RESUMO Show ESTAT�STICA B�SICA Conte�do 1. Introdu��o��������������������������������������������������������������������������������������������� pag. 02 2. Organiza��o de Dados Estat�sticos����������������������������������������� pag. 03 3. Medidas de Posi��o������������������������������������������������������������������ pag. 14 4. Medidas de Dispers�o��������������������������������������������������������������� pag. 27 5. Medidas de Assimetria e Curtose������������������������������������������������������ pag. 32 Alexandre Jos� Granzotto���������������������������� Julho a Outubro / 2002 RESUM�O� -� ESTAT�STICA B�SICA1.�� INTRODU��O ESTAT�STICA: ����� ramo da matem�tica aplicada. ANTIGUIDADE: ���� os povos j� registravam o n�mero de habitantes, nascimentos, �bitos. Faziam "estat�sticas". IDADE M�DIA: ������ as informa��es eram tabuladas com finalidades tribut�rias e b�licas. SEC. XVI:����� surgem as primeiras an�lises sistem�ticas, as primeiras tabelas e os n�meros relativos. SEC. XVIII: � a estat�stica com fei��o cient�fica � batizada por GODOFREDO ACHENWALL. As tabelas ficam mais completas, surgem as primeiras representa��es gr�ficas e os c�lculos de probabilidades. A estat�stica deixa de ser uma simples tabula��o de dados num�ricos para se tornar "O estudo de como se chegar a conclus�o sobre uma popula��o, partindo da observa��o de partes dessa popula��o (amostra)". M�TODO ESTAT�STICO M�TODO: ��� � um meio mais eficaz para atingir determinada meta. M�TODOS CIENT�FICOS:��������� destacamos o m�todo experimental e o m�todo estat�stico. M�TODO EXPERIMENTAL:������ consiste em manter constante todas as causas, menos uma, que� sofre varia��o para se observar seus efeitos, caso existam.�� Ex: Estudos da Qu�mica, F�sica, etc. M�TODO ESTAT�STICO:����������� diante da impossibilidade de manter as causas constantes (nas ci�ncias sociais), admitem todas essas causas presentes variando-as, registrando essas varia��es e procurando determinar, no resultado final, que influ�ncias cabem a cada uma delas.�� Ex: Quais as causas que definem o pre�o de uma mercadoria quando a sua oferta diminui? � Seria imposs�vel, no momento da pesquisa, manter constantes a uniformidade dos sal�rios, o gosto dos consumidores, n�vel geral de pre�os de outros produtos, etc. A ESTAT�STICA �������� � uma parte da matem�tica aplicada que fornece m�todos para coleta, organiza��o, descri��o, an�lise e interpreta��o de dados e para a utiliza��o dos mesmos na tomada de decis�es. �������� A coleta, a organiza��o ,a descri��o dos dados, o c�lculo e a interpreta��o de coeficientes pertencem � ESTAT�STICA DESCRITIVA, enquanto a an�lise e a interpreta��o dos dados, associado a uma margem de incerteza, ficam a cargo da ESTAT�STICA INDUTIVA ou INFERENCIAL, tamb�m chamada como a medida da incerteza ou m�todos que se fundamentam na teoria da probabilidade. . 2.� ORGANIZA��O DE DADOS ESTAT�STICOS FASES DO M�TODO ESTAT�STICO 1� - DEFINI��O DO PROBLEMA : ������� Saber exatamente aquilo que se pretende pesquisar � o mesmo que definir corretamente o problema. 2� - PLANEJAMENTO :���� Como levantar informa��es ? Que dados dever�o ser obtidos ? Qual levantamento a ser utilizado? Censit�rio?� Por amostragem? E o cronograma de atividades ? Os custos envolvidos ? etc. 3� - COLETA DE DADOS: ���������� Fase operacional. � o registro sistem�tico de dados, com um objetivo determinado. Dados prim�rios: ��� quando s�o publicados pela pr�pria pessoa ou organiza��o que os haja recolhido.� Ex:� tabelas do censo demogr�fico do IBGE. Dados secund�rios: ������� quando s�o publicados por outra organiza��o. Ex: quando determinado jornal publica estat�sticas referentes ao censo demogr�fico extra�das do IBGE. OBS: ������������ � mais seguro trabalhar com fontes prim�rias. O uso da fonte secund�ria traz o grande risco de erros de transcri��o. Coleta Direta: �������� quando � obtida diretamente da fonte. Ex: Empresa que realiza uma pesquisa para saber a prefer�ncia dos consumidores pela sua marca. coletacont�nua:���� registros de nascimento, �bitos, casamentos; coleta peri�dica:��� recenseamento demogr�fico, censo industrial; coleta ocasional:�� registro de casos de dengue. Coleta Indireta:������ �feita por dedu��es a partir dos elementos conseguidos pela coleta direta, por analogia, por avalia��o,ind�cios ou proporcionaliza��o. 4� - APURA��O DOS DADOS: ������������������������ Resumo dos dados atrav�s de sua contagem e agrupamento. � a condensa��o e tabula��o de dados. 5� - APRESENTA��O DOS DADOS: � H� duas formas de apresenta��o, que n�o se excluem mutuamente. A apresenta��o tabular, ou seja � uma apresenta��o num�rica dos dados em linhas e colunas distribu�das de modo ordenado, segundo regras pr�ticas fixadas pelo Conselho Nacional de Estat�stica. A apresenta��o gr�fica dos dados num�ricos constitui uma apresenta��o geom�trica permitindo uma vis�o r�pida e clara do fen�meno. 6� - AN�LISE E INTERPRETA��O DOS DADOS: �� A �ltima fase do trabalho estat�stico � a mais importante e delicada. Est� ligada essencialmente ao c�lculo de medidas e coeficientes, cuja finalidade principal � descrever o fen�meno (estat�stica descritiva). DEFINI��ES B�SICAS DA ESTAT�STICA . FEN�MENO ESTAT�STICO: ����� � qualquer evento que se pretenda analisar, cujo estudo seja poss�vel a aplica��o do m�todo estat�stico. S�o divididos em tr�s grupos: Fen�menos de massa ou coletivo:����� s�o aqueles que n�o podem ser definidos por uma simples observa��o. A estat�stica dedica-se ao estudo desses fen�menos. Ex: A natalidade na Grande Vit�ria, O pre�o m�dio da cerveja no Esp�rito Santo, etc. Fen�menos individuais:�� ��������� s�o aqueles que ir�o compor os fen�menos de massa.�� Ex: cada nascimento na Grande Vit�ria, cada pre�o de cerveja no Esp�rito Santo, etc. Fen�menos de multid�o:����������� quando as caracter�sticas observadas para a massa n�o se verificam para o particular. DADO ESTAT�STICO: ���� � um dado num�rico e � considerado a mat�ria-prima sobre a qual iremos aplicar os m�todos estat�sticos. POPULA��O: ������� � o conjunto total de elementos portadores de, pelo menos, uma caracter�stica comum. AMOSTRA: �� �� uma parcela representativa da popula��o que � examinada com o prop�sito de tirarmos conclus�es sobre a essa popula��o. PAR�METROS: ���� S�o valores singulares que existem na popula��o e que servem para caracteriz�-la. Para definirmos um par�metro devemos examinar toda a popula��o.� Ex: Os alunos do 2� ano da FACEV t�m em m�dia 1,70 metros de estatura. ESTIMATIVA:��������� � um valor aproximado do par�metro e � calculado com o uso da amostra. ATRIBUTO: � �quando os dados estat�sticos apresentam um car�ter qualitativo, o levantamento e os estudos necess�rios ao tratamento desses dados s�o designados genericamente de estat�stica de atributo. VARI�VEL: ������������ � o conjunto de resultados poss�veis de um fen�meno. VARI�VEL QUALITATIVA: �������� Quando seu valores s�o expressos por atributos: sexo, cor da pele,etc. VARI�VEL QUANTITATIVA: ���� Quando os dados s�o de car�ter nitidamente quantitativo, e o conjunto dos resultados possui uma estrutura num�rica, trata-se portanto da estat�stica de vari�vel e se dividem em : VARI�VEL DISCRETA OU DESCONT�NUA:Seus valores s�o expressos geralmente atrav�s de n�meros inteiros n�o negativos.� Resulta normalmente de contagens.� Ex:� N� de alunos presentes �s aulas de introdu��o � estat�stica econ�mica no 1� semestre de 1997: mar = 18 , abr = 30 , mai = 35 , jun = 36. VARI�VEL CONT�NUA: � Resulta normalmente de uma mensura��o, e a escala num�rica de seus poss�veis valores corresponde ao conjunto R dos n�meros Reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. Ex.: Quando voc� vai medir a temperatura de seu corpo com um term�metro de merc�rio o que ocorre � o seguinte: O filete de merc�rio, ao dilatar-se, passar� por todas as temperaturas intermedi�rias at� chegar na temperatura atual do seu corpo. Exemplos - . Cor dos olhos das alunas:�������������������������������������������������������� qualitativa . �ndice de liquidez nas ind�strias capixabas:������������������������ quantitativa cont�nua . Produ��o de caf� no Brasil: ���������������������������������������������������� quantitativa cont�nua . N�mero de defeitos em aparelhos de TV: ����������������������������� quantitativa discreta . Comprimento dos pregos produzidos por uma empresa: ��� quantitativa cont�nua . O ponto obtido em cada jogada de um dado: ����������������������� quantitativa discreta AMOSTRAGEM M�TODOS PROBABIL�STICOS �������� Exige que cada elemento da popula��o possua determinada probabilidade de ser selecionado. Normalmente possuem a mesma probabilidade.� Assim, se N for o tamanho da popula��o, a probabilidade de cada elemento ser selecionado ser� 1/N.� Trata-se do m�todo que garante cientificamente a aplica��o das t�cnicas estat�sticas de infer�ncias.� Somente com base em amostragens probabil�sticas � que se podem realizar infer�ncias ou indu��es sobre a popula��o a partir do conhecimento da amostra. � � uma t�cnica especial para recolher amostras, que garantem, tanto quanto poss�vel, o acaso na escolha. . AMOSTRAGEM CASUAL ou �ALEAT�RIA SIMPLES �������� � o processo mais elementar e freq�entemente utilizado. � equivalente a um sorteio lot�rico.� Pode ser realizada numerando-se a popula��o de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleat�rio qualquer, x n�meros dessa seq��ncia, os quais corresponder�o aos elementos pertencentes � amostra. Ex:����� Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de 90 alunos de uma escola: 1� - numeramos os alunos de 1 a 90. 2� - escrevemos os n�meros dos alunos, de 1 a 90, em peda�os iguais de papel, colocamos na urna e ap�s mistura retiramos, um a um, nove n�meros que formar�o a amostra. OBS: quando o n�mero de elementos da amostra � muito grande, esse tipo de sorteio torna-se muito trabalhoso. Neste caso utiliza-se uma Tabela de n�meros aleat�rios, constru�da de modo que os algarismos de 0 a 9 s�o distribu�dos ao acaso nas linhas e colunas. . .AMOSTRAGEM PROPORCIONAL ESTRATIFICADA: �������� Quando a popula��o se divide em estratos (sub-popula��es), conv�m que o sorteio dos elementos da amostra leve em considera��o tais estratos, da� obtemos os elementos da amostra proporcional ao n�mero de elementos desses estratos. Ex:� Vamos obter uma amostra proporcional estratificada, de 10%, do exemplo anterior, supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. S�o portanto dois estratos (sexo masculino e sexo feminino). Logo, temos:
Numeramos ent�o os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90, meninas e procedemos o sorteio casual com urna ou tabela de n�meros aleat�rios. . AMOSTRAGEM SISTEM�TICA: �������� Quando os elementos da popula��o j� se acham ordenados, n�o h� necessidade de construir o sistema de refer�ncia. S�o exemplos os prontu�rios m�dicos de um hospital, os pr�dios de uma rua, etc. Nestes casos, a sele��o dos elementos que constituir�o a amostra pode ser feita por um sistema imposto pelo pesquisador. Ex: Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra formada por 50 casas para uma pesquisa de opini�o. Podemos, neste caso, usar o seguinte procedimento:� como 900/50 = 18, escolhemos por sorteio casual um n�mero de 01 a 18, o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18 em 18. Assim, suponhamos que o n�mero sorteado fosse 4 a amostra seria: 4� casa, 22� casa, 40� casa, 58� casa, 76� casa, etc. AMOSTRAGEM POR CONGLOMERADOS (ou AGRUPAMENTOS) �������� Algumas popula��es n�o permitem, ou tornam extremamente dif�cil que se identifiquem seus elementos. N�o obstante isso, pode ser relativamente f�cil identificar alguns subgrupos da popula��o.� Em tais casos, uma amostra aleat�ria simples desses subgrupos (conglomerados) pode se colhida, e uma contagem completa deve ser feita para o conglomerado sorteado. Agrupamentos t�picos s�o quarteir�es, fam�lias, organiza��es, ag�ncias, edif�cios etc. Ex:� Num levantamento da popula��o de determinada cidade, podemos dispor do mapa indicando cada quarteir�o e n�o dispor de uma rela��o atualizada dos seus moradores. Pode-se, ent�o, colher uma amostra dos quarteir�es e fazer a contagem completa de todos os que residem naqueles quarteir�es sorteados. M�TODOS N�O PROBABIL�SITCOS �������� S�o amostragens em que h� uma escolha deliberada dos elementos da amostra. N�o � poss�vel generalizar os resultados das pesquisas para a popula��o, pois as amostras n�o-probabil�sticas n�o garantem a representatividade da popula��o. AMOSTRAGEM ACIDENTAL �������� Trata-se de uma amostra formada por aqueles elementos que v�o aparecendo, que s�o poss�veis de se obter at� completar o n�mero de elementos da amostra. Geralmente utilizada em pesquisas de opini�o, em que os entrevistados s�o acidentalmente escolhidos. Ex: Pesquisas de opini�o em pra�as p�blicas, ruas de grandes cidades; AMOSTRAGEM INTENCIONAL �������� De acordo com determinado crit�rio, � escolhido intencionalmente um grupo de elementos que ir�o compor a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opini�o. Ex:� Numa pesquisa sobre prefer�ncia por determinado cosm�tico, o pesquisador se dirige a um grande sal�o de beleza e entrevista as pessoas que ali se encontram. AMOSTRAGEM POR QUOTAS �������� Um dos m�todos de amostragem mais comumente usados em levantamentos de mercado e em pr�vias eleitorais. Ele abrange tr�s fases: 1� - classifica��o da popula��o em termos de propriedades que se sabe, ou presume, serem relevantes para a caracter�stica a ser estudada; 2� - determina��o da propor��o da popula��o para cada caracter�stica, com base na constitui��o conhecida, presumida ou estimada, da popula��o; 3� - fixa��o de quotas para cada entrevistador a quem tocar� a responsabilidade de selecionar entrevistados, de modo que a amostra total observada ou entrevistada contenha a propor��o e cada classe tal como determinada na 2� fase. Ex: ���� Numa pesquisa sobre o "trabalho das mulheres na atualidade", provavelmente se ter� interesse em considerar: a divis�o cidade e campo, a habita��o, o n�mero de filhos, a idade dos filhos, a renda m�dia, as faixas et�rias etc. A primeira tarefa � descobrir as propor��es (porcentagens) dessas caracter�sticas na popula��o. Imagina-se que haja 47% de homens e 53% de mulheres na popula��o. Logo, uma amostra de 50 pessoas dever� ter 23 homens e 27 mulheres. Ent�o o pesquisador receber� uma "quota" para entrevistar 27 mulheres. A considera��o de v�rias categorias exigir� uma composi��o amostral que atenda ao n determinado e �s propor��es populacionais estipuladas. . S�RIES ESTAT�STICAS TABELA:����� � um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistem�tica. � De acordo com a Resolu��o 886 do IBGE, nas casas ou c�lulas da tabela devemos colocar :
Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto.. S�RIE ESTAT�STICA:� ��� � qualquer tabela que apresenta a distribui��o de um conjunto de dados estat�sticos em fun��o da �poca, do local ou da esp�cie. S�ries Hom�gradas:����������� s�o aquelas em que a vari�vel descrita apresenta varia��o discreta ou descont�nua. Podem ser do tipo temporal, geogr�fica ou espec�fica. a) S�rie Temporal:�� � Identifica-se pelo car�ter vari�vel do fator cronol�gico. O local e a esp�cie (fen�meno) s�o elementos fixos. Esta s�rie tamb�m � chamada de hist�rica ou evolutiva. � ABC VE�CULOS LTDA. � Vendas no 1� bimestre de 1996
. b) S�rie Geogr�fica:��������� Apresenta como elemento vari�vel o fator geogr�fico. A �poca e o fato (esp�cie) s�o elementos fixos. Tamb�m � chamada de espacial, territorial ou de localiza��o. ABC VE�CULOS LTDA. Vendas no 1� bimestre de 1996
c) S�rie Espec�fica: ���������� O car�ter vari�vel � apenas o fato ou esp�cie. Tamb�m � chamada de s�rie categ�rica. ABC VE�CULOS LTDA. Vendas no 1� bimestre de 1996
S�RIES CONJUGADAS: �� �Tamb�m chamadas de tabelas de dupla entrada. S�o apropriadas � apresenta��o de duas ou mais s�ries de maneira conjugada, havendo duas ordens de classifica��o: uma horizontal e outra vertical. O exemplo abaixo � de uma s�rie geogr�fica-temporal. ABC VE�CULOS LTDA. Vendas no 1� bimestre de 1996
GR�FICOS ESTAT�STICOSG �������� S�o representa��es visuais dos dados estat�sticos que devem corresponder, mas nunca substituir as tabelas estat�sticas. Caracter�sticas:������� Uso de escalas, sistema de coordenadas, simplicidade, clareza e veracidade. Gr�ficos de informa��o: ������������ S�o gr�ficos destinados principalmente ao p�blico em geral, objetivando proporcionar uma visualiza��o r�pida e clara. S�o gr�ficos tipicamente expositivos, dispensando coment�rios explicativos adicionais. As legendas podem ser omitidas, desde que as informa��es desejadas estejam presentes. Gr�ficos de an�lise:���������� S�o gr�ficos que prestam-se melhor ao trabalho estat�stico, fornecendo elementos �teis � fase de an�lise dos dados, sem deixar de ser tamb�m informativos. Os gr�ficos de an�lise freq�entemente v�m acompanhados de uma tabela estat�stica. Inclui-se, muitas vezes um texto explicativo, chamando a aten��o do leitor para os pontos principais revelados pelo gr�fico. � Uso indevido de Gr�ficos: Podem trazer uma id�ia falsa dos dados que est�o sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, de um problema de constru��o de escalas. . Classifica��o dos gr�ficos: ������ Diagramas, Estereogramas, Pictogramas e Cartogramas. . 1 - Diagramas: �������� S�o gr�ficos geom�tricos dispostos em duas dimens�es. S�o os mais usados na representa��o de s�ries estat�sticas. Eles podem ser : 1.1- Gr�ficos em barras horizontais. 1.2-���� Gr�ficos em barras verticais ( colunas ). � Quando as legendas n�o s�o breves usa-se de prefer�ncia os gr�ficos em barras horizontais. Nesses gr�ficos os ret�ngulos t�m a mesma base e as alturas s�o proporcionais aos respectivos dados. � A ordem a ser observada � a cronol�gica, se a s�rie for hist�rica, e a � decrescente, se for geogr�fica ou categ�rica. 1.2- Gr�ficos em barras compostas. 1.4- ��� Gr�ficos em colunas superpostas. � Eles diferem dos gr�ficos em barras ou colunas convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou mais atributos. 1.5- ��� Gr�ficos em linhas ou lineares. � S�o freq�entemente usados para representa��o de s�ries cronol�gicas com um grande n�mero de per�odos de tempo. As linhas s�o mais eficientes do que as colunas, quando existem intensas flutua��es nas s�ries ou quando h� necessidade de se representarem v�rias s�ries em um mesmo gr�fico. � Quando representamos, em um mesmo sistema de coordenadas, a varia��o de dois fen�menos, a parte interna da figura formada pelos gr�ficos desses fen�menos � denominada de �rea de excesso. 1.5-���� Gr�ficos em setores. � Este gr�fico � constru�do com base em um c�rculo, e � empregado sempre que desejamos ressaltar a participa��o do dado no total. O total � representado pelo c�rculo, que fica dividido em tantos setores quantas s�o as partes. Os setores s�o tais que suas �reas s�o respectivamente proporcionais aos dados da s�rie. O gr�fico em setores s� deve ser empregado quando h�, no m�ximo, sete dados. � Obs:� As s�ries temporais geralmente n�o s�o representadas por este tipo de gr�fico. . 2 - Estereogramas: �������� S�o gr�ficos geom�tricos dispostos em tr�s dimens�es, pois representam volume. S�o usados nas representa��es gr�ficas das tabelas de dupla entrada. Em alguns casos este tipo de gr�fico fica dif�cil de ser interpretado dada a pequena precis�o que oferecem. . 3 - Pictogramas: �������� S�o constru�dos a partir de figuras representativas da intensidade do fen�meno. Este tipo de gr�fico tem a vantagem de despertar a aten��o do p�blico leigo, pois sua forma � atraente e sugestiva. Os s�mbolos devem ser auto-explicativos. A desvantagem dos pictogramas � que apenas mostram uma vis�o geral do fen�meno, e n�o de detalhes minuciosos. Veja o exemplo abaixo: 4- Cartogramas: ������� S�o ilustra��es relativas a cartas geogr�ficas (mapas). O objetivo desse gr�fico � o de figurar os dados estat�sticos diretamente relacionados com �reas geogr�ficas ou pol�ticas. DISTRIBUI��O DE FREQ��NCIA �������� � um tipo de tabela que condensa uma cole��o de dados conforme as freq��ncias (repeti��es de seus valores). Tabela primitiva ou dados brutos:������ � uma tabela ou rela��o de elementos que n�o foram numericamente organizados. � dif�cil formarmos uma id�ia exata do comportamento do grupo como um todo, a partir de dados n�o ordenados. Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 ROL:������������� � a tabela obtida ap�s a ordena��o dos dados (crescente ou decrescente). Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 Distribui��o de freq��ncia sem intervalos de classe:���� � a simples condensa��o dos dados conforme as repeti��es de seu valores. Para um ROL de tamanho razo�vel esta distribui��o de freq��ncia � inconveniente, j� que exige muito espa�o. Veja exemplo abaixo:
Distribui��o de freq��ncia com intervalos de classe:Quando o tamanho da amostra � elevado, � mais racional efetuar o agrupamento dos valores em v�rios intervalos de classe.
ELEMENTOS DE UMA DISTRIBUI��O DE FREQ��NCIA (com intervalos de classe) � � CLASSE: ���� s�o os intervalos de varia��o da vari�vel e � simbolizada por� i� e o n�mero total de classes simbolizada por k. Ex: na tabela anterior k = 5 e� �49 |------- 53 � a 3� classe, onde i = 3. LIMITES DE CLASSE: ���� s�o os extremos de cada classe. O menor n�mero � o limite inferior de classe ( li ) e o maior n�mero, limite superior de classe ( Li ).� Ex: em 49 |------- 53,... l3 = 49 e L3 = 53.� O s�mbolo |------- representa um intervalo fechado � esquerda e aberto � direita. O dado 53 do ROL n�o pertence a classe 3 e sim a classe 4 representada por 53 |------- 57. AMPLITUDE DO INTERVALO DE CLASSE: �� �� obtida atrav�s da diferen�a entre o limite superior e inferior da classe e � simbolizada por hi = Li - li.�� Ex: na tabela anterior hi = 53 - 49 = 4. Obs: Na distribui��o de freq��ncia c/ classe o hi ser� igual em todas as classes. AMPLITUDE TOTAL DA DISTRIBUI��O:����� � a diferen�a entre o limite superior da �ltima classe e o limite inferior da primeira classe.AT = L(max) - l(min).�� Ex: na tabela anterior AT = 61 - 41= 20. AMPLITUDE TOTAL DA AMOSTRA (ROL): � � a diferen�a entre o valor m�ximo e o valor m�nimo da amostra (ROL). Onde AA = Xmax - Xmin.�� Em nosso exemplo AA = 60 - 41 = 19. Obs:�� AT sempre ser� maior que AA. PONTO� M�DIO DE CLASSE: �� � o ponto que divide o intervalo de classe em duas partes iguais. .......Ex: em 49 |------- 53 o ponto m�dio x3 = (53+49)/2 = 51, ou seja� x3=( l3 + L3 )/2. M�todo pr�tico para constru��o de uma Distribui��o de Freq��ncias c/ Classe � 1� -����� Organize os dados brutos em um ROL. 2� -����� Calcule a amplitude amostralAA. � No nosso exmplo:�� AA� = 60 - 41� = 19 3� -����� Calcule o n�mero de classes atrav�s da "Regra de Sturges":
Obs: � Qualquer regra para determina��o do n� de classes da tabela n�o nos levam a uma decis�o final; esta vai depender, na realidade de um julgamento pessoal, que deve estar ligado � natureza dos dados. No nosso exemplo:�� n� =� 20 dados, ent�o ,a princ�pio, a regra sugere a ado��o de 5 classes. 4� -����� Decidido o n� de classes, calcule ent�o a amplitude do intervalo de classe� h > AA / i. No nosso exemplo: AA/i = 19/5 = 3,8 . Obs: Como h > AA/i um valor ligeiramente superior para haver folga na �ltima classe. Utilizaremos ent�o� h = 4 5� - ���� Temos ent�o o menor n� da amostra, o n� de classes e a amplitude do intervalo. Podemos montar a tabela, com o cuidado para n�o aparecer classes com freq��ncia = 0 (zero). No nosso exemplo: o menor n� da amostra = 41 + h = 45, logo a primeira classe ser� representada por ...... 41 |------- 45. As classes seguintes respeitar�o o mesmo procedimento. O primeiro elemento das classes seguintes sempre ser�o formadas pelo �ltimo elemento da classe anterior. REPRESENTA��O GR�FICA DE UMA DISTRIBUI��O Histograma,� Pol�gono de freq��ncia e� Pol�gono de freq��ncia acumulada �������� Em todos os gr�ficos acima utilizamos o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos os valores da vari�vel e na linha vertical (eixo das ordenadas), as freq��ncias. . Histograma: ���������� � formado por um conjunto de ret�ngulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos m�dios coincidam com os pontos m�dios dos intervalos de classe. A �rea de um histograma � proporcional � soma das freq��ncias simples ou absolutas. Freq��ncias simples ou absoluta: ����� s�o os valores que realmente representam o n�mero de dados de cada classe. A soma das freq��ncias simples � igual ao n�mero total dos dados da distribui��o. Freq��ncias relativas: ��� s�o os valores das raz�es entre as freq��ncia absolutas de cada classe e a freq��ncia total da distribui��o. A soma das freq��ncias relativas � igual a 1 (100 %). . Pol�gono de freq��ncia: �� �� um gr�fico em linha, sendo as freq��ncias marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos m�dios dos intervalos de classe. Para realmente obtermos um pol�gono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos m�dios da classe anterior � primeira e da posterior � �ltima, da distribui��o. . Pol�gono de freq��ncia acumulada: � � tra�ado marcando-se as freq��ncias acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. Freq��ncia simples acumulada de uma classe:����� � o total das freq��ncias de todos os valores inferiores ao limite superior do intervalo de uma determinada classe. Freq��ncia relativa acumulada de um classe:�������� � a freq��ncia acumulada da classe, dividida pela freq��ncia total da distribui��o.
fi = freq��ncia simples;��� xi = ponto m�dio de classe;��� fri = freq��ncia simples acumulada; Fi = freq��ncia relativa� e� Fri = freq��ncia relativa acumulada. � Obs: uma distribui��o de freq��ncia sem intervalos de classe � representada graficamente por um diagrama onde cada valor da vari�vel � representado por um segmento de reta vertical e de comprimento proporcional � respectiva freq��ncia. . 3.� �MEDIDAS DE POSI��O Introdu��o �������� S�o as estat�sticas que representam uma s�rie de dados orientando-nos quanto � posi��o da distribui��o em rela��o ao eixo horizontal do gr�fico da curva de freq��ncia. � As medidas de posi��es mais importantes s�o as medidas de tend�ncia central ou prom�dias (verifica-se uma tend�ncia dos dados observados a se agruparem em torno dos valores centrais). � As medidas de tend�ncia central mais utilizadas s�o: m�dia aritm�tica, moda e mediana. Outros prom�dios menos usados s�o as m�dias: geom�trica, harm�nica, quadr�tica, c�bica e biquadr�tica. � As outras medidas de posi��o s�o as separatrizes,que englobam: a pr�pria mediana, os decis, os quartis e os percentis. . M�DIA ARITM�TICA = �������� � igual ao quociente entre a soma dos valores do conjunto e o n�mero total dos valores.
...... onde� xi s�o os valores da vari�vel e n o n�mero de valores. . Dados n�o-agrupados: � Quando desejamos conhecer a m�dia dos dados n�o-agrupados em tabelas de freq��ncias, determinamos a m�dia aritm�tica simples. Ex:����� Sabendo-se que a venda di�ria de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 kilos, temos, para venda m�dia di�ria na semana de:
Desvio em rela��o � m�dia: ����� � a diferen�a entre cada elemento de um conjunto de valores e a m�dia aritm�tica, ou seja:.
. di = Xi - No exemplo anterior temos sete desvios:...� �d1 = 10 - 14 = - 4 , ...d2 = 14 - 14 = 0 ,�� d3 = 13 - 14 = - 1 , ...d4 = 15 - 14 = 1 ,... d5 = 16 - 14 = 2 ,... d6 = 18 - 14 = 4 ...e.� ..�� d7 = 12 - 14 = - 2. . Propriedades da m�dia aritm�tica� � 1� propriedade: ���� A soma alg�brica dos desvios em rela��o � m�dia � nula. � No exemplo anterior : d1+d2+d3+d4+d5+d6+d7 = 0 2� propriedade: ���� Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma vari�vel, a m�dia do conjunto fica aumentada ( ou diminu�da) dessa constante. � Se no exemplo original somarmos a constante 2 a cada um dos valores da vari�vel temos: Y = 12+16+15+17+18+20+14 / 7 = 16 kilos ou Y =
3� propriedade: ���� Multiplicando-se (ou dividindo-se) todos os valores de uma vari�vel por uma constante (c), a m�dia do conjunto fica multiplicada ( ou dividida) por essa constante. � Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da vari�vel temos: Y = 30+42+39+45+48+54+36 / 7 = 42 kilos ou Y =
. Dados agrupados: Sem intervalos de classe ������ Consideremos a distribui��o relativa a 34 fam�lias de quatro filhos, tomando para vari�vel o n�mero de filhos do sexo masculino. Calcularemos a quantidade m�dia de meninos por fam�lia:
� Como as freq��ncias s�o n�meros indicadores da intensidade de cada valor da vari�vel, elas funcionam como fatores de pondera��o, o que nos leva a calcular a m�dia aritm�tica ponderada, dada pela f�rmula:
onde 78 / 34� =� 2,3 meninos por fam�lia Com intervalos de classe� ����� Neste caso, convencionamos que todos os valores inclu�dos em um determinado intervalo de classe coincidem com o seu ponto m�dio, e determinamos a m�dia aritm�tica ponderada por meio da f�rmula:
onde Xi � o ponto m�dio da classe. Ex: Calcular a estatura m�dia de beb�s conforme a tabela abaixo.
Aplicando a f�rmula acima temos: 2.440 / 40.= 61. logo... M�dia Geom�trica� =�
�������� � a raiz n-�sima do produto de todos eles. M�dia Geom�trica Simples:
Ex.: - Calcular a m�dia geom�trica dos seguintes conjuntos de n�meros:E a) { 10, 60, 360 }.:��������������� � = ( 10� * 60 * 36 0) ^ (1/3) ....R: 60 b) { 2, 2, 2 }........: ���������������� �= (2 * 2 * 2 ^ (1/3) ..��� .R: 2 c) { 1, 4, 16, 64 }:����������������� = (1 * 4 * 16 * 64� ) ^(1/4) ....R: 8 . M�dia Geom�trica Ponderada : � Ex - Calcular a m�dia geom�trica dos valores da tabela abaixo:
=��� (12 * 34 * 92 * 271) (1/9)........R: 3,8296 . M�DIA HARM�NICA� -
�������� � o inverso da m�dia aritm�tica dos inversos. . M�dia Harm�nica Simples:.� (para dados n�o agrupados) .. . M�dia Harm�nica Ponderada :� (para dados agrupados em tabelas de freq��ncias)
Ex.: Calcular a m�dia harm�nica dos valores da tabela abaixo:
Resp: 20 / 4,03 = 4,96 OBS:������� A m�dia harm�nica n�o aceita valores iguais a zero como dados de uma s�rie. � A igualdade
OBS:������� Quando os valores da vari�vel n�o forem muito diferentes, verifica-se aproximadamente a seguinte rela��o: � Demonstraremos a rela��o acima com os seguintes dados: z = { 10,1 ; 10,1 ; 10,2 ; 10,4 ; 10,5 } M�dia aritm�tica = 51,3 / 5����������� = 10,2600 M�dia geom�trica= ����������������������� ����������������������� = 10,2587 M�dia harm�nica = 5 / 0,4874508 ��������� = 10,2574 Comprovando a rela��o: 10,2600 + 10,2574 / 2 = 10,2587 = m�dia geom�trica . MODA� -� Mo �������� � o valor que ocorre com maior freq��ncia em uma s�rie de valores. � Desse modo, o sal�rio modal dos empregados de uma f�brica � o sal�rio mais comum, isto �, o sal�rio recebido pelo maior n�mero de empregados dessa f�brica. . A Moda quando os dados n�o est�o agrupados �
Ex: Na s�rie { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda � igual a 10.
Ex: { 3 , 5 , 8 , 10 , 12 } n�o apresenta moda. A s�rie � amodal.
Ex: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A s�rie � bimodal. . A Moda quando os dados est�o agrupados� � a) Sem intervalos de classe:����� Uma vez agrupados os dados, � poss�vel determinar imediatamente a moda: basta fixar o valor da vari�vel de maior freq��ncia. Ex: Qual a temperatura mais comum medida no m�s abaixo:
Resp: 2� C � a temperatura modal, pois� � a de maior freq��ncia. . b) Com intervalos de classe:���� A classe que apresenta a maior freq��ncia � denominada classe modal. Pela defini��o, podemos afirmar que a moda, neste caso, � o valor dominante que est� compreendido entre os limites da classe modal. O m�todo mais simples para o c�lculo da moda consiste em tomar o ponto m�dio da classe modal. Damos a esse valor a denomina��o de moda bruta. onde l* = limite inferior da classe modal e L* = limite superior da classe modal. Ex:� Calcule a estatura modal conforme a tabela abaixo.
Resposta: a classe modal � 58|-------- 62, pois � a de maior freq��ncia. l* = 58 e L* = 62 Mo = (58+62) / 2 = 60 cm ( este valor � estimado, pois n�o conhecemos o valor real da moda).
M�todo mais elaborado pela f�rmula de CZUBER:���� Mo = l* + (d1/(d1+d2)) x h* l* = limite inferior da classe modal..... e..... L* = limite superior da classe modal d1 =� freq��ncia da classe modal - freq��ncia da classe anterior � da classe modal d2 = freq��ncia da classe modal - freq��ncia da classe posterior � da classe modal h* = amplitude da classe modal Mo =� 58 + ((11-9) / ((11-9) + (11 � 8)) x 4���������� �������� Mo = 59,6 Obs:� A moda � utilizada quando desejamos obter uma medida r�pida e aproximada de posi��o ou quando a medida de posi��o deva ser o valor mais t�pico da distribui��o. J� a m�dia aritm�tica � a medida de posi��o que possui a maior estabilidade. MEDIANA� -� Md �������� A mediana de um conjunto de valores, dispostos segundo uma ordem ( crescente ou decrescente), � o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo n�mero de elementos. . A mediana em dados n�o-agrupados � Dada uma s�rie de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 } De acordo com a defini��o de mediana, o primeiro passo a ser dado � o da ordena��o (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 } O valor que divide a s�rie acima em duas partes iguais � igual a 9, logo a Md = 9. . M�todo pr�tico para o c�lculo da Mediana: ������� Se a s�rie dada tiver n�mero �mpar de termos:� ���� O valor mediano ser� o termo de ordem dado pela f�rmula : Ex: Calcule a mediana da s�rie { 1, 3, 0, 0, 2, 4, 1, 2, 5 } 1� - ordenar a s�rie { 0, 0, 1, 1, 2, 2, 3, 4, 5 } n = 9 logo (n + 1)/2 � dado por (9+1) / 2 = 5, ou seja, o 5� elemento da s�rie ordenada ser� a mediana A mediana ser� o 5� elemento = 2 . Se a s�rie dada tiver n�mero par de termos: ���������� O valor mediano ser� o termo de ordem dado pela f�rmula :.... .[( n/2 ) +( n/2+ 1 )] / 2 Obs:�� n/2 e (n/2 + 1) ser�o termos de ordem e devem ser substitu�dos pelo valor correspondente. Ex: Calcule a mediana da s�rie { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 } 1� - ordenar a s�rie { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 } n = 10 logo a f�rmula ficar�: [( 10/2 ) + (10/2 + 1)] / 2 [( 5 + 6)] / 2 ser� na realidade (5� termo+ 6� termo) / 2 5� termo = 2 6� termo = 3 A mediana ser� = (2+3) / 2 ou seja, Md = 2,5 . A mediana no exemplo ser� a m�dia aritm�tica do 5� e 6� termos da s�rie. Notas:
Em { 5, 7, 10, 13, 15 } a m�dia = 10 e a mediana = 10 Em { 5, 7, 10, 13, 65 } a m�dia = 20 e a mediana = 10 � isto �, a m�dia do segundo conjunto de valores � maior do que a do primeiro, por influ�ncia dos valores extremos, ao passo que a mediana permanece a mesma. A mediana em dados agrupados � a) Sem intervalos de classe:����� Neste caso, � o bastante identificar a freq��ncia acumulada imediatamente superior � metade da soma das freq��ncias. A mediana ser� aquele valor da vari�vel que corresponde a tal freq��ncia acumulada. Ex.:� conforme tabela abaixo:
� Quando o somat�rio das freq��ncias for �mpar o valor mediano ser� o termo de ordem dado pela f�rmula : . � Como o somat�rio das freq��ncias = 35 a f�rmula ficar�: ( 35+1 ) / 2 = 18� termo = 3.. � Quando o somat�rio das freq��ncias for par o valor mediano ser� o termo de ordem dado pela f�rmula: Ex:� Calcule Mediana da tabela abaixo:
� Aplicando f�rmula acima teremos:[(8/2)+ (8/2+1)]/2 = (4� termo + 5� termo) / 2 = (15 + 16) / 2 = 15,5 b) Com intervalos de classe:���� Devemos seguir os seguintes passos: 1�) ����� Determinamos as freq��ncias acumuladas ; 2�) ����� Calculamos
4�) Calculamos a Mediana pela seguinte f�rmula:.��� M� Md = l* + [( l* ������� = � o limite inferior da classe mediana. FAA �� = � a freq��ncia acumulada da classe anterior � classe mediana. f* ������� = � a freq��ncia simples da classe mediana. h*������� = � a amplitude do intervalo da classe mediana. Ex:
l* = 58........... FAA = 13........... f* = 11........... h* = 4 Substituindo esses valores na f�rmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 OBS: Esta mediana � estimada, pois n�o temos os 40 valores da distribui��o. Emprego da Mediana
SEPARATRIZES �������� Al�m das medidas de posi��o que estudamos, h� outras que, consideradas individualmente, n�o s�o medidas de tend�ncia central, mas est�o ligadas � mediana relativamente � sua caracter�stica de separar a s�rie em duas partes que apresentam o mesmo n�mero de valores. Essas medidas - os quartis, os decis e os percentis - s�o, juntamente com a mediana, conhecidas pelo nome gen�rico de separatrizes. . QUARTIS� -� Q �������� Denominamos quartis os valores de uma s�rie que a dividem em quatro partes iguais.� Precisamos portanto de 3 quartis (Q1 , Q2 e Q3) para dividir a s�rie em quatro partes iguais. Obs: O quartil 2 ( Q2 ) sempre ser� igual a mediana da s�rie. Quartis em dados n�o agrupados� � �������� O m�todo mais pr�tico � utilizar o princ�pio do c�lculo da mediana para os 3 quartis.� Na realidade ser�o calculadas " 3 medianas " em uma mesma s�rie. Ex 1: Calcule os quartis da s�rie: { 5, 2, 6, 9, 10, 13, 15 } - O primeiro passo a ser dado � o da ordena��o (crescente ou decrescente) dos valores:�� { 2, 5, 6, 9, 10, 13, 15 } - O valor que divide a s�rie acima em duas partes iguais � igual a 9, logo a Md = 9 que ser� = Q2 = 9 - Temos agora {2, 5, 6 } e {10, 13, 15 } como sendo os dois grupos de valores iguais proporcionados pela mediana ( quartil 2 ). Para o c�lculo do quartil 1 e 3 basta calcular as medianas das partes iguais provenientes da verdadeira Mediana da s�rie (quartil 2). Logo em { 2, 5, 6 } a mediana � = 5 . Ou seja: ser� o quartil 1 = Q1 = 5 em {10, 13, 15 } a mediana � =13 . Ou seja: ser� o quartil 3 = Q = 13 Ex 2: Calcule os quartis da s�rie: { 1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13 } - A s�rie j� est� ordenada, ent�o calcularemos o Quartil 2 = Md = (5+6)/2 = 5,5 - - O quartil 1 ser� a mediana da s�rie � esquerda de Md : { 1, 1, 2, 3, 5, 5 } Q1 = (2+3)/2 = 2,5 - O quartil 3 ser� a mediana da s�rie � direita de Md : {6, 7, 9, 9, 10, 13 } Q3 = (9+9)/2 = 9 Quartis para dados agrupados em classes� ������� �������� Usamos a mesma t�cnica do c�lculo da mediana, bastando substituir, na f�rmula da mediana, E fi / 2.... por ... k . E fi / 4 ... sendo k o n�mero de ordem do quartil. Assim, temos: Q1 = . l* + [(E fi / 4 - FAA ) x h*] / f* Q2 = . l* + [(2.E fi / 4 - FAA ) x h*] / f* Q3 = . l* + [(3.E fi / 4 - FAA ) x h*] / f* Ex 3 - Calcule os quartis da tabela abaixo:
- O quartil 2 = Md , logo:
l* = 58........... FAA = 13........... f* = 11........... h* = 4 Q2 = . l* + [(2.E fi / 4 - FAA ) x h*] / f* - Substituindo esses valores na f�rmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 = Q2 - O quartil 1 :�� E fi / 4 = 10 Q1 = . l* + [(E fi / 4 - FAA ) x h*] / f* Q1 = 54 + [ (10 - 4) x 4] / 9 = 54 + 2,66 = 56,66 = Q1 . - O quartil 3 : 3.E fi / 4 = 30 Q3 = . l* + [(3.E fi / 4 - FAA ) x h*] / f* Q3 = 62 + [ (30 -24) x 4] / 8 = 62 + 3 = 65 = Q3 DECIS� -� D �������� A defini��o dos decis obedece ao mesmo princ�pio dos quartis, com a modifica��o da porcentagem de valores que ficam aqu�m e al�m do decil que se pretende calcular. A f�rmula b�sica ser� :�� k .E fi / 10 onde k � o n�mero de ordem do decil a ser calculado.�� Indicamos os decis : D1, D2, ... , D9. Deste modo precisamos de 9 decis para dividirmos uma s�rie em 10 partes iguais. � De especial interesse � o quinto decil, que divide o conjunto em duas partes iguais. Assim sendo,o quinto decil � igual ao segundo quartil, que por sua vez � igual � mediana. Para D5 temos : ����� 5.E fi / 10 = E fi / 2 Ex:� �Calcule o 3� decil da tabela anterior com classes. k= 3 onde��� 3 .E fi / 10 = 3 x 40 / 10 = 12. Este resultado corresponde a 2� classe. D3 = 54 + [ (12 - 4) x 4]� / 9 = 54 + 3,55 = 57,55 = D3 PERCENTIL ou CENTIL �������� Denominamos percentis ou centis como sendo os noventa e nove valores que separam uma s�rie em 100 partes iguais. Indicamos: P1, P2, ... , P99.� � evidente que P50 = Md ; P25 = Q1 e P75 = Q3. � O c�lculo de um centil segue a mesma t�cnica do c�lculo da mediana, por�m a f�rmula ser���� : k .E fi / 100��� onde k � o n�mero de ordem do centil a ser calculado. Dispers�o ou Variabilidade:������ � a maior ou menor diversifica��o dos valores de uma vari�vel em torno de um valor de tend�ncia central ( m�dia ou mediana ) tomado como ponto de compara��o. � A m�dia - ainda que considerada como um n�mero que tem a faculdade de representar uma s�rie de valores - n�o pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que comp�em o conjunto. � Consideremos os seguintes conjuntos de valores das vari�veis X, Y e Z: X = { 70, 70, 70, 70, 70 } Y = { 68, 69, 70 ,71 ,72 } Z = { 5, 15, 50, 120, 160 } - Observamos ent�o que os tr�s conjuntos apresentam a mesma m�dia aritm�tica = 350/5 = 70 � Entretanto, � f�cil notar que o conjunto X � mais homog�neo que os conjuntos Y e Z, j� que todos os valores s�o iguais � m�dia. O conjunto Y, por sua vez, � mais homog�neo que o conjunto Z, pois h� menor diversifica��o entre cada um de seus valores e a m�dia representativa. � Conclu�mos ent�o que o conjunto X apresenta dispers�o nulae que o conjunto Y apresenta uma dispers�o menorque o conjunto Z. 4.� MEDIDAS DE DISPERS�O ABSOLUTA Amplitude total:������� � a �nica medida de dispers�o que n�o tem na m�dia o ponto de refer�ncia. � Quando os dados n�o est�o agrupados a amplitude total � a diferen�a entrE o maior e o menor valor observado: AT = X m�ximo - X m�nimo. Ex: ���� Para os valores 40, 45, 48, 62 e 70 a amplitude total ser�: AT = 70 - 40 = 30 Quando os dados est�o agrupados sem intervalos de classe ainda temos : AT = X m�ximo - X m�nimo. Ex: � AT = 4 - 0 = 4 * Com intervalos de classe a amplitude total � a diferen�a entre o limite superior da �ltima classe e o limite inferior da primeira classe. Ent�o: �AT = L m�ximo - l m�nimo Ex:
� AT = 10 - 4 = 6 � A amplitude total tem o inconveniente de s� levar em conta os dois valores extremos da s�rie, descuidando do conjunto de valores intermedi�rios. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia, no controle de qualidade ou como uma medida de c�lculo r�pido sem muita exatid�o. Desvio quartil:���������� Tamb�m chamado de amplitude semi-interquat�lica e � baseada nos quartis. S�mbolo: Dq e a F�rmula:�� Dq = (Q3 - Q1) / 2 Observa��es: 1 - ����� O desvio quartil apresenta como vantagem o fato de ser uma medida f�cil de calcular e de interpretar. Al�m do mais, n�o � afetado pelos valores extremos, grandes ou pequenos, sendo recomendado, por conseguinte, quando entre os dados figurem valores extremos que n�o se consideram representativos. 2- ������ O desvio quartil dever� ser usado preferencialmente quando a medida de tend�ncia central for a mediana. 3- ������ Trata-se de uma medida insens�vel � distribui��o dos itens menores que Q1, entre Q1 e Q3 e maiores que Q3. Ex: Para os valores 40, 45, 48, 62 e 70 o desvio quartil ser�: Q1 = (45+40)/2 = 42,5 Q3 = (70+62)/2 = 66 Dq = (66 - 42,5) / 2 = 11,75 Desvio m�dio absoluto� - Dm Para dados brutos:���������� � a m�dia aritm�tica dos valores absolutos dos desvios tomados em rela��o a uma das seguintes medidas de tend�ncia central: m�dia ou mediana.
� para a M�dia = ������������������ Dm = E | Xi -
� para a Mediana = �������������� Dm = E | Xi - Md | / n � As barras verticais indicam que s�o tomados os valores absolutos, prescindindo do sinal dos desvios. Ex: Calcular o desvio m�dio do conjunto de n�meros { - 4 , - 3 , - 2 , 3 , 5 }
Tabela auxiliar para c�lculo do desvio m�dio
Pela M�dia : ����������� Dm = 16,8 / 5 = 3,36 ������ Pela Mediana : ������������������ Dm = 15 / 5 = 3 DESVIO PADR�O� -� S �������� � a medida de dispers�o mais geralmente empregada, pois leva em considera��o a totalidade dos valores da vari�vel em estudo. � um indicador de variabilidade bastante est�vel. O desvio padr�o baseia-se nos desvios em torno da m�dia aritm�tica e a sua f�rmula b�sica pode ser traduzida como : a raiz quadrada da m�dia aritm�tica dos quadrados dos desvios e � representada por S .
� A f�rmula acima � empregada quando tratamos de uma popula��o de dados n�o-agrupados. Ex: Calcular o desvio padr�o da popula��o representada por - 4 , -3 , -2 , 3 , 5
Sabemos que n = 5 e 62,8 / 5 = 12,56. A raiz quadrada de 12,56 � o desvio padr�o = 3,54 Obs: � Quando nosso interesse n�o se restringe � descri��o dos dados mas, partindo da amostra, visamos tirar infer�ncias v�lidas para a respectiva popula��o, conv�m efetuar uma modifica��o, que consiste em usar o divisor n - 1 em lugar de n. A f�rmula ficar� ent�o: � Se os dados - 4 , -3 , -2 , 3 , 5 representassem uma amostra o desvio padr�o amostral seria a raiz quadrada de 62,8 / (5 -1) = 3,96 � O desvio padr�o goza de algumas propriedades, dentre as quais destacamos: 1� = ��� Somando-se (ou subtraindo-se) uma constante a todos os valores de uma vari�vel, o desvio padr�o n�o se altera. 2� = ��� Multiplicando-se (ou dividindo-se) todos os valores de uma vari�vel por uma constante (diferente de zero), o desvio padr�o fica multiplicado ( ou dividido) por essa constante. � Quando os dados est�o agrupados (temos a presen�a de freq��ncias) a f�rmula do desvio padr�o ficar� :
Ex: ���� Calcule o desvio padr�o populacional da tabela abaixo:
- Sabemos que�� E fi = 30 e 32,7 / 30 = 1,09. - A raiz quadrada de 1,09 � o� desvio padr�o = 1,044 - Se considerarmos os dados como sendo de uma amostra o desvio padr�o seria : a raiz quadrada de 32,7 / (30 -1) = 1,062 Obs: � Nas tabelas de freq��ncias com intervalos de classe a f�rmula a ser utilizada � a mesma do exemplo anterior. VARI�NCIA� -� S2 �������� � o desvio padr�o elevado ao quadrado.� A vari�ncia � uma medida que tem pouca utilidade como estat�stica descritiva, por�m � extremamente importante na infer�ncia estat�stica e em combina��es de amostras. MEDIDAS DE DISPERS�O RELATIVA Coeficiente de Varia��o de Pearson� -� CVP � Na estat�stica descritiva o desvio padr�o por si s� tem grandes limita��es. Assim, um desvio padr�o de 2 unidades pode ser considerado pequeno para uma s�rie de valores cujo valor m�dio � 200; no entanto, se a m�dia for igual a 20, o mesmo n�o pode ser dito. � Al�m disso, o fato de o desvio padr�o ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais s�ries de valores, relativamente � sua dispers�o ou variabilidade, quando expressas em unidades diferentes. � Para contornar essas dificuldades e limita��es, podemos caracterizar a dispers�o ou variabilidade dos dados em termos relativos a seu valor m�dio, medida essa denominada de CVP: Coeficiente de Varia��o de Pearson (� a raz�o entre o desvio padR�o e a m�dia referentes a dados de uma mesma s�rie).
CVP = (S / � o resultado neste caso � expresso em percentual, entretanto pode ser expresso tamb�m atrav�s de um fator decimal, desprezando assim o valor 100 da f�rmula. Ex:� Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indiv�duos:
- Qual das medidas (Estatura ou Peso) possui maior homogeneidade ? Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultado menor ser� o de maior homogeneidade ( menor dispers�o ou variabilidade). CVP estatura =������� ( 5 / 175 ) x 100 ������ = 2,85 % CVP peso = ������������ ( 2 / 68 )�� x 100������� = 2,94 %. Logo, nesse grupo de indiv�duos, as estaturas apresentam menor grau de dispers�o que os pesos. Coeficiente de Varia��o de Thorndike� -� CVT � � igual ao quociente entre o desvio padr�o e a mediana.
CVT = ( S / Md ) x 100 % Coeficiente Quart�lico de Varia��o� -� CVQ � Esse coeficiente � definido pela seguinte express�o:
CVQ = [(Q3 - Q1) / (Q3 + Q1)] x 100 %. Desvio quartil Reduzido � Dqr
Dqr = [(Q3 - Q1) / 2Md ] x 100 %. 5.� MEDIDAS DE ASSIMETRIA Introdu��o: � Uma distribui��o com classes � sim�trica quando : M�dia = Mediana = Moda �������� Uma distribui��o com classes � : Assim�trica � esquerda ou negativa quando : ������� M�dia < Mediana < Moda Assim�trica � direita ou positiva quando : ��������������� M�dia > Mediana > Moda Coeficiente de assimetria:��������� A medida anterior, por ser absoluta, apresenta a mesma defici�ncia do desvio padr�o, isto �, n�o permite a possibilidade de compara��o entre as medidas de duas distribui��es. Por esse motivo, daremos prefer�ncia ao coeficiente de assimetria de Person: �� As = 3 ( M�dia - Mediana ) / Desvio Padr�o � Escalas de assimetria: | AS | < 0,15 ����������������������� � ������ assimetria pequena 0,15 < | AS | < 1 ����� �������� assimetria moderada | AS | > 1 ����������������� � ������ assimetria elevada Obs: � Suponhamos AS = - 0,49� a assimetria � considerada moderada e negativa Suponhamos AS = 0,75� � a assimetria � considerada moderada e positiva MEDIDAS DE CURTOSE Introdu��o: � Denominamos curtose o grau de achatamento de uma distribui��o em rela��o a uma distribui��o padr�o, denominada curva normal (curva correspondente a uma distribui��o te�rica de probabilidade). � Quando a distribui��o apresenta uma curva de freq��ncia mais fechada que a normal (ou mais aguda ou afilada em sua parte superior), ela recebe o nome de leptoc�rtica. � Quando a distribui��o apresenta uma curva de freq��ncia mais aberta que a normal (ou mais achatada em sua parte superior), ela recebe o nome de platic�rtica. �������� A curva normal, que � a nossa base referencial, recebe o nome de mesoc�rtica. Coeficiente de curtose
C1 = (Q3 - Q1) / 2(P90 - P10) � Este coeficiente � conhecido como percent�lico de curtose. � Relativamente a curva normal, temos: C1 = 0,263��� ������� curva mesoc�rtica C1 < 0,263 �� � ����� curva leptoc�rtica C1 > 0,263 �� ������� curva platic�rtica � O coeficiente abaixo� ( C2 )ser� utilizado em nossas an�lises:
onde S � desvio padr�o C2 = 3 � curva mesoc�rtica C2 > 3 � curva leptoc�rtica C2 < 3 � curva platic�rtica FIM Agradecimento: ��� Este resumo s� foi poss�vel gra�as a �garimpagem� realizada na WEB, mais especificamente na pagina do Prof. Paulo Cezar Ribeiro da Silva, ao qual eu� externo meus agradecimentos. Como fazer uma distribuição de frequência?A distribuição de frequência pode ser feita pelo sexo dos entrevistados e fazer com que, ao finalizar a pesquisa, o resultado mostre quantos homens e quantas mulheres responderam a uma determinada questão.
Quais os elementos que compõe uma distribuição de frequências?Elementos de uma distribuição de frequência. I) Tabela Primitiva: conjunto de elementos (n) que não foram organizados. ... . II) Rol: é o arranjo obtido após a ordenação dos dados que pode ser crescente ou decrescente. ... . III) Classe (i): são intervalos de alteração da variável.. Como e formada a estrutura de uma tabela de frequência?Na tabela de frequências para dados quantitativos contínuos a informação é organizada, no mínimo, em 3 colunas: coluna das classes – onde se identificam os intervalos (classes) em que se subdividiu a amostra; coluna das frequências absolutas – onde se regista o total de elementos da amostra que pertencem a cada classe ...
Quais são os tipos de distribuição de frequência?Distribuição de frequência sem intervalos de classe, ou distribuição pontual, onde todos os valores dos dados coletados são apresentados, e não há perdas de valores ou, Distribuição de frequência com intervalos de classe, onde os valores estão representados por faixas de magnitude.
|