Вы находитесь на странице: 1из 32

UNIVERSIDADE FEDERAL DO OESTE DO PAR - PROF. RODRIGO MEDEIROS.

1. A Estatstica
A Estatstica um ramo da Matemtica Aplicada que fornece mtodos para a coleta, organizao, anlise e interpretao de dados e a sua respectiva utilizao na tomada de decises. A Estatstica Descritiva (ou dedutiva) se encarrega da coleta, organizao e descrio dos dados, enquanto que a Estatstica Inferencial (ou indutiva) se encarrega da anlise e interpretao dos dados. O mtodo estatstico se d em diferentes fases: coleta dos dados, crtica dos dados, apurao dos dados, exposio dos dados e anlise dos dados. Coleta dos dados: A coleta dos dados deve ocorrer aps um planejamento criterioso e a devida determinao das caractersticas mensurveis do fenmeno que se quer estudar. Crtica dos dados: Durante a coleta dos dados, diversos tipos de erros ou falhas podem ocorrer. Essas falhas podem surgir tanto por parte do informante (por distrao ou m interpretao das perguntas que lhe foram feitas), ou ainda, por possveis falhas internas, como erros de digitao ou arredondamento, por exemplo. A crtica dos dados de grande importncia no processo, pois possveis erros nos dados podem influir grosseiramente nos resultados, adulterando toda a pesquisa. Apurao dos dados: a soma e o processamento dos dados obtidos e a disposio mediante critrios de classificao. Pode ser manual ou eletrnica. Exposio ou apresentao dos dados: Para que se possa estudar adequadamente um conjunto de dados comum resumir e simplificar estes dados, a fim de apresent-los de forma mais adequada (tabelas, grficos, medidas tpicas, etc.), tornando mais fcil o entendimento, a anlise e a interpretao do objeto de estudo. Anlise dos resultados: A anlise dos resultados pode se dar a partir da Estatstica Descritiva, que tem objeto descrever e analisar determinada populao, sem pretender tirar concluses de carter mais genrico. Entretanto, o objetivo ltimo da Estatstica tirar concluses sobre o todo (Populao) a partir de informaes fornecidas por uma parte representativa do todo (Amostra), objeto da Estatstica Inferencial.

2. Conceitos Fundamentais
2.1. Varivel: o conjunto de resultados possveis de um fenmeno. Exemplos: - Para o fenmeno nmero de filhos h um nmero de resultados possveis expressos por nmeros naturais: 0, 1, 2, 3, 4, ..., n; - Para o fenmeno estatura h um nmero infinito de valores numricos dentro de um determinado intervalo; - Para o fenmeno Sexo so apenas dois os resultados possveis: masculino ou feminino. Obs: Quando uma varivel admite apenas dois resultados possveis, diz-se que ela dicotmica. Uma varivel pode ser de dois tipos: a) Qualitativa: toda varivel expressa por atributos. Exemplos: Sexo (masculino ou feminino), profisso (professor, engenheiro, etc.), cor da pele (branca, parda, etc.). b) Quantitativa: toda varivel expressa por nmeros. Exemplos: Idade, nmero de filhos, salrio, etc. Uma varivel quantitativa pode ser ainda de dois tipos: contnua e discreta. Varivel contnua: toda varivel quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites. Diz-se ainda que tudo aquilo que pode ser medido. Varivel discreta: toda varivel quantitativa que s pode assumir valores pertencentes a um conjunto enumervel, ou seja, que s assume valores inteiros. Diz-se ainda que tudo aquilo que pode ser contado. Exemplos: Nmero de alunos em uma escola: varivel discreta; Salrio de professores da rede pblica de ensino: varivel contnua; Notas na 1 avaliao de Literatura: varivel contnua; Nmero de professores com ps-graduao: varivel discreta. 2.2. Populao: o conjunto de entes portadores de, pelo menos, uma caracterstica comum. 2.3. Amostra: um subconjunto finito da populao. 2.4. Amostragem: tcnica utilizada para recolher amostras.

Exerccios Propostos
2.1. Classifique as variveis em qualitativas ou quantitativas: a) Cor dos olhos. b) Face de cima de um dado aps um lanamento. c) Dimetro de uma roda de automvel. d) Marca do automvel. e) Renda anual. f) preo do Kg do feijo. g) Tipo de Hepatite. 2.2. Classifique as variveis quantitativas em contnuas ou discretas: a) b) c) d) e) f) g) h) Comprimento de parafusos produzidos por uma mquina. Nmero de pessoas mortas em acidentes areos. Nmero de defeitos por unidade de aparelhos produzidos em uma linha de montagem. Volume de bebida por garrafa em uma fbrica de refrigerantes. Notas na prova de estatstica . Peso (Kg) . Nmero de alunos reprovados em Histria na turma de 1 ano da escola Charles Darwin. Nmero de livros em mau estado na biblioteca central da UFPA.

3. Tabulao
Um dos principais objetivos da Estatstica sintetizar os valores que uma ou mais variveis podem assumir, para que tenhamos uma viso global da variao dessa ou dessas variveis. Assim, uma vez realizada a coleta e apurao dos dados, devemos apresent-los. Duas importantes ferramentas para tal so as Tabelas e os Grficos. A Tabela pode ser definida como um quadro que resume um conjunto de observaes. Na construo de uma Tabela devemos sempre tentar obter um mximo de esclarecimentos com um mnimo de espao e tempo, j que o objetivo principal apresentar os dados de forma sucinta, coerente e organizada, para facilitar a compreenso e anlise dos dados estudados. Uma Tabela compe-se de: 3.1. Ttulo: Conjunto de informaes localizado no topo da Tabela. Estas informaes so referentes a o qu a Tabela est procurando representar. Toda Tabela deve necessariamente responder a trs perguntas: O QU? ONDE? E QUANDO? Exemplo: Nmero de estudantes matriculados em escolas pblicas no estado do Amap no ano de 2003. O qu? Nmero de estudantes matriculados em escolas pblicas. Onde? No estado do Amap.

Quando? No ano de 2003.

3.2. Cabealho: a parte superior da Tabela que especifica o contedo das colunas.

3.3. Corpo: o conjunto de linhas e colunas que contm informaes sobre a varivel em estudo. Segundo o corpo, as Tabelas podem ser de entrada simples ou de dupla entrada. Exemplo: Entrada Simples. Faixa etria das vtimas de violncia sexual atendidas no projeto Sentinela-Belm nos anos de 2002 a 2004. Faixa Etria Menor de 6 anos De 6 a 11 anos De 12 a 18 anos Total
Fonte: Projeto Sentinela Belm, 2005

Freqncia 71 178 162 411

Cabealho

Ttulo

Corpo da Tabela

Rodap Exemplo: Entrada Dupla. Terminais telefnicos em servio no Brasil por regio 1991-1993. Regies Norte Nordeste Sudeste Sul Centro-Oeste 1991 342.938 1.287.813 6.234.501 1.497.315 713.357 1992 375.658 1.379.101 6.729.467 1.608.989 778.925 1993 403.494 1.486.649 7.231.634 1.746.232 884.822

Fonte: Ministrio das Comunicaes

3.4. Rodap: onde colocamos a legenda e todas as informaes que venham esclarecer a interpretao da tabela. Geralmente no rodap que se coloca a fonte dos dados.

Obs1: Cuidado! Nunca devemos inserir unidades de medida ou outros smbolos nos dados da tabela. Comprimento 10 cm 15 cm 20 cm fi 5 10 5 20 ERRADO fr 25% 50% 25% 100% Comprimento (cm) 10 15 20 fi 5 10 5 20 CERTO fr (%) 25 50 25 100

Obs2: O trao (-) usado quando o dado no existe; Obs3: Os trs pontos (...) so usados quando os dados existem, mas no esto disponveis; Obs4: O uso de traos verticais separando as colunas facultativo.

4. Representao Grfica
O grfico uma forma de apresentao dos dados que visa produzir no pblico uma viso mais geral, mais interessante e mais rpida do fenmeno estudado. Toda representao grfica deve obedecer necessariamente trs requisitos fundamentais: Simplicidade, Clareza e Veracidade. Abaixo seguem os principais tipos de representao grfica. 4.1. Grfico em Linhas ou em Curvas Este tipo de grfico utiliza uma linha poligonal para representar os dados. O grfico em linha baseia-se na representao cartesiana dos pontos no plano.
10 9 8 7 6 5 4 3 2 1 0 8,7 7,3 7,3 7 9,3 8,5 9,2 9,6 8,5 8,7 8,6

Notas

1989

90

91

92

93

94 Ano

95

96

97

98

99

Figura 4.1: Notas do aluno X na disciplina Matemtica no Colgio Santa Catarina de Sena de 1989 a 1999.

4.2. Grfico em Colunas ou em Barras a representao dos dados por meio de retngulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras). Exemplo de Grfico em Colunas Produo brasileira de carvo mineral bruto 1989-92 Anos Quantidade Produzida (1.000 t) 18.196 11.168 10.468 9.241

1989 1990 1991 1992

Fonte: Ministrio da Agricultura

20000 Produo (1.000 t) 15000 10000 5000 0 1989 1990 Ano 1991 1992

Figura 4.2: Produo brasileira de carvo mineral bruto 1989 92.

Obs1: O ttulo do grfico pode ser escrito em cima ou abaixo do grfico. Em trabalhos cientficos comum estar abaixo da Figura. Obs2: As variveis representadas em cada eixo devem ser necessariamente identificadas. Obs3: Grficos tambm podem exibir rodap.

Exemplo de Grfico em Barras Tipo de relao da vtima de violncia sexual com o acusado atendidos no Projeto Sentinela SentinelaBelm nos anos de 2002 a 2004. Tipo de Relao Pai Vizinho Padrasto Tio Desconhecido Primo Conhecido da famlia Conhecido da vtima Av Outros familiares Irmo Namorado Total
Fonte: Projeto Sentinela-Belm, 2005 Belm,

Freqncia 82 79 43 37 32 28 20 14 8 7 6 6 362

% 22,7 21,8 11,9 10,2 8,8 7,7 5,5 3,9 2,2 1,9 1,7 1,7 100,0 100

Pai Vizinho Padrasto Tio Desconhecido Primo Conhecido da Famlia Conhecido da Vtima Av Outros Familiares Irmo Namorado 0 10 20 30 40 50 60 70 80 90

Relao vtima x acusado

Quantidade

Figura 4.3: Relao Vtima x Acusado nos casos atendidos no Projeto Sentinela Sentinela-Belm nos anos de 2002 a 2004. Obs1: Sempre que os dizeres a serem escritos forem extensos, convm dar preferncia ao grfico em barras;

Obs2: A ordem a ser observada a cronolgica, no caso das sries histricas, e a decrescente, no caso das sries geogrficas ou categricas.

4.3. Grfico em Colunas Mltiplas, Superpostas e Empilhadas

Este tipo de grfico geralmente utilizado quando deseja-se representar, simultaneamente, dois ou mais fenmenos estudados com propsito de comparao. Exemplo de grfico em colunas mltiplas:
40000 35000 30000 Valor (US$) 25000 20000 15000 10000 5000 0 1989 1990 Ano 1991 Exportao Importao

Figura 4.4: Balana comercial do Brasil 1989 1991.

Quando existem diversos dados a ser representados simultaneamente, convm utilizar o grfico em colunas empilhadas.
12 10 Frequncia 8 6 4 2 0 1 Ano Srie 2 Ano Qumica Fsica Biologia Geografia Histria Portugus Matemtica

Figura 4.4: Grfico de colunas empilhadas para as disciplinas reprovadas por srie no ensino mdio.

4.4. Grfico em Setores Este grfico construdo sempre que se deseja ressaltar a participao de um dado em relao ao total. Exemplo: Pesquisa de inteno de votos para os candidatos prefeitura da cidade X em 1999. Candidatos Candidato A Candidato B Candidato C Candidato D Total
Dados Fictcios

Freqncia 54 125 234 28 441

% 12 28 53 7 100

53% 28% A B C 12% 7% D

Figura 4.5: Pesquisa de inteno de votos para os candidatos prefeitura da cidade X em 1999.

Obs: O grfico em setores s deve ser empregado quando h, no mximo, sete dados;

ERRADO

10

4. Distribuio de Freqncias
Vamos inicialmente considerar as notas de 30 alunos da escola Madre Celeste, em Ananindeua, em 2003. 3,0 9,0 9,0 5,0 2,0 5,0 1,0 3,0 3,0 8,0 0,0 3,0 8,0 2,0 4,0 6,0 4,0 7,0 5,0 5,0 4,0 7,0 6,0 6,0 9,0 6,0 4,0 9,0 4,0 8,0

Portanto, estamos lidando com a varivel quantitativa Nota. Repare que os dados encontram-se desorganizados e difcil tirar alguma concluso a seu respeito. A distribuio de freqncia uma tabela na qual indica-se o nmero de ocorrncias (freqncia) de cada observao. Para construir uma distribuio de freqncias, necessrio compreender os seguintes conceitos: 1. Rol: Consiste na ordenao dos dados segundo algum critrio de grandeza (crescente ou decrescente). Rol: 0,0 4,0 6,0 1,0 4,0 7,0 2,0 4,0 7,0 2,0 5,0 8,0 3,0 5,0 8,0 3,0 5,0 8,0 3,0 5,0 9,0 3,0 6,0 9,0 4,0 6,0 9,0 4,0 6,0 9,0

2. Freqncia simples ou absoluta (fi): um valor que representa o nmero de vezes que uma determinada observao aparece. 3. Freqncia relativa (fr): a razo entre a freqncia simples e o total de observaes. 4. Freqncia acumulada (fac): o total das freqncias de todos os valores inferiores a uma dada observao. O ltimo valor da fac sempre coincidir com . Notas dos alunos do colgio Madre Celeste em Ananindeua no ano de 2003 Notas 0,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 Total fi 1 1 2 4 5 4 4 2 3 4 30 fac 1 2 4 8 13 17 21 23 26 30 fr (%) 3,3 3,3 6,7 13,3 16,7 13,3 13,3 6,7 10,0 13,4 100

Fonte: Colgio Madre Celeste

11

Muitas vezes, o processo de construir uma distribuio de freqncias pode se tornar inconveniente, j que pode tomar muito espao e tornar a anlise muito trabalhosa. Nestes casos convm dividir a amostra em intervalos de classe. Notas dos alunos do colgio Madre Celeste em Ananindeua no ano de 2003 Notas 0,0 2,0 4,0 6,0 8,0 |---- 2,0 |---- 4,0 |---- 6,0 |---- 8,0 |---- 10,0 Total fi 2 6 9 6 7 30 fac 2 8 17 23 30 fr (%) 6,7 20,0 30,0 20,0 23,3 100

Fonte: Colgio Madre Celeste.

5. Classe: um intervalo de variao da varivel. As classes so representadas simbolicamente por i, sendo i = 1, 2, 3, 4, ..., k (onde k o nmero total de classes). Portanto, no exemplo apresentado temos k = 5 e o intervalo 4,0 |---- 6,0 define a terceira classe (i = 3). 6. Limites de classe: so os extremos de cada classe. 11 O menor nmero o limite inferior de classe (li) e o maior nmero, o limite superior de classe (Li). Na quarta classe, por exemplo, temos l4 = 6,0 e L4 = 8,0.

7. Amplitude de um intervalo de classe (hi): a medida do intervalo que define a classe e pode ser obtida simplesmente pela diferena entre os limites superior e inferior dessa classe. hi = Li - li No caso da segunda classe, temos: h2 = L2 l2 = 4,0 2,0 = 2. 8. Amplitude total da distribuio (AT): a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe. AT = L (max.) l (min.) Em nosso exemplo: AT = 10,0 0,0 = 10.

12

9. Nmero de Classes:Uma das primeiras questes a enfrentar na hora de construir uma distribuio de freqncias com intervalos de classe o nmero de classes e, conseqentemente, a amplitude e os limites dos intervalos de classe. A regra de Sturges fornece o nmero de classes (i) de uma distribuio: i 1 + 3,3 . log n onde: i o nmero de classes; n o nmero total de observaes. Abaixo segue outra regra para o clculo do nmero de classes (i) de uma distribuio: Se n < 25 => i = 5 Se n 25 => i = Resolvido o problema da determinao do nmero de classes, obtm-se a amplitude do intervalo de classe dividindo a amplitude total (AT) pelo nmero de classes: h=

Exerccios Propostos
5.1. Construir uma distribuio de freqncia (sem intervalos de classe) para as medidas do dimetro (mm) de uma barra de metal: 325 328 326 330 324 328 327 326 328 329 324 328 327 329 326 328 326 330 327 328

5.2. Dada a seguinte distribuio: Valores 2 10 5 15 6 8 8 3 10 2

Encontrar: a) n. b) Freqncia acumulada. c) Freqncia relativa. d) Freqncia acumulada relativa. e) Qual o percentual de valores menores ou iguais a 6? f)

13

5.3. Abaixo esto descritas as notas de 32 estudantes de uma classe: 6,0 8,0 2,0 4,0 0,0 7,0 5,0 4,5 2,0 8,5 5,5 4,0 6,5 6,0 5,0 1,0 5,0 4,5 7,0 5,5 3,5 0,0 1,5 3,5 4,0 6,5 5,0 2,5 7,0 6,0 5,0 4,5

Determinar: a) O rol. b) A distribuio de freqncia com intervalos de classe (sugesto: iniciar por zero e intervalo de classe de 1,5). c) A maior e a menor nota. d) A amplitude total. e) A freqncia acumulada. f) A freqncia relativa. g) Qual o percentual de alunos que tiraram nota menor que 4,5? 5.4. Os pesos (Kg) dos 40 alunos de uma classe esto abaixo descritos: 69 65 60 67 57 76 81 68 72 60 71 53 54 49 67 75 93 74 63 65 68 59 64 58 72 66 53 80 58 83 73 60 64 70 81 63 62 45 50 53

Determinar: a) A distribuio de freqncia com intervalos de classe, utilizando a frmula de Sturges (sugesto: iniciar com 45). Dado log 40 = 1,60. b) A distribuio de freqncia acumulada. c) A distribuio de freqncia relativa. 5.5. Com os dados abaixo, fazer uma distribuio de freqncias com intervalos de classe (Sugesto: intervalos de 10, incio com 40): 63 76 76 77 70 81 61 71 65 68 57 52 82 71 56 90 56 63 85 79 46 68 74 80 51 68 80 56 75 78 72 75 68 75 80 75 95 72 86 72 50 47 64 69 61 60 73 77 58 53

14

4.1. Representao Grfica da Distribuio de Frequncia 4.1.1. Histograma a representao grfica de uma distribuio de freqncia a partir de retngulos justapostos. A base de cada retngulo colocada no eixo das abscissas e corresponde ao intervalo de classes; a altura de cada retngulo dada pela freqncia simples (ou relativa) das classes.

120

100

80 Frequency

60

40

20

0 1,5 3,0 4,5 6,0 MAT 7,5 9,0

Figura 4.1: Histograma das notas de Matemtica nas escolas pesquisadas em Santarm 2010.

5. Medidas de Tendncia Central


Os dados observados em determinada distribuio tendem, em geral, a se agrupar em torno de valores centrais. Medidas representativas desses valores so chamadas medidas de tendncia central. Dentre as principais medidas de tendncia central, destacamos: a) A mdia aritmtica; b) A mediana; c) A moda. 6.1. Mdia Aritmtica ( ) A Mdia aritmtica definida como o quociente entre a soma dos valores da varivel pelo nmero de observaes.

15

Onde: a mdia aritmtica; os valores da varivel; o nmero de observaes. 6.1.1. Dados no-agrupados Para conhecer a mdia dos dados no-agrupados, determinamos a mdia aritmtica simples. Exemplo: Sabendo-se que a produo diria de uma fbrica de iogurte, durante uma semana, foi de 90, 115, 105, 110, 95, 100 e 120 litros, temos que a produo mdia da semana foi:

= 105

Nota-se que em alguns casos o valor da mdia pode ser diferente de todos os demais valores da amostra. Esse ser o valor representativo dessa amostra, embora no esteja representado nos dados originais. Neste caso, dizemos que a mdia no tem existncia concreta.

Desvio em relao mdia

Denomina-se desvio em relao mdia a diferena entre cada elemento de um conjunto de valores e a mdia aritmtica. = Para o exemplo anterior, temos: = = = = = 90 105 = 15 = 115 105 = 10 = 105 105 = 0 = 110 105 = 5 = = = = 95 105 = 10 = 100 105 = 5 = 120 105 = 15

Propriedade: A soma algbrica dos desvios em relao mdia igual a zero. No exemplo anterior, temos: = 15 + 10 + 0 + 5 + 10 + 5 + 15 => =0 =0

16

6.1.2. Dados Agrupados Sem intervalos de Classe

Como, neste caso, as freqncias so nmeros indicadores da intensidade de cada valor da varivel, elas funcionam como fatores de ponderao. Portanto, devemos utilizar a mdia aritmtica ponderada:

Exemplo: Nmero de filhos do sexo masculino em 34 famlias de quatro filhos

0 1 2 3 4
Dados fictcios

2 6 10 12 4 34

0 6 20 36 16 78

Assim:

=>

= 2,29

=>

= 2,3 meninos.

Como interpretar o valor mdio de 2,3 meninos?

Com intervalos de Classe

Aqui, convenciona-se que todos os valores includos em um determinado intervalo de classe coincidem com o seu ponto mdio.

=
onde o ponto mdio da classe.

17

Exemplo: Estaturas (cm) de 40 alunos do curso de pedagogia UFPA em 2007 i 1 2 3 4 5 6 Estaturas (cm) 150 |--- 154 154 |--- 158 158 |--- 162 162 |--- 166 166 |--- 170 170 |--- 174
Dados fictcios

4 9 11 8 5 3 40

152 156 160 164 168 172

608 1404 1760 1312 840 516 6440

= 6440;

= 161

= 40

=>

= 161 cm

5.3. Moda (Mo) Denomina-se moda o valor que ocorre com maior freqncia em uma srie de valores. 5.3.1. Dados no-agrupados Quando lidamos com dados no-agrupados, reconhece-se a moda simplesmente como aquele valor que mais se repete na amostra. Exemplos: Amostra 1: Amostra 2: Amostra 3:

3, 4, 5, 5, 5, 6, 6, 7, 8

Mo = 5

0, 1, 3, 5, 9, 12 => Amodal (no apresenta moda); 2, 3, 4, 4, 4, 4, 6, 7, 8, 8, 8, 8, 9 => Bimodal (apresenta duas modas: 4 e 8).

5.3.2. Dados Agrupados Sem intervalos de classe

Para determinar a moda basta fixar o valor da varivel com maior freqncia.

18

Exemplo: Nmero de filhos do sexo masculino em 34 famlias de quatro filhos

0 1 2 3 4
Dados fictcios

2 6 10 12 4 34

No exemplo acima, freqncia mxima corresponde o valor 3. Logo, Mo = 3. Com intervalos de classe

A classe que apresenta a maior freqncia denominada classe modal. A moda ser obtida simplesmente calculando-se o ponto mdio da classe modal.

onde:

o limite inferior da classe modal; o limite superior da classe modal.

Este valor recebe o nome de moda bruta. Existem ainda outros mtodos mais elaborados para o clculo da moda, como a frmula de Czuber, por exemplo: = +

onde:

sendo:

o limite inferior da classe modal; a amplitude da classe modal; = ; = ,

a freqncia da classe modal; a freqncia da classe anterior classe modal; a freqncia da classe posterior classe modal.

19

Exemplo: Estaturas (cm) de 40 alunos do curso de pedagogia UFPA em 2007 i 1 2 3 4 5 6 Estaturas (cm) 150 |--- 154 154 |--- 158 158 |--- 162 162 |--- 166 166 |--- 170 170 |--- 174
Dados fictcios

4 9 11 Classe modal 8 5 3 40

Moda Bruta:

Logo: Mo = 160 cm Pela frmula de Czuber:

= 160

= +

= 158 + = 159,6

5.4. Mediana A mediana pode ser definida como o valor central de um conjunto de valores ordenados segundo algum critrio de grandeza. 5.4.1. Dados no-agrupados Exemplo: Vamos considerar o conjunto de observaes: 2, 5, 9, 3, 12, 6, 14 Vamos dar a este conjunto uma ordenao (que pode ser crescente ou decrescente): 2, 3, 5, 6, 9, 12, 14 Nota-se que a observao 6 representa o valor de posio central do conjunto quando este est organizado segundo um critrio de grandeza. 6 o valor central que divide o conjunto em questo ao meio. Portanto, temos Md = 6.

20

No entanto, se o conjunto de valores dado tiver um nmero par de observaes, a mediana ser, por definio, qualquer nmero compreendido entre os dois valores centrais. Por conveno, geralmente utiliza-se o ponto mdio. Por exemplo: 2 , 3, 5, 6, 9, 12, 14, 16 Md = =7,5

Verificamos que, para um conjunto de dados com n elementos, a mediana ser: - o termo de ordem , se n for mpar; e

- a mdia aritmtica dos termos de ordem

+ 1, se n for par.

Obs1: O valor da mediana pode coincidir ou no com um termo da amostra. Quando o nmero de termos da amostra mpar, h coincidncia, quando o nmero de termos da amostra par, no h coincidncia; Obs2: A mediana e a mdia aritmtica no tero, necessariamente, o mesmo valor; Obs3: A mediana depende unicamente da posio e no dos valores dos elementos da amostra. Por esta razo a mediana no se deixa influenciar facilmente por observaes discrepantes, ao contrrio da mdia, que toma todos os valores da amostra para o seu clculo, sendo facilmente influenciada por observaes discrepantes. Por conta disso diz-se que a mediana mais resistente que a mdia; Obs4: Empregamos a mediana sempre que houver valores extremos (observaes discrepantes ou outliers) afetando de uma maneira acentuada a mdia; Obs5: Utilizamos a mediana sempre que desejamos obter o ponto que divide a distribuio em partes iguais. 6.3.2. Dados Agrupados Sem intervalos de classe

Identifica-se a freqncia acumulada imediatamente superior metade da soma das freqncias. A mediana ser aquele valor da varivel que corresponde a tal freqncia acumulada.

21

Exemplo: Nmero de filhos do sexo masculino em 34 famlias de quatro filhos

0 1 2 3 4
Dados fictcios

2 6 10 12 4 34

2 8 18 30 34

= 17

A menor freqncia acumulada que supera esse valor 18, que corresponde ao valor 2, sendo este o valor mediano. Logo: Md = 2 meninos Obs: Caso exista uma freqncia acumulada , tal que: = 2 , a mediana ser dada por:

ou seja, a mediana ser a mdia aritmtica entre o valor correspondente a essa freqncia acumulada e o seguinte. Com intervalos de classe

Primeiramente devemos localizar a classe em que se encontra a mediana: a classe mediana. Tal classe ser aquela correspondente freqncia acumulada imediatamente superior a seguida empregamos a frmula:

. E em

onde:

o limite inferior da classe mediana; a freqncia acumulada da classe anterior classe mediana; a freqncia da classe mediana; a amplitude do intervalo da classe mediana.

= +

22

Exemplo: Estaturas (cm) de 40 alunos do curso de pedagogia UFPA em 2007 i 1 2 3 4 5 6 Estaturas (cm) 150 |--- 154 154 |--- 158 158 |--- 162 162 |--- 166 166 |--- 170 170 |--- 174
Dados fictcios

4 9 11 8 5 3 40

4 13 24 32 37 40

Classe mediana

= 20 = 158 + = 160, 54

= +

Logo: Obs: No caso de existir

Md = 160,54 cm

= 2 , a mediana ser o limite superior da classe correspondente.

Exerccios Propostos
6.1. Para cada uma das sries de valores abaixo, calcule a mdia aritmtica, a moda e a mediana: a) 3, 4, 1, 6, 3, 6, 5, 6 b) 20, 9, 7, 2, 12, 7, 20, 15 c) 15, 18, 20, 13, 10, 16, 14 6.2. As notas de um aluno, em seis provas, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2. Determine: a) A nota mdia. b) A nota mediana. c) A nota modal 6.3. Em uma classe de 50 alunos, as notas obtidas formaram a seguinte distribuio: Notas N de alunos 2 1 3 3 4 6 5 10 6 13 7 8 8 5 9 3 10 1

23

6.4. Calcule a mdia, a moda e a mediana para cada uma das distribuies de freqncia abaixo: a) Notas 0 |--- 2 2 |--- 4 4 |--- 6 6 |--- 8 8 |--- 10 fi 5 8 14 10 7 44 b) Estaturas (cm) 150 |--- 158 158 |--- 166 166 |--- 174 174 |--- 182 182 |--- 190 fi 5 12 18 27 8 70

c) Salrios (R$) 500 |--- 700 700 |--- 900 900 |--- 1100 1100 |--- 1300 1300 |--- 1500 1500 |--- 1700 1700 |--- 1900 fi 18 31 15 3 1 1 1 70

7.

Medidas de Disperso ou Variabilidade


Vamos considerar os seguintes conjuntos de valores das variveis x, y e z: x: 5, 5, 5, 5, 5 y: 3, 4, 5, 6, 7 z: 0, 1, 2, 10, 12 =5 =5 =5

Calculando as respectivas mdias, verificamos que os trs conjuntos de dados apresentam a mesma mdia aritmtica: 5. Entretanto, fcil notar que o conjunto x o mais homogneo que os demais, assim como o conjunto z mais heterogneo que os demais. Assim, verifica-se que conjuntos que apresentam a mesma mdia podem, ainda assim, ser bastante distintos entre si. Chegamos concluso de que a mdia no um valor representativo suficiente para descrever determinado conjunto de dados. Para tal, seriam necessrios ainda valores que dissessem algo a

24

respeito da diversificao dos valores de determinada varivel em torno de sua mdia representativa. Chamamos de disperso ou variabilidade a maior ou menor diversificao dos valores de uma varivel em torno de um valor de tendncia central. Desta forma, podemos dizer do conjunto x do exemplo dado que possui variabilidade ou disperso nula. Podemos dizer tambm que a varivel z apresenta maior disperso ou variabilidade que a varivel y, que apresenta valores mais concentrados em torno da mdia 5. As principais medidas de disperso ou variabilidade so: a amplitude total, a varincia, o desvio padro e o coeficiente de variao. 8.1. Amplitude Total A amplitude total definida como a diferena entre o maior e o menor valor observado: = 8.1.1. Dados no-agrupados Exemplo: Para os valores: 30, 35, 46, 50, 63, 78, 80 AT = 80 30 = 50. Obs1: Quanto maior a amplitude total, maior a disperso dos valores da varivel; Obs2: A maior restrio em relao utilizao da amplitude total como medida de disperso o fato de que ela toma o maior e o menor valor da amostra para o seu clculo, nada dizendo a respeito das observaes que esto entre esses dois valores; Obs3: Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia ou no ano, como medida de clculo rpido ou quando a compreenso popular mais importante que a exatido e a estabilidade. 8.1.2. Dados agrupados Sem intervalos de classe = . . . .

Neste caso ainda teremos: Com intervalos de classe

Neste caso, a amplitude total tomada como a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe. = . .

25

8.2. Varincia e Desvio Padro A varincia e o desvio padro fogem falha a amplitude em considerar apenas o valores dos extremos de uma amostra. Tanto a varincia como o desvio padro levam em conta a totalidade dos dados, o que faz delas ndices de variabilidade bastante estveis e, por isso mesmo, os mais geralmente empregados. A varincia baseia-se na soma dos desvios em relao mdia tomados ao quadrado. Lembrando que a soma dos desvios em relao mdia sempre igual a zero. Por essa razo, esses desvios so tomados ao quadrado. Assim, a varincia dada por:

ou, como

= =

Obs: Quando nosso interesse no se restringe descrio dos dados, mas, partindo da amostra, visamos tirar referncias vlidas para a populao, convm utilizar o divisou n 1 no lugar de n. Como a varincia calculada a partir dos quadrados dos desvios, ela acaba sendo um nmero em unidade quadrada em relao varivel em questo, o que, sob o ponto de vista prtico, um inconveniente. Por essa razo, foi pensada uma nova medida com utilidade e interpretao prticas, de nominada desvio padro (s). O desvio padro pode ser definido com a raiz quadrada da varincia: = =

Obs: A varincia uma medida que tem pouca utilidade como estatstica descritiva, porm extremamente importante em inferncia estatstica. Em estatstica descritiva, geralmente utiliza-se o desvio padro. Para fins de computao, a frmula dada para o clculo do desvio padro no uma boa frmula, pois quando a mdia aritmtica ( ) precisa ser arredondada, cada desvio fica afetado ligeiramente do erro, devido a esse arredondamento. Esse fato torna pouco prtico o clculo de . Por esta razo, conveniente simplificar os clculos fazendo uso da igualdade:

E substituindo-a na frmula do desvio padro, temos: =


2

26

Este mtodo no apenas mais prtico, como tambm mais preciso. 8.2.1. Dados no-agrupados Vamos considerar como exemplo o conjunto de valores da varivel x: x: 10, 12, 14, 16, 18, 20

10 12 14 16 18 20 = 90 =
2

100 144 196 256 324 400 = 1420


2

Como n = 6, temos:

1420 90 2 6 6

= 3,42

8.2.2. Dados Agrupados Como aqui temos a presena de freqncias, devemos lev-las em considerao na hora do clculo: =

27

Exemplo: Estaturas (cm) de 40 alunos do curso de pedagogia UFPA em 2007 i 1 2 3 4 5 6 Estaturas (cm) 150 |--- 154 154 |--- 158 158 |--- 162 162 |--- 166 166 |--- 170 170 |--- 174
Dados fictcios

4 9 11 8 5 3 40

152 156 160 164 168 172

608 1404 1760 1312 840 516 6440

92416 219024 281600 215168 141120 88752 1038080

= 5,57

1038080 6440 2 40 40

= 31 = 5,567

7.3. Coeficiente de Variao Como o desvio padro expresso na mesma unidade dos dados, seu emprego fica limitado quando desejamos comparar duas ou mais sries de valores, relativamente sua variabilidade, quando expressas em unidades diferentes. Para contornar essas limitaes, caracterizamos a variabilidade dos dados em termos relativos a seu valor mdio, obtendo o coeficiente de variao (CV):

No exemplo anterior, = 161 =


,

= 100
e = 5,57 . Portanto:

100 = 3,459

= 3,5%

28

Exerccios Propostos
8.1. Dada a amostra 2, 3, 4, 5, 7, 10, 12. Calcule: a) A amplitude. b) A varincia. c) O desvio padro. 8.2. Num teste aplicado a 20 alunos, obteve-se a seguinte distribuio de pontos: Pontos N de alunos 35 |--- 45 1 45 |--- 55 3 55 |--- 65 8 65 |--- 75 3 75 |--- 85 3 85 |--- 95 2

a) Calcular a varincia. b) Calcular o desvio padro. c) Calcular o coeficiente de variao.

8.3. Calcule o desvio padro para cada uma das distribuies abaixo: a) Notas 0 |--- 2 2 |--- 4 4 |--- 6 6 |--- 8 8 |--- 10 fi 5 8 14 10 7 44 b) Estaturas (cm) 150 |--- 158 158 |--- 166 166 |--- 174 174 |--- 182 182 |--- 190 fi 5 12 18 27 8 70

c) Salrios (R$) 500 |--- 700 700 |--- 900 900 |--- 1100 1100 |--- 1300 1300 |--- 1500 1500 |--- 1700 1700 |--- 1900 fi 18 31 15 3 1 1 1 70

29

7.4. Em um exame final de Matemtica, a nota mdia de um grupo de 150 alunos foi 7,8 e o desvio padro, 0,80. Em Estatstica, entretanto, a nota mdia foi 7,3 e o desvio padro, 0,76. Em que disciplina foi maior a disperso?

8.
4.2.

Instrumental Matemtico
Arredondamento de dados

O arredondamento de dados consiste em suprimir unidades inferiores s de determinada ordem. O arredondamento feito, na maioria da vezes, por uma questo de convenincia ou praticidade. O arredondamento feito da seguinte maneira: Quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, fica inalterado o ltimo algarismo a permanecer.

Exemplos: 15, 543 = 15, 54 2, 94 = 2, 9 Quando o primeiro algarismo a ser abandonado for 6, 7, 8 ou 9, aumenta-se de uma unidade o algarismo a permanecer.

Exemplos: 3, 87 = 3, 9 23, 918 = 23, 92 53, 99 = 54, 0 Quando o primeiro algarismo a ser abandonado for 5, h duas solues: a) Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma unidade ao algarismo a permanecer. Exemplos: 6, 254 = 6, 3 24, 6501 = 24, 7 76, 250002 = 76, 3 b) Se o 5 for o ltimo algarismo ou se ao 5 s seguirem zeros, o ltimo algarismo a ser conservado s ser aumentado de uma unidade se for mpar. Exemplos: 24, 75 = 24, 8 24, 65 = 24, 6 24, 75000 = 24, 8 24, 6500 = 24, 6 Obs: Cuidado! No devemos nunca fazer arredondamentos sucessivos. Exemplo: 3, 3452 = 3,35 = 3,4 Na verdade, 3,3452 = 3,3

30

4.3.

Somatrio

Usamos o smbolo (letra grega, maiscula: sigma), denominado somatrio, para indicar a soma dos valores de uma varivel x, isto , + + + . Assim: = = + + + + + + + =2 =5 =7

Portanto, no caso em que n = 5: +

Exemplo:

2, 5, 7 , tem-se:

4.3.1. Propriedades do somatrio i) Sendo c uma constante: iii) Obs: Cuidado. d d = + = = +

= + + = 2 + 5 + 7 = 14

ii) Sendo c uma constante e x uma varivel:

Sendo x e y duas variveis:

31

Exerccios Propostos
9.1. Escreva sob a forma de somatrio: a) x1 + x2 + x3 + x4 = b) x4 + x5 + x6 + x7 = 4.4. Arredonde cada um dos nmeros abaixo, deixando-os apenas com uma casa decimal: a) b) c) d) e) f) g) h) i) j) k) 2,38 = 24,65 = 0,351 = 4,24 = 328,35 = 2,97 = 6,829 = 5,550 = 89,99 = 78,85 = 1,250001 =

32