Академический Документы
Профессиональный Документы
Культура Документы
IFES
CAMPUS GUARAPARI
APOSTILA DE ESTATISTICA
Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização,
descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisão.
Tabelas
Coleta de Dados Critica dos dados Análises
Gráficos
Tipos de variaveis
a) Qualitativa: quando seus valores são expressos por atributos:
Ex. Sexo ( masculino, feminino), cor(branca,vermelha,parda etc.)
b) Quantitativas: quando seus valores são expressos em números( sálario das pessoas, idade dos
alunos de sua sala de aula etc.)
Devemos observar que uma variavel quantitativa que pode assumir qualquer valor entre dois
limites recebe o nome de variavel Continua. Uma variavel que só pode assumir valores pertencentes
ao conjunto dos numeros inteiros é chamada variavel discreta.
ex. a quantidade de alunos de uma escola pode ser 100, 80, 400 etc, jamais teriamos uma escola
com 40,5 alunos.
População e Amostra
População:
Uma população é uma coleção de unidades individuais, que podem ser pessoas, animais, resultados
experimentais, com uma ou mais características comuns, que se pretendem analisar.
Obs.
• Podemos também definir população como um conjunto de elementos abrangidos por
uma mesma definição.
• A cada elemento da população dá-se o nome de unidade estatística.
• O número de elementos da população designa-se por dimensão da população e
representa-se por N.
• A dimensão da população pode ser finita ou infinita.
Muitas vezes a população é confundida com a própria característica populacional em estudo.
Exemplo
Ao considerarmos a população constituída pelos alunos de uma Universidade, no ano letivo
2005/06, podemos estar interessados em estudar a altura. Assim falamos na população constituída
pelas alturas dos alunos da Universidade, já que é a característica a estudar.
Exemplo
Obter uma amostra representativa, de 10%, de uma população de 200 alunos de uma
escola.
1º) Numerar os alunos de 1 a 200;
2º) Escrever os números de 1 a 200 em pedaços de papel e colocá-los em uma urna;
3º) Retirar 20 pedaços de papel, um a um, da urna, formando a amostra da população.
Nesta técnica de amostragem, todos os elementos da população têm a mesma
probabilidade de serem selecionados: 1/N, onde N é o número de elementos da
população.
Amostragem Estratificada
Exemplo
Em uma população de 200 alunos, há 120 meninos e 80 meninas. Extraia uma
amostra representativa, de 10%, dessa população. Nesse exemplo, há uma característica
que permite identificar 2 subconjuntos, a característica Sexo. Considerando essa divisão,
vamos extrair a amostra da população.
Com o erro amostral tolerável em 2%, 1111 colaboradores devem ser entrevistados para a
pesquisa.
Vamos repetir os cálculos, definindo o erro amostral tolerável em 4%.
N = 2000
E0 = 0,04
n0 = 1 / (E0)2
n0 = 1 / (0,04)2
n0 = 625
n = (N . n0) / (N + n0)
n = (2000 . 625) / (2000 + 625)
n = 476 colaboradores
Através deste segundo cálculo, é possível observar que, quando aumentamos a margem
de erro, o tamanho da amostra reduz. E se houvesse 300.000 colaboradores na empresa?
N = 300.000
E0 = 0,04
n0 = 1 / (E0)2
n0 = 1 / (0,04)2
n0 = 625
n = (N . n0) / (N + n0)
n = (300.000 . 625) / (300.000 + 625)
n = 623 colaboradores
Observe que a diferença entre n e n0, neste último cálculo, é muito pequena. Portanto, se o
número de elementos da população (N) é muito grande, a primeira aproximação do tamanho da
amostra já é suficiente.
Observe ainda:
N = 2000
E0 = 0,04
n = 476 colaboradores = 23,8% da população
N = 300.000
E0 = 0,04
n = 623 colaboradores = 0,2% da população
TABULAÇÃO
Uma vez feita a coleta dos dados , e sua respectiva apuração, devemos efetuar a apresentação
Rodapé
No rodapé de uma tabela devemos colocar a legenda e as observações que venham esclarecer a
interpretação da tabela. Geralmente também é no rodapé que se coloca a fonte dos dados, embora
em alguns casos ela possa ser colocada também no cabeçalho. A fonte serve para dar maior
autenticidade a tabela.
Tabelas
Uma das formas de sintetizar a informação contida em dados observados é por meio de tabelas e
gráficos. A fim de apresentar as representações mais usuais de variaveis continuas, consideremos o
resultado do ensaio de ruptura de uma mostra de 80 corpos de prova de concreto indicado no quadro
abaixo.
Quadro 1
298 321 354 352 328 334 310 247 343 352
290 293 348 289 353 335 335 319 324 267
346 334 305 289 321 280 323 283 310 254
284 315 283 298 265 294 275 269 293 270
272 323 295 306 271 323 298 317 292 306
303 306 325 285 250 300 267 309 284 287
277 326 289 265 282 302 302 322 285 324
Estes dados, registrados em sua ordem cronologica, fornecem pouca informação sobre o fenômeno.
Apresentadas em sua ordem crescente, como no quadro 2, mostram que a resistencia a ruptura varia
entre 247 e 354.
Quadro 2
247 250 254 265 265 267 267 269 270 271
272 275 276 277 277 280 282 283 283 284
284 285 285 287 289 289 289 290 290 291
292 292 293 293 293 294 295 296 298 298
300 302 302 303 305 306 306 306 309 310
310 315 317 317 319 321 321 322 323 323
323 324 324 324 325 326 328 332 334 334
335 335 339 343 346 348 352 352 353 354
Agrupando os dados em classes como no quadro 3, podemos apreciar que a maior concentração se
apresenta na classe central, decrescendo à medida que nos aproximamos dos extremos. O numeo de
observações em cada classe denomina-se frequencia da classe, sendo este quadro designado tabela
de frequencias.
Quadro 3
Tabela de frequencias
Tensão de ruptura Numero de corpos
240 a 249 1
250 a 269 7
270 a 289 19
290 a 309 22
310 a 329 18
330 a 349 9
350 a 359 4
Estatistica Gráfica
Corresponde às representações dos dados sob diferentes formas gráficas, a fim de permitir uma
visão rápida e global do fato estudado. De uma maneira geral, podemos dizer que os gráficos devem
ser construidos de maneira simples e clara, de tal sorte que o observador entenda facilmente aquilo
que o gráfico busca evidenciar. É extremamente importante que o gráfico seja construido com
honestidade, buscando retratar a realidade, observando-se o máximo cuidado no traçado quanto a
escala.
Gráficos para distribuição de frequencia de uma variavel discreta
Numeros de erros por paginas observadas em um livro
Xi Fi
0 35
1 20
Fi
35
20
13
0 1 2 3 4 5 Xi
Representação gráfica da distribuição de frequência de uma variavel continua
Histograma
É a representação gráfica atrvés de retangulos adjacentes onde a base colocada no eixo da
abscissas corresponde aos intervalos das classes, e a altura é dada pela frequência absoluta das
classes.
Notas dos alunos 3º periodo de Administração
2–4 5 8
4–6 10 18
6–8 6 24
8 –10 1 25
25
Histograma
FI
0 2 4 6 8 10 notas
Poligono de frequência
É a representação gráfica de uma distribuição de frequências por meio de um poligono, onde os
pontos são obtidos por perpendiculares traçadas a partir dos pontos médios das classes, e de altura
proporcional à frequência de cada uma das classes. No caso de frequência acumulada, os segmentos
perpendiculares são traçados a partir dos limites superiores da classe. Em ambos os casos, o
primeiro e o ultimo pontos são colocados de modo a manter a proporcionalidade do gráfico.
FI
10
0 2 4 6 8 10 notas
Medidas de posição
A distribuição de frequências, até agora, permite-nos descrever, de modo geral, os grupos de valores
que uma variavel pode assumir. Dessa forma, podemos localizar a maior concentração de valores de
uma determinada distribuição, isto é, se ela se localiza no inicio, no meio ou no final, ou ainda, se
há uma distribuição igual. Porém, para ressaltar a têndencias caracteristicas de cada distribuição,
isoladamente, ou em confronto com outras, necessitamos introduzir conceitos que se expressem
através de numeros, que nos permitam traduzir essas tendências. Esses conceitos são denominados
elementos tipicos da distribuição e são as:
a- medidas de posição
b- medidas de variabilidade ou dispersão
c- medidas de assimetria
d- medidas de curtose
As medidas de posição mais importantes são as medidas de tendência central, que rcebemtal
denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos
valores centrais. Dentr as medidas de tendência central, destacamos.
x = Σxi/n
onde:
x média aritmética
xi valores da variavel
n numero de valores
Exemplo
x = (50+70+45+60)/4
x = 56,25 pontos
Σ= 34
Neste caso, como as frequências são numeros indicadores da intensidade de cada valor da variavel,
elas funcionam como fatores de ponderação, o que nos leva a calcular a média artimética
x = Σxifi/ Σfi
O modo mais prático de obtenção da média ponderada é abrir, na tabela, uma coluna
correspondente aos produtos xifi.
Tabela
xi fi xifi
O 2 0
1 6 6
2 10 20
3 12 36
4 4 16
Σ = 34 Σ = 78
temos então
Σxifi = 78 Σfi = 34
logo:
x = Σxifi/Σfi =78/32 = 2,3 meninos
Mediana (Md)
A mediana é outra medida de posição definida como o número que se encontra no centro de uma
serie de numeros, estando estes dispostos segundo uma ordem. É o numero que separa o conjunto
em duas partes com o mesmo numero de elementos quando ordenados.
Exemplo:
Dada a série de valores, abaixo
5,13,10,2,18,15,6,16,9
Vamos ordenar em ordem crescente
2,5,6,9,10,13,15,16,18
Tomamos o valor central que apresenta o mesmo numero de elementos a direita e a esquerda.
Md = 10
Se porém a serie tiver numero par de elementos, a mediana será, por definição qualquer dos
numeros compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o ponto
médio.
Exemplo
2,6,7,10,12,13,18,,21
A mediana será a média dos dois valores centrais
Md = (10 + 12)/2
Md = 11
Mediana para dados agrupados
Se os dados se agrupam em uma distribuição de frequência, o cálculo da mediana se processa de
modo muito semelhante àquele dos dados não agrupados visto anteriormente, implicando, porém, a
determinação prévia das frequências acumuladas. Ainda aqui, temos que determinar um valor tal
que divida a distribuição em dois grupos que contenham o mesmo numero de elementos.
Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos, é dada por.
Σfi/2
Sendo :
Σfi/2 = 34/2 = 17
A menor frequência acumulada que supera esse valor é 18, que corresponde ao valor 2 da variavel,
sendo este valor mediano, logo:
Md = 2
No caso de existir uma frequência acumulada ( Fi), tal que:
Fi = Σfi/2
A mediana será dada por:
Md = (xi + xi+1)/2
Isto é, a mediana será a média aritmética entre o valor da variavel correpondente a essa frequência
acumulada e o seguinte.
Exemplo
Xi fi Fi
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
Σ=8
Exercicio
1 – Complete o esquema para o cálculo da mediana das distribuições:
a)
xi 2 4 6 8 10
fi 3 7 12 8 4
Xi fi FI
2 3 ….....
4 7 10
6 12 …....
8 8 30
10 4 …....
Md =..........
b)
xi 012345
fi 259763
Xi fi Fi
0 2 2
….. ...... …...
….. 9 …...
….. …... …...
4 …... …...
…... …... …...
Σ= …......
Md =..........
Σ = 40
Σfi/2 = 40/2 = 20
Como há 24 valores incluidos nas tres primeiras classes da distribuição e como pretendemos
determinar o valor que ocupa o 20º lugar, a partir do incio da série, vemos que este deve estar
localizado na terceira classe ( i = 3 ), supondo que as frequências dessas classes estejam
uniformemente distribuidas.
( Σfi - f(ant) ) h*
Md = 2 f*
na qual:
L* é o limite inferior da classe mediana
F(ant) é a frequência acumulada da classe anterior à classe da mediana
f* é a frequência simples da classe mediana
h* é a amplitudee do intervalo da classe mediana
Σfi = 40 = 20
2
Logo, a classe mediana é a de ordem 3. Então
L* = 158, F (ant) = 13, f* = 11 e h* = 4
Substituindo esses valores na formula, obtemos:
Exercícios
1) Considerando os conjuntos de dados:
a. 3, 5, 2, 6, 5, 9, 5, 2, 8, 6
b. 20, 9, 7, 2, 12, 7, 2, 15, 7
c. 51,6; 48,7; 50,3; 49,5; 48,9
3. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2.
Determine:
a) a nota média;
b) a nota mediana;
c) a nota modal.
4. Considerando a distribuição abaixo:
xi 3 4 5 6 7 8
fi 4 8 11 10 8 3
Calcule:
a) a média;
b) a mediana;
c) a moda.
5. Em uma classe de 50 alunos, as notas obtidas formaram a seguinte distribuição:
NOTAS 2 3 4 5 6 7 8 9 10
Nº DE
1 3 6 10 13 8 5 3 1
ALUNO
Determine:
a) a nota média;
b) a nota mediana
c) a nota modal.
b.
xi 50 58 66
fi 20 50 30
7. Determine os desvios em relação à média dos seguintes dados: 6, 8, 5, 12, 11, 7, 4, 15.
Determine a soma dos desvios.
c. d.
SALÁRIOS (R$) fi PESOS (kg) fi
500 ι— 700 18 145 ι— 151 10
700 ι— 900 31 151 ι— 157 9
900 ι— 1.100 15 157 ι— 163 8
1.100 ι— 1.300 3 163 ι— 169 6
1.300 ι— 1.500 1 169 ι— 175 3
1.500 ι— 1.700 1 175 ι— 181 3
1.700 ι— 1.900 1 181 ι— 187 1
∑ = 70 ∑ = 40
12. Numa empresa, vinte operários têm salário de R$ 4.000,00 mensais; dez operários têm salário
de R$ 3.000,00 mensais e trinta têm salário de R$ 2.000,00 mensais. Qual é o salário médio desses
operários:
13. Explique a relação média aritmética e média ponderada. Pesquise caso necessário.
14. Numa grande empresa, em três setores pesquisados num determinado dia, foram constatadas
faltas de funcionários, assim distribuídos:
* 4% no setor administrativo;
* 8% no setor de produção;
* 12% no setor comercial.
Calcule a média de faltas desse dia, considerando que, no setor de produção, há 200 funcionários, o
setor administrativo tem 50 funcionários e o setor comercial tem 75 funcionários.
15. Um carro, numa viagem, andou 5 horas a 60 km por hora. Determine a velocidade horária
média nessas 8 horas de viagem.
16. A média aritmética entre 50 números é igual a 38. Dois números são retirados: o número 55 e o
21. Calcule a média aritmética dos números que restaram.
17. Um ourives fez uma liga fundindo 200 g de ouro 14 k (quilates) com 100 g de ouro 16 k. O
número que dá a melhor aproximação em quilates de ouro obtido é:
a) 14,5 k b) 14,6 k c) 14,7 k d) 15,0 k e) 15,5 k
18. Num concurso de vestibular para dois cursos A e B, compareceram 500 candidatos para o curso
A e 100 candidatos para o curso B. Na prova de Matemática, a média aritmética geral, considerando
os dois cursos, foi 4,0.
Mas, considerando apenas os candidatos ao curso A, a média cai para 3,8.
A média dos candidatos ao curso B, na prova de Matemática, foi:
a) 4,2 b) 5,0 c) 5,2 d) 6,0 e) 6,2
20. Considere um grupo formado por cinco amigos com idade de 13, 13, 14, 14 e 15 anos. O que
acontece com a média de idade desse grupo, se um sexto amigo com 16 anos juntar-se ao grupo?
a) Permanece a mesma b) Diminui 1 ano c) Aumenta 12 anos
d) Aumenta mais de 1 ano e) Aumenta menos de 1 ano x
22. A média aritmética de um grupo de 120 pessoas é de 40 anos. Se a média aritmética das
mulheres é de 35 anos e dos homens é de 50 anos, qual o número de pessoas de cada sexo, no
grupo?
23. Sabe-se que a média aritmética de 5 números inteiros distintos, estritamente positivos, é 16. O
maior valor que um desses inteiros pode assumir é:
a) 16 b) 20 c) 10 d) 70 e) 100
24. Num país, a população feminina é 51% do total. A idade média da população feminina é 38 anos
e da masculina é 36. Então, a idade média da população, em anos, é:
a) 37,02 b) 37,00 c) 37,20 d) 36,60 e) 37,05
25. Numa população, a razão do número de mulheres para o de homens é de 11 para 10. A idade
média das mulheres é 34 e a idade média dos homens é 32. Então, a idade média da população é
aproximadamente:
a) 32,9 b) 32,95 c) 33,00 d) 33,05 e) 33,10
Medidas de dispersão
As medidas de dispersão servem para verificarmos a representatividade das medidas de posição,
pois é muito comum encontrarmos séries que, apesar de terem a mesma média, são compostas de
maneira distinta.
Assim para as séries:
a) 20,20,20,20,20
b) 15,10,20,25,30
fazendo os cálculos temos xa = xb = 20
Nota-se que os valores da serie “a” se concentram totalmente na média 20, enquanto os valores da
série “b” se dispersam em torno do mesmo valor. Ou seja, a série “a” não apresenta dispersão e os
valores da série “b” estão disperso em torno de 20. Vamos medir o grau de concentração ou
dispersão dos dados em torno da média. Vamos calcular as medidas de dispersão.
Amplitude
A amplitude se baseia somente nos valores extremos do conjunto de dados, sendo definida como a
diferença, em valor absoluto, entre esses extremos superior e inferior. Assim, se o menor valor entre
os dados for 2 e o maior for 49, a amplitude será 47, pois 49 – 2 = 47.
Variancia
A variancia é calculada a partir das diferenças entre cada elemento e a média do conjunto; sendo
assim, é uma medida mais significativa que a amplitude.
Numa sequência de valores qualquer, a variância será calculada seguindo os seguintes passos:
passo1
Encontrar a média aritmética dos elementos da sequência
Passo 2
Encontrar as diferenças entre a média e cada elemento da sequencia
Passo 3
Elevar ao quadrado essas diferenças
Passo 4
Somar essas diferenças
Passo 5
Dividir o resultado da soma pelo numero de elementos do conjunto.
a) Cálculo da média
x= Σxi = 67+ 59+ 68+ 62+ 64+ 60+ 66+ 66+ 65+ 67+ 63+ 65+ 67+ 58
n 14
x = 64
b) Calculo das diferenças ( xi - x)
67 – 64 = 3
59 – 64 = -5
68 – 64 = 4 resolvendo para todos os elementos teremos
3,-5, 4,-2,0,-4,2,2,1,3,-1,-1,1,3,-6
c) Elevando-as ao quadrado e somando: ( xi – x )2
(67 – 64)2 = 9
(59 – 64)2 = 25 e assim por diante, teremos portanto:
9+ 25+ 16+ 4+ 0+ 16+ 4+ 4+ 1+ 9+ 1+ 1+1+9+36 = 136
Variância = 136
15
Variância = 9,07
Variância = Σ(x-x)2
n
1. Em uma prova de Estatística, 3 alunos obtiveram a nota 8,2; outros 3 obtiveram a nota
9,0; 5 obtiveram a nota 8,6; 1 obteve a nota 7,0 e 1 a nota 8,9. Tirando a média aritmética,
esta será:
A) uma média aritmética simples com valor 8,0.
B) uma média aritmética simples com valor 8,7.
C) uma média aritmética ponderada com valor 8,0.
D) uma média aritmética ponderada com valor 8,5.
E) Nenhuma das anteriores.
2. Um professor, após verificar que toda a classe obteve nota baixa, eliminou as questões
que não foram respondidas pelos alunos. Com isso, as notas de todos os alunos foram
aumentadas de 3 pontos. Então:
A) a média aritmética ficou alterada, assim como a mediana.
B) apenas a média aritmética ficou alterada.
C) apenas a mediana ficou alterada.
D) não houve alteração nem na média nem na mediana.
E) nada podemos afirmar sem conhecer o número total de alunos.
6) Dados os conjuntos de números: A = { -2, -1, 0, 1, 2 } B = { 220, 225, 230, 235, 240 }
Podemos afirmar de acordo com as propriedades do desvio padrão, que o desvio padrãode B
é igual: