Estes testes são úteis para verificar se determinada amostra pode provir de uma
população especificada. São usualmente conhecidos como testes de aderência ou bondade do
ajuste. Neste caso, retira-se uma amostra aleatória e compara-se a distribuição amostral com a
distribuição de interesse.
2.1.1 – Pressupostos
2.1.2 – O Método
Este método irá calcular a probabilidade de obter valores mais extremos do que
os observados.
Determinar N;
Determinar as freqüências observadas;
De acordo com a hipótese, calculamos com a ajuda da Distribuição Binomial
e/ou tabela, a probabilidade de ocorrência de valores mais extremos do que o
observado (número de sucessos):
x
N N
N
P X x p i q N i ou P X x p i q N i *
i 0 i i x i
5
N 5
11
P X 5 p i q N i p i q 11i 0,5
i 0 i i 0 i
Pequenas Amostras
x
N N
N
P X x p i q N i ou P X x p i q N i
i 0 i i x i
Grandes Amostras
x np
Z e procede-se como num teste de hipótese convencional
npq
Tabela: A – SIEGEL
^ 1
Obs: note que a hipótese alternativa foi definida pelos dados amostrais, pois p .
10
x
N 1
10
P X 1 p i q N i 0,3i 0,710 i 0,1493
i 0 i i 0 i
Exemplo 3: Num ensaio de degustação de café, cada mesa era constituída de 5 amostras,
sendo duas delas de café “mole” e as 3 restantes, de café “comum”. Dos 8 degustadores que
foram utilizados, 3 classificaram corretamente os tipos de café.
Teste a hipótese de que os degustadores conseguem distinguir o café “mole” dos demais.
N
N 8
8
P X 3 p i q N i 0,10 i 0,90 8i 0,0381
i 0 i i 3 i
Exercício - A Lei de Mendel afirma que para 4 genes, 3 são dominantes e 1 é recessivo. Em
um certo experimento observou-se 54 genes dominantes e 26 recessivos. Verifique,
pelo teste Binomial, se a lei se aplica ao experimento realizado.
1 1
H0 : p versus Ha : p em que temos: N = 80 e x = 26
4 4
aprox. Normal
80
80 1 i 3 80i 26 20
P X 26 P X P Z 1,55 0,0606
i 26 i 4 4 15
Conclusão: Ao nível de significância de 5% não rejeitamos a hipótese nula. A Lei parece que
se aplica ao experimento.
NPSTAT Aproximação
2.2.2 – O Método
2 i
em que oi freqüência observada na categoria i
i
e
e freqüência esperada na categoria i
i 1 i
i
Quanto maior o valor de 2 maior será a probabilidade de as freqüências
observadas estarem divergindo das freqüências esperadas.
A estatística do teste 2 tem distribuição Qui-Quadrado com graus
de liberdade onde:
Exemplo 1: Deseja-se testar se a posição de largada de um cavalo (por dentro ou por fora)
influencia no resultado de uma corrida de cavalos.
Tabela 2.1 – Distribuição do número de vitórias dos cavalos na sua posição de largada.
Posição 1 2 3 4 5 6 7 8
Número 29 19 18 25 17 10 15 11
de
Vitórias 18* 18* 18* 18* 18* 18* 18* 18*
Fonte: Livro-Siegel
H 0 : f1 f 2 f 8 versus H a : f1 f 2 f 8
8
oi ei 2 29 18 2 19 18 2 11 18
2
2
16,3
k 1 ei 18 18 18
72 indica que o valor 16,3 acusa um p-valor = 0,02224, considerado um valor exato e
bilateral.
(Tabela C – SIEGEL)
Exemplo 2: A tabela dada a seguir apresenta o número observado de falhas mecânicas, por
hora, em uma linha de montagem a partir de um experimento com duração de 40 horas.
Tabela 2.2 – Distribuição do número de falhas mecânicas por hora em uma linha de montagem.
Falhas 0 1 2 3 4 5 6 7 + de 7
Freq. Observada 0 6 8 11 7 4 3 1 0
Freq. Esperada 1,6 5,2 8,3 8,9 7,1 4,6 2,4 1,1 0,7
Fonte: Livro-Siegel
H 0 : A distribuição das falhas mecânicas por hora se ajusta a um processo de Poisson com
3,2
H a : A distribuição das falhas mecânicas por hora não se ajusta a um processo de Poisson
com 3,2
Como a tabela dada apresenta mais de 20% das freqüências com valores inferiores a 5
devemos unir as categorias. Assim:
Tabela 2.3 – Junção das Categorias em que as freqüências são inferiores ao valor 5.
Falhas 0e1 2 3 4 5 ou mais
Freq. Observada 6 8 11 7 8
Freq. Esperada 6,8 8,3 8,9 7,1 8,8
Fonte: Livro-Siegel
5
oi ei 2
2
0,675
k 1 ei
Tabela 2.4 – Distribuição do número de famílias com 5 filhos de acordo com o sexo
Número 5 mulheres 4 mulheres 3 mulheres 2 mulheres 1 mulher 0 mulheres Total
de filhos 0 homens 1 homem 2 homens 3 homens 4 homens 5 homens
Número 18 56 110 88 40 8 320
de
famílias
ei 10 50 100 100 50 10 320
6 o e 2
2 i i 12,0 e com 52 que acusa um p-valor aproximadamente igual a 0,04.
i 1 ei
2.3.2 – O Método
D máx F0 X S n X
Exemplo 1: Num experimento para calibrar a luminosidade adequada de uma nova máquina
fotográfica, foram tiradas 5 fotos de cada uma das 10 pessoas que participaram do
experimento. A cada pessoa perguntou-se qual das fotos apresentava uma qualidade maior, de
1 a 5, onde 1 representa um grau baixo e 5 um grau alto de luminosidade.
H 0 : f1 f 2 f 5 versus H a : f1 f 2 f 5
1 2 3 4 5
F0 X 1 2 3 4 5
5 5 5 5 5
S10 X 0 1 1 6 10
1010 10 10 10
F0 X - 2 3 5 2 0
S10 X 10 10 10 10
Exemplo 2 :Verifique se os dados abaixo podem ser ajustados por uma distribuição de
Poisson com média igual a 1,2.
Xi fi
0 15
1 25
2 10
3 5
4 4
5 1
F0 X i Sn X i F0 X i - S n X i
0,3012 0,250 0,0512*
0,6626 0,666 0,0041
0,8794 0,833 0,0461
0,9661 0,917 0,0494
0,9921 0,983 0,0088
0,9983 1,000 0,0017
Conclusão: D máx F0 X i S n X i 0,0512 e com isto p > 0,20. Então não podemos
rejeitar a hipótese nula.
Como vimos no exemplo acima os dados foram agrupados em classes ( i ), onde era
associado a cada valor Xi a sua respectiva freqüência f i . Este teste também pode ser aplicado
quando as classes são definidas por intervalos; no entanto desta forma ele perde em precisão.
Classes fi xi F xi S xi F xi - S
xi
2700-3000 13 2850 0,332 0,111 0,221
3000-3300 18 3150 0,397 0,265 0,132
3300-3600 24 3450 0,465 0,478 0,012
3600-3900 32 3750 0,534 0,756 0,221
3900-4200 17 4050 0,602 0,904 0,301
4200-4500 11 4350 0,667 1,00 0,332
115
Podemos admitir que a produção média segue uma distribuição normal com média
3.600 e 2 3.000.000 ?
Conclusão: Para n = 115, a P(D 0,332) < 0,01 e os dados não se aderem à distribuição Normal
proposta.
Este teste tem procedimento análogo ao Kolmogorov – Smirnov porém utiliza uma
tabela própria e mais adequada a este tipo de situação. (Tabela 6 – Campos)
Exige-se ao menos que os dados sigam uma escala nominal e que eles possam
ser divididos em duas categorias.
2.5.2 – Método
r r
Z
r
E fazemos uso da tabela da distribuição normal padrão.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
+ - + + + + - + + + - - - - + - - + + + - - - -
1 2 3 3 3 3 4 5 5 5 6 6 6 6 7 8 8 9 9 9 10 10 10 10
N 50 2.30.20
r 1 25
n1 30 50
n2 20 2.30.20( 2.30.20 30 20)
r 3,356
r 35 (30 20) 2 (30 20 1)
35 25
Z 2,98
3,356
Conclusão: Pela Tabela da Normal Padrão temos pelo teste bilateral um p-valor igual a
0,0028. Assim, rejeitamos a hipótese nula. Na fila observada, a ordem de homens e mulheres
não foi aleatória.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Sexo H H M H M M M H M M M H H H H M
QI 125 127 128 132 133 135 136 137 140 141 142 143 144 145 146 147
Temos evidências para acreditar que a ordem dos quocientes não seja aleatória?
n1 8 n2 8 r 8 l1 4 l2 14
Conclusão: O número de iterações observado encontra-se dentro dos limites tabelados. Não
temos evidências de que os quocientes não se ordenam aleatoriamente para homens e
mulheres.
Observe neste exercício que tínhamos uma variável em escala intervalar e que
esta foi transformada em nominal, levando a uma perda considerável de observações.
Neste caso, seria mais adequada a verificação da suposição de normalidade e se
atendida aplicar um teste paramétrico.
Se não atendido o pressuposto, deveríamos tentar a aplicação de uma técnica
Não-Paramétrica para comparação de duas amostras, que veremos mais adiante.
Гораздо больше, чем просто документы.
Откройте для себя все, что может предложить Scribd, включая книги и аудиокниги от крупных издательств.
Отменить можно в любой момент.