Академический Документы
Профессиональный Документы
Культура Документы
Testes de Independncia
Testes de Homogeneidade
1. Testes de Aderncia
Objetivo: Testar a adequabilidade de um modelo probabilstico a
um conjunto de dados observados
Exemplo 1: Gentica
Equilbrio Hardy-Weinberg
Aa
Probabilidades:
Aa
AA
Aa
aa
(Modelo terico)
Gentipo
Freqncia
Observada
AA
26
Aa
45
aa
29
Total
100
25
50
25
Gentipo
Freqncia
Observada
Freqncia
Esperada
AA
26
25
Aa
45
50
aa
29
25
Total
100
100
1. Testes de Aderncia
Metodologia
2 categorias de
Freqncia
Observada
O1
O2
O3
Ok
Total
Ei
n poi ,
1, , k
7
Freqncia
Observada
Freqncia
Esperada
O1
E1
O2
E2
O3
E3
Ok
Ek
Total
(Oi
Ei )2
Ei
8
Ei ) 2
(Oi
2
i 1
Estatstica do
teste de aderncia.
Ei
Supondo H verdadeira,
k
2
i 1
sendo que q = k
(Oi
Ei )2
Ei
2
q
, aproximadamente,
Obs.:
Obs Este resultado vlido para n grande e para
Ei
5, i
1, , k .
Regra de deciso:
Pode ser baseada no nvel descritivo P, neste caso
P(
2
q
2
obs
),
2
obs
Se, para
fixado, obtemos P
, rejeitamos a hiptese H.
10
Equilbrio Hardy-Weinberg:
Hipteses:
H: O modelo proposto adequado a esta situao
A: O modelo no adequado a esta situao
De forma equivalente, podemos escrever:
11
Gentipo
Oi
Ei
AA
26
25
Aa
45
50
aa
29
25
Total
100
100
(Oi
0,04
Ei)2
Ei
(26 25) 2
25
0,50 0,64
(45 50) 2
50
(29 25) 2
25
1,18 .
Data Display
K2
0.554327
MTB >
Nvel descritivo
13
Dia da
semana
No. de acidentes
Seg
20
Ter
10
Qua
10
Qui
15
Sex
30
Sab
20
Dom
35
14
15
Dia da semana
No. de acidentes
observados (Oi )
No. esperado de
acidentes (Ei )
Seg
20
20
Ter
10
20
Qua
10
20
Qui
15
20
Sex
30
20
Sab
20
20
Dom
35
20
7
1
(Oi
Ei)2
Ei
(20 20) 2
20
(30 20)2
20
(10 20) 2
20
(20 20) 2
20
(10 20)2
20
(35 20) 2
20
(15 20)2
20
27,50 .
16
2
6,
aproximadamente.
P(
2
6
27,50)
Data Display
K2
0.000116680
Logo, para = 0,05, segue que P = 0,001 < e assim rejeitamos H,
e conclumos que o nmero de acidentes no o mesmo em
todos os dias da semana.
17
2. Testes de Independncia
Objetivo: Verificar se existe independncia entre duas variveis
medidas nas mesmas unidades experimentais.
Exemplo 3: Deseja-se verificar se existe dependncia entre a renda e o
nmero de filhos em famlias de uma cidade.
250 famlias escolhidas ao acaso forneceram a tabela a seguir:
Renda (R$)
Nmero de filhos
0
+ de 2
Total
menos de 2000
15
27
50
43
135
2000 a 5000
25
30
12
75
5000 ou mais
13
10
40
Total
48
70
71
61
250
18
B
A1
A2
B1
n11
n21
B2
n12
n2s
Bs
n1s
n2s
Total
n1
n2
Ar
nr1
nr2
nrs
nr
Total
Teste de independncia:
independncia
H: A e B so variveis independentes
A: As variveis A e B no so independentes
19
P(Ai
Bj ) = P(Ai )
P(Bj )
i = 1, 2, , r e j = 1, 2, ,s.
Eij
pij
pi
pj
ni
n
nj
n
Eij
ni
nj
n
Estatstica do
teste de
independncia
Eij )2
( Oij
Eij
i 1 j 1
2
i 1 j 1
sendo q = ( r
1)
(s
(Oij
Eij )2
Eij
2
q
1 ) graus de liberdade.
21
Regra de deciso:
Pode ser baseada no nvel descritivo P, neste caso
P
em que
do teste.
2
obs
P(
2
q
2
obs
Graficamente:
P
2
obs
Se, para
fixado obtemos P
Exemplo (continuao):
Estudo da dependncia entre renda e o nmero de filhos
250 famlias foram escolhidas ao acaso
Hipteses
Renda (R$)
Nmero de filhos
0
+ de 2
Total
15
27
50
43
135
2000 a 5000
25
30
12
75
5000 ou mais
13
10
40
Total
48
70
71
61
250
menos de 2000
48 135
250
25,92 .
23
Renda (R$)
menos de 2000
2000 a 5000
Nmero de filhos
0
+ de 2
Total
135
8(18,30)
75
5000 ou mais
8(7,68)
13(11,20)
9(11,36)
10(9,76)
40
Total
48
70
71
61
250
70 75
250
E 34
21,00
61 40
9,76
250
Lembre-se:
Eij
ni
nj
n
24
Renda (R$)
menos de 2000
2000 a 5000
+ de 2
Total
135
8(18,30)
75
5000 ou mais
8(7,68)
13(11,20)
9(11,36)
10(9,76)
40
Total
48
70
71
61
250
2
obs
15 25,92
25,92
30 21,00
21,00
12 21,30
21,30
10 9,76
9,76
25 14,40
14,40
13 11,20
11,20
9 11,36
11,36
8 7,68
7,68
27 37,80
37,80
50 38,34
38,34
43 32,94
32,94
12 21,30
21,30
8 18,30
18,30
36,62
25
Logo,
2
6
e, supondo
q = (r
= 0,05, P
P(
1) (s
2
6
1) = 2 3 = 6
36,62)
0,000
Stat
test
Tables
Chi-Square
26
Sada do MINITAB:
Chi-Square Test
Expected counts are printed below observed counts
C1
15
25,92
C2
27
37,80
C3
50
38,34
C4
43
32,94
Total
135
25
14,40
30
21,00
12
21,30
8
18,30
75
8
7,68
13
11,20
9
11,36
10
9,76
40
Total
48
70
71
61
250
Chi-Sq =
4,601
7,803
0,013
DF = 6, P-Value
+ 3,086 +
+ 3,857 +
+ 0,289 +
= 0,000
3,546 +
4,061 +
0,490 +
3,072 +
5,797 +
0,006 = 36,621
27
Colesterol
Presso
Total
< 127
127a 166
>166
<200
117
168
22
307
200 a 260
204
418
63
685
>260
67
145
33
245
Total
388
731
118
1237
Sada do MINITAB:
Chi-Square Test
Expected counts are printed below observed counts
C1
C2
C3
Total
1
117
168
22
307
96,29
181,42
29,29
2
204
214,86
418
404,80
63
65,34
685
67
76,85
388
145
144,78
731
33
23,37
118
245
Total
Chi-Sq =
4,452
0,549
1,262
DF = 4, P-Value
+ 0,993 +
+ 0,431 +
+ 0,000 +
= 0,009
1237
1,812 +
0,084 +
3,967 = 13,550
= 0,05).
29
3. Teste de Homogeneidade
Objetivo: Verificar se uma varivel aleatria se comporta de modo
similar, ou homogneo, em vrias subpopulaes.
Exemplo 5: A reao ao tratamento por quimioterapia est sendo
estudada em quatro grupos de pacientes com cncer.
Deseja-se investigar se todos os tipos reagem da mesma maneira.
Uma amostra de pacientes de cada grupo foi escolhida ao acaso
e classificou-se a reao em trs categorias:
Cncer
Reao
Pouca
Mdia
Alta
Total
Tipo I
51
33
16
100
Tipo II
58
29
13
100
Tipo IIII
48
42
30
120
Tipo IV
26
38
16
80
30
valores
da
varivel
Total da linha
O11
O12
...
n1
O21
O22
...
n2
...
...
...
...
...
Total da coluna
Total geral
Teste de homogeneidade:
homogeneidade
ei , j
ni
total da coluna j
total geral
32
Estatstica do
teste de
homogeneidade
Eij )2
( Oij
Eij
i 1 j 1
Supondo H verdadeira,
r
2
i 1 j 1
sendo q = ( r
1)
(s
(Oij
Eij )2
Eij
2
q
1 ) graus de liberdade.
33
Sada do MINITAB
Expected counts are printed below observed counts
1
2
3
4
Total
Chi-Sq =
Pouca
51
45,75
58
45,75
48
54,90
26
36,60
183
0,602
3,280
0,867
3,070
DF = 6, P-Value
Mdia
33
35,50
29
35,50
42
42,60
38
28,40
Alta
16
18,75
13
18,75
30
22,50
16
15,00
142
+ 0,176
+ 1,190
+ 0,008
+ 3,245
= 0,009
75
+
+
+
+
0,403
1,763
2,500
0,067
Total
100
100
120
80
400
+
+
+
= 17,173
34