Академический Документы
Профессиональный Документы
Культура Документы
Paulo J Azevedo
DI - Universidade do Minho
2009
1
Testes de Hipteses
Testes de Significncia
Em termos estatsticos:
H0 o nmero de resultados positivos no significativamente diferente do
valor esperado por variabilidade aleatria MCE (mean chance expectation)
H1 o valor observado significativamente diferente do valor esperado.
3
Testes de Hipteses
ou em alternativa
4
Exemplo
One-tailed test
Exemplo
Algumas Definies
p-value: a probabilidade de obter (de forma aleatria) um resultado
to ou mais extremo do que o que foi observado, assumindo que a
hiptese nula verdadeira.
Isto P(Obs MCE |
H0)
Interpretao alternativa, p-value o grau de contradio da
hiptese nula pelas observaes na amostra estudada. Quanto
menor, maior o grau de contradio.
o grau de significncia. O valor tradicional 5%, mas pode
tambm ser de 1% ou outros valores entre [0,1].
grau de confiana (1 - ).
tambm define a regio critica i.e. regio onde a hiptese nula
rejeitada. est relacionado com o erro Tipo I.
Erro tipo I, rejeitar H0 quando ela verdadeira ().
Erro tipo II, no rejeitar H0 quando ela falsa ().
Fora do teste (power of the test): probabilidade de correctamente
rejeitar H0. quando esta falsa e no rejeit-la quando ela
verdadeira. , respectivamente, (1 - ) e (1 ).
Testes de Hipteses
Intervalos de Confiana
8
Testes de Hipteses
Teste Binomial
Testa a significncia do desvio de uma amostra
representando um conjunto de experincias de Bernoulli
em relao distribuio terica esperada dessas
observaes i.e as variveis so dicotmicas
sucesso/insucesso.
um teste exacto !
Um teste de significncia exacto um teste onde todas as
condies assumidas para a derivao da distribuio onde o
teste estatstico baseado so satisfeitas. Consequentemente,
leva tambm obteno de um p-value exacto (e no
aproximado).
Um teste aproximado um teste onde a aproximao pode ser
feita o mais precisa possvel custa da obteno de uma
amostra suficientemente grande.
Testes de Hipteses
n, tamanho da amostra.
k, nmero de observaes com sucessos em n.
p, probabilidade esperada para sucesso
Clculo computacionalmente
q, probabilidade esperado para insucesso.
pesado! Por vezes faz-se uma
aproximao Gaussiana
p=1q
(categorias dicotmicas!)
(Normal)
n!
prob (n, k , p, q)
p k q nk
k!(n k )!
Para one-sided test (H1: observaes > MCE):
p-value = prob(k,n,p,q) + prob(k+1,n,p,q)+ prob(k+2,p,q) + +
prob(n,n,p,q).
10
Testes de Hipteses
Testes Paramtricos
Esto relacionados com um ou mais parmetros da
populao (distribuio assumida) e.g. mdia, desvio
padro.
Tipicamente assumida a Gaussiana.
Testes de localizao: relacionados com o valor
esperado da populao (mdia), onde o centro da
populao est localizado.
Vrios tipos:
Uma amostra: dada uma amostra e um valor esperado de uma populao,
testar se a amostra foi tirada da populao com o valor esperado dado.
Student t-test
Assume uma distribuio Gaussiana (Normal)
Ideal para aplicar a amostra com N<30, para N30 devemos usar o
z-teste.
um teste de mdias.
H0: = 0 (0 o valor esperado da populao)
H1: 0, < 0, > 0 (dependendo de ser two-sided ou one-sided)
Estatstica do teste:
TS
X 0
S/ N
Student t-test
(one sample)
TS
X 0
S/ N
Para
H1: 0, TS -tN-1(/2) ou TS tN-1(/2)
H1: < 0, TS < tN-1()
H1: > 0, TS > tN-1()
Graus de
liberdade
Distribuio t-student
Valor crtico
Valor da
t-estatstica
14
Testes de Hipteses
Student t-test
(amostras independentes)
0 a diferena
entre valores
esperados das
populaes
15
Testes de Hipteses
Student t-test
(paired test)
TS
S / N
Notar que este teste acaba por ser one-sample (as diferenas entre
pares formam uma s amostra)!
Testes alternativos
Z-test quando N>30,
Mann-Whitney para amostras independentes de populaes no
Normais.
Binomial, Wilcoxon para amostras emparelhadas de populaes no
Normais.
Testes de Hipteses
tN
18
Teste de Mann-Whitney-Wilcoxon
Hipteses:
H0:A = B (n de valores positivos n de negativos
H1:A B , A > B ou A < B
i.e. no h tendncia)
19
Testes de Hipteses
Diferenas nulas
so ignoradas
Amostra A
Amostra B
Diferena entre
amostras
Valor absoluto da
diferena
Testes de Hipteses
20
Teste de Mann-Whitney-Wilcoxon
Procedimento:
Calcular XA XB, ignorar casos com valor zero,
Calcular |XA XB|, rank deste valor e o rank sinalizado:
+ se XA XB > 0
- se XA XB < 0
Testes de Hipteses
21
Teste de Associao
Testes no paramtricos que medem o grau de
dependncia entre duas variveis aleatrias.
No assumem nenhum tipo de distribuio.
Assume observaes de frequncia de variveis
categricas. As variveis da amostra esto divididas
em categorias.
As observaes das duas variveis so agrupadas em
classes independentes (disjuntas).
Tipicamente, os dados do teste esto representados em
tabelas de contingncia 2 x 2. No entanto podemos ter
mais do que 2 dimenses.
Testes a estudar
Teste do 2 (chi quadrado)
Teste exacto de Fisher,
Testes de Hipteses
22
Teste do 2
Hipteses:
H0 : as variveis so independentes
H1 : as variveis no so independentes
N i
ij
j 1
23
Testes de Hipteses
Teste do 2 (2)
Estatstica do teste:
TS
( N ij eij )
i 1
j 1
eij
eij
N i N j
N
TS > 2(I-1)(J-1)()
Testes de Hipteses
24
SEXO
TB no SR
3534
1319
4853
Outras TB
270
252
522
Total
3804
1571
5375
tabela de
distribuio do 2.
Para =0.05 temos 2(1)(1)(0.05) =3.84. Rejeitamos H0 se 2 > 3.84 o que o caso.
Concluso: a proporo de homens que morre de tuberculose tipo SR diferente
da proporo de mulheres. Isto , h evidncias de uma associao entre tipo de
TB e sexo.
25
Testes de Hipteses
Caractersticas do teste do 2
um teste no direccional. sempre two-sided.
um teste aproximado. O p-value obtido por
aproximao. No problema anterior p-value < 0.00001.
Para observaes pequenas um teste pouco fivel.
Para valores esperado pequenos (eij < 5) no deve ser
usado.
No caso especfico de tabelas 2 x 2 devemos usar a
Correco de Yates para continuidade.
'
TS
( N ij eij ) 0.5
i 1
j 1
eij
26
Y1
Y2
Total
X1
a+b
X2
c+d
Total
a+c
b+d
As margens
esto a azul
n = a+b+c+d
28
Goodness-of-fit
(testes para a qualidade do ajuste)
No nosso caso, vai servir para verificar se duas
amostras foram retiradas de uma mesma populao.
Tradicionalmente so utilizados para verificar a
qualidade da adequao (fit) de uma distribuio terica
em relao a um conjunto de observaes (amostra)
e.g. testar a Normalidade de uma amostra.
Testes no paramtricos:
Para amostras de valores contnuos
Kolgomorov-Smirnov
29
Goodness-of-fit
Nk
ekA N A
N
ekB N k ekA
30
Goodness-of-fit (2)
A estatstica do teste :
( N kA ekA ) 2
TS
ekA
k 1
K
( N kB ekB ) 2
ekB
k 1
K
TS > 2K-1()
31
Testes de Hipteses
Teste de Kolgomorov-Smirnov
(duas amostras)
FA ( x) : xi S ( xi )
xj
N :x
xi
32
Testes de Hipteses
H0 : FA(x) = FB(x)
H1 : FA(x) FB(x)
A estatstica do teste :
TS D' max S A ( x) S B ( x)
x
N ANB
D ' D' ( )
N A NB
34
Testes de Hipteses
Mltiplas Hipteses
Controle da capitalizao do acaso.
Exemplo de situao tpica:
Mltiplas Hipteses
Nova situao:
Vamos imaginar agora que aceitamos 10 candidatos para esta
funo, onde vamos seleccionar o corrector com maior preciso.
Para n candidatos, n > 1, cada charlato tem 2.87% de passar o
teste.
Em geral, a probabilidade de seleccionar um charlato
1 - (1 0.0287)n.
No caso de n=10, esta probabilidade 25.3%
36
Para n testes,
k max( pi : 1 j i p j
Testes de Hipteses
n j 1
37
Ajustamento de Bonferroni
(utilizao tpica em Data Mining)
Usar Ajustamento de Bonferroni (corrigir para n
testes como sendo = /n).
Usar layered critical values,
Em vezes de um cutoff global que corrige o
inicial, obter vrios L para cada nvel L.
'L
( Lmax S L )
L 1 L S L
Testes de Hipteses
38
Resumo
Testes de significncia,
Inferncia estatstica e controle de fenmenos
fruto do acaso,
Tipos de erro,
Testes paramtricos e no paramtricos,
Direccionalidade, poder do teste, regio crtica,
p-value e intervalos de confiana,
Testes de localizao, associao e goodnessof-fit,
Mltiplas hipteses e controle de erro,
Ajustamento do valor de significncia ().
39
Testes de Hipteses