Вы находитесь на странице: 1из 70

Estatística: Aplicação ao Sensoriamento Remoto

ANO 2010

Camilo Daleles Rennó


camilo@dpi.inpe.br
http://www.dpi.inpe.br/~camilo/estatistica
/
Teste de Hipótese para µ
Uma amostra de 25 valores foi selecionada, chegando a uma média amostral X igual a 11,3.
Poderia esta média amostral ter sido obtida de uma população com média µ = 10 e
variância σ 2 = 16? 0,14
N (0,1)
0,12

Hipóteses 0,1

H0 : µ = 10 (hipótese nula) 0,08

H1: µ ≠ 10 (hipótese alternativa) α α


0,06

1−α
X −µ 0,04
2 2
z= ~ N (0,1)
σ 0,02

0
n 0
-∞ 5 -zcrít 10 zcrít 15
+∞ 20

Se H0 é verdadeira, então
0
X − 10 rejeição aceitação rejeição
z= ~ N (0,1) de H0 de H0 de H0
σ
z <<< 0 z=0 z >>> 0
n Se H0 falsa Se H0 verdadeira
Se H0 falsa
Região Crítica:
•aceito H0 se –zcrít < z < zcrít → P(–zcrít < z < zcrít ) = 1 - α
•rejeito H0 caso contrário → P(|z| > zcrít ) = α
Conclusão (sempre associada a um nível de significância)
Teste de Hipótese para µ
Uma amostra de 25 valores foi selecionada, chegando a uma média amostral X igual a 11,3.
Poderia esta média amostral ter sido obtida de uma população com média µ = 10 e
variância σ 2 = 16? Adotando-se 5%0,14de significância...
N (0,1)
0,12

Hipóteses 0,1

H0 : µ = 10 (hipótese nula) 0,08

H1: µ ≠ 10 (hipótese alternativa) 0,06


α α
2,5% −α
195% 2,5%
X −µ 0,04
2 2
z= ~ N (0,1)
σ 0,02

0
n -∞ -zcrít
-1,96 zcrít +∞
0 1,96
0 5 10 15 20

Se H0 é verdadeira, então
X − 10 11,3 − 10 rejeição aceitação rejeição
z= ~ N (0,1) z= = 1, 625 de H0 de H0 de H0
σ4 4
5n 5 1,625
Região Crítica:
•aceito H0 se –1,96
–zcrít <<z z<<zcrít1,96 → P(–zcrít < z < zcrít ) = 1 - α
•rejeito H0 caso contrário → P(|z| > zcrít ) = α
Conclusão (sempre
Conclusão: associada
não há razões paraaduvidar
um nívelque
de asignificância)
média µ seja de fato 10, adotando-se
5% de significância
Teste de Hipótese para µ
Hipóteses
H0 : µ = 10 0,14
N (0,1)
H1: µ > 10 (teste unilateral) 0,12

0,1

X −µ 0,08
z= ~ N (0,1)
σ 0,06

0,04
1−α α
n
0,02

Se H0 é verdadeira, então 0
0
-∞ 5 10
0 zcrít 15
+∞ 20

X − 100
z= ~ N (0,1) aceitação rejeição
σ
de H0 de H0
n
Região Crítica:
•aceito H0 se z < zcrít → P(z < zcrít ) = 1 - α
•rejeito H0 caso contrário → P(z > zcrít ) = α

Conclusão (sempre associada a um nível de significância)


Teste de Hipótese para µ
Hipóteses
H0 : µ = 10 0,14
N (0,1)
H1: µ > 10 (teste unilateral) 0,12

0,1

X −µ 0,08
z= ~ N (0,1)
σ 0,06

0,04
195%
−α α5%
n
0,02

Se H0 é verdadeira, então 0
0
-∞ 5 10
0 zcrít
1,645
15
+∞ 20

X − 10 11,3 − 10
z= ~ N (0,1) z= = 1, 625 aceitação rejeição
σ4 4
de H0 de H0
5n 5
1,625
Região Crítica:
•aceito H0 se z < z1,645
crít → P(z < zcrít ) = 1 - α
•rejeito H0 caso contrário → P(z > zcrít ) = α

Conclusão:(sempre
Conclusão não há razões paraa duvidar
associada um nívelque
de asignificância)
média µ seja de fato 10, adotando-se
5% de significância (teste unilateral)
Teste de Hipótese – Erros I e II
Hipóteses
H0 : µ = µ 0
H1: µ > µ 0
−µ −µ
XX
= = crít0 0
zcrít
Existe a possibilidade de se selecionar σ σ
uma amostra de uma população com n n
média µ 0 e obter X alto de forma que
0,14
N (0,1)
leve a conclusão errada de que H0 é0,12
falsa? 0,1

0,08

0,06

0,04
1−α α
0,02

0
0
-∞ 5 10
0 zcrít 15
+∞ 20
Teste de Hipótese – Erros I e II
Hipóteses
H0 : µ = µ 0
H1: µ > µ 0
X crít − µ0 σ
zcrít = ⇒ X crít = µ0 + zcrít
Existe a possibilidade de se selecionar σ n
uma amostra de uma população com n
média µ 0 e obter X alto de forma que
leve a conclusão errada de que H0 é
σ2
falsa? N ( µ0 , )
n
0
,14

0
,12

Sim. Este erro é chamado de erro do 0


,1

tipo I e equivale ao nível de


0
,08

0
,06 α
significância α . 0
,04 1−α
0
,02

0
0
-∞ 5

µ
1
0

X crít
1
5
+∞ 2
0

P(rejeitar H0 / H0 é verdadeira) = α
P(aceitar H0 / H0 é verdadeira) = 1 - α
Teste de Hipótese – Erros I e II
Hipóteses
H0 : µ = µ 0
H1: µ > µ 0

Existe a possibilidade de se selecionar


σ2 σ2
uma amostra de uma população com N ( µ0 , ) N ( µ1 , )
n n
média µ 1 (> µ 0) e obterX de0,14forma

que leve a conclusão errada de


0,12 que H
0
é verdadeira? 0,1

0,08

Sim. Este erro é chamado de erro


0,06 do

tipo II ou erro β . 0,04


1−α
0,02
α
0
0
-∞ 5
µ
10
X crít µ
15 20
+∞
0 1

aceitação β
P(aceitar H0 / H1 é verdadeira) = β de H0
P(rejeitar H0 / H1 é verdadeira) = 1 - β (poder do
teste)
Teste de Hipótese – Erros I e II
Hipóteses
H0 : µ = µ 0
H1: µ > µ 0

H0 é verd. H0 é falso σ2 σ2
N ( µ0 , ) N ( µ1 , )
n n
Aceita H0 1-α β 0,14

0,12

Rejeita H0 α 1 - β 0,1
0,08

0,06

0,04
1−α

Alternativas para diminuir β : 0,02


α
0
• distanciar µ 1 de µ 0
0
-∞ 5
µ
10
X crít µ
15 20
+∞
• aumentar α
0 1

• aumentar n β
Teste de Hipótese para µ
No exemplo anterior, uma amostra de 25 valores foi selecionada, chegando-se a uma média
amostral X igual a 11,3. Através de um teste z unilateral, chegou-se a conclusão que a
verdadeira média µ poderia ser igual a 10, adotando-se o nível de significância de 5%
(considerando σ 2 = 16). Mas qual a probabilidade de chegarmos a esta mesma conclusão,
sendo a verdadeira média igual a 12, ou seja, qual o valor de β ?

N (0,1)
H0 : µ = 10 11,3 − 10
z = 0,14 = 1, 625
H1: µ > 10 4
0,12
5
X −µ 0,1
z= ~ N (0,1)
σ 0,08

n aceito H
0,06 se z < 1,645
0
95%
rejeito H0 se z > 1,645
0,04

Se H0 é verdadeira, então 0,02


5%
0

X − 10
0
-∞ 5 10
0
15
+∞
z= ~ N (0,1) zcrít = ?1,645
σ Conclusão:
n Aceito H0, ou seja, a média µ é igual a 10
considerando 5% de significância
Teste de Hipótese para µ
Agora, considerando a µ igual a 12

N (0,1)
H0 : µ = 10
0,14
H1: µ = 12 0,12

β = P(aceitar H0 / H1 é verdadeiro)
0,1 H0 verdadeiro
0,08

β = P( Z < 1, 645 / µ = 12) 0,06

0,04
95%
0,02
5%
0
0
-∞ 5 10
0
15
+∞ 20

zcrít = ?1,645
Teste de Hipótese para µ
Agora, considerando a µ igual a 12

H0 : µ = 10
H1: µ = 12
H0 H1
β = P(aceitar H0 / H1 é verdadeiro)
0,14

β = P( Z < 1, 645 / µ = 12) 0,12

0,1

X − 10 0,08
β = P( < 1, 645 / µ = 12) 0,06
4
0,04
95%
5
0,02 β 5%
β = P( X < 11,316 / µ = 12) 0
0
-∞ 5 10
10
15
12
20
+∞
X − 12 11,316 − 12
β = P( < )
4 4 11,316
5 5
β = P ( Z < −0,855) = P( Z > 0,855) = 0,1963
Teste de Hipótese – valor-P (p-value)
Toda conclusão de um teste de hipótese está associada a um nível de
significância.
Por exemplo: “Com base num teste z unilateral a 5% de significância, pôde-se
concluir que a média µ é maior que 20 uma vez que a estatística z obtida
foi de 2,5 (zcrítico = 1,645)”. N (0,1)

H0 : µ = 20 0,14

H1: µ > 20
0,12

0,1

Se H0 é verdadeira, então
0,08

0,06
95%
X −µ 0,04
z= ~ N (0,1) 0,02 5%
σ
0
Aceita H0 Rejeita H0
n 0
-∞ 5 10 15
+∞ 20
0
z = 2,5
1,645
2,5
A média µ continuaria ser significativamente maior do que 20 se fosse adotado
um nível de significância de 1%?
Teste de Hipótese – valor-P (p-value)
Toda conclusão de um teste de hipótese está associada a um nível de
significância.
Por exemplo: “Com base num teste z unilateral a 5% de significância, pôde-se
concluir que a média µ é maior que 20 uma vez que a estatística z obtida
foi de 2,5 (zcrítico = 1,645)”. N (0,1)

H0 : µ = 20 0,14

H1: µ > 20
0,12

0,1

Se H0 é verdadeira, então
0,08

0,06
99%
X −µ 0,04
z= ~ N (0,1) 0,02
σ 1%
0
Aceita H0 Rejeita H0
n 0
-∞ 5 10 15
+∞ 20
0
z = 2,5
2,33
2,5
A média
Para continuaria
que µvalores de nívelser
designificativamente maior
significância, a média µ do que 100
poderia serseconsiderada
fosse adotado
um nível
igual de significância de 1%?
a 20?
Teste de Hipótese – valor-P (p-value)
Toda conclusão de um teste de hipótese está associada a um nível de
significância.
Por exemplo: “Com base num teste z unilateral a 5% de significância, pôde-se
concluir que a média µ é maior que 20 uma vez que a estatística z obtida
foi de 2,5 (zcrítico = 1,645)”. N (0,1)

H0 : µ = 20 0,14

H1: µ > 20
0,12

0,1

Se H0 é verdadeira, então
0,08

0,06 valor-P
X −µ 0,04
?
0,0062
z= ~ N (0,1) 0,02
σ
0
Aceita H0 Rejeita H0
n 0
-∞ 5 10 15
+∞ 20
0
z = 2,5
2,5
A média
Para continuaria
que µvalores de nívelser
designificativamente maior
significância, a média µ do que 100
poderia serseconsiderada
fosse adotado
um nível
igual de significância de 1%?
a 20?
Pode-se aceitar H0 para qualquer nível de significância (α ) menor que 0,0062.
valor-P = P(Z > z), ou seja, neste caso valor-P = P(Z > 2,5) = 0,0062
Teste de Hipótese – valor-P (p-value)
Exemplo: Foram coletadas amostras (50 pontos) em mapas a fim de avaliar sua
exatidão. Procedeu-se o teste z para verificar quais deles possuíam exatidão
(p) de 0,90. A tabela abaixo apresenta a exatidão estimada, o resultado do
teste (estatística z) e o valor-P de cada mapa.
p̂ − p
z=
p̂ z valor-P pq
n
Mapa 1 0,87 -0,707 0,2397

Mapa 2 0,62 -6,600 2,07e-11

Mapa 3 0,82 -1,886 0,0297

Mapa 4 0,84 -1,414 0,0786

Quais mapas possuem exatidão menor que 0,90, com 5% de significância?


Mapas 2 e 3
Quais mapas possuem exatidão menor que 0,90, com 1% de significância?
Somente Mapa 2
Teste de Hipótese para σ 2

Hipóteses
amostra H0 : σ 2 = 25 (hipótese nula)
H1: σ 2 ≠ 25 (hipótese alternativa)
s2 = 27,34

S
σ 2 = 25
Uma população com variância
σ 2 = 25 conhecida poderia
produzir uma amostra com
s2 = 27,34?
Teste de Hipótese para σ 2

Hipóteses
amostra H0 : σ 2 = 25 (hipótese nula)
H1: σ 2 ≠ 25 (hipótese alternativa)
s2 = 27,34
( n − 1) s 2
~ χ 2
n −1
S σ2

σ 2 = 25
Uma população com variância Se H0 é verdadeira, então
σ 2 = 25 conhecida poderia
produzir uma amostra com (n − 1) s 2
~ χ n2−1
s2 = 27,34? 25
Teste de Hipótese para σ 2

Hipóteses
H0 : σ 2 = 25 (hipótese nula) χ n2−1
H1: σ 2 ≠ 25 (hipótese alternativa)

( n − 1) s 2
~ χ 2
n −1 α α
σ2 1−α
2 2

Se H0 é verdadeira, então
0 xa xb +∞
(n − 1) s 2 rejeição aceitação rejeição
~ χ n2−1
25 de H0 de H0 de H0

Região Crítica:
•aceito H0 se xa < X < xb → P(xa < X < xb) = 1 - α
•rejeito H0 caso contrário
Conclusão (sempre associada a um nível de significância)
Teste de Hipótese para σ 2

Exemplo: uma v.a. qualquer tem uma distribuição desconhecida com média µ e variância
σ 2 desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a variância
amostral. Supondo que s2 = 2,34, teste a hipótese de que a verdadeira variância σ 2
seja de fato igual a 4, considerando 5% de significância.

Hipóteses χ 242
H0 : σ 2 = 4
H1: σ 2 ≠ 4

( n − 1) s 2 2,5% 2,5%
~ χ n2−1 95%
σ 2

Se H0 é verdadeira, então
0 xa xb +∞
24s 2 24.2,34
~ χ 24
2 X= = 14, 04
4 4
?
12,40 ?
39,36
Região Crítica:
•aceito H0 se 12,40 < X < 39,36
•rejeito H0 caso contrário
Conclusão: Aceito H0, ou seja, não há razões para discordar que, a 5%, σ 2 = 4
Teste de Hipótese para µ com σ 2

desconhecida
Exemplo: uma v.a. qualquer tem uma distribuição desconhecida com média µ e variância
σ 2 também desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a média
amostral e a variância amostral. Supondo que X = 12,7 e s2 = 4,5, teste a hipótese
unilateral a 1% de que µ = 15.

t24
H0 : µ = 15 12, 7 − 15
t = 0,14 = − 5, 43
H1: µ < 15 2,12
0,12
25
X −µ 0,1
t= ~ t n −1
s 0,08

aceito H
0,06 se t > -2,492
n 0
99%
rejeito H0 se t < -2,492
0,04

Se H0 é verdadeira, então 0,02


1%
0
0
-∞ 5 10
0
15
+∞
X − 15
t= ~ t 24
s tcrít = ?- 2,492
Conclusão:
25
Rejeito H0, ou seja, a média é significativamente
(a 1%) menor que 15
Inferência entre parâmetros de duas populações

n1

n2

X1
X2
S1 S2
E ( X 1 ) = µ1 E ( X 2 ) = µ2

Mesmo não se conhecendo as médias µ 1 e µ 2, seria possível verificar se elas


são iguais a partir de seus valores amostrais?

Se µ 1 eµ 2são iguais, µ 1-µ 2=


então 0.
Teste de Hipótese para µ 1 = µ 2
Hipóteses
H0 : µ 1 - µ 2 = 0 (µ 1 = µ 2)
H1: µ 1 - µ 2 ≠ 0
X 1 ~ N ( µ1 ,σ12 ) X 2 ~ N ( µ2 ,σ 22 ) µi desconhecidas, mas σ i2 conhecidas

σ 12 σ 22 σ 12 σ 22
X 1 ~ ?N ( µ1 , ) X 2 ~ N ( µ2 , ) X 1 − X 2 ~ ?N ( µ1 − µ2 , + )
n1 n2 n1 n2
0,14
( X 1 − X 2 ) − ( µ1 − µ2 ) N (0,1)
~ ?N (0,1)0,12
σ 2
σ 2
+1 2 0,1
n1 n2 0,08

Se H0 é verdadeira, então
0,06
α α
0,04
1−α
2 2
X1 − X 2 0,02

z= ~ N (0,1) 0
σ 2
σ 2
-∞ -zcrít zcrít +∞
+1 2 0 5
0
10 15

n1 n2
P(− zcrít < z < zcrít ) = 1 − α
Teste de Hipótese para µ 1 = µ 2

X 1 ~ N ( µ1 ,σ12 ) X 2 ~ N ( µ2 ,σ 22 ) µi e σ i2 desconhecidas

( X 1 − X 2 ) − ( µ1 − µ2 ) (n1 − 1) s12 ( n2 − 1) s22 χ 2


~ ?N (0,1) + ~ ? n1 +n2 −2
σ 2
σ 2 σ 12 σ 22
+1 2
n1 n2 χ n21 −1 χ n22 −1

( X 1 − X 2 ) − ( µ1 − µ 2 )
σ 12 σ 22
+
n1 n2 (fazendo σ 1 = σ 2 ⇒ σ )
2 2 2
~ ?tn1 +n2 − 2
(n1 − 1) s12 ( n2 − 1) s 22 (homocedástico)
+
σ 12 σ 22
n1 + n2 − 2
Teste de Hipótese para µ 1 = µ 2

X 1 ~ N ( µ1 ,σ12 ) X 2 ~ N ( µ2 ,σ 22 ) µi e σ i2 desconhecidas

( X 1 − X 2 ) − ( µ1 − µ2 ) (n1 − 1) s12 ( n2 − 1) s22 χ 2


~ ?N (0,1) + ~ ? n1 +n2 −2
σ 2
σ 2 σ 12 σ 22
+1 2
n1 n2

( X 1 − X 2 ) − ( µ1 − µ2 )
σ2 σ2
+
n1 n2
~ tn1 +n2 − 2
(n1 − 1) s 2
( n2 − 1) s 2
+1 2
σ2 σ2
n1 + n2 − 2
Teste de Hipótese para µ 1 = µ 2

X 1 ~ N ( µ1 ,σ12 ) X 2 ~ N ( µ2 ,σ 22 ) µi e σ i2 desconhecidas

( X 1 − X 2 ) − ( µ1 − µ2 ) (n1 − 1) s12 ( n2 − 1) s22 χ 2


~ ?N (0,1) + ~ ? n1 +n2 −2
σ 2
σ 2 σ 12 σ 22
+
1 2
n1 n2

( X 1 − X 2 ) − ( µ1 − µ2 )
1 1
σ +
n1 n2
~ tn1 +n2 − 2
1 ( n1 − 1) s + ( n2 − 1) s
2
1
2
2
σ n1 + n2 − 2
Teste de Hipótese para µ 1 = µ 2
Hipóteses
H0 : µ 1 - µ 2 = 0 (µ 1 = µ 2)
µi e σ i2 desconhecidas mas σ 12 = σ 22
H1: µ 1 - µ 2 ≠ 0 (t homocedástico)

( X 1 − X 2 ) − ( µ1 − µ 2 )
~ tn1 +n2 −2
( n1 − 1) s + ( n2 − 1) s
2 2
1 1 0,14
1 2
+ tn1 +n2 − 2
n1 + n2 − 2 n1 n 2 0,12

0,1

0,08

Se H0 é verdadeira, então 0,06


α α
1−α
0,04
2 2
X1 − X 2
t= ~ t n1 + n2 − 2
0,02

(n1 − 1) s + (n2 − 1) s
2 2
1 1
1 2
+ 0
-∞ -tcrít tcrít +∞
n1 + n2 − 2 n1 n 2 0 5
0
10 15

P (−tcrít < t < t crít ) = 1 − α


Teste de Hipótese para µ 1 = µ 2
Hipóteses
H0 : µ 1 - µ 2 = 0 (µ 1 = µ 2)
µi e σ i2 desconhecidas mas σ 12 ≠ σ 22
H1: µ 1 - µ 2 ≠ 0 (t heterocedástico)
2
 s12 s22 
( X 1 − X 2 ) − ( µ1 − µ 2 )  + 
n n
2 2
~ tg g ≈  12 2  2
s s 0,14 s12   s22 
1
+ 2
   
tg
n1 n2 0,12 n
 1  +  n2 
n1 − 1 n2 − 1
0,1

0,08

Se H0 é verdadeira, então 0,06


α α
1−α
0,04
2 2
X1 − X 2
t= ~ tg 0,02

s12 s22
+ 0
-∞ -tcrít tcrít +∞
n1 n2 0 5
0
10 15

P (−tcrít < t < t crít ) = 1 − α


Teste de Hipótese para µ 1 = µ 2

Exemplo: duas v.a. quaisquer têm distribuições desconhecidas com médias e variâncias
também desconhecidas. Retira-se uma amostra de cada população e calcula-se a média
e a variância para cada amostra. Teste a hipótese de que as variâncias e médias
populacionais não diferem significativamente a 5% entre si, considerando que:

n1 = 26 X 1 = 10,3 s12 = 2,34


n2 = 41 X 2 = 15, 7 s22 = 1,91

Usar teste t homocedástico ou heterocedástico?

primeiramente deve-se testar se σ 1 = σ 2


2 2
Distribuição F (de Snedecor)
g1 / 2 − ( g1 + g2 ) 2
Γ[( g1 + g2 ) 2]  g1   g 
f ( x) =   xg1 / 2−1  1 + 1 x x ≥0
Γ( g1 2) Γ( g2 2)  g2   g2 

g2
0 +∞
E( X ) =
g2 − 2
2 g 22 ( g1 + g2 − 2) X ~ Fg1 , g2 (lê-se: X tem distribuição F com g1 e g2 graus
Var ( X ) = de liberdade)
g1 ( g 2 − 2)2 ( g2 − 4)

Propriedades: Fg1 , g2
U / g1
a) se U ~ χ g1 e V ~ χ g22 então
2
~ Fg1 , g2
V / g2 F
0 +∞
1 1
b) se X ~ Fg1 , g2 então ~ Fg2 , g1 ⇒ P( Fg1 , g2 > F ) = P ( Fg2 , g1 < )
X F Fg2 , g1

0 1 +∞
F
Distribuição F
g1

0 F +∞

P ( Fg1 , g2 > F ) = 0,025

g2

P( F15,20 > ?) = 0,025

P( F15,20 > 2,57) = 0,025


Distribuição F
g1

0 F +∞

P ( Fg1 , g2 > F ) = 0,025

g2

P ( F25,5 < ?) = 0,025


P ( F5,25 > ?) = 0,025
Distribuição F
g1

0 F +∞

P ( Fg1 , g2 > F ) = 0,025

g2

P ( F25,5 < ?) = 0,025


P ( F5,25 > ?) = 0,025
P ( F5,25 > 3,13) = 0,025
1
P ( F25,5 < ) = 0,025
3,13
P( F25,5 < 0,319) = 0,025
Distribuição F

Se X 1 ~ N ( µ1 , σ12 ) X 2 ~ N ( µ2 ,σ 22 )

(n1 − 1) s12 (n2 − 1) s22


~ χ
? 2
n1 −1
~ χ
? 2
n2 −1
σ 12 σ 22

( n1 − 1) s12
( n1 − 1)σ 12 s12 σ 22 s12σ 22
= 2 2 = 2 2 ~ Fn1 −1,n2 −1
( n2 − 1) s2 2
σ 1 s2 s2σ 1
( n2 − 1)σ 22
Teste de Hipótese para σ = σ 2
1
2
2

Exemplo: duas v.a. quaisquer têm distribuições desconhecidas com médias e variâncias
também desconhecidas. Retira-se uma amostra de cada população e calcula-se a média
e a variância para cada amostra. Teste a hipótese de que as variâncias e médias
populacionais não diferem significativamente a 5% entre si, considerando que:
n1 = 26 X 1 = 10,3 s12 = 2,34 n2 = 41 X 2 = 15, 7 s22 = 1,91
Hipóteses
H 0 : σ 12 / σ 22 = 1 (σ 12 = σ 22 )
F25;40
H1 : σ / σ ≠ 1
2
1
2
2

s12σ 22
~ Fn1 −1; n2 −1
s2σ 1
2 2

2,5% 95% 2,5%


Se H0 é verdadeira, então
s12 2,34
F = 2 ~ Fn1 −1;n2 −1 F = = 1, 2251
s2 1,91 0 fa fb +∞
Região Crítica:
•aceito H0 se 0,47 < F < 1,99 ?
1 1,?99
•rejeito H0 caso contrário 2,12
Conclusão: Aceito H0, ou seja, não há razões para discordar que, a 5%, σ 1 = σ 2
2 2
Teste de Hipótese para µ 1 = µ 2 (cont.)
Exemplo: duas v.a. quaisquer têm distribuições desconhecidas com médias e variâncias
também desconhecidas. Retira-se uma amostra de cada população e calcula-se a média
e a variância para cada amostra. Teste a hipótese de que as variâncias e médias
populacionais não diferem significativamente a 5% entre si, considerando que:
n1 = 26 X 1 = 10,3 s12 = 2,34 n2 = 41 X 2 = 15, 7 s22 = 1,91
Hipóteses
0,14
t65
H0 : µ 1 - µ 2 = 0 (µ 1 = µ 2) 0,12

H1: µ 1 - µ 2 ≠ 0 0,1

0,08
( X 1 − X 2 ) − ( µ1 − µ 2 )
~ t0n,016+n2 −2
( n1 − 1) s + ( n2 − 1) s
2 2
1 1 2,5% 95% 2,5%
+
n1 n 2 (t homocedástico)
1 2
0,04
n1 + n2 − 2
0,02

Se H0 é verdadeira, então 0
-∞ -t t +∞
X1 − X 2
0 5
0
10 15

t= ~ t n1 + n2 − 2
(n1 − 1) s + ( n2 − 1) s
2 2
1 1
1 2
+ ?
1,997
n1 + n2 − 2 n1 n 2 t = -14,9515

Conclusão: Rejeito H0, ou seja, as médias são diferentes significativamente a 5%


Teste de Hipótese para p
Hipóteses
H0 : p = p0 0,14
N (0,1)
H1: p ≠ p0 0,12

0,1

pˆ − p 0,08
~ N (0,1)
pq
0,06
α α
1−α
0,04
2 2
n 0,02

Se H0 é verdadeira, então 0
0
-∞ 5
-zcrít 0
10
zcrít 15
+∞ 20

pˆ − p0
z= ~ N (0,1) rejeição aceitação rejeição
p0 q0
de H0 de H0 de H0
n
Região Crítica:
•aceito H0 se –zcrít < z < zcrít → P(–zcrít < z < zcrít ) = 1 - α
•rejeito H0 caso contrário → P(|z| > zcrít ) = α

Conclusão (sempre associada a um nível de significância)


Teste de Hipótese para p1 = p2
Hipóteses
H0 : p1 – p2 = 0 (p1 = p2) 0,14
N (0,1)
H1: p1 – p2 ≠ 0 0,12

0,1

( pˆ1 − pˆ 2 ) − ( p1 − p2 )
~ N (0,1) 0,08

 p1q1 p2 q2  0,06
α α
 +  1−α
n n2 
0,04
2 2
 1 0,02

Se H0 é verdadeira, então 0
0
-∞ 5
-zcrít 0
10
zcrít 15
+∞ 20

( pˆ1 − pˆ 2 ) − ( p1 − p2 ) n1 pˆ 1 + n2 pˆ 2
z= pˆ =
n1 + n2 rejeição aceitação rejeição
1 1
ˆ ˆ + 
pq de H0 de H0 de H0
 n1 n2 
Região Crítica:
•aceito H0 se –zcrít < z < zcrít → P(–zcrít < z < zcrít ) = 1 - α
•rejeito H0 caso contrário → P(|z| > zcrít ) = α

Conclusão (sempre associada a um nível de significância)


Teste de Hipótese (resumo)
X −µ
z=
N (0,1) se σ 2 é conhecida σ
para µ n
tn −1 se σ 2 é desconhecida X −µ
t=
( n − 1) s 2 s
para σ 2 χ 2
n −1 χ = 2
n
σ2
N (0,1) se σ 12 e σ 22 são conhecidas

para µ 1 - µ 2
tn1 + n2 −2 se σ 1 e σ 2 são desconhecidas, mas σ 1 = σ 2
2 2 2 2

tg se σ 1 e σ 2 são desconhecidas, mas σ 1 ≠ σ 2


2 2 2 2

( X 1 − X 2 ) − ( µ1 − µ 2 )
thomo =
(n1 − 1) s12 + (n2 − 1) s 22 1 1
+
( X 1 − X 2 ) − ( µ1 − µ2 ) n1 + n2 − 2 n1 n 2
z=
σ 12 σ 22 ( X 1 − X 2 ) − ( µ1 − µ 2 )
+ thetero =
n1 n2
s12 s22
+
n1 n2
Teste de Hipótese (resumo)
N (0,1) se σ 2 é conhecida
para µ
tn −1 se σ 2 é desconhecida

para σ 2 χ n2−1

se σ 1 e σ 2 são conhecidas
2 2
N (0,1)

para µ 1 - µ 2
tn1 + n2 −2 se σ 1 e σ 2 são desconhecidas, mas σ 1 = σ 2
2 2 2 2

tg se σ 1 e σ 2 são desconhecidas, mas σ 1 ≠ σ 2


2 2 2 2

σ 12 Fn1 −1,n2 −1 s12σ 22


para 2 F= 2 2
σ2 s2σ 1
p̂ − p
para p N (0,1) z=
pq ˆ ˆ
( p1 − p2 ) − ( p1 − p2 ) n1 pˆ 1 + n2 pˆ 2
z= n pˆ =
para p1 – p2 N (0,1) 1 1 n1 + n2
ˆ ˆ + 
pq
 n1 n2 
Teste de Hipótese / EXCEL
Exemplo:
Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos
aleatoriamente de cada alvo, cujos resultados são apresentados abaixo.
Adotando um nível de significância de 5%, podemos concluir que, em média, os
alvos apresentam a mesma resposta?

Comparação de duas médias: teste-t


Teste-F: duas amostras para variâncias Teste-t: duas amostras presumindo variâncias equivalentes
amostra Alvo 1 Alvo 2
1 128 98 Mas qual? Homo
Alvoou
1 heterocedástico?
Alvo 2 Alvo 1 Alvo 2
2 134 105 Média 119,2 101,6 Média 119,2 101,6
3 110 99 Variância 90,84444 36,04444 Variância 90,84444 36,04444
Observações 10 10 Observações 10 10
4 112 109
gl 9 9 Variância agrupada 63,44444
5 125 95 F 2,520345 Hipótese da diferença de média 0
6 107 101 P(F<=f) uni-caudal 0,092349 gl 18
7 111 100 F crítico uni-caudal 3,178893 Stat t 4,940841
8 115 92 P(T<=t) uni-caudal 5,28E-05
t crítico uni-caudal 1,734064
9 130 107 P(T<=t) bi-caudal 0,000106
10 120 110 t crítico bi-caudal 2,100922
H0 : µ 1 - µ 2 = 0
H1: µ 1 - µ 2 > 0
Conclusão: através do teste-t homocedástico unilateral, pôde-se
concluir que a média do alvo 1 deve ser maior que a do alvo 2,
adotando-se um nível de significância de 5%, uma vez que valor-P
foi menor que 0,05 (0,0000528).
Teste t pareado
10 pontos são escolhidos em cada imagem
amostra A B
1 12 15
2 34 17

Esquema 1
3 16 21
4 28 27
5 15 25
6 17 32
7 23 15
8 13 19
9 29 29
10 31 30

Imagem A Imagem B
amostra A B
1 12 11
2 34 37
3 16 18
Esquema 2

4 28 27
5 15 18
6 17 19
7 23 24
8 13 15
9 29 32
10 31 33
Teste t pareado

amostra A B
1 12 15 X A = 21,8 s A2 = 66,84
2 34 17 X B = 23, 0 sB2 = 41,11
Esquema 1

3 16 21
4 28 27
H 0 : σ A2 = σ B2
5 15 25
teste F
6 17 32 H1 : σ A2 > σ B2
7 23 15
8 13 19 H0 : µ A = µ B
9 29 29 teste t (homo ou heterocedástico)
10 31 30 H1 : µ A < µ B

amostra A B
1 12 11
2 34 37
3 16 18
Esquema 2

4 28 27
5 15 18
6 17 19
7 23 24
8 13 15
9 29 32
10 31 33
Teste t pareado

amostra A B
1 12 15 X A = 21,8 s A2 = 66,84
2 34 17 X B = 23, 0 sB2 = 41,11
Esquema 1

3 16 21
4 28 27
H 0 : σ A2 = σ B2 Fcalc = 1, 63 (valor-P = 0,24)
5 15 25
6 17 32 H1 : σ A2 > σ B2 Aceito H0 a 5% (usar teste t homocedástico)
7 23 15
8 13 19 H0 : µ A = µ B tcalc = −0,37 (valor-P = 0,36)
9 29 29
10 31 30 H1 : µ A < µ B Aceito H0 a 5% (as médias são iguais)

amostra A B
1 12 11 X A = 21,8 s A2 = 66,84
2 34 37 X B = 23, 4 s B2 = 74,04
3 16 18
Esquema 2

4 28 27
H 0 : σ A2 = σ B2 Fcalc = 0,90 (valor-P = 0,44)
5 15 18
6 17 19 H1 : σ A2 < σ B2 Aceito H0 a 5% (usar teste t homocedástico)
7 23 24
8 13 15 H0 : µ A = µ B tcalc = −0, 43 (valor-P = 0,34)
9 29 32
10 31 33 H1 : µ A < µ B Aceito H0 a 5% (as médias são iguais)
Teste t pareado

amostra A B
1 12 15 X A = 21,8 s A2 = 66,84
2 34 17 X B = 23, 0 sB2 = 41,11
Esquema 1

3 16 21
4 28 27
H 0 : σ A2 = σ B2 Fcalc = 1, 63 (valor-P = 0,24)
5 15 25
6 17 32 H1 : σ A2 > σ B2 Aceito H0 a 5% (usar teste t homocedástico)
7 23 15
8 13 19 H0 : µ A = µ B tcalc = −0,37 (valor-P = 0,36)
9 29 29
10 31 30 H1 : µ A < µ B Aceito H0 a 5% (as médias são iguais)

amostra A B A-B
1 12 11 1 Teste t pareado
2 34 37 -3 X A− B = −1, 6 s 2
A− B = 2, 27
3 16 18 -2
Esquema 2

4 28 27 1 H0 : µ A-B = 0 Se H0 verdadeiro
5 15 18 -3
H1: µ A-B < 0 X tcalc = −3,36
6 17 19 -2 tcalc = A− B ~ tn −1
7 23 24 -1 s A− B (valor-P = 0,004)
8 13 15 -2
n
9 29 32 -3
10 31 33 -2 Conclusão: Rejeito H0 a 5%, ou seja, a média
da diferença é menor que zero
Comparando-se as médias de r populações

S1 S2 Sr
E ( X 1 ) = µ1 E ( X 2 ) = µ2 E ( X r ) = µr

N ( µ2 , σ 2 )
ε 1 = X1 - µ 1
N ( µ1 , σ )
2

ε 2 = X2 - µ 2
N (µr , σ 2 )
ε j ~ N(0,σ 2)

ε r = Xr - µ r -∞ µ 1 µ 2 µ r
+∞

Desvio, resíduo ou erro Todas r populações são normalmente distribuídas e


têm a mesma variância!!!
Comparando-se as médias de r populações

S1 S2 Sr
E ( X 1 ) = µ1 E ( X 2 ) = µ2 E ( X r ) = µr

N ( µ2 , σ 2 )
N ( µ1 , σ )
2

Xj = µ j + ε j ε j ~ N(0,σ 2)
N (µr , σ 2 )
µ j=µ g+τ j

Xj = µ g + τ j + ε j
-∞ µ 1 µ 2 µ r
+∞
µ g
média
efeito
efeito
global
da pop.
aleatório
j Todas r populações são normalmente distribuídas e
têm a mesma variância!!!
Comparando-se as médias de r populações

n1 nr
n2

X1 Xr
X2
S1 S2 Sr
E ( X 1 ) = µ1 E ( X 2 ) = µ2 E ( X r ) = µr

Xij é o i-ésimo elemento da amostra retirada da população j (população = tratamento)

µ j é a média da população j
i = 1, ..., nj
j = 1, ..., r
Comparando-se as médias de r populações
A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
nj 2 3 3 2 10

A B C D
X11 X12 X13 X14
X21 X22 X23 X24
X32 X33 Total
Total X*1 X*2 X*3 X*4 X**

Média X1 X2 X3 X4 XT
nj n1 n2 n3 n4 nT
Comparando-se as médias de r populações
A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
nj 2 3 3 2 10

30

25

20
X ij − X T
XT
15 X 32 − X T = −5

10
A B C D
Comparando-se as médias de r populações
A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
nj 2 3 3 2 10

30

X4
25 X 14 − X 4 = −3

20
X ij − X j
X3
15 X1
X2
10
A B C D
Comparando-se as médias de r populações
A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
nj 2 3 3 2 10

30

X4
25
X 4 − XT = 9
20
X j − XT
X3 XT
15 X1
X2
10
A B C D
Comparando-se as médias de r populações
A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
nj 2 3 3 2 10

(X ij − X T ) = ( X j − X T ) + ( X ij − X j )
r nj r r nj

∑∑ ( X ij − X T ) = ∑ n j ( X j − X T ) + ∑∑ ( X ij − X j )
2 2 2

j =1 i =1 j =1 j =1 i =1

SQTO = SQT + SQE


Análise de Variância
A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
nj 2 3 3 2 10

ANOVA (Análise de Variância)


Fonte de Soma dos Quadrados Graus de Quadrado
Variação Liberdade Médio
r
SQT
Tratamentos SQT = ∑ n j ( X j − X T )
2
r-1 QMT =
j =1 n r −1
r
SQE
SQE = ∑∑ ( X ij − X j )
j
Erro 2
nT - r QME =
j =1 i =1 nT − r
r nj
Total
SQTO = ∑∑ ( X ij − X T )
2
nT - 1
j =1 i =1
Análise de Variância
A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
nj 2 3 3 2 10

ANOVA (Análise de Variância)


Fonte de Soma dos Graus de Quadrado E ( QME ) = σ 2
r
Variação Quadrados Liberdade Médio
Tratamentos
∑ n (µ j j − µT ) 2
QMT E ( QMT ) = σ 2 +
j =1
SQT r-1
r −1
Erro
r
SQE nT - r QME ∑n τ j
2
j

E ( QMT ) = σ 2 +
j =1
Total SQTO nT - 1 r −1
Análise de Variância
A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
nj 2 3 3 2 10

H0 : µ 1 = µ 2 = ... = µ r
ANOVA (Análise de Variância)
H1: nem todos µ j são iguais
Fonte de Soma dos Graus de Quadrado QMT
H0 : τ j = 0 ~ ?Fr −1,nT − r
Variação Quadrados Liberdade Médio
H1: nem todos τ j = 0 QME
Tratamentos SQT r-1 QMT

Erro SQE nT - r QME

Total SQTO nT - 1
Análise de Variância
A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
nj 2 3 3 2 10

H0 : µ 1 = µ 2 = ... = µ r
ANOVA (Análise de Variância)
H1: nem todos µ j são iguais
Fonte de Soma dos Graus de Quadrado
Variação Quadrados Liberdade Médio
Fr −1, nT − r
Tratamentos SQT r-1 QMT
QMT
Fcalc = α
Erro SQE nT - r QME QME
0 1 Fcrít +∞
Total SQTO nT - 1 H0 verd. H0 falso
ac. H0 rej. H0
Análise de Variância
A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
nj 2 3 3 2 10

ANOVA (Análise de Variância)


Fonte de Soma dos Graus de Quadrado F calculado Valor - P
Variação Quadrados Liberdade Médio
Tratamentos 258
3 86 11,2 0,0072
Erro 46 6 7,67

Total 304 9 Conclusão: rej. H0 a 5%, pelo menos uma


média é diferente das demais
Análise de Variância
OBSERVAÇÕES:
- Cada observação é independente das demais;
- Cada tratamento tem distribuição normal;
- Todas as distribuições têm a mesma variância; e
- ANOVA com 2 tratamentos (r = 2) é similar a um
teste t bilateral (homocedástico).
r r X 2j X T2
SQT = ∑ n j ( X j − X T )
2
=∑ −
j =1 j =1 nj nT

r nj

SQE = ∑∑ ( X ij − X j )
2
= SQTO − SQT
j =1 i =1

nj nj
r r
X T2
SQTO = ∑∑ ( X ij − X T ) = ∑∑ X −
2 2
ij
j =1 i =1 j =1 i =1 nT
Teste de Bartlett (igualdade de variâncias)
Se s1, ... , sr são as variâncias amostrais de r populações com
2 2

distribuição normal, então


r

∑ (n
j =1
j − 1) s 2j
QME =
nT − r B ~ χ r2−1
Fazendo
2,302585  r  H0 : σ 12 = σ 22 = L = σ r2
B=
C
(
 Tn − r ) log 10 QME − ∑ (n j − 1) log s 2
10 j 
H1: nem todas σ j são iguais
2
 j = 1 
onde
1  r 1 1  χ r2−1
C = 1+ ∑ − 
3(r − 1)  j =1 n j − 1 nT − r 
α

0 X crít +∞
H0 verd.
ac. H0 rej.
H0 falso
H0
Teste de Bartlett (igualdade de variâncias)
Usando-se o exemplo da ANOVA:

A B C D
12 14 19 24
18 12 17 30
13 21 Total
s2 18 1 4 18
nj 2 3 3 2 10

H0 : σ 12 = σ 22 = σ 32 = σ 42
H1: nem todas σ j são iguais
2

1 1 1 r 1 11 1  1  χ 32
C = 1 +  + +
3( r − 1)
∑ + − −  = 1,3148
n

9 1 2 j =12 j 1− 1 6 nT − r 
0,05
2,302585  r 
B=
C
1,3148
[ ( n −
5,3076
 T r −
) log
3, 7147
10 ]
QME = −
2,∑7897 (n j − 1) log s 2
10 j  0 X crít +∞
 j = 1  X crít = 7,8147
Conclusão: aceito H0 a 5%, ou seja, as variâncias dos grupos podem ser as mesmas
Teste de Tukey (teste para comparação múltipla)
Utilizado quando se deseja comparar todos os pares de médias de r
populações, adotando-se um único nível de significância.

H0 : µi − µ j = 0
H1: µi − µ j ≠ 0 ∀i ≠ j

O teste consiste em calcular um valor (Dcrít ), acima do qual, a diferença


entre duas médias amostrais (em absoluto) é significativamente
diferente de zero.

qr ,n T −r 1 1
Dcrít = QME +  
2  ni n
 j

onde qr ,n T −r representa o valor tabelado (vindo de uma distribuição da


amplitude studentizada – “studentized range”) associado ao nível de
significância adotado.
Distribuição da Amplitude Studentizada
P (q r ,g >
q tab) =0,05

g
Teste de Tukey (teste para comparação múltipla)
Usando-se o exemplo da ANOVA:

A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
nj 2 3 3 2 10

q4,6 1 1
Dcrít = QME +  q4,6 = 4,90 (=α 5%)
2  ni n
 j
Xi
13 4,90 1 1 
D =15− 13
= 2 Dcrít = +  =  8,76
7,67
15 2  3 2
19
27
Teste de Tukey (teste para comparação múltipla)
Usando-se o exemplo da ANOVA:

A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
nj 2 3 3 2 10

q4,6 1 1
Dcrít = QME +  q4,6 = 4,90
2  ni n
 j
Xi
a 13 4,90 1 1 
a 15 D =19− 13
= 6 Dcrít = +  =  7,83
7,67
19 2 3 3
27
Teste de Tukey (teste para comparação múltipla)
Usando-se o exemplo da ANOVA:

A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
nj 2 3 3 2 10

q4,6 1 1
Dcrít = QME +  q4,6 = 4,90
2  ni n
 j
Xi
a 13
a 15 4,90 1 1 
D = 27− 13
= 14 Dcrít = + =
7,67  8,76
a 19 2 3 2
27
Teste de Tukey (teste para comparação múltipla)
Usando-se o exemplo da ANOVA:

A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
nj 2 3 3 2 10

q4,6 1 1
Dcrít = QME +  q4,6 = 4,90
2  ni n
 j
Xi
a 13
a 15
a 19
D =19− 15
= 4
b 27
Teste de Tukey (teste para comparação múltipla)
Usando-se o exemplo da ANOVA:

A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
nj 2 3 3 2 10

q4,6 1 1
Dcrít = QME +  q4,6 = 4,90
2  ni n
 j
Xi
a 13
a 15 4,90 1 1 
a 19 D = 27− 15
= 12 Dcrít = 7,67+  =  9,60
b 27 2 2 
2
Teste de Tukey (teste para comparação múltipla)
Usando-se o exemplo da ANOVA:

A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
nj 2 3 3 2 10

q4,6 1 1
Dcrít = QME +  q4,6 = 4,90
2  ni n
 j
Xi
a 13
a 15
a 19 4,90 1 1 
b
D = 27− 19
= 8 Dcrít = + =
7,67  8,76
27 2 3 2
Teste de Tukey (teste para comparação múltipla)
Usando-se o exemplo da ANOVA:

A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
nj 2 3 3 2 10

q4,6 1 1
Dcrít = QME +  q4,6 = 4,90
2  ni n
 j
35
Xi 30
25
b
ab
a 13 20
15
a a
a 15 10
5 B A C D
ab 19 0 10 20 30
b
A B C D
27