Вы находитесь на странице: 1из 22

1

ANOVA
Aplicao da Anlise Varincia
Na rea do Ensino/Educao
Mest r ando Joo Pedr o Si l va, al uno 1101485
Uni v er si dade Aber t a
Joaopedr o74@sapo.pt
Resumo
A anl i se de var i nci a ( ANOVA) um t est e est at st i co que f oi i mpl ement ado por R. A.
Fi sher , nos anos 20 do scul o XX em i nvest i gaes e pesqui sas no campo da Bi ol ogi a e
Agr i cul t ur a. Os r esul t ados que pr oduzi u l evar am a que out r as r eas de conheci ment o
e i nv est i gao t omassem est a f er r ament a est at st i ca com o necessr i a par a o seu
desenvol vi ment o. consi der ada como um dos mai s ut ei s mt odos na r ea da
est at st i ca dedut i va. Quando um i nv est i gador necessi t a de compar ar mai s do que doi s
gr upos exper i ment ai s, em r el ao a uma var i vel quant i t at i va, est e r ecor r e anl i se
de var i nci a ou ANOVA. Est a anl i se ver i f i ca se exi st e uma di f er ena si gni f i cat i v a
ent r e as mdi as dos gr upos e se os f at or es exer cem i nf l unci a em al guma var i v el
dependent e. Na r ea da Educao, a ANOVA t ambm t em si do f undament al em
pesqui sas de car ct er pedaggi co, quer na ver i f i cao de hi pt eses exper i ment ai s,
quer na compar ao de r esul t ados escol ar es ou at f i dedi gni dade e val i dade das not as
de t est es pedaggi cos, mt odos pedaggi cos, ent r e out r os. Nest e ar t i go i r ei
demonst r ar a apl i cabi l i dade da ANOVA a um f at or na i nv est i gao de quest es l i gadas
ao ensi no/ Educao at r avs de doi s exempl os.
Palavras-chave: Anl i se de Var i nci a, R.A. Fi sher , ANOVA, Educao, Ensi no.
Abstract
Anal ysys of var i ance ( ANOVA) i s a st at i st i cal t est i mpl ement ed by R.A. Fi sher dur i ng
t he 20s i n t he 20
t h
cent ur y The pr oduced r esul t s l ed ot her ar eas of k now l edge and
r esear ch t o t ak e t hi s st at i st i cal t ool as necessar y f or i t s dev el opment I t i s consi der ed
one of t he most usef ul met hods i n deduct i ve st at i st i cs. When a r esear cher needs t o
compar e mor e t han t w o exper i ment al gr oups i n r el at i on t o a quant i t at i ve var i abl e he
r ef er s t o t he anal ysi s of var i ance or ANOVA. Thi s k i nd of anal ysi s check s w het her
t her e i s a si gni f i cant di f f er ence bet w een gr oup means and t he f act or s i nf l uenci ng i n
some dependent var i abl e. The ANOVA has been f undament al i n r esear ches w i t hi n t he
Educat i on f i el d, w het er i n exper i ment al t est i ng of hy pot heses or t o compar e school
r esul t s or ev en r el i abi l i t y and val i di t y of t eachi ng t est scor es. I n t hi s paper i w i l l
demonst r at e a smal l apl i cat i on of t he ANOVA ut i l i t y i n a educat i on quest i on.
Key Words: The aut hor s must r ef er f i ve w or ds maxi mum.
2
1. Anlise de Varincia (ANOVA)
A anl i se da var i nci a a um fator um pr ocedi ment o ut i l i zado par a t est ar se um
det er mi nado f at or i ndependent e, quando apl i cado de modo di f er ent e a vr i as
popul aes, t em um ef ei t o si gni f i cat i vo sobr e det er mi nada var i vel dependent e.
Apesar do nome, a anl i se r ecai , essenci al ment e, sobr e as mdi as dos f at or es
i ndependent es.
Anal i se de exper i enci as com vr i os gr upos de obser vaes cl assi f i cados at r avs de
um s f act or ( por exempl o: gr upos de al unos suj ei t os a di f er ent es abor dagens par a
uma mesma di f i cul dade pedaggi ca) . At r avs da apl i cao da anl i se de var i nci a
com um f act or ou " one-way ANOVA" , podemos i ndagar se as di f er ent es abor dagens
pr oduzem os mesmos r esul t ados no que di z r espei t o car act er st i ca em est udo
Se os gr upos so pr edet er mi nados par t i da t emos uma exper i enci a com ef ei t os
f i xos. Se os gr upos f or em escol hi dos al eat or i ament e ent r e um conj unt o al ar gado de
possi bi l i dades t emos uma exper i nci a com ef ei t os al eat r i os.
1.1. Modelo
Vamos apr esent ar uma f er r ament a par a anal i sar o compor t ament o de di ver sos
t r at ament os de um f at or apl i cados a um pr ocesso, pr odut o ou ser vi o.
Par a uma boa anl i se necessr i o descr ever os dados at r avs de um model o
apr opr i ado. Um dos mai s si mpl es o model o de ef ei t os, descr i t o por :
(1)
em que i=1,2,,k e j=1,,n .
Par a est e model o, um par met r o comum a t odos os t r at ament os e r epr esent a a
mdi a ger al dos dados i, o ef ei t o que o nvel i do f at or pr ovoca na var i vel
r espost a. A var i vel al eat r i a ij cor r esponde ao er r o al eat r i o exper i ment al , i st o ,
a var i abi l i dade devi do aos out r os f at or es que t m i nf l unci a no pr ocesso, pr odut o
ou ser vi o e que no f or am consi der ados na exper i nci a.
O model o apr esent ado pe em evi dnci a a segui nt e r el ao:
Valor observado=mdia da populao subjacente ao i-simo grupo+ valor residual
Nas si t uaes pr at i cas descr i t as por est e t i po de model o i nt er essa
f undament al ment e t est ar se as mdi as i das popul aes associ adas nas amost r as
so si gni f i cat i vament e di f er ent es umas das out r as.
As hi pt eses do t est e f undament al da ANOVA podem ent o ser especi f i cadas da
segui nt e f or ma:
H0: 1= 2== n=
VS
H1: os val or es i no so t odos i guai s.
No ent ant o, podemos r eescr ever a hi pt ese H0 da segui nt e f or ma:
ij i ij
y + + =
3
H0: 1 -2=0, 1 -3=0,, 1 -n=0
O que equi val e a escr ever a segui nt e hi pt ese:
H0: 1 - =0, 2 -=0 ,, n - =0, em que

=
=
i
n
j
i
n
1
1
.
Ent o t emos que i -=0 par a i =1,,n-1 e n -=0 o que nos per mi t e r eescr ever a
hi pt ese H0 : i -=0 par a i =1,,n-1, em que o val or n-1 denomi nado graus de
liberdade.
A i dei a de base par a t est ar est as hi pt eses a segui nt e: est i ma-se a var i nci a
2
por doi s mt odos di f er ent es, um que no depende da ver aci dade de H0 e out r o que
depende da ver aci dade de H0. Depoi s compar am-se as duas est i mat i vas. Se H0 e
ver dadei r a, ent o as duas est i mat i vas devem ser pr xi mas; caso cont r r i o, devem
di f er i r si gni f i cat i vament e.
A par t i r dos dados, ut i l i zar emos a segui nt e not ao:
-

=
=
i
n
j
ij i
y y
1
:soma das obser vaes do nvel i do f at or A,
-
i
n
j
ij
i
n
y
y
i

=
=
1
: mdi a das obser vaes do nvel i do f at or A,
-

= =
=
i i
n
i
n
j
ij
y Y
1 1
: som de t odas as obser vaes,
-
N
y
Y
i i
n
i
n
j
ij
= =
=
1 1
: mdi a ger al das obser vaes, sendo

=
=
k
i
i
n N
1
o t ot al de
obser vaes.
A t cni ca da ANOVA est associ ada par t i o da var i abi l i dade t ot al dos dados em
component es. Assi m, a soma de quadr ados t ot al def i ni da como medi d a da
var i abi l i dade t ot al dos dados, i st o :
,

= =
=
k
i
n
j
ij
i
y y SQT
1 1
2
No ent ant o, possvel escr ever a segui nt e i gual dade:
, , ,



SQA
k
i
n
j
i ij
SQE
k
i
i i
SQT
k
i
n
j
ij
i i
y y y y n y y

= = = = =
+ =
1 1
2
1
2
1 1
2
(2)
4
SST: var i abi l i dade t ot al das obser vaes yij em r el ao mdi a gl obal Y .
SQE: var i abi l i dade das obser vaes entre gr upos - cor r esponde soma ponder ada
das var i aes das mdi as de cada gr upo, yi , em t or no da mdi a gl obal , Y ( a
ponder ao f ei t a pel o nmer o de obser vaes de cada gr upo, ni.)
SQA: var i abi l i dade das obser vaes dentro dos gr upos - cor r esponde soma das
var i aes das obser vaes yij dent r o de cada um dos di f er ent es gr upos ( par a
cada gr upo i , a var i ao das obser vaes cal cul ada r el at i vament e mdi a
desse gr upo, yi ) .
necessr i o def i ni r ai nda:
-
1
=
k
SQE
QME como a mdi a da soma dos quadr ados entre os gr upos
-
k N
SQA
QMA

= como a mdi a da soma dos quadr ados dentro dos gr upos.


1.2. Anlise Estatstica
Par a t est ar a i gual dade das mdi as dos dados, o t est e est at st i co ut i l i zado o que
r esul t a do quoci ent e de duas est i maes da var i nci a
2
.
O t est e F dado pel o quoci ent e:
QMA
QME
F = ( 3)
Os val or es de QME e QMA so as duas est i mat i vas de
2
ant er i or ment e r ef er i das
( sendo QME aquel a que depende da ver aci dade de H0) . Assi m, quando a hi pt ese
H0 ver dadei r a, est es val or es devem ser pr xi mos e, consequent ement e, a r azo
QSE/QMA t er um val or pr xi mo de1. Se H0 no f or ver dadei r a, ent o o val or de
MSE ser si gni f i cat i vament e super i or ao de QMA. Assi m, a hi pt ese H0 r ej ei t ada
par a val or es el evados de QME/ QMA.
Sob a val i dade de H0, t em-se:
F ~F( k-1;N-k) ;
onde F( k-1;N-k) r epr esent a a distribuio de Fisher com k-1 e N-k graus de liberdade.
Como f oi r ef er i do aci ma, a hi pt ese H0 r ej ei t ada par a val or es el evados de F, pel o
que p valor = P( F F0) ;
onde F0 r epr esent a o val or obser vado de QME/QMA.
Se F0 > F( 1- ,k-1;N-k) , r ej ei t amos H0 e concl umos que exi st e di f er ena si gni f i cat i va
ent r e as mdi as dos nvei s do f at or , no qual F( 1- ,k-1;N-k) , cor r esponde ao quant i l da
di st r i bui o F de Snedecor com nvel de conf i ana de 1- .
Podemos ai nda cal cul ar o P-val or como,
5
A ANOVA pode ser r epr esent ada na t abel a a segui r :
Font e de var i ao Soma de Quadr ados Gr aus de Li ber dade Quadr ados Mdi os Test e
Fator SQA k-1 QMA F
Erro SQE N-k QME
Total SQT N-1
1.3. Estimao de parmetros
A est i mao dos par met r os do model o ut i l i zado em ( 1) e cr i ao de i nt er val os de
conf i ana ser f ei t a da f or ma segui nt e.
Num pr i mei r o passo, necessr i o def i ni r os est i mador es. Ent o t emos que:
- o est i mador da mdi a ger al ;
- um est i mador par a os ef ei t os;
- um est i mador pont ual par a ( mdi a do i-
simo nvel ) .
Assi m, assumi ndo que os er r os so nor mal ment e di st r i budos e i ndependent es,
t emos que a mdi a ( do nvel i) t em di st r i bui o Nor mal com mdi a e
var i nci a . Ut i l i zando o quadr ado mdi o do er r o ( QME) como est i mador de
, podemos const r ui r um i nt er val o de conf i ana baseado na Di st r i bui o t-St udent .
Dest a f or ma, obt emos que:
t em di st r i bui o t-St udent com ( ) gr aus de l i ber dade. Por t ant o, o i nt er val o
com conf i ana de 100( 1- ) par a a mdi a do -si mo nvel def i ni do por
Em que par a t odo i=1,,k e so i ndependent es.
Da mesma f or ma, t emos:
6
Assi m, um i nt er val o com conf i ana de 100(1-) par a a di f er ena ent r e a mdi a de
doi s nvei s dado por
onde,
1.4. Anlise de Resduos
A decomposi o da var i abi l i dade na anl i se de var i nci a pur ament e al gbr i ca. No
ent ant o, par a r eal i zao de t est es est at st i cos e a obt eno de i nt er val os de
confi ana, ut i l i zamos as segui nt es hi pt eses:
- Os er r os ij so nor mai s e i ndependent es, com mdi a 0 e var i nci a
2
const ant e e
- As obser vaes so descr i t as por mei o de model o descr i t o em ( 1)
Na pr t i ca, pr eci samos ver i f i car se est as suposi es so vl i das. As vi ol aes
nest as suposi es so ver i f i cadas at r avs dos r esduos.
O r esduo par a a j-si ma obser vao do nvel i def i ni do por
onde uma est i mat i va da obser vao
Na sequnci a, vamos fazer a anl i se de nor mal i dade, i ndependnci a e i gual dade da
var i nci a dos r esduos. Gr ande par t e dos pr obl emas que encont r amos na pr t i ca, so
sol uci onados, consi der ando al gumas suposi es i ni ci ai s, t ai s como, assumi r uma funo de
di st r i bui o par a os dados amost r ados. Nesse sent i do, sur ge a necessi dade de
cer t i fi car mos se essas suposi es podem, r eal ment e, ser assumi das. Em al guns casos,
assumi r a nor mal i dade dos dados o pr i mei r o passo que t omamos par a si mpl i fi car sua
anl i se. Par a dar supor t e a est a suposi o, consi der amos, o t est e Ander son-Dar l i ng, o t est e
Kol mogor ov - Smi r nov e o t est e Shapi r o - Wi l k.
7
1.5. Pressupostos para aplicao da ANOVA
A apl i cao da anl i se de var i nci a pr essupe a ver i f i cao das segui nt es
condi es:
1. As amost r as devem ser al eat r i as e i ndependent es;
2. As amost r as devem ser ext r adas de popul aes nor mai s;
3. As popul aes devem t er var i nci as i guai s ( )
Hi pt ese de Homocedast i ci dade.
Um dos pr essupost os da ANOVA a nor mal i dade dos dados a anal i sar . Par a
aver i guar se os dados a anal i sar pr ovm de uma di st r i bui o nor mal r ecor r e-se a
t est es de nor mal i dade.
1.5.1. Testes de Independncia
Teste de Qui-Quadrado
O t est e de i ndependnci a do qui -quadr ado per mi t e ver i f i car a i ndependnci a ent r e
duas var i vei s de qual quer t i po que se apr esent em agr upadas numa t abel a de
cont i ngnci a.
Hi pt eses em t est e:
H0: As var i vei s so i ndependent es;
H1: As var i vei s no so i ndependent es.
Como f unci ona o t est e:
compar am-se as f r equnci as obser vadas de cada uma das pq cl ul as,nij , com as
cor r espondent es f r equnci as esper adas sob a hi pt ese da i ndependnci a, eij ,
at r avs do val or

= =

=
p
i
q
j ij
ij ij
e
e n
1 1
2
2
) (
; (4)
que usado par a o cl cul o do coef i ci ent e de cont i ngnci a de Pear son. Se est e val or
suf i ci ent ement e pequeno, o que si gni f i ca que as di f er enas nij -eij so pequenas,
ent o somos conduzi dos acei t ao de H0.
1.5.2. Testes de Normalidade
I. Teste de Kolmogorov Smirnov
O t est e de Kol mogor ov - Smi r nov pode ser ut i l i zado par a aval i ar as hi pt eses:
H0: Os dados t em uma di st r i bui o nor mal ;
H1: Os dados no t em uma di st r i bui o nor mal .
8
O t est e est at i st i co a ut i l i zar obser va a di f er ena mxi ma absol ut a ent r e a f uno de
di st r i bui o acumul ada assumi da par a os dados, no caso a Nor mal , e a f uno de
di st r i bui o empr i ca dos dados. Como cr i t r i o, compar amos est a di f er ena com
um val or cr t i co, par a um dado nvel de si gni f i cnci a.
Consi der e uma amost r a al eat r i a si mpl es X1, X2,, Xk de uma popul ao com
f uno de di st r i bui o acumul ada cont nua FX desconheci da. A est at st i ca ut i l i zada
par a o t est e :
) ( ) ( x F x F Sup D
n
x
n
=
o que r epr esent a a mai or di st nci a ( na ver t i cal ) ent r e a f uno de di st r i bui o
empr i ca ( f r equnci as r el at i vas acumul adas) e a f uno de di st r i bui o em t est e.
Est a di st r i bui o assi nt t i ca vl i da quando t emos conheci ment o compl et o sobr e
a di st r i bui o de , ent r et ant o, na pr t i ca, especi f i ca uma f aml a de
di st r i bui es de pr obabi l i dade. Nest e caso, a di st r i bui o assi nt t i ca da est at st i ca
de Kol mogor ov-Smi r nov no conheci da e f oi det er mi nada vi a si mul ao.
Como a f uno de di st r i bui o empr i ca descont nua e a f uno de di st r i bui o
hi pot t i ca cont nua, vamos consi der ar duas out r as est at st i cas:
par a cal cul ar mos a est at st i ca de k ol mogor ov -Smi r nov. Essas est at st i cas medem
as di st nci as ( ver t i cal ) ent r e os gr f i cos das duas f unes, t er i ca e empr i ca,
nospont os x(i-1) e x(i). Com i sso, podemos ut i l i zar como est at st i ca de t est e:
Se Dn mai or que o val or cr t i co, r ej ei t am os a hi pt ese de nor mal i dade dos dados
com 100( 1- ) de conf i ana. Caso cont r r i o, no r ej ei t amos a hi pt ese de
nor mal i dade.
Resumo das est at st i cas de t est e.
x(ordenada) Fn(x)
,
|
|
.
|

'

s =
s
x x
z P x F
i
i
) ( , ) (
i n i
x F x F , ) (
1

i n i
x F x F
x(1)
n
1 ,
|
|
.
|

'

s =
s
x x
z P x F
1
1
) ( , ) (
1 1
x F x F
n
, 0
1
x F

x(n-1)
n
n 1
,
|
|
.
|

'

s =

s
x x
z P x F
n
n
1
1
) ( , ) (
1 1

n n n
x F x F , ) (
2 1

n n n
x F x F
x(n) 1
,
|
|
.
|

'

s =
s
x x
z P x F
n
n
) ( , ) (
n n n
x F x F , ) (
1

n n n
x F x F
9
II. Teste de Shapiro-Wilk
O t est e Shapi r o-Wi l k , pr opost o em 1965, baseado na est at st i ca W dada por :
(5)
em que xi so os val or es da amost r a or denados ( x(1) o menor ) . Menor es val or es de
W so evi dnci as de que os dados so nor mai s. A const ant e b det er mi nada da
segui nt e f or ma:
As Hi pt eses em t est e so:
H0: A amost r a pr ovm de uma di st r i bui o n or mal ;
H1: A amost r a no pr ovm de uma di st r i bui o nor mal .
Aps cal cul ar a est at st i ca de t est e devemos t omar a deci so:
Rej ei t ar H0 ao nvel de si gni f i cnci a se Wcal cul ado < W .
III. Teste de Andersen-Darling
Pr opost o por Ander son & Dar l i ng ( 1952) mai s ut i l i zado quando o t amanho da
amost r a no super i or a 25. Est e t est e baseado na f uno de di st r i bui o
empr i ca, a i dei a que dada a f uno de di st r i bui o sob hi pt eses nul a, os dados
podem ser t r ansf or mados di st r i bui o uni f or me.
Os dados t r ansf or mados podem ent o ser em t est ados par a uni f or mi dade.
A est at st i ca de t est e :
j j

=
+
+ =
n
i
i n i
p p i
n
n A
1
) 1 (
1 ln( ) ln( 1 2
1
,
onde
j
|
.
|

'

=
s
y y
F p
i
i
so os per cent i s or denados da di st r i bui o nor mal padr o e
F r epr esent a a f uno de di st r i bui o acumul ada nor mal padr o.

>
< s
<
=
+
) (
) 1 ( ) (
) 1 (
_ , 1
_ ,
_ , 0
) (
n
k k n
x x se
x x x se
n
k
x x se
x F
O p-valor cal cul ado da est at st i ca modi f i cada
A
n n
Z
|
.
|

'

+ + =
2
25 . 2 75 . 0
1
,

=

=
n
i
i
x x
b
W
1
2
2
10
1.4.3. Testes de igualdade das Varincias
Par a o model o het er ocedst i co, vamos i ni ci al ment e t est ar as hi pt eses
Os mt odos mai s ut i l i zados so os t est es de Cochr an, Bar t l et t e de Levene.
I. Teste de Cochran (Homogeneidade de Varincia)
O t est e de Cochr an compar a a mai or var i nci a com as demai s. Par a apl i car mos o
t est e de Cochr an, vamos assumi r que a exper i nci a equi l i br ada com
e segui r os segui nt es passos:
1. Cal cul ar a Est at st i ca
( 6)
onde
- : r epr esent a o nmer o de nvei s do f at or ;
- : r epr esent a a var i nci a amost r al . E est a cal cul ada por
- : r epr esent a o nmer o de medi das em cada nvel do f at or
2. Anal i sar a Est at st i ca C
Se Ccalculado > Ctabelado, r ej ei t amos H0.
II. Teste de Bartlett
O t est e de Bar t l et t uma f er r ament a par a t est ar a homogenei dade das var i nci as.
A est at st i ca do t est e pr op ost a por Bar t l et t dada por :
, , ,
C
s n siduos QM k n
B
k
i
i i
=

=
1
2
0
log 1 Re log ) (
, ( 7)
11
Onde
,

]


+ =

=
k
i i
k n n k
C
1
1
1
1
1 3
1
1 e B0~
2
1 k

Sob H0 ( i gual dade das var i nci as) sabemos que B0 t em di st r i bui o assi nt t i ca qui -
quadr ado com k-1gr aus de l i ber dade. Dest a f or ma, r ej ei t amos H0 se B0>Q[1-,k-1] no
qual Q[1-,k-1] r epr esent a o quant i l 100( 1- ) da di st r i bui o qui -quadr ado com (k-1)
gr aus de l i ber dade. Al m di sso, o P-val or cal cul ado por :
>
O t est e de Bar t l et t sensvel em r el ao a hi pt ese de nor mal i dade dos dados. Se
r ej ei t ar mos a hi pt ese de nor mal i dade, mel hor ut i l i zar mos o t est e pr opost o por
Levene. Por m, se a hi pt ese de nor mal i dade n o f or vi ol ada, o t est e pr opost o por
Bar t l et t t em um compor t ament o mel hor que o t est e pr opost o por Levene.
Um out r o pr essupost o do t est e de Bar t l et t o de que est e t est e deve ser apl i cado
apenas quando ni>5.
1
III. Teste de Levene
Como f oi r ef er i do ant er i or ment e, o t est e de Levene mai s i ndi cado quando h
r ej ei o da hi p t ese de nor mal i dade dos dados. Est e pr ocedi ment o consi st e em
f azer uma t r ansf or mao dos dados or i gi nai s e apl i car aos dados t r ansf or mados o
t est e da ANOVA. Levene pr ops, em 1960, a segui nt e t r ansf or mao:
onde
- : r epr esent a os dados aps t r ansf or mao;
- : r epr esent a os dados or i gi nai s; e
- : r epr esent a a mdi a do nvel , par a os dados or i gi nai s.
Assi m, a expr esso a segui r subst i t uda por :
i=1,,k e j=1,,ni
( 8)
onde
- : r epr esent a os dados aps t r ansf or mao;
- : r epr esent a os dados or i gi nai s; e
- : r epr esent a a medi ana do nvel , par a os dados or i gi nai s.
1
Prof. Jorge Cadima
i ij ij
x x z
~
=
12
Aps a t r ansf or mao dos dados or i gi nai s pel a expr esso ( 8) , apl i camos o t est e da
ANOVA. Se a est at st i ca F f or si gni f i cat i va r ej ei t amos a hi pt ese de i gual dade das
var i nci as. A expr esso do t est e est at st i co dada por :
,
,
,
,

= =
=

=
k
i
n
j
i ij
k
i
i i
i
z z
z z n
k
k n
L
1 1
2
1
2
...
0
1
( 9)
O t est e de Levene consi st e em r ej ei t ar H0 se L0 > F[ ( k 1,nk ) ,( 1 ) ] . F( k 1,nk ) ,( 1 )
r epr esent a o quant i l de or dem 1 da di st r i bui o F( k 1,nk ) e o nvel de
si gni f i cnci a do t est e.
No caso de f al ha em t odos os pr essupost os par a o uso da anl i se de var i nci a
possvel usar um out r o t est e em al t er nat i va: Test e de Kr usk al l - w al i s.
Est e t est e ser abor dado num out r o document o.
1.4. Comparaes mltiplas
Quando se r ej ei t a a hi pt ese nul a da i gual dade das mdi as, no se t em i nf or mao
sobr e qual ou quai s dos gr upos so r esponsvei s pel a di f er ena. Uma das
possi bi l i dades par a ef et uar compar aes ml t i pl as consi st e em compar ar t odos os
par es de mdi as, i e j, par a i j.
Pr obl ema: Fi xado o nvel de si gni f i cnci a do t est e cor r espondent e a cada
compar ao, o nvel de si gni f i cnci a gl obal de um conj unt o de compar aes t ende
a ser t ant o mai s el evado quant o mai or o nmer o de compar aes, o que no
desej vel . Ef et i vament e, o f act o do nvel de si gni f i cnci a gl obal de um conj unt o de
compar aes ser el evado si gni f i ca que el evada a pr obabi l i dade de se r ej ei t ar
i ndevi dament e pel o menos uma das hi pt eses nul as do conj unt o.
Exi st em mt odos que pr ocur am t omar em consi der ao est e pr obl ema.
A anl i se de compar aes ml t i pl as no f az sent i do nos model os de ef ei t os
al eat r i os e s deve ser ut i l i zada nos model os de ef ei t os f i xos.
I. Mtodo de Tukey(HSD)
O mt odo de Tuk ey consi st e na const r uo de i nt er val os de conf i ana par a t o dos
os par es de mdi as de t al f or ma que o conj unt o de t odos os i nt er val os t enha um
det er mi nado gr au de conf i ana ( por exempl o, se = 0:95, t emos 95% de
conf i ana de que os i nt er val os obt i dos cont m, t odos, as r espet i vas di f er enas
i - j)
O mt odo de const r uo dest es i nt er val os depende do f act o dos gr upos t er em ou
no a mesma di menso.
13
Amostras equilibradas: Todos os gr upos t m a mesma di menso n.
Os i nt er val os de conf i ana par a i - j, com gr au de conf i ana , so dados por :
Amostras pouco desequilibradas: Os gr upos t m di f er ent es di menses, mas exi ge-se
que di menso mxi ma 2 di menso mni ma. Quando o t amanho das amost r as so
di f er ent es o mt odo ( ou t est e) de Tuk ey modi f i cado e denomi nado por vr i os
escr i t or es como Test e de Tuk ey-k r amer . Esse t est e no exat o, mas
mi ni mament e conser vat i vo no sent i do em que a a t axa de er r o da f aml i a dos
t est es r eal mui t as vezes menor que . O t est e de Tuk ey - k r amer decl ar a duas
mdi as si gni f i cat i vament e di f er ent es se o val or absol ut o das di f er enas amost r ai s
ul t r apassar o i nt er val o de conf i ana, par a
II. Teste de Fischer
O mt odo de Fi sher ao compar ar t odos par es de mdi as cont r ol a a t axa de er r o ao
nvel de si gni f i cnci a par a cada compar ao doi s a doi s, mas no cont r ol a a t axa
de er r o do exper i ment o. Esse pr ocedi ment o usa a est at st i ca par a t est ar
, em que
O pr ocedi ment o de Fi sher consi st e em r eal i zar t est es t ,ml t i pl os, cada um ao nvel
de si gni f i cnci a ,soment e se o t est e F pr el i mi nar si gni f i cant e ao nvel . Est e
pode ser vi st o como um pr ocedi ment o de duas et apas em que a hi pt ese nul a
t est ada no pr i mei r o passo por um t est e F de n vel . Se o t est e F no si gni f i cat i vo,
o pr ocedi ment o t er mi na sem a necessi dade de f azer i nf er nci as det al hadas nas
di f er enas dos par es das mdi as; caso cont r r i o, cada di f er ena de par t est ada
por um t est e t com nvel de si gni f i cnci a. Esse pr ocedi ment o chamado de t est e
da di f er ena mni ma si gni f i cat i va ( l east si gni f i cant di f f er ence ( LSD) t est ) .
O LSD cont r ol a a t axa de er r o da obser vao ao nvel sobr e H0 devi do
" pr ot eo" f or neci da p ar a essa hi pt ese pel o t est e F pr el i mi nar . No ent ant o, em
out r as conf i gur aes ( hi pt eses) de mdi as ver dadei r as, a t axa de er r o da
obser vao pode ser mai or que .
Par a t amanhos de amost r as i gu ai s, o t est e de Fi sher consi der a duas mdi as
si gni f i cat i vament e di f er ent es se o val or absol ut o das suas di f er enas amost r ai s
ul t r apassar
14
e par a t amanhos de amost r as di f er ent es dados no bal anceados)
em que t um val or t abel ado que depende do nmer o de gr aus de l i ber dade dos
er r os ( N-k) .
Por out r as pal avr as, r ej ei t amos a i gual dade ent r e as mdi as dos doi s n vei s se
H um segundo pr ocedi ment o de Fi sher popul ar ment e chamado como
pr ocedi ment o de Bonf er r oni que cont r ol a a t axa de f aml i a de er r os da obser vao
em t odas as conf i gur aes ( hi pt eses) .
III. Mtodo de Bonferroni
O segundo mt odo de compar ao ml t i pl a pr opost o por Fi sher e usual ment e
chamado de t est e ou mt odo de Bonf er r oni , consi st e em ef et uar cada um dos t est es
t i ndi vi duai s s hi pt eses H0: i =j e H1: i j , com um nvel de si gni f i cnci a
mui t o r eduzi do de modo que o n vel gl obal sej a o desej ado. Assi m, consi der a-se
par a cada uma das r compar aes i ndi vi duai s um n vel de si gni f i cnci a r=/r por
f or ma a gar ant i r que o n vel t ot al sej a, no mxi mo, .
Est e mt odo f unci ona bem desde que o nmer o de compar aes a ef et uar no sej a
demasi ado el evado.
Para amostras de igual dimenso, o teste de Bonferroni considera duas mdias
significativamente diferentes se o valor absoluto de suas diferenas amostrais
ultrapassar
e para amostras de diferentes tamanhos,
em que = / r e r o nmer o de compar aes duas a duas ( ou t ambm podemos
di zer que o nmer o de i nt er val os em est udo) . O quant i l da di st r i bui o
de pr obabi l i dade -St udent com par met r o . Temos assi m que a mar gem de
er r o da equao ant er i or depende do nmer o de compar aes.
15
IV. Teste de Scheffe
O mt odo pr opost o por Schef f e ( 1959) t ambm conheci do como t est e de Schef f e
da di f er ena compl et ament e si gni f i cat i va (fully significant difference - FSD) e como
t est e de Schef f e da di f er ena gl obal ment e si gni f i cat i va (globally significant
difference(GSD)). um mt odo exat o no sent i do em que, par a as f aml i as ( f i ni t as)
envol vendo t odos os cont r ast es das k mdi as, a t axa de er r o da f aml i a de t est es
exat ament e .
O Test e de Schef f e pode ser usado quando as compar aes so sel eci onadas depoi s
de obser var os dados e i ncl uem os cont r ast es, que nem t odos so aos par es.
Tambm pode ser ut i l i zado quando um gr ande nmer o de cont r ast es( nem t odos
aos par es) so especi f i cados ant es de col et ar os dados.
Dada uma t axa de er r o da f aml i a de t est es de , o i nt er val o de conf i ana par a o
cont r ast e , em que cal cul ado ut i l i zando a segui nt e f r mul a
em que o quant i l da di st r i bui o com par met r os e . A mar gem
de er r o da expr esso ant er i or no depende do nmer o de cont r ast es, mas si m do
nmer o de mdi as no cont r ast e. O mt odo de Shef f e t ambm pode ser usado par a
a f aml i a de t odas as compar aes duas a duas, mas quase sempr e r esul t ar em
i nt er val os de conf i ana mai or es que os mt odos anal i sados ant er i or ment e. Dado
uma t axa de er r o de , o i nt er val o de conf i ana par a i - j cal cul ado usando a
segui nt e expr esso
Assi m, t emos que o Test e de Schef f e consi der a duas mdi as si gni f i cat i vament e
di f er ent es se o val or absol ut o das di f er enas amost r ai s ul t r apassar
I st o , r ej ei t amos a i gual dade da mdi a de doi s nvei s se
16
1 2 3
5
10
15
Racio professores por aluno
1-Alemanha 2-Portugal 3-espanha
Pases
2. APLICAO
2.1. Os dados que i r ei apr esent ar par a est e pr i mei r o pr obl ema r ef er em -se ao r ci o
al unos/ docent e em t r s pases da Uni o Eur opei a. O r ci o al unos/ docent e o
nmer o de al unos par a cada pr of essor em at i vi dade no si st ema de ensi no ger al
dest es pases no ano de 2007. Os pases escol hi dos so Por t ugal , Espanha e
Al emanha. A escol ha no f oi i nt ei r ament e al eat r i a. Por r azes bvi as escol hi
Por t ugal e de segui da escol hi o pas mai s pr xi mo geogr af i cament e: Espanha. E
par a t er cei r o pas opt ei por um dos chamados pases do Nor t e da Eur opa. Nest e
caso opt ei pel a Al emanha. Os dados f or am r et i r ados do obser vat r i o das
desi gual dades. Cada l i n ha cor r esponde a um di f er ent e nvel de ensi no.
2
Os dados a ut i l i zar na anl i se ser o os segui nt es:
1.Al emanha 2.Por t ugal 3.Espanha
16,9 9,6 15,5
18,3 11,8 13,6
15,2 7,9 11,7
14,3 8,4 7,7
Ant es de i ni ci ar o pr ocesso de anl i se de var i n ci a ser aconsel hvel apr esent ar as
est at st i cas descr i t i vas dos dados e uma r epr esent ao gr f i ca dos mesmos.
Assi m, t emos:
2
Consultar Tabela em anexo
17
Obser vando os gr f i cos em cai xa de bi godes , podemos ver i f i car que as medi anas
dos r ci os cor r espondent es a Por t ugal e Espanha so bast ant e pr xi mas.
Estatsticas descritivas
VAR00002
N Mean
Std.
Deviation
Std.
Error
95% Confidence Interval for
Mean Minimum Maximum
Lower Bound Upper Bound
1,00 4 16,1750 1,78022 ,89011 13,3423 19,0077 14,30 18,30
2,00 4 9,4250 1,73662 ,86831 6,6617 12,1883 7,90 11,80
3,00 4 12,1250 3,33304 1,66652 6,8214 17,4286 7,70 15,50
Total 12 12,5750 3,62093 1,04527 10,2744 14,8756 7,70 18,30
Independncia de dados:
Podemos consi der ar os dados i ndependent es por que pr ovm de pases di f er ent es.
O pr i mei r o passo da r esol uo ser a ver i f i cao da nor mal i dade dos dados.
Normalidade dos dados:
Dos 4 t est es que r ef er i e apr esent ei ant er i or ment e, vou ut i l i zar o t est e de shapi r o
w i l k por que at ual ment e consensual que o t est e K-S possui uma f r aca
sensi bi l i dade a desvi os em r el ao di st r i bui o sobr e a qual se const r i a
hi pt ese.
Obs. O t est e de Shapi r o-Wi l k aconsel hado quando n<30.
Nest a apl i cao, o t est e de Shapi r o-Wi l k f oi ut i l i zado at r avs do supl ement o
action
3
no excel .
Os dados obt i dos so os segui nt es:
Al emanha:
Estatstica: Shapiro-Wilk 0,966814418
P-valor 0,821668363
Por t ugal :
Estatstica: Shapiro-Wilk 0,916719736
P-valor 0,518717592
Espanha:
Estatstica: Shapiro-Wilk 0,966917165
P-valor 0,822309883
Com base na t abel a de Shapi r o-w i l k consi der o W =0,748.
3
http://www.portalaction.com.br/
18
Ent o, devo concl ui r que t odas as popul aes t em di st r i bui es nor mai s, ou pel o
menos, suscet vei s de aj ust e nor mal i dade.
Quant o homogenei dade das var i nci as i r ei ut i l i zar o t est e de Levene. Nest e caso
o t est e de Bar t l et t no i ndi cado, por que o t amanho de cada obser vao n=4.
Est e f act o, desaconsel ha a ut i l i zao do t est e de Bar t l et t .
Informao Valor
Levene (estatstica do teste) 0,9006241
Graus de Liberdade 2
P-valor 0,440005937
Segundo o t est e est at st i co, a hi pt ese H0 no deve ser r ej ei t ada.
Vamos agor a pr oceder anlise de Varincia.
A hi pt ese nul a a t est ar ser :
H0: 1= 2= 3. I st o , as mdi as dos dados r ecol hi dos sobr e os t r s pases so
i guai s.
E a hi pt ese al t er nat i va ser :
H1: 123. Ou sej a, as mdi as no so i guai s.
A est at st i ca de t est e ser baseada na compar ao da var i ao obser vada ent r e os
gr upos( ent r e as suas mdi as) com a var i ao ent r e os el ement os do gr upo.
At r avs do supl ement o action obt enho os segui nt es dados descr i t os na segui nt e
t abel a:
Tabela da Anova
G.L. Soma Quad Quadrado Mdio Estat. F P-valor
fator 2 92,34 46,17 8,009058931 0,01
Resduos 9 51,8825 5,764722222
O t est e est at st i co devol ve um val or di st ant e da uni dade e um P-valor menor que
0.05, o que nos l eva a concl ui r que, sem qual quer dvi da, as mdi as dos gr upos so
di f er ent es ent r e si .
Sobr e a anl i se de r essuos:
Teste de Falta de Ajuste G.L. Soma Quad Quadrado Mdio Estat. F P-valor
fator 2 92,34 46,17 8,009058931 0,01
Resduos 9 51,8825 5,764722222
Falta de ajuste 0 -7,10543E-15
Erro 9 51,8825 5,764722222
19
-10 -5 0 5
3-2
3-1
2-1
Intervalos de Confiana (95%)
Diferenas entre as mdias dos nveis do Fator
Histograma dos Resduos
Resduos
F
r
e
q

n
c
i
a
s
-6 -4 -2 0 2 4
0
1
2
3
4
5
-4 -2 0 2
-
1
.
5
-
0
.
5
0
.
5
1
.
0
1
.
5
Papel de Probabilidade
Resduos
N
o
r
m
a
l
Mdia = 2.776e-17
DP = 2.172
N = 12
AD = 0.1734
P-Valor = 0.9043
10 11 12 13 14 15 16
-
4
-
2
0
2
Resduos x Valores Ajustados
Valores Ajustados
R
e
s

d
u
o
s
2 4 6 8 10 12
-
4
-
2
0
2
Resduos x Ordem de Coleta
Ordem de Coleta
R
e
s

d
u
o
s
A nor mal i dade dos r es duo aval i ada at r avs do gr f i co " papel de pr obabi l i dade"
e do t est e de Ander son -Dar l i ng. No nosso caso, t omamos como hi pt ese nul a a
nor mal i dade dos r esduos, e ut i l i zamos a est at st i ca de Ander son - Dar l i ng par a
t est ar est a hi pt ese. Como o P-val or al t o ( apr oxi madament e 0,9 ) no r ej ei t amos
a hi pt ese de nor mal i dade dos r esduos.
Devemos agor a pr oceder ao t est e de comparaes mltiplas. Par a t al , i r ei ut i l i zar o
t est e de Tuk ey. Os dados cal cul ados at r avs d a f er r ament a action so os segui nt es:
20
Nveis Centro Limite.Inferior Limite.Superior P.Valor
2-1 -6,75 -11,4901325 -2,009867499 0,00814767
3-1 -4,05 -8,790132501 0,690132501 0,093921043
3-2 2,7 -2,040132501 7,440132501 0,298335549
O t est e de Tuk ey per mi t e concl ui r que:
Ao consi der ar mos um nvel de si gni f i cnci a de 5%, no r ej ei t amos a hi pt ese de
i gual dade ent r e as mdi as dos nvei s: ( 3-1) e ( 3-2) .
Obs. Graficamente pode verificar-se que os intervalos que correspondem a estes nveis incluem o
valor zero.
Concluso
As mdi as sobr e os dados r ef er ent es ao r ci o pr of essor / al uno na amost r a de 3
pases so cl ar ament e di f er ent es. Mas at r avs do t est e de Tuk ey, em par t i cul ar a
par t i r do gr f i co or i gi nado pel o mesmo, podemos consi der ar as mdi as de
Por t ugal e Espanha pr xi mas. Tambm podemos r ef er i r que a var i nci a ent r e
gr upos mai or que a var i nci a dent r o dos gr upos. I st o , h mai s homogenei dade
dentro dos gr upos que entre os di f er ent es gr upos. Todos os pr essupost os par a a
i mpl ement ao da ANOVA f or am t est ados e o seu r esul t ado f oi posi t i vo.
A opo por um exempl o com poucos dados deve-se necessi dade de pouca
compl exi dade nos cl cul os a ef et uar , e demonst r ar , t endo em cont a uma h i pot t i ca
apr esent ao r eal .
21
Anexo
22
Bibliografia
-MONTGOMERY, Dougl as C.-Desi gn and Anal ysi s of Exper i ment s, 7t h Edi t i on,2009
-DEAN, Angel a; VOSS,Dani el -Desi gn and anal ysi s of exper i ment s,1999.
-OLI VEI RA, Ter esa, Text os de apoi o.
-LOURENO, Car l os, Test es de hi pt eses par a mai s de duas amost r as, One w ay
ANOVA-t ext os de apoi o.
-CADI MA, Jor ge, Text os de apoi o.
-ht t p:/ / w w w .por t al act i on.com.br / -consul t ado pel a l t i ma vez em 04.02.2012.
-ht t p:/ / w w w .i t l .ni st .gov/ di v898/ han dbook / -consul t ado pel a ul t i ma vez em
04.02.2012.
-An i nt r oduct i on t o Anal ysi s of var i ance

Вам также может понравиться