Вы находитесь на странице: 1из 23

ANOVA de um fator:

Comparao de vrias mdias


Captulo 22

2006 W.H. Freeman and Company

Objetivos
ANOVA de um fator

Comparao de vrias mdias

A idia da ANOVA

O teste F da ANOVA

Usando a Tabela D

Comparando vrias mdias


Agora, desejamos comparar mais de duas populaes ou mais de dois
tratamentos. A questo no somente se cada mdia populacional i
diferente de outra mdia populacional, mas tambm se elas so
significantivamente diferentes quando analisadas como um grupo.

Se voc for comparar uma amostra dos indivduos mais altos com uma
amostra dos indivduos mais baixos dentro de uma populao, voc
provavelmente ir encontrar uma diferena com significncia estatstica.
No entanto, quando comparamos com outras amostras aleatrias daquela
populao, torna-se claro que as duas amostras extremas so apenas
partes da populao.

Lembrete: problema com comparao mltipla


Devido a incerteza na inferncia, devemos evitar realizar anlises
mltiplas de um mesmo tipo.

Para qualquer teste estatstico, a


probabilidade de incorretamente de
rejeitar H0 (cometendo um erro do
Tipo I) o nvel de significncia .

Se ajustarmos = 5% e proceder a
anlises mltiplas, podemos esperar
de cometer um erro do Tipo I cerca de
5% do tempo.

Manipulando-se estatisticamente as comparaes


mltiplas

O primeiro passo no exame estatstico de populaes ou

tratamentos mltiplos (comparaes mltiplas) fazer um teste geral


para ver se h boa evidncia de quaisquer diferenas entre os
parmetros que desejamos comparar.
ANOVA (Anlise da varincia): teste F

Se o teste geral mostrar uma significncia estatstica, ento uma

anlise de acompanhamento detalhada deve ser feita para decidir qual


dos parmetros diferente e para estimar o tamanho das diferenas.

mtodos mais complexos no sero estudados nesta disciplina

Exemplo: Nematides e o crescimento das plantas


Os nematides afetam o crescimento das plantas? Um
botnico prepara 16 vasos idnticos e, em seguida
adiciona quantidades diferentes de nematides nesses
vasos. O crescimento das mudas (em mm) registrado
duas semanas aps o plantio.

Hipteses: Todas i so iguais (H0)


versus nem todas i so iguais (Ha)

xi
Nematodes
Seedling growth
0 10.8 9.1 13.5 9.2 10.65
1,000 11.1 11.1 8.2 11.3 10.43
5,000 5.4 4.6 7.4
5
5.6
10,000 5.8 5.3 3.2 7.5
5.45
Overall mean 8.03

A idia da ANOVA
Lembretes: Um fator uma varivel que assume um dos vrios nveis para diferenciar um
grupo de outro.
Um experimento tem um planejamento com um fator ou completamente aleatorizado
se vrios nveis de um fator esto sendo estudados e os indivduos so aleatoraimente
fixados em seus nveis. (Existe somente um nico fator no grupo.)

Ex: Quatro nveis da quantidade de nematides no experimento do crescimento das


plantas.

Mas, seria um planejamento de dois fatores se fossem usados duas espcies de


plantas e quatro nveis de nematides.

Anlise da varincia (ANOVA) uma tcnica usada para determinar


se mais que duas mdias populacionais so iguais.
ANOVA de um fator usada em planejamentos completamente
aleatorizados, planejamentos de fator nico.

Como comparamos as mdias?


Queremos saber se as diferenas observadas nas mdias amostrais
so atribudas somente ao processo de amostragem aleatria.

Isto ir provavelmente depender das diferenas das mdias amostrais


e em quanta variao h dentro de cada amostra.

O teste F da ANOVA
O teste F da anlise da varincia compara a variao devida a fontes
especficas (nveis do fator) com a variao dentre os indivduos que
devem ser similares (indivduos de uma mesma amostra).

H0: Todas as mdias i so iguais.


Ha: Nem todas as mdias i so iguais.

A estatstica F da anlise da varincia para testar a igualdade de vrias


mdias :

F=

var iao entre mdias amostrais


var iao entre indivduos na mesma amostra

Implicaes para F
F=

var iao entre mdias amostrais


var iao entre indivduos na mesma amostra

(a) Diferena na mdia pequena

(b) Diferena na mdia grande

relativa variabilidade global

relativa variabilidade global

F tende a ser pequeno.

F tende a ser grande.

Grandes valores de F tipicamente representam uma diferena mais significativa


entre as mdias populacionais. O quo grande depende dos graus de liberdade
(I1 and NI).

O modelo da ANOVA
Temos I AAS independentes, uma de cada das I populaes.
A i-sima populao tem uma distribuio normal com mdia i
desconhecida.
Todas as I populaes tm o mesmo desvio padro , desconhecido.

H0: 1 = 2 = = I

A estatstica F da ANOVA:

Ha: Nem todas i so iguais.

SSG ( I 1)
F=
SSE ( N I )
Quando H0 verdadeiro, F tem uma
distribuio F com I 1 (numerador)
e N I (denominador) graus de
liberdade.

MSG SSG ( I 1)
=
F=
MSE SSE ( N I )
MSG, a mdia quadrtica de grupos, mede quanto as mdias individuais
diferem da mdia geral (~ a mdia ponderada das distncias quadrticas para
a mdia global). SSG a soma quadrtica de grupos.

MSE, a mdia quadrtica do erro ou varincia amostral combinada sp2,


mede a variabilidade dentro dos grupos (~ mdia ponderada das varincias de
cada uma das I amostras). SSG soma quadrtica do erro.

Varincia combinada e os intervalos de confiana


MSE, a mdia quadrtica do erro ou varincia amostral combinada
sp2, estima a varincia comum 2 das I populaes.
Assim, podemos facilamente calcular intervalos de confiana com nvel
C para cada mdia populacional I (normalmente fornecido pelos
programas computacionais):

xi t * s p

ni

or

xi t * MSE / ni

Usa-se o valor critco de t* da distribuio


t com N I graus de liberdade.

Verificando nossas suposies


Cada uma das #I populaes devem ser normalmente distribudas.
Mas, o teste robusto a desvios da normalidade para amsotras de
tamanho grande, em virtude do teorema central do limite.
O teste F da ANOVA requer que todas as populaes tenham o mesmo
desvio padro . Como desconhecido, isto pode ser difcil de
verificar.
Prtica: Os resultados do teste F da ANOVA so aproximadamente
corretos quando o maior desvio padro amostral no mais que
duas vezes o menor desvio padro amostral.
(Amostras de mesmo tamanho fazem a ANOVA mais robusta a desvios da regra da
igualdade dos desvios padro .)

Os nematides afetam o crescimento das plantas?


Crescimento das plantas
0 nematide
10,8
9,1
13,5
1000 nematides 11,1
11,1
8,2
5000 nematides
5,4
4,6
7,4
10000 nematides 5,8
5,3
3,2

9,2
11,3
5,0
7,5

10,65
10,425
5,6
5,45

2,053
1,486
1,244
1,771

Condies necessrias:
Varincias iguais: verifique se o maior si no mais que duas vezes o
menor si
maior si = 2,053; menor si = 1,244
Amostras aleatrias simples independentes
Quatro grupos obviamente independentes
Distribuies aproximadamente normais
difcil de assegurar a normalidade com
somente quatro pontos por condio. Mas, os
vasos em cada grupo so idnticos, e no
existe razo para suspeitar de distribuies
assimtricas.

si

Sada do Excel para a ANOVA de um fator


Menu/Tools/DataAnalysis/AnovaSingleFactor
Anova: Single Factor
SUMMARY
Groups
0 nematode
1,000 nematodes
5,000 nematodes
10,000 nematodes

numerador
denominador

Count
4
4
4
4

ANOVA
Source of variation
Between Groups
Within Groups

SS
100.647
33.3275

Total

133.974

Sum
Average
42.6
10.65
41.7 10.425
22.4
5.6
21.8
5.45

df

Variance
4.21667
2.20917
1.54667
3.13667

MS
F
P-value
3 33.549 12.0797 0.0006
12 2.77729

F crit
3.4902996

15

Aqui, o valor F calculado (12,08) maior que o Fcritco (3,49) para 0,05.
Assim, o teste significativo com 5% Not all mean seedling lengths
are the same; nematode amount is an influential factor.

Sada do SPSS para a ANOVA de um fator


Descriptives
SeedlingLength

N
0
1000
5000
10000
Total

4
4
4
4
16

Mean
10.6500
10.4250
5.6000
5.4500
8.0313

Std. Deviation
2.05345
1.48633
1.24365
1.77106
2.98858

Std. Error
1.02673
.74316
.62183
.88553
.74715

95% Confidence Interval for


Mean
Lower Bound Upper Bound
7.3825
13.9175
8.0599
12.7901
3.6211
7.5789
2.6318
8.2682
6.4387
9.6238

ANOVA
SeedlingLength
Sum of
Squares
Between Groups 100.647
Within Groups
33.328
Total
133.974

df

Mean Square
3
33.549
12
2.777
15

F
12.080

Sig.
.001

A ANOVA encontrou que a quantidade de nematides


nos vasos significantivamente influencia o crescimento
das plantas.
O grfico sugere que a quantidade de nematides
acima de 1000 por vaso danosa ao crescimento das
plantas.

Minimum
9.10
8.20
4.60
3.20
3.20

Maximum
13.50
11.30
7.40
7.50
13.50

Usando a tabela D
A distribuio F assimtrica e tem 2 dois graus de liberdade distintos.
Isto foi descoberto por Fisher, sendo conhecido por "F".
Novamente o que devemos fazer calcular o valor de F para os dados
amostrais, e ento olhar a rea correspondente sob a curva na tabela D.

dfnum = I 1

Para df: 5,4

dfden
=
N I

ANOVA
Source of Variation SS
df MS
F
P-value
F crit
Between Groups
101
3 33.5 12.08 0.00062 3.4903
Within Groups
33.3 12 2.78
Total

134

15

Fcritical para 5% 3,49

F = 12,08 > 10,80


Assim p < 0,001

Influncia do fumo no sono


Um estudo do efeito de fumar classifica os indivduos como no fumantes,
fumantes moderados e fumantes inveterados. Os pesquisadores entrevistaram
200 pessoas de uma amostra aleatria e perguntaram quantas horas voc
dorme em uma noite tpica?"

1. Plano de estudo?

1. Isto um estudo observacional.


Varivel explicativa: fumante -- 3 nveis: no
fumantes, fumantes moderados, fumantes
inveterados
Varivel de resposta: # horas de sono por noite

2. Hipteses?
2. H0: Todas 3 i iguais (versus nem todas iguais)
3. Suposies daANOVA?
4. Graus de liberdade?

3. Trs AAS obviamente independentes. Tamanho


da amostra de 200 deve acomodar qualquer desvio
da normalidade. Teste smin/smax.
4. I = 3, n1 = n2 = n3 = 200, e N = 600,
portanto, existem I - 1 = 2 (numerador) e N - I =
597 (denominador) graus de liberdade.

Preparao do Iogurte e o sabor


Iogurte pode ser preparado usando trs mtodos comerciais
diferentes: tradicional, ultra-filtrao e osmose reversa.
Para estudar o efeito destes mtodos no sabor, um experimento foi
planejado onde trs bateladas de iogurte foram preparadas por cada
um dos trs mtodos. Um provador experiente testou as 9 amostras,
apresentadas em ordem aleatria e atribuiu notas em uma escala de 1
a 10.
Variveis, hipteses, suposies, clculos?
Tabela da ANOVA
Fonte de Variao
Entre os Grupos
Dentro dos Grupos
Total

SS

df

17,3 I-1=2
4,6 N-I=6
17,769

MS
8,65
0,767

F
11,283

P-value

F crit

Dfnum = I - 1

Dfden
=
N-I

Вам также может понравиться