Академический Документы
Профессиональный Документы
Культура Документы
=
H
H
3 1 1
3 1 2
(
(
=
H
H
< 1 1
< 1 2
(
(
=
H
H
?2"26 ?2"26 ?2"26
3 4 1
3 4 2
(
(
=
H
H
< 4 1
< 4 2
(
(
=
H
H
< 3 1
< 3 2
(
(
=
H
H
?2"26 ?2"26 ?2"26
9 medida /ue aumenta el n>mero de grupos" no
podemos garantiar /ue se mantenga el nivel
de significacin.
@ara solucionar este problema es /ue hacemos
primero una pregunta glo7al y dependiendo
del resultados seguimos investigando pares de
grupos.
Comparando medias mediante $%&.
0e tienen , muestras aleatorias independientes(
( ) "
1
N
( ) "
4
N
( ) "
k
N
@oblacin 1 @oblacin 4 @oblacin k
m.a.s.
tama#o
m.a.s.
n
4
tama#o
m.a.s.
n
k
tama#o
n
1
...
Nota: 9sumimos /ue la desviacin est$ndar
poblacional de cada grupo es igual a
3homocedasticidad5.
9I6%/!SIS :;%<;
Usaremos
= = =
= 1 2
H . las medias poblacionales son iguales
o
Normal
=
1 2
H . al menos una media es diferente
1
Normal
=
/%0/!S continuacin
Biptesis de inter&s(
. iguales son no medias dos menos al (
(
1
3 4 1 2
H
H = =
;on un nivel de significacin ?2"26
Catos(
N Media
Desviacin
tpica
A 5 35.20 3.564
B
5 43.20 1.924
C
5 36.40 1.140
Tota
15 38.27 4.284
Dotacin en las 3 muestras 3i?1"4"35(
i
n n
1 4
n
3
n
i
y
1
y
4
y
3
y
i
s
1
s
4
s
3
s
Fuentes de variacin
'ste an$lisis lleva el nombre de E9n$lisis de varianaF
por/ue para comparar las medias de los grupos o
tratamientos necesitamos identificar las distintas
)uentes de varia7ilidad#
1. =a variabilidad de la variable respuesta se conoce
como varia7ilidad total.
4. =a variabilidad de la variable respuesta" atribuida a
factores espec!ficos o tratamientos" se conoce
como varia7ilidad e"plicada. .ide la variabilidad
entre los diferentes grupos.
3. =a variabilidad de la variable respuesta de las
unidades 3e%perimentales5 dentro de cada nivel del
factor se conoce como varia7ilidad no-e"plicada.
&aria7ilidad total >
varia7ilidad e"plicada ? varia7ilidad no e"plicada
'n el ejemplo de los tomates distinga las fuentes de
variacin.
30
35
40
45
50
0 1 2 3 4
Fertilizantes
A
l
t
u
r
a
(
c
m
s
)
@ara docimar la hiptesis glo7al acerca de las medias
usaremos el test estad,stico F. 'ste test contrasta la
variabilidad entre los grupos con la variabilidad natural
dentro de los grupos.
muestras las de C'DGRH ad variabilid
muestrales medias las 'DGR' ad variabilid
= F
6ensemos
Caso ( 0i las medias muestrales son e%actamente
iguales" 7cu$l ser$ el numerador del test F8
Case <. 0i las medias muestrales son muy distintas
entre los grupos" 7como ser$ la variabilidad
'DGR' comparada con el caso 98
7Iu& valores puede tener el estad!stico F8
7F puede ser negativo8
7Iu& tipo de valores de F ser$n a favor de la hiptesis
alternativa8
0edias cuadr@ticas
'l test estad!stico correspondiente al 9DHJ9 es la
ran entre dos medidas de variacin de los datos
muestrales.
MCD
MCE
F = =
muestras las de C'DGRH ad variabilid
muestrales medias las 'DGR' ad variabilid
'stas dos medidas de variacin se llaman medias
cuadr@ticas" as! en el numerador tendemos la media
cuadr$tica !$/R! los grupos 3.;'5 y en el
denominador la media cuadr$tica 1!$/R% de los
grupos 3.;C5.
'ntre m$s grande sea la variacin !$/R! las medias
muestrales comparada con la variacin natural
1!$/R% de las muestras" mayor evidencia a favor de
diferencias entre las medias poblacionales.
0lo valores grandes del test estad!stico nos sirven para
rechaar la hiptesis nula" por lo tanto los test F de
9DHJ9 son unilaterales 3de una cola5 con la direccin
del e%tremo hacia la derecha.
'l valor p ser$ la probabilidad de observar un test
estad!stico tan o m$s grande bajo la hiptesis nula.
1istri7ucin F de Fisher
:ajo
2
H
el test estad!stico F /ue se calcula en el
9DHJ9 tiene una distribucin F de Fisher con 3,+1" n+
,5 grados de libertad.
Dotacin(
5 " 1 3 - k n k F F
Caracter,sticas.
=a distribucin es sesgada a la derecha
0us valores son positivos" empiean en cero y se
e%tienden hasta infinito
=a curva de la distribucin /ueda definida por los
grados de libertad del numerador y del denominador
:RFIC%S
0e muestran dos gr$ficos de caja. ;ada uno representa
el resultado de sacar 3 muestras aleatorias
independientes de tres poblaciones normales. 7'n cu$l
de los dos gr$ficos cree usted /ue podemos rechaar la
hiptesis nula
3 4 1 2
( = = H
8
Respuesta
Arupo 1 Arupo 4
Arupo 3
Respuesta
Arupo 1 Arupo 4
Arupo 3
Cmo calculamos F
;uando tenemos una muestra aleatoria de una poblacin
con variana desconocida
4
" vamos a estimar esta
variana con la variana muestral s
2
. =a variana
muestral se calcula tomando la suma de los cuadrados
de las desviaciones a la media y dividiendo por los
grados de libertad 3n+15.
=as dos medidas de variabilidad en 9DHJ9" .;' y
.;C tienen la misma forma.
3gl5 libertad de Arados
30;5 cuadrados de 0uma
cuadr$tica .edia =
;ada muestra aleatoria" una por cada , poblaciones"
tiene su media muestral y su variana muestral
representados por(
k
y y y "..." "
4 1
y
4 4
4
4
1
"..." "
I
s s s
.
&ariacin !$/R! grupos.
:ajo la hiptesis nula" las medias poblacionales son
iguales. 0i la hiptesis nula fuera cierta" ser!a raonable
promediar todas las observaciones para tener una
estimacin de la media de la poblacin. =a media
muestral com>n ser!a(
n
y n y n y n
y
k k
+ + +
=
4 4 1 1
=a media cuadr$tica 'DGR' los grupos o media
cuadr$tica de los tratamientos se calcula como(
1
=
k
SCE
MCE
donde la suma de cuadrados 'DGR' 30;'5 se calcula
como(
( ) ( ) ( ) ( )
( )( )
=
= + + + =
grupos
grupos
i i k k
y y n y y n y y n y y n SCE
4
4 4 4
4 4
4
1 1
conjunta muestral media grupo muestral media grupo muestra tama#o
=
donde la suma de cuadrados C'DGRH de los grupos se
calcula(
( ) ( ) ( ) ( )
( ) ( )
=
= + + + =
grupos
grupos
i i k k
s n s n s n s n SCD
grupo muestral variana 1 + grupo muestral tama#o
1 1 1 1
4 4 4
4 4
4
1 1
Dote /ue esta cantidad es una e%tensin de la
estimacin combinada de la variana empleada para la
prueba t de 4 muestras(
( ) ( ) ( )
k n n n
s n s n s n
s
k
k k
p
+ + +
+ + +
=
4 1
4 4
4 4
4
1 1 4
1 1 1
0idiendo la variacin /%/;.
'n 9DHJ9 de una v!a" la variana total de todas las
observaciones esta dada por la suma de cuadrados total"
0;G" /ue mide la variacin de cada observacin a la
media muestral de todas las observaciones.
( ) ( )
= =
nes observacio nes observacio
ij
y y SCT
4
4
muestral media + n observaci
=a variacin total puede ser particionada entre las dos
fuentes de variacin entre y dentro. =a relacin entre las
sumas de cuadrados es(
SCD SCE SCT + =
.
0i se tienen dos de las sumas de cuadrados" se obtiene la
tercera f$cilmente.
/a7la $%&
Godo esto se resume en la tabla de 9n$lisis de Jariana"
en /ue se presentan las fuentes de variacin" los grados
de libertad" las sumas de cuadrados y las medias
cuadr$ticas correspondientes.
/<; 1! $;ISIS 1! &RI$A
Fuente de
variacin
gl
:rados de
li7ertad
SC
Suma de
Cuadrados
0C
0edias
cuadr@ticas
F
'ntre
tratamientos
1 k
( )
=
=
k
i
i i
y y n SCE
1
4
1 k
SCE
MCD
MCE
F =
Centro de
tratamientos
k n
( )
=
=
n
i
i i
s n SCD
1
4
1
k n
SCD
Gotal
1 n
( )
=
=
n
i
ij
y y SCT
1
4
TOMATES continuacin.
- Realice los c$lculos para docimar la hipotesis de inter&s del
agricultor. ;ompruebe sus resultados con tabla salida del
0@00.
- ;ompruebe la relacin entre las sumas de cuadrados y la de
los grados de libertad.
- 'scriba su conclusin para el agricultor.
ANOVA ALTUA TOMATES
"#$a de
c#ad%ados &
Media
c#ad%'tica ( "i&.
)nte%*&%#pos 186.133 2 93.067 15.774 .000
)nt%a*&%#pos 70.800 12 5.900
Tota 256.933 14
N Media Desviacin tpica
A 5 35.20 3.564
B 5 43.20 1.924
C 5 36.40 1.140
Tota 15 38.27 4.284