Вы находитесь на странице: 1из 22

Comparacin de

varios tratamientos o grupos


Sir Ronald Fisher
1890 Inglaterra - 1962 ustralia
Rothamsted gricultural !"periment Station# Fue el primer
instituto de investigacin en agricultura del Reino Unido. Fundado
en 1837 para estudiar los efectos de la nutricin y los tipos de suelos
en la fertilidad de las plantas. Fisher trabaj en Rothamsted donde
hio contribuciones en estad!stica" en particular en dise#o y an$lisis
de e%perimentos" y en gen&tica. 'n dise#o de e%perimentos introdujo
el concepto de aleatoriacn y de an$lisis de variana. http())***+
gap.dcs.st+and.ac.u,)-history).athematicians)Fisher.html
$%& '$al(sis %) &riance*
$%& simple+ de un )actor+ de una v,a 'one
-a( $%&*
Caso 1. Un m&dico /uiere comparar la efectividad de
tres tratamientos para reducir el colesterol de pacientes
con altos niveles de colesterol sangu!neo. 0e asignan
aleatoriamente 12 individuos a los tres tratamientos 342
en cada uno5 y se registra la reduccin de colesterol de
cada paciente.
Caso 2. Una ecloga est$ interesada en comparar la
concentracin de cadmio en 6 r!os. Recolecta 62
muestras de agua 312 muestras en cada r!o5 y mide la
concentracin de cadmio.
'n cada uno de los casos" describa(
a5 7cu$l es el dise#o de la investigacin8
b5 7cu$l es la variable respuesta8
c5 7cu$l es el factor o variable e%plicativa8
d5 7cu$ntos niveles tiene cada factor8
'l caso 1 se analiar$ mediante un an$lisis de variana
de un factor con 3 niveles.
'l caso 4 se analiar$ mediante un an$lisis de variana
de un factor con 6 niveles.
/%0/!S
Un agricultor /uiere comparar el efecto de tres
fertiliantes 39" : y ;5 en el crecimiento de sus plantas
de tomate. 0eleccion 16 plantas de tomate de una
semana y las plant en diferentes maceteros. 9sign
aleatoriamente los 3 fertiliantes y se los administr a
las plantas por <6 d!as. =a figura muestra la altura de las
plantas en cent!metros seg>n cada fertiliante.
30
35
40
45
50
0 1 2 3 4
Fertilizantes
A
l
t
u
r
a

(
c
m
s
)
1/%S. 9ltura de plantas de tomates tratadas
con distintos fertiliantes
Fertilizantes
A B C
31 41 35
32 42 36
36 43 36
38 44 37
39 46 38
21e 3u4 manera podr,amos comparar estos
tres tratamientos5
=a respuesta natural ser!a comparar cada par de
tratamientos o grupos con una prueba t para
muestras independientes.
6ro7lema de comparaciones m8ltiples.
0i tenemos < grupos ser$n(

comparaciones
posibles.
4 1 1
4 1 2
(
(

=
H
H
3 1 1
3 1 2
(
(

=
H
H
< 1 1
< 1 2
(
(

=
H
H
?2"26 ?2"26 ?2"26
3 4 1
3 4 2
(
(

=
H
H
< 4 1
< 4 2
(
(

=
H
H
< 3 1
< 3 2
(
(

=
H
H
?2"26 ?2"26 ?2"26
9 medida /ue aumenta el n>mero de grupos" no
podemos garantiar /ue se mantenga el nivel
de significacin.
@ara solucionar este problema es /ue hacemos
primero una pregunta glo7al y dependiendo
del resultados seguimos investigando pares de
grupos.
Comparando medias mediante $%&.
0e tienen , muestras aleatorias independientes(



( ) "
1
N

( ) "
4
N

( ) "
k
N

@oblacin 1 @oblacin 4 @oblacin k
m.a.s.


tama#o
m.a.s.

n
4

tama#o
m.a.s.

n
k

tama#o
n
1
...
Nota: 9sumimos /ue la desviacin est$ndar
poblacional de cada grupo es igual a

3homocedasticidad5.
9I6%/!SIS :;%<;
Usaremos

i para representar la media del grupo i"


entonces estaremos interesados en probar la siguiente
hiptesis(
. iguales son no medias dos menos al (
... (
1
4 1 2
H
H
k
= = =
Ar$ficamente(
Normal

= = =
= 1 2
H . las medias poblacionales son iguales
o
Normal

=
1 2
H . al menos una media es diferente
1
Normal

=
/%0/!S continuacin
Biptesis de inter&s(
. iguales son no medias dos menos al (
(
1
3 4 1 2
H
H = =
;on un nivel de significacin ?2"26
Catos(
N Media
Desviacin
tpica
A 5 35.20 3.564
B
5 43.20 1.924
C
5 36.40 1.140
Tota
15 38.27 4.284
Dotacin en las 3 muestras 3i?1"4"35(
i
n n
1 4
n
3
n
i
y
1
y
4
y
3
y
i
s
1
s
4
s
3
s
Fuentes de variacin
'ste an$lisis lleva el nombre de E9n$lisis de varianaF
por/ue para comparar las medias de los grupos o
tratamientos necesitamos identificar las distintas
)uentes de varia7ilidad#
1. =a variabilidad de la variable respuesta se conoce
como varia7ilidad total.
4. =a variabilidad de la variable respuesta" atribuida a
factores espec!ficos o tratamientos" se conoce
como varia7ilidad e"plicada. .ide la variabilidad
entre los diferentes grupos.
3. =a variabilidad de la variable respuesta de las
unidades 3e%perimentales5 dentro de cada nivel del
factor se conoce como varia7ilidad no-e"plicada.
&aria7ilidad total >
varia7ilidad e"plicada ? varia7ilidad no e"plicada
'n el ejemplo de los tomates distinga las fuentes de
variacin.
30
35
40
45
50
0 1 2 3 4
Fertilizantes
A
l
t
u
r
a

(
c
m
s
)
@ara docimar la hiptesis glo7al acerca de las medias
usaremos el test estad,stico F. 'ste test contrasta la
variabilidad entre los grupos con la variabilidad natural
dentro de los grupos.
muestras las de C'DGRH ad variabilid
muestrales medias las 'DGR' ad variabilid
= F
6ensemos
Caso ( 0i las medias muestrales son e%actamente
iguales" 7cu$l ser$ el numerador del test F8
Case <. 0i las medias muestrales son muy distintas
entre los grupos" 7como ser$ la variabilidad
'DGR' comparada con el caso 98
7Iu& valores puede tener el estad!stico F8
7F puede ser negativo8
7Iu& tipo de valores de F ser$n a favor de la hiptesis
alternativa8
0edias cuadr@ticas
'l test estad!stico correspondiente al 9DHJ9 es la
ran entre dos medidas de variacin de los datos
muestrales.
MCD
MCE
F = =
muestras las de C'DGRH ad variabilid
muestrales medias las 'DGR' ad variabilid
'stas dos medidas de variacin se llaman medias
cuadr@ticas" as! en el numerador tendemos la media
cuadr$tica !$/R! los grupos 3.;'5 y en el
denominador la media cuadr$tica 1!$/R% de los
grupos 3.;C5.
'ntre m$s grande sea la variacin !$/R! las medias
muestrales comparada con la variacin natural
1!$/R% de las muestras" mayor evidencia a favor de
diferencias entre las medias poblacionales.
0lo valores grandes del test estad!stico nos sirven para
rechaar la hiptesis nula" por lo tanto los test F de
9DHJ9 son unilaterales 3de una cola5 con la direccin
del e%tremo hacia la derecha.
'l valor p ser$ la probabilidad de observar un test
estad!stico tan o m$s grande bajo la hiptesis nula.
1istri7ucin F de Fisher
:ajo
2
H
el test estad!stico F /ue se calcula en el
9DHJ9 tiene una distribucin F de Fisher con 3,+1" n+
,5 grados de libertad.
Dotacin(
5 " 1 3 - k n k F F
Caracter,sticas.
=a distribucin es sesgada a la derecha
0us valores son positivos" empiean en cero y se
e%tienden hasta infinito
=a curva de la distribucin /ueda definida por los
grados de libertad del numerador y del denominador

:RFIC%S
0e muestran dos gr$ficos de caja. ;ada uno representa
el resultado de sacar 3 muestras aleatorias
independientes de tres poblaciones normales. 7'n cu$l
de los dos gr$ficos cree usted /ue podemos rechaar la
hiptesis nula
3 4 1 2
( = = H
8
Respuesta
Arupo 1 Arupo 4
Arupo 3
Respuesta
Arupo 1 Arupo 4
Arupo 3
Cmo calculamos F
;uando tenemos una muestra aleatoria de una poblacin
con variana desconocida
4
" vamos a estimar esta
variana con la variana muestral s
2
. =a variana
muestral se calcula tomando la suma de los cuadrados
de las desviaciones a la media y dividiendo por los
grados de libertad 3n+15.
=as dos medidas de variabilidad en 9DHJ9" .;' y
.;C tienen la misma forma.
3gl5 libertad de Arados
30;5 cuadrados de 0uma
cuadr$tica .edia =
;ada muestra aleatoria" una por cada , poblaciones"
tiene su media muestral y su variana muestral
representados por(
k
y y y "..." "
4 1
y
4 4
4
4
1
"..." "
I
s s s
.
&ariacin !$/R! grupos.
:ajo la hiptesis nula" las medias poblacionales son
iguales. 0i la hiptesis nula fuera cierta" ser!a raonable
promediar todas las observaciones para tener una
estimacin de la media de la poblacin. =a media
muestral com>n ser!a(
n
y n y n y n
y
k k
+ + +
=

4 4 1 1
=a media cuadr$tica 'DGR' los grupos o media
cuadr$tica de los tratamientos se calcula como(
1
=
k
SCE
MCE
donde la suma de cuadrados 'DGR' 30;'5 se calcula
como(
( ) ( ) ( ) ( )
( )( )

=
= + + + =
grupos
grupos
i i k k
y y n y y n y y n y y n SCE
4
4 4 4
4 4
4
1 1
conjunta muestral media grupo muestral media grupo muestra tama#o

&ariacin 1!$/R% de los grupos.


Uno de los supuestos de 9DHJ9 es /ue las ,
poblaciones tienen la misma variana. ;ada una de las
variana muestrales es un estimador de la variana
com>n
4
" independiente de si la hiptesis nula es cierta.
=os grados de libertad de cada variana muestral es" n
i
K
1. =a .;C esencialmente combina las variana
muestrales para obtener un estimador de
4
. =a media
cuadr$tica dentro" es tambi&n llamada la media
cuadr$tica del error. 'l denominador del estad!stico F
es(
k n
SCD
MCD

=
donde la suma de cuadrados C'DGRH de los grupos se
calcula(
( ) ( ) ( ) ( )
( ) ( )

=
= + + + =
grupos
grupos
i i k k
s n s n s n s n SCD
grupo muestral variana 1 + grupo muestral tama#o
1 1 1 1
4 4 4
4 4
4
1 1

Dote /ue esta cantidad es una e%tensin de la
estimacin combinada de la variana empleada para la
prueba t de 4 muestras(
( ) ( ) ( )
k n n n
s n s n s n
s
k
k k
p
+ + +
+ + +
=


4 1
4 4
4 4
4
1 1 4
1 1 1
0idiendo la variacin /%/;.
'n 9DHJ9 de una v!a" la variana total de todas las
observaciones esta dada por la suma de cuadrados total"
0;G" /ue mide la variacin de cada observacin a la
media muestral de todas las observaciones.
( ) ( )

= =
nes observacio nes observacio
ij
y y SCT
4

4
muestral media + n observaci
=a variacin total puede ser particionada entre las dos
fuentes de variacin entre y dentro. =a relacin entre las
sumas de cuadrados es(
SCD SCE SCT + =
.
0i se tienen dos de las sumas de cuadrados" se obtiene la
tercera f$cilmente.
/a7la $%&
Godo esto se resume en la tabla de 9n$lisis de Jariana"
en /ue se presentan las fuentes de variacin" los grados
de libertad" las sumas de cuadrados y las medias
cuadr$ticas correspondientes.
/<; 1! $;ISIS 1! &RI$A
Fuente de
variacin
gl
:rados de
li7ertad
SC
Suma de
Cuadrados
0C
0edias
cuadr@ticas
F
'ntre
tratamientos
1 k
( )

=
=
k
i
i i
y y n SCE
1
4
1 k
SCE
MCD
MCE
F =
Centro de
tratamientos
k n
( )

=
=
n
i
i i
s n SCD
1
4
1
k n
SCD

Gotal
1 n
( )

=
=
n
i
ij
y y SCT
1
4
TOMATES continuacin.
- Realice los c$lculos para docimar la hipotesis de inter&s del
agricultor. ;ompruebe sus resultados con tabla salida del
0@00.
- ;ompruebe la relacin entre las sumas de cuadrados y la de
los grados de libertad.
- 'scriba su conclusin para el agricultor.
ANOVA ALTUA TOMATES

"#$a de
c#ad%ados &
Media
c#ad%'tica ( "i&.
)nte%*&%#pos 186.133 2 93.067 15.774 .000
)nt%a*&%#pos 70.800 12 5.900
Tota 256.933 14
N Media Desviacin tpica
A 5 35.20 3.564
B 5 43.20 1.924
C 5 36.40 1.140
Tota 15 38.27 4.284

Вам также может понравиться