Академический Документы
Профессиональный Документы
Культура Документы
ANALISIS DE VARIANZA
Mg. Ysela Agero Palacios
Profesora Principal/UNMSM
ANALISIS DE VARIANZA
El anlisis de varianza es una tcnica estadstica que tiene bastante
aplicacin en el anlisis de datos derivados de experimentos y se
utiliza para cumplir dos objetivos:
1. Probar hiptesis de respecto a las varianzas de las poblaciones
2. Probar hiptesis de comparacin de medias de tres o ms
poblaciones (Este uso fue visto en clases pasadas).
En esta parte del curso estudiaremos las aplicaciones del anlisis
de varianza a los datos resultantes de los diseos experimentales
ms comunes:
-Diseo completamente aleatorizado.
-Diseos por bloques completos y aleatorizados
-Experimentos factoriales
Bloque II
Bloque III
Tratamiento
B
Tratamiento
A
Tratamiento
C
Tratamiento
A
Tratamiento
C
Tratamiento
B
Tratamiento
C
Tratamiento
B
Tratamiento
A
DISEO FACTORIAL
Ejemplo : Diseo factoria 22
FACTOR B
FACTOR A
B1
B2
A1
y11
y12
A2
y21
y22
DISEO COMPLETAMENTE
ALEATORIZADO DE UNA VIA
CON EFECTOS FIJOS
ANOVA DE UN FACTOR
El tipo ms simple de anlisis de varianza es el que se conoce
como ANOVA de un factor, en el cual se investiga una sola
fuente de variacin.
EJEMPLO 1
Un ingeniero qumico esta estudiando un polmero
recientemente desarrollado para que sea utilizado en la
eliminacin de los residuos txicos del agua. Los experimentos
se realizan a cinco temperaturas diferentes. La respuesta
observada es el porcentaje de impurezas eliminadas por el
tratamiento.
ANOVA DE UN FACTOR
EJEMPLO 2
Uno de los focos de contaminacin del agua lo constituyen los
vertidos industriales y agrcolas ricos en fosforo. Demasiado
fosforo puede causar una explosin en el crecimiento de plantas y
microorganismos, a lo que se denomina afloramiento.
Se realiz un estudio para determinar el nivel de fosforo en los
cuatro lagos principales de una determinada regin, por extraccin
y anlisis de muestras de agua. Se piensa que uno de los lagos se
esta viendo excesivamente contaminado por los vertidos de una
planta industrial prxima y se espera que, comparando el nivel de
fosforo de este lago con el de los otros, esto se demuestre.
OBSERVACINES
1.Si bien los ejemplos anteriores tienen diseos de investigacin
distintos (el primero es experimental y el segundo es
observacional), se asemejan en que cada uno produce k muestras
con medias 1,2,...,k, , respectivamente. El propsito del
estudio en cada caso es comparar medias poblacionales y por lo
tanto, representan la extensin natural del problema de
comparacin de las medias de dos muestras independientes.
2. El termino diseo completamente aleatorizado se refiere a
que no se ha realizado ningn intento de emparejar unidades
experimentales de las distintas muestras. Las k muestras son
independientes unas de otras.
OBSERVACINES
3. El termino efectos fijos expresa que el experimentador
selecciona especficamente los niveles del factor
implicados, porque considera que estos tienen un inters
especial. No se seleccionan aleatoriamente de un grupo
mas grande de niveles posibles.
ANOVA DE UN FACTOR
En general, se describen del modo siguiente:
Tenemos una coleccin de n unidades experimentales y
queremos estudiar el efecto de k tratamientos diferentes.
Estas unidades son divididas aleatoriamente en k grupos de
tamaos n1, n2,,nk y cada subgrupo recibe un tratamiento
diferente y se anota la respuesta.
A los k subgrupos se les considera muestras aleatorias
independientes de tamaos n1,n2,,nk extradas de poblaciones
con respuestas medias 1,2,...,k, respectivamente.
Queremos contrastar la hiptesis nula de que los tratamientos
tienen el mismo efecto medio:
ANOVA DE UN FACTOR
Otra situacin puede ser la siguiente:
Tenemos k poblaciones, cada una identificable por alguna
caracterstica comn que ser estudiada.
De cada una de las k poblaciones, se seleccionan, muestras
aleatorias independientes de tamaos n1, n2,..., nk,
respectivamente.
Cada muestra recibe el mismo tratamiento, y cualquier
diferencia observada en las respuestas medidas se atribuye a
diferencias (aleatorias y/o sistemticas) entre las k
poblaciones.
Queremos contrastar la hiptesis nula de que los
tratamientos tienen el mismo efecto medio
ANOVA DE UN FACTOR
En ambas situaciones las hiptesis son:
(no hay diferencia en las medias
de las k poblaciones)
para algn i y j
las otras
yi j i i j ;
i 1,..., n j ; j 1,...., k
: Media general.
Supuestos
1. Las k muestras representan muestras aleatorias independientes
extradas de k poblaciones especificas con medias 1,2,...,k
(constantes desconocidas)
2. Cada una de las k poblaciones es normal. con media cero y con la
misma varianza 2 (constante).
Los datos
recogidos en un
experimento de un
nico factor ( o
las muestras de k
subpoblaciones)
se registran en el
siguiente formato:
:::
y11
y21
y31
:::
yk1
y12
Y22
y32
:::
yk2
y13
y23
y33
:::
yk3
:::
:::
:::
:::
y1n1
y2,n2
:::
yknk
y3n3
Fuentes de
variacin
Factor
SC Factor
CM fa c tor
k-1
CM Factor
CM residual
Residual
Total
n-k
SC Residual
n-1
SC Total
CM Residual
Ejemplo
Se sabe que se ha arrojado material toxico a un rio que entra en una gran rea
de pesca comercial en agua salada. Los ingenieros civiles han estudiado la
forma en que el agua transporta el material toxico, midiendo la cantidad de
material (en partes por milln) hallado en las ostras recogidas en tres lugares
diferentes, desde la salida del estuario hasta la baha donde se realiza la
mayor parte de la pesca comercial. A continuacin, se presentan los resultados:
El test pos hoc indica que la cantidad de material (ppm) hallado en las
ostras recogidas en el estuario y cerca de la baha son similares y son
significativamente mayores que en el lugar lejos de la baha
i 1,..., k ; j 1,...., b
: Media general.
i : Efecto del i-esimo nivel de factor A.
Supuestos
1. Las k muestras representan muestras aleatorias independientes
extradas de k poblaciones especificas con medias 1,2,...,k
(constantes desconocidas)
2. Cada una de las k poblaciones es normal. con media cero y con la
misma varianza 2 (constante).
Bloque 2
Bloque 3
:::
Bloque b
y11
y21
y31
:::
yk1
y12
Y22
y32
:::
yk2
:::
:::
:::
:::
y1k
y2,k
:::
ybk
y3k
Fuentes de
variacin
Factor
Bloques
Residual
Total
SC Factor
CM Factor
SC Bloques
CM Bloques
F
CM fa c tor
CM residual
CM Bloques
CM residual
(k-1)(b-1)
SC Residual
bk-1
SC Total
CM Residual
Ejemplo
Xij : numero de kilocaloras consumidas por kilometro recorrido al
realizar la i-esima actividad (correr, caminar, pedalear) por la
isima persona (bloque) .
F DE ACTIVIDAD=49,298
ERROR CUADRATICO MEDIO= 0,045
F DE ACTIVIDAD=79,897
ERROR CUADRATICO MEDIO= 0,028
DISEO FACTORIAL
DISEO FACTORIAL
Muchos experimentos se llevan a cabo para estudiar los efectos
producidos por dos o ms factores.
Por diseo factorial se entiende aquel en el que se investigan
todas las posibles combinaciones de los niveles de los factores
en cada ensayo completo o rplica del experimento. Por ejemplo
si de tienen dos factores A con 2 niveles y B con 2 niveles,
entonces cada rplica del experimento contiene todas las 2x2
combinaciones de los tratamientos.
Los diseos factoriales son los mas eficientes para este tipo de
situaciones.
El efecto de un factor se define como el cambio en la respuesta
producido por un cambio en el nivel del factor. A esto se le
conoce como efecto principal
DISEO FACTORIAL
El efecto de un factor se define como el cambio en la respuesta
producido por un cambio en el nivel del factor. A esto se le conoce
como efecto principal, porque se refiere a los efectos de inters
principal en el experimento.
En algunos experimentos puede encontrarse que la diferencia en
la respuesta entre los niveles de un factor no es la misma en
todos los niveles de los otros factores considerados en el modelo.
Cuando esto ocurre se dice que existe una interaccin entre los
factores.
Experimento factorial
b 21
b2 1
b11
b11
a 11
a21
a1
sin interaccin
a2
Con interaccin
DISEO FACTORIAL
El modelo para el diseo de factorial es
yijk i j ij ijk ;
: Media general.
i : Efecto del i-esimo factor A.
i : Efecto del jsimo factor B.
ik : Efecto de la interaccin de A y B
ij : Error aleatorio de la (i,j,k) esima observacin
DISEO FACTORIAL
Estructura de los datos de un diseo con 2 factores con k tratamientos
FACTOR
B
1
FACTOR A
1
y111,,y11n
y1.
Medias
:::
:::
:::
y1ik,,y1ik,,
:::
y1a1,,y1an
:::
:::
:::
:::
yi .
:::
:::
yi11, , yi1n
:::
yij1,,yijn
:::
yia1, , yian
yb.
:::
:::
:::
:::
:::
:::
:::
b
Medias
yb11,,yb1n
y .1
:::
ybIJ, , ybjn
y.j
:::
yba1,,yban
y .a
y ..
DISEO FACTORIAL
Tabla de anlisis de varianza
Fuentes de
variacin
Grados de
libertad
Suma de
cuadrados
Cuadrados
medio
Factor A
a-1
SCA
CMA
CMA/CMresidual
Factor B
b-1
SC B
CMB
CMB/CMresidual
Interaccin
(a-1) (b-1)
SCAB
CM AB
CMAB/CMresidual
Ab(n-1)
SCresidual
CM residual
Residuos
Total
abn-1
DISEO FACTORIAL
Se realiza un estudio para averiguar la madurez emocional de 27 varones
jvenes mayores de edad, clasificados segn grado de instruccin
DISEO FACTORIAL
Modelo de efectos principales
yij i j ij ;
i 1,..., a ; j 1,...., b
DISEO FACTORIAL
Modelo de efectos principales con interaccin
DISEO FACTORIAL
Modelo de efectos principales con interaccin
yijk i j ij ijk ;