Вы находитесь на странице: 1из 47

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

(Universidad del Per, DECANA DE AMRICA)

FACULTAD DE CIENCIAS BIOLGICAS

ANALISIS DE VARIANZA
Mg. Ysela Agero Palacios
Profesora Principal/UNMSM

ANALISIS DE VARIANZA
El anlisis de varianza es una tcnica estadstica que tiene bastante
aplicacin en el anlisis de datos derivados de experimentos y se
utiliza para cumplir dos objetivos:
1. Probar hiptesis de respecto a las varianzas de las poblaciones
2. Probar hiptesis de comparacin de medias de tres o ms
poblaciones (Este uso fue visto en clases pasadas).
En esta parte del curso estudiaremos las aplicaciones del anlisis
de varianza a los datos resultantes de los diseos experimentales
ms comunes:
-Diseo completamente aleatorizado.
-Diseos por bloques completos y aleatorizados
-Experimentos factoriales

DISEO COMPLETAMENTE ALEATORIZADO


DE UNA VIA CON EFECTOS FIJOS.

Fuente: Bioestadstica de Daniel.

DISEO POR DE BLOQUES COMPLETOS


ALEATORIZADOS
Ejemplo: Diseo de bloques y un factor con 3 tratamientos.
Bloque I

Bloque II

Bloque III

Tratamiento
B

Tratamiento
A

Tratamiento
C

Tratamiento
A

Tratamiento
C

Tratamiento
B

Tratamiento
C

Tratamiento
B

Tratamiento
A

DISEO FACTORIAL
Ejemplo : Diseo factoria 22
FACTOR B
FACTOR A

B1

B2

A1

y11

y12

A2

y21

y22

DISEO COMPLETAMENTE
ALEATORIZADO DE UNA VIA
CON EFECTOS FIJOS

ANOVA DE UN FACTOR
El tipo ms simple de anlisis de varianza es el que se conoce
como ANOVA de un factor, en el cual se investiga una sola
fuente de variacin.
EJEMPLO 1
Un ingeniero qumico esta estudiando un polmero
recientemente desarrollado para que sea utilizado en la
eliminacin de los residuos txicos del agua. Los experimentos
se realizan a cinco temperaturas diferentes. La respuesta
observada es el porcentaje de impurezas eliminadas por el
tratamiento.

ANOVA DE UN FACTOR
EJEMPLO 2
Uno de los focos de contaminacin del agua lo constituyen los
vertidos industriales y agrcolas ricos en fosforo. Demasiado
fosforo puede causar una explosin en el crecimiento de plantas y
microorganismos, a lo que se denomina afloramiento.
Se realiz un estudio para determinar el nivel de fosforo en los
cuatro lagos principales de una determinada regin, por extraccin
y anlisis de muestras de agua. Se piensa que uno de los lagos se
esta viendo excesivamente contaminado por los vertidos de una
planta industrial prxima y se espera que, comparando el nivel de
fosforo de este lago con el de los otros, esto se demuestre.

OBSERVACINES
1.Si bien los ejemplos anteriores tienen diseos de investigacin
distintos (el primero es experimental y el segundo es
observacional), se asemejan en que cada uno produce k muestras
con medias 1,2,...,k, , respectivamente. El propsito del
estudio en cada caso es comparar medias poblacionales y por lo
tanto, representan la extensin natural del problema de
comparacin de las medias de dos muestras independientes.
2. El termino diseo completamente aleatorizado se refiere a
que no se ha realizado ningn intento de emparejar unidades
experimentales de las distintas muestras. Las k muestras son
independientes unas de otras.

OBSERVACINES
3. El termino efectos fijos expresa que el experimentador
selecciona especficamente los niveles del factor
implicados, porque considera que estos tienen un inters
especial. No se seleccionan aleatoriamente de un grupo
mas grande de niveles posibles.

ANOVA DE UN FACTOR
En general, se describen del modo siguiente:
Tenemos una coleccin de n unidades experimentales y
queremos estudiar el efecto de k tratamientos diferentes.
Estas unidades son divididas aleatoriamente en k grupos de
tamaos n1, n2,,nk y cada subgrupo recibe un tratamiento
diferente y se anota la respuesta.
A los k subgrupos se les considera muestras aleatorias
independientes de tamaos n1,n2,,nk extradas de poblaciones
con respuestas medias 1,2,...,k, respectivamente.
Queremos contrastar la hiptesis nula de que los tratamientos
tienen el mismo efecto medio:

ANOVA DE UN FACTOR
Otra situacin puede ser la siguiente:
Tenemos k poblaciones, cada una identificable por alguna
caracterstica comn que ser estudiada.
De cada una de las k poblaciones, se seleccionan, muestras
aleatorias independientes de tamaos n1, n2,..., nk,
respectivamente.
Cada muestra recibe el mismo tratamiento, y cualquier
diferencia observada en las respuestas medidas se atribuye a
diferencias (aleatorias y/o sistemticas) entre las k
poblaciones.
Queremos contrastar la hiptesis nula de que los
tratamientos tienen el mismo efecto medio

ANOVA DE UN FACTOR
En ambas situaciones las hiptesis son:
(no hay diferencia en las medias
de las k poblaciones)

para algn i y j

(al menos una media difiere de

las otras

Donde, i denota la respuesta media de la i-esima poblacin

DISEO COMPLETAMENTE ALEATORIZADO DE


UNA VIA, CON EFECTOS FIJOS.
El modelo para el diseo es

yi j i i j ;

i 1,..., n j ; j 1,...., k

: Media general.

i : Efecto del i-esimo nivel del factor A.

ij : Error aleatorio de la (i,j) esima observacin

Supuestos
1. Las k muestras representan muestras aleatorias independientes
extradas de k poblaciones especificas con medias 1,2,...,k
(constantes desconocidas)
2. Cada una de las k poblaciones es normal. con media cero y con la
misma varianza 2 (constante).

DISEO COMPLETAMENTE ALEATORIZADO DE


UNA VIA, CON EFECTOS FIJOS.
Yij , i=1,2,; nj, j=1,2,,k : es una variable aleatoria continua,
que indica la respuesta de la i-esima unidad experimental al j simo
tratamiento. Tiene distribucin normal con media y varianza 2
constante.
Niveles del factor (o Subpoblaciones)

Los datos
recogidos en un
experimento de un
nico factor ( o
las muestras de k
subpoblaciones)
se registran en el
siguiente formato:

:::

y11

y21

y31

:::

yk1

y12

Y22

y32

:::

yk2

y13

y23

y33

:::

yk3

:::

:::

:::

:::

y1n1

y2,n2

:::

yknk

y3n3

DISEO COMPLETAMENTE ALEATORIZADO DE


UNA VIA, CON EFECTOS FIJOS.
TABLA ANOVA

Fuentes de
variacin
Factor

Grados de Suma de Cuadrados


libertad cuadrados
medio

SC Factor

CM fa c tor

k-1

CM Factor

CM residual

Residual
Total

n-k

SC Residual

n-1

SC Total

CM Residual

Ejemplo
Se sabe que se ha arrojado material toxico a un rio que entra en una gran rea
de pesca comercial en agua salada. Los ingenieros civiles han estudiado la
forma en que el agua transporta el material toxico, midiendo la cantidad de
material (en partes por milln) hallado en las ostras recogidas en tres lugares
diferentes, desde la salida del estuario hasta la baha donde se realiza la
mayor parte de la pesca comercial. A continuacin, se presentan los resultados:

MEDICIONES DE MATERIAL TXICO SEGN


LUGAR DE RECOJO DE DATOS

MEDICIONES DE MATERIAL TXICO SEGN


LUGAR DE RECOJO DE DATOS

Verificacin del supuesto de varianza constante en


cada una de las subpoblaciones.

Verificacin del supuesto de normalidad de las


mediciones de material toxico (PPM) en cada una
de las subpoblaciones

Anlisis de varianza de un factor.

El test pos hoc indica que la cantidad de material (ppm) hallado en las
ostras recogidas en el estuario y cerca de la baha son similares y son
significativamente mayores que en el lugar lejos de la baha

DISEO POR BLOQUE


COMPLETOS ALEATORIZADOS.

DISEO POR BLOQUE COMPLETOS


ALEATORIZADOS.
Ejemplo:

Se realiza un experimento para comparar la energa que se requiere


para llevar a cabo tres actividades fsicas: correr, pasear y montar
en bicicleta.
La variable de inters es
X: numero de kilocaloras consumidas por kilometro recorrido.
Se piensa que las diferencias metablicas entre los individuos
pueden afectar al numero de kilocaloras requeridas para llevar a
cabo una determinada actividad, y se pretende controlar esta
variable extraa. Para hacerlo, se seleccionan ocho individuos.

DISEO POR BLOQUE COMPLETOS


ALEATORIZADOS.
Ejemplo (continuacin)

Se le pide a cada uno que corra, camine y recorra en bicicleta una


distancia medida, y se determina para cada individuo el numero de
kilocaloras consumidas por kilometro durante cada actividad.
Las actividades se realizan en orden aleatorio, con tiempo de
recuperacin entre una y otra.
Cada individuo es utilizado como un bloque. Cada actividad se
monitoriza exactamente una vez para cada individuo y de este
modo se completa el diseo. Cualquier diferencia en el numero
medio de kilocaloras consumidas se atribuir a diferencias entre
las actividades mismas, puesto que se ha neutralizado el efecto de
las diferencias individuales por medio de la construccin de
bloques

DISEO POR BLOQUE COMPLETOS


ALEATORIZADOS.
Cuando se quiere comparar las medias de k poblaciones en
presencia de una variable extraa se utiliza un procedimiento
conocido como diseo de bloques.
Un bloque es una coleccin de k unidades experimentales tan
parecidas como sea posible con respecto a la variable extraa,
luego se asigna aleatoriamente cada tratamiento a una unidad
dentro de cada bloque. Esto permite neutralizar el efecto de la
variable extraa entre los tratamientos.
Una vez controlada esta fuente de variacin, cualquier diferencia
en las respuestas es atribuible a los efectos del tratamiento

DISEO POR BLOQUE COMPLETOS


ALEATORIZADOS.
El diseo que presentamos aqu se conoce como diseo de bloques
completo aleatorizado con efectos fijos.
El trmino bloque se refiere al hecho de que se ha agrupado a las
unidades experimentales en funcin de alguna variable extraa.
Aleatorizado se refiere al hecho de que los tratamientos se asignan
aleatoriamente dentro de los bloques,
Decir que el diseo es completo implica que se utiliza cada
tratamiento exactamente una vez dentro de cada bloque. El
termino efectos fijos se aplica a ambos, bloques y tratamientos.
Es decir, se supone que ni los bloques ni los tratamientos se eligen
aleatoriamente. Cualquier inferencia que se haga se aplica
solamente) a los k tratamientos y a los b bloques utilizados.

DISEO POR BLOQUE COMPLETOS


ALEATORIZADOS CON UNA VIA
El modelo para el diseo es
yi j i J i j ;

i 1,..., k ; j 1,...., b

: Media general.
i : Efecto del i-esimo nivel de factor A.

i : Efecto del bloque j- esimo.

ij : Error aleatorio de la (i,j) - esima observacin

Supuestos
1. Las k muestras representan muestras aleatorias independientes
extradas de k poblaciones especificas con medias 1,2,...,k
(constantes desconocidas)
2. Cada una de las k poblaciones es normal. con media cero y con la
misma varianza 2 (constante).

DISEO COMPLETAMENTE ALEATORIZADO DE


UNA VIA, CON EFECTOS FIJOS.
Yij , i=1,2,; nj, j=1,2,,k : es una variable aleatoria continua,
que indica la respuesta para el i-esimo tratamiento, en el j-esimo
bloque. Tiene distribucin normal con media y varianza 2
constante.
BLOQUES
Bloque 1

Bloque 2

Bloque 3

:::

Bloque b

y11

y21

y31

:::

yk1

y12

Y22

y32

:::

yk2

:::

:::

:::

:::

y1k

y2,k

:::

ybk

y3k

DISEO DE BLOQUES COMPLETOS ALEATORIZADO


DE UNA VIA, CON EFECTOS FIJOS.
TABLA ANOVA

Fuentes de
variacin
Factor
Bloques
Residual
Total

Grados de Suma de Cuadrados


libertad cuadrados
medio
k-1
b-1

SC Factor

CM Factor

SC Bloques

CM Bloques

F
CM fa c tor
CM residual
CM Bloques
CM residual

(k-1)(b-1)

SC Residual

bk-1

SC Total

CM Residual

Ejemplo
Xij : numero de kilocaloras consumidas por kilometro recorrido al
realizar la i-esima actividad (correr, caminar, pedalear) por la
isima persona (bloque) .

Kilocaloras consumidas de acuerdo al tipo de


actividad.

Kilocaloras consumidas por cada persona (bloques)

Verificacin del supuesto de normalidad de las


mediciones de kilocalorias consumidas de
acuerdo al tipo de actividad

Anlisis de varianza de la cantidad de kilocaloras consumidas de


acuerdo al tipo de actividad fsica realizada, sin tomar en cuenta el
efecto de bloques (personas).

F DE ACTIVIDAD=49,298
ERROR CUADRATICO MEDIO= 0,045

Anlisis de varianza de la cantidad de kilocaloras consumidas de


acuerdo al tipo de actividad fsica realizada, cuantificando el efecto
de bloques (personas).

F DE ACTIVIDAD=79,897
ERROR CUADRATICO MEDIO= 0,028

DISEO FACTORIAL

DISEO FACTORIAL
Muchos experimentos se llevan a cabo para estudiar los efectos
producidos por dos o ms factores.
Por diseo factorial se entiende aquel en el que se investigan
todas las posibles combinaciones de los niveles de los factores
en cada ensayo completo o rplica del experimento. Por ejemplo
si de tienen dos factores A con 2 niveles y B con 2 niveles,
entonces cada rplica del experimento contiene todas las 2x2
combinaciones de los tratamientos.
Los diseos factoriales son los mas eficientes para este tipo de
situaciones.
El efecto de un factor se define como el cambio en la respuesta
producido por un cambio en el nivel del factor. A esto se le
conoce como efecto principal

DISEO FACTORIAL
El efecto de un factor se define como el cambio en la respuesta
producido por un cambio en el nivel del factor. A esto se le conoce
como efecto principal, porque se refiere a los efectos de inters
principal en el experimento.
En algunos experimentos puede encontrarse que la diferencia en
la respuesta entre los niveles de un factor no es la misma en
todos los niveles de los otros factores considerados en el modelo.
Cuando esto ocurre se dice que existe una interaccin entre los
factores.

Experimento factorial

b 21
b2 1

b11
b11

a 11

a21
a1

sin interaccin

a2

Con interaccin

DISEO FACTORIAL
El modelo para el diseo de factorial es

yijk i j ij ijk ;

i 1,..., a ; j 1,...., b ; k 1,..., n

: Media general.
i : Efecto del i-esimo factor A.
i : Efecto del jsimo factor B.

ik : Efecto de la interaccin de A y B
ij : Error aleatorio de la (i,j,k) esima observacin

Un supuesto bsico del anlisis de la Varianza es que los errores se


distribuyen aleatoriamente alrededor de cero (media cero) y varianza 2 . Es
decir: : N (0, 2 )
ij

DISEO FACTORIAL
Estructura de los datos de un diseo con 2 factores con k tratamientos
FACTOR
B
1

FACTOR A
1
y111,,y11n

y1.

Medias

:::

:::

:::

y1ik,,y1ik,,

:::

y1a1,,y1an

:::

:::

:::

:::

yi .

:::

:::

yi11, , yi1n

:::

yij1,,yijn

:::

yia1, , yian

yb.

:::

:::

:::

:::

:::

:::

:::

b
Medias

yb11,,yb1n
y .1

:::

ybIJ, , ybjn
y.j

:::

yba1,,yban
y .a

y ..

DISEO FACTORIAL
Tabla de anlisis de varianza
Fuentes de
variacin

Grados de
libertad

Suma de
cuadrados

Cuadrados
medio

Factor A

a-1

SCA

CMA

CMA/CMresidual

Factor B

b-1

SC B

CMB

CMB/CMresidual

Interaccin

(a-1) (b-1)

SCAB

CM AB

CMAB/CMresidual

Ab(n-1)

SCresidual

CM residual

Residuos
Total

abn-1

DISEO FACTORIAL
Se realiza un estudio para averiguar la madurez emocional de 27 varones
jvenes mayores de edad, clasificados segn grado de instruccin

DISEO FACTORIAL
Modelo de efectos principales

yij i j ij ;

i 1,..., a ; j 1,...., b

DISEO FACTORIAL
Modelo de efectos principales con interaccin

Se observa que las


medias
de
las
categoras ocasional
y diario se cruzan lo
que indica que existe
interaccin entre la
edad y la frecuencia
de consumo.

DISEO FACTORIAL
Modelo de efectos principales con interaccin

yijk i j ij ijk ;

i 1,..., a ; j 1,...., b ; k 1,..., n

Вам также может понравиться