Вы находитесь на странице: 1из 27

Estadística y Diseño de

Experimentos
Diseño de experimentos

Experimentos con un solo factor:


ANOVA
INTRODUCCIÓN
• Muchos experimentos involucran un solo factor
con varios niveles.
• Este tipo de experimentos son los más sencillos
• Supondremos que
– tenemos un solo factor con a niveles o tratamientos.
– se realizan n réplicas en cada uno de los a
tratamientos.
– el experimento se ha aleatorizado completamente.
El análisis de varianza
• Suponga que se tienen a tratamientos o niveles
diferentes de un solo factor y se desea probar si
existe diferencia entre los tratamientos.
• Se puede ver a la variable de respuesta
observada en cada uno de los a tratamientos
como una variable aleatoria.
• Sea yij la j-ésima respuesta observada para el i-
ésimo tratamiento, i= 1, …, a, j= 1, …, n.
• En total se tendrán N=an observaciones.
El análisis de varianza
• Las observaciones se pueden organizar en una taba
como la siguiente:
Tratamiento Observaciones Totales Promedios
(Niveles)
1 y11 y12 … y1j … y1n y1. y 1.
2 y21 y22 … y2j … y2n y2. y 2.
 


i yi1 yi2 … yij … yin yi. yi.


 
a ya1 ya2 … yaj … yan ya. y a.
Donde: y.. y ..
n a a n
yi. y ..
y i . = ∑ y ij y .. = ∑ y i . = ∑∑ y ij yi. = y .. =
j =1 i =1 i =1 j =1 n N
El análisis de varianza
• Modelos para la representación de las
observaciones
– Modelo de las medias
 i = 1, 2, ..., a
y ij = µ i + ε ij 
donde:
 j = 1, 2, ..., n
• yij es la observación ij-ésima,
• µ i es la media del i-ésimo tratamiento del factor y
• ε ij es un componente del error aleatoria que incorpora todas la
demás fuentes de variabilidad del experimento (mediciones,
factores no controlables, diferencias entra unidades
experimentales y el ruido de fondo –debido al paso del tiempo, a
variables ambientales, etc.-)
El análisis de varianza
• Modelos para la representación de las
observaciones
– Modelo de los efectos
– Defínase µ i= µ + τ i, i= 1, …, a; con ello el modelo de
las medias se transforma en:
 i = 1, 2, ..., a
y ij = µ + τ i + ε ij 
donde ahora:  j = 1, 2, ..., n
• yij es la observación ij-ésima,
• µ es la media global
• τ i es el efecto del i-ésimo tratamiento y
• ε ij es un componente del error aleatorio.
El análisis de varianza
• Modelos para la representación de las
observaciones
– Los modelos de las medias y de los efectos son modelos
estadísticos lineales, pues la variable de respuesta yij es
una función lineal de los parámetros del modelo.
– En el caso de un solo factor, se les llama modelo del
análisis de varianza simple o de un solo factor (o
dirección).
– El diseño experimental es un diseño completamente
aletorizado, con la finalidad de evitar que los efectos de
variables perturbadoras contaminen los resultados.
El análisis de varianza
• Modelos para la representación de las
observaciones
– Los objetivos serán probar las hipótesis apropiadas
sobre las medias de los tratamientos y estimarlas.
– Para ello se supondrá que los errores son NID, tales
que:
• ε ij~N(0, σ 2), i= 1, …, a, j= 1, …, n.
• σ 2 es constante para todos los tratamientos o niveles del
factor.
• Por consiguiente: yij~N(µ + τ i, σ 2).
• Y las observaciones yij son mutuamente excluyentes.
El análisis de varianza
• Factor fijo y factor aleatorio
– El modelo estadístico
 i = 1, 2, ..., a
y ij = µ + τ i + ε ij 
 j = 1, 2, ..., n
puede representar dos situaciones
diferentes con respecto a la forma como
se determinaron los niveles o factores a
considerar en la experimentación.
El análisis de varianza
• El modelo con efectos fijos
– Los a tratamientos o niveles son establecidos o
elegidos expresamente por el experimentador.
– Este enfoque se emplea cuando se desean probar
hipótesis sobre las medias de los tratamientos.
– Las conclusiones se aplican únicamente a los
tratamientos del factor considerados en el diseño.
– Es decir: las conclusiones no se pueden extender o
aplicar a tratamientos similares del factor que no
fueron considerados explícitamente en el diseño del
experimento.
El análisis de varianza
• El modelo con efectos fijos
– Con este modelo se podrá:
• Estimar la media global, µ .
• Los efectos de los tratamientos, τ i, i= 1, …, a.
• Las medias de los efectos, µ i, i= 1, …, n.
• La varianza del error aleatorio, σ 2.
El análisis de varianza
• El modelo con efectos aleatorios
– Los a tratamientos son una muestra aleatoria de una
población más grande de tratamientos del factor.
– Este enfoque se emplea cuando se desean probar
hipótesis sobre la variabilidad de los tratamientos.
– Las conclusiones (basadas en la muestra de los
tratamientos) se pueden extender a todos los
tratamientos de la población, sin importar si se
consideraron explícitamente o no en el diseño del
experimento.
El análisis de varianza
• El modelo con efectos aleatorios
– En este modelo las τ i son variables
aleatorias y el conocimiento de las τ i
particulares que se investigaron es
relativamente inútil.
– Con este modelo se podrá:
• Probar hipótesis sobre la variabilidad de las τ i.
• Estimar la variabilidad de las τ i.
Análisis del modelo con efectos fijos
• yi. representa el total de n
las observaciones para el y i . = ∑ y ij
i-ésimo tratamiento j =1

• y i . representa el promedio yi.


de las observaciones yi. =
para el i-ésimo n
tratamiento
• y.. representa el gran total a a n

de todas las y .. = ∑ y i . = ∑∑ y ij
observaciones i =1 i =1 j =1

• y .. representa el y ..
y .. =
promedio global de todas N
las observaciones
• N=total de observaciones N= an
Análisis del modelo con efectos fijos

• Formulación de hipótesis para el modelo


de las medias con efectos fijos: se desea
probar la igualdad de las medias µ i para
los a tratamientos, es decir:
H0: µ 1= µ 2= … = µ a
vs.
H1: µ i ≠ µ j para al menos un par (i, j)
Análisis del modelo con efectos fijos

• Formulación de hipótesis para el modelo


de los efectos con efectos fijos: se desea
probar que los efectos τ i de los a
tratamientos son cero, es decir:
H0: τ 1= τ 2= … = τ a= 0
vs.
H1: τ i ≠ 0 para al menos una i
Descomposición de la suma de
cuadrados total
• El procedimiento apropiado para probar la
igualdad de las medias de los a
tratamientos es al análisis de varianza.
• Se parte de la suma de cuadrados total
corregida:
SST = ∑∑ ( y ij − y..)
a n
2

i =1 j =1
Descomposición de la suma de
cuadrados total
• La suma de cuadrados total corregida puede
expresarse como
2

∑∑ ( y − y .. ) = ∑∑ [( y i . − y .. ) + ( y ij − y i . ) ]
a n a n
2
ij
i =1 j =1 i =1 j =1

• Lo cual se simplifica en

∑∑ ( y − y .. ) = n ∑ ( y i . − y .. ) + ∑∑ ( y ij − y i . )
a n a a n
2 2 2
ij
i =1 j =1 i =1 i =1 j =1

• O bien:
SST = SSTratamientos + SSE
Descomposición de la suma de
cuadrados total
• Suma de cuadrados total
∑∑ ( )
a n
2
corregida: N-1 grados de SST = y ij − y ..
libertad i =1 j =1

• Suma de cuadrados a
debida a los tratamientos SS
Tratamientos = n ( y i . − y .. )

2

(o entre los tratamientos): i =1


a-1 grados de libertad
• Suma de cuadrados
∑∑ ( )
a n
debida al error (o dentro SS = y ij − y i .
2
E
de los tratamientos): N-a i =1 j =1
grados de libertad
Análisis estadístico
• Dado que se ha supuesto que los errores ε ij
son NID tales que ε ij ~ N(0,σ 2), entonces las
observaciones yij son NID tales que
yij~N(µ +τ i,σ 2).
• A partir de lo anterior se puede demostrar que:
– SST/σ 2 ~ χ 2
N-1

– Si la hipótesis nula es cierta:


SSTratamientos/σ 2 ~ χ 2a-1
– SSE/σ 2 ~ χ 2
N-a
Análisis estadístico
• Cuadrado medio de los tratamientos:
SSTratamientos
MSTratamientos =
a −1
• Cuadrado medio del error

SSE
MSE =
N −a
Análisis estadístico
• Puede demostrarse que el valor esperado de
los cuadrados medios, si los tratamientos son
fijos es:
a
n ∑τ i
2

E ( MSTratamientos ) = σ 2 + i =1
a −1

( )
E MSE = σ 2
Análisis estadístico

• Si no hay efecto de los tratamientos, es decir si


la hipótesis nula es verdadera, la variable
aleatoria F0 definida como:
MSTratamientos
F0 =
MSE
sigue una distribución Fa-1, N-a; por lo tanto, se
rechazaría la hipótesis nula si
F0> Fα , a-1, N-a
con un nivel de confianza 100(1-α )%.
Análisis estadístico
• Análisis de varianza para el modelo con un solo
factor y efectos fijo
Fuente de Suma de Grados de Cuadrado F0
variación cuadrados libertad medio

Tratamientos SSTratamientos a-1 MSTratamientos = MSTratamientos


MSE
SSTratamientos
a −1
Error SSE N-a SSE
MSE =
N −a
Total SST N-1
Análisis estadístico

• Fórmulas para cálculos manuales


a n 2
y
SST = ∑∑ y ij2 − ..
i =1 j =1 N
a 2
1 y
SSTratamientos = ∑ y i. −
2 ..
n i =1 N

SSE = SST − SSTratamientos


Verificación de la adecuación del
modelo
• Para la verificación de la adecuación del
modelo deberá estarse alerta a los
problemas potenciales con el supuesto
de normalidad, con la desigualdad de la
varianza por tratamiento y la
independencia de los errores.
• Como siempre, el análisis de residuales
es la herramienta principal que se utiliza
en estos diagnósticos de verificación.
Verificación de la adecuación del
modelo
• Para la verificación de la adecuación del
modelo, un estimador del valor que toma yij
esta dado por:
yˆ ij = y i .
• El residual de la j-ésima observación para el
i-ésimo tratamiento se calcula mediante:
eij = y ij − yˆ ij
= y ij − y i .

Вам также может понравиться