4 IntroduANOVA 2

3.
COMPARACIÓN DE
k TRATAMIENTOS
(Introducción al ANOVA)
V. García T.
1
INTRODUCCIÓN
En esta sección, aunque se sigue considerando un solo
factor, se presentan los diseños experimentales que se
utilizan cuando el objetivo es comparar más de dos
tratamientos.
Puede ser de interés, por ejemplo:

•comparar tres o más máquinas,
•varios proveedores,
•cuatro procesos,
•tres materiales, etc.
2
Por lo general el interés del
experimentador se centra en comparar
los tratamientos en cuanto a sus medias
poblacionales, sin olvidar que también es
importante compararlos en relación a sus
varianzas.
3
D. Mineralurgia/DOE V. García T.
Fuente: Bibliografía propuesta
Desde el punto de vista estadístico, la

hipótesis fundamental a probar cuando se
comparan varios tratamientos es:
H 0 : 1  2  3 ...  k
H1 : i   j para a lg ún i  j
4
La estrategia natural para resolver este

problema es obtener una muestra
representativa de mediciones en cada
uno de los tratamientos, y con base en
las medias y varianzas muestrales, construir
un estadístico de prueba para decidir el
resultado de dicha comparación.
5
Los diseños experimentales más utilizados para

comparar tratamientos, considerando desde cero hasta
tres factores de bloque, son respectivamente:
1. Diseño completamente al azar.
2. Diseño en bloques completos al azar.
3. Diseño en cuadro latino.
4. Diseño en cuadro grecolatino.
La diferencia fundamental entre estos diseños es el
número de factores de bloque que incorporan o
controlan de forma explícita durante el experimento.
6
D. Mineralurgia/DOE V. García
T.
Familia de diseños para comparar tratamientos.
7
T.
La comparación de los tratamientos en cuanto a la

respuesta media que logran, en cualquiera de estos
diseños, se hace mediante las hipótesis:
H 0 : 1  2  3 ...  k  
y se prueba con la técnica estadística llamada
con uno, dos, tres o cuatro criterios de clasificación,

dependiendo del número de factores de bloque incorporados
al diseño.
8
T.
El nombre análisis de varianza se

deriva de la partición de la
variabilidad total en sus partes
componentes.
9
T.
Para cada diseño comparativo se tienen al menos dos

fuentes de variabilidad, a saber:
Los tratamientos o niveles del factor

de interés
y el error aleatorio.
Se agrega una nueva fuente variabilidad por cada

factor de bloque que se controla directamente.
10
T.
En estos modelos también se observa que los

diseños suponen que no hay efectos de
interacción entre los factores; es deseable que
efectivamente eso ocurra, de lo contrario la
variabilidad de cada interacción activa se carga al
error y el problema de comparación no se resuelve
con éxito.
Que exista interacción entre dos factores, se

refiere a que el efecto de cada factor depende
del nivel en que se encuentra el otro.
11
Diseño completamente aleatorizado
El diseño completamente al azar es el más

simple de todos los diseños que se utilizan
para comparar dos o más tratamientos, dado
que sólo considera dos fuentes de variabilidad:
los tratamientos y el error aleatorio.
T. 12
T.
Suponiendo que se tienen:
k tratamientos o niveles diferentes de un solo factor

que quieren compararse.
La respuesta observada de cada uno de los k

tratamientos es una variable aleatoria. Los datos
aparecerían como en la siguiente tabla. Una entrada de la
tabla (por ejemplo, yij) representa la observación j-
ésima tomada bajo el nivel del factor o tratamiento i.
13
y ..1k2
T.
Tabla 4.1.- Datos típicos de un experimento de un solo factor
Nivel del
Observaciones Totales Promedios
factor
1 y11 y12 ... y1n y1 y1
2 y21 y22 ... y2n y2 y2

. . . . . . .
. . . . . . .
. . . . . . .
k yk1 yk2 ... ykn yk yk
y.. y..
Habrá, en general, n observaciones bajo el
tratamiento i-ésimo. 14
T.
Modelo
Se encontrará útil describir las observaciones

de un experimento con un modelo.
El modelo es una manera de expresar

matemáticamente todo lo que se supone puede
influir sobre la variable de respuesta, en un
diseño dado.
15
T.
Una manera de escribir el modelo que nos

ocupa es:
i  1,2,..., k
yi j  i   i j
j  1, 2,..., n
yi j  Es la observación ij-ésima
i  es la media del nivel del factor o tratamiento i-ésimo
es un componente del error aleatorio que incorpora

i j  todas las demás fuentes de variabilidad del
experimento, incluyendo las mediciones, la variabilidad
que surge de factores no controlados, las diferencias
entre las unidades experimentales, y el ruido de fondo
general en el proceso.
16
T.
Es conveniente considerar que los errores tienen

media cero, de tal modo que E(yij) =µi.
A la ecuación anterior se le llama el modelo de

las medias.
Una forma alternativa de escribir un modelo de

los datos es definiendo    
i i
17
T.
de tal modo que el modelo se convierte en:
yi j     i   i j
En esta forma del modelo, µ es un parámetro
común a todos los tratamientos al que se llama la
media global, y τi es un parámetro único del
tratamiento i-ésimo al que se le llama el efecto del
tratamiento i-ésimo.
A esta ecuación se le llama por lo general el

modelo de los efectos. 18
T.
A la ecuación o modelo de los efectos, se le llama

también el
o de un solo factor (o
dirección), porque únicamente se investiga un factor.
Además, será un requisito que el experimento se

lleve a cabo en orden aleatorio para que el ambiente
en el que se apliquen los tratamientos sea lo más
uniforme posible.
Por lo tanto, el diseño experimental es un

.
19
T.
ANOVA PARA UN DCA
Análisis de varianza (ANOVA) es una metodología en

la que de hecho se utilizan cocientes de varianzas para
probar la hipótesis de igualdad de medias.
La idea general de esta técnica es separar la variación

total en las partes con la que contribuye cada fuente
de variación en el experimento.
En el caso del DCA se separan la variabilidad debida a

los tratamientos y la debida al error.
20
T.
a) Variabilidad total b) Variabilidad total
21
Variabilidad Variabilidad Variabilidad
debida a Variabilidad
debida a debida a debida a
tratamientos error tratamientos error
No hay efecto de tratamiento Sí hay efecto de tratamiento
Figura 4. .- Partición de la variación total en sus componentes en un DCA

T.
Cuando la primera predomina "claramente"

sobre la segunda es cuando se concluye que
los tratamientos tienen efecto (figura 4.1b), o
lo que es lo mismo, las medias son diferentes.
Cuando los tratamientos contribuyen igual o

menos que el error, se concluye que las
medias son iguales (figura 4.1a).
22
T.
Para representar de manera abreviada cantidades

numéricas que se pueden calcular a partir de los
datos en un diseño completamente al azar, en la cual
yij representa la j-ésima observación en el tratamiento
i, con i = 1, 2, ... , k y j = 1, 2, ... , ni se tiene que:
yi.  Suma de las

observaciones del
y..  Suma total de las
N=n1+n2…+nk
tratamiento i mediciones
Media de las Media global o

y i.  observaciones del i- y ..  promedio de todas
ésimo tratamiento las observaciones 23
T.
Así entonces, el objetivo del análisis de varianza en el

DCA es probar la hipótesis de igualdad de las
respuestas medias dadas por
H 0 : 1  2  3 ...  k  
la cual se puede escribir de forma equivalente como:

H 0 :  1   2   3 ...   k  0
H1 :  i  0 para a lg ún i
donde τi es el efecto del tratamiento i sobre la variable de

respuesta. 24
T.
Para probar la hipótesis mediante la técnica de ANOVA

con un criterio de clasificación, lo primero es
descomponer la variabilidad total de los datos en sus
dos componentes, como ya se ha mencionado:
Variabilidad Variabilidad debida a + Variabilidad debida al

total = diferencias entre error (también
tratamientos llamada variabilidad
(efectos del factor) residual, diferencias
dentro de cada
tratamiento)
25
T.
La suma de cuadrados total corregida, se usa como

una medida de la variabilidad global de los datos.
 
k n k n 2
y
SST   yi j  y..   y i2j  ..
2
i 1 j 1 i 1 j 1 kn
Intuitivamente, esto es razonable porque, si SST
tuviera que dividirse por el número apropiado de
grados de libertad (en este caso, kn - 1 = N - 1), se
obtendría la varianza muestral de las y. La varianza
muestral es, desde luego, una medida de variabilidad.
26
T.
Sumando y restando adentro del paréntesis la media

del tratamiento i,
2
   
k n
SST    y i .  y ..  yi j  y i. 
i 1 j 1
 
y desarrollando el cuadrado
k n k k n
 ( y
i 1 j 1
ij  y..)  n ( yi .  y..)   ( yij  yi .)
2
i 1
2
i 1 j 1
2
27
T.
Donde el primer componente es la suma de

cuadrados de tratamientos (SSTRAT) y el segundo es
la suma de cuadrados del error(SSE).
La SSTRAT mide la variación o diferencias

entre tratamientos.
Mientras que la SSE mide la variación dentro

de tratamientos.
28
T.
En forma abreviada, esta descomposición de la suma

total de cuadrados se puede escribir como
SST  SSTRATAMIENTOS  SS E
Esta ecuación es llamada a menudo:
la ecuación fundamental del análisis

de varianza.
29
T.
La ecuación anterior muestra

La diferencia entre los promedios
que la variabilidad total de
observados de los tratamientos y
los datos, medida por la suma
el promedio general constituye
total de cuadrados, puede
una medida de la diferencia
descomponerse en entre las medias de tratamiento,
1
la suma de cuadrados de las

diferencias entre los mientras que la causa de las
promedios de los tratamientos diferencias de las observaciones
y el promedio general, y dentro de los tratamientos con
2
respecto al promedio del
en la suma de cuadrados de tratamiento puede ser solamente
las diferencias entre las el error aleatorio.
observaciones dentro del
tratamiento y el promedio del
mismo.
30
T.
Puede observarse que la identidad del análisis de

varianza proporciona dos estimaciones para la varianza:
una basada en la variabilidad propia e

interna de los tratamientos,
y otra en la variabilidad de los mismos.
Si no existe diferencia en el nivel medio de los
tratamientos, estas dos estimaciones deben ser
similares; de no ser así, se sospecharía que la diferencia
observada puede ser el resultado de una diferencia
entre las medias de los tratamientos.
31
Esta comparación se facilita si
primero se escala estas sumas
de cuadrados dividiéndolas
Entonces: por su número de grados de
libertad.
Si SSTRAT es grande, es debido a
las diferencias entre las medias Hay Kn = N observaciones
de los diferentes niveles del totales. Asi, SST tiene N - 1
grados de libertad. Hay k
factor o tratamientos. niveles de factor, así SSTRAT
tiene k – 1 grados de libertad.
Así, comparando la magnitud Finalmente, dentro de cada
de SSTRAT y SSE se puede saber nivel hay n observaciones, por
cuánta variabilidad es debida a lo cual, hay n – 1 grados de
libertad con los cuales estimar
los cambios de los niveles de el error experimental. Como
factor o tratamientos, y cuánta hay k niveles del factor, se
es debida al error. tiene k(n – 1) grados de
libertad para el error. 32
T.
La relación de la suma de cuadrados y su número de

grados de libertad, es llamado Cuadrado medio:
SSTRAT SS E
MS TRAT  y
MS E 
k 1 k (n  1)
Cuando la hipótesis nula es verdadera, ambos cuadrados

medios son estimadores insesgados de la varianza común
σ2 de los tratamientos que se comparan. En cambio,
cuando la igualdad de las k medias es falsa, el cuadrado
medio del error sigue siendo un estimador insesgado de la
varianza, mientras que el cuadrado medio de tratamientos
deja de ser un estimador insesgado de la varianza, y el
sesgo que surge se atribuye a que las medias no son 33
iguales.
T.
Con base en este hecho se construye el estadístico

de prueba:
Estimación de  2 basada en la var iación entre las medias muestrales
F0 
Estimación de  2 basada en la var iación dentro de las muestras
MS TRAT debe seguir una distribución F con

F0  ν1=(k - 1) grados de libertad en el
MS E numerador y ν2=(N - k) grados de
libertad en el denominador.
se deduce que si F0 es grande se contradice la hipótesis

de que no hay efectos de tratamientos, en cambio si F0
es pequeño se confirma la validez de H0. Así, para un
nivel de significancia α prefijado, se rechaza H0 si F0 >
Fα, ν1, ν2 . 34
T.
Toda la información necesaria para calcular el

estadístico F0 se escribe en la llamada
tabla de análisis de varianza

(TABLA DE ANOVA).
El análisis de varianza es la técnica estadística
fundamental para el análisis de todo tipo de
diseños experimentales.
35
TABLA DE ANOVA
Para un experimento de un solo factor
FUENTE GRADOS CUADRADO MEDIO

SUMA DE DE RAZÓN F0
DE VARIACIÓN
CUADRADOS LIBERTAD (Estimaciones de la varianza)
1.- Tratamientos SS TRAT

SSTRAT k –1 MS TRAT 
* k 1 F0 
MSTRAT
MS E
2.- Error SSE k( n – 1) MS E 

SS E
** k (n  1)
TOTAL SST kn - 1
D. Mineralurgia/DOE V. García 36
T.
T.
Fórmulas usadas para calcular las sumas

de los cuadrados (cálculos manuales).
Igual tamaño de las muestras:
k n 2
y
SST   y  2
ij
..
i 1 j 1 kn
k 2 2
y . y ..
SSTRAT .    i
i 1 n kn
SS E  SST  SSTRAT
37
T.
En algunos experimentos unifactoriales, el número de

observaciones tomadas para cada tratamiento puede ser
diferente.
En este caso se dice que el diseño no está balanceado.
En este caso, puede emplearse el análisis de varianza descrito

anteriormente, con ligeras modificaciones a las fórmulas para
las sumas de cuadrados.
Grados de
2
Sea ni el número de k
y n libertad:
observaciones bajo cada SST   yij2  .. Para los
tratamiento i (i = 1, 2, ..., i 1 j 1 N tratamientos =
k), y N=∑ ni , el número k–1
total de observaciones. k
yi2 . y 2 .. Para el error =
Las fórmulas para los
cálculos son:
SSTRAT .    N–k
i 1 ni N Para el total =
N–1 38
VERIFICACIÓN DE LA ADECUACIÓN
DEL MODELO
La validez de los resultados obtenidos en cualquier
análisis de varianza queda supeditado a que los
supuestos del modelo se cumplan.
Estos supuestos del modelo de ANOVA son:
normalidad,
varianza constante (igual varianza de
los tratamientos),
independencia.
T.
T.
Las violaciones de los supuestos básicos y la

adecuación del modelo pueden investigarse
con facilidad mediante el examen de los
residuales. Los residuos

cantidades que
presentan a los errores.
son
re
El residual de la observación j-ésima en el

tratamiento i-ésimo se define como la
diferencia entre respuesta observada y la
diferencia predicha:
Si el modelo es adecuado, los
 i j  yi j  y ij
residuales deberán estar sin
estructura; es decir, no
deberán contener patrones
obvios. 40
T.
Para comprobar cada supuesto existen pruebas

analíticas y gráficas.
Se recomiendan las pruebas gráficas dado que se
pueden aplicar con pocos datos, cosa que no sucede
con las pruebas analíticas; estas últimas pierden
drásticamente su potencia con pocos datos.
Las pruebas gráficas tienen el inconveniente de que no
son "exactas", pero aun así en la mayoría de las
situaciones, proporcionan evidencia suficiente en contra
o a favor de los supuestos.
41
El uso de las pruebas gráficas requiere fuerte evidencia
visual para concluir que el supuesto en cuestión no se
cumple.
Cuando es uno o dos los puntos que se salen del
comportamiento esperado de las gráficas se puede
tratar de un problema de puntos aberrantes, no de
violación del supuesto en cuestión.
En ese caso debe investigarse la obtención de dichas
mediciones atípicas.
42
T.
Normalidad
Gráfica de probabilidad en papel normal.
Es un procedimiento gráfico para verificar la

normalidad de los residuos. Ésta es una gráfica del tipo
X-Y que tiene las escalas de tal manera que si los
residuos siguen una distribución normal, al ser
graficados tienden a quedar alineados en una línea
recta. Por lo tanto, si claramente no se alinean, se
concluye que el supuesto de normalidad no es
correcto.
43
Los pasos en la construcción de la gráfica de
probabilidad normal, para los N residuos son los
siguientes:
1. Ordenar los N valores del menor al mayor,

asignándoles rangos de 1 a N.
2. Calcular una posición de graficación para cada dato
en función de su rango y del total de observaciones
como (i - 0.5)/N, i = 1, 2,..., N.
3. El papel de probabilidad normal tiene una de las
escalas lineal (eje X) y la otra logarítmica (eje Y); así,
sobre éste se ubican las parejas [eij, (i - 0.5)/N].
4. Dibujar una línea recta sobre los puntos para tratar
de dilucidar si se ajustan a ella o no.
La LR debe ser trazada ajustándose sobre los puntos
centrales, y no los extremos. Debe ser una L 44
simultáneamente lo más cerca posible a todos los
T.
Fuente: Bibliografía propuesta puntos.
T.
La grafica de probabilidad también puede ser elaborada

en papel ordinario con escalas equiespaciadas en
ambos ejes. Para ello, en lugar de graficar directamente
la frecuencia acumulada observada (i - 0.5) / N se grafica
su correspondiente valor normal estandarizado Zi que
cumple la relación:
 i  0.5
 P  Z  Zi   ( Zi )
N
Donde ( Z i ) es la distribución normal estándar
acumulada evaluada en Zi.
La interpretación de la gráfica es subjetiva, pero muchas veces es

suficiente para llegar a una conclusión razonable sobre la distribución que
siguen los datos. 45
46
Fig. 4.2.- Gráficas de probabilidad normal, en papel

normal y en papel ordinario.
T.
47
Fig. 4.3.- Ejemplo de gráficas de residuos, verificando el supuesto

de normalidad para el Anova, donde no se cumple éste.
T.
48
Fig. 4.4.- Gráfica de residuos, verificación del

supuesto de normalidad.
T.
49
Fig. 4.5.- Otro ejemplos de gráficas de probabilidad

normal.
T.
50
Fig. 4.6.- Gráficas de probabilidad normal: a) ideal, b) distribución con colas gruesas;
c) distribución con colas delgadas; d) asimetría positiva; e) asimetría negativa.
T.
Para detectar puntos atípicos o aberrantes, puede
hacerse una verificación aproximada de examinando los
residuales estandarizados:
eij
di j 
MS E
Si los errores son N(0, σ2), cerca de 95% de ellos

los residuales estandarizados deberán estar incluidos
deberán ser aproximadamente dentro de ±2 y virtualmente
normales con media cero y todos ellos deberán estar
varianza unitaria. Por lo tanto, incluidos dentro de ±3.
cerca de 68% de los Un residual mayor que 3 o 4
residuales estandarizados desviaciones estándar a partir
deberán estar incluidos de cero es un punto atípico
dentro de los límites ±1, potencial. 51
T.
Independencia
La suposición de independencia en Si el comportamiento de los
los residuos puede verificarse si se puntos es aleatorio, el
grafica el orden en que se colectó supuesto se está
un dato contra el residuo cumpliendo.
correspondiente:
La violación de este supuesto
en el eje horizontal se grafica el generalmente indica
tiempo (orden de corrida) y en el deficiencias en la planeación y
eje vertical los residuos; si se ejecución del experimento,
detecta una tendencia o patrón no puede ser que no se aleatorizó
aleatorio claramente definido, en forma correcta, o que
entonces es evidencia de que conforme se fueron realizando
las pruebas experimentales
existe una correlación entre los
hubo factores que afectaron la
errores y por lo tanto el supuesto respuesta observada.
de independencia no se cumple. 52
53
Fig. 4.7.- Residuales graficados en orden del tiempo
T.
54
Residuales
Fig. 4.8.- Gráfica de residuos, verificación de la

independencia
T.
La violación de este supuesto generalmente indica deficiencias en la planeación y ejecución del
experimento; o puede ser un indicador de que no se aplicó en forma correcta el principio de aleatorización; o
de que conforme se fueron realizando las pruebas aparecieron factores que afectaron la respuesta.
55
Fig. 4.9.- Gráficas prototipo de residuales que muestran violación al

supuesto de independencia.
T.
56
Fig. 4.10.- Más ejemplos de gráficas que no cumplen con el supuesto de

independencia en el Anova.
T.
T.
Varianza constante
Una forma de verificar el supuesto de varianza

constante es graficando los predichos (eje horizontal)
contra los residuos (en el eje vertical).
Si los puntos se distribuyen aleatoriamente en una

banda horizontal (sin ningún patrón claro y
contundente), entonces es señal de que se cumple este
supuesto. Por el contrario, si se distribuyen con algún
patrón, por ejemplo en forma de "corneta o embudo",
entonces es señal de que no se está cumpliendo el
supuesto.
57
Si los niveles del factor que tienen las
Si se viola el supuesto varianzas mayores corresponden con
de la homogeneidad los tamaños de las muestras más
de las varianzas, la pequeños, el error tipo 1 real es mayor
prueba F sólo resulta que lo previsto (o los intervalos de
afectada ligeramente confianza tienen niveles de confianza
en el modelo reales más bajos que los
balanceado con especificados).
efectos fijos. Sin Si los niveles del factor con las
embargo, en diseños varianzas mayores tienen también los
no balanceados o en tamaños de las muestras mayores, los
casos en que una de niveles de significación son mucho
las varianzas es menores que lo anticipado (los niveles
considerablemente de confianza son más altos).
más grande que las Ésta es una buena razón para escoger
demás, el problema es tamaños de muestras iguales siempre
más grave. que sea posible.
58
59
Fig. 4.11.- Residuales graficados contra valores ajustados
T.
60
Fig. 4.12.- Ejemplos de gráficas de residuos cuando no se cumplen los

supuestos de Anova.
T.
61
Fig. 4.13.- Patrones en las

gráficas de residuales:
a) satisfactorio, b) en
embudo, c) en doble arco,
d) no lineal.
T.
(1) La varianza depende de la media: el error tiene relación directa con la magnitud del pronóstico (valor
predicho o ajustado) (Los datos pueden ser transformados) (2) Error en el análisis; tal vez se omitió la
media en el modelo (o ese factor en el modelo). (3) Tal vez sea necesario un término de segundo orden
en el modelo. (Transformación de los datos).
62
Fig. 4.14.- Impresión que

deben dar los residuales
satisfactorios.
(Banda aleatoria)
Fig. 4.15.- Nuevamente, ejemplos de

características mostradas por conducta no
T. satisfactoria de los residuales.
Pruebas estadísticas para verificar los
supuestos del modelo.
Prueba de Shapiro-Wilks para normalidad

Considerando una muestra aleatoria de datos x1, x2,
…, xn que proceden de cierta distribución
desconocida, se quiere verificar si dichos datos fueron
generados por un proceso normal, mediante las
hipótesis estadísticas:
H0: Los datos proceden de una distribución normal.

H1: Los datos no proceden de una distribución normal
T.
T.
Los pasos para la prueba de Shapiro-Wilks son:
1. Se ordenan los datos de menor a mayor.

2. De la tabla correspondiente se obtienen los
coeficientes a1, a2,…,ak, donde ak es
aproximadamente n/2.
3. Se calcula el estadístico W:
2
1  
 (i ) 
k
W 2  
(n  1) s  i1
ai x( n i 1)  x

Si el valor del estadístico es mayor que su valor crítico al
nivel α seleccionado se rechaza la normalidad de los datos.
64
T.
Prueba de Bartlett de homogeneidad de varianzas
Si se tienen k poblaciones o tratamientos

independientes, donde las varianzas son desconocidas,
y se quiere probar la igualdad de varianzas:
H 0 :  12   2 2   32 ...   k 2   2
H1 :  i 2   j 2 para a lg ún i  j
El estadístico de prueba está dado por:
q
 0  2.3026
c
65
T.
donde
k
q  ( N  k )log10 s 2p    ni  1 log10 si2
i 1
1  k 1 
  ni  1   N  k  
1
c  1 
3  k  1  i 1 
 i1 i 1
k
( n  1) s 2
s 2p 
N k
Se rechaza H0 si  0 2 2
 , k 1 66
T.
Prueba de Cochran para homogeneidad de

varianzas
Se quiere probar:
H 0 :  12   2 2   32 ...   k 2   2
H1 :  i 2   j 2 para a lg ún i  j
Se calcula el estadístico de Y se compara con el valor

prueba: crítico obtenido en la tabla
de Cochran gα
2
Mayor s
G0  2
S1  S2  ...  Sk
2 2
Si G0 > gα se rechaza H0.
67
T.
Estimación de los parámetros del modelo
Considerando el modelo yi j     i   i j
es posible determinar una estimación del intervalo de

confianza de la media del tratamiento i-ésimo,
utilizando MSE como estimador de σ2, el intervalo de
confianza se basaría en la distribución t. Por lo tanto,
un intervalo de confianza de 100(1- α) por ciento para
la media i del tratamiento i-ésimo es:
MS E
y i  t /2, N k
n 68
T.
Un intervalo de confianza de 100(1- α) por ciento

para la diferencia en las medias de dos tratamientos
cualesquiera, por ejemplo    sería:
i j
2 MS E
y i  y j  t /2, N k
n
69
COMPARACIONES O PRUEBAS
DE RANGO MÚLTIPLES
Después que se rechaza la hipótesis nula en el

análisis de varianza, se puede ir a detalle y ver
cuáles tratamientos son diferentes.
Esto se responde probando la igualdad de todos los

posibles pares de medias, mediante las hipótesis:
H 0 : i   j
H1 : i   j para toda i  j
T.
T.
Para probar estas hipótesis se han propuesto métodos

diferentes, conocidos como
métodos de comparaciones múltiples o

pruebas de rango múltiple.
La diferencia primordial entre los métodos radica en la
potencia que tienen para detectar las diferencias entre
las medias. Se dice que una prueba es más potente si
es capaz de detectar diferencias más pequeñas,
siempre y cuando estas diferencias sean reales.
71
T.
Algunos de estos métodos son:
 Método LSD (Diferencia mínima

significativa)
 Prueba de Tukey
 Prueba de Duncan
 Prueba de Dunnet
 Método de Sheffé
72
T.
Método LSD
(diferencia mínima significativa)
Una vez que se rechazó H0 en el anova, para cualquier

par de medias de dos tratamientos, µi y µj , se
declararían significativamente diferentes si:
1 1 
y i  y j  t /2, N k MS E   
n
 i nj 
A la cantidad
1 1 
LSD  t /2, N k MS E   
n
 i nj 
73
T.
se le llama diferencia mínima significativa (least

significant difference), ya que es la diferencia mínima
que debe existir entre dos medias muestrales para
considerar que los tratamientos correspondientes son
significativamente diferentes.
Así, si cada diferencia de medias muestrales en valor
absoluto que sea mayor que LSD se concluye que las
medias poblacionales difieren.
Si el diseño es balanceado,
2 MS E
LSD  t /2, N k
n
74
Prueba de Tukey
El procedimiento de Tukey hace uso de la distribución

del estadístico del rango studentizado
y max  y min
q
MS E n
En el numerador se tienen las medias muestrales

mayor y menor, respectivamente, sacadas de un grupo
de p medias muestrales.
75
T.
T.
Para tamaños de las muestras iguales, la prueba de

Tukey declara que dos medias son significativamente
diferentes si el valor absoluto de sus diferencias
muestrales excede
MS E
T  q , (k , f )
n
MSE se obtiene de la tabla de ANOVA; n es el número

de observaciones por tratamiento, k es el número de
tratamientos, f=N - k es igual a los grados de libertad
para el error, α es el nivel de significancia prefijado y
el estadístico qα, (k,f) son puntos porcentuales de la
distribución del rango studentizado, obtenidos en la
tabla correspondiente.
76
T.
Se declaran significativamente diferentes los pares

de medias cuya diferencia muestral en valor absoluto
sea mayor que Tα.
Cuando los tamaños de las muestras no son iguales,

la ecuación anterior quedan como:
q , ( k , f ) 1 1 
T  MS E   
n
2  i nj 
77
T.
Prueba del rango múltiple

de Duncan
Este es un procedimiento Para aplicar esta prueba

muy utilizado para comparar cuando los tamaños de las
todos los pares de medias. muestras son iguales, los k
Es considerado como muy promedios de los
eficaz para detectar tratamientos se arreglan
diferencias entre medias en orden ascendente, y el
cuando existen diferencias error estándar de cada
reales. promedio se determina
Por esta razón, la prueba como
del rango múltiple de MS E
Duncan es muy popular. sy 
i
n 78
T.
Para tamaños de muestras k

desiguales, se sustituye n nh 
1
en la ecuación anterior
 i1 n
k
con la media armónica nh, i
En la tabla de Duncan de rangos significativos se

obtienen los valores rα (p,f) para p=2,3,…, k . Estos
rangos se convierten en un conjunto de k -1 rangos
mínimos significativos
R p  r , (k , f ) s yi. Para p=2,3,…,k
79
T.
Las diferencias observadas entre
las medias, empezando con la Este proceso se continúa
más grande contra la menor, se hasta que se han
comparara con el rango mínimo considerado las diferencias
de significación Rk. Después se entre todos los pares de
calcula la diferencia de la mayor medias posibles.
y la segunda menor y se Si una diferencia
compara con el rango mínimo de observada es mayor que el
significación Rk-1 . Estas rango de significación
comparaciones se continúan mínima correspondiente,
hasta que todas las medias se se concluye que el par de
han comparado con la media medias en cuestión es
mayor. Luego se calcula la significativamente
diferencia entre la segunda diferente.
media mayor y la menor y se
compara con el rango mínimo de
significación Rk-1 80
Comparación de medias de
tratamientos con un control
En muchos experimentos, uno de los tratamientos es

un control, y el analista se interesa en comparar cada
una de las medias de los k-1 tratamientos restantes
con el control. Por lo tanto, sólo es necesario hacer k-1
comparaciones.
Un procedimiento para hacer estas comparaciones es

el método de Dunnett.
T.
T.
Suponiendo que el tratamiento de control es k, y que

quieren probarse las hipótesis
H0 : i   k
H1 : i   k Para i = 1,2,…, k-1
La hipótesis nula se rechaza si
1 1 
y i.  y k .  d , (k  1, f ) MS E   
n
 i nj 
donde dα,(k-1,f) es el valor en tablas.
Para diseño balanceado se tiene: 2 MS E

n 82
T.
Comparación por contrastes
No siempre interesa probar las hipótesis dos a dos, o

bien, no siempre éstas interesan todas por igual. En
ocasiones se tiene interés de contrastar hipótesis que
involucran a más de dos medias. Entonces pueden ser
usados los métodos de comparación por contrastes.
83
T.
Contraste
Una expresión de la forma
Las hipótesis de
C   i 1 ci i
k
comparación de medias son
contrastes. Por ejemplo, la
es una combinación lineal de las hipótesis H0: µi=µj se puede
medias poblacionales de interés, escribir como H0: µi - µj =0 ,
donde los coeficientes ci son el contraste correspondiente
números reales. La combinación es la combinación lineal
lineal C se llama contraste si ciµi+cjµj, con ci= 1 Y cj=-1,
e interesa verificar si es
cumple que la suma de los
estadísticamente igual a
coeficientes es igual a cero
cero.

k
i 1
ci  0 84
T.
Considerando lo anterior, las pruebas de hipótesis que

incluyen contrastes pueden hacerse de dos maneras
básicas: Utilizando la prueba t, o bien, la prueba F.
Usando t: El contraste de interés se
escribe en términos de los totales de Para tamaños de muestra
los tratamientos. Así, el estadístico es: diferentes:
k
c y .
k
i i c y . i i
t0  i 1
t0  i 1
k
nMS E  c
k
MS E  ni ci2
2
i
i 1 i 1
Se rechaza H0 si
t0 t  , N k
85
T.
Usando F:
2
 k

  ci yi . 
Se rechaza H0 si
F0   i 1 k  F0  F ,1, N k
nMS E  ci2
i 1
Para tamaños de muestra
MSC SSc / 1 desiguales:
F0  
MS E MS E  k

2
  ci yi . 
SSc   i 1 
2
 k

 i i 
k
c y .
SSc   i 1   ii
n c
i 1
2
k
n ci2
86
i 1
Elección del tamaño de la muestra
Esta es una decisión importante en cualquier diseño.
Por lo general, si se esperan diferencias pequeñas

entre tratamientos, será necesario un mayor tamaño
de muestra.
Aunque existen varios métodos para estimar el

tamaño muestral, muchas veces tienen poca
aplicabilidad porque requieren cierto conocimiento
previo sobre la varianza del error.
87
Recurriendo a la bibliografía, se menciona que
es importante considerar el tiempo y el costo,
pero por experiencia, el número de réplicas en
la mayoría de las situaciones experimentales
en las que se involucra un factor, varía entre
cinco y diez; incluso en algunos casos puede
llegar hasta 30.
La tendencia podría inclinarse por un extremo

de este rango e incluso salirse de éste, de
acuerdo con las siguientes consideraciones:
88
A menor diferencia esperada en los
tratamientos, mayor será la cantidad de réplicas
para detectar diferencias significativas, y
viceversa.
Si se espera mucha variación dentro de cada

tratamiento, debido a la variación de fuentes no
controladas, como métodos de medición, medio
ambiente, materia prima, etc., entonces se
necesitarán más réplicas.
Si son varios tratamientos (cuatro o más),

entonces éste es un punto favorable para reducir
el número de réplicas.
89
ALTERNATIVA NO PARAMÉTRICA
Prueba de Kruskal-Wallis
Si el supuesto de normalidad
no está justificado, se puede
La prueba de Kruskal-Wallis
usar un procedimiento
puede considerarse como una
alternativo ANOVA con la
prueba de la igualdad de las
prueba F que no dependa de
medias de los tratamientos.
este su puesto.
Y es una alternativa no
La prueba de Kruskal-Wallis paramétrica del análisis de
se usa para probar la varianza usual.
hipótesis nula de que los k
tratamientos son idénticos
contra la alternativa de que D. Mineralurgia/DOE V. García
no lo son. T.
90
T.
Para realizar la prueba,

1º. Se hace la clasificación en rangos de todas las
observaciones, en orden ascendente;
2º Cada observación se reemplaza con su rango, por
ejemplo Rij asignándole a la observación menor el
rango 1.
3º En el caso de empates se asigna el rango promedio
a cada una de las observaciones empatadas.
4º Si Ri. es la suma de los rangos del tratamiento i-
ésimo, el estadístico de prueba es
k 2
12 R
KW  
N ( N  1) i 1 ni
 3( N  1)
i
Se rechaza la hipótesis nula si KW > KWα 91

4 IntroduANOVA 2

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

4 IntroduANOVA 2

Загружено:

Авторское право:

Доступные форматы

3.

Puede ser de interés, por ejemplo:

Desde el punto de vista estadístico, la

La estrategia natural para resolver este

Los diseños experimentales más utilizados para

Familia de diseños para comparar tratamientos.

La comparación de los tratamientos en cuanto a la

con uno, dos, tres o cuatro criterios de clasificación,

El nombre análisis de varianza se

Para cada diseño comparativo se tienen al menos dos

Los tratamientos o niveles del factor

Se agrega una nueva fuente variabilidad por cada

En estos modelos también se observa que los

Que exista interacción entre dos factores, se

El diseño completamente al azar es el más

Suponiendo que se tienen:

k tratamientos o niveles diferentes de un solo factor

La respuesta observada de cada uno de los k

Tabla 4.1.- Datos típicos de un experimento de un solo factor

1 y11 y12 ... y1n y1 y1

2 y21 y22 ... y2n y2 y2

Se encontrará útil describir las observaciones

El modelo es una manera de expresar

Una manera de escribir el modelo que nos

i  es la media del nivel del factor o tratamiento i-ésimo

es un componente del error aleatorio que incorpora

Es conveniente considerar que los errores tienen

A la ecuación anterior se le llama el modelo de

Una forma alternativa de escribir un modelo de

de tal modo que el modelo se convierte en:

A esta ecuación se le llama por lo general el

A la ecuación o modelo de los efectos, se le llama

Además, será un requisito que el experimento se

Por lo tanto, el diseño experimental es un

ANOVA PARA UN DCA

Análisis de varianza (ANOVA) es una metodología en

La idea general de esta técnica es separar la variación

En el caso del DCA se separan la variabilidad debida a

a) Variabilidad total b) Variabilidad total

No hay efecto de tratamiento Sí hay efecto de tratamiento

Figura 4. .- Partición de la variación total en sus componentes en un DCA

Cuando la primera predomina "claramente"

Cuando los tratamientos contribuyen igual o

Para representar de manera abreviada cantidades

yi.  Suma de las

Media de las Media global o

Así entonces, el objetivo del análisis de varianza en el

la cual se puede escribir de forma equivalente como:

donde τi es el efecto del tratamiento i sobre la variable de

Para probar la hipótesis mediante la técnica de ANOVA

Variabilidad Variabilidad debida a + Variabilidad debida al

La suma de cuadrados total corregida, se usa como

Sumando y restando adentro del paréntesis la media

Donde el primer componente es la suma de

La SSTRAT mide la variación o diferencias

Mientras que la SSE mide la variación dentro

En forma abreviada, esta descomposición de la suma

Esta ecuación es llamada a menudo:

la ecuación fundamental del análisis

La ecuación anterior muestra

la suma de cuadrados de las

Puede observarse que la identidad del análisis de

una basada en la variabilidad propia e