Вы находитесь на странице: 1из 91

3.

COMPARACIÓN DE
k TRATAMIENTOS
(Introducción al ANOVA)
V. García T.

1
INTRODUCCIÓN
En esta sección, aunque se sigue considerando un solo
factor, se presentan los diseños experimentales que se
utilizan cuando el objetivo es comparar más de dos
tratamientos.

Puede ser de interés, por ejemplo:


•comparar tres o más máquinas,
•varios proveedores,
•cuatro procesos,
•tres materiales, etc.
2
Por lo general el interés del
experimentador se centra en comparar
los tratamientos en cuanto a sus medias
poblacionales, sin olvidar que también es
importante compararlos en relación a sus
varianzas.

3
D. Mineralurgia/DOE V. García T.
Fuente: Bibliografía propuesta

Desde el punto de vista estadístico, la


hipótesis fundamental a probar cuando se
comparan varios tratamientos es:

H 0 : 1  2  3 ...  k
H1 : i   j para a lg ún i  j

4
D. Mineralurgia/DOE V. García T.
Fuente: Bibliografía propuesta

La estrategia natural para resolver este


problema es obtener una muestra
representativa de mediciones en cada
uno de los tratamientos, y con base en
las medias y varianzas muestrales, construir
un estadístico de prueba para decidir el
resultado de dicha comparación.

5
D. Mineralurgia/DOE V. García T.
Fuente: Bibliografía propuesta

Los diseños experimentales más utilizados para


comparar tratamientos, considerando desde cero hasta
tres factores de bloque, son respectivamente:
1. Diseño completamente al azar.
2. Diseño en bloques completos al azar.
3. Diseño en cuadro latino.
4. Diseño en cuadro grecolatino.
La diferencia fundamental entre estos diseños es el
número de factores de bloque que incorporan o
controlan de forma explícita durante el experimento.

6
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Familia de diseños para comparar tratamientos.

7
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

La comparación de los tratamientos en cuanto a la


respuesta media que logran, en cualquiera de estos
diseños, se hace mediante las hipótesis:
H 0 : 1  2  3 ...  k  
H1 : i   j para a lg ún i  j
y se prueba con la técnica estadística llamada

con uno, dos, tres o cuatro criterios de clasificación,


dependiendo del número de factores de bloque incorporados
al diseño.
8
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

El nombre análisis de varianza se


deriva de la partición de la
variabilidad total en sus partes
componentes.

9
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Para cada diseño comparativo se tienen al menos dos


fuentes de variabilidad, a saber:

Los tratamientos o niveles del factor


de interés
y el error aleatorio.

Se agrega una nueva fuente variabilidad por cada


factor de bloque que se controla directamente.

10
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

En estos modelos también se observa que los


diseños suponen que no hay efectos de
interacción entre los factores; es deseable que
efectivamente eso ocurra, de lo contrario la
variabilidad de cada interacción activa se carga al
error y el problema de comparación no se resuelve
con éxito.

Que exista interacción entre dos factores, se


refiere a que el efecto de cada factor depende
del nivel en que se encuentra el otro.
11
Diseño completamente aleatorizado

El diseño completamente al azar es el más


simple de todos los diseños que se utilizan
para comparar dos o más tratamientos, dado
que sólo considera dos fuentes de variabilidad:
los tratamientos y el error aleatorio.

D. Mineralurgia/DOE V. García
T. 12
Fuente: Bibliografía propuesta
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Suponiendo que se tienen:

k tratamientos o niveles diferentes de un solo factor


que quieren compararse.

La respuesta observada de cada uno de los k


tratamientos es una variable aleatoria. Los datos
aparecerían como en la siguiente tabla. Una entrada de la
tabla (por ejemplo, yij) representa la observación j-
ésima tomada bajo el nivel del factor o tratamiento i.

13
y ..1k2
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Tabla 4.1.- Datos típicos de un experimento de un solo factor

Nivel del
Observaciones Totales Promedios
factor

1 y11 y12 ... y1n y1 y1

2 y21 y22 ... y2n y2 y2


. . . . . . .
. . . . . . .
. . . . . . .
k yk1 yk2 ... ykn yk yk
y.. y..
Habrá, en general, n observaciones bajo el
tratamiento i-ésimo. 14
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Modelo

Se encontrará útil describir las observaciones


de un experimento con un modelo.

El modelo es una manera de expresar


matemáticamente todo lo que se supone puede
influir sobre la variable de respuesta, en un
diseño dado.

15
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Una manera de escribir el modelo que nos


ocupa es:
i  1,2,..., k
yi j  i   i j
j  1, 2,..., n

yi j  Es la observación ij-ésima

i  es la media del nivel del factor o tratamiento i-ésimo

es un componente del error aleatorio que incorpora


i j  todas las demás fuentes de variabilidad del
experimento, incluyendo las mediciones, la variabilidad
que surge de factores no controlados, las diferencias
entre las unidades experimentales, y el ruido de fondo
general en el proceso.
16
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Es conveniente considerar que los errores tienen


media cero, de tal modo que E(yij) =µi.

A la ecuación anterior se le llama el modelo de


las medias.

Una forma alternativa de escribir un modelo de


los datos es definiendo    
i i

17
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

de tal modo que el modelo se convierte en:

yi j     i   i j
En esta forma del modelo, µ es un parámetro
común a todos los tratamientos al que se llama la
media global, y τi es un parámetro único del
tratamiento i-ésimo al que se le llama el efecto del
tratamiento i-ésimo.

A esta ecuación se le llama por lo general el


modelo de los efectos. 18
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

A la ecuación o modelo de los efectos, se le llama


también el
o de un solo factor (o
dirección), porque únicamente se investiga un factor.

Además, será un requisito que el experimento se


lleve a cabo en orden aleatorio para que el ambiente
en el que se apliquen los tratamientos sea lo más
uniforme posible.

Por lo tanto, el diseño experimental es un


.
19
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

ANOVA PARA UN DCA

Análisis de varianza (ANOVA) es una metodología en


la que de hecho se utilizan cocientes de varianzas para
probar la hipótesis de igualdad de medias.

La idea general de esta técnica es separar la variación


total en las partes con la que contribuye cada fuente
de variación en el experimento.

En el caso del DCA se separan la variabilidad debida a


los tratamientos y la debida al error.

20
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

a) Variabilidad total b) Variabilidad total

21
Variabilidad Variabilidad Variabilidad
debida a Variabilidad
debida a debida a debida a
tratamientos error tratamientos error

No hay efecto de tratamiento Sí hay efecto de tratamiento

Figura 4. .- Partición de la variación total en sus componentes en un DCA


D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Cuando la primera predomina "claramente"


sobre la segunda es cuando se concluye que
los tratamientos tienen efecto (figura 4.1b), o
lo que es lo mismo, las medias son diferentes.

Cuando los tratamientos contribuyen igual o


menos que el error, se concluye que las
medias son iguales (figura 4.1a).

22
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Para representar de manera abreviada cantidades


numéricas que se pueden calcular a partir de los
datos en un diseño completamente al azar, en la cual
yij representa la j-ésima observación en el tratamiento
i, con i = 1, 2, ... , k y j = 1, 2, ... , ni se tiene que:

yi.  Suma de las


observaciones del
y..  Suma total de las
N=n1+n2…+nk
tratamiento i mediciones

Media de las Media global o


y i.  observaciones del i- y ..  promedio de todas
ésimo tratamiento las observaciones 23
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Así entonces, el objetivo del análisis de varianza en el


DCA es probar la hipótesis de igualdad de las
respuestas medias dadas por
H 0 : 1  2  3 ...  k  
H1 : i   j para a lg ún i  j

la cual se puede escribir de forma equivalente como:


H 0 :  1   2   3 ...   k  0
H1 :  i  0 para a lg ún i

donde τi es el efecto del tratamiento i sobre la variable de


respuesta. 24
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Para probar la hipótesis mediante la técnica de ANOVA


con un criterio de clasificación, lo primero es
descomponer la variabilidad total de los datos en sus
dos componentes, como ya se ha mencionado:

Variabilidad Variabilidad debida a + Variabilidad debida al


total = diferencias entre error (también
tratamientos llamada variabilidad
(efectos del factor) residual, diferencias
dentro de cada
tratamiento)
25
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

La suma de cuadrados total corregida, se usa como


una medida de la variabilidad global de los datos.

 
k n k n 2
y
SST   yi j  y..   y i2j  ..
2

i 1 j 1 i 1 j 1 kn
Intuitivamente, esto es razonable porque, si SST
tuviera que dividirse por el número apropiado de
grados de libertad (en este caso, kn - 1 = N - 1), se
obtendría la varianza muestral de las y. La varianza
muestral es, desde luego, una medida de variabilidad.

26
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Sumando y restando adentro del paréntesis la media


del tratamiento i,
2

   
k n
SST    y i .  y ..  yi j  y i. 
i 1 j 1
 

y desarrollando el cuadrado
k n k k n

 ( y
i 1 j 1
ij  y..)  n ( yi .  y..)   ( yij  yi .)
2

i 1
2

i 1 j 1
2

27
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Donde el primer componente es la suma de


cuadrados de tratamientos (SSTRAT) y el segundo es
la suma de cuadrados del error(SSE).

La SSTRAT mide la variación o diferencias


entre tratamientos.

Mientras que la SSE mide la variación dentro


de tratamientos.

28
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

En forma abreviada, esta descomposición de la suma


total de cuadrados se puede escribir como

SST  SSTRATAMIENTOS  SS E

Esta ecuación es llamada a menudo:

la ecuación fundamental del análisis


de varianza.
29
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

La ecuación anterior muestra


La diferencia entre los promedios
que la variabilidad total de
observados de los tratamientos y
los datos, medida por la suma
el promedio general constituye
total de cuadrados, puede
una medida de la diferencia
descomponerse en entre las medias de tratamiento,
1

la suma de cuadrados de las


diferencias entre los mientras que la causa de las
promedios de los tratamientos diferencias de las observaciones
y el promedio general, y dentro de los tratamientos con
2
respecto al promedio del
en la suma de cuadrados de tratamiento puede ser solamente
las diferencias entre las el error aleatorio.
observaciones dentro del
tratamiento y el promedio del
mismo.
30
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Puede observarse que la identidad del análisis de


varianza proporciona dos estimaciones para la varianza:

una basada en la variabilidad propia e


interna de los tratamientos,
y otra en la variabilidad de los mismos.
Si no existe diferencia en el nivel medio de los
tratamientos, estas dos estimaciones deben ser
similares; de no ser así, se sospecharía que la diferencia
observada puede ser el resultado de una diferencia
entre las medias de los tratamientos.
31
Esta comparación se facilita si
primero se escala estas sumas
de cuadrados dividiéndolas
Entonces: por su número de grados de
libertad.
Si SSTRAT es grande, es debido a
las diferencias entre las medias Hay Kn = N observaciones
de los diferentes niveles del totales. Asi, SST tiene N - 1
grados de libertad. Hay k
factor o tratamientos. niveles de factor, así SSTRAT
tiene k – 1 grados de libertad.
Así, comparando la magnitud Finalmente, dentro de cada
de SSTRAT y SSE se puede saber nivel hay n observaciones, por
cuánta variabilidad es debida a lo cual, hay n – 1 grados de
libertad con los cuales estimar
los cambios de los niveles de el error experimental. Como
factor o tratamientos, y cuánta hay k niveles del factor, se
es debida al error. tiene k(n – 1) grados de
libertad para el error. 32
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

La relación de la suma de cuadrados y su número de


grados de libertad, es llamado Cuadrado medio:

SSTRAT SS E
MS TRAT  y
MS E 
k 1 k (n  1)

Cuando la hipótesis nula es verdadera, ambos cuadrados


medios son estimadores insesgados de la varianza común
σ2 de los tratamientos que se comparan. En cambio,
cuando la igualdad de las k medias es falsa, el cuadrado
medio del error sigue siendo un estimador insesgado de la
varianza, mientras que el cuadrado medio de tratamientos
deja de ser un estimador insesgado de la varianza, y el
sesgo que surge se atribuye a que las medias no son 33

iguales.
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Con base en este hecho se construye el estadístico


de prueba:
Estimación de  2 basada en la var iación entre las medias muestrales
F0 
Estimación de  2 basada en la var iación dentro de las muestras

MS TRAT debe seguir una distribución F con


F0  ν1=(k - 1) grados de libertad en el
MS E numerador y ν2=(N - k) grados de
libertad en el denominador.

se deduce que si F0 es grande se contradice la hipótesis


de que no hay efectos de tratamientos, en cambio si F0
es pequeño se confirma la validez de H0. Así, para un
nivel de significancia α prefijado, se rechaza H0 si F0 >
Fα, ν1, ν2 . 34
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Toda la información necesaria para calcular el


estadístico F0 se escribe en la llamada

tabla de análisis de varianza


(TABLA DE ANOVA).
El análisis de varianza es la técnica estadística
fundamental para el análisis de todo tipo de
diseños experimentales.
35
TABLA DE ANOVA
Para un experimento de un solo factor

FUENTE GRADOS CUADRADO MEDIO


SUMA DE DE RAZÓN F0
DE VARIACIÓN
CUADRADOS LIBERTAD (Estimaciones de la varianza)

1.- Tratamientos SS TRAT


SSTRAT k –1 MS TRAT 
* k 1 F0 
MSTRAT
MS E

2.- Error SSE k( n – 1) MS E 


SS E
** k (n  1)

TOTAL SST kn - 1

D. Mineralurgia/DOE V. García 36
T.
Fuente: Bibliografía propuesta
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Fórmulas usadas para calcular las sumas


de los cuadrados (cálculos manuales).

Igual tamaño de las muestras:

k n 2
y
SST   y  2
ij
..

i 1 j 1 kn

k 2 2
y . y ..
SSTRAT .    i

i 1 n kn

SS E  SST  SSTRAT
37
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

En algunos experimentos unifactoriales, el número de


observaciones tomadas para cada tratamiento puede ser
diferente.
En este caso se dice que el diseño no está balanceado.

En este caso, puede emplearse el análisis de varianza descrito


anteriormente, con ligeras modificaciones a las fórmulas para
las sumas de cuadrados.
Grados de
2
Sea ni el número de k
y n libertad:
observaciones bajo cada SST   yij2  .. Para los
tratamiento i (i = 1, 2, ..., i 1 j 1 N tratamientos =
k), y N=∑ ni , el número k–1
total de observaciones. k
yi2 . y 2 .. Para el error =
Las fórmulas para los
cálculos son:
SSTRAT .    N–k
i 1 ni N Para el total =
N–1 38
VERIFICACIÓN DE LA ADECUACIÓN
DEL MODELO
La validez de los resultados obtenidos en cualquier
análisis de varianza queda supeditado a que los
supuestos del modelo se cumplan.

Estos supuestos del modelo de ANOVA son:

normalidad,
varianza constante (igual varianza de
los tratamientos),
independencia.
D. Mineralurgia/DOE V. García 39
T.
Fuente: Bibliografía propuesta
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Las violaciones de los supuestos básicos y la


adecuación del modelo pueden investigarse
con facilidad mediante el examen de los

residuales. Los residuos


cantidades que
presentan a los errores.
son
re

El residual de la observación j-ésima en el


tratamiento i-ésimo se define como la
diferencia entre respuesta observada y la
diferencia predicha:
Si el modelo es adecuado, los

 i j  yi j  y ij
residuales deberán estar sin
estructura; es decir, no
deberán contener patrones
obvios. 40
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Para comprobar cada supuesto existen pruebas


analíticas y gráficas.
Se recomiendan las pruebas gráficas dado que se
pueden aplicar con pocos datos, cosa que no sucede
con las pruebas analíticas; estas últimas pierden
drásticamente su potencia con pocos datos.
Las pruebas gráficas tienen el inconveniente de que no
son "exactas", pero aun así en la mayoría de las
situaciones, proporcionan evidencia suficiente en contra
o a favor de los supuestos.
41
El uso de las pruebas gráficas requiere fuerte evidencia
visual para concluir que el supuesto en cuestión no se
cumple.
Cuando es uno o dos los puntos que se salen del
comportamiento esperado de las gráficas se puede
tratar de un problema de puntos aberrantes, no de
violación del supuesto en cuestión.
En ese caso debe investigarse la obtención de dichas
mediciones atípicas.

42
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Normalidad

Gráfica de probabilidad en papel normal.

Es un procedimiento gráfico para verificar la


normalidad de los residuos. Ésta es una gráfica del tipo
X-Y que tiene las escalas de tal manera que si los
residuos siguen una distribución normal, al ser
graficados tienden a quedar alineados en una línea
recta. Por lo tanto, si claramente no se alinean, se
concluye que el supuesto de normalidad no es
correcto.
43
Los pasos en la construcción de la gráfica de
probabilidad normal, para los N residuos son los
siguientes:

1. Ordenar los N valores del menor al mayor,


asignándoles rangos de 1 a N.
2. Calcular una posición de graficación para cada dato
en función de su rango y del total de observaciones
como (i - 0.5)/N, i = 1, 2,..., N.
3. El papel de probabilidad normal tiene una de las
escalas lineal (eje X) y la otra logarítmica (eje Y); así,
sobre éste se ubican las parejas [eij, (i - 0.5)/N].
4. Dibujar una línea recta sobre los puntos para tratar
de dilucidar si se ajustan a ella o no.
La LR debe ser trazada ajustándose sobre los puntos
centrales, y no los extremos. Debe ser una L 44
D. Mineralurgia/DOE V. García
simultáneamente lo más cerca posible a todos los
T.
Fuente: Bibliografía propuesta puntos.
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

La grafica de probabilidad también puede ser elaborada


en papel ordinario con escalas equiespaciadas en
ambos ejes. Para ello, en lugar de graficar directamente
la frecuencia acumulada observada (i - 0.5) / N se grafica
su correspondiente valor normal estandarizado Zi que
cumple la relación:

 i  0.5
 P  Z  Zi   ( Zi )
N
Donde ( Z i ) es la distribución normal estándar
acumulada evaluada en Zi.

La interpretación de la gráfica es subjetiva, pero muchas veces es


suficiente para llegar a una conclusión razonable sobre la distribución que
siguen los datos. 45
46

Fig. 4.2.- Gráficas de probabilidad normal, en papel


normal y en papel ordinario.

D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta
47

Fig. 4.3.- Ejemplo de gráficas de residuos, verificando el supuesto


de normalidad para el Anova, donde no se cumple éste.

D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta
48

Fig. 4.4.- Gráfica de residuos, verificación del


supuesto de normalidad.
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta
49

Fig. 4.5.- Otro ejemplos de gráficas de probabilidad


normal.

D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta
50

Fig. 4.6.- Gráficas de probabilidad normal: a) ideal, b) distribución con colas gruesas;
c) distribución con colas delgadas; d) asimetría positiva; e) asimetría negativa.

D. Mineralurgia/DOE V. García
T.
Para detectar puntos atípicos o aberrantes, puede
hacerse una verificación aproximada de examinando los
residuales estandarizados:
eij
di j 
MS E

Si los errores son N(0, σ2), cerca de 95% de ellos


los residuales estandarizados deberán estar incluidos
deberán ser aproximadamente dentro de ±2 y virtualmente
normales con media cero y todos ellos deberán estar
varianza unitaria. Por lo tanto, incluidos dentro de ±3.
cerca de 68% de los Un residual mayor que 3 o 4
residuales estandarizados desviaciones estándar a partir
deberán estar incluidos de cero es un punto atípico
dentro de los límites ±1, potencial. 51
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Independencia
La suposición de independencia en Si el comportamiento de los
los residuos puede verificarse si se puntos es aleatorio, el
grafica el orden en que se colectó supuesto se está
un dato contra el residuo cumpliendo.
correspondiente:
La violación de este supuesto
en el eje horizontal se grafica el generalmente indica
tiempo (orden de corrida) y en el deficiencias en la planeación y
eje vertical los residuos; si se ejecución del experimento,
detecta una tendencia o patrón no puede ser que no se aleatorizó
aleatorio claramente definido, en forma correcta, o que
entonces es evidencia de que conforme se fueron realizando
las pruebas experimentales
existe una correlación entre los
hubo factores que afectaron la
errores y por lo tanto el supuesto respuesta observada.
de independencia no se cumple. 52
53

Fig. 4.7.- Residuales graficados en orden del tiempo

D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta
54

Residuales

Fig. 4.8.- Gráfica de residuos, verificación de la


independencia

D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta
La violación de este supuesto generalmente indica deficiencias en la planeación y ejecución del
experimento; o puede ser un indicador de que no se aplicó en forma correcta el principio de aleatorización; o
de que conforme se fueron realizando las pruebas aparecieron factores que afectaron la respuesta.

55

Fig. 4.9.- Gráficas prototipo de residuales que muestran violación al


supuesto de independencia.

D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta
56

Fig. 4.10.- Más ejemplos de gráficas que no cumplen con el supuesto de


independencia en el Anova.

D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Varianza constante

Una forma de verificar el supuesto de varianza


constante es graficando los predichos (eje horizontal)
contra los residuos (en el eje vertical).

Si los puntos se distribuyen aleatoriamente en una


banda horizontal (sin ningún patrón claro y
contundente), entonces es señal de que se cumple este
supuesto. Por el contrario, si se distribuyen con algún
patrón, por ejemplo en forma de "corneta o embudo",
entonces es señal de que no se está cumpliendo el
supuesto.
57
Si los niveles del factor que tienen las
Si se viola el supuesto varianzas mayores corresponden con
de la homogeneidad los tamaños de las muestras más
de las varianzas, la pequeños, el error tipo 1 real es mayor
prueba F sólo resulta que lo previsto (o los intervalos de
afectada ligeramente confianza tienen niveles de confianza
en el modelo reales más bajos que los
balanceado con especificados).
efectos fijos. Sin Si los niveles del factor con las
embargo, en diseños varianzas mayores tienen también los
no balanceados o en tamaños de las muestras mayores, los
casos en que una de niveles de significación son mucho
las varianzas es menores que lo anticipado (los niveles
considerablemente de confianza son más altos).
más grande que las Ésta es una buena razón para escoger
demás, el problema es tamaños de muestras iguales siempre
más grave. que sea posible.
58
59

Fig. 4.11.- Residuales graficados contra valores ajustados

D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta
60

Fig. 4.12.- Ejemplos de gráficas de residuos cuando no se cumplen los


supuestos de Anova.

D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta
61

Fig. 4.13.- Patrones en las


gráficas de residuales:
a) satisfactorio, b) en
embudo, c) en doble arco,
d) no lineal.

D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta
(1) La varianza depende de la media: el error tiene relación directa con la magnitud del pronóstico (valor
predicho o ajustado) (Los datos pueden ser transformados) (2) Error en el análisis; tal vez se omitió la
media en el modelo (o ese factor en el modelo). (3) Tal vez sea necesario un término de segundo orden
en el modelo. (Transformación de los datos).
62

Fig. 4.14.- Impresión que


deben dar los residuales
satisfactorios.
(Banda aleatoria)

Fig. 4.15.- Nuevamente, ejemplos de


D. Mineralurgia/DOE V. García
características mostradas por conducta no
T. satisfactoria de los residuales.
Fuente: Bibliografía propuesta
Pruebas estadísticas para verificar los
supuestos del modelo.

Prueba de Shapiro-Wilks para normalidad


Considerando una muestra aleatoria de datos x1, x2,
…, xn que proceden de cierta distribución
desconocida, se quiere verificar si dichos datos fueron
generados por un proceso normal, mediante las
hipótesis estadísticas:

H0: Los datos proceden de una distribución normal.


H1: Los datos no proceden de una distribución normal

D. Mineralurgia/DOE V. García 63
T.
Fuente: Bibliografía propuesta
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Los pasos para la prueba de Shapiro-Wilks son:

1. Se ordenan los datos de menor a mayor.


2. De la tabla correspondiente se obtienen los
coeficientes a1, a2,…,ak, donde ak es
aproximadamente n/2.
3. Se calcula el estadístico W:

2
1  
 (i ) 
k
W 2  
(n  1) s  i1
ai x( n i 1)  x

Si el valor del estadístico es mayor que su valor crítico al
nivel α seleccionado se rechaza la normalidad de los datos.
64
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Prueba de Bartlett de homogeneidad de varianzas

Si se tienen k poblaciones o tratamientos


independientes, donde las varianzas son desconocidas,
y se quiere probar la igualdad de varianzas:

H 0 :  12   2 2   32 ...   k 2   2
H1 :  i 2   j 2 para a lg ún i  j

El estadístico de prueba está dado por:

q
 0  2.3026
c
65
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

donde
k
q  ( N  k )log10 s 2p    ni  1 log10 si2
i 1

1  k 1 
  ni  1   N  k  
1
c  1 
3  k  1  i 1 

 i1 i 1
k
( n  1) s 2

s 2p 
N k
Se rechaza H0 si  0 2 2
 , k 1 66
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Prueba de Cochran para homogeneidad de


varianzas
Se quiere probar:
H 0 :  12   2 2   32 ...   k 2   2
H1 :  i 2   j 2 para a lg ún i  j

Se calcula el estadístico de Y se compara con el valor


prueba: crítico obtenido en la tabla
de Cochran gα
2
Mayor s
G0  2
S1  S2  ...  Sk
2 2
Si G0 > gα se rechaza H0.

67
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Estimación de los parámetros del modelo

Considerando el modelo yi j     i   i j

es posible determinar una estimación del intervalo de


confianza de la media del tratamiento i-ésimo,
utilizando MSE como estimador de σ2, el intervalo de
confianza se basaría en la distribución t. Por lo tanto,
un intervalo de confianza de 100(1- α) por ciento para
la media i del tratamiento i-ésimo es:

MS E
y i  t /2, N k
n 68
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Un intervalo de confianza de 100(1- α) por ciento


para la diferencia en las medias de dos tratamientos
cualesquiera, por ejemplo    sería:
i j

2 MS E
y i  y j  t /2, N k
n

69
COMPARACIONES O PRUEBAS
DE RANGO MÚLTIPLES

Después que se rechaza la hipótesis nula en el


análisis de varianza, se puede ir a detalle y ver
cuáles tratamientos son diferentes.

Esto se responde probando la igualdad de todos los


posibles pares de medias, mediante las hipótesis:

H 0 : i   j
H1 : i   j para toda i  j

D. Mineralurgia/DOE V. García 70
T.
Fuente: Bibliografía propuesta
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Para probar estas hipótesis se han propuesto métodos


diferentes, conocidos como

métodos de comparaciones múltiples o


pruebas de rango múltiple.
La diferencia primordial entre los métodos radica en la
potencia que tienen para detectar las diferencias entre
las medias. Se dice que una prueba es más potente si
es capaz de detectar diferencias más pequeñas,
siempre y cuando estas diferencias sean reales.

71
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Algunos de estos métodos son:

 Método LSD (Diferencia mínima


significativa)
 Prueba de Tukey
 Prueba de Duncan
 Prueba de Dunnet
 Método de Sheffé
72
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Método LSD
(diferencia mínima significativa)

Una vez que se rechazó H0 en el anova, para cualquier


par de medias de dos tratamientos, µi y µj , se
declararían significativamente diferentes si:

1 1 
y i  y j  t /2, N k MS E   
n
 i nj 
A la cantidad
1 1 
LSD  t /2, N k MS E   
n
 i nj 
73
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

se le llama diferencia mínima significativa (least


significant difference), ya que es la diferencia mínima
que debe existir entre dos medias muestrales para
considerar que los tratamientos correspondientes son
significativamente diferentes.
Así, si cada diferencia de medias muestrales en valor
absoluto que sea mayor que LSD se concluye que las
medias poblacionales difieren.
Si el diseño es balanceado,

2 MS E
LSD  t /2, N k
n
74
Prueba de Tukey

El procedimiento de Tukey hace uso de la distribución


del estadístico del rango studentizado

y max  y min
q
MS E n

En el numerador se tienen las medias muestrales


mayor y menor, respectivamente, sacadas de un grupo
de p medias muestrales.

75
D. Mineralurgia/DOE V. García
T.
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Para tamaños de las muestras iguales, la prueba de


Tukey declara que dos medias son significativamente
diferentes si el valor absoluto de sus diferencias
muestrales excede
MS E
T  q , (k , f )
n

MSE se obtiene de la tabla de ANOVA; n es el número


de observaciones por tratamiento, k es el número de
tratamientos, f=N - k es igual a los grados de libertad
para el error, α es el nivel de significancia prefijado y
el estadístico qα, (k,f) son puntos porcentuales de la
distribución del rango studentizado, obtenidos en la
tabla correspondiente.
76
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Se declaran significativamente diferentes los pares


de medias cuya diferencia muestral en valor absoluto
sea mayor que Tα.

Cuando los tamaños de las muestras no son iguales,


la ecuación anterior quedan como:

q , ( k , f ) 1 1 
T  MS E   
n
2  i nj 
77
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Prueba del rango múltiple


de Duncan

Este es un procedimiento Para aplicar esta prueba


muy utilizado para comparar cuando los tamaños de las
todos los pares de medias. muestras son iguales, los k
Es considerado como muy promedios de los
eficaz para detectar tratamientos se arreglan
diferencias entre medias en orden ascendente, y el
cuando existen diferencias error estándar de cada
reales. promedio se determina
Por esta razón, la prueba como
del rango múltiple de MS E
Duncan es muy popular. sy 
i
n 78
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Para tamaños de muestras k


desiguales, se sustituye n nh 
1
en la ecuación anterior
 i1 n
k

con la media armónica nh, i

En la tabla de Duncan de rangos significativos se


obtienen los valores rα (p,f) para p=2,3,…, k . Estos
rangos se convierten en un conjunto de k -1 rangos
mínimos significativos

R p  r , (k , f ) s yi. Para p=2,3,…,k

79
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta
Las diferencias observadas entre
las medias, empezando con la Este proceso se continúa
más grande contra la menor, se hasta que se han
comparara con el rango mínimo considerado las diferencias
de significación Rk. Después se entre todos los pares de
calcula la diferencia de la mayor medias posibles.
y la segunda menor y se Si una diferencia
compara con el rango mínimo de observada es mayor que el
significación Rk-1 . Estas rango de significación
comparaciones se continúan mínima correspondiente,
hasta que todas las medias se se concluye que el par de
han comparado con la media medias en cuestión es
mayor. Luego se calcula la significativamente
diferencia entre la segunda diferente.
media mayor y la menor y se
compara con el rango mínimo de
significación Rk-1 80
Comparación de medias de
tratamientos con un control

En muchos experimentos, uno de los tratamientos es


un control, y el analista se interesa en comparar cada
una de las medias de los k-1 tratamientos restantes
con el control. Por lo tanto, sólo es necesario hacer k-1
comparaciones.

Un procedimiento para hacer estas comparaciones es


el método de Dunnett.

D. Mineralurgia/DOE V. García 81
T.
Fuente: Bibliografía propuesta
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Suponiendo que el tratamiento de control es k, y que


quieren probarse las hipótesis
H0 : i   k
H1 : i   k Para i = 1,2,…, k-1

La hipótesis nula se rechaza si

1 1 
y i.  y k .  d , (k  1, f ) MS E   
n
 i nj 

donde dα,(k-1,f) es el valor en tablas.

Para diseño balanceado se tiene: 2 MS E


n 82
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Comparación por contrastes

No siempre interesa probar las hipótesis dos a dos, o


bien, no siempre éstas interesan todas por igual. En
ocasiones se tiene interés de contrastar hipótesis que
involucran a más de dos medias. Entonces pueden ser
usados los métodos de comparación por contrastes.

83
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Contraste
Una expresión de la forma
Las hipótesis de
C   i 1 ci i
k
comparación de medias son
contrastes. Por ejemplo, la
es una combinación lineal de las hipótesis H0: µi=µj se puede
medias poblacionales de interés, escribir como H0: µi - µj =0 ,
donde los coeficientes ci son el contraste correspondiente
números reales. La combinación es la combinación lineal
lineal C se llama contraste si ciµi+cjµj, con ci= 1 Y cj=-1,
e interesa verificar si es
cumple que la suma de los
estadísticamente igual a
coeficientes es igual a cero
cero.


k
i 1
ci  0 84
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Considerando lo anterior, las pruebas de hipótesis que


incluyen contrastes pueden hacerse de dos maneras
básicas: Utilizando la prueba t, o bien, la prueba F.
Usando t: El contraste de interés se
escribe en términos de los totales de Para tamaños de muestra
los tratamientos. Así, el estadístico es: diferentes:
k

c y .
k
i i c y . i i
t0  i 1
t0  i 1
k
nMS E  c
k
MS E  ni ci2
2
i
i 1 i 1

Se rechaza H0 si
t0 t  , N k
85
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta
Usando F:
2
 k

  ci yi . 
Se rechaza H0 si

F0   i 1 k  F0  F ,1, N k
nMS E  ci2
i 1
Para tamaños de muestra
MSC SSc / 1 desiguales:
F0  
MS E MS E  k

2

  ci yi . 
SSc   i 1 
2
 k

 i i 
k
c y .
SSc   i 1   ii
n c
i 1
2

k
n ci2
86
i 1
Elección del tamaño de la muestra

Esta es una decisión importante en cualquier diseño.

Por lo general, si se esperan diferencias pequeñas


entre tratamientos, será necesario un mayor tamaño
de muestra.

Aunque existen varios métodos para estimar el


tamaño muestral, muchas veces tienen poca
aplicabilidad porque requieren cierto conocimiento
previo sobre la varianza del error.

87
Recurriendo a la bibliografía, se menciona que
es importante considerar el tiempo y el costo,
pero por experiencia, el número de réplicas en
la mayoría de las situaciones experimentales
en las que se involucra un factor, varía entre
cinco y diez; incluso en algunos casos puede
llegar hasta 30.

La tendencia podría inclinarse por un extremo


de este rango e incluso salirse de éste, de
acuerdo con las siguientes consideraciones:
88
A menor diferencia esperada en los
tratamientos, mayor será la cantidad de réplicas
para detectar diferencias significativas, y
viceversa.

Si se espera mucha variación dentro de cada


tratamiento, debido a la variación de fuentes no
controladas, como métodos de medición, medio
ambiente, materia prima, etc., entonces se
necesitarán más réplicas.

Si son varios tratamientos (cuatro o más),


entonces éste es un punto favorable para reducir
el número de réplicas.
89
ALTERNATIVA NO PARAMÉTRICA
Prueba de Kruskal-Wallis
Si el supuesto de normalidad
no está justificado, se puede
La prueba de Kruskal-Wallis
usar un procedimiento
puede considerarse como una
alternativo ANOVA con la
prueba de la igualdad de las
prueba F que no dependa de
medias de los tratamientos.
este su puesto.
Y es una alternativa no
La prueba de Kruskal-Wallis paramétrica del análisis de
se usa para probar la varianza usual.
hipótesis nula de que los k
tratamientos son idénticos
contra la alternativa de que D. Mineralurgia/DOE V. García
no lo son. T.
Fuente: Bibliografía propuesta
90
D. Mineralurgia/DOE V. García
T.
Fuente: Bibliografía propuesta

Para realizar la prueba,


1º. Se hace la clasificación en rangos de todas las
observaciones, en orden ascendente;
2º Cada observación se reemplaza con su rango, por
ejemplo Rij asignándole a la observación menor el
rango 1.
3º En el caso de empates se asigna el rango promedio
a cada una de las observaciones empatadas.
4º Si Ri. es la suma de los rangos del tratamiento i-
ésimo, el estadístico de prueba es
k 2
12 R
KW  
N ( N  1) i 1 ni
 3( N  1)
i

Se rechaza la hipótesis nula si KW > KWα 91

Вам также может понравиться