Вы находитесь на странице: 1из 2

ESTADISTICA II ING. MAT.

SERGIO CASTILLO PÁEZ

ANALISIS DE VARIANZA UNIDIRECCIONAL (ANOVA DE 1 FACTOR)

Sirve para probar la igualdad de varias medias poblacionales (no solamente de2 en 2). Se basa en el estadístico F.
El proceso estadístico se basa en la comparación de los efectos de diferentes tratamientos al ser aplicados estos en
diferentes muestras (que contienen varias unidades experimentales) en varias (c) poblaciones

Ho: 1 =2 =3 =...=  c


Ha: No todas las medias son iguales (al menos una es diferente)

Población 1 (1) Población 2 (2) Población 3 (3) Población C (c)


Muestra 1 Muestra 2 Muestra 3 Muestra 1

n1 n2 n3 nc
..........

SUPUESTOS BASICOS DEL ANOVA


Diseño completamente aleatorizado: Significa que las unidades experimentales fueron asignados a un tratamiento
de forma indistinta.
Modelo de efectos fijos: Los tratamientos son fijos o conocidos desde el inicio del estudio.
Además:
- Todas las poblaciones son normales.
- Todas las poblaciones tienen varianzas iguales
- Las muestras se eligen de manera independiente. (no es muestreo pareado)
- A cada muestra se le aplicó un determinado tratamiento.
Aunque el ANOVA trata de comparar las medias poblacionales de varias poblaciones sometidas a diferentes
tratamientos, el análisis se basa en el estudio de las variaciones inherentes a dichos tratamientos. Hay tres
variaciones en el análisis ANOVA:
- Variación Intramuestral: Es la variación de cada muestra independiente
- Variación Intermuestral: Es la variación entre los diferentes muestras, es decir, entre los diferentes
tratamientos.
- Variación Total: Es la variación de todos los datos, considerando a la suma de todas las muestras tomadas
como si fuera una sola muestra grande. Asimismo, la variación total es la suma de las dos variaciones
anteriores.
La variación intramuestral no se debe a los tratamientos, puesto que cada unidad experimental es diferente en sí
misma, pero están sometidas al mismo tratamiento. Como se supone que las varianzas poblacionales son iguales,
entonces esta variación debe ser igual dentro de cada muestra.
El efecto de cada tratamiento sobre cada muestra (si este existe) sólo está reflejada sobre la variación Intermuestral,
y esta variación debe ser mayor a la intramuestral, porque aumenta mayores fluctuaciones a los datos. En este caso,
los tratamientos no son iguales y Ho es rechazada. Para comparar entonces los tratamientos, se debe comparar sus
variaciones utilizando el estadístico F = Variación Intermuestral / Variación Intramuestral.

CONSTRUCCION DE LA TABLA ANOVA


Consideremos el siguiente caso: Usted ha aplicado tres tipos diferentes de programas de capacitación a sus
empleados para aumentar su productividad. Luego de dicha capacitación, usted les ha tomado un examen evaluativo
para conocer los resultados de cada programa:
Nro de Tipo de capacitación Esta información nos dice que cada muestra
empleados Programa 1 Programa 2 Programa 3 tiene un diferente tratamiento y también
1 85 80 82 diferente información. ¿Es posible concluir que
2 72 84 80 todos los programas de capacitación son
3 83 81 85 iguales?
4 80 78 90 Nótese que cada muestra tiene un tamaño ni. Es
5 * 82 88 decir:
Promedio ( X 80 81 85 n1= 4; n2= 5; n3= 5;
el tamaño total es n = n1 + n2 + n3= 14;
)
Como hay 3 programas diferentes, c = 3
Luego, se calcula el promedio de cada muestra, y luego la media general X (promedio de promedios):
c
 n i Xi 4(80)  5(81)  5(85)
X = i 1 = = 82,14
14
n
ESTADISTICA II ING. MAT. SERGIO CASTILLO PÁEZ

SUMAS DE CUADRADOS
r c
Suma Cuadrada Total = SST =   (X
j1 i 1
ij  X ) 2 = 251,7

(es decir, a cada valor se le resta la media general y se eleva al cuadrado y se suma) – (Variación Total)

c
Suma Cuadrada del Tratamiento = SSTR = n i 1
i (X i  X ) 2 = 65,7

(a cada promedio muestral se le resta la media general, se eleva al cuadrado, se multiplica por el tamaño de la
muestra y se suma) – (Variación intermuestral)

r c
Suma Cuadrada del Error = SSE =  (X
j1 i 1
ij  X i ) 2 = 186,0

(a cada valor, se le resta el promedio de su muestra, se eleva al cuadrado y se suma) – (Variación Intramuestral)

Se puede comprobar que: SST = SSTR + SSE , es decir: 251,7 = 65,7 + 186,0
En la práctica, se calcular SSE de esta última expresión, es decir: SSE = SST – SSTR = 251,7 – 65,7 = 186,0

MEDIAS CUADRADAS
Luego de calcular las sumas cuadradas, se calculan las medias cuadradas, de la siguiente manera:
SST
Media Cuadrada Total = MST = = 19,4
n 1
SSTR
Media Cuadrada del Tratamiento = MSTR = = 32,9
c 1
SST
Media Cuadrada del Error = MSE = = 16,9
n c
CALCULO DE F: Como se explicó anteriormente, F es la razón entre la variación intermuestral y la intramuestral:
MSTR
F= = 1,94
MSE
VALOR CRITICO DE F (Fc): Depende del error de confianza , y de los grados de libertad del numerador (c – 1)
y del denominador (n – c). En nuestro ejemplo, y con un nivel de confianza de 95%, entonces Fc = F 0,05;2;11=
3,98

REGLA DE DECISIÓN: Ho es rechazada si F > Fc, de lo contrario no se rechaza. En nuestro caso, como F = 1,94
y Fc = 3,98, entonces Ho no es rechazada. Se puede suponer que los tres programas de formación son iguales.

TABLA ANOVA
Fuente de variación Suma Cuadradas Grados de Libertad Medias Cuad. Valor F Fc
Intermuestral (tratamiento) SSTR c–1 SSTR / (c -1) MSTR/MSE F;c-1;n-c
Intramuestral (error) SSE n–c SSE / (n – c )
Variación total SST n-1

Вам также может понравиться