Академический Документы
Профессиональный Документы
Культура Документы
Probabilidad y
Estadística
Inferencial
2
Análisis de varianza de un
factor(ANOVA de un
factor)
3
El
análisis de la varianza o Anova (Analysis of
Variance) es uno de los test más usados para
comparar dos o más medias y determinar si
son o no iguales entre si.
ANOVA permite comparar varias medias en
diversas situaciones sobre un asunto de
interés y muy ligado a la base del análisis
multivariante.
Dado las múltiples situaciones en que se
plantea en este tipo de experimentos, los
realizados mediante la distribución normal o la
t – student resultan muy limitados.
4
Fertilizadores
Suposiciones e hipótesis
del ANOVA de un solo
factor
6
Método Dentro
Produce una estimación válida de la varianza
común desconocida de las poblaciones sin
importar si la hipótesis nula de las medias
poblacionales es cierta.
Estose debe a que la variabilidad de los valores
de la muestra se determinan comparando cada
elemento de los datos con la media muestral.
Esdecir cada valor obtenido de la población A
se compara con la media de la muestra A, cada
elemento obtenido de la población B se
compara con la media muestral B …
8
ij
( x x j ) 2
2 j i
s D c n 1
Xij =i-enésimo elemento de los datos en el grupo j
Xj = media del grupo j
c = número de grupos
n = número de elementos de la muestra en cada grupo.
9
Ejemplo
Se obtienen muestras de llenado de 4 paquetes de
espinacas congeladas, a partir de 3 contenedores. La
pregunta es si los pesos promedio de los paquetes son
iguales o diferentes entre los tres contenedores.
Seguidamente se ofrecen los pesos de las muestras
(onzas). Se trabaja con un nivel de significancia de 5%
Ho : 1 2 3
H 1: 1 2 3 almenos una media es disti nt a
2
(12.4 12)2 (13.7 12)2 (11.5 12)2 (10.3 12)2 6.19
x i _ x1
2
x i _ x 2 (11.9 11) (9.3 11) (12.1 11) (10.6 11) 5.07
2 2 2 2
2
x i _ x 3 (10.3 11.2) (12.4 11.2) (11.9 11.2) (10.2 11.2) 3.74
2 2 2 2
__
ij x j
( x ) 2
Método Entre
Este método produce una estimación de la varianza solo si
la hipótesis nula es cierta.
PASOS.
1. Se debe estimar la media poblacional ( con la media de
todos los valores muestrales).
2. Se obtiene la diferencia entre la media de cada grupo y
la media poblacional estimada y estas diferencia se
elevan al cuadrado y se suman. Así se obtiene la suma
de los cuadrado entre (SCE).
3. 3. El valor obtenido anteriormente se divide entre los
grados de libertad.
13
media global ) 2
n x j x
j
s 2
E
c 1
s 2
E = Estimación del método entre de la varianza población común
_
Xj = media del grupo j
_ doble
Xj = media global (media de todos los valores) usada como estimación de
la µ
c = número de grupos
n= número de elementos de la muestra en cada grupo si el número de
observaciones es el mismo
14
En el ejemplo anterior.
F s E
1.12
0.6707
2
s D
1.67
16
2
s E
c 1
2horizontal
s
2
c( n 1) 9vertical
d
Tabla ANOVA
Entre
2 0,56 1,12 0,6707
grupos
Dentro
9 15 1,67
grupos
18
Ejemplo No. 2
El Director Administrativo de una gran empresa
industrial desea determinar si los tres programas de
capacitación distintos tienen efectos diferentes en los
niveles de productividad de los empleados.
Se seleccionan aleatoriamente 14 empleados y se
asignan a uno de los tres programas.
Al terminar la capacitación, cada empleado responde a
un examen para determinar su competencia. Se colocan
cuatro empleados al primer programa de capacitación, y
cinco en cada uno de los otros dos programas.
Cada uno de estos tres grupos se trata de manera
independiente como muestras separadas.
Se trabaja con un nivel de significancia de 1 %
19
Tratamientos
Fuente de Suma de
GL Varianza F
variación cuadrados
Entre grupos 4 2010,64 502,66 11,24
Dentro grupos 20 894,4 44,72
Total 24 2905,04
Ejercicio
Los miembros de un equipo ciclista se
dividen al azar en tres grupos que entrenan
con métodos diferentes. El primer grupo
realiza largos recorridos a ritmo pausado, el
segundo grupo realiza series cortas de alta
intensidad y el tercero trabaja en el
gimnasio con pesas y se ejercita en el
pedaleo de alta frecuencia. Después de un
mes de entrenamiento se realiza un test de
rendimiento consistente en un recorrido
cronometrado de 9 Km. Los tiempos
empleados fueron los siguientes:
23
15 14 13
16 13 12
14 15 11
15 16 14
17 14 11
24
A un nivel de confianza del 95% ¿Puede
considerarse que los tres métodos producen
resultados equivalentes? O por el contrario
¿Hay algún método superior a los demás?