Академический Документы
Профессиональный Документы
Культура Документы
ANLISIS DE VARIANZA
ANOVA DE UNA VA
Pgina 1 de 26
CONTENIDO
1. ANOVA
2. Ejercicios
Pgina 2 de 26
Fc
sb2
sw2
Donde el nmero de grados de libertad para el numerador es k-1 y para el denominador es k(n1), siendo el nivel de significancia.
k = nmero de muestras.
Por ejemplo:
Ejemplo: Se tienen 14 empleados seleccionados al azar que se someten a
3 diferentes cursos de entrenamiento: Programa 1, Programa 2 y Programa 3.
Pgina 3 de 26
TRATAMIENTOS
c=1
c=3
c=2
Programa
Programa 1
Programa 3
r=1
85
80
82
r=2
72
84
80
r=3
83
81
85
r=4
80
78
90
r=5
**
82
88
Medias
80.00
81.00
85.00
Xj
82.14
SCT
i 1
( Xij X )
j 1
o variacin
Pgina 4 de 26
SCTR r j ( X j X ) 2
j 1
SCE
i 1
(X
j 1
ij
X j )2
19.4
32.9
16.9
Pgina 5 de 26
1.946745562
ZONA DE
NO RECHAZAR
RECHAZO
Distr. F
Como Fc es menor a Falfa no se rechaza Ho y las medias son iguales.
7. VALOR P DE Fc
P = distr.f(Fc, gl. SCTr, gl. SCE) = distr.f(1.946, 2, 11) = 0.18898099
Como P es mayor a alfa no se rechaza Ho
CONCLUSION: NO HAY SUFICIENTE EVIDENCIA PARA RECHAZAR HO, LAS MEDIAS DE
LOS TRATAMIENTOS SON IGUALES
Pgina 6 de 26
TABLA DE ANOVA
FUENTE DE VARIACIN
SUMA DE
GRADOS DE
CUADRADO
CUADRADOS LIBERTAD
MEDIO
VALOR F
SCTR
c-1
CMTR
CMTR/CME
SCE
n-c
CME
Variacin total
SCT
n-1
CMT
Regla: No rechazar si la F de la muestra es menor que la F de Excel para una cierta alfa
USO DE EXCEL:
Alfa = 0.05
RESUMEN
Grupos
Suma
Promedio
Varianza
Programa 1
320
80 32.666667
Programa 2
405
81
Programa 3
425
85
17
Grados
ANLISIS DE VARIANZA
de
Promedio de
Suma
Variaciones
cuadrados
Entre grupos
65.71428571
libertad
Cuadrados
Total
186
251.7142857
Probabilidad
F crtica
Dentro de
grupos
Fc
11 16.90909091
13
Pgina 7 de 26
USO DE MINITAB
OK
DF
2
11
13
S = 4.112
SS
65.7
186.0
251.7
MS
32.9
16.9
F
1.94
R-Sq = 26.11%
P
0.189
R-Sq(adj) = 12.67%
Individual 95% CIs For Mean Based on
Pooled StDev
Level
Programa 1
Programa 2
Programa 3
N
4
5
5
Mean
80.000
81.000
85.000
StDev
5.715
2.236
4.123
----+---------+---------+---------+----(------------*------------)
(----------*-----------)
(-----------*----------)
----+---------+---------+---------+----77.0
80.5
84.0
87.5
NOTA: Si los Intervalos de confianza se traslapan, las medias son iguales estadsticamente
Tukey 95% Simultaneous Confidence Intervals
All Pairwise Comparisons
Individual confidence level = 97.94%
Programa 1 subtracted from:
Programa 2
Programa 3
Lower
-6.451
-2.451
Center
1.000
5.000
Upper
8.451
12.451
--------+---------+---------+---------+(------------*-----------)
(-----------*------------)
--------+---------+---------+---------+-6.0
0.0
6.0
12.0
Upper
11.025
--------+---------+---------+---------+(-----------*----------)
--------+---------+---------+---------+-6.0
0.0
6.0
12.0
Lower
-3.025
Center
4.000
2. EJERCICIOS:
1. Cuatro catalizadores que pueden afectar la concentracin de un componente en una mezcla
lquida de tres componentes estn siendo investigado.
Se obtienen las siguientes concentraciones:
Catalizador
A
58.2
56.3
50.1
52.9
57.2
54.5
54.2
49.9
58.4
57
55.4
50
55.8
55.3
51.7
54.9
2. Para determinar si existe diferencia significativa en el nivel de Matemticas de 4 grupos de
estudiantes de Ingeniera se realiz un examen aleatorio a 6 individuos por grupo. Determine
cuales son los grupos en los cuales existen diferencias a un 95% de nivel de confianza.
A
75
93
78
71
63
76
B
78
91
97
82
85
77
C
55
66
49
64
70
68
D
64
72
68
77
56
95
85
71
59
75
75
64
82
73
62
76
74
69
Pgina 9 de 26
71
69
75
85
82
67
4. Probar si hay diferencia en los tiempos de servicio de 4 unidades de negocio para el mismo
servicio a un nivel de significancia del 5%.
A
5.4
8.7
11.1
9.9
7.8
7.4
10.3
12.8
5.3
9.4
9.7
12.1
7.4
10.1
10.3
10.8
8.4
9.2
9.2
11.3
7.3
9.8
8.8
11.5
Pgina 10 de 26
Pgina 11 de 26
Proveedor
I
II
III IV
56 64 45 42
55 61 46 39
62 50 45 45
59 55 39 43
60 56 43 41
El proveedor = factor
Tratamiento = I, II, III, IV
Con cinco replicaciones en cada tratamiento.
Observando la tabla se "ve" que existen evidentemente diferencias entre la resistencia de los
ejes de un proveedor a otro. Pero tambin existen entre los ejes de un mismo proveedor,
entonces, la diferencia detectada entre, los ejes de un proveedor y otro existe realmente? O la
diferencia es debida al azar?, La herramienta estadstica conocida como anlisis de varianza
(ANOVA) puede ayudar a despejar esta duda.
Para esto suponga un caso general como sigue: Si define Yij como el valor correspondiente
de la variable dependiente o caracterstica de calidad de la i-sima observacin o replicacin
bajo el tratamiento j, los resultados de un experimento de un solo factor con k tratamientos y n
replicas u observaciones por tratamiento seria:
Tratamiento
Observaciones
Totales
Promedios
(nivel)
1
Y11
Y12
...
Y1n
Y1.
Y..
Y21
Y22
...
Y2n
Y2.
Y2.
Y31
Y32
...
Y3n
Y3.
Y 3.
...
...
...
...
...
...
...
Yk1
Yk2
...
Ykn
Yk.
Yk.
Pgina 12 de 26
Yij j ij
Donde representa la media general, j representa el efecto del tratamiento j, y ij es el error
aleatorio al hacer la observacin ij.
Esto es, se supone que todos los datos en general pertenecen a una misma poblacin con
media excepto que existan desviaciones para diferentes tratamientos del mismo factor. Por
su parte ij representa el error aleatorio o medida de la variabilidad natural dentro de cada
tratamiento.
Generalmente se supone que:
0;
j
j 1
Y que el error aleatorio sigue una distribucin normal con media cero y varianza 2, esto denota:
ij N(0, 2 )
Sean Yi. El total de las observaciones bajo el i-esimo tratamiento, y
Yi.
el promedio de las
observaciones bajo el i-esimo tratamiento. Similarmente sean Y.. La suma de todas las
observaciones y
Y..
Yi. Yij
i 1
Y.. Yij
i 1 j 1
Y.. Y../n
Pgina 13 de 26
j 1 i 1
j 1
j 1 i 1
Pgina 14 de 26
SST (Yij2
j 1 i 1
Y..2 2
Y.. )
n
Yi.2 Y..2
SStr
N
j 1 n
SSE SST SStr
k
SS
G.L.
MS F0
Si F0 > F,k-1,N-k, H0 debe ser rechazada. Donde F, k-1,N-k es el valor de la variable F con
un nivel de significancia (error tipo I), k-1 grados de libertad en el numerador y N-k grados de
libertad en el denominador. Bajo la hiptesis nula la relacin MS tr/MSE sigue una funcin de
densidad F, por lo tanto si F0 es mayor que F, k-1,N-k existir una diferencia significativa y el
factor afecta la respuesta de la caracterstica de calidad en los niveles bajo estudio.
Si Ho no puede ser rechazada la conclusin es por lo tanto que el factor bajo estudio no
afecta la respuesta. Sin embargo, si Ho es rechazada y existe diferencia significativa entre los
diferentes tratamientos de un solo factor el siguiente paso es el analizar en detalle cual de los
tratamientos es el mejor y cuales son iguales.
56
64
45
42
55
61
46
39
62
50
45
45
59
55
39
43
Yi
292
286
218
210
58.4
57.2
43.6
42
1006
40.24
60
56
43
41
Y..=
Pgina 15 de 26
Yi.
Y ..
Yij
j1 i1
SS
G.L.
MS
k 1 = 3 MStr =378.3
Error
SSE=203.2 N k = 16 MSE=12.7
Total
SST=1338.2 N 1 = 19
F0
MStr/MSE
= 29.79
Pgina 16 de 26
F,3,16 = 3.24
Dado que F0 = 29.79 > 3.24= F0.05,3,16
Se concluye que Ho se rechaza y el factor proveedor afecta la variable resistencia a la
traccin.
Experimentos con un solo factor y diferente nmero de lecturas por tratamiento (o caso
desbalanceado)
Cuando por alguna razn l numero de lecturas que se tienen bajo cada tratamiento es
diferente, digamos Zi observaciones en el tratamiento j, el anlisis se puede llevar a cabo de una
manera similar con las siguientes formulas para k tratamientos:
2
SST Yij 2 - Y.. ; con N - 1 gradosde libertad
N
j1 i 1
Yi. 2 Y ..2
SStr
tr
I
II
III
9
20
6
Observaciones
12
10
8
23
30
5
8
16
15
13
Y..
Totales
Yi
67
73
35
175
Promedios
Yi.
11.17
24.33
8.75
14.75
Y ..
Con un nivel de significacin de = 0.05. Tiene los circuitos diferente tiempo de respuesta?
Pgina 17 de 26
k = 3; n1 = 6; n2 = 3; n3 = 4; N = 6 + 3 + 4 = 13
k
1752
9 12 ... 8 16
13
2993 2355.76 637.24
2
474.98
6
3
4
13
SSE SST - SStr 637.24 - 474.98 162.29
La tabla ANOVA es:
Fuente
SS
De error
G.L.
MS
SSE=162.29 N k = 10 MSE=16.22
Total
SST=637.24 N 1 = 12
F0
MStr/MSE
= 14.64
Dado que F.05,2,10 = 4.10, se concluye que los circuitos muestran diferentes tiempos de
respuesta.
Pgina 18 de 26
Yij i ij
Usando el mtodo de los mnimos cuadrados, las soluciones de las ecuaciones normales son:
Y..
i Yi. Y..
con i 1,2,3,..., k
Y es posible determinar fcilmente un intervalo de confianza para estimar la media del i-simo
tratamiento. Dicha i-simo media es:
i = + i
Un estimador puntual para i podra ser i i Yi. ahora si se supone que los errores estn
distribuidos normalmente, las Yi. son NID(0,2/n), entonces podra usarse la distribucin normal
para definir el intervalo de confianza buscado si se conoce . Al usar MSE como estimacin de,
2, el intervalo de confianza se debe basar en la distribucin t., por tanto, un intervalo de
confianza de (1-)100% para la media del i-simo tratamiento, es:
MSE
Y
i
.
/
2
,
N
un intervalo de confianza del (1-)100% para la diferencia de las medias de dos tratamientos
cualesquiera, por ejemplo i-j, ser:
2MSE
Y
i
.
Y
j
.
/
2
,
N
.
n
Ejemplo 3: Al usar los datos del ejemplo 2.3, las estimaciones de la media general y de los
efectos de los tratamientos son 376 25 15 .04; y
Pgina 19 de 26
usando la formula para calcular el intervalo de confianza del 95% para la media del tratamiento 4
es:
MSE
8.06
Y
i
.
/
2
,
N
21.60 2.086
n
5
o, bien.
21.60 2.65
Yij i ij
El residuo de la observacin i del tratamiento j se define mediante:
ij
eij Yij Y
en donde
ij
Y
Pgina 20 de 26
ij i i
Y
ij Y.. ( Yi. Y..)
Y
ij Yi.
Y
La ecuacin anterior muestra un resultado que se intuye fcilmente, ya que la estimacin de
cualquier observacin del i-simo tratamiento es igual al promedio del tratamiento
correspondiente. El examen de los residuos debe ser automtico en el anlisis de variancia. Si
el modelo es adecuado, los residuos no deben tener estructura.
Supongamos que al efectuar un anlisis de variancia para un modelo de efectos fijos la: hiptesis
nula es rechazada. Se concluye que existe diferencia entre las medias, aunque no se especifique
exactamente cual de ellas es diferente. En esta situacin puede ser til realizar comparaciones
adicionales entre grupos de medias de los tratamientos. La media del i-simo tratamiento se
define mediante i = + i y su estimacin es Yi. . Las comparaciones entre medias de
tratamientos se realizan en trminos de los totales de tratamientos Yi. O de los promedios de
tratamientos Yi. . Los procedimientos para efectuar estas comparaciones se conocen como
mtodos de comparacin mltiple.
Mtodo de la Mnima Diferencia Significativa (LSD, del ingls least significant difference)
Supongamos que despus de haber rechazado la hiptesis nula, con base en una prueba F de
anlisis de variancia, se desea probar Ho: i = j para toda i j. Esto puede hacerse empleando
la estadstica t:
to
Yi. Yj.
1 1
MSE
ni nj
Pgina 21 de 26
1 1
LSD t/2, N k MSE
ni nj
Se denomina mnima diferencia significativa. Si el diseo es balanceado, entonces n1 = n2 = nk =
n.
Para usar el procedimiento de la LSD, simplemente se comparan las diferencias observadas
entre cada par de promedios con el valor correspondiente de la LSD. Si, se concluye que las
medias poblacionales i = j son diferentes.
Ejemplo 4: Para ilustrar este procedimiento, si se usan los datos del Ejemplo 2.3 el valor de la
LSD con = .05 es:
1 1
LSD t/2, N k MSE
ni nj
2.086
2(8.06)
3.75
5
Por tanto, una pareja de medias difieren significativamente si el valor absoluto de la diferencia
de promedios en los tratamientos correspondientes es mayor que 3.75. Los cinco promedios
de tratamiento son:
Y1. 9.8
Y2. 15.4
Y4. 21.6
Y5. 10.8
Y3. 16.6
Pgina 22 de 26
Los valores marcados con asterisco indican parejas de medias que son significativamente
diferentes. Resulta til graficar los datos como se muestra en la Fig. 4, subrayando las parejas
de medias que no difieren en forma significativa. Claramente los nicos pares que no difieren
significativamente son 1 y 5, y 2 y 3. El tratamiento 4 produce una resistencia a la tensin de
manera significativamente mayor que los otros tratamientos.
Y 1. Y 5.
9.8 10.8
Y 2 . Y 3.
15.4 17.6
Y 4.
21.6
Ho : i k
H 1 : i k
Pgina 23 de 26
Para i = 1, 2,..., k -1. El procedimiento de Dunnett es una modificacin de la prueba t. Para cada
hiptesis se calculan las diferencias que se observan en las medias mustrales:
1 1
Yi. Yk. d(k 1, f) MSE
ni nk
En donde la constante d (k -1, f) se encuentra en la Tabla IX del Apndice del texto de Diseo y
Anlisis de Experimentos de Douglas C. Montgomery (son posibles tanto pruebas unilaterales
como bilaterales). Hay que notar que alfa constituye el nivel de significacin conjunto asociado a
las k -1 pruebas.
Ejemplo 5: Para ilustrar la prueba de Dunnett, considrense los datos del Ejemplo 3, y su
pngase que el tratamiento 5 es el control. En este ejemplo, k = 5, k -1 = 4, f = 20, ni = n = 5, y
con un nivel del 5% se encuentra en la Tabla IX del Apndice que d 0.05 (4,20) = 2.65. Por tanto,
la diferencia crtica es:
d.05(4,20)
2MSE
2(8.06)
2.65
4.76
n
5
(Hay que notar que esta es una simplificacin de la Ecuacin anterior y que resulta de un diseo
balanceado.) En consecuencia, un tratamiento debe considerarse significativamente diferente del
control si la diferencia es mayor que 4.76. Las diferencias observadas son:
Pgina 24 de 26
Slo las diferencias Y 3. Y 5.; Y 4. Y 5. indican una diferencia significativa al ser comparadas
con el control; por tanto, se concluye que 3 = 5 y 4 = 5. Es conveniente usar ms
observaciones para el tratamiento de control (es decir, nk) que para los otros tratamientos (o sea,
n, suponiendo el mismo nmero de observaciones en los otros k -1 tratamientos) cuando se
comparan tratamientos con un control. Debe elegirse la razn nk / n aproximadamente igual a la
raz cuadrada del nmero total de tratamientos. En otras palabras, se elige n k/n =
Pgina 25 de 26
Pgina 26 de 26