Академический Документы
Профессиональный Документы
Культура Документы
UNIDAD
4
DISEOS DE
BLOQUES
OBJETIVO EDUCACIONAL
Al trmino de esta unidad el alumno ser capaz de:
61
Estadstica II ______________________________________________________________________________
observaciones
Tratamiento
y 11
y12
y1n
y 21
y 22
y 2n
Totales
Promedios
y 1
y 2
y1
y2
...
...
...
...
...
...
...
y a1
ya2
y an
y a
ya
y 1
y 2
y b
y 1
y 2
y b
Totales
Promedios
yi
yi j ;
y j
j1
yi
yi
b
yi
yi j
i 1
y j
a
y
y
y
ij
i 1 j1
y y
y
N ab
La notacin del subndice punto implica la sumatoria sobre el subndice que reemplaza.
i 1, 2 , , a
j 1, 2 , , b
donde es la media global, i es el efecto del i-simo tratamiento, j es el efecto del jsimo bloque y i j
62
Por otro lado, los efectos de los tratamientos y de los bloques son definidos como
desviaciones de la media global, de modo que
a
i 1
j 1
Tambin se supone que los tratamientos y los bloques no interactan entre s. Esto es, el
efecto del tratamiento i es el mismo sin importar en que bloque (o bloques) se pruebe. El
inters recae en probar la igualdad de los efectos de los tratamientos (equivale a probar la
hiptesis de que las medias de tratamientos son iguales)
1) Hiptesis
H0 : 1 2 a 0
SC /( a 1 )
CM
SC E /( a 1 )( b 1 ) CM E
Suma de
Cuadrados
Trats.
Bloques
Error
y2
1 2
SC yi
b i 1 ab
1
SC
a
j1
y 2 j
y 2
ab
SC E SCT SC SC
Grados de
Libertad
Cuadrados
Medios
a1
CM
SC
a1
b1
CM
SC
b1
( a 1 )( b 1 )
Fo
CM
2
SC E
( a 1 )( b 1 )
63
Estadstica II ______________________________________________________________________________
Total
SCT
y i2 j
y 2
i 1 j1
ab 1
ab
yi j yi y j y
o bien
ei j yi j
yi y j y
64
grafican en una hoja de papel de probabilidad normal. Si la suposicin es vlida los puntos
tendern a agruparse sobre una lnea recta que pasa por el punto medio.
tratamiento no ocurre en cada bloque. Existen dos formas generales de resolver el problema
de los valores faltantes.
y'i
y'
y' j , respectivamente.
observacin faltante se elige x, de manera que tenga una contribucin mnima a la suma de
cuadrados del error. Como la suma de cuadrados del error est dada por
65
Estadstica II ______________________________________________________________________________
a b
SCE ( yi j yi y j y )2
i 1 j 1
i 1 j 1
1
y
b
2
ij
i 1
j 1
yi j
i 1
j 1
yi j
ab
i 1 j 1
yi j
o bien,
1 21 2 1 2
SC E x ( 'y i x ) ( 'y j x ) ( 'y x ) R
b
a
ab
2
en donde R incluye todos los trminos que no contienen a x. Al derivar la SCE con respecto
a x e igualar a cero se obtiene
66
5 x 5
ADBEC
D AC B E
CBEDA
B E AC D
E C DAB
6 x 6
ADCEBF
B AE C F D
C E D F AB
DCFBEA
F B AD C E
E F B AD C
yi j k
i 1, 2 , , p
i j k i j k j 1, 2 , , p
k 1, 2 , , p
en donde
yi j k
la media general
i es el i-simo efecto de rengln
j es el j-simo efecto de tratamiento
El modelo es completamente
renglones, las columnas y los tratamientos. Slo dos de los subndices i, j y k se requieren
para especificar una observacin en particular porque nicamente hay una observacin en
cada celda.
El anlisis de varianza consiste en descomponer la suma total de cuadrados de las N p 2
observaciones en sus componentes de rengln, columna, tratamiento y error
SCT SC Re nglones SC Columnas SC Tratamient os SCE
CM Tratamient os
CM E
67
Estadstica II ______________________________________________________________________________
p1
que tiene una distribucin f ( p 2 )( p 1 ) si la hiptesis nula es verdadera. El procedimiento de
Fuente de
Variacin
Tratam.
SC
y 2 j
p
j 1
Renglones
SC
y i2
p
j 1
Columnas
SC
j 1
Error
Total
2
k
N
y 2
N
y 2
N
SC E SCT SC SC SC
SCT
y
i 1 j 1 k 1
68
y 2
2
i jk
y
N
p1
CM
SC
p1
p1
CM
SC
p1
p1
CM
SC
p1
( p 2 )( p 1 ) CM E
f0
f0
SC E
( p 2 )( p 1 )
p2 1
CM
CME
Columna
1
A
B
C
D
B
A
C
D
D
C
A
B
4
D
C
B
A
El diseo cuadrado greco-latino puede utilizarse para controlar sistemticamente tres fuentes
extraas de variabilidad. En otras palabras, se usa para hacer un anlisis por bloques en tres
direcciones. El diseo permite analizar cuatro factores (rengln columna, letra griega y letra
latina), cada uno con p niveles, usando solamente p2 ensayos. Los cuadrados grecolatinos
existen para toda p 3 excepto para p = 6.
El modelo estadstico de un diseo cuadrado greco-latino es
i 1, 2 , , p
j 1, 2 , , p
yi j k i j k l i j k l
k 1, 2 , , p
l 1 , 2 , , p
en donde
yi j k l la observacin que corresponde al rengln i, la columna k, la letra latina j y la
letra griega k.
la media general
i es el efecto del i-simo rengln
j es el j-simo efecto de tratamiento de las letras latinas
l es el efecto de la columna l
i j k l es la componente del error aleatorio
69
Estadstica II ______________________________________________________________________________
Slo dos de los cuatro subndices son necesarios para identificar completamente cualquier
observacin.
El anlisis de varianza es muy similar al de un cuadrado latino. El factor representado por las
letras griegas es ortogonal a los renglones, las columnas y los tratamientos de la letra latina
porque cada letra griega ocurre una sola vez en cada rengln, en cada columna y para cada
letra latina. Por lo tanto la suma de cuadrados debida al factor letra griega puede calcularse
usando los totales de la letra griega. El error experimental se reduce en esta cantidad. Las
hiptesis nulas de igualdad entre los renglones, entre las columnas, entre los tratamientos de
la letra latina y entre los tratamientos de la letra griega pueden probarse dividiendo la media
de cuadrados correspondiente entre la media de cuadrados del error.
Tabla 4.3 Anlisis de Varianza para un Diseo de Cuadrado Greco-Latino
Fuente de
Grados de
Sumas de Cuadrados
Cuadrados Medios
Variacin
libertad
p y2
Tratam.
y 2
SC
j
CM
p1
letra
SC
p1
N
Griega
j 1 p
Tratam.
letra
Latina
Renglones
SC
SC
SC
j 1
Error
Total
2
i
p
y
2
k
y 2
N
y
N
y 2
N
SCT SC SC SC SC
SCT
70
j 1
j 1
Columnas
y 2 j
y i2j k l
y 2
N
p1
CM
SC
p1
p1
CM
SC
p1
p1
CM
SC
p1
( p 3 )( p 1 ) CM E
SC E
( p 3 )( p 1 )
p2 1
f0
CM
CM E
Ejemplo 4.1. Se realiz un experimento para determinar el efecto que tienen cuatro tipos
diferentes de puntas de un probador de dureza sobre los valores de dureza observados de una
aleacin. Para ello se obtienen cuatro especimenes de aleacin, y se prueba cada punta sobre
cada uno de ellos. Los datos obtenidos son los siguientes
Espcimen
Tipo de
Punta
9.3
9.4
9.6
10.0
9.4
9.3
9.8
9.9
9.2
9.4
9.5
9.7
9.7
9.6
10.0
10.2
cuadrados:
Especmen
Tipo de
Punta
9.3
9.4
9.6
9.4
9.3
9.2
Total
Promedio
10.0
38.3
9.575
9.8
9.9
38.4
9.600
9.4
9.5
9.7
37.8
9.450
9.7
9.6
10.0
10.2
39.5
9.875
Total
37.6
37.7
38.9
39.8
154.0
Promedio
9.400
9.425
9.725
9.950
y 2
9.625
154 2
SCT y
9.3 9.4 10.2
1483.54 1482.25 1.29
ab
16
i 1 j1
a
2
ij
2
y
1 2 38.3 2 38.4 2 37.8 2 39.5 2 154 2
SC yi
0.385
b i1 ab
4
16
a
71
Estadstica II ______________________________________________________________________________
2
1 b 2 y 37.6 2 37.7 2 38.9 2 39.8 2 154 2
SC y j
0.825
a j 1
ab
4
16
Suma de
Cuadrados
Grados de
Libertad
Cuadrados
Medios
Fo
Tratamientos
0.385
0.1283
14.43
Bloques
0.825
0.275
Error
0.080
0.00889
Total
1.290
15
3.86
El valor de F observado para las puntas es de 14.43 es mayor que el valor de F de tablas
para el 5% de nivel de significancia, por lo que podemos concluir que existe una diferencia
estadsticamente significativa entre las mediciones de dureza entre las puntas.
b) Pruebe todos los pares de medias empleando la prueba de rango mltiple de Duncan, con
= 0.05
1. Las a medias de tratamientos se arreglan en orden ascendente
y 3 9.450 y1 9.575
y2 9.600
y4 9.875
CME 0.00889
0.0471
b
4
4.
r0.05 ( 3, 9 ) 3.34
r0.05 ( 4 , 9 ) 3.41
R4 3.41(0.0471) 0.1606
72
e i j y i j y i y j y
la frmula:
Tabla de Residuales
Especmen
Tipo de
Punta
yi
yi
-0.050
0.025
-0.075
0.100
38.3
9.575
0.025
-0.100
0.100
-0.025
38.4
9.600
-0.025
0.150
-0.050
-0.075
37.8
9.450
0.050
-0.075
0.025
0.000
39.5
9.875
y j
37.6
37.7
38.9
39.8
y =154.0
y j
9.400
9.425
9.725
9.950
y 9.625
Graficando los valores de los residuales contra los tipos de punta tenemos
73
Estadstica II ______________________________________________________________________________
residual
0.14
0.04
-0.06
-0.16
1
Tipo_Punta
Se observa que la variabilidad dentro de cada nivel el tipo de Punta es aproximadamente la
misma, por lo que se cumple satisfactoriamente el supuesto de homocedasticidad.
Solucin. En seguida se presenta la solucin de este problema utilizando Statgraphics
a) Existe alguna diferencia en las mediciones de dureza de las puntas? De la pantalla de
salida del Statgraphics obtenemos:
AnalysisofVarianceforDurezaTypeIIISumsofSquares
SourceSumofSquaresDfMeanSquareFRatioPValue
MAINEFFECTS
A:Tipo_Punta0.38530.12833314.440.0009
B:Especimen0.82530.27530.940.0000
RESIDUAL0.0890.00888889
TOTAL(CORRECTED)1.2915
El nivel de significancia observado para las puntas es de 0.0009, por lo que podemos concluir
que existe una diferencia estadsticamente significativa entre las mediciones de dureza entre
las puntas.
b) Pruebe todos los pares de medias empleando la prueba de rango mltiple de Duncan, con
= 0.05
MultipleRangeTestsforDurezabyTipo_Punta
Method:95.0percentDuncan
Tipo_PuntaCountLSMeanHomogeneousGroups
349.45X
149.575X
249.6X
74
449.875X
ContrastDifference
120.025
130.125
14*0.3
230.15
24*0.275
34*0.425
*denotesastatisticallysignificantdifference.
residual
0.14
0.04
-0.06
-0.16
1
Tipo_Punta
En la grfica podemos observar que la variabilidad dentro de cada punta es aproximadamente
la misma para todas las puntas.
75
Estadstica II ______________________________________________________________________________
Ejemplo 4.2 Un experimentador estudia los efectos que tienen cinco formulaciones de la
carga propulsora utilizada en los sistemas de expulsin de la tripulacin de un avin basado
en la rapidez de combustin. Cada formulacin se hace con un lote de materia prima que
slo alcanza para probar cinco formulaciones. Adems, las formulaciones son preparadas por
varios operadores, y puede haber diferencias sustanciales en las habilidades y experiencia de
los operadores. Por lo tanto, al parecer hay dos factores perturbadores que sern calculados
en promedio en el diseo: los lotes de materia prima y los operadores. El diseo apropiado
para es problema consiste en probar cada formulacin exactamente una vez con cada uno de
los cinco operadores. Al diseo resultante ilustrado en la Tabla 4.4 diseo cuadrado latino.
Operadores
Lotes de
materia prima
1
A=24
B=17
C=18
D=26
E=22
107
1
2
3
4
5
y k
2
B=20
C=24
D=38
E=31
A=30
143
3
C=19
D=30
E=26
A=26
B=20
121
4
D=24
E=27
A=27
B=23
C=29
130
5
E=24
A=36
B=21
C=22
D=31
134
yi
111
134
130
128
132
635
El estadstico apropiado para probar la la hiptesis de que no hay diferencia en las medias de
tratamiento es
f0
CM Tratamient os
CM Error
p1
que se distribuye como f ( p 2 )( p 1 ) bajo la hiptesis nula. Tambin puede probarse la
2
i jk
i1 j1 k1
SC Lotes
76
y
N
16805
(635 ) 2
676.0000
25
y2
1 p 2
yi
p j1
N
1
(635 ) 2
[(111 ) 2 ( 134 ) 2 (130 ) 2 (128 ) 2 (132 ) 2 ]
68.00
5
25
SC operadores
y 2
1 p 2
y
i N
p j1
1
(635 ) 2
[(107 ) 2 (143 ) 2 (121) 2 (130 ) 2 (134 ) 2 ]
150.00
5
25
A
B
C
D
E
y 1 143
y 2 101
y 3 112
y 4 149
y 1 130
La suma de cuadrados que resulta de las formulaciones se calcula a partir de estos totales
como
SC Formulacio nes
y 2
1 p 2
yi
p j1
N
1
(635 ) 2
[(143) 2 (101) 2 (112 ) 2 (1149 ) 2 (130 ) 2 ]
330.00
5
25
El anlisis de varianza se resume en la Tabla 4.5. Se concluye que hay una diferencia
significativa en la rapidez de combustin media generada por las diferentes formulaciones de
la carga propulsora. Tambin hay indicios de que hay diferencias entre los operadores, por lo
que la formacin de bloques para este factor fue una buena precaucin. No hay evidencia
77
Estadstica II ______________________________________________________________________________
slida de una diferencia entre los lotes de materia prima, por lo que al parecer en este
experimento particular hubo una precaucin innecesaria en esta fuente de variabilidad. Sin
embargo, la formacin de bloques de los lotes de materia prima es por lo general una buena
idea.
Ejemplo 4.3 Suponga que en el ejemplo anterior un factor adicional, los montajes de prueba,
podra ser importante. Sean cinco los montajes de prueba denotados por las letras griegas ,
Lotes de
materia prima
1
A =24
B =17
C =18
D =26
E =22
107
1
2
3
4
5
y k
2
B =20
C =24
D =38
E =31
A =30
143
3
C =19
D =30
E =26
A =26
B =20
121
4
D =24
E =27
A =27
B =23
C =29
130
5
E =24
A =36
B =21
C =22
D =31
134
yi
111
134
130
128
132
635
Observe que, debido a que los totales de los lotes de materia prima (renglones), los operadores
(columnas) y las formulaciones (letras latinas) son idnticos a los del ejemplo 4.2, se tiene
SCT 676 ;
SC Operadores 150 ;
SC Lotes 68
y1 135
y2 119
y3 122
y4 121
y 5 138
SC Montajes
j1
y 2 k
y2
N
1
(635 ) 2
[(135 ) 2 (119 ) 2 (122 ) 2 (121) 2 (138 ) 2 ]
62.00
5
25
A:Formulacion
B:Lotes
C:Operadores
D:Montaje
330.0
68.0
150.0
62.0
4
4
4
4
82.5
17.0
37.5
15.5
10.00
2.06
4.55
1.88
0.0033
0.1783
0.0329
0.2076
RESIDUAL
66.0
8
8.25
-------------------------------------------------------------------------------TOTAL (CORRECTED)
676.0
24
Problemas
1. Se realiza un experimento para obtener una medicin del perfil para diferentes tipos de
boquillas y distintos niveles de velocidad de expulsin del chorro. El inters en este
experimento se centra principalmente en el tipo de boquilla, y la velocidad es un factor
indeseable. Los datos son los siguientes:
Tipo de
boquilla
1
2
3
4
5
14.37
0.80
0.85
0.92
0.97
0.86
16.59
0.81
0.92
0.95
0.98
0.78
20.43
0.75
0.86
0.89
0.88
0.76
23.46
0.77
0.81
0.89
0.86
0.76
yi
28.74
0.78
0.83
0.83
0.83
0.75
yi
y j
y j
2. Una prueba de campo para detectar la presencia de arsnico en muestras de orina, ha sido
propuesta para su uso entre trabajadores forestales debido al empleo cada vez mayor de
arsnicos orgnicos en esta industria. El experimento compara los resultados obtenidos
con la prueba al ser efectuada por un inexperto y un entrenador experimentado con el
anlisis efectuado en un laboratorio remoto. Para la prueba se escogen cuatro sujetos, los
cuales son considerados como bloques. La variable de respuesta es el contenido de
arsnico (en ppm) en la orina del sujeto. Los datos son los siguientes:
Prueba
Inexperto
Experto
Laboratorio
Sujeto
1
0.05
0.05
0.04
2
0.05
0.05
0.04
3
0.04
0.04
0.03
4
0.15
0.17
0.10
yi
yi
y j
y j
79
Estadstica II ______________________________________________________________________________
cmo cambia la corriente de fuga a medida que cambia la longitud del canal. Para ello se
escogen cuatro longitud de canal. Para dada una de ellas, tambin se utilizan cinco
anchos diferentes, y el ancho se considera un factor indeseable. Los datos son los
siguientes:
Longitud
del canal
1
2
3
4
1
0.7
0.8
0.9
1.0
2
0.8
0.8
1.0
1.5
Ancho
3
0.8
0.9
1.7
2.0
4
0.9
0.9
2.0
3.0
yi
5
1.0
1.0
4.0
2.0
yi
y j
y j
1
A= 8
C = 11
B= 4
D= 6
E= 4
1
2
3
4
5
2
B=
E=
A=
C=
D=
Da
3
D= 1
A= 7
C = 10
E= 6
B= 3
7
2
9
8
2
4
C=
D=
E=
B=
A=
7
3
1
6
8
5
E= 3
B= 8
D= 5
A = 10
C= 8
80
2
B =16
C =21
D =12
E =15
A =24
3
C =19
D =18
E =16
A =22
B =17
4
D =16
E =11
A =25
B =14
C =17
5
E =13
A =21
B =13
C =17
D =14