Академический Документы
Профессиональный Документы
Культура Документы
Al sustituir e = y - y = y -
397
Xp, se tiene
= (y - xjJ)(y - xjJ)
SS E
= y'y- P'X'y
(10-16)
A la ecuacin 10-16 se le llama la suma de cuadrados residual o del error, y tiene n - p grados de libertad
asociados con ella. Puede demostrarse que
SSE
=--
(10-17)
n-p
E(P) = E[(X'XrIX'y]
= E[(X'X)-I(xp+S)]
=p
(10-18)
que es una matriz simtrica cuyo elemento i-simo de la diagonal principal es la varianza del coeficiente
de regresip individual
Ycuyo elemento (ij)-simo es la covarianza entre Y j La matriz de covarianza de p es
Pi'
Pi p
(10-19)
MI'I,'
'I!
398
'rll,,-'
111""-
::II~:
'ji"'
"'''41
,,'
''':j'
::::lr
:~::
';1'
"11
1 80 8
1 93 9
1 100 10
1 82 12
1 90 11
1 99 8
1 81 8
1 96 10
X=
1 94 12
1 93 11
1 97 13
1 95 11
1 100 8
1 85 12
1 86 9
1 87 12
:!'
2256
2340
2426
2293
2330
2368
2250
2409
y=
2364
2379
2440
2364
2404
2317
2309
2328
La matriz X'X es
x'x~H
1
93
9
1
87
12
80
93
87
l~j
16
=[1458
164
399
1458
164]
133,560 14,946
14,946 1,726
y el vector X'y es
2~40
1 [2256]
87]
12 2328
37,577]
= 3,429,550
[ 385,562
lJ =
14.176004 -0.129746
-0.223453
][ 37,577]
-0.129746
1.429184x10- 3 -4.763947x10- 5 3,429,550
385,562
2.222381x10- 2
-0.223453 -4.763947x10- 5
1566.07777]
7.62129
8.58485
=[
El ajuste de mnimos cuadrados, con los coeficientes de regresin expresados con dos cifras decimales, es
Tabla 10-3 Valores predichos, residuales y otros diagnsticos del ejemplo 10-1
Observacin
Valor predicho
Residual
i
e
hu
Yi
Ji
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
2256
2340
2426
2293
2330
2368
. 2250
2409
2364
2379
2440
2364
2404
2317
2309
2328
2244.5
2352.1
2414.1
2294.0
2346.4
2389.3
2252.1
2383.6
2385.5
2369.3
2416.9
2384.5
2396.9
2316.9
2298.8
2332.1
11.5
-12.1
11.9
-1.0
-16.4
-21.3
-2.1
25.4
-21.5
9.7
23.1
-20.5
7.1
0.1
10.2
-4.1
0.350
0.102
0.177
0.251
0.077
0.265
0.319
0.098
0.142
0.080
0.278
0.096
0.289
0.185
0.134
0.156
Residual
studentizado
Di
R-student
0.87
-0.78
0.80
-0.07
-1.05
-1.52
-0.15
1.64
-1.42
0.62
1.66
-1.32
0.52
0.01
0.67
-0.28
0.137
0.023
0.046
0.001
0.030
0.277
0.004
0.097
0.111
0.011
0.354
0.062
0.036
0.000
0.023
0.005
0.87
-0.77
0.79
-0.07
-1.05
-1.61
-0.15
1.76
-1.48
0.60
1.80
-1.36
0.50
<0.01
0.66
-0.27
~
'j
400
99
_ 95
390
e
e'o" 80
c.
ro
70
5e 50
~ 30
:Bro
20
e5
10
ll..
::1I;
'd t1
En las tres primeras columnas de la tabla 10-3 se presentan las observaciones reales Yi' los valores predichos o ajustados Yi y los residuales. La figura 10-1 es una grfica de probabilidad normal de los residuales. Las grficas de los residuales contra los valores predichos Ji y contra las dos variables Xl y X 2 se
muestran en las figuras 10-2, 10-3 Y10-4, respectivamente. Como en los experimentos diseados, la graficacin de los residuales forma parte integral de la construccin de modelos de regresin. Estas grficas
indican que en la varianza de la viscosidad observada existe una tendencia a incrementarse con la magnitud de la viscosidad. La figura 10-3 sugiere que la variabilidad de la viscosidad aumenta cuando se incrementa la temperatura.
25.43
-'
+1
1-
+
-
17.61 9.79 -
Ul
ro;;;'"
"C
1.97 -
'ji
'"
cr:
-5.85 -
-13.68 -
+
-21.50
-,
2244
2273
2302
2331
2359
1ft
2388
,2417
ro'"
25.43
17.61
f-
9.79
f-
401
+1
+
Ql
"
'O
1.97 f-
.~
a:
++
-5.85 f-13.68
f-
-21.50 h
80.0
83.3
86.7
90.0
x"
1+
93.3
+ 1
96.7
+ 1100.0
temperatura
Uso de la computadora
El ajuste de los modelos de regresin casi siempre se hace por medio de un paquete de software de estadstica. En la tabla 10-4 se muestra la salida obtenida cuando se usa el programa Minitab para ajustar el
modelo de regresin de la viscosidad del ejemplo 10-1. Muchas de las cantidades de esta salida debern
ser familiares, ya. que sus significados son similares a las cantidades de las salidas de computadora para el
anlisis de datos de experimentos diseados. Se han visto ya muchas salidas de computadora como sta en
este libro. En secciones subsecuentes se revisar en detalle el anlisis de varianza y la informacin de la
prueba t de la tabla 10-4 y se indicar de manera pormenorizada cmo se calcularon estas cantidades.
25.43
1-1
17.61
f-
9.79
f-
1-
'"
Ql
ro
"
.;
'O
1.97
Ql
f-
:\:
el:
-5.85 f-
-13.68 f-
+
-21.50
f-t
8.00
+1
1-
402
Tabla 10-4
CAPTULO 10
Anlisis de regresin
Coef
1566.08
7.6213
8.585
StDev
61.59
0.6184
2.439
R-Sq = 92.7%
S = 16.36
25.43
12.32
3.52
0.000
0.000
0.004
R-Sq<adj) = 91 .6%
Analys;s of Var;ance
SS
44157
3479
47636
Source
Regress;on
Res;dual Error
Total
DF
2
13
15
Source
Temp
Feed Rat
Seq SS
40841
3316
DF
1
1
82.50
0.000
68
57
36
MS
22079
268
I
I
....I
,," 57
32
""
46
Variables codificadas
Rendimiento,
1
2
3
4
5
6
7
8
9
10
11
12
120
160
120
160
120
160
120
160
140
140
140
140
x,=
Presin (psigi
Concentracin (gil)
x,
x,
x,
40
40
80
80
40
40
80
80
60
60
60
60
15
15
15
15
30
30
30
30
22.5
22.5
22.5
22.5
-1
1
-1
1
-1
1
-1
1
O
O
O
O
-1
-1
1
1
-1
-1
1
1
O
O
O
O
-1
-1
-1
-1
1
1
1
1
O
O
O
O
32
46
57
65
36
48
57
68
50
44
53
56
Temperatura -140
Presin- 60
20
x,=~.
x,=
Concentracin- 225
7.5
403
Se ha usado con frecuencia un modelo de regresin para presentar los resultados de un experimento diseado en una forma cuantitativa. Se ofrece ahora un ejemplo completo donde se indica cmo se hace esto.
Se presentan enseguida otros tres ejemplos breves que ilustran otras aplicaciones tiles del anlisis de regresin en los experimentos diseados.
EJEMPLO 10-2
32
46
57
65
36
48
y= 57
68
50
44
53
56
12 O
X'X- O 8
- [ O O
O O
O
O
8
O
O]
O
O
8
X'y=
612]
[
Puesto que X'X es diagonal, el inverso que se requiere tambin es diagonal, y las estimaciones de mnimos
cuadrados de los coeficientes de regresin son
1/12
O
45 [51.000]
5.625
O] [612]
1
(X'Xr X'y=
~ 1/ ~ 1/8O O
O 85 = 10.625
[
9
1.125
O 1/8
p=
404
Como se ha hecho uso de ellos en muchas ocasiones, los coeficientes de regresin guardan una estrecha relacin con las estimaciones de los efectos que se obtendran por el anlisis usual de un diseo 23 Por
ejemplo, el efecto de la temperatura es (referirse a la figura 10-5)
T=)ir -)ir
= 56.75- 45.50
= 11.25
Observe que el coeficiente de regresin de Xl es
(11.25)/2
= 5.625
Es decir, el coeficiente de regresin es exactamente la mitad de la estimacin usual del efecto. Esto siempre se cumplir para un diseo 2k Como se seal antes, en los captulos 6 al 8 se emple este resultado
para producir modelos de regresin, valores ajustados y residuales en varios experimentos de dos niveles.
Este ejemplo demuestra que las estimaciones de los efectos de un diseo 2k son estimaciones de mnimos
cuadrados.
.........................................................................
En el ejemplo 10-2 es sencillo obtener la matriz inversa porque X'X es diagonal. Intuitivamente, esto
parece ofrecer ventajas, no slo porque los clculos se simplifican sino tambin porque los estimadores de
todos los coeficientes de regresin no estn correlacionados, es decir, COV(~i' ~j) = O. Si los niveles de las
variables X pueden elegirse antes de recabar los datos, quiz sea deseable disear el experimento de tal
modo que resulte una X'X diagonal.
En la prctica puede ser relativamente sencillo conseguir esto. Se sabe que los elementos de X'X que
estn fuera de la diagonal son las sumas de los productos cruzados de las columnas en X. Por lo tanto, es
necesario hacer que el producto interior de las columnas deX sean iguales a cero; es decir, estas columnas
deben ser ortogonales. A los diseos experimentales que poseen esta propiedad para ajustar un modelo
de regresin se les llama diseos ortogonales. En general, el diseo factorial 2k es un diseo ortogonal
para ajustar el modelo de regresin lineal mltiple.
Los mtodos de regresin son en extremo tiles cuando algo "sale mal" en un experimento diseado.
Esto se ilustra en los dos ejemplos siguientes.
EJEMPLO
10~3
1
1
1
1
1
X= 1
1
1
1
1
1
-1
1
-1
1
-1
1
-1
O
O
O
O
-1
-1
1
1
-1
-1
1
O
O
O
O
-1
-1
-1
-1
1
1
1
O
O
O
O
405
32
46
57
65
36
48
57
50
44
53
56
y=
11
-1
X'X= -1
[-1
~~ =~ =:1
-1 -1
X'y=
r =~ j
-59
y entonces
jJ = (X'X) -1 X'y
9.61538X 10-z 1.92307 XlO- z 1.92307 XlO- z
1.92307x10-z 0.15385
2.88462 XlO- z
= [ 1.92307 XlO- z 2.88462 x lO- z 0.15385
1.92307 XlO- z 2.88462x10- z 2.88462xlO- z
1.92307XlO- z ] [544]
-23
2.88462xlO2.88462x10- z
17
0.15385
-59
[:~:;~]
1.25
Compare este modelo con el que se obtuvo en el ejemplo 10-2, donde se usaron las 12 observaciones. Los
coeficientes de regresin son muy similares. Debido a la estrecha relacin entre los coeficientes de regresin y los efectos de los factores, las conclusiones no sufriran una alteracin sustancial por la observacin
faltante. Sin embargo, observe que las estimaciones de los efectos han dejado de ser ortogonales, ya que
(X'X) y su inversa ya no son diagonales.
EJEMPLO 1O~4
e_e
406
Tabla lO-S
Corrida
1
2
3
4
5
6
7
8
9
10
11
12
125
158
121
160
118
163
122
165
140
140
140
140
14
15
15
15
33
30
30
30
22.5
22.5
22.5
22.5
41
40
82
80
39
40
80
83
60
60
60
60
X2
X3
-0.75
0.90
-0.95
1
-1.10
1.15
-0.90
1.25
-0.95
-1
1.1
1
-1.05
-1
1
1.15
O
O
O
O
O
O
O
O
-1.133
-1
-1
-1
1.14
1
1
1
O
O
O
O
Rendimiento
y
32
46
57
65
36
48
57
68
50
44
53
56
experimento diseado cuando el experimentador no ha podido obtener los niveles requeridos de los
factores.
Para ilustrar, el experimento de la tabla 10-5 presenta una variacin del diseo 23 del ejemplo 10-2,
donde muchas de las combinaciones de prueba no son exactamente las que se especifican en el diseo.
Las dificultades parecen haber ocurrido sobre todo con la variable temperatura.
Se ajustar el modelo de los efectos principales
Y= f30 +f3x +f32 x 2 +f33 x 3+8
-0.75
0.90
-0.95
1
-1.10
1.15
-0.90
1.25
O
O
O
O
-0.95
-1
1.1
1
-1.05
-1
1
1.15
O
O
O
O
-1.133
-1
-1
-1
1.4
1
1
1
O
O
O
O
32
46
57
65
36
48
y= 57
68
. 50
44
53
56
612
77.55 ]
Xy= 161.50
19.144