Вы находитесь на странице: 1из 10

10-7 DIAGNSTICOS DEL MODELO DE REGRESIN

417

siempre las grficas de los residuales que se usaron en los experimentos diseados. En general, siempre
es necesario: 1) examinar el modelo ajustado para asegurarse de que proporciona una aproximacin adecuada del verdadero sistema y 2) verificar que no se infringe ninguno de los supuestos de la regresin de
mnimos cuadrados. El modelo de regresin probablemente producir resultados pobres o equivocados a
menos que sea un ajuste adecuado.
Adems de las grficas de los residuales, existen otros diagnsticos del modelo que con frecuencia
son tiles en la regresin. En esta seccin se presenta un breve resumen de estos procedimientos. Para
anlisis ms completos, ver Montgomery y Peck [82] y Myers [84].
1O~ 7.1

Residuales escalados y PRESS

Residuales estandarizados y studentizados


Muchos constructores de modelos prefieren trabajar con residuales escalados en lugar de los residuales
de mnimos cuadrados ordinarios. Estos residuales escalados transmiten con frecuencia ms informacin
que los residuales ordinarios.
Un tipo de residual escalado es el residual estandarizado:
d.=2
fj

= 1, 2, ... ,12

(10-43)

donde por lo general se usa fj = ~ MS E en los clculos. Estos residuales estandarizados tienen media cero
y varianza aproximadamente unitaria; por consiguiente, son muy tiles para buscar puntos atpicos. La
mayora de los residuales estandarizados debern localizarse en el intervalo -3 :5 di :5 3, y cualquier observacin con un residual estandarizado que est fuera de este intervalo es potencialmente inusual con
respecto a su respuesta observada. Estos puntos atpicos debern examinarse con atencin, ya que pueden representar algo tan simple como un error al registrar los datos o algo que sea motivo de mayor preocupacin, como una regin del espacio del regresor, donde el modelo ajustado es una aproximacin
pobre de la verdadera superficie de respuesta.
El proceso de estandarizacin de la ecuacin 10-43 escala los residuales al dividirlos por su desviacin estndar promedio aproximada. En algunos conjuntos de datos, los residuales pueden tener desviaciones estndar que difieren considerablemente. A continuacin se presenta una escalacin que toma en
consideracin esta situacin.
El vector de los valores ajustados )Ji que corresponden a los valores observados Yi es

y =xP
=X(X'X)- X'y

(10-44)

=Hy
A la matriz 12 x 12, H = X(X'xt1X' se le llama generalmente la matriz "gorro" porque mapea el vector de
los valores observados en un vector de los valores ajustados. La matriz gorro y sus propiedades desempean un papel central en el anlisis de regresin.
Los residuales del modelo ajustado pueden escribirse convenientemente en la notacin matricial
como
e =y- y
y resulta que la matriz de covarianza de los residuales es
(10-45)
Cov(e)= a 2 (I-H)
La matriz 1 - H no es por lo general diagonal, por lo que los residuales tienen varianzas diferentes y estn
correlacionados.

418

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

Por lo tanto, la varianza del residual i-simo es


2
V(e i )=a (1-hi)

(10-46)
donde hu es el elemento i-simo de la diagonal de H. Puesto que O ~ h ~ 1, al utilizar el cuadrado medio
residual MSE para estimar la varianza de los residuales en realidad se est sobreestimando V( e). Adems,
puesto que hu es una medida de localizacin del punto i-simo en el espacio x, la varianza de e depende de
dnde est el punto Xi' En general, los residuales situados cerca del centro del espacio x tienen varianzas
ms grandes que los residuales situados en lugares ms apartados. Las violaciones de los supuestos del
modelo son ms probables en los puntos remotos, y estas violaciones pueden ser difciles de detectar por
la inspeccin de e (o d) porque sus residuales sern por lo general ms pequeos.
Se recomienda tomar en consideracin esta desigualdad de la varianza cuando se escalen los residuales. Se sugiere graficar los residuales studentizados:
r.
I

i = 1, 2, ...,

e
~(j2(1-hi)

11

(10-47)

con (j2 = MS E en lugar de e (o d). Los residuales studentizados tienen varianza constante V(r) = 1 independientemente de la localizacin de X cuando la forma del modelo es correcta. En muchas situaciones la
varianza de los residuales se estabiliza, en particular para conjuntos de datos grandes. En estos casos puede haber poca diferencia entre los residuales estandarizados y los studentizados. Por lo tanto, los residuales estandarizados y studentizados transmiten con frecuencia informacin equivalente. Sin embargo, ya
que cualquier punto con un residual grande y una hu grande tiene una influencia potencialmente considerable sobre el ajuste de mnimos cuadrados, suele recomendarse el examen de los residuales studentizados. En la tabla 10-3 se presentan las diagonales gorro hu Ylos residuales studentizados para el modelo de
regresin de la viscosidad del ejemplo 10-1.
Residuales PRESS
La suma de cuadrados del error de prediccin (PRESS, del ingls Prediction Error Sum of Squares) proporciona una til escalacin de los residuales. Para calcular la PRESS se selecciona una observacin, por
ejemplo la i. Se ajusta el modelo de regresin a las 11 - 1 observaciones restantes y se usa esta ecuacin
para predecir la observacin que se apart Yi' Al denotar este valor predicho Y(i)' puede encontrarse el
error de prediccin del punto i como e(i) = Y = Y(i)' Al error de prediccin suele llamrsele el residual
PRESS i-simo. Este procedimiento se repite para cada observacin i = 1, 2, ... ,11, producindose un conjunto de 11 residuales PRESS e(l)' e(2)' oo., e(n)' Entonces el estadstico PRESS se define como la suma de
cuadrados de los 11 residuales PRESS como en
PRESS

e~) = !

i=l

[Yi - Y(i)]2

(10-48)

i=l

Por lo tanto, la PRESS utiliza cada subconjunto posible de 11 -1 observaciones como un conjunto de datos
de estimacin, y se utiliza una observacin a la vez para formar un conjunto de datos de prediccin.
Inicialmente, parecera que para calcular la PRESS es necesario ajustar 11 regresiones diferentes. Sin
embargo, la PRESS puede calcularse a partir de los resultados de un solo ajuste de mnimos cuadrados a
las 11 observaciones totales. Resulta que el residual PRESS i-simo es
e

e(i)

= 1- h..

(10-49)

11

Por lo tanto, ya que la PRESS es tan slo la suma de cuadrados de los residuales PRESS, una frmula de
clculo simple es
PRESS

! ( ~h )2
i=l

(10-50)

10-7 DIAGNSTICOS DEL MODELO DE REGRESIN

419

por la ecuacin 10-49 es sencillo ver que el residual PRESS es slo el residual ordinario ponderado de
acuerdo con los elementos de la diagonal de la matriz gorro hu. Los puntos de los datos para los que hu es
grande tendrn residuales PRESS grandes. Estas observaciones sern por lo general puntos de alta influencia. En general, una diferencia grande entre el residual ordinario y los residuales PRESS indicar un
punto donde el modelo se ajusta bien a los datos, pero un modelo construido sin dicho punto producir
predicciones pobres. En la siguiente seccin se estudiarn otras medidas de influencia.
Por ltimo, cabe sealar que la PRESS puede usarse para calcular una R 2 aproximada de prediccin,
por ejemplo
?
.
PRESS
(10-51 )
RpredicciD = 1S
JY

Este estadstico ofrece cierto indicio de la capacidad predictiva del modelo de regresin. Para el modelo
de regresin de la viscosidad del ejemplo 10-1, los residuales PRESS pueden calcularse utilizando los residuales ordinarios y el valor de hu encontrado en la tabla 10-3. El valor correspondiente del estadstico
PRESS es PRESS = 5207.7. Entonces
2
PRESS
RpredicciD = 1S
JY

= 1-

5207.7
47,635.9
= 0.8907

Por lo tanto, podra esperarse que este modelo "explique" cerca de 89% de la variabilidad al predecir
nuevas observaciones, en comparacin con el aproximadamente 93% de la variabilidad en los datos originales que explica el ajuste de mnimos cuadrados. La capacidad predictiva global del modelo basado en
este criterio parece ser muy satisfactoria.
R-student

Es comn considerar al residual studentizado T comentado antes como el diagnstico de un punto atpico. Se acostumbra usar MSE como una estimacin de cr en el clculo de T. Se hace referencia a este enfoque como la escalacin interna del residual, ya que MSE es una estimacin de cr generada internamente
que se obtiene del ajuste del modelo a las n observaciones. Otro enfoque sera usar una estimacin de cr
basada en un conjunto de datos en el que se elimina la observacin i-sima. La estimacin de cr as obteniPuede demostrarse que
da se denota por S
2
(n- p)MSE _e2 /(l-h)
S(i)=
n-p-1
(10-52)

t).

La estimacin de cr de la ecuacin 10-52 se usa en lugar de MSE para producir un residual studentizado
externamente, al que es comn llamar R-student, dado por
t.
1

e.
1

~sti) (1- h)

i = 1, 2, ..., n

(10-53)

En muchas situaciones habr una ligera diferencia entre t y el residual studentizado ri' Sin embargo,
si la observacin i-sima es influyente, entonces S puede diferir significativamente de MSE, y por lo tanto la R-student ser ms sensible a este punto. Adems, bajo los supuestos usuales, ti tiene una distribucin tll - p - 1' Por lo tanto, la R-student ofrece un procedimiento ms formal para detectar puntos atpicos a
travs de la prueba de hiptesis. En la tabla 10-3 se muestran los valores de laR-student para el modelo de
regresin de la viscosidad del ejemplo 10-1. Ninguno de esos valores es inusualmente grande.

ti)

r
420
1O~7.2

CAPTULO 10

AJUSTE DE MODELOS DE REGRESIN

Diagnsticos de influencia

En ocasiones se encuentra que un subconjunto pequeo de los datos ejerce una influencia desproporcio_
nada sobre el modelo de regresin ajustado. Es decir, las estimaciones o predicciones de los parmetros
pueden depender ms del subconjunto influyente que de la mayora de los datos. Sera conveniente localizar estos puntos influyentes y valorar su impacto en el modelo. Si estos puntos influyentes son valores
"malos", debern eliminarse. Por otra parte, quiz no haya nada malo con estos puntos. Pero si controlan
propiedades clave del modelo, sera deseable saberlo, ya que podra afectar el uso del modelo. En esta
seccin se describen e ilustran algunas medidas tiles. de influencia.
Puntos de accin de palanca

La localizacin de los puntos en el espacio x es importante para determinar las propiedades del modelo. En
particular, las observaciones apartadas tienen potencialmente acciones o brazos de palanca desproporcionados sobre las estimaciones de los parmetros, los valores predichos y los estadsticos de resumen usuales.
La matriz gorro H :=: X(X'Xt1X' es muy til para identificar las observaciones influyentes. Como ya
se seal, H determina las varianzas y covarianzas de y y e, ya que V(Y) :=: a2H y V( e) :=: a2(I - H). Los elementos hu de H pueden interpretarse como la cantidad de accin de palanca ejercida porYj sobre J. Por lo
tanto, la inspeccin de los elementos de H puede .revelar puntos que son potencialmente influyentes en
virtud de su localizacin en el espacio x. La atencin suele centrarse en los elementos de la diagonal h.
Puesto que L;~l h:=: rango(H) :=: rango(X) :=: p, el tamao promedio de los elementos de la diagonal de la
matriz H es pln. Como gua aproximada, entonces, si un elemento h de la diagonal es mayor que 2pln, la
observacin i es un punto con accin de palanca alta. Para aplicar lo anterior al modelo de la viscosidad
del ejemplo 10-1, observe que 2pln :=: 2(3)/16 :=: 0.375. En la tabla 10-3 se dan las diagonales gorro h para
el modelo de primer orden; puesto que ninguna de las h excede 0.375, se concluira que no hay puntos de
accin de palanca en estos datos.
Influencia sobre los coeficientes de regresin

Las diagonales gorro identificarn los puntos potencialmente influyentes debido a su localizacin en el
espaciox. Es deseable considerar la localizacin del punto y la variable de respuesta cuando se mide la influencia. Cook [32a, b] ha sugerido el uso de una medida del cuadrado de la distancia entre la estimacin de mnimos cuadrado~, basada en todos los n puntos y la estimacin obtenida al eliminar el punto i,
por ejemplo P(i)' Esta medida de la distancia puede expresarse como

D. :=:
,

(P u)- P)'X'x(jJU) - P)
pMS E

i :=: 1, 2,

OO"

(10-54)

Un valor de referencia razonable paraD es la unidad. Es decir, en general las observaciones para las que
D > 1 se consideran influyentes.
El estadstico D se calcula en realidad a partir de
D. :=: r/ V[Y(x )]
, p V(e)

r/

h
p (l-h)

i :=: 1, 2, .oo,

11

(10-55)

Observe que, aparte de la constante p, D es el producto del cuadrado del residual studentizado i-simo y
hu/(l-h). Puede demostrarse que este cociente es la distancia del vector X al centroide de los datos restantes. Por lo tanto, D est compuesto por un componente que refleja la medida en que el modelo ajusta

lO-S PRUEBA DE FALTA DE AJUSTE

421

la observacin i-simaYi y un componente que mide qu tan alejado est ese punto del resto de los datos.
Cualquiera de los componentes (o ambos) puede contribuir a un valor grande de Di'
En la tabla 10-3 se muestran los valores de Di para el ajuste del modelo de regresin a los datos de la
viscosidad del ejemplo 10-1. Ninguno de estos valores de Di excede 1, por 10 que no hay evidencia slida
de observaciones influyentes en estos datos.

10-8

PRUEBA DE FALTA DE AJUSTE

En la seccin 6-6 se indic cmo agregar puntos centrales a un diseo factorial 2" le permite al experimentador obtener una estimacin del error experimental puro. Esto permite hacer la particin de la suma de
cuadrados de los residuales SSE en dos componentes; es decir,
SSE

= SSpE +SSWF

donde SSPE es la suma de cuadrados debida al ~rror puro y SSLOF es la suma de cuadrados debida a la falta
de ajuste.
Puede presentarse un desarrollo general de esta particin en el contexto de un modelo de regresin.
Suponga que se tienen ni observaciones de la respuesta en el nivel i-simo de los regresores Xi' i = 1, 2, ...,
m. Sea queYij denota la observacinj-sima de1a respuesta en Xi' i = 1,2, ... ,m yj = 1,2, ..., ni' Hay n = 2:;':1
ni observaciones en total. El residual (ij)-simo puede escribirse como
(lO-56)
donde jii es el promedio de las ni observaciones en Xi' Al elevar al cuadrado ambos miembros de la ecuacin 10-56 y hacer la operacin suma sobre i y j se obtiene
(10-57)
El primer miembro de la ecuacin 10-57 es la suma de cuadrados de los residuales ordinaria. Los dos
componentes del segundo miembro miden el error puro y la falta de ajuste. Se observa que la suma de
cuadrados del error puro
(10-58)
se obtiene calculando la suma de cuadrados corregida de las observaciones repetidas en cada nivel de X y
haciendo despus la agrupacin en los m niveles de x. Si se satisface el supuesto de la varianza constante,
sta es una medida independiente del modelo del error puro, ya que para calcular SSPE slo se usa la variabilidad de las y en cada nivel Xi' Puesto que hay ni - 1 grados de libertad del error puro en cada nivel Xi' el
nmero total de grados de libertad asociados con la suma de cuadrados del error puro es

(n-l)=n-m

(10-59)

=~

(10-60)

i=l

La suma de cuadrados de la falta de ajuste


SSWF

i=1

n(Yi -)Ji)2

422

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

es una suma ponderada de los cuadrados de las desviaciones entre la respuesta media Yi en cada nivel Xi y
el valor ajustado correspondiente. Si los valores ajustados )Ji estn cerca de las respuestas promedio); correspondientes, entonces hay un fuerte indicio de que la funcin de regresin es lineal. Si lasvse desvan
mucho de lasy, entonces es probable que la funcin de regresin no sea lineal. Hay m - p grajos de libertad asociados con SSLOF porque hay m niveles de x, y se pierden p grados de libertad porque deben estimarse p parmetros para el modelo. En lo que a los clculos se refiere, por lo general SSLOF se obtiene
restando SSPE de SSE'
El estadstico de prueba para la falta de ajuste es
F a-

El valor esperado de MSPE es

SSWF I (m- p) MSWF


- -SSPE I(n-m) - MS pE

er, y el valor esperado

(10-61)

de MSLOF es

(10-62)
Si la verdadera funcin de regresin es lineal, entonces E(Yi ) = f3 a + 2:.J=If3 jXij' y el segundo trmino de la
ecuacin 10-62 es cero, dando como resultado E(MSLOF) = er. Sin embargo, si la verdadera funcin de regresin no es lineal, entonces E(Yi ) :;t: f3 a + 2:.J=If3 jXij y E(MSLOF) > er. Adems, si la verdadera funcin de
regresin es lineal, entonces el estadstico Fa sigue la distribucin Fm-p,n-m' Por lo tanto, para probar la falta
de ajuste, se calculara el estadstico de prueba Fa y se concluira que la funcin de regresin no es lineal si
Fa > Fa, m-p,n-m'
Es sencillo incorporar este procedimiento de prueba en el anlisis de varianza. Si se concluye que la
funcin de regresin no es lineal, entonces el modelo tentativo habr de abandonarse y debern hacerse
intentos para encontrar una ecuacin ms apropiada. De manera alternativa, si Fa no excede Fa,m-p, n-m' no
existe evidencia slida de falta de ajuste y MSPE y MSLOF se combinan con frecuencia para estimar er. El
ejemplo 6-6 es una ilustracin muy completa de este procedimiento, donde las rplicas de las corridas son
puntos centrales de un diseo factorial 22

10~9

PROBLEMAS

10-1. La resistencia a la tensin de un producto de papel se relaciona con la cantidad de madera dura en la pulpa.
Se producen 10 muestras en la planta piloto y los datos obtenidos se presentan en la siguiente tabla.
Resistencia

Porcentaje de madera dura

Resistencia

Porcentaje de madera dura

160

10

15
15
20
20

181
188

20

171
175
182

184

193
195
200

25
25
28
30

a) Ajustar un modelo de regresin lineal que relacione la resistencia con el porcentaj e de madera dura.
Probar el modelo del inciso a para la significacin de la regresin.
e) Encontrar un intervalo de confianza de 95% para el parmetro {31'
10-2. En una planta se destila aire lquido para producir oxgeno, nitrgeno y argn. Se piensa que el porcentaje de
impurezas en el oxgeno se relaciona linealmente con la cantidad de impurezas en el aire, medida por el
b)

Il'rrnm
i
1

10-9 PROBLEMAS

423

"conteo de contaminacin" en partes por milln (ppm). Una muestra de los datos de operacin de la planta
se presenta a continuacin:

Pureza (%)

93.3

Conteo de contaminacin (ppm)

1.10

93.1

1.45

93.2

0.99

10-3.
10-4.
10-5.
10-6.

92.0

92.9

0.83

1.22

92.4
1.36
92.2
1.47

91.7
1.59
91.3
1.81

94.0
1.08
90.1
2.03

94.6
0.75
91.6
1.75

93.6
1.20
91.9
1.68

a) Ajustar un modelo de regresin lineal a los datos.


b) Probar la significacin de la regresin.
e) Encontrar un intervalo de confianza de 95% para 13.
Graficar los residuales del problema 10-1 y comentar la adecuacin del modelo.
Graficar los residuales del problema 10-2 y comentar la adecuacin del modelo.
Utilizando los resultados del problema 10-1, probar el modelo de regresin para la falta de ajuste.
Se realiz un estudio sobre el desgaste y de un cojinete y su relacin conx = viscosidad del aceite y X 2 = carga. Se obtuvieron los siguientes datos:
y
193
230
172
91
113
125

x
1.6
15.5
22.0
43.0
33.0
40.0

X2

851
816
1058
1201
1357
1115

a) Ajustar un modelo de regresin lineal mltiple a los datos.


b) Probar la significacin de la regresin.
e) Calcular el estadstico t para cada parmetro del modelo. Qu conclusiones pueden sacarse?
10-7. Se piensa que la potencia al freno desarrollada por el motor de un automvil en un dinammetro es una funcin de la rapidez del motor en revoluciones por minuto (rpm), el octanaje del combustible y la compresin
del motor. Se llev a cabo un experimento en el laboratorio y los datos colectados fueron:

Potencia al freno

rpm

Octanaje

Compresin

225
212
229
222
219
278
246
237
233
224
223
230

2000
1800
2400
1900
1600
2500
3000
3200
2800
3400
1800
2500

90
94
88
91
86
96
94
90
88
86
90
89

100
95
110
96
100
110
98
100
105
97
100
104

"

424

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

a) Ajustar un modelo de regresin mltiple a estos datos.


b) Probar la significacin de la regresin. Qu conclusiones pueden sacarse?
e) Con base en las pruebas t, son necesarios los tres regresares en el modelo?
10-8. Analizar los residuales del modelo de regresin del problema 10-7. Comentar la adecuacin del modelo.
10-9. El rendimiento de un proceso qumico se relaciona con la concentracin del reactivo y la temperatura de
operacin. Se realiza un experimento con los siguientes resultados:

Rendimiento

Concentracin

81
89
83
91
79
87
84
90

1.00
1.00
2.00
2.00
1.00
1.00
2.00
2.00

Temperatura
150
180
150
180
150
180
150
180

a) Suponga que quiere ajustarse un modelo de los efectos principales a estos datos. Establecer la matriz
X'X utilizando los datos exactamente como aparecen en la tabla.
b) La matriz que se obtuvo en el inciso a es diagonal? Comentar la respuesta.
e) Suponga que el modelo se escribe en trminos de las variables codificadas "usuales"

xI

Concentracin -1.5
0.5

x2

Temperatura -165
15

Establecer la matriz X'X para el modelo en trminos de estas variables codificadas. Esta matriz es diagonal? Comentar la respuesta.
d) Definir un nuevo conjunto de variables codificadas

XI

Concentracin - 1.O
1.0

= --------

Temperatura - 150
30

=------''----------

X
2

Establecer la matriz X'X para el modelo en trminos de este conjunto de variables codificadas. Esta
matriz es diagonal? Comentar la respuesta.
e) Resumir lo que se haya aprendido acerca de la codificacin de variables con este problema.
10-10. Considere el experimento factaria12 4 del ejemplo 6-2. Suponga que falta la ltima observacin. Volver a analizar los datos y sacar conclusiones. Cmo se comparan estas conclusiones con las del ejemplo original?
10-11. Considere el experimento factorial 24 del ejemplo 6-2. Suponga que faltan las dos ltimas observaciones.
Volver a analizar los datos y sacar conclusiones. Cul es el resultado de la comparacin de estas conclusiones con las del ejemplo original?
10-12. Dados los datos siguientes, ajustar el modelo de regresin polinomial de segundo orden

10-9 PROBLEMAS

X2

26
24
175
160
163
55
62
100
26
30
70
71

1.0
1.0
1.5
1.5
1.5
0.5
1.5
0.5
1.0
0.5
1.0
1.5

1.0
1.0
4.0
4.0
4.0
2.0
2.0
3.0
1.5
1.5
2.5
2.5

425

Despus de que se haya ajustado el modelo, probar la significacin de la regresin.


10-13. a) Considere el modelo de regresin cuadrtico del problema 10-12. Calcular los estadsticos t de cada uno
de los parmetros del modelo y comentar las conclusiones a que se llega a partir de estas cantidades.
b) Usar el mtodo de la suma de cuadrados extra para evaluar el valor de los trminos cuadrticos X2, x~ y
XX 2 del modelo.
10-14. Relacin entre el anlisis ae varianza y el anlisis de regresin. Cualquier modelo del anlisis de varianza puede
expresarse en trminos del modelo lineal general y = xfJ + e, donde la matriz X se compone de ceros y unos.
Demostrar que el modelo con un solo factor Yij = 1-1 + T + cij, i = 1,2, 3,j = 1,2,3,4 puede escribirse en la forma del modelo lineal general. Despus
a) Escribir las ecuaciones normales (X'X)jJ = X'y y compararlas con las ecuaciones normales que se encontraron en el captulo 3 para este modelo.
b) Encontrar el rango de X'X. Es posible obtener (X'X)-?
e) Suponga ql1e se elimina la primera ecuacin normal y se agrega la restriccin ~;~ ni = o. Tiene solucin el sisterila de ecuaciones resultante? De ser as, encontrarla. Hallar la suma de cuadrados de regresin jJ'X'yy compararla con la suma de cuadrados de los tratamientos del modelo con un solo factor.
10-15. Suponga que se est haciendo el ajuste de una lnea recta y se desea hacerla varianza de /3 tan pequea como
sea posible. Al trabajar con la restriccin de un nmero par de puntos experimentales, dnde debern colocarse estos puntos para minimizar V(/3)? (Nota: usar el diseo que se pide en este ejercicio con sumo cuidado, ya que, aun cuando minimiza V(/3), tiene propiedades indeseables; ver, por ejemplo, Myers y
Montgomery [85a]. nicamente si se tiene una gran seglllidad de que la verdadera relacin funcional es lineal deber considerarse el uso de este diseo.)
10-16. Mnimos cuadrados ponderados. Suponga que se est ajustando la lnea recta Y = 130 + f3x + c, pero la varianza
de las y depende ahora del nivel de x; es decir,

a?

V(ylx.)=a 2 = 1

i = 1,2, ... ,11

donde las W son constantes desconocidas, llamadas con frecuencia ponderaciones. Demostrar que si se eligen las estimaciones de los coeficientes de regresin para minimizar la suma de cuadrados de los errores
ponderados dada por. w(y - 130 - f3x )2, las ecuaciones normales de mnimos cuadrados resultantes son
1=1

i=l

i=1

~02: w+~2: wx =

~o! Wx+~! WX;


;=1

;=1

2: wY
;=1

=!
;=1

WXY

~'''1

426

CAPTULO 10

AJUSTE DE MODELOS DE REGRESIN

10-17. Considere el diseo 2i;:/ analizado en el ejemplo 10-5.


a) Suponga que se opta por aumentar el diseo con la corrida nica seleccionada en ese ejemplo. Encontrar
las varianzas y las covarianzas de los coeficientes de regresin del modelo (ignorando los bloques):

y= 130 +f3x +f32 x 2+f33 x 3+f34 x 4


+f3 12 XX 2 +f334X3X4 +e
Hay otras corridas de la fraccin alterna que separaran los alias AB de CD?
e) Suponga que el diseo se aumenta con las cuatro corridas sugeridas en el ejemplo 10-5. Encontrar las varianzas y las covarianzas de los coeficientes de regresin (ignorando los bloques) para el modelo del
inciso a.
d) Considerando los incisos a y e, qu estrategia de aumento se preferira y por qu?
10-18. Considere un diseo 2;;t Suponga que despus de correr el experimento, los efectos observados ms grandes sanA + BD, B + AD y D + AB. Quiere aumentarse el diseo original con un grupo de cuatro corridas
para separar los alias de estos efectos.
a) Cules son las cuatro corridas que se haran?
b) Encontrar las varianzas y las covarianzas de los coeficientes de regresin del modelo
b)

y= 130 +f3x +f32 X2+f34 x 4+f312 XX 2 +f34 XX 4

+13 24X2X4 + e

:::1
~:J

"

,
:11

e)

Es posible separar los alias de estos efectos con menos de cuatro corridas adicionales?