Вы находитесь на странице: 1из 71

Metodología de Superficies de Respuesta P. Reyes / Dic.

2006

METODOLOGÍA DE
SUPERFICIES DE RESPUESTA

PRIMITIVO REYES AGUILAR

Diciembre, 2006

1
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

CONTENIDO

1. Conceptos básicos 3

2. Introducción a las superficies de respuesta 14

3. Modelos y diseños de primer orden 32

4. Modelos y diseños de segundo orden 39

5. Determinación de las condiciones óptimas 42

2
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

1. CONCEPTOS BÁSICOS

La técnica de superficies de respuesta se ha utilizado principalmente en las


industrias de proceso y químicas, donde después de realizar un diseño de
experimentos para identificar las variables relevantes, se hace un estudio posterior
en los rangos relevantes de las variables con objeto de optimizar el proceso. Para
la optimización, si las variables de control son dos o tres cuantitativas, se puede
optimizar el proceso.

IDEAS BASICAS

Suponiendo que se tiene un sistema con una variable de respuesta y que


depende del nivel de varias variables de entrada: 1 ,  2 , 3,.... k . Se asume que los
niveles de las  ’s pueden ser controladas con un error despreciable. El
experimento se realiza con las variables de diseño x1, x 2 ,.... x k , las cuales son
simples transformaciones de las  ’s. Cada tratamiento puede ser representado
por un punto con coordenadas ( x1k , x 2 k ,.... xik ) en un espacio factorial de k –
dimensiones, en cada punto es observado un valor de y i . Donde:

__
  i
xi  ik ; el denominador es la diferencia entre niveles de  ’s.
 ik   ik 1

En general la respuesta es una función de las variables de entrada:

y  f (1 ,  2, 3,.... n )

Esta función es desconocida y a veces complicada.

El procedimiento básico de superficies de respuesta consiste en aproximar la


función f ( ) con un polinomio de bajo orden y usar datos de una muestra para
aproximar por el método de mínimos cuadrados, los coeficientes del polinomio.

I. SUPUESTOS BASE

Los supuestos básicos son:

1. Existe la estructura y  f (1 ,  2, 3,.... n ) , y es complicada o desconocida.


2. Las variables  i son cuantitativas y continuas.
3. La función verdadera f ( ) puede ser ajustada en la región de interés por un
polinomio de bajo orden.
4. Las variables de diseño ( x1k , x 2 k ,.... xik ) son controladas y medidas sin error.

La meta del análisis de superficies de respuesta es:

3
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

1. Encontrar una función de ajuste adecuado con el propósito de predecir la


respuesta futura.
2. Hallar los niveles de las variables de entrada para los cuales, en cierto sentido,
la respuesta es optimizada.

Si se realiza un experimento con variables de diseño ( x1k , x 2 k ,.... xik )


representado las variables de entrada 1 ,  2 , 3,.... n , se puede obtener una
aproximación satisfactoria de f ( ) a partir de los términos de bajo orden la serie
de expansión de Taylor alrededor del punto x1  x 2  ..... xk  0 .

Se toma un modelo de primer orden cuando el experimentador está interesado en


analizar f en una región angosta de x1, x 2 ,.... x k , con poca curvatura presente.
En términos de las variables se tiene:

k
E ( y )   0    i xi
i 1

La ecuación de estimación para este modelo de primer orden es:

^ k
y  b0   bi xi
i 1

donde bo , b1, son estimadores muestrales de  0,  1

Escribiendo la ecuación en forma matricial se tiene:

y = b0 + x’ b

en donde:

 x1  b1 
x  b 
x=  2; b=  2
....  ....
   
 xk  bk 

4
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

De otra forma, el experimentador podría usar la función de aproximación de


segundo orden, tomando los términos de primero y segundo orden de la
expansión, se tiene el polinomio cuadrático siguiente:

k k
E ( y )   0    i xi    ii xii   
2
ij xi x j
i 1 i 1 i j ij

 0,  1 , x1 son del modelo de primer orden

ii = coeficiente cuadrático de la variable i

 ij = coeficiente de interacción de las variables i, j.

La ecuación de estimación para este modelo, en forma matricial se puede escribir


como:

y = b0 + x’ b + x’ B x , donde la matriz B, es:

b11,b12 / 2,..............b1k / 2 
 
....
 22 b ,............... b2k / 2 
B=
.........................b( k 1),k / 2
 
sym,........................bkk 

ANÁLISIS DE LA SUPERFICIE AJUSTADA

Habiendo encontrado y probado un polinomio que aproxime la función de


respuesta, el próximo paso es buscar las características esenciales de la
superficie ajustada, como sigue:

Se puede calcular el punto en el cual y es un máximo, un mínimo o un punto en


una silla, se le denomina punto estacionario ( x0 )ya que la derivada vale cero.

De la ecuación general para la estimación de la respuesta:

y = b0 + x’ b + x’ B x

5
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

Las coordenadas del punto estacionario x0 se encuentran por derivación parcial


de la ecuación de primer orden para la respuesta estimada, quedando como:

x0 = - B -1 b / 2

donde b y B se obtienen de la ecuación de estimación.

el valor de y, y0 en el punto estacionario se encuentra substituyendo x0 en la


ecuación de estimación, quedando como:

y0 = b0 + ( x’ b ) / 2

**** poner figuras 5.3 y 5.5

Ejemplo 1.1

Un químico realiza un experimento para observar el efecto de la temperatura Tp y


el tiempo de reacción Tm, sobre el rendimiento de un proceso utilizado para
producir antibióticos. El experimento es como sigue:

Tratamiento Tp Tm
1 20 20
2 20 50
3 20 80
4 50 20
5 50 50
6 50 80
7 80 20
8 80 50
9 80 80

Transformando los datos para encontrar las variables de diseño x 1i , x2i


con la fórmula:

xij  ( ij  50) / 30

Se tiene la siguiente tabla de valores:


Bloques
Tratamiento x1 x2 I II III Totales
1 -1 -1 13.66 13.16 15.05 41.87
2 -1 0 12.23 13.84 11.85 36.92
3 -1 1 7.97 10.19 8.38 26.54

6
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

4 0 -1 16.98 13.42 14.29 44.69


5 0 0 13.8 15.55 13.92 43.27
6 0 1 12.86 18.27 15 46.13
7 1 -1 10 10.01 11.1 31.11
8 1 0 10.88 12.18 11.13 34.19
9 1 1 13.28 10.06 11.96 35.3
Totales 111.66 115.78 112.68 340.02

Haciendo un análisis de varianza preliminar con los datos anteriores para el diseño
en bloques aleatorios se tiene:

La suma de cuadrados total es:

9 3
y..2
SST    yij2 
i 1 j 1 9 x3

SST = 13.662 + 13.162 + ....... + 10.062 + 11.962 - (340.02)2 / 27

SST = 155.65 con N –1 grados de libertad gl = 26

La suma de cuadrados para los 9 tratamientos es:

9
y i2. y..2
SS trat   
i 1 3 9 x3

SSt = [41.872 + 36.922 + ....... + 34.192 + 35.302] / 3 - (340.06)2 / 27

SSt = 118.3145 con i – 1 grados de libertad gl = 8

La suma de cuadrados de los 3 bloques es:

3 y.2j y..2
SS bloque   
j 1 9 9 x3

SSb = [111.162 + 115.782 + 112.682 ] / 9 - (340.06)2 / 27

SSb = 0.907 con j –1 grados de libertad gl = 2

Para el error se tiene:

SSe = SST – SSt – SSb = 154.1606 – 118.3145 – 0.9704

SSe = 34.8757

7
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

Para la formación de la tabla ANOVA se calculan las sumas promedio cuadradas


MS y el estadístico F como:

MSt = SSt / gl t

MSb = SSb / gl b

F = ( MSt o MSb ) / MSe

Por tanto se tiene:

TABLA ANOVA

Fuente Suma de grados de Cuadrados estadístico


de variación cuadrados libertad medios F
Total 155.066 26
Bloque 0.9704 2 0.4852
Tratamiento 118.3145 8 14.7893 6.78**

Error 34.8757 16 2.1797 .

** significativo al nivel de 1% con F de tablas = 3.9, p = 0.000

Con Excel: ANOVA de dos vías

ANÁLISIS DE VARIANZA
Probabilida
Origen de Suma de Grados de Promedio de F d Valor crítico
las variaciones cuadrados libertad los cuadrados para F
Bloques 1.564474074 2 0.782237037 0.347516178 0.71164228 3.63372347
Tratamientos 118.0374296 8 14.7546787 6.554905118 0.00073389 2.59109618
Error 36.01499259 16 2.250937037

Total 155.6168963 26

Como los dos factores de tratamiento son variables cuantitativas, probaremos si


se puede aproximar una superficie de respuesta usando un polinomio cuadrático
como una ecuación ajustada para describir la superficie.

Utilizando un modelo de segundo orden, la ecuación de estimación para dos


factores que aproxime la superficie de respuesta es:

yˆ  b0  b1 x1  b2 x2  b11 x112  b12 x1 x2  b22 x22


2

La matriz básica de diseño (X) para este experimento se muestra a continuación:

8
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

X= bo b1 b2 b11 b12 b22


1 -1 -1 1 1 1
1 -1 0 1 0 0
1 -1 1 1 -1 1
1 0 -1 0 0 1
1 0 0 0 0 0
1 0 1 0 0 1
1 1 -1 1 -1 1
1 1 0 1 0 0
1 1 1 1 1 1
X’ =
bo 1 1 1 1 1 1 1 1 1
b1 -1 -1 -1 0 0 0 1 1 1
b2 -1 0 1 -1 0 1 -1 0 1
b11 1 1 1 0 0 0 1 1 1
b12 1 0 -1 0 0 0 -1 0 1
b22 1 0 1 1 0 1 1 0 1

El patrón anterior es repetido tres veces para los tres bloques.

Las ecuaciones normales para este experimento son:

X’ X b = X’ y

X’X =
bo b1 b2 b11 b12 b22
donde: 1 -1 -1 1 1 1
1 -1 0 1 0 0
1 -1 1 1 -1 1
3*X’X =
1 0 -1 0 0 1
27 0 0 18 0 18
1 0 0 0 0 0
0 18 0 0 0 0
1 0 1 0 0 1
0 0 18 0 0 0
1 1 -1 1 -1 1
18 0 0 18 0 12
1 1 0 1 0 0
0 0 0 0 12 0
1 1 1 1 1 1
18 0 0 12 0 18

9
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

b0 
b  Y
 1  41.9

b2  36.9
26.5
b=   44.7
b
 11  43.3
46.1
b12  31.1

  34.2
35.3
b22 

X’ y=

=
340.02
-4.73
-9.7
205.93
19.52
225.64

Por tanto de la ecuación X’ X b = X’ y se tiene:

b0 340.02
b1 -4.73
b2
= -9.7
b11 205.93
b12 19.52
b22 225.64

La solución para b = (X’ X)-1 X’ y, por tanto:

b=
15.0144444
0.19 0.00 0.00 -0.11 0.00 -0.11
-0.26277778
0.00 =
0.06 0.00 0.00 0.00 0.00
-0.53888889
0.00 0.00 0.06 0.00 0.00 0.00
-3.45833333
1.62666667
-0.17333333
10
340.02
Metodología de Superficies de Respuesta -4.73 P. Reyes / Dic. 2006
-9.7
205.93
-0.11 0.00 0.00 0.17 0.00 0.00 19.52
0.00 0.00 0.00 0.00 0.08 0.00 225.64
-0.11 0.00 0.00 0.00 0.00 0.17

La suma de cuadrados SSR de la regresión para la superficie ajustada (con


corrección en la media) es:

SSR = b’ X’ y - (  y ) / 27
2

donde:

b’ X’ =

13.811 11.819 9.480 15.380 15.014 14.302 10.032 11.293 12.208

Entonces b’ X’ y es:

 41.87 
36.92 
 
 26.54 
 
 44 . 69 
b’ X’ y = (b’X’)  43.27 
 
 46 . 13 
31.11 
 
 34. 19 
35.30 
 
b’ X’ y = 4392.149
Con los valores anteriores, calculando SSR se tiene:

SSR = 4392.149 – 4281.9852 = 112.7561

La suma de cuadrados para la falta de ajuste, SSLF es:

SSLF = SST –SSR = 118.3145 – 112.7261 = 5.5884

11
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

El análisis de varianza ANOVA final con la suma de cuadrados de tratamientos


particionados en un componente asociado con la superficie ajustada y un
componente asociado con la falta de ajuste es:

TABLA ANOVA

Fuente Suma de grados de Cuadrados estadístico


de variación cuadrados libertad medios F

Total 154.1606 26
Bloque 0.9704 2 0.4852

Superficie 112.7561 5 22.5452 10.34**


ajustada

Falta de 5.5844 3 1.8628 0.85 NS


ajuste

Error 34.8757 16 2.1797 .

** significativo al nivel de 1% con F de tablas = 3.9, p = 0.000


NS, no significativo
En Minitab

Reconocer el diseño:
Stat > DOE > Response surface > Custom Response Surface design
Factors Tp Tm (A B)
Low/High Tp 20 80 Tm 20 80 (A -1 1 B -1 1)
OK

Analizar el diseño
Stat > DOE > Response Surface > Analysis Response Surface design
Responses Rendim Seleccionar Coded Units
Terms (Full cuadratic pasar los factores con >>)
OK
Analysis of Variance for Rendim

Source DF Seq SS Adj SS Adj MS F P


Regression 5 108.763 108.763 21.753 9.75 0.000
Linear 2 7.051 7.051 3.526 1.58 0.229
Square 2 69.959 69.959 34.979 15.68 0.000
Interaction 1 31.753 31.753 31.753 14.23 0.001
Residual Error 21 46.854 46.854 2.231
Lack-of-Fit 3 9.275 9.275 3.092 1.48 0.253
Pure Error 18 37.579 37.579 2.088
Total 26 155.617

De la tabla de ANOVA se observa que la superficie ajustada contiene una cantidad


significativa de la variación de la respuesta, mientras que la falta de ajuste no es

12
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

significativa. La proporción de la variación total en respuesta contenida en la


superficie de respuesta es:

R2 = SSR / Sstot = 112.726 / 154.1606 = 0.73

La ecuación que describe la superficie en términos de las variables de diseño es:

y  15.35  0.26 x1  0.54 x 2  3.46 x12  1.63x1 x 2  0.67 x 22

0.26 3.46, 081x1


y 15.  x1,3 2 x1,2  b0 x’b +x’Bx

0.54 0.81,67x2
Estimated Regression Coefficients for Rendim

Term Coef SE Coef T P


Constant 15.0885 0.6428 23.474 0.000
A -0.3183 0.3521 -0.904 0.376
B -0.5389 0.3521 -1.531 0.141
A*A -3.4028 0.6098 -5.580 0.000
B*B -0.2844 0.6098 -0.466 0.646
A*B 1.6267 0.4312 3.772 0.001

S = 1.494 R-Sq = 69.9% R-Sq(adj) = 62.7%

Para analizar en más detalle la superficie, encontramos el punto estacionario


( x 0 , y 0 ) , donde:

13
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

0.4 0,.4800.26 0.18 


x0 = (-B-1 b )/2 = -
(1 / 2 )
0.48 0,2.0740.54 1 25 
    
con y0 calculada como sigue:

0.26
y0 = b0 + (x0‘ b) /2 = 15.35 + 0. 8,1 1.25 (1/2) 5.1 71
0.54
Como ambos coeficientes bii, bij son negativos, el punto estacionario es un
máximo.

La ecuación final cuadrática que describe la superficie de respuesta es:

y  9.7239  0.2852T p  0.0335Tm  0.0038T p2  0.0018T pTm  0.0007Tm2

donde

y = resultado de salida de antibiótico

Tp = temperatura (ºC)

14
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

Tm = tiempo de reacción (min.)


Estimated Regression Coefficients for Rendim
(Usando factores Tp y Tm con valores reales de los niveles 20 50 80)

Term Coef SE Coef T P


Constant 10.7935 2.34957 4.594 0.000
Tp 0.2771 0.07282 3.805 0.001
Tm -0.0767 0.07282 -1.054 0.304
Tp*Tp -0.0038 0.00068 -5.580 0.000
Tm*Tm -0.0003 0.00068 -0.466 0.646
Tp*Tm 0.0018 0.00048 3.772 0.001

15
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

2. INTRODUCCIÓN A LA METODOLOGÍA DE SUPERFICIES DE


RESPUESTA (RSM)

La RSM es un conjunto de técnicas con el objeto de:

1. Preparar una serie de experimentos que proporcionen una medición adecuada


y confiable de la respuesta de interés.
2. Determinar un modelo matemático que mejor ajuste los datos colectados del
diseño seleccionado en (1), realizando pruebas de hipótesis apropiadas en
relación con los parámetros del modelo, y
3. Determinar el ajuste óptimo de los factores experimentales que produzcan el
valor máximo o mínimo de la respuesta.

Para evaluar el efecto de ciertos factores en el comportamiento de una variable de


respuesta medible, se utiliza la regresión, la cual ayuda a establecer una relación
empírica entre la variable de respuesta y los factores de influencia. La variable de
respuesta es la variable dependiente y es llamada la respuesta, los niveles de los
factores de influencia se denominan, regresores, explicatorios o variables de
entrada.


(a)

(b)

0

x1

Fig. 1.1 Modelos de polinomios, (a) línea recta,    0  1 X 1 y (b) parábola


   0  1 X 1

La función de la respuesta de predicción Y-gorro está en función de los parámetros


estimados b0, b1, b2, etc., estableciéndose como sigue:

^
Y  b0  b1 X 1  b2 X 2

La superficie de respuesta está representada por la ecuación de predicción, por


ejemplo para el caso de una ecuación de segundo orden se tiene:

16
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

^
Y  13.85  0.90x1  0.56x2  0.57x1 x2  1.94x12  0.78x22
donde las x’s son variables codificadas. Con k factores la superficie de respuesta
es un subconjunto de un espacio euclidiano de (k + 1) dimensiones.

La representación del contorno de una superficie de respuesta son las líneas o


curvas de respuesta constante en función de las variables de entrada X’s.

La región de operación es el espacio factorial donde se realizan los experimentos


y la región experimental de interés R representa una parte limitada de la anterior.

Arreglo de Minitab con datos reales


Tp Tm Rendim
20 20 13.66
20 50 12.23
20 80 7.97
50 20 16.98
50 50 13.8
50 80 12.86
80 20 10
80 50 10.88
80 80 13.28
20 20 13.16
20 50 13.84
20 80 10.19
50 20 13.42
50 50 15.55
50 80 18.27
80 20 10.01
80 50 12.18
80 80 10.06
20 20 15.05
20 50 11.85
20 80 8.38
50 20 14.29
50 50 13.92
50 80 15
80 20 11.1
80 50 11.13
80 80 11.96

17
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

CONCEPTOS MATEMÁTICOS RELACIONADOS CON RSM

MATRICES

Definición 2.1 Una matriz cuadrada tiene el mismo número de renglones y de


columnas.

Definición 2.2 La transpuesta de una matriz M (N x k) es la matriz (k x N) o M’,


obtenida al intercambiar filas por columnas.

Definición 2.3 Una matriz simétrica es igual a su transpuesta, M = M’.

Definición 2.4 Una matriz diagonal es una matriz cuadrada cuyos elementos fuera
de la diagonal mij , i j son cero. Si los elementos en la diagonal son 1’s se tiene
una matriz identidad I.

Definición 2.5 La traza de una matriz cuadrada M es la suma de los elementos de


la diagonal.

Definición 2.6 Asociada con cada matriz cuadrada M se tiene su determinante


denotado por |M|.

Definición 2.7 Los valores característicos de una matriz cuadrada M son las las
soluciones a las ecuaciones de determinantes |M -  I| = 0. El determinante es un
polinomio de grado k – ésimo en  , por tanto M tiene k valores característicos.

Definición 2.8 Asociado con cada valor característico i de la matriz cuadrada M,


hay un vector característico vi, cuyos elementos satisfacen el sistema de
ecuaciones:

( M  i I ) v i  0

Definición 2.9 Las matrices que tienen el mismo orden pueden ser sumadas
elemento por elemento, se dice que son conformables para la adición. En forma
similar son conformables para la multiplicación si el número de columnas de la
matriz de la izquierda es igual al número de filas de la matriz de la derecha. Por
ejemplo si M es (N x k) y T es (k x r), su producto MT es (N x r).

Definición 2.10 La inversa de una matriz cuadrada M es una matriz denotada por
M tal que MM-1 = M-1 M = I, la matriz que tiene inversa se dice que no es singular.

Definición 2.11 Una matriz cuadrada T se dice que es ortogonal si T’ = T -1 o sea la


transpuesta es igual a su inversa. La transformación w = T v se denomina una
transformación ortogonal.

18
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

MÉTODO DE MÍNIMOS CUADRADOS

Asumiendo que N observaciones de la respuesta se puedan expresar por medio


de un modelo de primer orden

Yu   0   1 X u1   2 X u 2  .......   k X uk   u (2.1)

En la ecuación 2.1 Yu denota la respuesta observada en el intento u; Xui


representa el nivel del factor i en el intento u; las betas son parámetros
desconocidos y  u representa el error aleatorio en Yu. Se asume que los errores
 u tienen las características siguientes:

1. Tienen media cero y varianza común 2.


2. Son estadísticamente independientes.
3. Están distribuidos en forma normal.

El método de mínimos cuadrados selecciona como estimados para los parámetros


desconocidos beta, los valores b0, b1, ...., bk respectivamente, los cuales minimizan
la cantidad:

N
R(  0 , 1 ,...,  k )   (Yu   0  1 X u1   2 X u 2  .....   uk ) 2
u 1

Y son las soluciones a un conjunto de (k +1) ecuaciones normales.

Sobre N observaciones el modelo de primer orden puede expresarse en forma


matricial como:

Y = X  +  = [1 : D]  + 

Y es un vector N x 1.
X es una matriz de orden N x (k + 1), donde la primera columna es de 1’s.
 es un vector de orden (k + 1) x 1.
 es un vector de orden N x 1.
D es la matriz de Xij con i = 1, 2, ..., N; j = 1, 2, ......, k

Las ecuaciones normales a resolver para minimizar los cuadrados se pueden


escribir como:

X’X b = X’ Y (2.2)

Los estimadores de mínimos cuadrados b de los elementos  son:

b = (X’X)-1 X’Y (2.3)

19
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

Como principales características de los estimadores b se tienen:

La matriz de varianza y covarianza de el vector de estimados b es:

Var(b) = C = (X’X)-1  2 (2.4)

El elemento (ii) de esta matriz cii  Var (bi ) es la varianza del elemento i de b. El
2

error estándar de bi es la raíz cuadrada positiva de la varianza de b i o sea:

se.bi  cii 2 (2.5)

La covarianza del elemento bi y bj de b es Co var(cij )  cij .


2

(2.6)

Si errores están normalmente distribuidos, entonces b se dice que está distribuido


como:

b  N (  , ( X ' X ) 1  2 )

Sea x’p un vector (1 x p) vector cuyos elementos corresponden a una fila de la


matriz X, p = k + 1, entonces en la región experimental el valor de predicción de la
respuesta es:

^
Y ( x )  x' p b (2.7)

Una medida de la precisión de la predicción Y-gorro(x) se puede expresar como:

^
Var (Y ( x))  Var ( x p b)  x' p ( X ' X ) 1 x p 2 (2.8)

RESIDUOS

Los residuos se definen como la diferencia entre los valores reales observados y
los valores predichos para estos valores de respuesta usando el modelo de ajuste,
o sea:

^
ru  Yu  Y ( xu ), u  1,2,..., N (2.9)

Si se obtienen valores para los N intentos entonces en forma matricial:


^

20
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

r=Y–Xb (2.10)

los residuos tienen las propiedades siguientes:

1. 1’r = 0, donde 1’ es un vector (1 x N) de 1’s.


2. Yest(X)’r = 0
3. X’r = 0

ESTIMACIÓN DE 

Para un modelo con p parámetros y se tengan N observaciones (N > p), la


varianza se estima como sigue:

1 N 2 1 1
s2  
N  p u 1
ru 
Np
(Y  Xb)' (Y  Xb) 
Np
SSE (2.11)

TABLA DE ANOVA

La suma de cuadrados totales es:

N __
SST   (Yu  Y ) 2 con N-1 grados de libertad (2.12)
u 1

La suma de cuadrados debidos a la regresión es:

N ^ __
SSR   (Y ( xu )  Y ) 2 con p (parámetros) – 1 grados de libertad (2.13)
u 1

La suma de cuadrados del error o de los residuos es:

N ^
SSE   (Yu  Y ( xu )) 2 con (N-1) – (p –1) grados de libertad (2.14)
u 1

En forma matricial se tiene:

(1' Y ) 2
SST  Y ' Y 
N

(1' Y ) 2
SSR  b' X ' Y 
N

21
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

SSE  Y ' Y  b' X ' Y (2.15)

Para probar la hipótesis de existencia del modelo:

H 0 :  1   2  ...   k  0

H a :  i  0, i  1,2,..., k

Se calcula el estadístico F como:

MSR SSR /( p  1)
F  (2.16)
MSE SSE / N  p )

Se compara el valor de F con el de tablas para F,p-1,N-p el cual es la parte superior


de la distribución F, si F calculada excede a F de tablas se infiere que la variación
explicada por el modelo es significativa.

El coeficiente de determinación R2 mide la proporción de la variación total de los


valores Yu alrededor de la media Y explicada por el modelo de ajuste. Se expresa
en porcentaje.

SSR
R2  (2.17)
SST

22
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

EJEMPLO: MODELANDO LA CANTIDAD DE COMIDA INGERIDA POR RATAS


DE LABORATORIO1

Doce ratas de tamaño uniforme fueron privadas de comida excepto por una hora
por día durante 10 días. Al siguiente día, cada rata fue inyectada con una
substancia reductora del hambre (dosis de 0.3 y 0.7 mg/kg) y después de
transcurrido un cierto tiempo (1, 5 y 9 horas), las ratas fueron alimentadas, cada
combinación fue aplicada a dos ratas midiéndose el peso de la comida ingerida
por cada rata para analizar los efectos.

Tabla: Peso de la comida ingerida por las ratas

Tiempo transcurrido entre inyección y comida


Dosis (mg/kg) 1 5 9 total

0.3 5.63, 6.42 11.57, 12.16 12.68, 13.31 61.77

0.7 1.38, 1.94 5.72, 4.69 8.28, 7.73 29.74

total 15.37 34.14 42.00 91.51

El modelo propuesto para relacionar el peso de la comida ingerida por rata al nivel
de dosis de droga (X1) y el tiempo transcurrido entre inyección e ingestión (X 2) es:

Yi   0  1 xi1   2 xi 2  12 xi1 xi 2   22 xi22   i

i  1,2,.......,12

Codificando las variables como:

X 1  0 .5
x1 
0 .2

Para los niveles de dosis de droga inyectada, 0.3 y 0.7 mg/kg equivale a valores
de –1 y +1 respectivamente.

X2  5
x2 
4

Para los intervalos de tiempo de 1, 5 y 9 horas corresponden a los niveles –1, 0 y


+1 respectivamente.

Expresando el modelo en notación matricial se tiene:


1
Khuri, Andre I, et.al., Response Surfaces: Design and Analysis, Marcel Dekker, Inc.
America Society for Quality Control, Nueva York, 1987, cap. 1 y 2

23
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

Y=X+

24
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

5.63  1,1,1,1,1 1 


6.42  1,1,1,1,1  
    2

1.38  1,1,1,1,1 3 


     
1 .94  1,1,1,1,1  4 
0 
1 .57 1,1,0,0,0  5 
     1   
1 2.16 1,1,0,0,0 6 
  2    
5.72  1,1,0,0,0  7
      12   
4 .69  1,1,0,0,0 8 
2 
12.68 1,1,1,1,1  
    9

13.31 1,1,1,1,1 10


25
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

Las ecuaciones normales de las variables codificadas son:

X’ X b = X’ Y se tiene:

b0 
 12,00,00,00,08  b  91.51 
 00,12,00,00,00  1   32.03
  b2   
 00,00,08,00,00   = 26.63 
  b
 11   
  00,  00, 00,  08,  00    1 . 25 
b12 
 08,00,00,00,08   57.37 
b
 22 
La solución para b = (X’ X)-1 X’ Y, es por tanto (ver Ejeratas):

8.535 
 2.669
 
b= 3.329 
 
  0 .156 
 1.364 
Detalle de cálculos matriciales en Excel (Ctr-Shift-Enter)

EJEMPLO
DE LAS
RATAS

MATRIZ
X'
1 1 1 1 1 1 1 1 1 1 1 1
-1 -1 1 1 -1 -1 1 1 -1 -1 1 1
-1 -1 -1 -1 0 0 0 0 1 1 1 1

26
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

1 1 -1 -1 0 0 0 0 -1 -1 1 1
1 1 1 1 0 0 0 0 1 1 1 1

MATRIZ MATRIZ
X X'X
1 -1 -1 1 1 12 0 0 0 8
1 -1 -1 1 1 0 12 0 0 0
1 1 -1 -1 1 0 0 8 0 0
1 1 -1 -1 1 0 0 0 8 0
1 -1 0 0 0 8 0 0 0 8
1 -1 0 0 0
1 1 0 0 0
MATRIZ
1 1 0 0 0 VECTOR Y X'Y
1 -1 1 -1 1
1 -1 1 -1 1 5.63 91.51 91.51 91.51 91.51 91.51
- -
1 1 1 1 1 6.42 -32.03 32.03 -32.03 -32.03 32.03
1 1 1 1 1 1.38 26.63 26.63 26.63 26.63 26.63
1.94 -1.25 -1.25 -1.25 -1.25 -1.25
11.57 57.37 57.37 57.37 57.37 57.37
MATRIZ
(X'X)-1 12.16
VECTOR b Varianza de
= (X'X)-1 b = (X'X) -1
5.72 X'Y s2y
0.25 0 0 0 -0.3 4.69 8.535 0.148 0.384708
0 0.08 0 0 0 12.68 -2.66917 0.04736 0.217624
0 0 0.13 0 0 13.31 3.32875 0.07696 0.277417
0 0 0 0.13 0 8.28 -0.15625 0.07696 0.277417
-0.3 0 0 0 0.38 7.73 -1.36375 0.22496 0.474299
Media 7.6258 sse
Varianza de y 2.030732
0.592

El modelo ajustado de segundo orden es:

^
Y ( x)  8.35  2.669x1  3.329 x2  0.156x1x2  1.364x22
En Minitab
Tabla de datos

Dosis TIempo StdOrder RunOrder Blocks PtType Y


0.3 1 1 1 1 1 5.63
0.3 1 2 2 1 1 6.42
0.7 1 3 3 1 1 1.38
0.7 1 4 4 1 1 1.94
0.3 5 5 5 1 1 11.6
0.3 5 6 6 1 1 12.2

27
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

0.7 5 7 7 1 1 5.72
0.7 5 8 8 1 1 4.69
0.3 9 9 9 1 1 12.7
0.3 9 10 10 1 1 13.3
0.7 9 11 11 1 1 8.28
0.7 9 12 12 1 1 7.73

Reconocer diseño
Stat > DOE > Response surface > Custom Response Surface design
Factors Dosis Tiempo
Low/High Dosis 0.3 0.7 Tiempo 1 9
OK

Analizar el diseño
Stat > DOE > Response Surface > Analysis Response Surface design
Responses Y Seleccionar Uncoded Units
Terms (Full cuadratic pasar los factores con > excepto AA)
OK

La salida de Minitab es como sigue:


Estimated Regression Coefficients for Y using data in uncoded units

Term Coef
Constant 8.5350
b1 -2.6692
b2 3.3288
b1*b2 -0.1562
b2*b2 -1.3638

Este modelo expresado en términos de las variables originales queda como:

^
Y ( x)  8.428  12.369 X 1  1.782 X 2  0.195X 1 X 2  0.085X 22

28
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

Estimated Regression Coefficients for Y

Term Coef SE Coef T P


Constant 8.4278 1.17212 7.190 0.000
Dosis -12.3693 2.03057 -6.092 0.000
TIempo 1.7822 0.34674 5.140 0.001
TIempo*TIempo -0.0852 0.02945 -2.895 0.023
Dosis*TIempo -0.1953 0.34001 -0.574 0.584

Tabla: Valores de respuesta estimada y residuos obtenidos con la ecuación anterior.

Dosis Horas Peso observ. Desv. Peso pronost. Desv. Residuo

__ ^ ^ __ ^
(X1) (X2) Yi Yi  Y Y ( xi ) Y ( xi )  Y Y i  Y ( xi )
0.3 1 5.63 -1.996 6.36 -1.266 -0.73
6.42 -1.206 6.36 -1.266 0.06

0.7 1 1.38 -6.246 1.33 -6.296 0.05


1.94 -5.586 1.33 -6.296 0.61

etc.

Los residuos de Minitab son:

Exp. Dosis TIempo Y FITS1 RESI1


1 0.3 1 5.63 6.3554 -0.72542
2 0.3 1 6.42 6.3554 0.06458
3 0.7 1 1.38 1.3296 0.05042
4 0.7 1 1.94 1.3296 0.61042
5 0.3 5 11.57 11.2042 0.36583
6 0.3 5 12.16 11.2042 0.95583
7 0.7 5 5.72 5.8658 -0.14583
8 0.7 5 4.69 5.8658 -1.17583
9 0.3 9 12.68 13.3254 -0.64542
10 0.3 9 13.31 13.3254 -0.01542
11 0.7 9 8.28 7.6746 0.60542
12 0.7 9 7.73 7.6746 0.05542

Calculando las sumas de cuadrados para realizar el ANOVA se tiene:

12
SST   (Yi  7.626) 2 183.436 con 12-1 grados de libertad
i 1

12 ^
SSR   (Y ( x i )  7.626)2 183.436 con 5 - 1 grados de libertad
i 1

29
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

12 ^
SSE   (Yi  Y ( xi )) 2 SST  SSR  4.143 con 12-5 = 7 grados de libertad
i 1

La tabla de ANOVA queda como:

Tabla ANOVA

Fuente df SS MS F

Regresión 4 179.293 44.283 44.283/4.143 = 75.73

Residuos 7 4.413 0.592

Total 11 183.436 .
Analysis of Variance for Y

Source DF Seq SS Adj SS Adj MS F P


Regression 4 179.293 179.293 44.8232 75.73 0.000
Linear 2 174.138 174.138 87.0690 147.10 0.000
Square 1 4.960 4.960 4.9595 8.38 0.023
Interaction 1 0.195 0.195 0.1953 0.33 0.584
Residual Error 7 4.143 4.143 0.5919
Lack-of-Fit 1 2.620 2.620 2.6202 10.32 0.018
Pure Error 6 1.523 1.523 0.2538
Total 11 183.436

El valor calculado de F excede al de tablas con F 0.01,4,7 = 7.85, por tanto se rechaza
la hipótesis de que los coeficientes sean iguales a cero, donde al menos uno es
diferente de cero.

H 0 :  1   2   11   22  0

H a : i  0

El valor de R2 como medición de la proporción de la variación total de los valores


de Yi alrededor de la media Ymedia explicada por el modelo ajustado. Se expresa
como:

SSE
R2 
SST

donde p es el número de parámetros del modelo.

por tanto R2 es igual a 0.98.


S = 0.7693 R-Sq = 97.7% R-Sq(adj) = 96.5%

30
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

Para probar la hipótesis de igualdad a cero de cada parámetro se compara su


valor estimado con su error estándar estimado o sea:

b1  12.369
t   6.09
MSE * C 22 0.591 * 6.966

Este valor se compara con la t de tablas con  de 0.01 y 7 grados de libertad


asociados con MSE de los residuos, que es 2.998, por tanto como el valor
absoluto de t calculado excede al de tablas, se rechaza la hipótesis nula de que

H0: 1 = 0 a favor de que Ha: 1 < 0.

Se pueden realizar pruebas similares para los otros parámetros 2 , 12 , 22
obteniéndose una t calculada de 5.14, -0.57 y –2.93 respectivamente, con
hipòtesis:

H0: 2 = 0; Ha: 2 > 0 ; t de tablas para  = 0.01 es 2.998 y se rechaza H0.

H0: 22 = 0; Ha: 22 < 0, t de tablas para  = 0.01 es 2.998 y no se rechaza H0.

H0: 12 = 0 a favor de que Ha: 12  0, t/2 de tablas para  = 0.05 es 3.499 y no se
rechaza H0.

De Minitab
Estimated Regression Coefficients for Y

Term Coef SE Coef T P


Constant 8.4278 1.17212 7.190 0.000
Dosis -12.3693 2.03057 -6.092 0.000
TIempo 1.7822 0.34674 5.140 0.001
TIempo*TIempo -0.0852 0.02945 -2.895 0.023
Dosis*TIempo -0.1953 0.34001 -0.574 0.584

De acuerdo a lo anterior se infiere que el cambio en la dosis de droga de 0.3 a 0.7


mg/kg reduce el hambre de las ratas evidenciada por el menor peso de comida
consumida. Lo contrario sucede con el tiempo entre inyección y comidas.

PRUEBA DE LA FALTA DE AJUSTE DEL MODELO AJUSTADO


USANDO OBSERVACIONES REPLICADAS

El modelo puede ser inadecuado debido a que:

1. Hay factores que se omitieron pero que afectan la respuesta.

31
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

2. Se omitieron factores de mayor orden y son requeridos para mejorar la


explicación.

La prueba de adecuación (cero falta de ajuste) requiere que se cumplan dos


condiciones:

1. El número de puntos de diseño n debe ser mayor que el número de términos


en el modelo de ajuste. Si el modelo contiene p términos entonces n > p.
2. La estimación de la varianza del error experimental no debe depender de la
forma del modelo de ajuste, lo cual puede ser logrado si se toman al menos
dos observaciones replicadas en uno o más de los puntos de diseño y se
calcula el error antes y después de la réplica observando que no varíe.

Asumiendo que los errores están distribuidos en forma aleatoria con varianza
común 2 .

Cuando se cumplen las dos condiciones anteriores, la suma de cuadrados residual


SSE puede ser particionada en dos fuentes de variación; la variación entre los
puntos replicados (suma de cuadrados del error puro SSPE ) y la variación por falta
de ajuste del modelo (SSLOF ).

Si denotamos a la observación i-ésima en el punto de diseño Yik donde i = 1, 2, ....


__
rk >= 1, k = 1,2,3,.... n. Definiendo Y k como el promedio de las rk observaciones
en el punto de diseño i-ésimo, entonces la suma de cuadrados del error puro es:

n rk __
SS PE    (Y ik  Yk ) 2 con N – n grados de libertad. N = total de observaciones.
k 1 i 1

La suma de cuadrados por falta de ajuste se calcula por resta:

SS LOF  SSE  SS PE con (N – p) – (N – n) = n – p grados de libertad.

^
o en forma alterna si Yk es el valor de predicción de la respuesta en el punto de
diseño k-ésimo entonces:

n ^ __
SS LOF   rk (Y k  Yk ) 2
k 1

La prueba de la hipótesis nula de adecuación de ajuste (o falta de ajuste cero) se


toma como:

32
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

SS LOF
(n  p)
F
SS PE
( N  n)

La hipótesis nula realmente probada por F es:

H 0 : ( X q  X p A)  q  0,    donde.. A  ( X p' X p ) 1 X p' X q

La matriz A se denomina la matriz Alias.

Cuando Ho es rechazada y se asume Ha como verdadera, el paso siguiente es


agregar más términos de alto orden al modelo.

Continuando con el ejemplo, de:

SSE = 4.143 con 7 grados de libertad,

SSPE = (5.63 – 6.025)2 + (6.42 – 6.025)2+.....+(7.73 – 8.005)2 = 1.523 con 6 gl.


donde por ejemplo 6.025 es la media de 5.63 y 6.42 que es la observación con
una dosis de 0.3 y 1 hora.

O sea:
Y Ykprom Dif2
5.63 6.025 0.15603
6.42 6.025 0.15603
1.38 1.66 0.0784
1.94 1.66 0.0784
11.57 11.865 0.08703
12.16 11.865 0.08703
5.72 5.205 0.26523
4.69 5.205 0.26523
12.68 12.995 0.09922
13.31 12.995 0.09923
8.28 8.005 0.07562
7.73 8.005 0.07563
1.523

Restando SSPE de SSE se tiene:

SSLOF = 4.143 – 1.523 = 2.620 con 7 – 6 =1 grados de libertad.

El valor de F es:

33
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

2.620 / 1
F  10.32
1.523 / 6

Como F excede el valor de F de tablas F0.05,1,6  5.99 inferimos que hay evidencia
suficiente para indicar que el modelo exhibe falta de ajuste al nivel  = 0.05 de
significancia. Posiblemente es causado por haber omitido el término 12 X 1 X 22 .

Analysis of Variance for Y

Source DF Seq SS Adj SS Adj MS F P


Regression 4 179.293 179.2928 44.8232 75.73 0.000
Linear 2 174.138 63.5158 31.7579 53.65 0.000
Square 1 4.960 4.9595 4.9595 8.38 0.023
Interaction 1 0.195 0.1953 0.1953 0.33 0.584
Residual Error 7 4.143 4.1433 0.5919
Lack-of-Fit 1 2.620 2.6202 2.6202 10.32 0.018
Pure Error 6 1.523 1.5231 0.2538
Total 11 183.436

COMENTARIOS ACERCA DE LAS PROPIEDADES DE UN DISEÑO DE


SUPERFICIE DE RESPUESTA

El objetivo principal a lograr es explorar la superficie de respuesta sobre la región


experimental, de acuerdo a Box y Draper se tienen 14 caracterìsticas de un diseño
de superficie de respuesta a ser usado cuando se ajusta un modelo de polinomio a
los datos colectados en los puntos de diseño, las más importantes son:

1. El diseño debe generar una distribución satisfactoria de información a través de


la región de interés.
^
2. El diseño debe asegurar que el valor de predicción en x, Y (x ), .. sea tan
cercano como sea posible al valor verdadero en x, (x).
3. El diseño debe detectar adecuadamente la falta de ajuste.
4. El diseño debe permitir realizar experimentos en bloques.
5. El diseño debe permitir construir sobre el diseño de más alto orden en forma
secuencial.
6. El diseño debe proporcionar una estimación interna de la varianza del error 2.
7. El diseño debe requerir un número mínimo de puntos experimentales.
8. El diseño debe asegurar simplicidad de cálculos de los parámetros del modelo
estimados.

Ortogonalidad y Rotabilidad

En un diseño ortogonal los términos del modelo de ajuste son no correlacionados


entre sí y las estimaciones de los parámetros no son correlacionadas. En este
caso la varianza de la respuesta de estimada en cualquier punto x en la región

34
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

experimental, se puede expresar como la suma ponderada de las varianzas de los


parámetros estimados del modelo. Un modelo de primer orden es ortogonal si la
matriz correspondiente es X’X diagonal.

^
En un diseño rotable, la varianza de la respuesta estimada Y (x ), que es sabido
que depende de la localización del punto x, es función unicamente de la distancia

 ^

del punto x al centro del diseño. De esta forma la varianza de predicción Var Y ( x) es
 
la misma para todos los puntos equidistantes del centro del diseño. Esta
característica es importante cuando se trata de predecir hacia donde moverse
durante la optimización.

35
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

3. MODELOS Y DISEÑOS DE PRIMER ORDEN

En la práctica se utilizan polinomios de bajo orden (primero o segundo) por su


simplicidad considerando que se está trabajando en la región de interés que es
pequeña, para toda la región de operación sí sería necesario el uso de polinomios
de más alto orden.

El modelo de primer orden con k variables de entrada X 1 , X 2 ,.... X k es:

k
Y  0   i X i   (3.1)
i 1

Si el error experimental  tiene una media cero, entonces la ecuación anterior


representa la respuesta verdadera , o sea:

k
  0   i X i (3.2)
i 1

Sin embargo si el modelo anterior no es adecuado para representar la respuesta


media, entonces  contiene en adición al error experimental, un error sistemático
causado por la ausencia de términos de má alto orden en las X’s, denominado
error de falta de ajuste.

En forma matricial el modelo de primer orden para N observaciones es:

Y = X +  (3.3)

Y es un vector de N (N  k +1) observaciones;

 = ( 0 , 1 ,......., k )’ es un vector (k+1) x 1 de parámetros desconocidos;

 = ( 0 , 1 ,........, N )’ es un vector N x 1 de errores y

X es una matriz N x (k +1) de ajuste de valores de las variables de entrada.

X = [ 1: Dx ] ; donde 1 es un vector N x 1 de 1’s y

Dx es la matriz de diseño N x k cuyos elementos (ui) – ésimos , Xui son los


valores de las variables de entrada usadas en la corrida experimental u – ésima
( u = 1, 2, ...., N; i = 1, 2, ....., k).

Se asume que los errores están independientemente distribuidos como variables


normales con media cero y varianza común 2 .

36
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

Un estimador de  es el estimador (BLUE) de mínimos cuadrados b:

b = (X’X) -1 X’Y (3.4)

La matriz de varianza y covarianza de b es:

Var (b) = (X’X) –1 2 (3.5)

Los niveles de k variables de entrada Xi se codifican con la transformación:


__
x ui  2( X ui  X i ) / Ri u = 1, 2, ..., N; i =1, 2, ...., k (3.6)

__
donde X i es la media de todas las observaciones y Ri es el rango entre el ajuste
menor y el mayor de las variables. Sobre las N observaciones, los valores de las
variables codificadas satisfacen:

x
u 1
ui 0 i = 1,2, ........, k (3.7)

Del experimento de las ratas, se tiene:

X1 X 2 x1 x2
0.3,1    1,1
0.3,7    1,1
   
0.7,1    1,1
   
0.7,1    1,1
0.3,5    1,0
   
0 .3,5  1, 0
DX    D   
0.7,5    1,0
   
0.7,5    1,0
0.3,9    1,1
   
 0 .3,9    1,1
0.7,9    1,1
   
0.7,9 
  
  1,  1 

37
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

3.1 DISEÑOS PARA AJUSTE CON MODELOS DE PRIMER ORDEN

^
Sea Y ( x) la respuesta de predicción en el punto x = (x1, x2,....,xk)’ en la región de
interés en el espacio de las variables codificadas denotado por R, se tiene:

^
Y ( x)  1, x'b (3.8)

Var Y (x)    x'(D' D)1 x 2


^ 2

  N
(3.10)

Aquí se muestra la dependencia de la varianza de Yest. de la matriz de diseño D.

Definición: Un diseño de primer orden D donde D’D es diagonal se denomina


diseño ortogonal.

En un diseño ortogonal los efectos de las k variables de entrada se pueden


evaluar independientemente ya que los elementos de covarianza de la matriz de b
son ceros. Las clases de diseños ortogonales incluyen los siguientes:

1. Los diseños factoriales 2k , donde k es el número de factores.


2. Replicas factoriales de los diseños 2k.
3. Diseños simplex.
4. Diseños de Plackett – Burman.
5. Diseños de Taguchi.

DISEÑOS FACTORIALES

Para estos diseños se utilizan las variables codificadas, el estimador de b, Var(b)


en mínimos cuadrados se transforma en:

1
b X 'Y
2k

38
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

2
Var (b)  I k 1
2k

En este caso la varianza es igual al valor de MSE y el valor del error estádar es:

MSE
sse( Ai ) 
2k

Las columnas de X correspondientes a las variables de entrada (i = 1,2, .... , k),


consiste de números unos positivos y negativos. De esta forma las b 1, b2, ..., bk
son contrastes en las observaciones obtenidas bajo las 2 k combinaciones de
tratamientos. Estos contrastes estiman los efectos de los k factores.
La suma de cuadrados del contraste i-ésimo es también la suma de cuadrados
(SS) para el factor Ai, esta dado por:

SS Ai  2 k bi2 i = 1, 2, ......, k

Las sumas de cuadrados son estadísticamente independientes (ya que las bi son
estadísticamente independientes) y se prueba con el estadístico F = SS Ai / MSE
con 1 y 2k – k – 1 grados de libertad, la hipótesis:

Ho: i = 0

Los valores altos de F son significativos.

Ejemplo 3.1: En un estudio relacionado con la conversión de carbón en aceite, se


investigó el efecto de las variables de entrada X 1 = temperatura, X2 = CO / H2, X3 =
presión y X4 = tiempo de contacto; la variable de respuesta Y fue el % de lignita.

Se utilizó un diseño factorial 24 para ajustar un modelo de primer orden, los niveles
de los cuatro factores son:

X1 = temperatura (ºC) 380 400

X2 = CO / H2 ¼ 3/4

X3 = presión (MPa) 7.1 11.1

X4 = tiempo de contacto 10 50

Las variables codificadas se definen como sigue:

39
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

X 1  420
x1 
40

X 2  1/ 2
x2 
1/ 4
X  9.1
x3  3
2.0

X 4  30
x4 
20

La combinación de los tratamientos y la respuesta correspondiente se muestra a


continuación:

Tabla 3.1 Combinación de tratamientos y valores de la respuesta

Experimento x1 x2 x3 x4 Y
(1) -1 -1 -1 -1 53.3
a1 1 -1 -1 -1 78
a2 -1 1 -1 -1 62.4
a1a2 1 1 -1 -1 78.9
a3 -1 -1 1 -1 75.9
a1a3 1 -1 1 -1 75.4
a2a3 -1 1 1 -1 71.3
a1a2a3 1 1 1 -1 84.4
a4 -1 -1 -1 1 64.5
a1a4 1 -1 -1 1 67.5
a2a4 -1 1 -1 1 72.8
a1a2a4 1 1 -1 1 85.3
a3a4 -1 -1 1 1 71.4
a1a3a4 1 -1 1 1 83.3
a2a3a4 -1 1 1 1 82.9
a1a2a3a4 1 1 1 1 81.7

Con estos valores se obtiene el modelo ajustado de primer orden (ver cálculos en
Excel abajo) con variables codificadas como sigue:

X'
x1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 Y
x2 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 X 53.3 = X'Y 80
x3 -1 -1 -1 -1 1 1 1 1 -1 -1 -1 -1 1 1 1 1 78 50.4
x4 -1 -1 -1 -1 -1 -1 -1 -1 1 1 1 1 1 1 1 1 62.4 63.6
78.9 29.8

40
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

75.9
75.4 b0 = 74.3125
promedio de
71.3 Y

1 84.4
b X 'Y
2k 64.5
67.5
72.8
85.3 b 5
71.4 3.15
83.3 3.975
82.9 1.8625
81.7

^
Y  74.31 `5.00x1  3.15x2  3.98x3  1.86x4 con sse. = 1.41 en todos los parámetros
Con Minitab:

Stat > Regression > Regression


Response Y Predictors X1 X2 X3 X4
OK

Regression Analysis: Y versus x1, x2, x3, x4

The regression equation is


Y = 74.3 + 5.00 x1 + 3.15 x2 + 3.98 x3 + 1.86 x4

Predictor Coef SE Coef T P


Constant 74.313 1.408 52.79 0.000
x1 5.000 1.408 3.55 0.005
x2 3.150 1.408 2.24 0.047
x3 3.975 1.408 2.82 0.017
x4 1.862 1.408 1.32 0.213

La tabla ANOVA queda como:

Fuente grados de Suma de Cuadrado F


libertad cuadrados medio
X1 1 400.00 400.00 12.61**
X2 1 158.76 158.76 5.01 **
X3 1 252.81 252.81 7.97 **
X4 1 55.50 55.50 1.75
Residuos 11 348.825 31.71
Total 15 1215.895

41
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

La F de tablas para  = 0.05 con 1 y 11 grados de libertad es 4.75, por tanto son
significativas las tres primeras variables X1, X2 y X3.

42
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

De Minitab
Analysis of Variance

Source DF SS MS F P
Regression 4 867.07 216.77 6.84 0.005
Residual Error 11 348.83 31.71
Total 15 1215.90

S = 5.63128 R-Sq = 71.3% R-Sq(adj) = 60.9%

Source DF Seq SS
x1 1 400.00
x2 1 158.76
x3 1 252.81
x4 1 55.50

43
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

4. MODELOS Y DISEÑOS DE SEGUNDO ORDEN

Cuando con un modelo de primer orden se presenta falta de ajuste por la


existencia de curvatura en la superficie, el modelo de primer orden es enriquecido
agregando términos de segundo orden al mismo.
k k k 1 k
Y   0    i X i    ii X i2    ij Xi X j  (4.1)
i 1 i 1 i 1 j 2

Como alternativa a los diseños factoriales 3k, Box y Hunter introdujeron los
Diseños centrales compuestos (CCD), un CCD consiste de:

1. Un diseño factorial 2k completo o fraccional, con los niveles codificados +1, -1.
Esta es la porción factorial del diseño.
2. n0 puntos centrales (n0 >1).
3. Dos puntos axiales sobre el eje de cada variable de diseño a una distancia 
del centro. Esta es la porción axial del diseño.

De esta forma el número total de puntos de diseño es N = 2 k + 2k + n0 . Los


valores de n0 y  se escigen de manera apropiada. Como ejemplo un CCD con k =
2 variables con n0 =1 y  = 2 tiene la forma.
x2
  1,1 
 
  1,  1 
  1,1 
 
  1,  1 
  x1
D   2 , 0 
  2 , 0 
 
  0, 2 
 
  0 ,  2 
  0,0 

Fig. 4.1 CCD con k = 2 variables

Un CCD puede ser hecho ortogonal si seleccionamos el valor axial de  cómo:

44
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

FN  F
 (4.2)
2

Donde F es el número de puntos correspondientes a la parte factorial.

Un diseño rotatorio de segundo orden que proporciona un valor uniforme de


predicción dentro de una esfera de radio unitario en la vecindad del punto central
del diseño, se denomina diseño de precisión uniforme.

Los valores del coeficiente  4 requeridos para hacer la varianza de Yest.(x) en


=1 igual a la de  =0 para un diseño rotatorio para k factores son:

Tabla 4.1 Constantes 4 en función de k

k 2 3 4
4 0.7844 0.8385 0.8704

Para hacer que un diseño central compuesto (CCD) sea rotatorio y ortogonal
(OR), el número de replicaciones en el centro del diseño n 0 es (F puntos del
diseño factorial) :

n0  4 F1/2 + 4 – 2k (4.3)

Por ejemplo para k = 2 y F = 22, no = 8 puntos centrales replicados.

Para un diseño central compuesto (CCD) rotatorio que tenga la propiedad de


precisión uniforme (PU) se tiene:

n0  4 (F1/2 + 2)2 – F – 2k (4.4)

Por ejemplo para 4 = 0.7844, k = 2 y F = 22, no  5 puntos centrales replicados.

Una tabla de constantes para estos diseños se muestra a continuación:

45
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

Tabla 4.2 CCD de precisión uniforme o rotatorio ortogonal

k 2 3 4

F 4 8 16

na 4 6 8

n0 (OR) 8 9 12

no (PU) 5 6 7

N (OR) 16 23 36

N (PU) 13 20 31

Donde na representa el número de puntos axiales y N el número de puntos


experimentales totales.

Entre otros criterios, el de Box y Draper se refiere al uso de replicaciones del punto
central para probar falta de ajuste en el modelo ajustado de segundo orden,

Draper recomienda realizar un mínimo de cuatro o cinco replicaciones en el punto


central para tener suficiente sensibilidad de falta de ajuste.

46
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

5.0 DETERMINACIÓN DE LAS CONDICIONES ÓPTIMAS

5.1 INTRODUCCIÓN

El grupo de valores de las variables de entrada que generan valores de respuesta


deseados, se denomina conjunto de soluciones óptimas. La estrategia en el
desarrollo de un modelo empírico a través de un programa secuencial de
experimentación es como sigue:

1. Se usa un polinomio de primer orden para ajustar los datos colectados en los
puntos de un diseño de primer orden.
2. Si el modelo de primer orden es adecuado, se usa este modelo para localizar
áreas dentro de la región experimental donde se sospecha que se encuentran
los valores más deseados de la respuesta.
3. Dentro de la nueva región, se repite el ciclo probando la adecuación del
modelo de primer orden. Si se detecta falta de ajuste, el modelo puede ser
enriquecido agregando productos cruzados y/o términos cuadráticos puros.
4. Si se detecta una curvatura en la superficie y un modelo de segundo orden es
apropiado, se utiliza para mapear la forma de la superficie a través de una
gráfica de contorno en la región experimental. Después se localizan los valores
óptimos.
5. Al final en la región donde se encuentran las respuestas más deseables, se
realizan experimentos adicionales para verificar que así sea.

Revisando el análisis de una superficie de primer orden, representada por la


ecuación de un hiperplano en k variables codificadas.

k
Y  0   i X i   (5.1)
i 1

Y =  +  es apropiado cuando:

1. Los valores de la respuesta se colectan sobre una región limitada del espacio
de k variables.
2. O cuando no se conoce la forma de la superficie en la región de interés y el
hiperplano representa una primera aproximación.

5.2 ANALISIS DE UNA SUPERFICIE AJUSTADA DE PRIMER ORDEN

Como ejemplo se realiza un experimento con dos réplicas, con dos factores siendo
X1 la temperatura y X2 el tiempo en segundos, la variable de respuesta es el
porcentaje de producto bueno del proceso, el cual actualmente se encuentra entre
55 a 75% pero se piensa que puede ser mejorado.

47
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

Tabla 5.1 Datos del experimento

Valores originales Variables codificadas Porcentaje de buenos


Temp. (ºC) Tiempo (seg.) x1 x2 Y

70 30 -1 -1 49.8, 48.1
90 30 +1 -1 57.3, 52.3
70 90 -1 +1 65.7 69.4
90 90 +1 +1 73.1, 77.8

Los valores codificados x1 y x2 se definen como:

X 1  80
x1  ; (5.2)
10

X 2  60
x2  ;
30

Los valores observados de la respuesta son modelados con la ecuación:

Y   0   1 x1   2 x 2   (5.3)

Los ocho valores de respuesta observados cuando se expresan como funicón de


los niveles de las variables codificadas, en notación matricial son:

Y=X+

48
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

49.8 1,11,  1


48.1 1,11,   
7 
  
57.3 1,11,  4
    0   
5 2.3 1,11,   6
 1 
65.7 1,11,   2
   2  
6 9.4 1,11,  8
73.1 1,11,  3
   
7 .8 1,11,  5
49
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

Los coeficientes estimados en el modelo de primer orden de la ecuación 5.3 se


calculan de:

X’X b X’Y

8,0 b0 493.5


0,8 0b 27.5 
     1

0, 8b2 78.5 


Tiemp
o en

60 90
x2
90
85
x1

30

50
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

80

70

60 70 80 90 100 110 120 130


Temperatura en ºC

Fig. 5.1 Ajustes de temperatura y tiempo y el porcentaje de respuesta observado

Por tanto:

b (X’X) X’Y

51
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

b0 1/8,0 493.5 61.875


b0,1/8027.53.475
1      

b2 0, 1/87.5 9.8125


.

El modelo de ajuste de primer orden es:

^
Y  61.6875  3.4375x1  9.8125x2
El modelo equivalente en las variables originales, temperatura (X 1) y tiempo (X2)
es:

^
Y  14.5625  0.34375x1  0.32708x2

52
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

La sumas de cuadrados separados son:

Suma de cuadrados totales:

(1' Y ) 2
SST  Y ' Y   898.7488; con 8-1 grados de libertad
8

Suma de cuadrados de la regresión:


(1' Y ) 2
SSR  b' X ' Y   864.8125; con 3-1 grados de libertad
8

Suma de cuadrados residual:


SSE  Y ' Y  bX ' Y  33.9363; con 8-3 grados de libertad

Error puro (entre replicaciones):

1
 
Error. puro    (49.8  48.1) 2  (57.3  52.3) 2  (65.7  69.4) 2  (73.1  77.8) 2  31.8350;
2
con 4 grados de libertad

Falta de ajuste = SS de residuos –Error puro = 33.9363 – 31.8350 = 2.1013

Con 5-4 = 1 grados de libertad.

Tabla 5.2 Tabla ANOVA para el modelo de primer orden

Fuente gl. Suma de Cuadrado medio F


Cuadrados .
Regresión 2 864.8125 432.4063 63.71
Residual 5 33.9363 6.7873 (MSE)
Falta de ajuste 1 2.1013 2.1013 0.264
Error puro 4 31.8350 7.9588

Con F0.05,1,4 = 7.71

El error puro no es significativo.

H 0 : 1   2  0

El modelo de ajuste es significativo, dado que F = 63.71 > F tablas (0.01,2,5) por
tanto uno o los dos coeficientes  no son cero.

Ahora probamos lo siguiente:

53
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

H 0 : 1  0 H0 : 2  0

con:

b1  0 3.4375 3.4375
t    3.73
Var (b1 ) diag ( X ' X ) 1 * MSE (1 / 8)6.7873

Como t calculada es mayor que la t 0.025,5 gl de MSE = 2.571, 1 tiene efecto significativo
en la respuesta.

b2  0 9.8125 9.8125
t    10.65 (5.6)
1
Var (b2 ) diag ( X ' X ) * MSE (1 / 8)6.7873

Como t calculada es mayor que la t0.025,5 = 2.571, 2 tiene efecto significativo en la


respuesta.

5.2.1 Usando el modelo de primer orden para mapear la superficie en la


región experimental

Obtendremos las líneas de igual contorno de respuesta utilizando la ecuación (5.4)


donde por ejemplo si Y (x) = 60, se tiene:

0 = 1.6875 + 3.4375 x1 + 0.8125 x2

Haciendo x1 = 0, calculamos x2 = -1.6875 / 9.8125 = -0.172

Ahora haciendo x2 = 0, calculamos x1 = -1.675 / 3.4375 = -0.495

Así la línea de contorno para Y = 60 pasa por las coordenadas (0, -0.172) y
(-.495, 0) y se extiende un poco más del área de experimentación en x 1 = 1 y x2 =
1.
De esta misma forma podemos trazar las líneas de contorno correspondientes a
Y(x) = 55, 60, 65 y 70% (ver figura 5.2).

La dirección de inclinación de la superficie plana de la respuesta estimada se


indica con una flecha perpendicular a las líneas de contorno de la fig. 5.2. La
flecha apuntando hacia arriba y a la derecha indica que se pueden obtener valores
más altos de la respuesta incrementado los valores de x 1 y x2 a +1 (90° de
temperatura y 90 seg. De tiempo). Este es el inicio de una serie de experimentos
simples a ser realizados en la trayectoria de ascenso rápido perpendicular a los
contornos hacia hasta la superficie.

54
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

5.2 REALIZANDO EXPERIMENTOS A LO LARGO DE LA TRAYECTORIA DE


ASCENSO RÁPIDO

El procedimiento des ascenso rápido consiste de la realización de una secuencia


de experimentos a los largo de la trayectoria de máximo incremento en la
respuesta (recordar que la la dirección depende de la escala de los valores).

El procedimiento inicia al aproximar la superficie de respuesta usando una


ecuación de hiperplano. Con la información obtenida por el hiperplano estimado se
determina la dirección hacia la cual podemos observar valores de respuesta
mayores.

Conforme nos movemos hacia la superficie de valores mayores de respuesta y


llegamos donde se presente una curvatura, los valores de respuesta empezarán a
descender si seguimos en esa dirección.

En este punto se realiza un nuevo conjunto de experimentos y otra vez se prueba


la adecuación del modelo de primer orden. Se determina una nueva dirección
hacia valores mayores de la respuesta, realizando experimentos sobre esta nueva
trayectoria, hasta que sea evidente que casi ya no se obtiene incremento en la
respuesta.

Matemáticamente, utilizando el multiplicador de Lagrange  para este ejemplo, se


obtiene la relación:

bi
xi  (2.11)
2

Donde el valor de  será determinado de acuerdo a la experiencia y conocimiento


del proceso, tomando un incremento en una de las variables y calculando su
efecto en la otra variable.

Por ejemplo si tomamos un cambio arbitrario en el tiempo de 45 seg. (t), se tiene:

de la ecuación (5.4) del modelo de primer orden, b 2 = 9.8125 y el cambio de 45


segundos corresponde a un cambio en la variable codificada de x 2 = 45 / 30 = +1.5
unidades. Por tanto se tiene:

b2 9.8125
   3.27
2 x2 2(1.5)

El valor de x1 correspondiente a un cambio en x2 de 1.5 unidades es:

55
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

b1 3.4375
x1    0.526
2  2(3.27)

Por tanto el cambio incremental en temperatura es T = 0.53(10) = 5.3º.

De esta forma el primer punto en la trayectoria de ascenso rápido se


encuentra en las coordenadas (x1, x2) = (0.53, 1.5), que corresponde a
los ajustes en las variables originales (X1, X2) = (83.5, 105).

Para checar si se predice un incremento en la respuesta en este punto,


se estima el valor de la respuesta en este punto (ec. 5.4) y se compara a
la respuesta en el centro del diseño o sea: Yest (0.53,1.5) – Yest.(0,0) =
16.5406.

Con el mismo procedimiento se realizan experimentos a lo largo de esta


trayectoria de ascenso rápido correspondientes a los incrementos 1.5i ,
2 i , 3i y 4i ; para (i =1,2).

Utilizando los valores de las variables originales se tiene:

Tabla 5.3 Puntos en la trayectoria de ascenso rápido y respuesta observada

Temperatura (ºC) Tiempo (seg.) % rendimiento

Base 80 60
i 5.3 45
Base + i 85.3 105 74.3
Base + 1.5i 87.95 127.5 78.6
Base + 2i 90.6 150 83.2
Base + 3i 95.9 195 84.7
Base + 4i 101.2 240 80.1

Habiendo observado una disminución en el ultimo punto respecto al penúltimo, se


toma la decisión de realizar un segundo grupo de experimentos alrededor de del
punto X1 = 95.9º y X2 = 195 seg. como centro. Tomando los rangos iniciales se
tiene que las variables codificadas son:

Temperatur a ( X 1 )  95.9 Tiempo ( X 2 )  195


x1  x2  (5.12)
10 30

Los cuatro nuevos puntos del diseño, el punto central y los valores de la respuesta
de rendimiento obtenida se muestran en la tabla 5.4.

(Ver tabla 5.4 en la página siguiente)

56
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

El modelo ajustado es el siguiente:

Yest ( x )  82.7  3.575 x1  2.75 x 2

Calculando el error puro por medio de los puntos replicados se tiene:

1
Error . puro  ((82.9  81.4) 2  (87.4  89.5) 2  (74.6  77.0) 2  (84.5  83.1) 2  (84.7  81.9) 2 ) 
2
Error puro = 11.11

Por tanto el error de falta de ajuste LOF es:

ELOF = Error residual – Error puro = 13.455 – 11.11 = 2.345 con 7 – 5 = 3 gl.

Calculando la F del error de falta de ajuste contra el error puro se observa que no
es significante (F = 1.173 / 2.222 = 0.53).

Por lo anterior el nuevo modelo de primer orden es adecuado para ajustar la


respuesta.

Ahora se incrementa la temperatura en 10º correspondiente al nivel +1,


utilizando las fórmulas para calcular el efecto en x2 o tiempo se
encuentra que:

b2  2.750  2.750
x2     0.769  0.77
2 b1 3.575
2( )
2( 1)

Por tanto el valor del tiempo corresponde a una disminución de –0.77 x


30 seg. = -23.1 seg. por tanto las coordenadas del nuevo punto central
serán X1 = 95.9 + 10º y X2 = 195 – 23.1 seg o sea (105.9º, 171.9 seg.).
Estimando la respuesta en este punto se tiene:

Yest. = 82.7 +3.75 (+1) –2.75 (-0.77) = 88.56, la cual es mayor que la
respuesta anterior, por tanto si se incrementa la respuesta.

Siguiendo esta nueva segunda dirección, variando ahora los factores a


partir del segundo punto central con incrementos de Temperatura de
+10º, +20º, +30º y `40º, y los tiempos correspondientes con –23.1,
-46.2, -69.3 y – 92.4 se realizan La secuencia de los experimentos
numerados como `pasos 1 al 4 como se muestra en la figura 5.3 y en la
tabla 5.4 donde se muestran los valores de las respuestas observadas.

57
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

El paso No. 2 con las condiciones de [centro + 2 i ] se observa que da el


valor mayor de la respuesta, por tanto se replica en el paso 5 para
asegurar que efectivamente proporcione una respuesta mayor. Una vez
comprobado continua el proceso.

De la figura 5.3 se observa que al reducir el tiempo se reduce la


respuesta por lo que para ahorrar trabajo de experimentación se prueba
ahora con un nivel tomando como punto central las condiciones en el
paso 2 que son (+2, -1.54) o (115.9º, 148.8 seg.) y se aumentan los
valores en forma relativa con (+1,+1), por lo que ahora se tienen como
nuevos valores (+3,-0.77) o (125.9º, 171.9 seg.). La respuesta obtenida
representa al experimento del paso No. 6, donde se observa un nivel de
respuesta mayor.

Uniendo los puntos de los valores de la respuestas correspondientes a


los pasos No. 5 y No. 6 se encuentra una nueva tercera dirección de
ascenso rápido. Realizando los experimentos en esta dirección con
valores incrementados en Temperatura y Tiempo en una unidad se tiene
con valores codificados:

Experimento del paso No. 7 (+4,0) con valor de respuesta Y = 96.2 ;


Experimento del paso No. 8 (+5, 0.77) con valor de respuesta Y = 92.9.

Otra vez en el paso No. 8 se observa una disminución de la respuesta,


por lo que se intenta un nuevo diseño utilizando el punto en el paso No.
7 como centro o sea en (135.9º, 195 seg.) y los experimentos de los
pasos Nos. 6 y 8 como puntos del nuevo diseño, Se realizan además los
experimentos de los pasos No. 9 y 10, quedando el diseño como (el
punto central se replica para tener dos valores de la respuesta):

+3,+.77 Paso 9 +5,+.77 Paso 8


Y = 91.7 Y = 92.9
+4,0
Paso 7,11
Y=96.2, 97

+3,-0.77 – Paso 6
+3,-.77 Paso 6
Y = 93.6
Y=93.6

Con los datos de los experimentos 6 a 11 y aplicando la regresión lineal


múltiple se obtiene el modelo siguiente:

Yest .( x ) 93.983  0.025x1  0.375 x 2

Su análisis de varianza ANOVA queda como sigue:

Fuente Df SS MS F

58
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

Regresión 2 0.5650 0.2825 0.04


Residual 3 22.1833 7.3944

Total 5 22.7483

Por tanto el modelo no explica una gran cantidad de variación total en la


variable de respuesta.

Una gráfica de los residuos (Yu – Yu est.) en los puntos del diseño
anterior indican que el modelo de regresión subestima la respuesta en el
centro sin emabrgo la sobre estima en los puntos factoriales, indica que
no es adecuado ajustar una superficie curva con un plano.

Punto Valor del residuo


(-1,+1) -1.88
(+1,+1) -0.73
(-1,-1) -0.73
(+1,+1) -1.88
(0,0) +2.22, +3.02

Probaremos ahora si hay curvatura.

5.3.1 Prueba de curvatura de la superficie con el método de Un solo grado de


libertad

Se trata de probar la hipótesis nula Ho contra la hipótesis alterna Ha siguientes:

k k
H 0    ii  0 H a    ii  0
i 1 i 1

El estadístico de prueba es:

(Y
F 

Sean n1, las observaciones registradas en el diseño ortogonal de primer orden,


donde n1>n. Si asumimos que se toman un número igual de replicaciones r 1 en
cada punto del diseño, o sea n1 = nr1. Denotando el promedio de las n1
observaciones por Y1. Suponiendo además que se toman en forma adiciona n 0 >1
observaciones en el centro del diseño (0,0,...,0). Denotando el promedio de estas
observaciones como Y0.

El estadístico de prueba es:

59
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

__ __
(Y 1  Y 0 ) 2
F con , 1, n1 + n0 – n - 1 g.l. (5.16)
1 1
s2 (  )
n1 n 2

Donde s2 es un estimador de la varianza 2. Si n1 = n, entonces s2 se calcula a


partir de las replicaciones de los n0 puntos centrales con n0 –1 grados de libertad.
Si n1>n entonces s2 se calcula usando las replicaciones en los putnos del diseño
de primer orden así como las replicas de los puntos centrales.

Para el caso del ejemplo, se tiene:

r1 =1; n0 = 2

__
Y1  (93.6  92.9  91.7  92.5) / 4  96.675

__
Y0  (96.2  97.0) / 2  96.6

(96.2  96.6) 2  (97.0  96.6) 2


s2   0.32 con 2 – 1 grados de libertad
2 1

El valor de F es:

(96.675  96.6) 2
F  64.19 Como F0.10,1,1 = 39.9
032(1 / 4  1 / 2)

La F calculada es mayor que la de tablas por lo que se rechaza H 0: ii = 0. Por lo


que el siguiente pasa será establecer un modelo de segundo orden alrededor de la
región de interés.

Para el modelo de segundo orden, se agregarán puntos adicionales al diseño


básico, de tal forma que todos los coeficientes en el modelo puedan ser
estimados.

5.4 Ajuste de un modelo de segundo orden: exploración local de la


respuesta

Ahora se tratará de lograr lo siguiente:

1. Obtener un modelo adecuado de representación de la superifice estimada de


segundo orden.
2. Localizar las coordenadas (x10, x20, ..., xk0) del punto estacionario, donde la
pendiente de la superficie es cero. Si se encuentra dentro de la región de

60
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

interés ir a paso 3; de otra forma se requiere experimentación adicional en la


dirección del punto estacionario.
3. Describir la naturaleza de del punto estacionario, como un máximo, mínimo o
minimax – cordillera.
4. Describir la forma de la superficie de respuesta en la vecindad del punto
estacionario.

5.4.1 Ajuste con un modelo de segundo orden

Suponiendo que se realizan cuatro experimentos adicionales en cada uno de los


ejes axiales ( x1 , x 2 )  (  2 ,0); y ( x1 , x 2 )  (0, 2 ) . Estos puntos junto con los
cuatro puntos de diseño y el punto central forman un diseño central compuesto
rotable, los valores para todos los experimentos se muestran en la tabla 5.5.

Con los datos de la tabla 5.5 y codificando los valores, el modelo de segundo
orden encontrado es (ver ejemplo numérico en página 7):

Yest .( x )  96.6  0.03x1  0.31x 2  1.98 x12  1.83x 22  0.58 x1 x 2 (5.20)

La tabla ANOVA se muestra en la tabla 5.6.

La SS del error puro se calcula utilizando las dos réplicas tomadas en el punto
central como:

SS Error puro = ½ ( 96.2 – 97.0)2 = 0.32 con 1 grado de libertad

y la SS del error por falta de ajuste es:

SS Error LOF = Error residual – Error puro = 0.4539 – 0.32 = 0.1339 con 4 – 1 = 3
g.l. por tanto el error cuadrático medio es 0.044.

Donde se observa que error por falta de ajuste (E LOF) es menor que la unidad, no
es significativo. Los coeficientes cuadráticos puros son muy significativos ( p <
0.001 ), lo que indica la presencia de curvatura en los valores de respuesta
observados.

Con el modelo de segundo orden de ecuación 5.20, se pueden predecir valores de


rendimiento para diversos valores de x1 y x2 y su varianza dentro de la región
experimental (ver tabla 5.7) y los contornos de igual respuesta se muestran en la
figura 5.6.

La ecuación del modelo de segundo orden en forma matricial es:

Yest (x) = b0 + x’b + x’Bx (5.21)

61
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

Las coordenadas del punto estacionario se determinan con la ecuación:

B 1b (5.22)
x0  
2

Donde la matriz B correspondiente al modelo representado por la ecuación 5.20


es:

1.98127, .0 28750
B 
 .0 28750, .1 83127
De la fórmula para invertir una matriz A:

a1 ,a12 
A  
 a 21 , a 2 

1 a , a 
1 2 12
A  
A a21,a1 
Se tiene:

62
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

1 .0 51650, .0 08109


B  
 .0 08109, .0 5588 
 .0 03018 
b 
 .0 31125
y el punto estacionario es:

1 1  0.0 486
x0   B b    (5.23)

2  0.08568
De acuerdo a las variables originales, el punto de ajuste estacionario es T =
135.85ºC y t = 193.02 seg. respectivamente, calcualdo de las siguientes
ecuaciones:

Temperatur a  135.9 tiempo  195


x1  ; ;x 2 
10 23.1

Pendiente el calculo del intervalo de confianza para el punto estacionario.

63
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

5.5.1 La ecuación canónica del modelo de segundo orden de la superficie de


respuesta

Si trasladamos el origen del centro del diseño al punto estacionario, se tiene:

( z1 , z 2 ,....., z k )'  ( x1  x10 , x 2  x 20 ,....., x k  x k 0 )' o sea z = x – x0, expresando la


ecuación de respuesta de segundo orden como:

Yest (z) = Yest (0) + z’Bz (5.26)

Definiendo las variables W1, W2, ...., Wk tal que W esté dado por:

W = M’z (5.27)

Donde la matriz M es una matriz ortogonal (k x k) cuyas columnas son vectores


propios o característicos de la matriz B. M diagonaliza a B, es decir:

M’ B M = diag ( 1,  2,.....,  k) donde las ’s son valores característicos de B.

Los ejes asociados con las variables Wi se denominan ejes principales del sistema
de respuesta.

La transformación de la ecuación 5.27 es una rotación de los ejes zi para formar


los ejes Wi (ver figura 5.9b para k = 2), además si se escribe:

W =M’z – M’(x – x0);

Entonces los coeficientes de las xi son los cosenos de dirección de los ejes Wi
respecto a los ejes xi y un coeficiente unitario, indicaría que los ejes Wi son
paralelos a los xi .

Expresando la ecuación 5.26 en función de las variables W i, se tiene:

x’Bz = W’M’BMW = 1W1  .....  2Wk


2 k
(5.28)

Los valores característicos  i son reales y representan a los coeficientes de W i en


la ecuación canónica:

k
Yest  Yest (0)   iWi 2 (5.29)
i 1

Esta ecuación canónica de la superficie de respuesta de segundo orden, realiza la


misma función que la dirección del ascenso rápido para el modelo de priemer
orden. Se puede observar que si (1, 2,....., k) son:

64
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

1. Todos positivos, entonces en x0, la superficie es un máximo.


2. Todos negativos, entonces en x0, la superficie es un mínimo.
3. De signos mezclados, entonces x0 es un punto silla de la superficie ajustada o
minimax.
4. Si son muy cercanos a cero, significa que la respuesta no cambia en valor
conforme nos movemos en valor desde x0 hacia la dirección del eje Wi. En este
caso para k = 2 se tiene un sistema de cordillera estacionaria (ver figura 5.7d
donde no hay cambio en la dirección de W2).
5. Las magnitudes de los valores individuales de 1, 2,....., k dicen que tan
rápido cambia la altura de la superficie al moverse desde x0 en la dirección del
eje Wi.

Para expresar cada Wi como función de xi, si particionamos la matriz M (kxk) en mi


vectores columna se tiene:

M = [ m1: m2: .....:mk ]

Los elementos de mi se obtienen al hallar un vector característico asociado con  i


y normalizándolo de tal forma que la suma de cuadrados de mi sea la unidad, o
sea mi’mi =1 y mi’mj = 0 para i  j. Los elementos de se obtienen al resolver la
ecuación:

(B –  i Ik ) mi = 0 (5.31)

Conociendo los valores de los elementos de la matriz M y los valores


característicos  i , se puede hacer una descripción de la superficie de respuesta
estimada a través de la ecuación canónica de la ecuación 5.29.

Expresando las variables Wi en términos de xi, se tiene:

W = M’z = M’ (x – x0) (5.32)

EJEMPLO NUMÉRICO

El modelo de segundo orden de la ecuación 5.20 se puede escribir como:

65
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

x10.32x1 1.983,0275x1
Yest(x)96.'  '  =

x20.312 x20.2875,13x2
Yest.(x) = b0 + x’b+x’ B x

En el punto estacionario Yest (x0) = 96.613. Para obtener la ecuación canónica se


requiere encontrar los valores propios o característicos de la matriz B
(1, 2 ) resolviendo la ecuación de determinantes siguiente:

B  I  0 o sea:

66
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

(1.9813  ),0.2875
0
0.2875,(1.8313  )
Expandiendo el determinante queda como:

2  3.8125  3.5455  0 con raíces:

(1, 2 ) = (-1.6091, -2.2034) y la ecuación canónica es:

Yest  Yest (0)  1W12  2W22  96.6133  1.6091W12  2.2034W22


(5.33)

donde Yest (0) = Yest. (0,0)

Como ambas ’s son negativas, el punto estacionario es un máximo, la superficie


estimada cae más rápido en el eje W2 (eje mayor) que al moverse en el eje W 1 (eje
menor).

Para dibujar los contornos de la superficie (figura 5.6), se requiere expresar los
ejes W’s en términos de los x’s. Por tanto:

Para el caso de  1 se tiene:

De ecuación 5.32 para 1 = -1.6091 se tiene:

67
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

(1.98131.6091,0.2875 m1  0



0.2875,(1.831 1.6091)m  0
   21   
o sea:

-0.3722m11 + 0.2875m21 = 0
0.2875m11 – 0.2222m21 = 0 (5.34)

Inicialmente ponemos a 1 el valor de m11 y resolvemos para m21, por tanto de la


primera ecuación se tiene:

m21 = 1.2945

Los valores normalizados de m11 y m21 son:

1
m11   0.6113
1  (1.2945) 2
2

1.2945
m 21   0.7914
1  (1.2945) 2
2

con:

m112  m21
2
1

De tal forma que:

68
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

0.61 3
m1   
0.7914
Para el caso de  2 se tiene:

De ecuación 5.32 para 2 = -2.20335 se tiene:

(1.98132. 03 5,0.2875 m12 0



0.2875,(1.831 2. 03 5)m  0
  2   
o sea:

0.2221m12 + 0.2875m22 = 0
0.2875m12 – 0.3721m22 = 0 (5.34)

69
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

Inicialmente ponemos a 1 el valor de m22 y resolvemos para m12, por tanto de la


primera ecuación se tiene:

m12 = -1.2945

Los valores normalizados de m11 y m21 son:

 1.2945
m12   0.7914
1  ( 1.2945) 2
2

1
m22   0.6113
1  (1.2945) 2
2

con:

m122  m22
2
1

La Matriz M’ y la relación entre las variables W’s y x’s es de la ecuación 5.32:

W1 0.613,0.7914x10. 49


   ' 
W 2 0.7914,0.613 x20. 857
De tal forma que:

W1  0.6113 x1  0.7914 x 2  0.0708

70
Metodología de Superficies de Respuesta P. Reyes / Dic. 2006

W2  0.7914 x1  0.6113 x 2  0.0485


Una gráfica de los ejes W1 y W2 en relación a los ejes x1 y x2 se muestra en la
figura 5.11.

71

Вам также может понравиться