Академический Документы
Профессиональный Документы
Культура Документы
FACULTAD DE INGENIERIA
ESCUELA DE FORMACION PROFESIONAL
INGENIERIA METALURGICA
MODULO
OPTIMIZACION POR DISEOS
EXPERIMENTALES
UNIDAD I
Sesin I: Diseo Experimental
Sesin II: Experimento de comparacin Simple
Sesin III: Inferencia de las Medias Diseo
Aleatorizado
Sesin IV: Experimento de un Solo Factor
SESION I
1.1. EXPERIMENTO
Definicin
Se refiere a la creacin y preparacin de lotes de prueba que verifiquen la validez de las
hiptesis establecidas sobre las causas de un determinado problema o defecto, objeto de
estudio.
Concepto
En un Experimento, el experimentador escoge ciertos factores para su estudio, los altera
deliberadamente de forma controlada y despus, observa el efecto resultante.
El Experimento puede realizarse bien en laboratorio o bien en el exterior: En la fbrica, en unos
almacenes, en los locales del usuario, etc.
1.2. DISEO DE EXPERIMENTOS
Definicin
Metodologa estadstica destinada a la planificacin y anlisis de un Experimento.
Concepto
El Diseo de un Experimento debe garantizar que este cumpla ciertos requisitos mnimos:
Debe poder comprobar las hiptesis objeto de estudio, no dejndose confundir por variables
insospechadas (=ruido), como errores de medida desproporcionados, etc.
Debe poder revelar la existencia de cualquier causa importante de variacin, aunque no
haya sido adelantada como hiptesis.
Debe mantener los costos de experimentacin a un nivel razonable, en comparacin con el
problema objeto de estudio.
Debe tener un alto grado de seguridad en las respuestas.
Si el Experimento se realiza en un laboratorio, ste ha de ser, respecto a las variables
estudiadas, un buen indicador de las pruebas que se obtendran en el taller o "in situ".
Si el Experimento se realiza durante el desarrollo normal del proceso en estudio, se tendr
adems cuidado de interferir lo menos posible en el trabajo normal y protegerse de las
interferencias no autorizadas o involuntarias en la prueba por parte del personal adepto.
El proceso o sistema bajo estudio puede representarse por medio del modelo de la Fig. 1-1.
Suele ser posible visualizar el proceso como una combinacin de mquinas, mtodos, personas
y otros recursos que transforman alguna entrada a menudo un material en una salida que tiene
una o ms respuestas observables. Algunas de las variables del proceso x 1, x2...............xn, son
controlables, mientras que otras z1, z2,... zp son incontrolables aunque pueden ser controlables
para los fines de una prueba). Entre los objetivos del experimento pueden incluirse:
1. Determinar cules variables tienen mayor influencia en la respuesta, y.
2. Determinar el mejor valor de las x que influyen en y, de modo que Y tenga casi siempre
un valor cercano al valor nominal deseado.
3. Determinar el mejor valor de las x que influyen en y, de modo que la variabilidad de y
sea pequea.
4. Determinar el mejor valor de las x que influyen en y, de modo que se minimicen los
efectos de las variables incontrolables z 1, z2,..., zp.
Los mtodos de diseo experimental tienen un cometido importante en el desarrollo de procesos
y en la depuracin de procesos para mejorar el rendimiento. En muchos casos, el objetivo puede
ser desarrollar un proceso consistente o robusto; esto es, un proceso afectado mnimamente por
fuentes de variabilidad externas (la z).
He aqu un ejemplo de experimento. Supngase que un ingeniero metalrgico est interesado en
estudiar el efecto que tienen sobre una aleacin de aluminio dos procesos diferentes de
endurecimiento: el templado en aceite y el templado en agua salada. En este caso, el objetivo
del investigador es determinar cul de las dos soluciones produce el mximo grado de dureza
sobre la aleacin mencionada. El ingeniero decide someter un cierto nmero de probetas de la
aleacin a cada medio de templado, para despus medir la dureza de las muestras. La dureza
promedio de las probetas tratadas en cada solucin servir para determinar cul de las dos
soluciones es la mejor.
Temperatura de la soldadura
Temperatura de precalentamiento
Velocidad de banda transportadora
Tipo fundente
Densidad relativa del fundente
Profundidad de la onda de soldadura
Angulo de la banda transportadora
Adems de estos factores controlables, existen varios otros cuyo control no es fcil durante el
proceso de manufactura ordinario, aunque podran controlarse para los fines de una prueba.
Ellos son:
1. Espesor de la tarjeta de circuitos impresos.
2. tipos de componentes usados en la tarjeta.
Efecto
(Variable Dependiente)
Y
A. Controlables
1. Bsicas o primarias
2. Transformadas
B. Incontrolables
1. Materias primas
2. Condiciones ambientales
3. Condiciones de operacin
4. Factores econmicos
A. De rendimiento
1. Econmicas
2. Contreidas
B. 1. Cualitativas
2. Cuantitativas
a) Fsicas
b) Operacionales
C. Intermedias
SESION II
EXPERIMENTOS DE COMPARACIN SIMPLES
Se usan para comparar dos condiciones (a menudo llamadas tratamientos). A menudo, se
denominan experimentos de comparacin simples. Se comienza con un ejemplo de un
experimento realizado para determinar si dos frmulas diferentes de un producto producen
resultados equivalentes.
Los experimentos comparativos son, bsicamente, experimentos en los cuales la muestra se
compara por sus efectos medios sobre una variable respuesta. El objeto principal es determinar
cul de ellos es mejor en algn sentido.
Esta discusin conduce a una revisin de los conceptos bsicos de la estadstica, tales como
variables aleatorias, distribuciones de probabilidad, muestras aleatorias, distribuciones mustrales
y pruebas de hiptesis.
2-1 INTRODUCCION
La resistencia adhesiva a la tensin del mortero de cemento Portland es una caracterstica
importante del producto. Un ingeniero est interesado en comparar la resistencia de una formula
modificada, a la que se han agregado emulsiones de polmeros de latex durante el
mezclado, contra la resistencia de la argamasa hecha con la formula no modificada. El
experimentador ha recolectado 10 observaciones de la resistencia de la formula modificada y
otras 10 de la formula no modificada. Los datos aparecen en la Tabla 2-1. Las dos frmulas
pueden considerarse como dos tratamientos, o dos niveles de las formulaciones de factor.
Los datos de este experimento se grafican en la Fig. 2-1. Esta representacin grfica se denomina
diagrama de puntos. A primera vista, estos datos dan la impresin de que la resistencia del
mortero no modificado es mayor que la del modificado.
Esta impresin se refuerza al comparar los valores medios de la resistencia a la tensin, es decir
1 = 16.76 kgf/cm2, del mortero modificado contra 2 = 17.92 kgf/cm 2, del mortero no,
modificado. Los promedios de la resistencia a la tensin en estas dos muestras difieren en una
cantidad que parece ser significativa. Sin embargo, no es evidente que esta diferencia sea
suficientemente grande como para implicar que las dos frmulas son realmente distintas. Quizs
la diferencia que se observa en el promedio de las resistencias es resultado de las fluctuaciones
en el muestreo, siendo en realidad las dos frmulas idnticas. Posiblemente otras dos muestras
produzcan resultados contrarios, cuando la resistencia de la frmula modificada supera a la de la
frmula original.
Una tcnica de inferencia estadstica llamada prueba de hiptesis (pruebas de significacin),
puede servir para ayudar al experimentador al comparar estas dos frmulas. La prueba de
hiptesis permite que la comparacin de las formulas se realice sobre bases objetivas, con un
El histograma se utiliza cuando los datos son numeroso, se representa la tendencia central, la
dispersin y la forma general de la distribucin de los datos. Un histograma se construye
dividiendo el eje horizontal en intervalos (por lo regular de la misma longitud) y trazando sobre el j-
esimo intervalo un rectngulo con rea proporcional a n i, el nmero de observaciones que caen en
ese intervalo. A continuacin en la Fig. 2-2 se presenta el histograma de 200 observaciones de la
recuperacin de metal (rendimiento) en un proceso de fundicin.
El diagrama de caja es un medio muy til para representar grficamente datos. En dicho
diagrama, los valores mnimo y mximo, los cuartiles inferior y superior (percentiles 25 y 75,
respectivamente) y la mediana (percentil 50) se representan en una caja rectangular alineada ya
sea horizontal o verticalmente. La caja se extiende del cuartil inferior al superior, y es atravesada
de un lado al otro por la mediana. A partir de los extremos de la caja se extienden lneas
("bigotes") hasta los valores mnimo y mximo.
En la Fig. 2-3 se presentan los diagramas de caja para las dos probetas de resistencia adhesiva a
la tensin del experimento con mortero de cemento portland. Esta representacin revela
claramente la diferencia de resistencia media entre las dos formulaciones. Tambin indica ambas
formulaciones producen distribuciones simtricas de resistencia con similar variabilidad o
dispersin.
Distribucin de Probabilidad
La estructura probabilstica de una variable aleatoria, digamos y, se describe por su distribucin
de probabilidad. A menudo, la distribucin de probabilidad de y, representada por p(y), se
denomina funcin de probabilidad y es discreta. Si y es continua, usualmente la distribucin de
probabilidad de y, es, f(y), se denomina funcin de densidad de probabilidad de y.
En la figura 2-4 se ilustra dos distribuciones de probabilidad hipottica, una discreta y la otra
continua. Obsrvese que en la distribucin de probabilidad discreta es la altura de la funcin p(yj)
la que representa la probabilidad, mientras que en el caso continuo, es el rea bajo la curva f(y)
asociada con un intervalo dado la que representa la probabilidad.
y la variancia muestral
2-2
donde SS = n
Entonces
i=1
2-3
Por lo tanto,
2-4
..
2-7
sigue una distribucin normal estndar, denotada por z ~ N(0, 1). A la operacin ilustrada en
la Ecuacin 2-7 suele llamarse la estandarizacin de la variable aleatoria normal y.
En muchas tcnicas estadsticas se supone que la variable aleatoria sigue una distribucin
normal. El teorema del lmite central es con frecuencia una justificacin de la normalidad
aproximada.
SESION III
2.4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS
ALEATORIZADOS
Estamos preparados ahora para volver al problema del mortero de cemento portland de la seccin
2-1.
Recuerde que se estaban investigando dos formulaciones diferentes para determinar si difieren en
la fuerza de la tensin de adhesin. En esta seccin se examina como pueden realizarse los datos
de este experimento comparativo simple utilizando procedimientos de pruebas de hiptesis e
intervalos de confianza para comparar las medias de dos tratamientos.
A lo largo de esta seccin se supone que se usa un diseo experimental completamente
aleatorizado. En este diseo, los datos se consideran como si fueran una muestra aleatoria de una
distribucin normal.
2.4.1 Prueba de hiptesis
Se retoma ahora al experimento del cemento portland introducido en la seccin 2-1. Recuerde que
el inters se encuentra en comparar la fuerza de dos formulaciones diferentes: una del mortero sin
modificar y una del mortero modificado. En general, estas dos formulaciones pueden considerarse
como dos niveles del factor formulaciones.
Sea que y11, y12,.y1n1 represente las n1 observaciones del primer nivel del factor y que y21,
y22., y2n2 represente las n, observaciones del segundo nivel del factor. Se supone que las
muestras se sacan al azar de dos poblaciones normales independientes. En la figura 2-6 se ilustra
la situacin.
Una hiptesis estadstica es un enunciado o afirmacin ya sea acerca de los parmetros de una
distribucin de probabilidad o de los parmetros de un modelo. La hiptesis refleja alguna conjetura
acerca de la situacin del problema. Por ejemplo, en el experimento del cemento portland, puede
pensarse que las fuerzas de la tensin de adhesin promedio de las dos formulaciones del mortero
son iguales. Esto puede enunciarse formalmente como
. 2-9
donde 1, y 2, son las medias muestrales, n1 y n2 son dos tamaos de las muestras, S2p es una
estimacin de la varianza comn 21 = 22 = 2 calculada a partir de
2.10
y S21, y S22; son las dos varianzas mustrales individuales. Para determinar si deber rechazarse
Ho: 1= 2, se comparara to con la distribucin t con n1 + n2 - 2 grados de libertad. Si I to I > donde
t/2,n1+n2-2 es el punto porcentual /2 superior de la distribucin t con n 1+n2-2 grados de libertad,
entonces se rechazara Ho y se concluira que las fuerzas promedio de las dos formulaciones del
mortero de cemento portland difieren. A este procedimiento de prueba se le llama generalmente la
prueba t de dos muestras.
Este procedimiento puede justificase de la siguiente manera. Si el muestreo se est haciendo de
distribuciones normales independientes, entonces la distribucin de 1-2 es N[1 - 2,2(1/n1 +
1/n2)]. Por lo tanto, si se conociera 2, y si Ho: 1= 2 fuera verdadera, la distribucin de
Seria N(0,1). Sin embargo, al sustituir con Sp en la ecuacin 2-11, la distribucin de Z o cambia de
la normal estndar a la distribucin t con n 1 +n2- 2 grados de libertad. Ahora bien, si Ho es
verdadera, to de la ecuacin 2-9 se distribuye como t n1+n2-2 y, por consiguiente, se esperara que
100(1- ) por ciento de los valores de t o estn entre - t/2,n1+n2-2 y t/2,n1+n2-2. Una muestra que
produjera un valor de to que estuviera fuera de estos lmites seria inusual si la hiptesis nula fuera
verdadera y es evidente de que Ho deber rechazarse. Por lo tanto, la distribucin t con n1 +n2 - 2
grados de libertad es la distribucin de referencia apropiada para el estadstico de prueba to. Es
decir, describe el comportamiento de to cuando la hiptesis nula es verdadera. Observe que es la
probabilidad del error tipo I de la prueba.
En algunos problemas quiz quiera rechazarse Ho nicamente si una de las medias es mayor que
la otra. Por lo tanto, se especifican a una hiptesis alternativa de una cola H1:1>2 y Ho solo se
rechazara si to > t/2,n1+n2-2. Si se desea rechazar Ho solo si, es menor que 1 entonces la hiptesis
alternativa es H1: 1<2, y Ho se rechazara si to < t/2,n1+n2-2
Para ilustrar el procedimiento, considere los datos del cemento portland de la tabla 2-1. Para estos
datos, se encuentra que
y el estadstico de prueba es
Puesto que to = -9.13 < - t0,025, 18 = -2.101, se rechazara Ho y se concluira que las fuerzas de la
tensin de adhesin promedio de las dos formulaciones del mortero de cemento Portland son
diferentes.
No siempre es sencillo calcular el valor P exacto de una prueba. Sin embargo la mayora de los
programas de computacin modernos para realizar anlisis estadsticos reportan valores P y
pueden obtenerse tambin en algunas calculadoras portables. A continuacin se indicara como
obtener una aproximacin del valor P para el experimento del mortero de cemento portland. Por la
tabla II del apndice, para una distribucin t con 18 grados de libertad, la probabilidad menor en el
rea de la cola es 0.0005, para la cual t0.0005,18 = 3.922. Ahora bien, Itol = 9.13 > 3.922, de donde, ya
que la hiptesis alternativa es de dos colas, se sabe que el valor P debe ser menor que 2(0.0005)
= 0.001.
SESION IV
EXPERIMENTOS CON UN SOLO FACTOR: ANLISIS DE VARIANCIA
Este modelo es el ms sencillo del diseo de experimentos, en el cual la variable respuesta puede
depender de la influencia de un nico factor, de forma que el resto de las causas de variacin se
engloban en el error experimental.
Se supone que el experimento ha sido aleatorizado por completo, es decir, todas las unidades
experimentales han sido asignadas al azar a los tratamientos.
En la sesin anterior se consideraron mtodos para comparar dos condiciones o tratamientos. Por
ejemplo, en el experimento de la resistencia adhesiva a la tensin del cemento Portland
participaban dos formulaciones (clases) distintas de mortero. Otra forma de describir este
experimento es como uno unifactorial con dos niveles del factor, donde el factor es formulacin del
mortero y los dos niveles son los dos mtodos distintos de formulacin. Muchos experimentos de
este tipo implican ms de dos niveles del factor.
3.1 UN EJEMPLO
Un ingeniero de desarrollo de productos est interesado en maximizar la resistencia a la tensin
de una nueva fibra sinttica que se empleara en la manufactura de tela para camisas de hombre.
El ingeniero sabe por experiencia que la resistencia es influida por el porcentaje de algodn
presente en la fibra. Adems, el sospecha que elevar el contenido de algodn incrementara la
resistencia, al menos inicialmente. Tambin sabe que el contenido de algodn debe variar aproximadamente entre 10 y 40% para que la tela resultante tenga otras caractersticas de calidad que
se desean (como capacidad de recibir un tratamiento de planchado permanente. El ingeniero
decide probar muestras (o probetas) a cinco niveles de porcentaje de algodn: 15, 20, 25, 30 y
35%. As mismo, decide ensayar cinco muestras a cada nivel de contenido de algodn.
Este es un ejemplo de experimento unifactorial con a = 5 niveles del factor y n = 5 repeticiones.
Las 25 corridas deben hacerse al azar. Para ilustrar la forma en que puede aleatorizarse el orden
de ejecucin, supngase que las corridas se numeran como sigue:
Ahora se elige un nmero aleatorio entre 1 y 25, supngase que este nmero es 8. Entonces la
observacin nmero 8(20% de algodn) se ejecuta (corre) primero. El proceso se repite hasta
que se ha asignado una posicin en la secuencia de prueba a cada una de las 25 observaciones.
Supngase que la secuencia de prueba obtenida es
Esta secuencia de prueba aleatorizada es necesaria para evitar que los resultados sean
contaminados por los efectos de variables inconvenientes desconocidas, que pueden salir de
control durante el experimento. Para ilustrar esta situacin, supngase que se corren las 25
muestras de prueba en el orden no aleatorizado original (esto es, las cinco muestras con 15% de
algodn, se prueban primero, luego las cinco muestras con 20% de algodn, y as
sucesivamente). Si la maquina probadora de la resistencia a la tensin presenta un efecto de
calentamiento tal que a mayor tiempo de funcionamiento menores lecturas de resistencia a la
tensin, entonces dicho efecto potencialmente contaminara los datos de resistencia e invalidara el
experimento.
Supngase ahora que el ingeniero ejecuta la prueba en el orden aleatorio que hemos determinado
Las observaciones que el obtiene acerca de la resistencia a la tensin se presentan en la Tabla 31.
Siempre es una buena idea representar grficamente los datos experimentales. En la Fig. 3-1 se
muestran diagramas de caja para resistencia a la tensin a cada nivel de porcentaje de algodn, y
la Fig. 3-2 es un diagrama de dispersin para resistencia contra porcentaje de algodn. En esta
ltima figura, los crculos negros son Las observaciones individuales, y los blancos son los valores
medios de las resistencias observadas Ambas graficas indican que la resistencia a la tensin
aumenta con el contenido de algodn, hasta un valor aproximado de este ultimo de 30%. Ms all
del 30% de algodn, ocurre un notable decremento en la resistencia. No hay una fuerte evidencia
que sugiera que la variabilidad en la resistencia alrededor del promedio dependa del porcentaje de
algodn. Con base en este sencillo anlisis grfico, sospechamos fuertemente que:
1) el porcentaje de algodn influye en la resistencia y la tensin y
Supngase que deseamos ser ms objetivos en nuestros anlisis de los datos. Especficamente,
supngase que deseamos probar en busca de diferencias entre las resistencias medias a las a=5
niveles de porcentaje de algodn. Por tanto, nos interesa probar la igualdad de las cinco medias.
Al parecer la solucin a este problema consiste en realizar pruebas t para todos los posibles pares
de medias. Sin embargo, esta solucin no es correcta ya que produce una gran distorsin en el
error tipo I. Por ejemplo, Supongamos que se desea probar la igualdad de 5 medias usando
comparaciones por pares. Existir 10 posibles pares, y si la probabilidad de aceptar correctamente
la hiptesis nula en cada prueba individual es 1- = 0.95, entonces la probabilidad de aceptar
correctamente la hiptesis nula en las 10 pruebas es (0.95)10= 0.60, si estas son independientes.
Es as como se produce un incremento sustancial del error tipo I.
El procedimiento apropiado para probar la igualdad de varias medias es el anlisis de variancia.
Sin embargo, este anlisis tiene aplicaciones adicionales a la del problema descrito con anterioridad. Probablemente es la tcnica ms til en el campo de la inferencia estadstica.
3.2 ANALISIS DE VARIANCIA
Supongamos que se desea comparar a tratamientos o niveles de un solo factor. La
respuesta que se observa en cada uno de los a tratamientos es una variable aleatoria.
Los datos apareceran como en la Tabla 3-2. Una entrada de la citada tabla (por
ejemplo, y ij representa la j-esima observacin del tratamiento i. En general, habr n
observaciones del tratamiento i. Obsrvese que la Tabla 3-2 es el caso general de los
datos del experimento de resistencia a la tensin resumido en la Tabla 3-1.
Es til describir las observaciones mediante el modelo estadstico lineal
. 3-1
en donde y ij , es la ( ij )-sima observacin, , es la media del nivel del factor o
tratamiento i-simo, y ij es un componente del error aleatorio que incorpora todas las
dems fuentes de variabilidad del experimento, incluyendo las mediciones, la
variabilidad que surge de factores no controlados, las diferencias entre las unidades
experimentales (como los materiales de prueba, etc) a las que se aplican los
tratamientos, y el ruido de fondo general en el proceso (ya sean la variabilidad con el
tiempo, los efectos de variables ambientales, etc). Es conveniente considerar que los
errores tienen media cero, de tal modo que E(y ij )= i . A la ecuacin 3-1 se le llama el
modelo de las medias. Una forma alternativa de escribir un modelo de los datos es
definiendo
De tal modo que la ecuacin 3-1 se convierte en
3-2
En esta forma del modelo, es un parmetro comn a todos los tratamientos al que se
llama media global, y i es un parmetro nico del tratamiento i-simo al que se le llama
el efecto del tratamiento i-simo. A la ecuacin 3-2 se le llama por lo general el
modelo de los efectos.
Tanto el modelo de las medias como el de los efectos son modelos estadsticos
lineales; es decir, la variable de respuesta y ij es una funcin lineal de los parmetros del
modelo.
A la ecuacin 3-2 (o a la 3-1) se le llama tambin el modelo del anlisis de varianza
simple o de un solo factor (o direccin), por que nicamente se investiga un factor.
Adems, ser un requisito que el experimento se lleve a cabo en orden aleatorio para
que el ambiente en el que se apliquen los tratamiento (llamados con frecuencia
unidades experimentales) sea lo ms uniforme posible. Por lo tanto, el diseo
experimental es un diseo completamente aleatorizado. Nuestro objetivo ser probar
las hiptesis apropiadas con respecto a los efectos del tratamiento y hacer una
estimacin de ellos. Para probar las hiptesis, se supone que los errores del modelo son
variables aleatorias independientes con distribucin normal, con media cero y variancia
2 Se supone que esta ltima es constante para todos los niveles del factor.
3-3
en donde N=an es el nmero total de observaciones. Entonces, la notacin de "punto en el sub ndice implica la suma sobre el sub ndice que reemplaza.
La media del j-simo tratamiento es E(y ij )= + , i= 1. 2.,a. Por tanto, el valor
medio del j-simo tratamiento consta de la suma de la media general y el efecto del isimo tratamiento. Interesa probar la igualdad de las medias de dos a tratamientos: es
decir hay que observar
que si H 0 es verdadera, todos los tratamientos tienen la media comn . Una forma
equivalente de expresar las hiptesis anteriores es en trminos de los efectos de
tratamiento i , o sea
Por tanto, es posible hablar de probar la igualdad de las medias de los tratamientos,
bien de probar que los efectos de tratamiento (las i ) son cero. El procedimiento
apropiado para probar la igualdad en el nivel medio de a tratamientos en el anlisis de
variancia
3.3.1 Descomposicin do la Suma Total do Cuadrados
La denominacin anlisis de variancia resulta de descomponer la variabilidad total de
los datos en sus partes componentes. La suma total de cuadrados corregida
se usa como medida de la variabilidad total de los datos. Intuitivamente esto parece
razonable, ya que si se divide SS T , entre el nmero apropiado de grados de libertad (en
este caso entre (a.n - 1 = N -1), se obtiene la variancia muestral de y. Obviamente, la
variancia muestral es una medida estndar de la variabilidad.
Debe observarse que la suma total de cuadrados corregida SS T (notacin proveniente
de sum of square, SS) puede escribirse como
.3-4
o bien
..3-5
Sin embargo, el trmino del producto de cruz en la ecuacin 3-5 es cero. ya que
En esta forma es fcil observar que el termino ubicado entre los parntesis
rectangulares, dividido entre n-1, es la variancia muestral del i-esimo tratamiento, o
Ahora bien, es posible combinar a variancias muestrales para producir una estimacin
de la variancia poblacional comn como se muestra a continuacin:
Por tanto, SS E /(N-a) es una estimacin de la variancia comn a cada uno de los a
tratamientos.
Igualmente, si no hay diferencia entre las medial de los a tratamientos, puede usarse la
variacin de los promedios de los tratamientos con respecto al promedio general para
estimar 2 . Especficamente.
Ahora bien, cuando se elevan al cuadrado las cantidades entre parntesis rectangulares
y se toma su valor esperado, los trminos que contienen 2 ij y 2 i deben remplazarse por
y n 2 respectivamente, porque E( ij )=0. Ms aun, todos los productos de cruz que
contienen poseen una expectativa igual a 0. Por tanto, al elevar al cuadrado y tomar
valor esperado, la ltima ecuacin se transforma en
O bien
Usando un enfoque similar es posible mostrar que
Por tanto, como se argumenta en forma heurstica, una estimacin para 2 es MS E =SS E /
(N-a); por otra parte, si no hay diferencia en el nivel medio de los tratamientos (lo que
implica que i =0), MS Tratamiento =SS Tratamiento /(a-1) proporciona otra estimacin para 2. Sin
embargo, hay que observar que si existe diferencia en las medias de los tratamientos, el
valor esperado de la media de cuadrados de tratamiento es mayor que 2 .
Resulta claro que una prueba para la hiptesis de la igualdad en el nivel medio de
tratamientos puede efectuarse comparando MS Tratamiento y MS E . A continuacin se muestra
como realizarse tal comparacin.
3-3.2 Anlisis Estadstico
Ahora se investiga cmo puede realizarse una prueba formal de la hiptesis de medias
de los tratamientos (H 0 : 1 = 2 =.= a , o equitativamente, H 0 : 1 = 2 = ..= a =0)
Puesto que se ha supuesto que los errores ij son independientes y estn normalmente
distribuidos con media cero y variancia 2 , las observaciones y ij tambin son
independientes y se encuentran normalmente distribuidos con media + i y variancia 2 .
Es posible demostrar que SS E / 2 tiene una distribucin ji cuadrada con N-1 grados de
libertad porque SS T , es una suma de cuadrados de variables aleatorias normalmente
distribuidas. Tambin se puede mostrar que SS E / 2 tiene una distribucin ji cuadrada
con N-a grados de libertad y que si la hiptesis nula H 0 : i=0 es verdadera, SS Tratamiento / 2
tiene una distribucin ji cuadrada con a-1 grados de libertad. Sin embargo, estas tres
sumas de cuadrados no son independientes ya que SS T es igual a SS Tratamiento ms SS E .
El siguiente teorema, que es un caso particular de otro atribuido a Cochran, es til para
establecer la independencia entre SS E y SS Tratamiento .
TEOREMA 3.1. TEOREMA DE COCHRAN
Sean Z variable aleatorias NID(0,1)para i=1,2,.,v y
..3-7
tiene una distribucin F con a-1 y N-a grados de libertad. La Ecuacin 3-7 es la
estadstica para probar la hiptesis de igualdad de medias de los tratamientos.
Del valor esperado de la media de cuadrados se observa que, en general, MS E es un
estimador insesgado de 2 . Por otra parte, si la hiptesis nula es verdadera, MS Tratamientos
resulta ser un estimador insesgado de 2.Sin embargo, si la hiptesis nula es falsa, el
valor esperado de MS Tratamientos es mayor que 2 .Por tanto, el valor esperado del
numerador en la estadstica de prueba (Ecuacin 3-7), es mayor que el valor esperado
del denominador si la hiptesis alterna es verdadera y en consecuencia, debe
rechazarse H 0 si el valor de tal estadstica es demasiado grande. Esto implica una regin
crtica unilateral superior. En otras palabras, se rechaza H 0 si
Ejemplo 3.1
Mas Sobre el Experimento de Resistencia a la Tensin
Para ilustrar el anlisis de variancia, volvamos al ejemplo que se abord por primera vez
en la Sec. 3-1. Recordemos que el ingeniero de desarrollo le interesa determinar si el
peso porcentual del algodn en una fibra sinttica afecta la resistencia a la tensin, y
para ello ha realizado un experimento completamente aleatorizado con cinco niveles de
porcentaje de algodn y cinco repeticiones. Por conveniencia, aqu se reproducen los
datos de la Tabla 3-1:
El anlisis de variancia se resume en la Tabla 3-4. Hay que notar que la media de
cuadrados entre tratamientos (118.941) es mucho mayor que la media de cuadrados
dentro de tratamientos (8.06). Esto indica que es improbable que las medias de
tratamientos sean iguales. Mas formalmente, es posible calcular la razn F, o sea
F o=118.94/8.06=14.76, y compararla con F ,4,20 Como F .01,4,20 = 4.43, debe rechazarse Ho
y concluir que las medias de tratamientos difieren; en otras palabras, el algodn en la
fibra afecta significativamente su resistencia media.
Una Advertencia Acerca de los Clculos: Seguramente el lector alerta habr notado
que aqu se defini la suma de cuadrados en trminos de promedios; esto es, a partir de
la Ecuacin 3-6,
pero que las frmulas para el clculo se dedujeron utilizando totales. Por ejemplo, para
calcular SS Tratamaientos emplearamos la Ecuacin 3-9:
Ejemplo 3.2
Codificacin de Observaciones. A menudo, los clculos del anlisis de variancia
pueden hacerse ms precisos o ser simplificados si se codifican los datos. Por ejemplo
consideremos los datos de la resistencia a la tensin en el Ejemplo 3-1. Supngase que
a cada observacin se le resta 15. Los datos codificados aparecen en la Tabla 3-5.
y
Al comparar estas sumas de cuadrados con las del Ejemplo 3-1, se observa que no
quedan afectadas si se resta una constante a los datos originales.
Ahora supongamos que se multiplica por 2 cada observacin del Ejemplo 3-1. Es fcil
verificar que las sumas de los cuadrados en los datos transformados son SS T =2547.84,
SS Tratamientos =1903.04, y SS E =644.80. A primera vista parece ser que hay mucha
diferencia entre estas sumas de cuadrados y las calculadas en el Ejemplo 3.1, Sin
embargo, si se las divide entre 4 (en otras palabras, 2 2), los resultados son idnticos.
Por ejemplo, para la suma de cuadrados de tratamiento, 1903.04/40=475.76. Por tanto,
para los datos codificados la razn F es F= (1903.04/4)/(644.80/20)=14.76, resultado
que es idntico al de los datos originales. De esta forma los anlisis de variancia
resultan ser equivalentes.
UNIDAD II
Sesin V: Diseo de Cuadrados Latinos
Sesin VI: Diseo de Bloques aleatorizados
completos
Sesin VII: Diseo de Bloques Aleatorios Incompletos
SESION V
DISEO DE CUADRADO LATINO
En un diseo de bloques completamente aleatorizados se desea controlar una sola fuente de
variacin local. Generalmente es necesario controlar ms de una fuente de variacin. Un diseo
de Cuadrados Latinos es muy similar a un diseo de bloques completamente aleatorizados, pero
con una fuente de variacin adicional.
En el tema anterior se introdujo el diseo aleatorizado por bloques completos como un diseo
para reducir el error de los residuos de experimento, al sustraer la variabilidad debida a las
unidades experimentales. Hay otros diseos que usan el principio de anlisis por bloques. Por
ejemplo, supongamos que un experimentador est estudiando el efecto de cinco formulas
diferentes de la mezcla de dinamita sobre la fuerza explosiva observada. Cada Formula se
prepara usando un lote de materia prima, lo suficientemente grande para solo se haga cinco
mezclas. Ms aun, las mezclas las preparan varios operadores, pudiendo existir una diferencia
sustancial en la habilidad y experiencia entre ellos. Al parecer hay dos efectos extraos que se
deben cancelar en el diseo: lotes de materia prima y operadores. El diseo apropiado para
este problema consiste, en probar, cada frmula exactamente una vez, utilizando cada lote de
materia prima, y en que cada formula sea preparada exactamente una vez por cada uno de cinco
operadores. El diseo que resulta aparece en la Tabla 5-9 y se llama diseo de cuadros latinos.
Hay que notar que este diseo es un arreglo cuadrado y que las cinco formulas (o tratamientos)
se representan mediante las letras latinas A, B, C, D y E. de ah el hombre de cuadrado latino.
Se observa que tanto los lotes de materia prima (renglones) como los operadores (columna) son
ortogonales a los tratamientos.
El diseo de cuadrado latino se usa para eliminar dos fuentes de variabilidad problemtica; en
otras palabras, permite analizar sistemticamente por bloques en dos direcciones. En este
diseo, los reglones y columnas representan, en realidad, dos restricciones a la aleatorizacin.
En general, un cuadrado latino para p factores, o un cuadrado latino p x p, es un cuadrado que
contiene p renglones y p columnas. Cada una de las p 2 celdas contiene una de las p letras que
corresponde a un tratamiento, y cada letra aparece una sola vez en cada regln y columna. A
continuacin, se presenta algunos ejemplos de cuadrados latinos.
Bajo la suposicin usual de que ijk es NID(0,2), cada una de las sumas de
cuadrados del miembro derecho de la Ecuacin 4-23 son, al dividir entre 2,
variables aleatorias independientes con distribucin ji cuadrada. El estadstico
apropiado para probar la igualdad de medias en los tratamientos
que tiene una distribucin Fp-1,(p-2)(p-1) si la hiptesis nula es verdadera. Es posible probar que no
existen efectos de reglones o de columnas si se toma la razn de MS Reglones y MSColumnas contra la
MSE. Sin embargo, posiblemente estas pruebas no sean apropiadas por que los reglones y las
columnas representan restricciones de aleatorizacin.
El procedimiento de clculo para el anlisis de variancia se muestra en la tabla 4-10. Al analizar
las frmulas para el clculo de la suma de cuadrados, puede observarse que este anlisis es una
simple extensin del diseo aleatorizado por bloques, con la suma de cuadrados de reglones
calculada usando a los totales por reglones.
Ejemplo
'
Considrese el problema de las formulas de la dinamita descrito anteriormente. Se supone que
tanto los lotes de materia prima como los operadores representan restricciones en la
aleatorizacin. El diseo para este experimento mostrado en la tabla 4-9 es un cuadrado latino 5
x 5. Despus de codificar las observaciones, restando 25, se obtuvieron los datos de la tabla 411. Las sumas de cuadrados para los totales, lotes (renglones) y operadores (columnas) se
calculan a continuacin.
Tabla 4-9. Las sumas de cuadrados para los totales, lotes o (renglones) y operadores (colum nas)
se calculan a continuacin.
En la Tabla 4-12 de datos codificado se resume el anlisis de variancia. Se concluye que existe
una diferencia significativa en la fuerza explosiva media debido a las cinco formulas diferentes.
Tambin hay una indicacin de diferencia entre los operadores, por lo tanto, controlar este
factor fue una buena precaucin. No existe una evidencia fuerte de que haya una diferencia entre
los lotes de materia prima, y al parecer, en este experimento hubo una inquietud innecesaria en
cuanto a esta fuente de variabilidad. Sin embargo controlar localmente los lotes de materia prima
siempre resulta adecuado.
El lector debe determinar los residuos del ejemplo y construir las grficas apropiadas.
PROBLEMA 1.
Un Ing. Qumico desea probar el efecto que tienen cuatro agentes qumicos sobre la resistencia
de un tipo particular de tela. Como puede haber variabilidad entre un rollo de tela y otro, decide
utilizar un diseo aleatorizado por bloques, considerando los rollos de tela como bloques. Ella
selecciona cinco rollos y les aplica los cuatro agentes qumicos en orden aleatorio. A
continuacin, se proporcionan los resultados de la resistencia a la tensin.
Se pide:
1.
Analice estos datos y haga las conclusiones apropiadas.
2.
Identificar los Elementos del experimento: variable dependiente, independiente y
variable respuesta, factores bloques, etc.
PROBLEMA 2.
Se encuentra bajo estudio el efecto que tiene cinco reactivos distintos (A, B, C, D y E) sobre el
tiempo de reaccin de un proceso qumico. Cada lote de material nuevo es lo suficientemente
grande para permitir que solo se realice cinco ensayos. Ms an, cada ensayo tarda,
aproximadamente, una hora y media, por lo que solo pueden realizarse cinco ensayos por das,
la investigadora decide efectuar el experimento usando un diseo de cuadrado latino, con el fin
de controlar sistemticamente las variables lote material y da. Ella recolecta los siguientes
datos. Analice y obtenga las conclusiones.
Un ingeniero industrial est investigando el efecto que tienen cuatro mtodos de ensamblaje (A,
B, C y D) sobre el tiempo de ensamblaje de un componente para televisores a color. Se
seleccionan cuatro operadores para realizar este estudio. Por otra parte, el ingeniero sabe que
cada mtodo de ensamblaje produce fatiga, por lo que el tiempo que se tarda en el ltimo
ensamblaje puede ser mayor que el primero, independientemente del mtodo. En otras palabras,
se produce un patrn en el tiempo de ensamblaje. Para controlar esta posible fuente de
variabilidad, el ingeniero utiliza el diseo de cuadrados latinos que aparece a continuacin.
Analice y haga las conclusiones apropiadas.
Lunes
N (124)
E (112)
S (123)
O (118)
C (102)
Mircoles
S (124)
C (100)
N (133)
E (112)
O (122)
Viernes
C (124)
N (130)
O (112)
S (133)
E (118)
Sbado
O (122)
S (131)
E (121)
C (124)
N (131)
Domingo
E (124)
O (114)
C (133)
N (134)
S (133)
SESION VI
BLOQUES ALEATORIZADOS
DISEO ALEATORIZADO POR BLOQUES COMPLETOS
Este es el ms simple y quizs el ampliamente usado de los diseos de bloques al azar que es
definido por Hinkelman (1994) as: El material experimental es dividido en a grupos
de b unidades experimentales (UE) cada uno, donde a es el nmero de tratamientos, tales que
las UE dentro de cada grupo son lo ms homognea posible y las diferencias entre las UE sea
dada por estar en diferentes grupos. Los conjuntos son llamados bloques. Dentro de cada bloque
las UE son asignadas aleatoriamente, cada tratamiento ocurre exactamente una vez en un
bloque.
La palabra "completo" Indica que todos los tratamientos puntas son probadas en cada bloque
(probetas). Si se usa este diseo, los bloques o probetas forman una unidad experimental ms
homognea con la cual comparar las y puntas. Esta estrategia de diseo mejora efectivamente la
precisin de las comparaciones al eliminar la variabilidad entre las probetas. El orden en que las
cuatro puntas deben ser probadas en cada bloque se determina aleatoriamente. Hay que notar la
similitud que hay entre este diseo y el presentado en el diseo comparacin por pares cuando
se discuti la prueba t de diferencias aparejadas. El diseo aleatorizado por bloques completos
es una generalizacin de aquel concepto.
Dicho diseo es quizs el diseo experimental ms ampliamente utilizado. En la prctica, las
situaciones en las que este diseo se aplica son muy numerosas y pueden detectarse
fcilmente. A menudo, las unidades de equipo de prueba o maquinaria son diferentes en sus
caractersticas de operacin y constituyen un factor tpico que es necesario controlar. Lotes de
materia prima, personas o tiempo, tambin constituyen fuentes de variabilidad en un
experimento, las cuales pueden ser controladas sistemticamente mediante el anlisis por
bloques
Anlisis Estadstico
Supongamos que en general se tienen a tratamientos (que deben ser comparados) y b bloques.
En la Fig. 4.1 aparece el diseo aleatorizado por bloques completos. Se realiza una observacin
por tratamiento en cada bloque, y el orden en que los tratamientos son medidos en cada bloque
se determina aleatoriamente. A menudo, se dice que los bloques representan una restriccin en
la aleatorizacin por que la nica aleatorizacin de los tratamientos ocurre dentro de los bloques.
El modelo estadstico para este diseo es:
.4-1
En donde es una media general, i, es el efecto del i-simo tratamiento, i, es el efecto del jsimo bloque y ij es el termino usual NID(0, 2) de error aleatorio. Inicialmente se considera
que tanto los tratamientos como los bloques son factores fijos. Ms aun, los efectos de
tratamiento y de bloque se consideran como desviaciones de la media general, por lo tanto
Se desea probar la igualdad de las medias de tratamiento. As, la hiptesis nula de inters es.
Como la media del i-simo tratamiento es 1 = (1/b)bi=1(++)= +ij una forma equivalente de
expresar las hiptesis anteriores es en trminos de los efectos de tratamiento.
Sea yi el total de las observaciones del tratamiento i, y.i, el total de las observaciones del bloque j,
y.. el total de todas las observaciones, y N = ab el nmero total de observaciones.
Matemticamente,
4-2
4-3
4-4
del tratamiento i, .. es el
promedio de todas las
.. 4-6
Al desarrollar el segundo miembro de la ecuacin 4-6, se obtiene
Despus de algunos pasos algebraicos simples pero tediosos, se comprueba que los tres
trminos que contienen productos cruzados son iguales a cero. Por lo tanto,
.. 4-7
Representa una descomposicin de la suma total de cuadrados. Expresando simblicamente.
Las sumas de cuadrados de la Ecuacin 4-7, se tiene
4-8
Ya que existen N observaciones, la SS T, tiene N - 1 grados de libertad. La SSTratamientos y la
SSBloques, tienen a - 1 y b - 1 grados de libertad, respectivamente, porque existen a tratamientos y
b bloques. La suma de cuadrados del error no es ms que la suma de cuadrados entre las
celdas, menos la suma de cuadrados de tratamiento y de bloque. Existen ab celdas con ab - 1
grados de libertad entre ellas, por lo tanto, SS E, tiene ab - 1 (a - 1) (b 1) grados de libertad.
Ms aun, la suma de los grados de libertad de los miembros del lado derecho de la Ecuacin 4-8
es igual a la de los miembros del factor Izquierdo. Entonces, usando la suposicin usual de
normalidad de los errores y el Teorema puede mostrarse que SS Tratamientos/2, SSBloques/2, y
SSE/2, son variables aleatorias independientes con distribuciones ji cuadrada. Cada suma de
cuadrados dividida entre sus grados de libertad es igual a una media de cuadrados.
Considerando que los; tratamientos y los bloques son fijos, puede mostrarse que los valores
esperados de las medias de cuadrados son:
Por lo tanto, para probar la igualdad en las medias de tratamiento, hay que usar la estadstica
que tiene una distribucin F ,a-1,(a-1)(b-1) si la hiptesis nula es verdadera. La regin critica es el
extremo superior de la distribucin F y se debera rechazar H o si Fo > F,a-1,(a-1)(b-1).
Tambin puede ser de inters la comparacin entre las medias de los bloques, porque si no hay
gran diferencia entre ellas, el anlisis por bloques quizs no sea necesario en experimentos
futuros. Al analizar los valores esperados de las medias de cuadrados, puede parecer que la
hiptesis Ho: i = 0 puede probarse comparando la estadstica Fo = con F, a-1,(a-1)(b-1).
Sin embargo, debe recordarse que la aleatorizacin fue aplicada solo a los tratamientos dentro
de los bloques; en otras palabras, estos ltimos representan una restriccin para la
aleatorizacin. Qu efecto tiene esto sobre la estadstica F o = MSBloques/MSE? Existen diferentes
respuestas a esta pregunta. Por ejemplo. Box. Hunter y Hunter (1978) argumentan que la prueba
F del anlisis de variancia puede justificarse solamente con base en la aleatorizacin sin
necesidad de usar a su posicin de normalidad. Ellos concluyen que la prueba para comparar
bloques no puede ser incluida bajo este argumento a consecuencia de la restriccin de
aleatorizacin; pero que si los errores son NID(O, 2) la estadstica Fo = MSBloques/MSE, puede
usarse para comparar las medias de bloques.
Tabla 4-2. Anlisis de variancia para un diseo aleatorizado por bloques completos
Por otra parte. Anderson y McLean (1974) argumentan que la restriccin de aleatorizacin
impide que esta estadstica pueda ser til para comparar las medias de los bloques y que la
estadstica F, en realidad, es una prueba para la igualdad de las medias de los bloques ms
la restriccin de aleatorizacin a la que llaman error de restriccin; consltense Anderson y
4-11
Ejemplo 1
Considerar el experimento sobre la lectura de la dureza descrita en la Secc.
Hay cuatro puntas y estn disponibles cuatro probetas de metal. Cada
es probada una vez en cada probeta, resultando un diseo aleatorizado por
bloques completos. Recordar en el orden en que se prueban las puntas
una probeta en particular se determina aleatoriamente.
4-1.
punta
sobre
Para simplificar los clculos, se codifican los datos originales restando 9.5 de cada observacin
y multiplicando despus por 10.
Puesto que F0.05,3,12 = 3.49, no puede rechazarse la hiptesis de la igualdad de las mediciones de
la dureza media de las cuatro puntas. Por lo tanto, el diseo de bloques aleatorizados reduce lo
suficiente la cantidad de ruido en los datos para que las diferencias entre las cuatro puntas sean
detectadas. Esto ilustra un punto muy importante. Si un experimentador no recurre a la formacin
de bloques cuando debera haberlo hecho, el efecto puede ser inflar el error experimental a tal
grado que las diferencias importantes entre las medias de los tratamientos sean indetectables.
Desarrollar el ejercicio propuesto
1. Supongamos que queremos determinar si cuatro laboratorios miden la misma resistencia
caracterstica del hormign a compresin. Para ello se han considerado 5 amasadas
diferentes que han sido analizadas por cada uno de los laboratorios. A los 28 das, se han
roto las probetas a compresin simple y los resultados son los que hemos recogido en la
tabla que sigue.
en donde yij, es el total del i-esimo bloque. La SS Bloques, tiene b - 1 grados de libertad. La suma
de cuadrados de tratamiento corregida (o ajustada) es
4-29
con nij = 1 Si el tratamiento i ocurre en el bloque j, y n ij = 0 en otro caso. Por lo tanto. (1/k).n ijy.j
es el promedio de los totales de los bloques en los que se aplica el tratamiento i. La suma de los
totales de tratamiento corregidos siempre ser cero. La SS Tratamientos(ajustados) tiene a -1 grados de
libertad. La suma de cuadrados del error se calcula por diferencia y tiene N - a - b + 1 grados de
libertad.
4-31
Ejemplo 5-1
Considrese los datos de la Tabla 4-23 para el experimento de los catalizadores. Este es un diseo balanceado por bloques incompletos con a = 4, b = 4, k = 3, r = 3, = 2 y N = 12.
Para calcular la suma de cuadrados de tratamientos corregida que tome en cuenta los bloques,
primero hay que determinar los totales de tratamientos corregidos usando la Ecuacin 4-30
El anlisis de variancia se muestra en la Tabla 5-3. Como F o > F0.05,3,5 = 5.41, se concluye que el
catalizador empleado tiene un efecto significativo sobre el tiempo de reaccin.
SESION IX
La optimizacin por diseos experimentales de acuerdo a un esquema del mbito del diseo
experimental, es posible distinguir dos grandes rutas excluyentes entre s.
1. Los DISEOS DINAMICOS, que son factoriales secuenciales, entre ellos el EVOP, SSEVOP
y que son pequeas variaciones en el rango de las variables para lograr mejorar resultados
sucesivamente iniciando de un simplejo o prueba con variables codificadas en un tringulo
Descarta en una vez la peor respuesta siguiendo la ruta contrapuesta conformando
nuevamente otro simplejo y as avanzando hasta una respuesta mejorada paulatinamente
(normalmente la secuencia termina en una figura poligonal cerrada) Para lograr resultados
favorables es necesario que la materia prima sea constante, equivalente en mineral a que la
ley de cabeza sea constante y ello es difcil de lograr generalmente.
2. Los DISEOS ESTATICOS que se usan en laboratorio o en escala de pilotaje, en este
esquema del Diseo esttico se distinguen dos grandes etapas recomendablemente
Donde:
Vcod = es el valor codificado
Vreal = valor de la variable en unidades reales elegidas
Valor Central = el centro del rango real elegido
Radio = distancia en el rango del centro a un extremo en valor real.
Se reconoce una plantilla porque cada columna correspondiente a cada variable suma
siempre CERO. El anexo II muestra plantillas de diseos a los que nos estamos refiriendo.
PLANTILLAS MAS CONOCIDAS EN LA SELECCIN DE VARIABLES
En el caso de un diseo factorial 2n, es econmico usarlo solo hasta 3 variables con un mximo de 8
pruebas, constituyndose una plantilla en variable codificada del siguiente modo
Para 2 variables.
Variable
X1
X2
Rango
< 6 - 12 >
<3-7>
Central
9
5
Los rangos reales elegidos al ser codificados serian -1, 0, +1 para el rango mnimo, valor central y valor
mximo respectivamente en cada una de las variables. Despus, un juego de experimentos 22 tendra 4
pruebas, cuya secuencia y orden seria:
Prueba
1
2
3
4
X1
+
+
X2
+
+
Se confecciona intercalando en la primera columna valores -1 y +1; para la otra columna se hace el doble
de la anterior y as sucesivamente hasta, completar el nmero de, pruebas indique el diseo 2 en n.
X1
+
+
+
+
X2
+
+
+
+
X3
+
+
+
+
Si:
X1 = A
X2 = B
X3 = C
Existe una manera de representar estas plantillas con solo letras minsculas figurando la
correspondiente en la prueba en que la variable participa con signo +. En caso contrario se entiende que
participa con el valor mnimo del rango
Por lo tanto:
1
(1)
2
A
3
ab
4
ab
5
c
6
Ac
7
bc
8
abc
El termino (1) indica que todas las variables participan con el rango mnimo.
Cuando son ms de cuatro variables se usan diseos factoriales fraccionados para evitar hacer un
mayor nmero de pruebas:
Prueba
X1
X2
X3
X4
1
2
3
4
5
6
7
8
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
Para 5 variables.
El factorial 25 = 32 pruebas se fracciona en un diseo fraccionado (1/4 (2) 5) = 8 pruebas, cuya plantilla es
la-que sigue:
Prueb
a
1
2
3
4
5
6
7
8
X1
X2
X3
X4
X5
+
+
+
+
-
+
+
+
+
-
+
+
+
+
-
+
+
+
+
-
+
+
+
+
-
X1
+1
+1
+1
-1
+1
-1
-1
-1
X2
+1
+1
-1
+1
-1
-1
+1
-1
X3
+1
-1
+1
-1
-1
+1
+1
-1
X3
-1
+1
X4
+1
+1
X4
-1
+1
-1
-1
+1
+1
+1
-1
X5
+1
+1
X5
+1
-1
-1
+1
+1
+1
-1
-1
X6
+1
-1
X6
-1
-1
+1
+1
+1
-1
+1
-1
X7
-1
-1
X7
-1
+1
+1
+1
-1
+1
-1
-1
X8
-1
-1
X9
-1
+1
3
4
5
6
7
8
9
10
11
12
-1
+1
+1
+1
-1
-1
-1
+1
-1
-1
+1
+1
+1
-1
-1
-1
+1
-1
+1
-1
+1
+1
-1
-1
-1
+1
-1
+1
+1
-1
+1
-1
-1
-1
+1
-1
+1
+1
-1
-1
-1
-1
-1
+1
-1
+1
+1
-1
+1
-1
-1
-1
+1
-1
+1
+1
-1
+1
+1
-1
-1
+1
-1
+1
+1
-1
+1
+1
+1
-1
+1
-1
+1
+1
-1
+1
+1
+1
-1
-1
-1
+1
+1
-1
+1
+1
+1
-1
-1
-1
X4
+1
+1
+1
-1
-1
-1
+1
-1
+1
+1
-1
-1
X5
+1
+1
-1
-1
-1
+1
-1
+1
+1
-1
+1
-1
X6
+1
-1
-1
-1
+1
-1
+1
+1
-1
+1
+1
-1
X7
-1
-1
-1
+1
-1
+1
+1
-1
+1
+1
+1
-1
X8
-1
-1
+1
-1
+1
+1
-1
+1
+1
+1
-1
-1
X9
-1
+1
-1
+1
+1
-1
+1
+1
+1
-1
-1
-1
X10
+1
-1
+1
+1
-1
+1
+1
+1
-1
-1
-1
-1
X11
-1
+1
+1
-1
+1
+1
+1
-1
-1
-1
+1
-1
DISEO FACTORIAL 2k
Los diseos factoriales son ampliamente utilizados en experimentos en los que intervienen varios
factores para estudiar el efecto conjunto de estos sobre una respuesta. Sin embargo, existen
varios casos especiales del diseo factorial general que resultan importantes porque se usan
ampliamente en el trabajo de investigacin, y porque constituyen la base para otros diseos
de gran valor practico.
El ms importante de estos casos especiales ocurre cuando se tienen k factores, cada uno con
dos niveles. Estos niveles pueden ser cuantitativos como sera el caso de dos valores de
temperatura, presin o tiempo. Tambin pueden ser cualitativos como sera el caso de dos
mquinas, dos operadores, los niveles "superior a "inferior" de un factor o, quizs, la ausencia o
presencia de un factor. Una rplica completa de tal diseo requiere que se recopilen 2 x 2
x..... x 2 = 2k observaciones y se conoce como diseo factorial 2k. El segundo caso especial es el
de k factores con tres niveles cada uno, conocido como diseo factorial 3 k.
En este captulo se presentan mtodos especiales para el anlisis de estas dos tiles series de
diseos Se supone. 1) que los factores son fijos. 2) que los diseos son completamente aleatorizados, y 3) que se satisface la suposicin usual de normalidad.
El diseo 2k es particularmente til en las primeras fases del trabajo experimental, cuando es
probable que haya muchos factores por investigar. Conlleva el menor nmero de corridas con los
cuales pueden estudiarse k factores en un diseo factorial completo. Debido a que solo hay
dos niveles para cada factor, debe suponerse que la respuesta es aproximadamente lineal en
el intervalo de los niveles elegidos de los factores.
Como Diseo Factorial se entiende a todas las posibles combinaciones: de los niveles de los factores en
cada prueba completa o replica investigada. Los niveles son los diferentes valores que pueden tomar las
variables. Si se considera dos niveles, el diseo se denomina Diseo Factorial a dos niveles, o diseo
factorial 2n, el cual se emplea en el presente trabajo, por lo que detallaremos este modelo.
El nmero necesario de pruebas a realizar viene definido por la relacin:
COMBINACIN
PUNTO
N
n
N
X1
+
+
1
2
3
4
X2
+
+
= 2n ..2
Donde:
= Numero de variables.
= Nmero de experimentos.
DISEO FACTORIAL 22
SIMPLE
Se estudian dos factores a dos niveles (22 = 4), con sus combinaciones respectivas:
Se quiere evaluar de una manera directa cul de los factores tiene mayor significancia
(influencia) en un proceso y si estos interactan (uno depende del otro) entre s.
Ejemplo 1 se estudian dos factores (concentracin y temperatura) a dos niveles
Factores
A: Concentracin (%)
B: Temperatura (C)
Niveles
5
35
10
70
Para evaluar cualquier proceso de una manera directa deber desarrollarse los siguientes pasos.
Primero: visualizamos los valores numricos de los niveles y establecemos si existe interaccin
entre los valores de los diferentes factores,
Prueba
A
B
Y
1
5
35
39.3
5 1010
35
70
2
35
40.9
5
70
40.0
Vemos que no existe 3
interseccin con los
10
70
41.5
valores numricos, sin 4
importar la magnitud
de cada uno de ellos, por lo tanto en el anlisis resultara que no existe interaccin.
Nota: Con este anlisis preliminar no establecemos la direccin de la mxima, ni tampoco la
orientacin de cada variable.
Segundo: Analizamos los efectos de los factores principales a fin de direccionar la orientacin de
la ptima y la influencia de estos en el proceso, se desarrolla el clculo de los efectos con la
siguiente relacin:
Calculo de efectos:
Grficamente podemos visualizar que el efecto medio del vector respuesta nos indica que en el
orden de mayor significancia est el factor de concentracin, seguido de la temperatura (por la
pendiente ms pronunciada).
En este caso solamente estamos evaluando y no as optimizando, para desarrollar la
optimizacin deber seguirse otro camino, el cual ser desarrollado en el prximo acpite.
Nota: Anlisis de signos de los coeficientes de los efectos, segn el caso:
a)
(+)
Caso Maximizacin:
Indica que la variable se encuentra al nivel mnimo y (+) debe ser maximizado hasta el
ptimo y establecer su rango de trabajo.
(-)
Indica, que el factor ya no es una variable, por lo tanto viene a ser una constante en el
proceso, por lo que se encuentra en el nivel mximo y debe mantenerse como tal.
b)
Caso Minimizacin
Indica que el factor ya no es una variable, por lo tanto viene a ser una constante en el
proceso por lo que se encuentra en el nivel mximo y debe mantenerse como tal.
(+)
(-)
Indica que la variable se encuentra al nivel mnimo y debe ser maximizado hasta el ptimo
y establecer, su rango de trabajo.
Tercero: a fin de ver la influencia de los factores, se analiza la interaccin de los factores, quiere
decir si, existe cruce de informacin entre los factores y a la vez estos puedan controlarse de
una manera independiente a fin de manipular el proceso.
Interpretacin de la interaccin:
Notamos que el signo de la interaccin AB es negativo, esto nos indica que no existe
interaccin, lo cual lo hemos deducido al visualizar que no existe interseccin entre los valores
numricos, por lo tanto no existe significancia entre los factores en estudio.
Nota: Anlisis de signos de los coeficientes de las interacciones, segn el caso:
a)
(+)
(-)
Caso Maximizacin:
Indica que si existe interaccin entre las variables, uno depende del otro.
Indica que no existe interaccin entre las variables.
b)
(+)
(-)
Caso Minimizacin:
Indica que no existe interaccin entre las variables.
Indica que si existe interaccin entre las variables, uno depende del otro.
Como notara en este tipo de diseo no se han corrido pruebas centrales, en este caso se asume
que la interaccin representa el error acumulativo del proceso desarrollado, siempre y cuando
no exista interaccin o que el valor de significancia sea muy pequeo.
Para corroborar los anlisis desarrollados es que aplicamos el Anlisis de Varianza del proceso
(ANAVA, ANOVA, ANVA).
Para desarrollar la Suma de Cuadrados de los factores e Interacciones se deber desarrollar la
siguiente relacin:
La suma de cuadrados del total nos sirve para comprobar que los valores: suma de cuadrados
de los factores e interacciones, ms el error deben ser igual a dicho valor numrico.
Tal como se visualiza en el presente ejemplo, en donde se asume que el error experimental es
la interaccin por no ser significativo dentro del proceso.
El valor de F de tabla para un 95% de significancia es 161, vemos que el F-Ratio de los factores
principales son mayores por lo tanto ambos factores son significativos, por lo que corroboramos
que los efectos principales estn en su mnimo debiendo ser maximizados y a la vez son
variables en el proceso.
Siendo el modelo matemtico para el presente anlisis:
Caso Maximizacin:
Indica que dicho valor es el inicio del proceso y se encuentra en su mnimo y debe ser
maximizado hasta el ptimo.
Indica que es el mximo valor del vector respuesta, no se puede subir sobre dicho valor,
ms al contrario se puede bajar.
Caso Minimizacin
Indica que es el mximo valor del vector respuesta, no se puede subir sobre dicho valor,
ms al contrario se puede bajar.
Indica que dicho valor es el inicio del proceso y se encuentra en su mnimo y debe ser
maximizado hasta el ptimo.
En el modelo matemtico tambin podemos visualizar que la interaccin es negativa, o sea que no
tiene influencia en el proceso. Adems podemos visualizar que los factores principales son
positivos tal como se visualiz en el anlisis de los factores principales.
Interpretacin del modelo matemtico:
Si la concentracin y la temperatura son iguales a cero, entonces el modelo ser igual a la
constante, si visualizamos el signo de dicha constante notamos que es positivo, lo cual nos indica
que est en su mnimo y puede maximizarse. Notamos que la pendiente de la concentracin es
mayor que el de la temperatura, por lo tanto la concentracin es ms significativa que la
temperatura.
El punto ptimo del presente proceso viene establecido por la tendencia de la hiptesis planteada
en un principio, siendo estos que estn en el mnimo debiendo maximizarse, sea que son
variables y su tendencia es subir de nivel y avanzar al mximo, obtenindose un valor ptimo de
41,5 en l vector respuesta.
En el grfico podemos visualizar que no existe interaccin de los factores en el proceso por lo que
cada variable es independiente.
Nota: Es importante que no exista interaccin, y de esa manera podamos trabajar con los factores
principales.
La superficie respuesta nos indica que las pendientes son negativas por lo que visualizando el
grfico (isolineas), podemos interpretar lo siguiente: el valor ptimo de 41,5 est a una
concentracin de 10 y una Temperatura de 70.
La superficie respuesta a nivel espacial nos muestra la forma en que estn ubicados los puntos
experimentales, as mismo la direccin en la cual se orienta el proceso.
Notamos que la zona de mayor recuperacin se ubica a la mxima concentracin y temperatura.
En la Figura 6-1 se presentan grficamente las combinaciones de tratamientos para este diseo.
Por convencin, el efecto de un factor se denota por la letra latina mayscula. De este modo, "A"
se refiere al efecto del factor A, "B" se refiere al efecto del factor B, y "AB" se refiere a la
interaccin AB. En el diseo 22, los niveles bajo y alto de A y B se denotan por -" y "+ ", respectivamente, en los ejes A y B. As, (-) en el eje A representa el nivel bajo de concentracin
(15%), mientras que (+) representa el nivel alto (25%), y (-) en el eje B representa el nivel bajo de
catalizador mientras que (+) denota el nivel alto.
Las cuatro combinaciones de tratamientos en el diseo suelen representarse por letras
minsculas, como se muestra en la Fig. 6-1. En esta figura se aprecia que el nivel superior de
cualquier factor de una combinacin de tratamientos est representado por la presencia de la letra
minscula correspondiente, mientras que la ausencia de esta ltima representa el nivel inferior del
factor. As a representa la combinacin de tratamientos, en la que A se encuentra en el nivel
superior y B en el inferior; b representa aquella en la que A se halla en el nivel inferior y B en el
superior, y ab representa a ambos factores en el nivel superior. Por convencin (1) se usa para
representar a ambos factores en el nivel inferior. Esta notacin se usara a lo largo de toda la serie
2k.
El efecto promedio de un factor se define como el cambio en la respuesta producida por un
cambio en el nivel de ese factor, promediado sobre los niveles del otro factor. Como se ilustra en la
Figura 6-1, las letras minsculos (1), a, b y ab tambin se usan para representar los totales de las
El efecto de A en el nivel inferior de B es [a -(1) ]/n, mientras que en el nivel superior de B es [ab
-b]/n.
Tomando el promedio de estas dos cantidades se obtiene
6-1
El efecto promedio de B se determina a partir de su efecto en el nivel inferior de A (esto es [b (1)]/n, y de su efecto en el nivel superior de A (que es igual a [ab a]/n) obtenindose
6-2
El efecto de interaccin AB se define como la diferencia promedio entre el efecto de A en el nivel
superior de B y su efecto en el nivel inferior de B. As,
6-3
Por otro lado se puede definir AB como la diferencia promedio entre el efecto de B en el nivel
superior de A y el efecto de B en el nivel inferior de A. Esto conduce a la misma Ecuacin 6-3.
Las frmulas para los efectos de A, B y AB pueden deducirse por otro mtodo. El efecto de A
puede hallarse como la diferencia en la respuesta promedio de las dos combinaciones de tratamientos en la mitad derecha de la Fig. 6-1 (que llamaremos A+, puesto que es la respuesta promedio para, las combinaciones de tratamientos a las que A se encuentra en el nivel alto) y las dos
combinaciones de tratamientos en la mitad izquierda (o A-). Esto es,
Este es exactamente el mismo resultado que en la Ecuacin 6-1. El efecto de B (Ecuacin 6-2) se
encuentra como la diferencia mire el promedio de las dos combinaciones de tratamientos en la
parte superior del cuadrado ( B+) y el promedio de las dos combinaciones de tratamiento en la
parte inferior ( B-), 0
El efecto de A (concentracin de reactivo) es positivo esto sugiere que elevar A del nivel bajo
6-8
al utilizar SSA, SSB y SSAB de la ecuacin 6-8. En la tabla 6-1 se resume el anlisis de varianza
completo. Con base en los valores P, se concluye que los efectos principales son
estadsticamente significativos al 1% y que no hay interaccin entre estos factores. Esto confirma
la interpretacin de los datos que se hizo originalmente con base en las magnitudes de los efectos
de los factores.
Con frecuencia resulta conveniente escribir las combinaciones de los tratamientos en el orden (1),
a, b, ab. Se hace referencia a esto como el orden estndar (u orden de Yates, por el Dr. Frank
yates). Al utilizar este orden estndar, se observa que los coeficientes de los contrastes usados
para estimar los efectos son
Observe que los coeficientes de los contrastes par estimar el efecto de la interaccin son solo el
producto de los coeficientes correspondientes de los dos efectos principales. El coeficiente de un
contraste es siempre +1 o -1, y puede usarse una tabla de signos positivos y negativos como la
tabla 6-2 para determinar el signo correcto para cada combinacin de tratamientos. Los
encabezados de las columnas de la tabla 6-2 son los efectos principales (A y B), la interaccin AB
e I, que representa el total o promedio del experimento completo. Obsrvese que la columna que
corresponde a I incluye nicamente signos positivos. Las etiquetas de los reglones son las
combinaciones de los tratamientos. Para encontrar el contraste para estimar cualquier efecto,
simplemente se multiplican los signos de la columna apropiada de la tabla por la combinacin de
tratamientos correspondientes y se hace la suma. Por ejemplo, para estima A, el contraste es (1)
+ a b + ab, que concuerda con la ecuacin 6-1.
El modelo de regresin
En el diseo factorial 2k es sencillo expresar los resultados del experimento en trminos de un
modelo de regresin. Puesto que 2k es tan slo un diseo factorial, podra usarse un modelo de
los efectos o del as medias, pero el enfoque del modelo de regresin es mucho ms natural e
intuitivo.
Donde x1 es una variable codificada que representa la concentracin del reactivo y x 2 es una
variable codificada que representa la cantidad del catalizador y las son los coeficientes de
regresin. La relacin entre las variables naturales la concentracin del reactivo y la cantidad de
catalizador y las variables codificadas es
Cuando las variables naturales slo tienen dos niveles, esta codificacin producir la familiar
notacin para los niveles de las variables codificadas. Para ilustras esto en el ejemplo, observe
que
Por tanto, si la concentracin est en el nivel alto (Concentracin = 25%), entonces x 1 = +1; si la
concentracin est en el nivel bajo (Concentracin = 15%), entonces x1 = -1. Adems,
Por tanto, si el catalizador estas en el nivel alto (Catalizador = 2 libras), entonces x 2 = +1; si el
catalizador est en el nivel bajo (Catalizador = 1 libra), entonces x2 = -1.
El modelo de regresin ajustado es
Como consecuencia, los coeficientes del modelo matemtico son definidos como el producto escalar de
la columna Y por la respectiva columna X1, dividida entre el nmero de experimentos (N) del diseo:
6-15
Otra relacin importante, resulta de comparar las ecuaciones 5.5 con 15 de lo cual resulta:
6-16
Utilizando la ltima relacin procedemos a calcular los coeficientes de modelo lineal
Por lo tanto, el modelo matemtico en escala codificada sin considerar la interaccin X1X2, que
Podemos hacer en este punto un anlisis de residuos, es decir, saber cuan distanciados estn las
predicciones de los valores iniciales mediante la diferencia (Y- Yest.) denotado comnmente como ei.
Con estos elementos podemos calcular la suma de cuadrados de residual del modelo, mediante la
siguiente ecuacin:
18
Donde:
Y = Yest.
Y = Yobservado
Nr = Nmero total de experimentos
I = Numero de parmetros del modelo matemtico.
La diferencia (Nr- I) se denomina grados de libertad del residual, el cual denotaremos como f4.
Aplicando la ecuacin 18 a los datos de la ltima tabla:
Ahora bien, para saber estadsticamente si el modelo matemtico hallado representa adecuadamente a
los datos experimentales mediante el test F.
20
Donde:
Donde:
Zj
Zj
EL DISEO 23
Suponga que se encuentran en estudio tres factores A, B y C, cada uno con dos niveles. Este diseo se
conoce como diseo factorial 23, y las ocho combinaciones de tratamientos pueden representarse
grficamente mediante un cubo, tal como se muestra en la Fig 6-4a. El orden estndar de las
combinaciones de tratamientos seria (1), a, b, ab, c, ac, bc y abc. Se debe recordar que las letras
minsculas tambin representan los totales de la n observaciones recopiladas bajo la combinacin
particular de tratamientos.
Existen en realidad tres notaciones distintas que se usan ampliamente para las corridas o ejecuciones en
el diseo 2k. La primera es la notacin "+, -", a menudo llamada "notacin geomtrica". La segunda
consiste en el uso de letras minsculas para identificar las combinaciones de tratamientos. En la tercera
notacin se utilizan los dgitos 1 y 0 para denotar los niveles alto y bajo del factor, respectivamente, en %
es de los signos + y -. Estas distintas notaciones se ilustran enseguida para el diseo 23
Existen siete grados de libertad entre las ocho combinaciones de tratamientos en el diseo 2 3. Tres de
esos grados de libertad se asocian con los principales efectos de A, B y C. Cuatro se asocian con
interacciones (AB, AC, BC y ABC), uno para cada una.
Consideremos que se estiman los efectos principales, primeramente el de A. El efecto de A cuando B y C
estn en el nivel bajo es [a - (1)]/n. De modo similar, el efecto de A cuando B est en el nivel alto y C en el
bajo es [ab - b]/n. El efecto de A cuando C est en el nivel alto
y B en el bajo es [ac - c]/n. Por ltimo, el efecto de A cuando B y C estn ambos en el nivel alto es [abcbc]/n. De este modo, el efecto promedio de A es simplemente el promedio de estos cuatro efectos, o sea.
Esta ecuacin tambin puede deducirse como un contraste entre las cuatro combinaciones de
tratamientos en la cara derecha del cubo de la Fig. 9-4a (donde A se halla en el nivel alto) y las cuatro de
la izquierda (donde A se encuentra en el nivel bajo). Es decir, el efecto de A es simplemente el promedio
de las cuatro corridas en que A se encuentra en el nivel alto A+ menos el promedio de las cuatro corridas
en que A esta en el nivel bajo A- , o
El efecto de C es un contraste entre las cuatro combinaciones de tratamientos en la cara superior del
cubo y las de la cara inferior; esto es
Los efectos de la interaccin de dos factores pueden calcularse fcilmente. Una media de la interaccin
AB es la diferencia entre los efectos promedio de A a los dos niveles de B. Por convencin, la mitad de
esta diferencia se denomina interaccin AB. En trminos matemticos,
De esta forma es fcil ver que la interaccin AB es la diferencia de promedios entre corridas en dos
planos diagonales del cubo de la Fig. 9-4. Aplicando un razonamiento similar y haciendo referencia a la
Fig. 9-4b, las interacciones AC y BC son
La interaccin ABC se define como la diferencia promedio entre la interaccin AB para dos niveles
distintos de C. De este modo,
Como antes, la interaccin ABC puede considerarse la diferencia de dos promedios. Si las corridas de
los dos promedios se aslan, definen los vrtices de los dos tetraedros que comprenden el cubo de la Fig.
9-4c.
En las Ecuaciones 1 al 7, las cantidades entre parntesis son contrastes entre las combinaciones de
tratamientos. En la Tabla 9-3 aparece una tabla de signos positivos y negativos desarrollada a partir de
las constantes de los contrastes. Los signos de los efectos principales se determinan asignando un signo
positivo con el nivel superior y uno negativo con el inferior. Una vez que se han establecido estos signos,
los de las columnas restantes pueden obtenerse multiplicando rengln por rengln las columnas
apropiadas que le preceden. Por ejemplo, los signos de la columna AB corresponden al producto de los
signos de las columnas A y B en cada uno de los renglones. Fcilmente se puede determinan el
contraste de cualquier efecto a partir de esta tabla.
La Tabla 9-3 tiene algunas propiedades interesantes.
1) Excepto por la columna cada columna tiene un nmero igual de signos positivos v negativos.
2) La suma de los productos de los signos de cualquier par de columnas siempre es cero.
3) El producto de la columna por cualquier otra columna dela a dicha columna sin cambios. En otras
palabras, es el elemento de identidad.
4) El producto de cualquier par de columnas produce otra columna que pertenece a la tabla. Por
ejemplo, A x B = AB, y
Es posible apreciar que los exponentes de los productos se forman usando aritmtica. mdulo 2
(el exponente solo puede ser cero o uno; si es mayor que uno se reduce mediante mltiplos de
dos hasta que sea cero o uno). Todas estas propiedades son consecuencia de la ortogonalidad
de los contrastes usados para estimar los efectos.
Fcilmente se puede determinar las sumas de cuadrados de los efectos, porque a cada una le
corresponde un contraste de un solo grado de libertad. En el diseo 2 3 con n replicas, la suma de
cuadrados de cualquier efecto es
Ejemplo N 1
Un ingeniero est interesado en el efecto que tiene la rapidez de corte X 1, la configuracin X2 y el
ngulo de corte X3 sobre la duracin de una herramienta. Se eligen dos niveles de cada factor y
se realiza un diseo 23 con tres replicas. Los resultados se muestran a continuacin. Analice los
datos de este experimento.
a) Estime los efectos de los factores. Cules de esos efectos resultan ser mayores?
b) Utilice el anlisis de variancia a fin de confirmar sus conclusiones para en caso (a).
c) Analice el modelo matemtico obtenido.
d) Cules de los niveles de X1, X2 y X3 recomendara el lector?
Solucin.
La matriz de variables independientes se muestra en la siguiente tabla. Como se mencion
anteriormente, la formula matricial ecuacin 7 es muy cmodo para hallar los efectos y ayuda
al anlisis de variancia. La parte inferior de la tabla muestra el producto de la matriz [X] T[Y]
seguidamente el efecto a cada variable correspondiente a la columna indicada. Los efectos de
las variables e interacciones estn divididas entre 12 ((N/2)r =(8/2)*3 = 12).
El valor de F es tabulado pare un nivel de significancia del 99% y para f 1=1 y f2=16 tenemos:
Por lo tanto podemos hacer las siguientes conclusiones:
a) La variable X2 (la configuracin) y X 3 (ngulo de corte) resultaron significativas al 1 % por lo
que la variacin del rival inferior al rival superior elevan significativamente en la duracin
de la herramienta, especialmente la configuracin de corte (X 2).
b) La interaccin es X 1X3 tambin resultaron significativas. En esta parte es importante notar
que la variable X1 (rapidez de corte) por s misma no es significativa pero solo es
conjuntamente con X3; esto significa que la rapidez de corte si es significativo y que
depende de ngulo de corte. Como en el problema se analiza la duracin de la herramienta
de corte, aparentemente la rapidez de corte no le afecta individualmente, pero si se cambia
de ngulo de corte la herramienta en mencin podra fallar y disminuir su duracin.
La suma de cuadrado medio del error es 30.3 con 16 grados de libertad. As el valor de F o es:
Comparando Fo, con el F de tabla a un nivel de significancia de 0.05, 19 y 16 grados de libertad,
respectivamente, (Ftabla = 2.28). Lo que significa que el modelo matemtico hallado ajusta o
representa adecuadamente al fenmeno.
Para poder visualizar el modelo matemtico, procedemos a hacer un corte pare X 2 = 0,
obteniendo
SESIN XI
21
Donde:
SSE = Suma de cuadrados del error
Yo = Replicas en el punto central del diseo
no = Numero de rplicas en el centro del diseo.
Y = Promedio de todas las rplicas.
La suma de cuadrados para la curvatura este dada por:
22
Donde:
Yo = Promedio de los puntos exteriores del diseo
Ejemplo 1
Un ingeniero qumico se encuentra estudiando el rendimiento de un proceso. Existen dos variables de
inters, tiempo y temperatura de reaccin. Debido a que tiene duda de la suposicin de la linealidad en
la regin que explore, ella decide realizar un diseo 2 2 (con una Sola replica en cada corrida)
aumentada con cinco puntos centrales. El diseo y los datos de rendimiento se muestran en figura 2.
Fig. 2
En la matriz de variables independientes que se muestra en la siguiente tabla, ntese que los puntos
replicados en el centro del diseo no entran en el clculo de los efectos e interacciones, pero si para
hallar la suma de cuadrados del error.
Fig. 3
SESION XII
DISEO FACCTORIAL FRACCIONADO
Los diseos factoriales simples requieren cantidades excesivas de tiempo, material, conviene encontrar
otros diseos que requieran menores pruebas de diseo, pero que no desdear una gran cantidad de
informacin sobre la naturaleza del vector respuesta que se expresa con los experimentos.
Los diseos factoriales fraccionados permiten lograr este objetivo. Si se est dispuesto a conformarse con
una investigacin algo menos completa, incluyendo los efectos principales y las interacciones de dos
factores y excluyendo los efectos de tres factores o interacciones de alto orden.
Los diseos factoriales fraccionadas se usan principalmente para la depuracin o seleccin, es decir, para
identificar la variable ms importante que influye en la respuesta.
En cualquier diseo que utilice menos pruebas de los que requiera uno de tipo factorial completo, se
tendrn los mismos efectos de confusin.
Por ejemplo, un efecto principal se puede confundir con uno o ms efectos de interaccin de alto orden,
esto es, la estadstica que mide un ejemplo principal puede ser igual a la estadstica que determina
algunos de los efectos de las interacciones. Por lo tanto, la estadstica en cuestin puede indicar que
existe algn efecto, pero no sealar si est presente el efecto principal, el de interaccin o alguna
combinacin aditiva de efectos.
Todos los diseos, proporcionan estimaciones confusas. Por ejemplo, si los efectos cuadrticos y cbicos,
se confunden las estimaciones de la media y los efectos principales, respectivamente, siempre que no
emplee un diseo factorial de dos niveles, las tendencias y otros efectos confunden las estimaciones.
Cualquier fenmeno emitido en un modelo ajustado confunde ciertos parmetros estimados en el modelo,
sea cual fuere el tipo de diseo empleado. Los buenos diseos factoriales fraccionadas se arreglan
cuidadosamente de tal manera que la estimacin de los efectos que se piensa es importantes, se
confunden por accin de los efectos que se consideran no importantes.
DISEO FACTORIAL 2 k-P
Este tipo de diseo es uno de los ms tiles desde el punto de vista prctico, pues permite obtener una
informacin de varios factores o variables a la vez, realizando un mnimo de experiencias (fraccionando
un diseo factorial completo). Es particularmente til cuando:
a)
Se tiene poca materia prima para realizar las experiencias o cuando estas son costosas, lo cual
obliga a realizar pocas pruebas experimentales.
b)
Se requiere informacin rpida.
c)
Existe escasez de recursos humanos y materiales.
Un diseo factorial fraccionada est definido por:
2k-P
Donde:
k: Es el nmero de factores a estudiar.
p: Es el nmero de factores a confundir.
De esta manera es posible estudiar por ejemplo el efecto de cuatro o ms factores, realizando un mnimo
de ocho experiencias. Para esto se requiere que algunas de las interacciones de orden superior sean
nulas o despreciables.
Notase que el diseo 23-1 se forma al seleccionar slo las combinaciones de tratamiento que producen la
multiplicacin de signos, donde C=AB.
Es posible construir la combinacin de tratamientos del diseo 2 k-1 completo igualando el factor C por la
interaccin AB, de amplia aplicacin cuando los efectos principales son negativos pero tienen una gran
influencia en el proceso.
Supongamos que queremos buscar una aproximacin lineal, para una pequea rea de una superficie
respuesta con cuatro variables independientes.
Un diseo factorial con ocho observaciones puede ser suficiente (por ejemplo un diseo 2 3). Como
mencionamos arriba, podemos asumir que la interaccin de tercer orden X 1X2X3 es aproximadamente
igual a cero o despreciable, e igualando a un cuarto factor o variable obtenemos:
X 4 = X 1 X 2X 3
El cual es conocido como relacin de generacin ver tabla
En la prctica las interacciones de tercer orden son aproximadamente iguales a cero, ms frecuentes que
las interacciones de segundo orden.
La interpretacin que puede deducirse es la siguiente: si estimamos el coeficiente b1 lo que realmente
vemos es la suma de 1 y 234, es decir que se encuentran confundidos. Pero, como mencionamos
anteriormente, que las interacciones de tercer orden son aproximadamente cero, lo que obtenemos es un
buen estimado de los trminos lineales del modelo matemtico, mas no as de los trminos con
interaccin, que estn confundidos.
Por lo tanto, la relacin de generacin escogida (X 4 = X1X2X3) es apropiada para la estimacin de efectos
principales o trminos lineales del modelo matemtico.
Si seleccionamos ahora una nueva relacin de generacin:
X4 = X1X2
Aplicando la ley de multiplicacin de factores, obtenemos la definicin de contraste:
Interpretacin: Utilizando la relacin de generacin (X4 = X1X2), obtenemos es un buen estimado de los
coeficientes de los trminos de interaccin doble del modelo matemtico, lo que puede utilizarse si el
inters es investigar las interacciones dobles entre las variables.
Existen numerosas alternativas para el fraccionamiento de un diseo. La tabla (*) resume las distintas
posibilidades de investigar ms de 3 variables, tomando diferentes combinaciones de definicin de
contrataste, utilizando la siguiente notacin:
N
de
Observaci
ones
N
de
Factores
Fraccin del
diseo
Factorial
Relacin
Generacin
Completo
--
1/2
Igualar C con
-AB
Completo
--
D = ABC
1/4
Igualar D=ABC
y E=-BC
Completo
--
Igualar E=ABC
y
F=BCD
1/8
16
de
Igualar E= ABC
y F=BCD y
G=ABD
En la primera etapa de optimizacin se investiga la influencia de cuatro factores, tiempo de molienda, pH,
dosificacin del colector y espumante en la recuperacin de cobre en un proceso de flotacin de un
mineral sulfurado de cobre. La tabla siguiente muestra, los niveles a considerar durante el experimento,
para cada uno de los factores.
F de tabla para un nivel de significancia de 0.01 y para 1 y 2 grados de libertad es 98.5. Por lo tanto, las
variables en forma independiente, tempo de molienda y dosificacin de colector son significativas,
mientras que el pH y la adicin de espumante resultaron insignificantes
Modelo Matemtico
Yest. = 87.65 + 1.6 X1 - 1.75 X3
Reemplazando los valores codificadas de X1 y X2 en el modelo matemtico obtenemos valores
estimados (Yest.). Luego podemos hacer un anlisis de residuales
SCMR= 0.748
La suma del cuadrado medio del error as 0.04 con 2 grados de libertad. As el valor de Fo es:
Fo = 0.748 / 0.04 = 18.7
Comparando Fo con el F de tabla a un nivel de significancia de 0.05 y para 4 y 2 grados de libertad,
respectivamente, (Ftabla = 19.30). Este valor es mayor que F de tabla, por lo tanto el modelo matemtico
hallado ajusta o representa adecuadamente al fenmeno.
Como ya se analiz, las variables principales X1 y X3 son significativas. Ahora analicemos que factores
estn confundidos y que es lo que estamos midiendo:
Como mencionamos anteriormente, en la prctica los trminos de interaccin de tercer orden son iguales
a cero, por lo que tendremos un buen estimado de las variables o factores principales X1 y X3, as decir:
Grafica del modelo matemtico:
Utilizando las frmulas de decodificacin del captulo anterior, el modelo matemtico a escala natural es:
YEST = 85.967 + 1.067 Z1 - 35 Z3
La representacin grfica del modelo matemtico se puede observar en le figura 3
a) Estime los efectos de los factores. Cules de esos efectos resultan ser mayores?
b) Utilice el anlisis de variancia a fin de confirmar sus conclusiones.
c) Analice el modelo matemtico obtenido.
d) Cules de los niveles de X1, X2 y X3 recomendara el lector?
Solucin.
La matriz de variables independientes se muestra en la siguiente tabla. Como se mencion
anteriormente, la formula matricial ecuacin 7 es muy cmodo para hallar los efectos y ayuda al anlisis
de variancia. La parte inferior de la tabla muestra el producto de la matriz [X] T[Y] seguidamente el efecto
a cada variable correspondiente a la columna indicada. Los efectos de las variables e interacciones
estn divididas entre 12 ((N/2)r =(814)*3 = 12).
La suma de cuadrados de los efectos a interacciones est definida por la ecuacin 9. Observando que
el vector del producto [X]T[Y], elevado al cuadrado y dividido
La suma de cuadrados de los efectos e interacciones, o llamado de tratamientos, es
El valor de F es tabulado para un nivel de significancia del 99% y para f 1=1 y f2=16 tenemos:
Por lo tanto podemos hacer las siguientes conclusiones:
a) La variable X2 (la configuracin) y X 3 (ngulo de corte) resultaron significativas al 1 % por lo que la
variacin del rival inferior al rival superior elevan significativamente en la duracin de la
herramienta, especialmente la configuracin de corte (X2).
b) La interaccin es X1X3 tambin resultaron significativas. En esta parte es importante notar que la
variable X1 (rapidez de corte) por si misma no es significativa pero solo es conjuntamente con X 3;
esto significa que la rapidez de corte si es significativo y que depende de ngulo de corte. Como en
el problema se analiza la duracin de la herramienta de corte, aparentemente la rapidez de corte no
le afecta individualmente, pero si se cambia de ngulo de corte la herramienta en mencin podra
fallar y disminuir su duracin.
La suma de cuadrado medio del error es 30.3 con 16 grados de libertad. As el valor de F o es:
Como puede observarse en la figura 1, el termino interaccin le da cierta curvatura al modelo, por lo
que, un modelo en el cual el trmino interaccin esta presente se le puede considerar como un modelo
matemtico de segundo orden,
SESION 13
DISEO PLACKETT Y BURMAN
Este es un tipo de diseo de experimentos muy importante, desafortunadamente hay solamente pocas
referencias de aplicacin prctica en procesamiento de minerales y en metalurgia. Esto se debe
probablemente a que los Ingenieros no han reconocido todava la verdadera utilidad de este diseo,
especialmente en la etapa de Screening, para la determinacin de las variables ms importantes que
afectan la respuesta o respuestas de un proceso bajo estudio.
El diseo Plackett y Burman es un tipo especial del diseo factorial fraccionado, donde se puede construir
diseos apropiados para el estudio de k variables en N pruebas experimentales, donde N>k. Como
pueden estudiarse con N experimentos hasta N-1 variables, la diferencia se asigna a variables
denominadas ficticias (no representan a ninguna variable experimental), cuya utilidad bsica es la
determinacin de la variancia del error experimental, como veremos ms adelante. Por esta razn es
conveniente que se apliquen o empleen al menos 02 variables ficticias.
Existen modelos para 8, 12, 16, 20, 24,...100 en mltiplos de 4. Las experiencias de estos arreglos se
definen en la primera fila y a partir de estos se construye el conjunto de arreglos experimentales, rotando
en forma cclica cada columna anterior.
Por ejemplo para k=4, el nmero de pruebas es 8, como se muestra en la matriz de diseo de la tabla 6.8
Podemos escoger arbitrariamente que las variables a investigar son X1, X2, X4, X7 y las variables
ficticias pueden ser X3, X5, X6. La ltima fila (8) se completa con (-).
La primera fila de arreglos para otros diseos es:
N=8 :+++-+--
Por ejemplo, supongamos que deseamos investigar 8 variables, segn lo anterior tendramos que elegir 12
pruebas experimentales y designar 3 variables ficticias para evaluar el error experimental, como se
muestra en la tabla.
Para la estimacin de la suma de cuadrados del error del sistema se emplean las variables ficticias. Para
ello, se hace una estimacin de sus efectos, los cuales en teora deben ser nulos; de no ser as, es de
suponer que su valor se debe puramente al error experimental. La suma de cuadrados del error est
dado por la siguiente ecuacin:
Donde:
Ef: Son los efectos mostrados por las variables ficticias la suma de cuadrados medios est definida por:
Donde:
nf = Numero de variables ficticias.
Modelo Matemtico
Con un modelo P&B se puede estimar modelos de primer orden, solamente para los trminos lineales,
mas no para evaluar interacciones entre las variables. Como todo diseo de primer orden, la evaluacin
de los coeficientes del modelo sigue el mismo procedimiento. El siguiente modelo podr ser estimado
para un diseo P&B.
Cabe sealar que solamente formaran parte del modelo matemtico final los coeficientes que resulten
significativas al proceso bajo estudio. La validez del modelo se prueba siguiendo el mismo mtodo del
diseo factorial.
Ejemplo del diseo Plackett y Burman
En el estudio de la separacin de Cu-Mo por flotacin de un concentrado bulk se parte de las siguientes
premisas:
Investigo el efecto del NaHS como depresor del Cu (CuFeS 2), la influencia de esta variable se
estima en trminos de estabilidad de HS-, por lo cual fue necesario controlar el potencial redox,
segn el diagrama Eh-pH.
Asimismo, se evalu el uso del N 2 como gas de flotacin, no solo porque reduce el consumo de
NaHS sino tambin, para averiguar si tena algn efecto en la eficiencia de separacin.
Adems se evalu otras dos variables tpicas de la flotacin como son el tiempo de
acondicionamiento y el tiempo de flotacin.
Antes de realizar la experimentacin se defini la funcin objetivo o lo que es lo mismo, el criterio o los
criterios de optimizacin; en este caso se consider tres:
a) Eficiencia de separacin.
b) Eficiencia de concentracin.
c) consumo de NaHS.
Los niveles para [as variables consideradas, incorporando dos variables ficticias en el estudio, se
muestran en la tabla siguiente:
Una vez definido, los niveles para cada factor, y considerando dos variables ficticias, se procedi a
efectuar las pruebas; para cada prueba se midi los tres criterios de optimizacin como se muestra en la
tabla siguiente:
Y 1 = Eficiencia de separacin
Y2 = Eficiencia de concentracin de MoS2
Y 3 = Consumo de NAHS.
a)
Nota: El factor ms importante en la primera evaluacin es el potencial redox, como puede observarse al
pasar de un valor inferior de (-400 v) a un valor superior de (- 200 v), la eficiencia de separacin disminuye
en 49.48%. Esto puede interpretarse de una manera opuesta, o sea que, al pasar de un nivel inferior de
(-200v) a otro superior de (-400 v) la eficiencia de separacin aumenta en 49.48%. Por consiguiente,
podemos afirmar que valores ms negativos del potencial redox mejoran la eficiencia de separacin.
F = 53.81/11.14=4.82
Para un nivel de significancia del 95% el valor de F de tabla es 18.5, y esta es mayor que 4.82. Por lo
tanto, el modelo matemtico ajusta o representa adecuadamente a los datos experimentales.
Grafica del modelo matemtico
El modelo matemtico obtenido anteriormente es:
Yest = 36.34 - 24.74 X1 + 8.64 X2 + 9.59 X5
Como puede observarse, hay en total 4 variables, para poder visualizar necesitamos hacer cortes en uno
de los ejes
Para X5= 0: Yest = 36.34 - 24.74 X, + 8.64 X 2 (1)
Para X2= 0: Yest = 36.34 - 24.74 X, + 9.59 X 5 (2)
Para X1= 0: Yest = 36.34 - 8.64 X1 + 9.59 X5 (3)
Para (1) el modelo matemtico decodificado es:
YEST = -46.52 -0.247 Z 1 + 8.64 Z2
La representacin grfica puede apreciarse en la figura 6.2.
Para (2) el modelo matemtico decodificado es:
YEST = -66.65 -0.247 Z1 + 3.836 Z5
La representacin grfica puede apreciarse en la figura 6.3.
Para (3) el modelo matemtico decodificado es:
YEST = -1.07 + 8.64 Z2 + 3.836 Z5
La representacin grfica puede apreciarse en la figura 6.4
b)
Anlisis de variancia
SSError = (-1.44)2 + (1.11)2 = 3.32
SSM = 3.32/2 = 1.66
A un nivel de significancia de 97.5% y para 1 y 2 grados de libertad el F de tabla es 38.51, por lo cual
el potencial redox, adicin de carbn activado y tiempo de flotaci6n, son significativas.
Modelo matemtico
Yest = 6.63 - 5.77 X, + 3.65 X 2 + 3.70 X 5
Anlisis de variancia
SSERROR= (2.35) 2 + (-0.40) 2 = 5.68
SSM =5.68 / 2 = 2.84
A un nivel de significancia de 97.5% y Para 1 y 2 grados de libertad el F de tabla es 38.51, por lo cual
ninguna de las variables es significativa. Por lo tanto, no podemos estimar un modelo matemtico que sea
vlido para el estudio.
Pero algo importante, que debemos observar es que el use de nitrgeno como gas disminuye el consumo
de NaHS en 6.40 lb/tn siendo esencial en la reduccin de costos del proceso.
Conclusin
En las tres corridas experimentales un factor importante es el potencial redox, que en valores ms
negativos a 400 mv es beneficiosa para la eficiencia de separacin, as como para la eficiencia de
concentracin del MoS2, siendo su efecto en el consumo de NaHS de regular importancia. Otra
conclusin, es que el uso del gas nitrgeno es beneficioso porque reduce el consumo de NaHS y esto
puede redundar en mejoras econmicas para el proceso.
Ejemplo: Plackett y Burman
Tostacin- Segregacin para la recuperacin de cobre proveniente de residuos de gas de
chimenea en la fundicin de cobre
El estudio consiste en recuperar cobre de los residuos de gas de chimenea en la fundicin de cobre por el
mtodo de Tostacin-Segregacin. El material contiene, adems del cobre, otras impurezas como el
arsnico, bismuto, etc.
El objetivo del estudio consiste en recuperar al menos el 85% de cobre presente en el material inicial y
eliminar en lo posible el 75% de impurezas en el residuo. Otros estudios previos a este trabajo, lograron
una recuperacin mxima de cobre de 60%.
Basados en estudios previos de tostacin-segregacin se defini las siguientes variables controlables:
En el estudio aplicaremos el diseo P&B.
La tabla muestra los resultados del diseo de Plackett y Burman, considerando tres variables ficticias.
Como podemos observar, los efectos ms grandes son la adicin de cal, adicin de coque X2, tiempo de
segregacin y temperatura. El efecto de la adicin de cal X1 es negativo, lo que significa que en su nivel
inferior ( - ) esta variable resulta significativa.
Anlisis de Varianza
SSERROR = (8.53)2 + (1.17)2 + (-1.67)2 = 76.966
SSM = 76.966 / 3 = 25.652
Para un nivel de significancia del 95% y para 1 y 3 grados de libertad respectivamente, Ftablas = 18.5 Por lo
cual, la adicin de cal, la adicin de coque, tiempo de segregacin y temperatura de segregacin son
significativos.
Modelo Matemtico
Yest =19.87 10.07X1 + 6.82X5 + 6.77X7 + 14.32X8
Nota: El modelo matemtico incluye solamente las variables que resultaron significativas. As:
SESION 14
OPTIMIZACIN
DISEOS ROTABLES
Un diseo experimental rotable es aquel en el cual se tiene igual facultad de prediccin en todas las
direcciones a partir de un punto experimental central y donde los otros puntos experimentales estn a una
distancia constante del punto central. Esto significa que la variancia (Se2) depende solamente de la
distancia del punto (X1X2,...Xk) al punto central del diseo (X o). El hecho de que la variancia dependa
solamente de la distancia, significa que el diseo permanece inalterado si este es rotado a un ngulo
arbitrario tomando como eje de rotacin el punto central. Esta caracterstica es muy til cuando las
unidades de las variables controlables estn dadas en escala natural, en este caso, evidentemente, la
distancia depender de las unidades en las cuales las variables controlables son las medidas, y que
cambios en la magnitud de estas unidades cambiaran la localizacin de los puntos a una distancia
constante del origen.
En general los diseos rotables que estudiaremos son:
a) Diseo pentagonal.
b) Diseo hexagonal.
c) Diseo octogonal.
Los cuales son presentados como polgonos regulares inscritos en una circunferencia cuyo centro es el
origen del sistema de coordenadas, de radio unitario o de radio (2)1/2.
Diseo Pentagonal
Este modelo se utiliza para estimar modelos matemticos de segundo orden, consiste en cinco puntos de
un pentgono ms los puntos necesarios replicados en el centro del diseo para estimar la variancia del
error experimental.
La matriz del diseo puede deducirse de la figura, tal como se observa en la tabla.
Diseo Hexagonal
Es el diseo ms popular utilizado por los investigadores, muy til para estimar modelos de segundo
orden, el cual consiste en seis puntos experimentales correspondientes a un hexgono regular, ms los
puntos necesarios replicados en el centro para estimar la variancia del error experimental. Este diseo se
muestra grficamente en la figura.
La matriz del diseo hexagonal puede deducirse de la figura, cuyos resultados se muestran en la tabla.
Diseo Octogonal
Este diseo es el ms confiable, debido a que utiliza un mayor nmero de observaciones (nmero de
pruebas experimentales). Este diseo consiste en ocho vrtices correspondientes a un octgono regular,
ms los puntos centrales necesarios para estimar la variancia de error experimental. El diseo
La matriz del diseo octogonal puede deducirse de la figura anterior, el cual se muestra en la tabla
Una de las formas ms adecuadas, para pasar de la escala codificada (matriz de diseo X j) a la escala
natural Zj, es utilizando las ecuaciones siguientes:
Donde:
Zj: Centro del diseo
Zj: El radio del diseo queda definido por
Por lo tanto, los valores de las variables en escala natural quedan definidos por la ecuacin siguiente:
Utilizando las formulas anteriores se obtiene la siguiente tabla:
Utilizando la formula bj*Zj y la tabla anterior se confecciona la matriz de diseo a escala codificado y a
escala natural para los diseos rotables descritos.
a) Diseo Pentagonal:
N
1
2
3
4
5
6
7
CODIFICADO
X1
X2
1
0.309
-0.809
-0.809
0.309
0
0
0
0.951
0.588
-0.588
-0.951
0
0
NATURAL
Z1
Z2
90
67.5425
31.2075
31.2075
67.5425
57.5
57.5
750
845.1
808.8
691.2
654.9
750
750
b) Diseo Hexagonal:
N
1
2
3
4
5
6
7
8
9
CODIFICADO
X1
X2
1
0.5
-0.5
-1
-0.5
0.5
0
0
0
0
0.866
0.866
0
-0.866
-0.866
0
0
0
NATURAL
Z1
Z2
90
73.75
41.25
25
41.25
73.75
57.5
57.5
57.5
750
836.6
836.6
750
663.4
663.4
750
750
750
c) Diseo Octogonal
N
CODIFICADO
X1
X2
2 0.707
3
0
0
0.707
1
4 -0.707 0.707
5
-1
0
6 -0.707
-
NATURAL
Z1
Z2
90
80.477
5
57.5
34.522
5
25
34.522
750
820.7
850
820.7
750
679.3
8 0.707
9
0
1
0
0
1
1
0
1
2
0
0.707
-1
0.707
0
5
57.5
80.477
5
57.5
679.3
750
57.5
750
57.5
750
57.5
750
650
i=1
uj=1
j=1
=b0 + bi X i + bu X u X j + b j X 2j
Los coeficientes del modelo matemtico de segundo orden pueden ser estimados por varios mtodos,
entre los que podemos mencionar a la tcnica de regresin mltiple por mnimos cuadrados, tanto en la
forma ecuaciones normales, forma matricial y el mtodo de correlacin mltiple. En cuanto a otras
tcnicas podemos mencionar a la tcnica de bsqueda directa (por ejemplo la tcnica de Nelder y Mead),
o tambin a la tcnica conocida como los polinomios de Chevyshev, entre otras ms. Desde el punto de
vista de la facilidad, para poder programar en computadoras, el mtodo matricial es el ms recomendable,
y que est definido por la siguiente frmula matricial:
Donde:
X: Matriz de diseo.
XT: Transpuesta de la matriz de diseo.
Y: Los datos observados (respuestas).
Veamos numricamente esta tcnica, resolviendo el problema planteado en el ejemplo.
(Recuperacin de cobre a partir de residuos de gas de chimenea por tostacin-segregacin).
N
1
2
3
4
5
6
7
8
9
CODIFICADO
X1
X2
1
0.5
-0.5
-1
-0.5
0.5
0
0
0
0
0.866
0.866
0
0.866
0.866
0
0
0
NATURAL
Z1
Z2
90
73.75
41.25
25
750
836.6
836.6
750
41.25
663.4
64.1
61.8
55.3
77.3
63.2
39.1
73.75
57.5
57.5
57.5
663.4
750
750
750
87.9
89.9
88.3
As, el modelo matemtico para el diseo hexagonal propuesto en escala codificada es la siguiente.
El modelo matemtico sirve para predecir los valores de la recuperacin de cobre, reemplazando valores
codificados de las variables en el rango de (-1 a +1). Sin embargo, en muchos casos es preferible
expresar el modelo matemtico en escala natural, especialmente cuando se desea graficar el modelo
usando cualquier software, para ello se debe proceder a decodificar el modelo segn las ecuaciones
siguientes.
Para el trmino independiente:
k
i=1
i ,u=1
j=1
a0 =b0 bi i biu i u b j 2 j
Donde:
i: es el cociente de dividir el centro del diseo (Zi ) y el radio del diseo (Zj).
ao: termino independiente del modelo matemtico en escala natural.
Para los trminos cuadrticos:
ai Z j =
bi
b ij
b ju
2
j
j=u=1 ..k1
Zi Zi
Zi j u
aii x 2i =
bii
Z 2i
aij Z i Z j=
b ij
i j=1. k
Zi Z j
aij : son los coeficientes del termino interaccin del modelo en escala natural.
Aplicando las ecuaciones para el modelo, al ejemplo que venimos analizando, tenemos la siguiente tabla
de datos:
N
Z1
Z2
(-)
( +)
Z
Z
25
90
57.5
32.5
1.769
650
850
750
100
7.5
a0 =b0b1 X 1b 2 X 2 +b 3 X 1+b4 X 2 +b 5 X 1 X 2
Termino independiente
a0 =88.7 (7.33 x1.769 ) ( 4.27 x7.5 )+ ( 18x 1.7692 ) +(39x 7.52 ) +[ 17.66 ( 1.769 )( 7.5 ) ]
a0 =1833.48
Trminos lineales
17.67
7.5=2.349
32.5
17.67
1.769=5.5996
100
( ) ( )
( ) ( )
7.5
18
2
1.769
32.5
32.5
4.27
39.13
a2 =
2
7.5
100
100
a1 =
Trmino cuadrticos
18
=0.017
32.52
39
a22= 2 =0.0039
100
a11 =
Termino Interaccin
a12=
17.67
=0.0054
( 32.5 x100 )
(8.8)
La variancia asociada a cada coeficiente es:
(8.9)
Donde:
Sbj : Desviacin standard asociado a los coeficientes
Cjj : Son los elementos de la diagonal de la matriz de correlacin (X TX)-l.
En el ejemplo anterior los elementos de la diagonal de la matriz de correlacin son:
Se: Desviacin standard del error experimental, que se estima de acuerdo a las ecuaciones 8.10:
N0
Y 0i
= i=1
N0
N0
(8.10)
SS E = ( Y 0i 0 )
i=1
MS E =
SC E
f2
S e = SM E
Las respuestas en el centro del diseo del ejemplo que venimos tratando son:
Se
(Cij)1/2
Sbj
bj
tj
Signf.
X1
X2
X12
X22
X1X2
1.058
1.058
1.058
1.058
1.058
0.577
0.577
0.912
0.912
1.1547
0.610
0.610
0.966
0.966
1.2217
-7.33
4.27
-18.00
-39.14
17.67
-12.02
7.00
-18.633
-40.506
14.463
Si
Si
Si
Si
Si
Para analizar la significancia de los coeficientes se compara el test t-calculado, con el T tablas, para un nivel de
significancia de 95% (p=0.05) y dos grados de libertad (f=2), el valor de T0.05,2 = 4.3; si T-calculado es
mayor que el t-tabla (Tc >Tt), la variable en cuestin es significativa para el proceso estudiado. Como
puede observarse, en la tabla anterior todos los coeficientes del termino independiente, trminos lineales,
trminos cuadrticos y el termino interaccin resultaron significativos.
Evaluacin del Modelo Matemtico
De la misma manera el modelo matemtico, derivada de los diseos rotables y compuestos, es avaluado
estadsticamente para ver el grado de ajuste a los datos experimentales, de la siguiente manera:
Se comienza con la suma de cuadrados del residual, que est definido por:
N
(8.11)
SS R = ( Y i )
i=1
f 1 =NI=N
( k+2 )( k+1 )
2
(8.12)
De las observaciones repetidas en el punto central del diseo encontramos la suma de cuadrados del error:
N0
SS E = ( Y 0i 0 )
(8.13)
i=1
f 2=N1
(8.14)
El paso siguiente es hallar la Falta de Ajuste de la suma de cuadrados, tanto del error como del residual.
Definido por:
SS FA =SS R SS E
(8.15)
f 3 =f 1 f 2
(8.16)
SS FA
f3
F=
SS E
f2
(8.17)
FO <F 95 f f
(8.18)
3 2
Aplicando las frmulas para ver la falta de ajuste del modelo matemtico, seguiremos los siguientes pasos:
a) Calculo de los valores predichos o estimados de la regresin, mediante la frmula matricial
b) Calculo de residuales:
SESIN 16
DISEO OCTOGONAL
Este diseo utiliza un mayor nmero de pruebas experimentales. Este diseo consiste en ocho
vrtices correspondientes a un octgono regular, ms los puntos centrales para estimar la
varianza de error experimental. Los puntos experimentales se muestran esquemticamente en la
fig. 12.3, se sabe que la suma de los ngulos exteriores de un polgono es de 360 y podemos
calcular su ngulos central segn la siguiente ecuacin.
C=
360
n
Para n=8 lados, el valor del ngulo central es de 45, haciendo coincidir uno de los lados que
forma el ngulo central con el eje de las abscisas y los vrtices del octgono correspondera a
los puntos experimentales
Aplicando las ecuaciones (Ec.67) y (Ec. 68) hallamos el centro y radio del diseo hexagonal
En la planificacin de las pruebas experimentales, se tiene que encontrar el valor de las variables
en escala natural por medio de la siguiente ecuacin:
1
2
3
4
5
6
7
8
9
10
11
12
Codificado
X1
X2
1.0000
0.0000
Natural
Z1
Z2
0.0350 27.500
0
0.7071
0.7071 0.0320 29.267
7
0.0000
1.0000 0.0250 30.000
0
-0.7071
0.7071 0.0179 29.267
3
7
-1.0000
0.0000 0.0150 27.500
0
-0.7071 -0.7071 0.0179 25.732
2
0.0000
-1.0000 0.0250 25.000
0
0.7071
-0.7071 0.0320 25.732
2
0.0000
0.0000 0.0250 27.500
0
0.0000
0.0000 0.0250 27.500
0
0.0000
0.0000 0.0250 27.500
0
0.0000
0.0000 0.0250 27.500
0
Tabla 12.3 Planificacin de las pruebas
Y
92.2
94.0
93.6
93.5
90.9
92.2
92.8
93.3
94.1
94.3
93.9
94.0
mltiple, desde el punto de vista de facilidad, para poder programar en computadoras, el mtodo
matricial es el ms recomendable, y el cual est definida por la (Ec. 70 )
La matriz [X] est definida por los valores de las variables codificadas, que corresponden a sus
respectivos coeficientes de regresin segn el modelo matemtico. La matriz completa del
diseo octagonal es el siguiente:
El clculo de la matriz inversa ([X] T* [X])-1 denominada tambin matriz de correlacin es constante
en el diseo octagonal siempre y cuando tenga doce pruebas experimentales es decir cuatro
repeticiones en el punto central del diseo, la diagonal de esta matriz inversa es importante en la
determinacin del anlisis de significancia de los coeficientes del modelo matemtico, luego la
matriz es la siguiente:
El modelo matemtico sirve para predecir los valores de recuperacin de cobre, reemplazando
valores codificados de las variables en el rango de (-1 a +1).En muchos casos es preferible
expresar el modelo en escala natural, especialmente cuando se desea graficar, para ello se debe
proceder a decodificar el modelo segn las ecuaciones descritas para los diseos de segundo
orden.
Para el trmino independiente: Segn la (Ec.72)
Para calcular el error experimental se hace a partir de las respuestas en el centro del diseo
cuyos valores se dan en la tabla siguiente:
c) calculamos primer o el promedio delas respuestas en el centro del diseo, empleando la (Ec.
82 )
MS E =
0.0875
=0.029167
3
A hora podemos calcular la Desviacin estndar asociada a los coeficientes, mediante la (Ec.86):
Para analizar la significancia de los coeficientes se compara el test calculado, con el t de tablas
para un nivel de confianza del 95% y 3 grados de libertad, para dos colas =0.025 t (0.975,3)=3.18
Si (t) calculado es mayor que el (t) de tablas si (-t ) es menor que (- t )de tablas el coeficiente
de la variable es significativa
Para llenar el cuadro de anlisis de varianza de Evaluacin del modelo matemtico se sigue el
mismo procedimiento que el realizado con el diseo hexagonal, ya que el modelo matemtico
tambin es de segundo orden.
La media de cuadrados del residual se calcula aplicando la (Ec. 88), teniendo en cuenta que los
parmetros del modelo son seis y se hizo doce pruebas experimentales por lo tanto los grados
de libertad son (12 - 6 = 6)
Este valor los comparamos con el F de tablas, para un nivel de confianza del 95% es decir un
nivel de significacin = 5% para 3,3 grados de libertad es: F (3,3)99% = 29.46
Por lo tanto aplicando la (Ec. 95) vemos si el modelo es aceptado o rechazado.
Cumple la condicin por lo tanto el modelo matemtico ajusta o representa adecuadamente los
datos experimentales.
El siguiente cuadro se resume el anlisis de Varianza del modelo matemtico.
Vemos que el coeficiente b11 y b22 son negativos, por lo tanto, su curva se asemeja a un Elipse.
Continuando con el ejemplo del problema que se est desarrollando, vamos a encontrar los
valores ptimos para las variables: (X 1: dosificacin de colector) y (X2: % de slidos). Y encontrar
Aplicando las ecuaciones (Ec. 67) y (Ec. 68) hallamos el centro y radio del diseo Octogonal.
El valor de las variables en escala natural se halla por medio de la (Ec. 69)