Академический Документы
Профессиональный Документы
Культура Документы
algunos experimentos puede encontrarse que la diferencia en la respuesta entre los niveles de un factor no es la misma para
todos los niveles de los otros factores. Cuando esto ocurre, existe una interacción entre los factores.
Considere el experimento factorial de dos factores que se ilustra en la figura con el nivel bajo del factor B el efecto
A es:
𝐴 = 50 − 20 = 30
Donde:
β = son parámetros cuyos valores deben determinarse.
X1 = es una variable que representa al factor A.
X2 = es una variable que representa al factor B.
Ε = es un término de error aleatorio.
X1 , x2 se definen en una escala codificada de -1 a +1 y x1x2 representan la interacción entre x1 y x2.
Las estimaciones de los parámetros en este modelo de regresión resultan estar relacionadas con las estimaciones de los efectos. Para
el experimento realizar, se encuentra que los efectos principales de A y B son A=21 y B=11. Las estimaciones de β1 y β2 son la
mitad del valor del efecto principal correspondiente; por lo tanto:
21
𝛽1 = = 10.5
2
11
𝛽2 = = 5.5
2
El efecto de la interacción de la figura 5.1 es AB=1 por lo que el valor del coeficiente de la interacción en el modelo de regresión es
1 20+40+30+52
𝛽12 = = 0.5. el parámetro 𝛽0 se estima con el promedio de las cuatro respuestas, o 𝛽0 = = 35.5. Por lo tanto, el
2 4
modelo de regresión ajustado es:
La estimaciones de los parámetro obtenidas de esta manera para el diseño factorial en el que todos los factores de
dos niveles (-y+) resultan ser estimaciones de mínimos cuadrados.
El coeficiente de la interacción (𝛽12 = 0.5) es pequeño en comparación con el coeficiente de los efectos
principales 𝛽1 𝑦 𝛽2 . La interpretación que se hará de este hecho es que la interacción es pequeña y puede ignorarse.
Por lo tanto, al eliminar el término 0.5𝑥1 𝑥2 se obtiene el modelo:
Suponga que la contribución de la interacción en el experimento no fuera insignificante; es decir, que el coeficiente
𝛽12 no fuera pequeño. En la figura se presenta la superficie de respuesta y la gráfica de contorno del modelo
LA VENTAJA DE LOS DISEÑOS FACTORIALES
Suponga que se tienen dos factores A y B, cada uno con dos niveles. Los niveles de los
factores se denotan por 𝐴− , 𝐴+ , 𝐵 − 𝑦 𝐵+ . podría obtenerse información acerca de
ambos factores haciéndolos variar uno a la vez. El efecto de cambiar el factor A esta
dado por 𝐴+ 𝐵− − 𝐴− 𝐵− , y el efecto de cambiar el factor B esta dado por 𝐴− 𝐵+ −
𝐴− 𝐵− . Debido a que esta presente el error experimental, es deseable realizar dos
observaciones.
Un ejemplo
Un ingeniero está diseñando una batería que se usara en un dispositivo que se someterá a variaciones de
temperatura extremas. El único parámetro del diseño que puede seleccionar en este punto es el material de la placa
o ánodo de la batería y tiene tres selecciones posibles. Cuando el dispositivo este fabricado y se envié al campo, el
ingeniero no tendrá control sobre las temperaturas extremas en las que operara eldispositivo, pero sabe por
experiencia que la temperatura probablemente afectara la vida efectiva de la batería. Sin embargo, la temperatura
puede controlarse en el laboratorio donde se desarrolla el producto para fines de prueba.
El ingeniero decide probar los tres materiales de la placa con tres niveles de temperatura -15, 70 y 125 °F, ya que
estos niveles de temperatura son consistentes con el medio ambiente donde se usara finalmente el producto. Se
prueban cuatro baterías con cada combinación del material de la placa y la temperatura, y las 36 pruebas se corren
de manera aleatoria.
En este caso, el ingeniero quiere responder las preguntas siguientes:
• ¿existe alguna elección del material que produzca de manera regular una vida larga de la batería independientemente de la
temperatura?
La segunda pregunta es de particular importancia. Quizá sea posible encontrar una alternativa de material que no resulte afectada
considerablemente por la temperatura. El ingeniero puede hacer que la batería sea robusta para la variación de la temperatura en
el campo. Se trata de un ejemplo de la aplicación del diseño experimental estadístico en el diseño de productos robustos.
Las observaciones de un experimento factorial pueden describirse con un modelo. Hay varias formas de escribir el modelo de un
experimento factorial. El modelo de los efectos es:
• Donde:
• 𝜇 = 𝑒𝑠 𝑒𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑔𝑙𝑜𝑏𝑎
Puesto que hay n réplicas del experimento hay abn observaciones en total.
• También podría usarse un modelo de regresión. Los modelos de regresión resultan particularmente útiles cuando
uno o más de los factores del experimento son cuantitativos.
• En el diseño factorial de dos factores, los factores de las regiones y las columnas, A y B, son de igual interés. El
interés se encuentra en probar hipótesis acerca de la igualdad de los efectos de los tratamientos de los reglones, por
ejemplo:
También existe interés en determinar si los tratamientos de los reglones y las columnas interactúan. Por lo tanto,
también querría probarse.
ANALISIS ESTADISTICO DEL MODELO CON EFECTOS FIJOS
• Sea que 𝑦𝑖 denote el total de observaciones bajo el nivel i-enésimo del factor A, que 𝑦𝑖 denote que
el total de observaciones bajo el nivel j-enésimo del factor B, que 𝑦𝑖𝑗 denote el total de
observaciones de la celda ij-enesima y que y… denote el gran total de todas las observaciones. Se
definen 𝑦𝑖… , 𝑦𝑗… , 𝑦𝑖𝑗. 𝑦 𝑦… como los promedios correspondientes de los reglones, las columnas, las
celdas y el gran promedio. Expresado matemáticamente.
Ya que los seis productos cruzados del lado derecho da la igualdad son cero. Conserve que se han hecho la participación de la suma
de cuadrados total en una suma de cuadrados debida a “los reglones”, o factor A; una suma de cuadrados debida “columnas”, o
factor B; una suma de cuadrados debida a la interacción entre A y B. Por ultimo componente del lado derecho de la igualdad de la
ecuación anterior, se observa que debe haber por lo menos dos replicas (n≥2) para obtener una suma de cuadrados del error.
La ecuación anterior se puede escribirse simbólicamente como
Esta asignación de los abn -1 grados de libertad totales a las sumas de cuadrados puede justificarse de la siguiente, manera: los
efectos principales A y B tienen a y b niveles, respectivamente; por lo tanto, tiene a -1 y b-1 grados de libertad, como se indica. Los
grados de libertad de la interacción son solo el número de grados de libertad de las celdas (que es ab -1) menos el número de grados
de libertad de los dos efectos principales A y B.
Dentro de cada una de las ab celdas hay n-1 grados de libertad entre las n replicas; por lo tanto hay ab(n-1) grados de libertad para
el error.
Cada suma de cuadrados dividida por sus grados de libertad es un cuadrado medio. Los valores esperados de los cuadrados medio
son:
Observe que si es verdadera la hipótesis nula de que no hay efectos de los tratamientos de los reglones ni
de los tratamientos de las columnas, ni interacción, entonces 𝑀𝑆𝐴 , 𝑀𝑆𝐵 , 𝑀𝑆𝐴𝐵 𝑦 𝑀𝑆𝐸 son todas
estimaciones de 𝜎 2 . Sin embargo, si hay diferencias entre los efectos del son tratamientos de los
reglones.
El procedimiento de prueba suele resumirse en una tabla de análisis de varianza.
En lo que los cálculos se refieren, por lo general se emplea un paquete de software de estadística
para realizar el análisis de varianza. Sin embargo, no es complicado obtener fórmulas para
calcular manualmente las sumas de cuadrados. La suma de cuadrados total se calcula como de
costumbre con
Ejemplo de aplicación:
Tabla 5-4: Datos de la vida( en horas) del experimento del diseño de la batería.
La suma de
cuadrados se
calculan de la
siguiente
manera:
En la tabla, se muestra el análisis de varianza, también se muestran los valores P para los
estadísticos de la prueba.
Como ayuda para interpretar los resultados de este
experimento, es conveniente construir una grafica de
las respuestas promedio para cada combinación de los
tratamientos. Esta grafica se muestra en la figura. El
hecho de que las rectas no sean paralelas indica que la
interacción es significativa. En general, se consigue una
ida mas larga con una temperatura baja,
independientemente del tipo de material. Al cambiar de
una temperatura baja a una intermedia, la vida de la
batería con el material tipo 3 tiene un incremento real,
mientras que con los materiales tipo 1 y 2 disminuye.
Con una temperatura de intermedio a alta la vida de la
batería disminuye para los materiales tipo tipos 2 y 3 y
se mantienen en esencia sin cambio para el material
tipo 1, el material tipo 3 parece producir los mejores
resultados si se quiere una perdida menor de la vida
efectiva cuando la temperatura cambia.
Comparaciones múltiples
Se ilustra el uso de la prueba de Tukey con los datos de la vida de la batería del ejemplo desarrollado. La interacción
es significativa, por lo tanto las comparaciones entre las medias de uno de los factores pueden ser oscurecida por la
interacción AB. Una forma de abordar esta cuestión consiste en fijar en factor B en un nivel especifico y aplicar la
prueba de Tukey a las medias del factor A con ese nivel. Suponiendo que el interés se encuentra en detectar las
diferencias entre las medias de los 3 tipos de material. Puesto que la interacción es significativa, esta comparación se
hace con un solo nivel de temperatura , por ejemplo 70°F. Se supone que la mejor estimación de la varianza del error
es 𝑀𝑆𝐸 de la tabla del análisis de varianza del error experimental es la misma para todas las combinaciones de
tratamientos.
Los promedios de los 3 tipos de material a 70°F dispuestos en orden ascendente son:
Para determinar un tamaño de la muestra (el numero de replicas, n) apropiado en un diseño factorial de dos factores, el
experimentador puede apoyarse en las curvas de operación característica. En la tabla 5-7 se muestra el valor apropiado
del parámetro Ф2 , así como los grados de libertad del numerador y el denominador.
Una forma muy eficaz de emplear estas curvas consiste en encontrar el valor menor de Ф2 que corresponde a una
diferencia especifica entre las medias dedos tratamientos cualesquiera. Por ejemplo, si la diferencia en las medias de dos
renglones cualesquiera es D, entonces el valor mínimo de Ф2 es:
Mientras que si la diferencia en as medias de dos columnas cualesquiera es D, entonces el valor mínimo de Ф2 es
Por ultimo el valor mínimo de Ф2 que corresponde a una diferencia D entre dos efectos de interacción cualesquiera es
Para ilustrar el uso de estas ecuaciones, considere los
datos de la vida de la batería del ejemplo 5-1. Suponga
que antes de correr experimento se decide que la
hipótesis nula deberá rechazarse con una alta
probabilidad si la diferencia en la vida media de la
batería entre dos temperaturas cualesquiera es hasta de 40
horas. Por lo tanto D = 40, y si se supone que la
desviación estándar de la vida de la batería es
aproximadamente 25, entonces por la ecuación se obtiene
Con el valor mínimo de Ф2 suponiendo que α=0.05, ahora puede usarse la parte V del apéndice para
construir la tabla:
Observe que con n=4 replicas se obtiene un riego de β de cerca de 0.06, o una probabilidad aproximada
de 94% de rechazar la hipótesis nula si la diferencia en la vida media de la batería con 2 niveles de
temperatura cualesquiera es hasta de 40 horas. Por o tanto, se concluye que 4 replicas bastan para
proporcionar la sensitividad deseada siempre y cuando la estimación usada para la desviación estándar
de la vida de la batería no tenga un error grave. En caso de duda, el experimentador podría repetir el
procedimiento anterior con otros valores de σ para determinar el efecto que tendría una estimación
equivocada de este parámetro sobre la sensitividad del diseño.
El supuesto de no interacción en un modelo de 2 factores
Ocasionalmente un experimentador siente que es apropiado un modelo de 2 factores sin interacción, por ejemplo:
Sin embargo, se deberá ser muy cuidadoso al hacer caso omiso de los términos de interacción, ya que la presencia de
una interacción significativa puede tener un impacto dramático sobre la interpretación de los datos.
El análisis estadístico de un modelo de 2 factores sin interacción es directo. En la tabla se presenta el análisis de los
datos de la vida de la batería. Suponiendo que es valido el modelo sin interacción.
Una prueba desarrollada por Tukey es útil para determinar si está presente una interacción.
En el procedimiento se supone que el termino de la interacción tiene una forma particularmente simple, a saber,
(τβ)𝑖𝑗 = γτ𝑖 β𝑗 donde γ es una constante desconocida. Al definir así el termino de la interacción, puede usarse
un enfoque de regresión para probar la significación del termino de la interacción. En la prueba se hace
participación de la suma de cuadrados de los residuales en componente con un solo grado de libertad debido
a la no aditividad (interacción) y un componente del error con (𝑎 − 1)(𝑏 − 1) − 1 grados de libertad. En lo
que a los cálculos se refiere, se tiene
Con (𝑎 − 1)(𝑏 − 1) − 1 grados de libertad. Para probar la presencia de una interacción, se calcula
Las impurezas presentes en un producto químico son afectadas por 2 factores, la presión y la temperatura. En la tabla
5-10 se muestran os datos de una sola replica de un experimento factorial.
El análisis de la varianza completa se resume en la tabla 5-11. el estadístico de la prueba para la no aditivita
es , de donde se concluye que no hay evidencia de interacción en estos datos. Los
efectos principales de la temperatura y la presión son significativos
El modelo factorial de 2 factores con una observación por celda luce exactamente igual
que el modelo de bloques completos aleatorizados. La prueba de Tukey con un solo
grado de libertad para la no aditividad puede aplicarse directamente para probar la
presencia de una interacción en el modelo de bloques aleatorizados. Las situacioens
que llevan al modelo de bloques aleatorizados y al modelo factorial son muy
diferentes.
DISEÑO FACTORIAL GENERAL
Los resultados del diseño factorial de dos factores pueden ampliarse al caso general en que haya “a” variables
del factor A, “b” niveles del factor B, “c” niveles del factor C, etc., dispuestos en un experimento factorial. En
general, habrá “abc…n” observaciones totales si se hacen “n” replicas del experimento completo. De nueva
cuenta, observe que es necesario un mínimo de dos replicas (n ≥ 2) para determinar una suma de cuadrados
debida al error si todas las interacciones posibles están incluidas en el modelo.
Cuando todos los factores del experimento son fijos, es sencillo formular y probar hipótesis acerca de los
efectos principales y las interacciones. Para un modelo con efectos fijos, los estadísticos de prueba para cada
efecto principal e interacción pueden construirse dividiendo el cuadro medio correspondiente del efecto o
interacción por el cuadro medio del error. Todas las pruebas F serán de una cola superior. El numero de
grados de libertad de cualquier efecto principal es el numero de niveles del factor menos uno, y el numero de
grados de libertad de una interacción es el producto del número de grados de libertad asociados con los
componentes individuales de la interacción.
En general los cálculos del análisis de varianza se efectuarían utilizando un
paquete de software de estadística. Sin embargo, en ocasiones resultan útiles las
formulas para calcular manualmente las sumas de cuadrados. la suma de
cuadrados total se encuentra de la manera acostumbrada como:
Las sumas de cuadrados de los efectos principales se encuentran a partir de los
totales de los factores A(yi…), B(y.j..) y C(y..k.) de la siguiente manera:
Para calcular las sumas de cuadrados de las interacciones de dos factores, se necesitan los totales de
las celdas AXB, AXC y BXC. Con frecuencia es útil desplegar la tabla de los datos originales en tres
tablas de dos vías para calcular estas cantidades. Las sumas de cuadrados se encuentran con:
Observe que la sumas de cuadrados de los subtotales de dos factores se encuentran a partir de los
totales de cada tabla de dos vías. La suma de cuadrados de la interacción de los tres factores se calcula a
partir de los totales de las celdas (y ijk.) de tres vías como:
La suma de cuadrados del error puede encontrarse restando la suma de cuadrados de
cada efecto principal e interacción de la suma de cuadrados total o con:
AJUSTE DE CURVAS Y SUPERFICIE DE RESPUESTA
Se ha visto que puede resultar útil ajustar una curva de respuesta a los niveles de un factor
cuantitativo para que el experimentador cuente con una ecuación que relacione la
respuesta con el factor. Esta ecuación podría utilizarse para hacer interpolación, es decir,
para predecir la respuesta en niveles inter
medios entre los factores, respecto de los que se utilizaron realmente en el experimento.
Cuando al menos dos de los factores son cuantitativos, puede ajustarse una superficie de
respuesta para predecir y con varias combinaciones de los efectos del diseño. En general,
se usan métodos de regresión lineal para ajustar estos modelos a los datos experimentales.
FORMACION DE BLOQUES EN UN DISEÑO FACTORIAL
Se han revisado diseños factoriales en el contexto de un experimento completamente aleatorizado. En ocasiones no es
factible o practico hacer la aleatorización completa de todas las corridas de un diseño factorial por ejemplo la presencia de un
factor perturbador puede hacer necesario que el experimento se corra en bloques.
Considere un experimento factorial con dos factores (A y B) y n replicas. El modelo estadístico lineal de este diseño es:
Suponga ahora que para realizar este experimento se necesita una materia prima particular esta materia prima está
disponible en lotes cuyo tamaño no es suficiente para permitir que no se corran todas las abn combinaciones de los
tratamientos con el mismo lote. Sin embargo, si un lote contiene material suficiente para hacer ab observaciones, entonces
un diseño alternativo es correr cada una de la n replicas utilizando un lote separado de materia prima. Por consiguiente, los
lotes de materia prima representan una restricción sobre la aleatorización o un bloque, y se corre una sola replica de un
experimento factorial completo dentro de cada bloque. El modelo de los efectos para este nuevo diseño es:
Desde luego dentro de un bloque el orden en que se corren las combinaciones de los tratamientos está completamente
aleatorizado.
En el modelo de la (ec 5.37) se supone que la interacción entre bloques y los tratamientos es insignificante. Anteriormente se
estableció el mismo supuesto en el análisis de diseños de bloques aleatorizados. Si estas interacciones existen, no pueden
separarse del componente del error. El término de error se compone de las interacciones
en la tabla 5.18 se describe el análisis de varianza. La disposición tiene un gran parecido con la de un diseño factorial.