Вы находитесь на странице: 1из 23

5.1.

Diseños factoriales con dos factores


El experimento factorial más sencillo es en el que intervienen solamente dos factores, por
ejemplo, A y B. Hay niveles del factor A y niveles del factor B. El experimento tiene réplicas y
cada réplica contiene todas las combinaciones de tratamientos .Considere los factores A y B
con y ( ) niveles de prueba, respectivamente. Con ellos se puede construir el arreglo o diseño
factorial , que consiste de tratamientos. Se llama réplica cada repetición completa del
arreglo factorial. Los diseños factoriales que involucran menos de cuatro factores se corren
replicados para poder tener la potencia necesaria en las pruebas estadísticas sobre los
efecto de interés, de tal forma que si se hacen réplicas, el número total de corridas
experimentales es ( ).
Efecto principal y efecto de interacción
El efecto de un factor se define como el cambio observado en la variable de respuesta
debido a un cambio de nivel de tal factor. En particular, los efectos principales son los
cambios en la media de la variable de respuesta que se deben a la acción individual de cada
factor. En términos matemáticos, el efecto principal de un factor con dos niveles es la
diferencia entre la respuesta media observada cuando tal factor estuvo en su primer nivel, y
la respuesta media observada cuando el factor estuvo en su segundo nivel.
Un diseño factorial es utilizado generalmente por los científicos que desean comprender el
efecto de dos o más variables independientes respecto de una única variable dependiente.
Los diseños factoriales son muy útiles para los psicólogos y los científicos de campo como
estudio preliminar, ya que les permiten juzgar si existe una conexión entre las variables y
reducen la posibilidad de un error experimental y de variables de confusión.
El diseño factorial, además de simplificar el proceso y abaratar el costo de la investigación,
permite muchos niveles de análisis. Además de resaltar las relaciones entre las variables,
permite que sean aislados y analizados por separado los efectos de la manipulación de una
sola variable.
La mayor desventaja es la dificultad de experimentar con más de dos factores o muchos
niveles. Un diseño factorial debe ser planificado cuidadosamente, ya que un error en uno de
los niveles o en la operacionalización general pondría en peligro una gran cantidad de
trabajo.
Dejando de lado estas pequeñas desventajas, un diseño factorial constituye uno de los
pilares de muchas disciplinas científicas, ya que ofrece excelentes resultados en el campo.En
primer lugar vamos a estudiar los diseños más simples, es decir aquellos en los que
intervienen sólo dos factores. Supongamos que hay a niveles para el factor A y b niveles del
factor B, cada réplica del experimento contiene todas las posibles combinaciones de
tratamientos, es decir contiene los ab tratamientos posibles.
El modelo estadístico para este diseño es:
yij = µ + τi + βj + (τβ)
ij + uij i = 1, 2, · · · , a ; j = 1, 2, · · · , b , donde
yij : Representa la observación correspondiente al nivel (i) del factor A y al nivel (j) del factor
B.
µ: Efecto constante denominado media global.
τi: Efecto producido por el nivel i-ésimo del factor A, (i τi = 0).
βj: Efecto producido por el nivel j-ésimo del factor B,-j
βj = 0.(τ β) ij : Efecto producido por la interacción entre A×B,-i (τβ)ij =j(τβ)
ij = 0.uij son vv aa. independientes con distribuciónN(0, σ).
Supondremos que se toma una observación por cada combinación de factores, por tanto,
hay un total de N = ab observaciones.
A pesar de las restricciones impuestas al modelo,i τi =j
βj =i(τβ)
ij =j(τβ)
ij = 0, el número de parámetros (ab + 1) supera al número de obsevaciones (ab). Por lo tanto,
algún parámetro no será estimable.
Los resultados del ANOVA para dos factores pueden ser extendidos a un caso general en
donde: a son los niveles del factor A, b son los niveles del factor B, c son los factores del nivel
C, y así sucesivamente, los cuales pueden ser arreglados en un experimento factorial, en el
cual el número de réplicas es n.
Está diseñada para generar procesos de calidad. TAGUCHI desarrolló una aproximación al
diseño de experimentos con el objetivo de reducir los costos emanados de la
experimentación, esta aproximación es más práctica que teórica y se interesa más por la
productividad y los costos de producción que en las reglas estadísticas. Los conceptos de
estas técnicas están basados en las relaciones de costos y ahorros.
Diseñar un sistema de manufactura para elaborar un producto requiere de conocimientos
técnicos además de una gran experiencia en el área a la cual pertenece el producto.
Los diseños factoriales son ampliamente utilizados en experimentos en los que intervienen
varios factores para estudiar el efecto conjunto de estos sobre una respuesta. Existen varios
casos especiales del diseño factorial general que resultan importantes porque se usan
ampliamente en el trabajo de investigación, y porque constituyen la base para otros diseños
de gran valor práctico.
En los últimos años se ha observado un creciente interés por algunas de las ideas del
profesor Genechi Taguchi acerca del diseño experimental y su aplicación al mejoramiento de
la calidad.
El diseño factorial fraccionario 2 k-p se usa en experimentos de escrutinio para identificar
con rapidez y de manera eficiente el subconjunto de factores que son activos, y para obtener
alguna información sobre la interacción. La propiedad de proyección de estos diseños hace
posible en muchos casos examinar los factores activos con más detalle. La combinación
secuencial de estos diseños a través del plegamiento es una forma muy eficaz de obtener
información extra acerca de las interacciones, la cual puede identificarse en un experimento
inicial como potencialmente importante.
Diseño Factorial General 2k
Los diseños factoriales son ampliamente utilizados en experimentos en los que intervienen
varios factores para estudiar el efecto conjunto de estos sobre una respuesta. Existen varios
casos especiales del diseño factorial general que resultan importantes porque se usan
ampliamente en el trabajo de investigación, y porque constituyen la base para otros diseños
de gran valor práctico.
El más importante de estos casos especiales ocurre cuando se tienen k factores, cada uno
con dos niveles. Estos niveles pueden ser cuantitativos como sería el caso de dos valores de
temperatura presión o tiempo. También pueden ser cualitativos como sería el caso de dos
máquinas, dos operadores, los niveles "superior" e "inferior" de un factor, o quizás, la
ausencia o presencia de un factor.
Una réplica completa de tal diseño requiere que se recopilen 2 x 2 x .... x 2 = 2k
observaciones y se conoce como diseño general 2k. El segundo caso especial es el de k
factores con tres niveles cada uno, conocido como diseño factorial 3k.
Se supone que:
a) los factores son fijos
b) los diseños son completamente aleatorios
c) se satisface la suposición usual de normalidad
El diseño 2k es particularmente útil en las primeras fases del trabajo experimental, cuando
es probable que haya muchos factores por investigar.
Conlleva el menor número de corridas con las cuales pueden estudiarse k factores en un
diseño factorial completo. Debido a que sólo hay dos niveles para cada factor, debe
suponerse que la respuesta es aproximadamente lineal en el intervalo de los niveles elegidos
de los factores.
DISEÑO 22
El primer diseño de la serie 2k es aquel que tiene sólo dos factores, A y B, cada uno con dos
niveles. Arbitrariamente, los niveles del factor pueden llamarse "inferior" y "superior".
DISEÑO 23
Suponga que se encuentran en estudio tres factores A, B y C, cada uno con dos niveles. Este
diseño se conoce como diseño factorial, 23 y las ocho combinaciones de tratamientos
pueden representarse gráficamente mediante un cubo. Existen en realidad tres notaciones
distintas que se usan ampliamente para las corridas o ejecuciones en el diseño 2k: La
primera es la notación "+,-", llamada "geométrica".
La segunda consiste en el uso de letras minúsculas para identificar las combinaciones de
tratamientos.
En la tercera se utilizan los dígitos 1 y 0 para denotar los niveles alto y bajo del factor,
respectivamente.
Diseño Factorial General 3k
Este diseño es una variación del diseño 2k y son muy útiles como las que se emplean cuando
todos los factores actúan a tres niveles.
Este es un diseño que consta de k factores con tres niveles cada uno. Los factores y las
interacciones se representan mediante letras mayúsculas. Los tres niveles de los factores
pueden referirse como nivel inferior, intermedio y superior. Estos niveles se representan
mediante los dígitos 0 (nivel inferior), 1 (intermedio) y 2 (superior).
Cada combinación de tratamientos de un diseño 3k se presenta mediante k dígitos, donde el
primero incida el nivel de A, el segundo señale al nivel de B,..... y el k-ésimo dígito, el nivel
del factor k. Por ejemplo, es un diseño 32 el 00 representa la combinación de tratamientos,
en la que tanto el factor A como el B están en el nivel inferior, y el 01 representa la
combinación de tratamientos que corresponde al factor A en el nivel inferior y a B en el nivel
intermedio.
Es claro que si los k factores no tienen la misma cantidad de niveles, entonces no se puede
factorizar de esta forma, y debe escribirse el producto de manera más explícita: por ejemplo
con k = 3 factores, el primero con cuatro niveles y los dos restantes con dos niveles, se tiene
el diseño factorial, que consiste de 16 combinaciones de niveles diferentes.
En estadística, un experimento factorial completo es un experimento cuyo diseño consta de
dos o más factores, cada uno de los cuales con distintos valores o niveles, cuyas unidades
experimentales cubren todas las posibles combinaciones de esos niveles en todo los
factores. Este tipo de experimentos permiten el estudio del efecto de cada factor sobre la
variable respuesta, así como el efecto de las interacciones entre factores sobre dicha
variable.
Por ejemplo, con dos factores y dos niveles en cada factor, un experimento factorial tendría
en total cuatro combinaciones de tratamiento, y se le denominaría diseño factorial de 2×2.
Si el número de combinaciones en un diseño factorial completo es demasiado alto para su
procesamiento, puede optarse por un diseño factorial fraccional, en el que se omitan
algunas de las combinaciones posibles.
Para ahorrar el espacio, los puntos en un experimento factorial de dos niveles se abrevian a
menudo con las cadenas de más y signos de menos. Las secuencias tienen tantos símbolos
como factores, y sus valores dictan el nivel de cada factor: − para el primer (o bajo) llano, y +
para el segundo (o alto) llano. Los puntos en este experimento se pueden representar como
−−,+−,−+,y++.
Los puntos factoriales se pueden también abreviar cerca (1), a, b, y el ab, donde la presencia
de una letra indica que el factor especificado está en su alto (o en segundo lugar) nivel y la
ausencia de una letra indica que el factor especificado está en su (o primero) nivel bajo (por
ejemplo, “a” indica que el factor A está en su alto ajuste, mientras que el resto de los
factores están en su ajuste del punto bajo (o primero)). (1) se utiliza indicar que todos los
factores están en sus (o primero) valores más bajos.
Para poder finalmente obtener un modelo estadístico que nos indique el valor de respuesta
al modificar los factores.
Cálculo del efecto
Contraste = (suma de niveles+)-(suma de niveles-) Efecto Contraste /replica*2^k
b= efecto/2 bo= suma total/numero total
Modelo estadístico: Y= bo+ b1X1 + b2X2......
El experimento factorial más simple contiene dos niveles para cada uno de dos factores.
Suponga los deseos de un ingeniero para estudiar la energía total usada por cada uno de dos
diversos motores, A y B, funcionando en cada uno de dos diversas 2000 o 3000 RPM de las
velocidades. El experimento factorial consistiría en cuatro elementos experimentales: viaje
en automóvil A en 2000 RPM, viaje en automóvil B en 2000 RPM, viaje en automóvil A en
3000 RPM, y viaje en automóvil B en 3000 RPM. Cada combinación de un solo nivel
seleccionado de cada factor está presente una vez.
Este experimento es un ejemplo de 2^2 (o 2x2) experimento factorial, nombrado así porque
considera dos niveles (la base) para cada uno de dos factores (la energía o el exponente), o
#lniveles#factores, produciendo 22puntos factoriales =4. Los diseños pueden implicar
muchas variables independientes. Como otro ejemplo, los efectos de tres variables entradas
se pueden evaluar en ocho condiciones experimentales demostradas como las esquinas de
un cubo. Esto se puede conducir con o sin la réplica, dependiendo de su propósito previsto y
recursos disponibles. Proporcionará los efectos de las tres variables independientes en la
variable dependiente y las interacciones posibles(en caso de haber más de 3 se habla de un
hiperespacio). La técnica fundamental consiste en repartir el total en componentes
mediante sumas de cuadrados. Esta técnica tuvo efectos secundarios en el modelo. Por
ejemplo, demostramos el modelo para un ANOVA simplificado con un tipo de tratamiento
en diversos niveles.
Los grados de libertad se pueden repartir de manera similar y especifican distribuciones chi-
cuadrado que describen las sumas asociadas de cuadrados.
En el modelo factorial 22 tenemos dos factores, A y B, cada uno de ellos a dos niveles, a los
que llamaremos inferior (-1) y superior (+1). Las unidades experimentales se obtienen
tomando las cuatro posibles combinaciones de ambos factores y replicándolo n veces, con
n>1 (el caso n=1 no lo trataremos aquí). Como es habitual, el objetivo fundamental del
experimento consiste en estudiar si los factores y sus posibles interacciones tienen una
influencia significativa sobre la variable respuesta.
Formalmente, el modelo se reduce a la ecuación
yijk=β0+β1x1+β2x2+β12x1x2+uijk,
con i,j∈{−,+} y k=1,…,n, donde yijk es el resultado observado en la k-ésima réplica asociada al
nivel i del factor A y al nivel j de B. Los números x1 y x2 toman los valores -1 y 1, según los
factores tomen los niveles inferior o superior, respectivamente. Las fluctuaciones aleatorias
uijk son todas ellas independientes y normales, de media nula y desviación típica σ
desconocida, uijk∼N(0,σ).
Los coeficientes β1 y β2 del modelo miden el incremento de la respuesta cuando el factor
correspondiente cambia en una unidad. La misma interpretación tiene el parámetro de
interacción β12. Sin embargo, en los diseños 22 se acostumbra a estimar los efectos A y B,
que miden la variación de la respuesta cuando los factores pasan del nivel inferior al
superior, siendo entonces A=2β1, B=2β2 y AB=2β12, cuyos estimadores se obtendrán una
vez ajustado el modelo anterior por el método de los mínimos cuadrados.
Una vez estimados los parámetros del modelo, los residuos, definidos por eijk=yijk−y¯ij⋅,
permiten evaluar la bondad del ajuste, ya que su comportamiento debe ser el de un proceso
de ruído gaussiano de media nula y varianza constante.
El estimador de la varianza del modelo es la varianza residual s2R=SCR/[4(n−1)].
Se acostumbra a realizar los siguientes contrastes de hipótesis, en los que todos los
estadísticos tienen distribución F:
H0:A=0, frente a H1:A≠0:
SCAs2R∼F1;4(n−1)
H0:B=0, frente a H1:B≠0:
SCBs2R∼F1;4(n−1)
H0:AB=0, frente a H1:AB≠0:
SCABs2R∼F1;4(n−1)
Estos contrastes permiten comprobar tanto si los factores actúan sobre la variable respuesta
como si también lo hacen sus interacciones. Si el p-valor asociado es menor de 0.05, existen
indicios de que el factor o interacción correspondiente es significativo.
El estudio de la tabla del análisis de la varianza se completa con el gráfico de interacciones,
que facilita la visualización del comportamiento de los factores. En cualquier caso, siempre
es necesario comprobar si el modelo se ajusta bien a los datos experimentales analizando
los residuos.
El programa que se incluye permite desarrollar un diseño factorial 22. El número de réplicas
debe cumplir 2≤n≤5.
En un experimento para mejorar la calidad de fabricación de un circuito electrónico, se han
considerado dos factores de fabricación, cada uno de ellos a dos niveles. Para cada
combinación de niveles se han realizado un total de cuatro réplicas. El objetivo del análisis es
ver cómo afectan estos niveles a la variable respuesta. Aunque los datos se han introducido
en la aplicación de forma sistemática, lo conveniente es realizar las réplicas en orden
aleatorio para evitar posibles sesgos.
Diseño factorial 23 con réplicas
En el modelo factorial 23 tenemos tres factores, A B y C, cada uno de ellos a dos niveles, a
los que llamaremos inferior (-1) y superior (+1). Las unidades experimentales se obtienen
tomando las ocho posibles combinaciones de ambos factores y replicándolo n veces, con
n>1 (el caso n=1 no lo trataremos aquí). Como es habitual, el objetivo fundamental del
experimento consiste en estudiar si los factores y sus posibles interacciones tienen una
influencia significativa sobre la variable respuesta.
Formalmente, el modelo se reduce a la ecuación
yijmk=β0+β1x1+β2x2+β3x3+β12x1x2+β13x1x3+β23x2x3+uijmk,
con i,j,m∈{−,+} y k=1,…,n, donde yijmk es el resultado observado en la k-ésima réplica
asociada al nivel i del factor A, al nivel j de B y al m de C. Los números x1, x2 y x3 toman los
valores -1 y 1, según los factores tomen los niveles inferior o superior, respectivamente. Las
fluctuaciones aleatorias uijmk son todas ellas independientes y normales, de media nula y
desviación típica σ desconocida, uijmk∼N(0,σ).
Los coeficientes β1, β2 y β3 del modelo miden el incremento de la respuesta cuando el
factor correspondiente cambia en una unidad. La misma interpretación tiene los parámetros
de interacción β12, β13, β23 y β123. Sin embargo, en los diseños 23 se acostumbra a estimar
los efectos A, B y C, que miden la variación de la respuesta cuando los factores pasan del
nivel inferior al superior, siendo entonces A=2β1, B=2β2, C=2β3, AB=2β12, AC=2β13,
BC=2β23 y ABC=2β123, cuyos estimadores se obtendrán una vez ajustado el modelo
anterior por el método de los mínimos cuadrados.
El diseño factorial estudia la influencia simultánea de dos o más VI (factores) sobre una, o
más de una, VD.
Cada factor puede tener dos o más valores (o niveles). Cada tratamiento (o condición
experimental) consiste en la combinación de los respectivos valores de un factor con los del
otro (u otros).
Al analizar simultáneamente dos o más factores en un solo experimento se puede estudiar:
El efecto de cada factor por separado (como si se tratara de un diseño con una sola VI). El
efecto de la combinación de los niveles de los diferentes factores sobre la VD. El
experimento factorial más sencillo consta de dos factores con dos niveles cada uno: Diseño
factorial AxB
A: número de niveles de un factor.
B: número de niveles del otro factor.
A medida que aumenta el número de factores y el número de niveles de cada factor,
aumenta el número de tratamientos y la dificultad para realizar, controlar e interpretar el
experimento.
Ej: Queremos ver la influencia del tipo de escenario y la ansiedad en quienes participan de
un curso (diseño factorial 2x3):
Factores = 2.
Escenario (con 2 niveles: virtual y presencial).
Ansiedad (con 3 niveles: alta, media y baja).
Número de tratamientos = 6 (2x3=6)
Considere los factores A y B con a y b (a, b ≥ 2) niveles de prueba, respectivamente. Con
ellos se puede construir el diseño factorial a x b que consiste en a x b tratamientos. Se llama
réplica a cada repetición completa del arreglo factorial. Los diseños factoriales que
involucran menos de 4 factores se corren replicados para poder tener la potencia necesaria
en las pruebas estadísticas sobre los efectos de interés, de tal forma que si se hacen n
réplicas, el número total de corridas experimentales es n(a x b).
Modelo Estadístico:
Con un diseño factorial a x b se pueden estudiar los efectos individuales y el efecto de
interacción de ambos factores. En términos estadísticos lo que se afirma es que el
comportamiento de la variable respuesta Y en el experimento con k réplicas se podrá
escribir mediante:
Donde es la media general, es el efecto del i-ésimo nivel del factor A, es el efecto del j-
ésimo nivel del factor B, representa el efecto de interacción en la combinación ij y es el
error aleatorio que supone sigue una distribución con media cero y varianza constante y
son independientes entre sí. Para que la estimación de los parámetros en este modelo sea
única, se introducen las restricciones: y
Es decir, los efectos dados en el modelo son desviaciones respecto de la media global.
Hipótesis a evaluar y análisis de varianza
Para el Factor A
Ó
Para el Factor B
Ó
Para la interacción AB:
Ó
El ANOVA para un diseño factorial a x b con n réplicas resulta de descomponer la variación
total como:
SST=SSA+SSB+SSAB+SSE
Y la tabla de ANOVA está dada por:

Ejemplo:
En un experimento llevado a cabo para determinar cuál de tres sistemas de misiles es
preferible, se midió el promedio de consumo de los propulsores para 24 encendidos
estáticos. Se utilizaron cuatro tipos diferentes de propulsores. En el experimento se
obtuvieron observaciones duplicadas de promedios de consumo en cada combinación de los
tratamientos. Los datos aparecen a continuación:

Ejercicios:
Se realizó un estudio con el objetivo de averiguar la estabilidad de la vitamina C en
concentrado de jugo de naranja congelado reconstituido que se almacena en un refrigerador
por un periodo de hasta una semana. Tres tipos de concentrado de jugo de naranja
congelado se probaron utilizando tres periodos diferentes de tiempo. Estos últimos se
refieren al número de días que transcurren desde que el jugo de naranja se mezcla hasta
que se somete a la prueba. Los resultados, en miligramos de ácido ascórbico por litro, se
registraron de la siguiente manera, según se indica en la siguiente tabla.
Utilice un nivel de significancia de 0,05 para probar las hipótesis:
No existe diferencia en los contenidos de ácido ascórbico entre las diferentes marcas de
concentrado de jugo de naranja.
No existen diferencias en los contenidos de ácido ascórbico debido a los diferentes periodos
de tiempo.
Las marcas de concentrado de jugo de naranja y el número de días que transcurre desde que
el jugo se mezcla hasta que se somete a la prueba no interactúan.

Se realizó un estudio para determinar qué músculos necesitan sujetarse a un programa de


acondicionamiento de tal forma que se mejore el comportamiento de un jugador en el
servicio tendido utilizado en tenis. Se probaron cinco músculos diferentes: deltoide anterior,
pectoral mayor, deltoide posterior, deltoide medio y tríceps; en cada uno de tres individuos,
y el experimentador se llevó a cabo tres veces para cada combinación de tratamiento. Los
datos del electromiograma, registrados durante el servicio fueron los siguientes:

Individuos diferentes tienen iguales mediciones de electromiograma.


Diferentes músculos no tienen efecto sobre las mediciones electromiográficas.
Los sujetos y los tipos de músculos no ineractúan.

Un ingeniero está diseñando una batería para usarse en un aparato que estará sujeto a
variaciones extremas de temperatura. Tiene tres opciones para el material de la placa para la
batería, y como sabe que la temperatura afecta la vida de la batería decide probar tres
temperaturas: 15°F, 70°F, 125°F. Se prueban 4 baterías en cada combinación de material y
temperatura y las 36 pruebas se corren en orden aleatorio (completamente al azar). Los
datos son vida (en horas) de las baterías.
¿Qué efectos produce el material y la temperatura en la vida de la batería?
Existe un material que produzca uniformemente más larga vida a la batería sin importar la
temperatura?
Se estudia el rendimiento de un proceso químico. Se piensa que las dos variables más
importantes son la presión y la temperatura. Se seleccionan tres niveles de cada factor y se
lleva a cabo un experimento factorial con dos réplicas. Los datos del rendimiento son:

Analice los datos, ¿qué concluye?


¿Bajo qué condiciones debe operarse este sistem
Un ingeniero sospecha que el acabado superficial de una pieza metálica se afecta por la
velocidad de alimentación y la profundidad de corte. Selecciona tres velocidades de
alimentación y cuatro profundidades de corte. Se realiza un experimento factorial y se
obtiene los siguientes resultados:
Se describe un experimento para investigar el efecto del tipo de cristal y el tipo de fósforo
sobre la brillantez de un cinescopio. Los datos son la corriente en micro amperes necesaria
para obtener un nivel de brillantez específico. Los datos son los siguientes.
Diseños factoriales con tres factores

Supongamos que hay a niveles para el factor A, b niveles del factor B y c niveles
para el factor C y que cada réplica del experimento contiene todas las posibles
combinaciones de tratamientos, es decir contiene los abc tratamientos posibles.

El modelo sin replicación


El modelo estadístico para este diseño es:

yijk = µ + τi + βj + γk + (τβ)ij + (τγ)ik + (βγ)jk + (τβγ)ijk + uijk


con i = 1, 2, · · · , a ; j = 1, 2, · · · , b ; k = 1, 2, · · · , c donde

τi, βj y γk: Son los efectos producidos por el nivel i-ésimo del factor A, ( i τi = 0),
por el nivel j-ésimo del factor B, j βj = 0 y por el nivel k-ésimo del factor C,

( k γk = 0), respectivamente.
(τβ)ij , (τγ)ik , (βγ)jk y (τβγ)ijk: Son los efectos producidos por las interacciones
entre A × B, A × C, B × C y A × B × C, respectivamente

(τβ)ij = (τβ)ij = (τγ)ik = (τγ)ik = (βγ)jk = (βγ)jk =


i j i k j k

= (τβγ)ijk = (τβγ)ijk = (τβγ)ijk = 0


i j k
Supondremos que se toma una observación por cada combinación de factores, por
tanto, hay un total de n = abc observaciones.
Parámetros a estimar:

Parámetros Número
µ 1
τi a−1
βj b−1
γ
k c−1
(τβ)ij (a − 1)(b − 1)
(τγ)ik (a − 1)(c − 1)
(βγ)jk (b − 1)(c − 1)
(τβγ)ijk (a − 1)(b − 1)(c − 1)
2
σ 1
Total abc + 1

A pesar de las restricciones impuestas al modelo, el número de parámetros


(abc + 1) supera al número de observaciones (abc). Por lo tanto, algún parámetro no
será estimable.

Estimación de los parámetros del modelo


Los estimadores máximos verosímiles de los parámetros del modelo son

El E.M.V. de µ es µ = y¯...

Los E.M.V. de los efectos principales son:


− y¯ ; β − ; −
... y¯ = y¯ y¯
τi = y¯i.. j = y¯.j. ... γk ..k ...

− −
Los E.M.V. de las interacciones de segundo orden son: τβ ij = yij. y¯i.. y¯.j. + y¯...

− − − −
(τγ)ik = yi.k y¯i.. y¯...k + y¯... ; βγ jk = y.jk y¯.j. y¯...k + y¯...
El E.M.V. de la interacción de tercer orden

τβγ ijk = yijk − µ − τi − βj −γk − τβ ij − (τγ)ik − βγ jk =


y − y − y¯ − y¯ + y¯ + y¯ + y¯ − y¯
= ijk ij. i.k .jk i.. .j. ..k ...

Descomposición de la variabilidad

En este modelo la variabilidad total se descompone en:

SCT = SCA + SCB + SCC + SC(AB) + SC(AC) + SC(BC) + SC(ABC) + SCR


El modelo sin replicación

Estas sumas de cuadrados se pueden expresar como:

2 2 2 2
SCT = i,j,k yijk − y... /(abc) ; SCA = i yi .. /bc − y... /(abc)

2 2 2 2
SCB = j y. j. /(ac) − y... /(abc) ; SCC = k y.. k /(ab) − y... /(abc)

2 2
SC(AB) = i,j yij . /c− y... /(abc)−SCA−SCB: S. C. de la interacción A×B

2 2
SC(AC) = i,k yi .k /b− y... /(abc)−SCA−SCC: S. C. de la interacción A×C
2 2
SC(BC) = j,k y. jk /a− y... /(abc)−SCB−SCC: S. C. de la interacción B×C

2 2
SC(ABC) = i,j,k yijk − y... /(abc)−SCA−SCB −SCC −SC(AB)−SC(AC)−
−SC(BC): S. C. de la interacción A × B × C

Al tratarse de un modelo sin replicación, los contrastes sólo se pueden realizar si se


supone que la interacción de tercer orden es cero. En esta hipótesis, CM(ABC) = CMR y
los contrastes de cada uno de los factores e interacciones comparan su cuadrado medio
correspondiente con la varianza residual para construir el estadístico de contraste.
El objetivo del análisis es realizar los contrastes de hipótesis nula que se muestran a
continuación junto con el estadístico de contraste correspondiente:
CMA H
≡ ··· 0A
i) H0A τ1 = = τa = 0 : FA = CMR F(a−1),(a−1)(b−1)(c−1)
CMB H
ii) H ≡ β = · · · = β = 0 : F = 0B
F
0B 1 b B CMR (b−1),(a−1)(b−1)(c−1)
CMC H

iii) H ≡ γ = · · · = γ = 0 : F = 0C
F
0C 1 c C CMR (c−1),(a−1)(b−1)(c−1)
CM(AB) H0(AB)
iv) H0(AB) ≡ (τβ)ij = 0, ∀i, j : F(AB) = F(a−1)(b−1),(a−1)(b−1)(c−1)
CMR
CM(AC) H0(AB)
v) H0(AC) ≡ (τγ)ik = 0, ∀i, k : F(AC) = F(a−1)(c−1),(a−1)(b−1)(c−1)
CMR
CM(BC) H0(ACB)
vi) H0(BC) ≡ (βγ)jk = 0, ∀ j, k : F(BC) = F(b−1)(c−1),(a−1)(b−1)(c−1)
CMR

Fijado un nivel de significación α, se rechaza la H0 correspondiente, si FEXP > Fteórica.


Modelo factorial con tres factores (sin replicación)

F. V. S. C. G. L. C. M. Fexp
Factor A SCA a−1 CMA CMA/CMR
Factor B SCB b−1 CMB CMB/CMR
Factor C SCC c−1 CMC CMC/CMR
A×B SC(AB) (a − 1)(b − 1) CM(AB) CM(AB)/CMR
A×C SC(AC) (a − 1)(c − 1) CM(AC) CM(AC)/CMR
B×C SC(BC) (b − 1)(c − 1) CM(BC) CM(BC)/CMR
A×B×C SC(ABC) (a − 1)(b − 1)(c − 1) CMR CM(ABC)/CMR
TOTAL SCT abc − 1 CMT

Ejemplo
Se están investigando los efectos sobre la resistencia del papel que producen la con-
contracción de fibra de madera (factor A), la presión del tanque (factor B) y el tiempo
de cocción de la pulpa (factor C). Se seleccionan dos niveles de la concentración de
madera (τ1, τ2), tres niveles de la presión (β1, β2, β3) y dos niveles del tiempo de
cocción (γ1, γ2). Pueden considerarse todos los factores fijos. Analizar los resultados y
obtener las conclusiones apropiadas.

γ1 γ2
β1 β2 β3 β1 β2 β3
τ1 y111 = 10 y121 = 20 y131 = 2 y112 = 6 y122 = 23 y132 = −2
y y y
τ2 211 = 26 221 = 28 y231 = 30 y212 = 30 222 = 34 y232 = 32

Vamos a calcular los totales marginales y las sumas de cuadrados

A×B β1 β2 β3 A
τ1 y11. = 16 y12. = 43 y13. = 0 y1.. = 59
τ2 y21. = 56 y22. = 62 y23. = 62 y2.. = 180
B y,1. = 72 y,2. = 105 y,3. = 62 y... = 239

γ γ
A×C 1 2 B×C γ1 γ2
y y
τ1 y1,1 = 32 y1,2 = 27 β1 ,11 = 36 ,12 = 36
y y
τ2 y2,1 = 84 y2,2 = 96 β2 ,21 = 48 ,22 = 57
C y.,1 = 116 y.,2 = 123 β3 y,31 = 32 y,22 = 30
2 2
y (239)
...

2
SCT = i,j,k yijk − abc = 6513 − 12 = 1752,9
2 2 2 2 2
y y ...
(59) + (180) (239)

SCA = bci i.. − abc = 6 − 12 = 1220,08


2 2 2 2 2 2
SCB = j y. j. − y... = (72) + (105) + (62) − (239) = 253,17
ac abc 4 12
2 2 2 2 2
k
y y (116) + (123) (239)
...

SCC = ab ..k − abc = 6 − 12 = 4,083


2 2 2 2 2
SC(AB) = − y... − SCA − SCB = (16) + · · · + (62)
i,j yij. − (239) −
c abc 2 12
−SCA − SCB = 231,16
2 2 2 2 2
SC(BC) = j,k y. jk − y... − SCB − SCC = (36) + · · · + (30) − (239) −
a abc 2 12
−SCB − SCC = 17,16
2 2 2 2 2
SC(AC) = i,k yi .k − y... − SCA − SCC = (32) + · · · + (96) − (239) −
b abc 3 12
−SCB − SCC = 24,08

SCR = SCT − SCA − SCB − SCC − SC(AB) − SC(AC) − SC(BC)−


−SC(ABC) = 3,167.
La Tabla ANOVA resultante es:
F
F. V. S.C. G.L. C.M. exp

Factor A 1220,08 1 1220,08 770,579


Factor B 253,16 2 126,58 79,947
Factor C 4,083 1 4,083 2,579
A×B 231,16 2 115,58 73,00
A×C 24,083 1 24,083 15,211
B×C 17,167 2 8,583 5,421
Residual 3,167 2 1,583
TOTAL 1752,9 11

Realizando los contrastes al nivel de significación del 5 %, se concluye que son


significativos los efectos de los factores A (F0,05,1,2 = 18,51), B y A × B (F0,05,2,2 = 19).
El modelo con replicación

El modelo estadístico para este diseño es:


y = µ + τ + β + γ + (τβ) + (τγ) + (βγ) + (τβγ) + u
ijkl i j k ij ik jk ijk ijkl
i = 1, 2, · · · , a ; j = 1, 2, · · · , b ; k = 1, 2, · · · , c ; l = 1, 2, · · · , r

donde r es el número de replicaciones y n = abcr es el número de observaciones.


El número de parámetros de este modelo es, como en el modelo de tres factores sin
replicación, abc + 1 pero en este caso el número de observaciones es abcr.
Las sumas de cuadrados tienen las siguientes expresiones:

y 2−y 2 2 2
SCT = i,j,k,l ijkl .... /(abcr) ; SCA = i yi ... /(bcr) − y.... /(abcr)

y 2 2 y2 2
SCB = j .j.. /(acr)− y.... /(abcr) ; SCC = k .. k. /(abr)− y.... /(abcr)

2 2
SC(AB) = i,j yij.. /(cr) − y.... /(abcr) − SCA − SCB

2 2
SC(BC) = j,k y.jk . /(ar) − y.... /(abcr) − SCB − SCC

2 2
SC(AC) = i,k yi.k . /(br) − y.... /(abcr) − SCA − SCC
y 2 2
SC(ABC) = i,j,k ijk . /r − y.... /(abcr) − SCA − SCB − SCC − SC(AB)−
−SC(AC) − SC(BC)

SCR = SCT − SCA − SCB − SCC − SC(AB) − SC(AC) −SC(BC) − SC(ABC).

En este modelo, el objetivo del análisis es realizar los contrastes de hipótesis nula que,
junto al estadístico de contraste, se muestran a continuación:
CMA H
i) H ≡ τ = · · · = τ = 0 : F = 0A
F
0A 1 a A CMR (a−1),abc(r−1)
CMB H

ii) H ≡ β = · · · = β = 0 : F = 0B
F
0B 1 b B CMR (b−1),abc(r−1)
CMC H

iii) H ≡ γ = · · · = γ = 0 : F = 0C
F
0C 1 c C CMR (c−1),abc(r−1)
CM(AB) H0(AB)
iv) H0(AB) ≡ (τβ)ij = 0, ∀i, j : F(AB) = F(a−1)(b−1),abc(r−1)
CMR
El modelo con replicación

CM(AC) H
v) H ≡ (τγ) = 0, ∀i, k : F = 0(AC) F − − −
0(AC) ik (AC) (a 1)(c 1),abc(r 1))
CMR
CM(BC) H
vi) H ≡ (βγ) = 0, ∀j, k : F = 0(BC) F − − −
0(BC) jk (BC) (b 1)(c 1),abc(r 1)
CMR
CM(ABC) H
vii) H ≡ (αβγ) = 0, ∀i, j, k : F = 0(ABC) F− − − −
0(ABC) ijk (ABC) (a 1)(b 1)(c 1),abc(r 1)
CMR
Modelo factorial con tres factores (con replicación)
F. V. S. C. G. L. C. M. Fexp
Factor A SCA a−1 CMA CMA/CMR
Factor B SCB b−1 CMB CMB/CMR
Factor C SCC c−1 CMC CMC/CMR
AxB SC(AB) (a − 1)(b − 1) CM(AB) CM(AB)/CMR
AxC SC(AC) (a − 1)(c − 1) CM(AC) CM(AC)/CMR
BxC SC(BC) (b − 1)(c − 1) CM(BC) CM(BC)/CMR
AxBxC SC(ABC) (a − 1)(b − 1)(c − 1) CM(ABC) CM(ABC)/CMR
Residual SCR abc(r − 1) CMR
TOTAL SCT abcr − 1 CMT

La diagnosis y validación del modelo se realiza igual que en los modelos anteriores.

Ejemplo
Supongamos de nuevo la situación del Ejemplo 6.2 en la que, en este caso, se
seleccionan tres niveles de la concentración de madera (τ 1, τ2, τ3) y dos niveles de la
presión (β1, β2) y del tiempo de cocción (γ1, γ2). Pueden considerarse todos los factores
fijos.
Se re-aliza un experimento factorial con dos réplicas y se recopilan los siguientes datos.
Analizar los resultados y obtener las conclusiones apropiadas.

γ1 γ2
β β β β
Operario 1 2 1 2
y = −3 y = −1 y = −1 y =1
1111 1211 1121 1221
τ1 y =0 y =0 y =1
y1112 = −1 1212 1122 1222

y2111 = 0 y2211 = 2 y2121 = 2 y2221 = 6


τ2 y =1 y y y =5
2112 2212 =1 2122 =3 2222

τ3 y2111 = 5 y3211 = 7 y3121 = 7 y3221 = 10


y3112 = 4 y3212 = 6 y3122 = 9 y3222 = 11

Vamos a calcular los totales marginales y las sumas de cuadrados


A×B×C γ1 γ2
β1 β2 β1 β2 A
y =2
τ1 y111. = −4 y121. = −1 y112. = −1 122. −4
τ2 y211. = 1 y221. = 3 y212. = 5 y222. = 11 20
τ3 y311. = 9 y321. = 13 y312. = 16 y322. = 21 59

A×B β1 β2 A×C γ1 γ2
y = −5 y =1 y = −5 y =1
τ1 11.. 12.. τ1 1,1. 1,2.
τ y =6 y = 14 τ y =4 y = 16
2 21.. 22.. 2 2,1. 2,2.

τ3 y31.. = 25 y32.. = 34 τ3 y3,1. = 22 y3,2. = 37


B y,1.. = 26 y,2.. = 49 C y.,1. = 21 y.,2. = 54

B×C γ1 γ2
y =6
β1 ,11. y,12. = 20
β y = 15 y = 34
2 ,21. ,22.

2 2
y 75
SCT = y 2−
....

i,j,k,l ijkl abcr = 571 − 24 = 336,62


2 2 2 2 2 2
SCA = i yi ... − y.... =(−4) + (20) + (59) − 75 = 252,75
bcr abcr 8 24
2 2 2 2 2
SCB = j y. j.. − y.... = (26) + (49) − 75 = 22,042
acr abcr 12 24
2 2 2 2 2
SCC = k y.. k. − y.... = (21) + (54) − 75 = 45,37
abr abcr 12 24
y 2 2 2 2 2
SC(AB) = i,j ij.. − y.... − SCA − SCB = (−5) + · · · + (34) − 75 −
cr abcr 4 24
−252,75 − 22,042 = 0,583

y2 2 2 2 2
j,k . jk. y.... (6) + · · · + (34) 75
SC(BC) = − − SCB − SCC =
ar abcr − −
−22,042 − 45,37 = 1,042 6 24

y2 2 2 2 2
i,k i .k. (−5) + · · · + (37) 75
SC(AC) = − y.... − SCA − SCC = − −
br abcr 4 24
−252,75 − 45,37 = 5,25
y2 2
i,j,k i .jk.
SC(ABC) = − y.... − SCA − SCB − SCC − SC(AB)−
r abcr
2 2 2 2
−SC(AC) − SC(BC) = (−4) + (−1) + · · · + (21) − 75 −
4 24
−252,75 − 22,042 − 45,37 − 0,583 − 5,25 − 1,042 = 1,083

SCR = SCT −SCA−SCB−SCC−SC(AB)−SC(AC)−SC(BC)−SC(ABC) = 8,5.


La Tabla ANOVA resultante es:
F
F. V. S. C. G. L. C. M. exp

Factor A 252,75 2 1265,375 178,412


Factor B 22,042 1 22,042 31,118
Factor C 45,375 1 45,375 64,059
A×B 0,583 2 0,292 0,412
A×C 5,25 2 2,625 3,706
B×C 1,042 1 1,042 1,471
A×B×C 1,083 2 0,542 0,765
Residual 8,5 12 0,708
TOTAL 336,625 23

Realizando los contrastes al nivel de significación del 5 %, se concluye que son


significativos los efectos de los factores A (F0,05,2,12 = 3,89), B y C (F0,05,1,12 = 4,75)
pero no son significativos los efectos de todas las interacciones.

Diseños factoriales con más de tres factores


Las ideas anteriores se extienden inmediatamente para modelos factoriales con cualquier
1
número de factores . Para más de tres factores, las interacciones superiores a tres suelen
suponerse nulas, lo que permite obtener una estimación del error experimental.
Consideremos un diseño con cuatro factores a niveles N1, N2, N3, N4. Las N1 × N2 ×
N3 × N4 observaciones permiten estimar:

La media general µ
4 4
i=1 (Ni − 1) = i=1 Ni − 4 efectos principales

1Véase Peña (1989) página 116.


Diseños factoriales con tres factores

4
(Ni − 1) (Nj − 1) interacciones de segundo orden para cada una de las 2 parejas
de interacciones de segundo orden

4
(Ni − 1) (Nj − 1) (Nk − 1) interacciones de tercer orden para cada una de las 3
interacciones de tercer orden

Si suponemos que las interacciones de cuarto orden son cero, tendremos:


(N1 − 1) (N2 − 1) (N3 − 1) (N4 − 1)
grados de libertad para calcular los residuos y efectuar los contrastes.

Bibliografía utilizada

∗ Lara Porras, A.M. (2000). “Diseño Estadístico de Experimentos, Análisis de la Va-


rianza y Temas Relacionados: Tratamiento Informático mediante SPSS.”
Proyecto Sur de Ediciones.

Вам также может понравиться