Вы находитесь на странице: 1из 14

INSTITUTO TECNOLÓGICO DE CAMPECHE

INGENIERIA INDUSTRIAL

Tarea NUM: 1 NOMBRE DEL TRABAJO: investigación


conceptual
Unidad NUM: 4 NOMBRE DE LA UNIDAD: diseño de bloques

Nombre del alumno:


Materia:
Estadística inferencial 2
Maestro:
Bocos Patrón Ramón Agustín
Grupo:
MI4

29/04/2019
Contenido
Introducción ........................................................................................................................................ 3
Diseño de bloques completamente aleatorizados.............................................................................. 4
Factores de bloqueo ........................................................................................................................ 4
Modelo estadístico .......................................................................................................................... 5
Hipótesis a probar ........................................................................................................................... 5
Análisis de varianza ......................................................................................................................... 6
Pruebas sobre medias de tratamientos individuales .......................................................................... 6
Otros métodos para pruebas sobre la diferencia d/medias d/2 tratamiento .................................... 7
El método de Tukey......................................................................................................................... 7
Ejemplo de los intervalos de confianza de Tukey ........................................................................... 7
El Test de Duncan ............................................................................................................................ 8
El método de Dunnett ..................................................................................................................... 9
Análisis de residuales y verificación del modelo ............................................................................... 10
Diseño de cuadros latinos ................................................................................................................. 10
Diseño de cuadro grecolatino ........................................................................................................... 11
Referencias ........................................................................................................................................ 14
videos de apoyo al tema ................................................................................................................... 14

2
Introducción
Algunos experimentos diseñados pueden proveer información de manera efectiva cuando las
mediciones son difíciles o muy costosas de hacer o pueden minimizar el efecto de variabilidad no
deseada en la inferencia del tratamiento. A continuación una breve discusión de los dos diseños
comúnmente utilizadas. Para mostrar estos diseños, se consideran dos factores de tratamiento (A
y B) y su interacción (A*B). Sin embargo, estos diseños no están restringidos a dos factores. Si el
diseño es balanceado, se puede utilizar el ANOVA balanceado para analizar los datos. Si no es así,
utilice GLM.

En este tema

Diseño de bloques aleatorizados

Diseño de cuadrados latinos con medidas repetidas

Este documento tiene como objetivo dar a conocer la parte conceptual de la unidad 4 de la
materia estadística inferencial 2 para la carrera de ingeniería industrial

3
Diseño de bloques completamente aleatorizados
Cuando se quieren comparar ciertos tratamientos o estudiar el efecto de un factor, es deseable
que las posibles diferencias se deban principalmente al factor de interés y no a otros factores que
no se consideran en el estudio. Cuando esto no ocurre y existen otros factores que no se controlan
o nulifican para hacer la comparación, las conclusiones podrían ser afectadas sensiblemente. Por
ejemplo, supongamos que se quieren comprar varias máquinas, si cada máquina es manejada por
un operador diferente y se sabe que éste tiene una influencia en el resultado, entonces es claro
que el factor operador debe tomarse en cuenta si se quiere comparar a las máquinas de manera
justa. Un operador más hábil puede hacer ver a su máquina (aunque ésta sea la peor) como la que
tiene el mejor desempeño, lo cual impide hacer una comparación adecuada de los equipos. Para
evitar este sesgo hay dos maneras de anular el posible efecto del factor operador: la manera lógica
es utilizar el mismo operador en las cuatro máquinas; sin embargo, tal estrategia no siempre es
aconsejable, ya que utilizar al mismo sujeto elimina el efecto del factor operador pero restringe la
validez de la comparación con dicho operador, y es posible que el resultado no se mantenga al
utilizar a otros operadores. La otra forma de anular el efecto operador en la comparación consiste
en que cada operador trabaje durante el experimento con cada una de las máquinas. Esta
estrategia es la más recomendable, ya que utilizar a todos los operadores con todas las máquinas
permite tener resultados de la comparación que son válidos para todos los operadores. Esta
última forma de nulificar el efecto de operadores, recibe el nombre de bloqueo.

Factores de bloqueo
A los factores adicionales al factor de interés que se incorporan de manera explícita en un
experimento comparativo se les llama factores de bloque. Éstos tienen la particularidad de que no
se incluyen en el experimento porque interese analizar su efecto, sino como un medio para
estudiar de manera adecuada y eficaz al factor de interés. Los factores de bloque entran al estudio
en un nivel de importancia secundaria con respecto al factor de interés y, en este sentido, se
puede afirmar que se estudia un solo factor, porque es uno el factor de interés. Por ejemplo, en el
caso de comparar cuatro máquinas que son manejadas por cuatro operadores, es pertinente
incluir explícitamente al factor operadores (bloques) para lograr el propósito del estudio, pero esta
inclusión no es con el fin de estudiar el efecto del factor operador (o comparar a los operadores).
Más bien, la inclusión de los operadores es un medio y no un fin para lograr una comparación
adecuada y eficaz de las máquinas. Puede ser que además de los operadores existan otros factores
de bloque que deban controlarse durante el experimento para lograr una comparación adecuada
de las máquinas. También se podrían controlar: el tipo de material, lotes, tipo de producto, día,
turno, etc., pero no se trata de caer en el extremo de querer controlarlo todo, sino básicamente
aquellos factores que por conocimiento del proceso o experiencia previa, se sabe que afectan en
forma considerable el resultado de la comparación.

En un DBCA se consideran 3 fuentes de variabilidad: factor de tratamientos, factor de bloque, y


error aleatorio es decir se tienen tres posibles “culpables” de la variabilidad presente en los datos.
La palabra completo en el nombre del diseño se debe a que en cada bloque se prueban todos los
tratamientos, o sea, los bloques están completos. La aleatorización se hace dentro de cada bloque;

4
por lo tanto, no se realiza de manera total como en el diseño completamente al azar. El hecho de
que existan bloques hace que no sea práctico o que incluso sea imposible aleatorizar en su
totalidad. Los factores de bloqueo que aparecen en la práctica son: turno, lote, día, tipo de
material, línea de producción, operador, máquina, método, etc. La imposibilidad de aleatorizar de
bloque a bloque se aprecia claramente cuando se bloquean factores como día o turno, ya que no
tiene sentido pensar en seleccionar al azar el orden de los días o los turnos porque es imposible
regresar el tiempo. Supongamos una situación experimental con k tratamientos y b blo ques. El
aspecto de los datos para este caso se muestra en la tabla 4.1, y considera una repetición en cada
combinación de tratamiento y bloque.

Modelo estadístico
Cuando se decide utilizar un DBCA, el experimentador piensa que cada medición será el resultado
del efecto del tratamiento donde se encuentre, del efecto del bloque al que pertenece y de cierto
error que se espera sea aleatorio. El modelo estadístico para este diseño está dado por:

donde Yij es la medición que corresponde al tratamiento i y al bloque j (ver tabla 4.1); m es la
media global poblacional; ti es el efecto debido al tratamiento i, gj es el efecto

debido al bloque j, y eij es el error aleatorio atribuible a la medición Yij. Se supone que los errores
se distribuyen de manera normal con media cero y varianza constante s2 [N(0, s2)], y que son
independientes entre sí.

Hipótesis a probar
Hipótesis a probar La hipótesis de interés es la misma para todos los diseños comparativos, y está
dada por:

5
En cualquiera de estas hipótesis la afirmación a probar es que la res puesta media poblacional
lograda con cada tratamiento es la misma para los k tratamientos y que, por lo tanto, cada
respuesta media mi es igual a la media global poblacional, m. De manera alternativa, es posible
afirmar que todos los efectos de tratamiento sobre la variable de respuesta son nulos, porque
cuando el efecto ti = mi – m = 0, entonces necesariamente la respuesta media del tratamiento es
igual a la media global (mi = m).

Análisis de varianza
La hipótesis dada por (4.2 o 4.3) se prueba con un análisis de varianza con dos criterios de
clasificación, porque se controlan dos fuentes de variación: el factor de trata mientos y el factor de
bloque. En la tabla 4.2 se muestra el aspecto del ANOVA para diseño DBCA.

Pruebas sobre medias de tratamientos individuales


Comparación de parejas de medias de tratamiento en el DBCA. Cuando se rechaza la hipótesis de
igualdad de los cuatro tratamientos, es natural preguntarse cuáles de ellos son diferentes entre sí.
Para averiguarlo se utiliza alguna de las pruebas que se estudiaron en la sección “Comparaciones o
pruebas de rango múltiples” del capítulo anterior. Por ejemplo, recordemos que la dife rencia
mínima significativa (LSD) para dos tratamientos, i y l, en un DCA está dada por

Entonces, en bloque esta expresión se transforma en

6
Otros métodos para pruebas sobre la diferencia d/medias d/2
tratamiento
El método de Tukey
Se utiliza en ANOVA para crear intervalos de confianza para todas las diferencias en parejas entre
las medias de los niveles de los factores mientras controla la tasa de error por familia en un nivel
especificado. Es importante considerar la tasa de error por familia cuando se hacen
comparaciones múltiples, porque la probabilidad de cometer un error de tipo I para una serie de
comparaciones es mayor que la tasa de error para cualquier comparación individual. Para
contrarrestar esta tasa de error más elevada, el método de Tukey ajusta el nivel de confianza de
cada intervalo individual para que el nivel de confianza simultáneo resultante sea igual al valor que
usted especifique.

Ejemplo de los intervalos de confianza de Tukey

Usted está midiendo los tiempos de respuesta de circuitos integrados de memoria. Tomó una
muestra de 25 circuitos integrados de cinco fabricantes diferentes.

Usted decide examinar las 10 comparaciones entre las cinco plantas para determinar
específicamente cuáles medias son diferentes. Usando el método de Tukey, usted especifica que
todo el conjunto de comparaciones debe tener una tasa de error por familia de 0.05 (equivalente a
un nivel de confianza simultáneo de 95%). Minitab calcula que los 10 niveles de confianza
individuales deben ser de 99.35% para obtener el nivel de confianza conjunto de 95%. Estos
intervalos de confianza de Tukey más amplios ofrecen estimaciones menos precisas del parámetro
de población, pero limitan a un máximo de 5% la probabilidad de que uno o más intervalos de
confianza no contengan la verdadera diferencia. Entendiendo este contexto, usted puede
examinar entonces los intervalos de confianza para determinar si alguno de ellos no incluye el
cero, lo que indica una diferencia significativa.

Intervalos de confianza con niveles de confianza individuales de 95%

7
Intervalos de confianza con niveles de confianza individuales de 99.35% para obtener un nivel de
confianza conjunto de 95% utilizando el método de Tukey

Comparación de los intervalos de confianza de 95% con los intervalos de confianza más amplios de
99.35% utilizados por el método de Tukey en el ejemplo anterior. La línea de referencia en 0
muestra cómo los intervalos de confianza más amplios de Tukey pueden cambiar sus conclusiones.
Los intervalos de confianza que contienen cero indican que no hay diferencia. (Por razones de
espacio, solo se muestran 5 de las 10 comparaciones).

El Test de Duncan
Es un test de comparaciones múltiples. Permite comparar las medias de los t niveles de un factor
después de haber rechazado la Hipótesis nula de igualdad de medias mediante la técnica ANOVA.
Todos los tests de comparaciones múltiples son tests que tratan de perfilar, tratan de especificar,
tratan de concretar, una Hipótesis alternativa genérica como la de cualquiera de los Test ANOVA.

El Test de Duncan es muy similar al Test HSD de Tukey (Ver Herbario de técnicas), pero en lugar de
trabajar con un umbral fijo trabaja con un umbral cambiante. Un umbral que dependerá del
número de medias implicadas en la comparación.

Para saber el número de medias implicadas en la comparación se ordenan las medias muestrales
de menor a mayor y así al hacer una comparación entre dos medias sabremos además de las dos
medias comparadas cuantas medias quedan dentro. Este número de medias implicadas en
cualquier comparación de medias es el parámetro p de
este umbral.

Veamos este umbral y cómo se calcula:

8
Se basa el procedimiento, también, en la distribución de los rangos estudentizados (Ver Test HSD
de Tukey en el Herbario de técnicas).

Es interesante comparar el Test HSD y el Test de Duncan. Este cambio tanto en el número de
medias implicada como en el nivel de significación genera un umbral más pequeño. Esto da una
mayor capacidad de encontrar diferencias mediante el Test de Duncan porque los umbrales son
más pequeños y, por lo tanto, es más fácil encontrar diferencias entre las medias comparadas. En
estos casos, en Estadística, decimos que el Test de Tukey es más conservador que el Test de
Duncan o que tiene menor potencia.

Si se quiere comparar las diferentes técnicas de comparaciones múltiples es recomendable leer el


artículo Comparación entre técnicas de comparaciones múltiples.

El método de Dunnett
Se utiliza en ANOVA para crear intervalos de confianza para las diferencias entre la media de cada
nivel de factor y la media de un grupo de control. Si un intervalo contiene el cero, no hay
diferencia significativa entre las dos medias que están comparándose. Usted especifica una tasa de
error por familia para todas las comparaciones, y el método de Dunnett determina los niveles de
confianza para cada comparación individual según corresponda.

Ejemplo del método de Dunnett

Usted está evaluando tres píldoras para perder peso con el fin de determinar si son
significativamente diferentes de un placebo. En un experimento doble ciego, cincuenta personas
reciben la píldora A, cincuenta personas reciben la píldora B, cincuenta personas reciben la píldora
C y cincuenta personas reciben un placebo. El grupo del placebo es el grupo de control. Usted
registra la pérdida de peso promedio de cada grupo y realiza un ANOVA con el método de Dunnett
para determinar si cualquiera de las tres píldoras produce una pérdida de peso que sea
significativamente diferente del placebo. El método de Dunnett produce tres intervalos de
confianza: uno para la diferencia en la media de pérdida de peso entre el grupo A y el grupo del
placebo, otro para la diferencia en la media de pérdida de peso entre el grupo B y el grupo del
placebo y otro para la diferencia en la media de pérdida de peso entre el grupo C y el grupo del
placebo. Usted establece la tasa de error por familia para las tres comparaciones en 0.10, de modo
que el nivel de confianza para todas las comparaciones es de 90%.

El intervalo de confianza para la diferencia entre la píldora A y el placebo contiene el cero; por lo
tanto, usted concluye que no existe diferencia entre la pérdida de peso en el grupo A y el grupo
del placebo. El intervalo de confianza para la diferencia entre la píldora B y el placebo contiene
solamente números negativos; por lo tanto, usted concluye que los sujetos del grupo B perdieron
menos peso que los sujetos del grupo que recibió el placebo. En otras palabras, la píldora B
previene la pérdida de peso. Por último, el intervalo de confianza para la diferencia entre la
píldora C y el placebo contiene solamente números positivos; por lo tanto, usted concluye que la

9
píldora C produce una pérdida de peso significativamente mayor que un placebo. Como resultado
de este estudio, usted recomienda utilizar la píldora C.

Análisis de residuales y verificación del modelo


Comprobación de supuestos. Como se comentó antes, la validez del análisis de varianza recae en
tres supuestos que siempre deben verificarse: normalidad, varianza constante e independencia de
los residuos; además de la ausencia de observaciones atípicas o aberrantes. Como se observa en la
figura 4.2, el supuesto de normalidad se cumple al caer los residuos o puntos “más o menos en
línea recta” (figura 4.2a). También se cumple el supuesto de varianza constante de acuerdo a las
figuras 4.2b y

4.2c, en las que los residuos se ubican aleatoriamente dentro de una banda horizontal; su
dispersión vertical es la misma a lo largo de los gráficos. No se comprobó el supuesto de
independencia porque no se conoce el orden en que se realizaron las mediciones del desgaste.

Diseño de cuadros latinos


Selección y aleatorización de un cuadro latino No cualquier arreglo de letras latinas en forma de
cuadro es un cuadro latino. La regla fundamental es que cada letra debe aparecer sólo una vez en
cada renglón y en cada columna. Siempre es fácil construir un cuadro lati no estándar: en el que
en la primera columna y en el primer renglón aparecen las letras en orden alfabético. Por ejemplo,
un cuadro latino estándar de tamaño cuatro está dado por:

10
Existen además los siguientes tres cuadros latinos estándar de dimensión cuatro:

Para cuatro tratamientos se pueden construir un total de 576 cuadros latinos, de los cuales cuatro
son estándar. La selección del diseño debería ser elegir uno al azar de los 576 posibles; no
obstante, es prácticamente imposible construir todos para seleccionar uno al azar. Sin embargo,
ocurre que dado un cuadro latino, cualquier intercambio de columnas o de renglones también es
un cuadro latino. Por eso la estrategia de selección y aleatorización recomendada en la práctica es
la siguiente:

1. Se construye el cuadro latino estándar más sencillo.

2. Se aleatoriza el orden de los renglones (o columnas) y después se aleatoriza el orden de las


columnas (o renglones).

3. Por último, los tratamientos a comparar se asignan en forma aleatoria a las letras latinas.

El cuadro latino tiene dos restricciones a la aleatorización que se deben a los dos factores de
bloque, lo cual implica que a la hora de correr el experi mento no hay ningún margen de
aleatorización. Es decir, se puede correr por columna o por renglón según convenga. Lo que no es
correcto es hac er todas las pruebas de un tratamiento, luego todas las de otro, y así
sucesivamente, puesto que se puede introducir ruido adicional debido a factores no controlables
que cambian con el tiempo.

Diseño de cuadro grecolatino


Con el diseño en cuadro grecolatino (DCGL) se controlan tres factores de bloque, además del
factor de tratamientos. Se llama cuadro grecolatino porque los cuatro factores involucrados se
prueban en la misma cantidad de nivel es, de aquí que se pueda escribir como un cuadro (véase
tabla 4.8); además, se utilizan letras latinas para denotar a los tratamientos y letras griegas para
nombrar a los niveles del tercer factor de bloque. Al igual que en el cuadro latino, cada letra
(latinas y griegas) debe aparecer sólo una vez en cada renglón y en cada columna. Además, cada
par de letras debe aparecer sólo una vez en todo el arreglo. En la tabla 4.8 se presenta el aspecto
de los datos del diseño en cuadro latino de dimensión k = 4. El modelo estadístico que describe a
las mediciones en un cuadro grecolatino está dado por:

11
donde Yijlm es la observación o respuesta que se encuentra en el tratamien to i (i-ésima letra
latina), en el renglón j, en la columna l y en la m-ésima letra griega; ti es el efecto del tratamiento i,
gj es el efecto del renglón j, dl representa el efecto de la columna l y jm representa el efecto de la
m-ésima letra griega, que son los niveles del tercer factor de bloque; el término eijlm representa el
error aleatorio atribuible a la medición Yijlm. Es importante no confundir las letras griegas del
modelo que representan efectos, con las letras griegas en el diseño que simbolizan a los niveles
del tercer factor de bloque. La variabilidad total presente en los datos se puede partir de la
manera usual como

donde las sumas SCB1, SCB2 y SCB3 miden la variabilidad debida a los facto res de bloque renglón,
columna y de letras griegas, respectivamente. Para k tratamientos, los grados de libertad
correspondientes a cada suma son

Un bosquejo del análisis de varianza se muestra en la tabla 4.9, en la cual se prueban las hipótesis
de igualdad de letras latinas (tratamientos), de renglones, de columnas y de letras griegas.

12
13
Referencias
Analisis y Diseño de Experimentos - Gutierrez, De la Vara 2ª ed.

https://support.minitab.com/es-mx/minitab/18/help-and-how-to/modeling-
statistics/anova/supporting-topics/anova-models/what-are-randomized-block-designs-and-latin-
square-designs/

videos de apoyo al tema


Análisis de Varianza (ANOVA) "Diseño de Bloques Aleatorizados"

https://www.youtube.com/watch?v=qYCDwNjAlIQ

Diseño Bloques al Azar

https://www.youtube.com/watch?v=gOJLxOGoxzo

14

Вам также может понравиться