Вы находитесь на странице: 1из 40

Bloques Aleatorios,

Cuadrados Latinos y
Diseños Relacionados
Bloques
 Definición:
– Bloque: Un “grupo” de unidades experimentales que se
sabe antes del experimento a ser similares en alguna
manera y se espera que influya en la variable de respuesta.
 Bloques se escogen para:
– Maximizar variación bloque a bloque.
– Minimizar variación entre unidades experimentales dentro
de cada bloque.
 Objetivo:
– Separar la variabilidad de bloque a bloque del error
experimental con el fin de lograr una comparación mas
sensitiva de los promedios de los tratamientos.

2
El Principio de Bloques
 Bloquear es una técnica para tratar con factores
perturbadores.
 Un factor perturbador es aquel que probablemente
tenga algún efecto en la respuesta, pero no es de
interés al experimentador..sin embargo, la
variabilidad que transmite a la respuesta necesita
ser minimizada.
 Típicos factores perturbadores incluyen lotes
(batches) de materia prima, operadores, partes de
equipos de prueba, tiempo (turnos, días, etc),
unidades experimentales diferentes.
 Muchos experimentos industriales involucran
bloques (o deberían).
 No bloquear es una falla común en diseñar un
experimento (¿consecuencias?).

3
El Principio de Bloques
 Si la variable perturbadora es conocida y controlable,
usamos bloques.
 Si el factor perturbador es conocido y no controlable,
se puede usar el análisis de covarianza para remover
el efecto del factor perturbador del análisis.
 Si el factor perturbador es desconocido y no
controlable (se desconoce esa variable), se espera que
la aleatorización balancee su impacto en todo el
experimento.
 Algunas veces, varias fuentes de variabilidad son
combinadas en un bloque, de modo que el bloque
llega a ser una variable agregada.

4
Experimentos con Bloques
Aleatorizados (cont)
 Diferencias en un experimento con bloques
aleatorizados
– Unidades experimentales clasificadas en “bloques” .
– Para cada bloque, la variable de respuesta es recolectada
para todos los tratamientos.
– Métodos de análisis remueven efectos observados de
bloques antes de probar la igualdad de medias.

 Ejemplos de factores de bloques comunes:


– Personas, grupo socio-económico, grupo de edad, genero,
región geográfica.
– Cliente, producto, suplidor.
– Centro de distribución, bodega, numero de la semana.

5
Bloquear
 Bloquear es una técnica para hacer una comparación mas
precisa en la presencia de variabilidad.

– Unidades que pertenecen Block 1 Block 2 Block 3


al mismo bloque son mas
similares que las unidades
de bloques diferentes.
Process 1
– Comparar tratamientos o
procesos dentro de cada
bloque.
Process 2

 Ejemplos de bloques: Lotes de fabricas, lotes de ensambles,


lotes de material, equipos, operarios, días, etc.

6
Procedimientos de
Aleatorizacion
 Asigne aleatoriamente las unidades
experimentales dentro de un bloque a los k
tratamientos.

 Dentro de cada bloque, aleatorice el orden en


el cual los tratamientos son administrados.

 Si es posible, aleatorice el orden en el cual los


bloques son corridos (no es esencial como la
aleatorizacion dentro de los bloques).

7
Ejemplo Motocicleta: Bloquear
 Diseño 3: Combinación de Factores
– Incluir múltiples conductores, motocicletas y A B
rutas.
– Considerar cada viaje de motocicleta como un
A B
bloque.
– Aleatoriamente asignar una llanta de cada
tipo a la llanta delantera y trasera de cada A B
motocicleta.
– Rotar las llantas en la mitad de cada viaje.
B A
 ¿Cuál es el beneficio del diseño de bloques?

B A

8
Ejemplo Motocicleta: Bloques
¿Puede ud detectar en este
grafico cual material es
mejor?

 Graficar los datos en


una manera diferente.
 ¿Puede ud determinar
cuál material es mejor
ahora?
 ¿Qué hace mas fácil ver
la diferencia?

9
Extensión del ANOVA a los Diseños
de Bloques Completamente
Aleatorizados (DBCA)

 Suponga que hay a tratamientos (niveles


de factor) y b bloques.
 Un modelo estadístico (modelo de efectos)
para el DBCA es:

 i  1, 2,..., a
yij     i   j   ij 
 j  1, 2,..., b

10
Análisis de Experimentos con
Bloques Aleatorizados
 ANOVA de dos vías es usada para:
– Particionar al suma total de cuadrados en tres
componentes :

SSTotal = SSTratamientos + SSBloques + SSError

– Probar H0 vs. H1 usando la prueba F

MSTreatment
F ;
MS Error
SSTreatment SS Error
MSTreatment  ; MS Error 
dfTreatment df Error
11
Análisis de Experimentos con
Bloques Aleatorizados (cont)
Tabla ANOVA Una Vía
Source df Sum of Mean Squares F-Stat P-value
Squares (Fcalc)
Treatments K-1 SSBetween MSBetween = SSWithin / K - 1 MSBetween / P (>FCalc)
MSWithin
Error nTotal - K SSWithin MSWithin = SSWithin / nTotal - 1

Total nTotal - 1 SSTotal SSTotal / nTotal - 1

Tabla ANOVA Dos Vías


Source df Sum of Squares Mean Square F-stat P-value
(Fcalc)
Blocks b-1 SSBlk MSBlk=SSBlk / b-1

Treatments k-1 SSTrt MSTrt=SSTrt / k-1 MSTrt /MSE p (>Fcalc)

Error (b-1)(k-1) SSE MSE= SSE /(b-1)(k-1)

Total bk-1 SSTotal

Nueva fila
correspondiente a
la nueva variable
12
Extensión del ANOVA a los DBCA
 Particionamiento de ANOVA de la variabilidad
total:
a b a b

 ( y
i 1 j 1
ij  y.. )   [( yi.  y.. )  ( y. j  y.. )
2

i 1 j 1

 ( yij  yi.  y. j  y.. )]2


a b
 b ( yi .  y.. )  a  ( y. j  y.. ) 2
2

i 1 j 1
a b
  ( yij  yi .  y. j  y.. ) 2
i 1 j 1

SST  SSTreatments  SS Blocks  SS E

13
Extensión de ANOVA a los DBCA
 Los grados de libertad para las sumas de
cuadrado en

SST  SSTreatments  SSBlocks  SSE


son las siguientes:

ab  1  a  1  b  1  (a  1)(b  1)
 Por tanto, las razones de suma de cuadrados a sus
grados de libertad resulta en cuadrados medios y
la razón del cuadrado medio de tratamientos con
el error medio cuadrado es un estadístico F que
puede ser usado para probar la hipótesis de
igualdad de medias de tratamientos.

14
Otros aspectos del Diseño de
Bloques
 El DBCA utiliza un modelo aditivo – no hay
interacción entre tratamientos y bloques.
 Tratamientos y/o bloques como efectos aleatorios.
 Valores faltantes.
 ¿Cuáles son las consecuencias de no bloquear si
no lo hiciéramos?
 Tamaño de muestra en DBCA. El procedimiento de la
CO puede ser usado para determinar el número de
bloques a correr.

15
Hipótesis Estadística

 Si queremos probar la hipótesis:

H0: 1 = 2 =  = k

vs.

H1: no todas las k son


iguales

16
Experimentos con Bloques
Aleatorizados
Meta del Diseño
– Determinar si hay diferencias significativas entre las
medias de los k tratamientos .

– Misma meta como las pruebas de medias de k


muestras independientes.
– Específicamente, las hipótesis a probar:

Means Test

H0: 1 = 2 =  = k
vs.
H1: no todas las k
son iguales
17
Análisis de Varianza (ANOVA)
 ANOVA particiona la variabilidad total, o
suma de cuadrados (SS), en fuentes
diferentes
Variación Total SSTotal

?
Variación debido Variación debido a Variación
= a Tratamientos + muestreo aleatorio + debido a
SStrt SSe Bloques SSblk

18
Tabla ANOVA de Dos Vías

19
Prueba F
 Test Estadístico

MSTreatment
F
MS Error

 Cuando H0 es verdadera, el estadístico F


sigue una distribución F con k-1 y (b-1)(k-1)
grados de libertad

Si H0 es verdadera, entonces todas las


observaciones se comportan como una
muestra aleatoria de una sola población, de
modo que el F calculado debe estar cercano a
1.
20
Criterio de Decisión F-test

Calcular Valor P

P-value < a P-value > a

Rechazar Ho Se falla rechazar Ho


Concluir no todas las i’s Concluir H0: 1=2=…=k
son iguales

21
Practica A continuación se muestra parte del ANOVA para un
diseño en bloques, que tiene tres tratamientos y cinco bloques con una sola
repetición por tratamiento-bloque.
Ejemplo Desgaste de Llantas
Considere el problema de determinar si diferentes
tipos de material para hacer llantas presentan
diferentes cantidades de pérdida de espesor después
de 32,000 km de manejo. Un gerente de una compañía
desea considerar cuatro diferentes materiales para
hacer llantas y tomar una decisión sobre cuál material
podría mostrar la cantidad mínima de desgaste
después del periodo de manejo. Los materiales a
considerar son A, B, C, y D. Aunque las condiciones de
manejo podrían simularse en un laboratorio, él desea
probar estos cuatro materiales bajo condiciones
actuales de manejo.

23
Ejemplo Desgaste de Llantas
 Un fabricante de llantas desea comparar los cuatro
materiales diferentes para hacer las llantas.
– Material A: Estándar
– Material B: Mas barato
– Material C: Competidor 1
– Material D: Competidor 2

 A ellos les gustaría cambiar al material B pero quieren


estar seguros que este material no es inferior al
material estándar o al de los competidores.

 La variable de respuesta es Yij es la diferencia en


espesor en milésimas (0.001 mm) y el único factor de
interés es marca, o sea j dónde j = 1, 2 , 3, 4

24
Ejemplo Desgaste de Llantas

 4 carros representando diferentes marcas,


modelos y tamaños están disponibles.

 ¿Cómo se debe diseñar este experimento?

25
Diseño de Bloques
Aleatorizados
 Incluir una llanta de cada uno de los 4 tipos
de materiales en cada carro.
 Aleatorize la asignación del tipo de material
a la posición de la llanta en cada carro.
 Maneje los carros por el numero
especificado de km, luego medir el desgaste
en cada llanta.

 ¿Cuáles son los bloques?


La meta del diseño aleatorizado de bloques es
separar la variabilidad de bloque a bloque
cuando se comparan tratamientos al
comparar tratamientos dentro de cada bloque.
26
Ejemplo Desgaste de Llantas:
Datos

¿Son las diferencias debido al tipo


de material o solo por variación
aleatoria?

27
Lo que no se debe hacer
17

16

15

14
Desgaste

13

12

11

10

A B C D
Tipo Material

 ¿Se puede identificar cuales materiales son diferentes?


 ¿Qué es lo que hace difícil detectar cualquier diferencia,
si existe?

28
Hipótesis Estadística

 Se quiere probar la hipótesis:

H0: 1 = 2 =  = k La media verdadera de


desgaste es la misma
para los materiales A,
vs. B, C y D

No todos los materiales


H1: no todas las i son tienen la misma media
iguales verdadera de desgaste.

29
Lo que si se debe hacer
MA RC A
17
A
B
16 C
D
15

14
Y (Desgaste)

13

12

11

10

1,0 1,5 2,0 2,5 3,0 3,5 4,0


Carro

 ¿Se puede detectar ahora si los materiales son


consistentemente diferentes de cada uno?
 ¿Porqué las diferencias son mas fáciles de ver
en este grafico?
Graficar tratamientos dentro de cada
bloque.
30
Ejemplo Desgaste de Llantas
Rechazar Ho.
Existen diferencias significativas
entre tratamientos.
Al menos algún material es
diferente.
Se pueden realizar comparaciones
múltiples.

Two-way ANOVA: Y versus CARRO. MARCA

Source DF SS MS F P
CARRO 3 38,6875 12,8958 10,04 0,003
MARCA 3 30,6875 10,2292 7,96 0,007
Error 9 11,5625 1,2847
Total 15 80,9375

S = 1,133 R-Sq = 85,71% R-Sq(adj) = 76,19%

31
Ejemplo Desgaste de Llantas
 Método Tukey 14,5

14,0

13,5
Tukey Simultaneous Tests
13,0
Response Variable Y

Desgaste
All Pairwise Comparisons among Levels of MARCA 12,5

MARCA = A subtracted from: 12,0

11,5
Difference SE of Adjusted
11,0
MARCA of Means Difference T-Value P-Value
B -2,000 0,8015 -2,495 0,1274 A B C D
C -3,500 0,8015 -4,367 0,0080 MA RCA

D -3,250 0,8015 -4,055 0,0125

MARCA = B subtracted from: CDBA


Difference SE of Adjusted
MARCA of Means Difference T-Value P-Value
C -1,500 0,8015 -1,872 0,3041
D -1,250 0,8015 -1,560 0,4452
Material A es significativamente
peor que el Material C y D.
MARCA = C subtracted from:
Materiales C y D presentan los valores
Difference SE of Adjusted menores de desgaste. Son equivalentes.
MARCA of Means Difference T-Value P-Value
D 0,2500 0,8015 0,3119 0,9888

32
Adecuación del Modelo
Residual Plots for Y
Normal Probability Plot Versus Fits Prueba de Homogeneidad de Varianzas
99
N 16 1 Bartlett's Test
AD 0,352
90 Test Statistic 1,45
P-Value 0,423 A

Residual
0 P-Value 0,694
Percent

50 Levene's Test
-1 Test Statistic 0,16
10 P-Value 0,923
-2
B
1

MARCA
-2 -1 0 1 2 8 10 12 14 16
Residual Fitted Value

Histogram Versus Order


C
4 1

3
Frequency

0
Residual

2 D
-1
1

0 -2 0 2 4 6 8 10 12 14 16 18
-2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
95% Bonferroni Confidence Intervals for StDevs
Residual Observation Order

Se cumplen las suposiciones del modelo.

33
Ejemplo Desgaste de Llantas

 Diseño de Cuadrados Latinos


CARRO

Posición I II III IV

1 C (12) D (11) A (13) B (8)


2 B (14) C (12) D (11) A (13)
3 A (17) B (14) C (10) D (9)
4 D (13) A (14) B (13) C (9)

 Modelo Estadístico:
Yijk =  + i + j + k + ijk

34
Resumen de Experimentos con Bloques
Completamente Aleatorizados
 Especificar las hipótesis experimentales y los riesgos
del error:
H0 : 1 = 2 = … = k vs. H1: No todas las ’s son iguales.

 Determine el numero bloques para el numero de


tratamientos y el cambio a detectar.
 Conduzca el experimento.
 Grafique los datos, revise diferencias y valores
atípicos.
 Si hay diferencias significativas entre las medias,
utilice un procedimiento de comparaciones múltiples
para determinar cuales medias son diferentes.
 Revise adecuación del modelo: normalidad de
residuos, independencia y homogeneidad de varianzas.

35
El Diseño de Cuadrados Latinos
 Estos diseños son usados para controlar
simultáneamente (o eliminar) dos fuentes de
variabilidad perturbadora.
 Una suposición significativa es que los tres
factores (tratamientos, factores perturbadores) no
interactúan.
 Si esta suposición es violada, los Cuadrados
Latinos no producirán resultados válidos

36
El problema de la carga propulsora –
Un diseño de Cuadrados Latinos

 Este es un diseño de cuadrados latinos de 5 x


5

37
Análisis Estadístico del Diseño de
Cuadrados Latinos
 El modelo estadístico (efectos) es:
 i  1, 2,..., p

yijk    a i   j   k   ijk  j  1, 2,..., p
k  1, 2,..., p

 El análisis estadístico (ANOVA) es muy
parecido al análisis para los DBCA.

38
Otros Diseños Relacionados

• Diseño Greco-Latino (4 Factores)


Acid Concentration
Batch 1 2 3 4 5
1 Aa=26 B=16 C=19 D=16 E=13
2 B=18 C=21 D=18 Ea=11 A=21
3 C=20 Da=12 E=16 A=25 B=13
4 D=15 E=15 A=22 B=14 Ca=17
5 E=10 A=24 Ba=17 C=17 D=14

• Diseño Híper-Greco-Latino (5 Factores)

40