Вы находитесь на странице: 1из 79

INTRODUCCIÓN AL

DISEÑO DE
EXPERIMENTOS
Apuntes para el curso de Estadística 2.

Facultad de Ingeniería Química UCE.


Semestre 17-18.
Preparado por G. Carvajal C.
1. Conceptos

INVESTIGACIÓN

La investigación es considerada una actividad orientada a la


obtención de nuevos conocimientos y su aplicación para la
solución a problemas o interrogantes de carácter científico.

2
1. Conceptos

3
1. Conceptos

VARIABLE

Característica de un objeto que puede ser observada y que


puede tomar diferentes valores, tanto en el mismo objeto
como entre diferentes objetos.

4
1. Conceptos

EXPERIMENTO

Es la creación y preparación de lotes de prueba que verifiquen la validez


de las hipótesis establecidas sobre las causas de un determinado
problema, objeto de estudio.

El experimentador escoge ciertos factores para su estudio, los altera


deliberadamente de forma controlada y después, observa el efecto
resultante en la variable de respuesta.

5
1. Conceptos
FACTOR (VARIABLE INDEPENDIENTE)

Es la causa que se supone influye sobre la característica que se mide. Para


comprobar su influencia, el investigador la manipulará durante el
experimento, en el sentido que le asignará valores diferentes a cada
observación.

Esta variable se llama también “factor" y cada uno de los valores que se le
asignarán "nivel de factor“, llamado a veces “tratamiento”.

6
1. Conceptos

VARIABLE DE RESPUESTA (VARIABLE DEPENDIENTE)

Es aquella variable que se mide en cada observación del experimento,


para establecer si los factor efectivamente influyen sobre sus valores.

7
1. Conceptos
VARIABLES EXTRAÑAS (RUIDO ALEATORIO)

Son aquellas que el investigador no puede manipular, pero influyen en la


variable de respuesta. Son la causa para que las observaciones de un
mismo nivel de tratamiento no necesariamente arrojen el mismo valor de
medida. Se identifica con el error experimental.

8
1. Conceptos
VARIABLES DE BLOQUEO

Son variables que se sabe pueden intervenir en los niveles de la variable


dependiente y se decide eliminar su influencia mediante el control de la
misma, creando bloques de observaciones, en los que esta variable,
asume respectivamente un valor constante.

Algunos autores agrupan a las variables extrañas y las variables de


bloqueo como “variables molestia (nuisance)”

9
1. Conceptos

OBSERVACIÓN

Toma de medida de una variable que genera un valor de la variable de


respuesta. Dependiendo del tipo de diseño, las observaciones pueden
tomarse a diferentes sujetos o al mismo sujeto.

10
1. Conceptos

REPETICIÓN

Reiteración de una observación al mismo nivel de tratamiento. Proporciona


una oportunidad para que los efectos de las variables extrañas, incontroladas
se compensen y permite, además, medir el error experimental.

11
1. Conceptos
DISEÑO EXPERIMENTAL

El diseño experimental hace referencia a la definición de procedimientos y


modelos estadísticos cuyo objetivo es averiguar si durante un
experimento, determinados factores influyen en una variable de interés y,
si existe influencia de algún factor, cuantificar dicha influencia.

12
2. Objetivos

• Controlar la variabilidad del experimento. Si la variabilidad es grande,


solo se detectará la influencia del factor cuando éste produzca grandes
cambios en relación con el error de observación.

• Determinar si la aplicación experimental de un determinado valor de un


factor produce o no un cambio en la variable de respuesta.

13
Un buen diseño experimental permite:

• Determinar las principales causas de variación en la respuesta.

• Encontrar las condiciones experimentales con las que se consigue un


valor extremo en la variable de interés o respuesta.

• Comparar las respuestas en diferentes niveles de observación de


variables controladas.

• Obtener un modelo estadístico-matemático que permita hacer


predicciones de respuestas futuras.

14
3. Alcance

Es de aplicación a todos aquellos estudios y situaciones en las


que se necesita ensayar hipótesis sobre una posible relación
causa-efecto.

15
4. Marco metodológico

La metodología del diseño de experimentos estudia cómo


variar las condiciones habituales de realización de un
experimento para aumentar la probabilidad de detectar
cambios significativos en la respuesta.

16
4. Marco metodológico

Si se repite un experimento, los resultados presentan una cierta


variabilidad.

Si se realiza en un laboratorio, el error experimental será pequeño y


habrá poca variación en los resultados. Pero si se experimenta en
procesos industriales, administrativos o humanos, la variabilidad será
mayor.

17
4. Marco metodológico
Un buen diseño experimental debe:

• Permitir la prueba de las hipótesis de estudio, no dejándose confundir por


variables insospechadas.

• Identificar la existencia de cualquier causa de variabilidad, aunque no haya


sido adelantada como hipótesis.

• Mantener los costos de experimentación a un nivel razonable, en relación


con el problema de estudio.

18
5. Variabilidad

Es el cambio observable en el valor de la variable de respuesta a través de


diferentes observaciones y réplicas, cuyo origen debe ser determinado a
través del diseño experimental.

19
5.1. Clases de Variabilidad
Variabilidad sistemática planificada

El efecto de los factores y las variables bloque produce variabilidad


sistemática planificada en la variable de respuesta.
Esta variabilidad viene originada por la posible dispersión de los resultados
debida a diferencias sistemáticas entre las distintas condiciones
experimentales impuestas en el diseño por expreso deseo del
experimentador.
Es el tipo de variabilidad que se intenta identificar y cuantificar con el
diseño experimental.

20
5.1. Clases de Variabilidad
Variabilidad sistemática no planificada

El efecto de variables no identificadas durante la realización del


experimento produce variabilidad sistemática no planificada.
Estas variables producen una variación sistemática en los resultados y es
debida a causas desconocidas y no planificadas. Los resultados están
siendo sesgados sistemáticamente por causas desconocidas.
Su presencia supone la principal causa de conclusiones erróneas y
estudios incorrectos al ajustar un modelo estadístico.

21
5.1. Clases de Variabilidad

Variabilidad aleatoria

El efecto de las variables extrañas produce variabilidad aleatoria.


Es la variabilidad debida al ruido aleatorio. Incluye, entre otros, al error de
medida. Impredecible e inevitable.
Tienen un patrón regular. Las medidas tienden a fluctuar en torno a un
valor central y siguiendo un modelo de probabilidad que será importante
estimar.

22
6. Planificación de un experimento

La forma tradicional que se utilizaba en la experimentación, se basaba en


estudiar los factores uno a uno, esto es, variar los niveles de un factor
permaneciendo fijos los demás. Esta metodología presenta grandes
inconvenientes:

o Es necesario un gran número de pruebas.


o Las conclusiones obtenidas en el estudio de cada factor tiene un
campo de validez muy restringido.
o No es posible estudiar la existencia de interacción entre los factores.
o Es inviable, en muchos casos, por problemas de tiempo o costo.

23
6. Planificación de un experimento

Las técnicas de diseño de experimentos que se basan en


estudiar simultáneamente los efectos de todos los factores de
interés, son más eficaces y proporcionan mejores resultados
con un menor costo.

24
Definir los objetivos del experimento.

Identificar las fuentes de variación.

Clasificar las fuentes de variación.

Definir el número de niveles de los factores.

Elegir una regla de asignación de las unidades experimentales a las


condiciones de estudio (niveles de factor).

25
Especificar las medidas con que se trabajará (la respuesta).

Ejecutar un experimento piloto.

Especificar el modelo estadístico.

Esquematizar los pasos del análisis.

Determinar el tamaño muestral.

26
6. Planificación de un experimento

6.1. Definir los objetivos del experimento.

o Analizar la hipótesis principal.


o Confeccionar una lista completa de las preguntas concretas a las que
debe dar respuesta el experimento.
o Indicar solamente cuestiones fundamentales. Abordar problemas
colaterales puede complicar innecesariamente el experimento.
o Esquematizar el tipo de conclusiones que se espera obtener en el
posterior análisis de datos.
o La lista de objetivos es refinada a medida que se van ejecutando las
etapas.

27
6. Planificación de un experimento

6.2. Identificar todas las posibles fuentes de variación.

Elaborar una lista de todas las posibles fuentes de variación del problema,
distinguiendo aquellas que, a priori, generarán una mayor variabilidad.

Es necesaria una revisión bibliográfica fuerte para identificar estudios


previos similares, y factores utilizados en los mismos.

28
6. Planificación de un experimento
6.3. Clasificar las fuentes de variación.
Una vez identificados todos los factores de variabilidad, clasificarlos de la
siguiente manera:

• Factores de estudio: fuentes cuyo efecto sobre la respuesta es de


particular interés.
• Factores fijos: fuentes que no son de interés directo y cuya variabilidad
se busca eliminar manteniendo su valor constante.
• Factores molestia: fuentes que no son de interés directo pero que se
contemplan en el diseño, en forma de bloque o aleatoria, para reducir
la variabilidad no planificada.

29
6. Planificación de un experimento
Factores molestia

Bloques
Factor del cual no interesa conocer su influencia pero se incorpora al
diseño del experimento para disminuir la variabilidad residual del modelo.
Pueden fijarse niveles dentro de ellos, de modo que es posible controlar
sus efectos dentro de cada nivel. A cada bloque se asignarán todos los
niveles de los factores de estudio.
→ Muestras de características comunes.
→ Condiciones ambientales.
→ Operador de los equipos de laboratorio.

30
6. Planificación de un experimento
Factores molestia

Variables extrañas (Ruido)

El efecto de las variables extrañas no se aísla por medio de bloques. Sus


diferentes niveles se distribuyen aleatoriamente dentro de los niveles de
los factores de estudio.

31
6. Planificación de un experimento

6.4. Definir el número de niveles de los factores.

Son los tipos o valores específicos de los factores que se tendrán en


cuenta en la realización del experimento.

Pueden ser cualitativos o cuantitativos.

32
6. Planificación de un experimento
Niveles de factor

Cualitativos
 proveedor (diferentes proveedores de una materia prima),
 tipo de máquina (diferentes tipos o marcas de máquinas),
 trabajador (los trabajadores encargados de hacer una tarea),
 un aditivo químico (diferentes tipos de aditivos químicos),

33
6. Planificación de un experimento
Niveles de factor

Cuantitativos
 Temperatura de reacción.
 Concentración de reactivos.
 Esfuerzo cortante.
 Velocidad másica.
 Presión.

… seleccionados en un rango de interés.

34
6. Planificación de un experimento
Niveles de factor

En el tratamiento matemático, los factores cuantitativos son tratados


como cualitativos y sus niveles son elegidos equiespaciados o se
codifican.

Por lo general, un factor no suele tener más de cuatro niveles.

35
6. Planificación de un experimento
6.5. Elegir una regla de asignación de las unidades experimentales a las
condiciones de estudio (niveles de factor).
Unidad Experimental
Es el material donde se evaluará la variable respuesta y al que se le aplican los
distintos niveles de los factores de estudio, para obtener el número de
observaciones deseado.
→ En medicina, individuos humanos u animales,
→ En industria, lotes de material, trabajadores, máquinas.
→ Muestras de agua, de crudo.
→ Intervalos de tiempo.
Deben ser representativas de la población (plan de muestreo).

36
6. Planificación de un experimento
La regla de asignación o diseño experimental especifica qué unidades
experimentales se observarán bajo cada nivel de los factores. Hay
diferentes posibilidades:

• diseño factorial o no,

• anidamiento,

• asignación al azar en determinados niveles de observación,

• orden de asignación, etc.


37
6. Planificación de un experimento
Tipos de diseño

Experimento factorial

Es el diseño de experimentos en que existen observaciones de todos los


posibles tratamientos.

El más usado es el 2ek.

38
6. Planificación de un experimento
6.6. Especificar las medidas que se realizarán (la respuesta), el
procedimiento experimental y anticiparse a las posibles dificultades.

Se debe especificar con claridad la forma en que se realizarán las


mediciones: instrumentos de medida, tiempo en el que se harán las
mediciones, etc.

Si no se dispone de procedimientos normalizados, es necesario


desarrollar previamente el procedimiento a seguir.

39
6. Planificación de un experimento

6.7. Ejecutar un experimento piloto

Es un experimento que utiliza un número pequeño de observaciones.

El objetivo de su ejecución es ayudar a completar y chequear la lista de


acciones a realizar.

40
6. Planificación de un experimento

Experimento piloto - Ventajas

↘ Permite practicar la técnica experimental elegida e identificar


problemas no esperados en el proceso de recogida de datos,
↘ Si tiene un tamaño suficientemente grande, puede ayudar a
seleccionar un modelo adecuado al experimento principal,
↘ Los errores experimentales observados pueden ayudar a calcular el
número de observaciones que se precisan en el experimento principal.

41
6. Planificación de un experimento
6.8. Especificar el modelo

El modelo matemático especificado debe indicar la relación que se


supone que existe entre la variable respuesta y las principales fuentes de
variación identificadas en el paso 2.

Los modelos de diseño de experimentos, según sean los factores


incluidos en el mismo, se pueden clasificar en:

42
6. Planificación de un experimento

Modelo de efectos fijos

Todos los factores son factores de efectos fijos.

Factor en el que los niveles han sido seleccionados por el


experimentador. Es apropiado cuando el interés se centra en comparar el
efecto sobre la respuesta de esos niveles específicos.

43
6. Planificación de un experimento

Modelo de efectos aleatorios

Todos los factores son factores de efectos aleatorios.

Factor del que solo se incluyen en el experimento una muestra aleatoria


simple de todos los posibles niveles del mismo. Se utilizan estos factores
cuando tienen un número muy grande de niveles y no es razonable o
posible trabajar con todos ellos. Interesa examinar la variabilidad de la
respuesta debida a la población entera de niveles del factor.

44
6. Planificación de un experimento
6.9. Esquematizar los pasos del análisis estadístico.

De acuerdo con el modelo elegido, determinar:

o Estimaciones que hay que calcular,


o Contrastes a realizar,
o Intervalos de confianza que se calcularán,

45
6. Planificación de un experimento
6.10. Determinar el tamaño muestral (número de repeticiones)

Calcular el número de repeticiones que se deben tomar para alcanzar los


objetivos del experimento.

Se estima a partir del experimento piloto y con base en experiencias


previas en trabajos con diseños experimentales semejantes.

Existen fórmulas y tablas para determinar este tamaño. Todas requieren


el conocimiento del tamaño de la variabilidad no planificada (no
sistemática y sistemática, si es el caso) y estimarlo a priori no es fácil,
siendo aconsejable sobreestimarla.

46
6. Planificación de un experimento

47
6. Planificación de un experimento

48
6. Planificación de un experimento

49
6. Planificación de un experimento

𝛅 refleja la potencia de la prueba. También depende de 𝛂

50
Planificación de un experimento

51
7. Consideraciones para el diseño

• La factorización del diseño.

• El principio de aleatorización.

• El bloqueo.

52
7. Consideraciones para el diseño
7.1. Factorización del Diseño

La factorización del diseño define una estrategia eficiente para


elegir el número de puntos experimentales sin considerar en
absoluto como asignarlos después a las unidades experimentales.

53
7. Consideraciones para el diseño
Diseño factorial

Es el diseño de experimentos en que existen observaciones de


todos los posibles tratamientos.

En un diseño de experimentos completo de tres factores, todos


ellos con K niveles, necesita K3 observaciones, número elevado si K
es grande.

54
7. Consideraciones para el diseño
Diseños de fracciones factoriales

Son diseños en los que se supone que muchas de las interacciones


son nulas, esto permite estudiar el efecto de un número elevado de
factores con un número relativamente pequeño de pruebas.

Los más usados son el cuadrado latino y el cuadrado grecolatino.

55
7. Consideraciones para el diseño

Cuadrados latinos

Se selecciona un conjunto de condiciones experimentales con la


condición de que cada nivel de un factor aparezca una vez con cada
uno de los niveles de los otros factores.

56
7. Consideraciones para el diseño
Cuadrados latinos

El diseño de cuadrado latino se puede utilizar si se verifican las


siguientes condiciones:

• Es un diseño de experimentos con tres factores.


• Los tres factores tienen el mismo número de niveles: K.
• No hay interacciones entre los tres factores.

57
7. Consideraciones para el diseño

Cuadrados latinos

Permite controlar al mismo tiempo dos fuentes de error o de


variabilidad, como las diferencias entre los renglones y las
diferencias entre las columnas.

En tales casos es necesario que cada tratamiento aparezca una vez


en cada renglón y una vez en cada columna.

58
7. Consideraciones para el diseño
Cuadrados latinos
Un esquema general es el siguiente:

59
7. Consideraciones para el diseño
Ejemplo:
Un investigador quiere evaluar el rendimiento de una determinada reacción, mediante el uso de
cuatro variedades de catalizador sólido (I, II, III, IV), utilizando para ello un solo reactor de laboratorio.
Dentro de su diseño decide estudiar también dos factores adicionales: tamaño de partícula del
catalizador (0,1; 0,5; 0,9; 1,3 mm) y pH del medio reaccionante (A=7,5; B=8,0; C=8,5; D=9,0). Para
ello, consideró el uso de un cuadrado latino en lugar de un experimento factorial. Los datos se
encuentran en % Rendimiento (reactivo a productos).

TIPO DE DIÁMETRO DE PARTÍCULA (mm)


CATALIZADOR 0,1 0,5 0,9 1,3
I D 78,5 B 73,0 C 70,0 A 59,5
II B 85,5 D 77,5 A 76,0 C 71,0
III C 95,0 A 88,5 D 79,5 B 78,0
IV A 94,5 C 95,0 B 88,0 D 83,5

60
7. Consideraciones para el diseño
Cuadrados grecolatinos

Cuando es necesario controlar tres fuentes de error o de


variabilidad.
Son dos cuadrados latinos superpuestos uno sobre otro, usando las
letras latinas A, B, C y D para uno de los cuadrados y las letras
griegas α, β, γ y δ para el otro.
Cada letra griega debe usarse una y sólo una vez con cada letra
latina; si se satisface esta condición se dice que el cuadrado es
ortogonal.

61
7. Consideraciones para el diseño
Cuadrados grecolatinos
Un esquema general es el siguiente:

62
7. Consideraciones para el diseño
Diseños factoriales a dos niveles

En experimentos en los que hay muchos factores que pueden influir


en la variable de interés, la utilización de experimentos completos
necesita un número elevado de observaciones. A menudo, muchos
de los factores en estudio no son influyentes y mucha información
recogida no es relevante.

Una estrategia mejor es utilizar una técnica secuencial donde se


comienza por trabajar con unos pocos factores y según los
resultados que se obtienen se eligen los factores a estudiar en la
segunda etapa.
63
7. Consideraciones para el diseño

Diseños factoriales a dos niveles

Los diseños factoriales 2k son diseños en los que se trabaja con k


factores, todos ellos con dos niveles (se suelen denotar + y -). Estos
diseños son adecuados para tratar el tipo de problemas descritos
porque permiten trabajar con un número elevado de factores y son
válidos para estrategias secuenciales.

64
7. Consideraciones para el diseño
7.2. Aleatorización y Bloqueo

Aleatorizar y bloquear son estrategias eficientes para asignar los

tratamientos a las unidades experimentales sin preocuparse de

qué tratamientos considerar.

65
7. Consideraciones para el diseño
Aleatorización

Aleatorizar todos los factores no controlados por el experimentador


en el diseño experimental y que pueden influir en los resultados, a
través de una asignación al azar de los puntos experimentales a las
unidades experimentales.

66
7. Consideraciones para el diseño

Aleatorización

Los puntos experimentales se asignan a las unidades


experimentales de manera completamente aleatoria.

El propósito de la aleatorización es eliminar diversas fuentes de


error.

67
7. Consideraciones para el diseño
Diseño completamente aleatorizado

El experimentador asigna las unidades experimentales a los puntos


experimentales al azar.

Los modelos matemáticos que se utilizan para realizar el análisis


estadístico de este tipo de diseño, consideran que:

Valor de la Respuesta = Constante + Efecto factor + Error

68
7. Consideraciones para el diseño
Ejemplo:

Se desea verificar si el analista tiene influencia en el resultado de un


ensayo de poder calórico. El laboratorio cuenta con cuatro analistas
y cuatro equipos para determinación de poder calórico. Para ello,
todos los analistas trabajarán con la misma muestra de crudo y
realizarán cuatro repeticiones del ensayo.

69
7. Consideraciones para el diseño
Es necesario que las unidades experimentales (equipos de poder
calórico A, B, C, D) se asignen al azar a cada uno de los ensayos a
realizarse (cuatro analistas, cuatro repeticiones cada uno)

Analista R1 R2 R3 R4

Diana D A C C

Ricardo B D B A

Fernanda D C B D

Santiago A B C A

70
7. Consideraciones para el diseño

Aleatorización - Ventajas

Transforma la variabilidad sistemática no planificada en ruido


aleatorio. Aleatorizar previene contra la introducción de sesgos en
el experimento.
Evita la dependencia entre observaciones al aleatorizar los
instantes de recogida muestral.
Valida muchos de los procedimientos estadísticos más comunes.

71
7. Consideraciones para el diseño
Bloqueo

Se deben dividir las unidades experimentales en grupos llamados


bloques de modo que las observaciones realizadas en cada bloque
se realicen bajo condiciones experimentales lo más parecidas
posibles.

72
7. Consideraciones para el diseño
Bloqueo

El experimentador no está interesado en investigar las posibles


diferencias de la respuesta entre los niveles de los factores bloque.
Bloquear es una buena estrategia siempre y cuando sea posible
dividir las unidades experimentales en grupos de unidades
similares.
La ventaja de bloquear un factor que se supone que tienen una
clara influencia en la respuesta pero en el que no se está
interesado, es que convierte la variabilidad sistemática no
planificada en variabilidad sistemática planificada.

73
7. Consideraciones para el diseño
Diseño en bloques

El experimentador agrupa las unidades experimentales en bloques,


a continuación determina la distribución de los puntos
experimentales (niveles) en cada bloque y, por último, asigna al
azar las unidades experimentales a los puntos dentro de cada
bloque.

Respuesta = Constante + Efecto factor + Efecto bloque + Error

74
7. Consideraciones para el diseño

Diseño en bloques

El diseño en bloques más simple es el denominado diseño en


bloques completos, en el que cada nivel del factor se observa el
mismo número de veces en cada bloque.

75
7. Consideraciones para el diseño
Bloques aleatorizados

Cuando se necesita todo un conjunto de niveles de un factor para


cada bloque, los tratamientos A, B, C y D se introducen en orden
aleatorio en cada uno de los bloques I, II, III y IV.

Se emplea para controlar una fuente de error o variabilidad: a


saber, la diferencia entre los bloques.

76
7. Consideraciones para el diseño
Ejemplo:

Se desea verificar si el analista tiene influencia en el resultado de un


ensayo de poder calórico. El laboratorio cuenta con cuatro analistas
y cuatro equipos para determinación de poder calórico. Sin
embargo, se sospecha que la hora de ensayo (4 horarios en el día)
es un factor que puede influir en el resultado, por lo que se decide
bloquear la hora del ensayo. Todos los analistas trabajarán con la
misma muestra de crudo, se realizarán dos réplicas.

77
7. Consideraciones para el diseño
Dentro de cada bloque (hora), se tienen 8 ensayos en total (cuatro
analistas con dos réplicas cada uno), a los cuales se asigna al azar los
cuatro equipos A, B, C, D disponibles (dos veces cada uno)

Hora de Ensayo
Analista 09:00 - 11:00 11:00 - 13:00 14:00 - 16:00 16:00 - 18:00
R1 R2 R1 R2 R1 R2 R1 R2
Diana D C A B A A A B
Ricardo B C A D D B C D
Fernanda A D C B D B D C
Santiago B A D C C C B A

78
7. Consideraciones para el diseño
Diseños con dos o más factores

En este modelo es importante estudiar la posible interacción entre


los dos factores. Para ello se hace un diseño de filas por columnas.
Si en cada casilla (punto experimental) se tiene una única
observación no es posible estudiar la interacción entre los dos
factores, para hacerlo hay que replicar el modelo, esto es, obtener
k observaciones en cada casilla, donde k es el número de réplicas.

Respuesta = Constante + Efecto Factor Fila + Efecto Factor Columna


+ Efecto Interacción + Error
79

Вам также может понравиться