Вы находитесь на странице: 1из 13

Diseo de Experimento

Una prueba o serie de pruebas en las cuales se introducen cambios deliberados


en las variables de entrada que forman el proceso, de manera que sea posible
observar e identificar las causas de los cambios en la variable de salida.
Realizar un experimento
Aplicar los distintos niveles, o combinaciones de niveles cuando hay presentes
ms de un factor, a distintas unidades experimentales y se observa el valor de
la variable respuesta.
Unidades experimentales: (personas, elementos fsicos.)
Factor: Variable controlable por el experimentador (Niveles del factor o
tratamientos)
Variable de inters: Variable Respuesta
Error experimental o perturbacin: Variables no controlables por el
experimentador
Tamao del experimento: nmero total de observaciones.
OBJETIVO
Estudiar el efecto que sobre la Variable Respuesta tiene un conjunto de otras
variables que reciben el nombre de Factores
ETAPAS
1) Disear un experimento con una estructura lo ms adecuada posible a la
situacin que se desea estudiar y a los medios disponibles.
a) Planteamiento general del problema y de los objetivos que se persiguen.
b) Seleccin y definicin de la variable respuesta.
c) Eleccin de los factores y niveles que han de intervenir en el experimento.
d) Determinacin del conjunto de unidades experimentales incluidas en el
estudio.
e) Determinacin de los procedimientos por los cuales los tratamientos se
asignan a las unidades experimentales.
2) Realizar la experimentacin de acuerdo con el plan previamente establecido
en el diseo.
3) Analizar estadsticamente los resultados obtenidos y comprobar si las
hiptesis establecidas y el modelo de diseo elegido se adecuan a la situacin
estudiada.
4) Realizar las modificaciones oportunas para ampliar o modificar el diseo.
5) Obtener las conclusiones apropiadas.

PRINCIPIOS BSICOS DEL DISEO DE EXPERIMENTOS


Aleatorizacin: La asignacin de las unidades experimentales a los distintos
tratamientos y el orden en el que se realizan los ensayos se determinan al azar.
Replicacin.
Homogeneidad del material experimental.
DISEO COMPLETAMENTE ALEATORIZADO
Una compaa algodonera que emplea diversos fertilizantes desea comprobar
si stos tienen efectos diferentes sobre el rendimiento de la semilla de algodn.
Una profesora de estadstica que imparte en grupos experimentales de
alumnos, en los que explica la misma materia pero siguiendo distintos mtodos
de enseanza, desea comprobar si el mtodo de enseanza utilizado influye en
las calificaciones de los alumnos.
Una industria qumica, que obtiene un determinado producto, est interesada
en comprobar si los cambios de temperatura influyen en la cantidad de
producto obtenido.
INTERS: Un solo factor con varios niveles o tratamientos
TCNICA ESTADSTICA: Anlisis de la Varianza de un factor o una va
OBJETIVO: Comparar ente s varios grupos o tratamientos
MTODO: Descomposicin de la variabilidad total de un experimento en
componentes independientes

Diseo de bloques
Al estudiar la influencia de un factor-tratamiento en una variable de inters
puede ser importante eliminar (controlar) estadsticamente la influencia de un
factor que puede influir en la variable respuesta. Para ello se utiliza el concepto
de bloque, que se basa en seleccionar niveles de esta variable y aplicar en cada
uno de ellos todos los niveles del factor principal, de esta forma disminuye la
variabilidad residual o no explicada.
Por tanto, un factor-bloque es un factor cuyo control puede reducir
significativamente la variabilidad no explicada y que no interacciona con los
factores principales.

El siguiente ejemplo ayuda a comprender estas ideas.


Ejemplo 5.1.

Una empresa fotogrfica tiene que realizar una compra de


impresoras de gran calidad que se van a utilizar en imprimir fotografas
digitales. La empresa tiene ofertas de I marcas de impresoras de
similares caractersticas y precio. Para la empresa fotogrfica es muy
importante la velocidad de impresin y por este motivo est
interesada en saber si las I impresoras ofertadas tienen la misma
velocidad o si hay una que es ms rpida. Para responder a esta
pregunta decide hacer un experimento que se puede plantear de dos
formas:
[1] De los muchos ficheros de fotos digitales que tiene la empresa,
elegir al azar I muestras de J fotos e imprimir en cada una de las
impresoras una de las muestras, aleatorizando la asignacin de muestras
que se deben imprimir en cada impresora.
Esta estrategia es la del modelo de diseo de experimentos
completamente aleatorizado que es perfectamente vlido. En este
ejemplo la variable de inters es la velocidad de impresin y el
factor-tratamiento el tipo de impresora.
Un inconveniente que puede tener esta estrategia es que exista una
fuerte variabilidad en el tipo de fotos, esto es, que haya fotos que se
impriman en poco tiempo y otras no, independientemente de la
impresora utilizada. En este caso la variabilidad de la respuesta
velocidad de impresin es debida no solo al tipo de impresora sino
tambin al tipo de fotos seleccionadas. Si la variabilidad debida
al tipo de fotos es muy grande y no se tiene en cuenta, la variabilidad
residual del modelo es grande y puede enmascarar la significatividad del
factor de inters, el tipo de impresora. Este problema se puede
reducir en parte si el tamao muestral es muy grande, aunque tiene el
inconveniente de tener un mayor coste.
[2] Una estrategia alternativa es elegir una nica muestra de J fotos
e imprimirlas en cada una de las I impresoras, de esta forma se
controla la variabilidad debida al tipo de fotos. Esta estrategia es
fuertemente recomendable si se supone que la variabilidad del tipo de
fotos es alta.
Tngase en cuenta que el nmero de pruebas a realizar segn las dos
estrategias propuestas es el mismo: IJ.

La segunda propuesta conlleva el bloqueo de las unidades


experimentales: cada foto es un bloque.
En este ejemplo se est interesado en estudiar la influencia
del factor tratamiento tipo de impresora pero eliminando o
controlando la posible influenciafactor bloque tipo de foto en la
variable respuesta velocidad de impresin.
Los resultados del experimento se recogen en una tabla como la
siguiente
Bloq.1

Bloq.2

Bloq.J

Trat.1

Trat.2

Trat.I

11

21

I1

12

22

I2

1J

2J

IJ

Del ejemplo anterior se deduce que


Bloquear un experimento consiste en distribuir las unidades
experimentales en grupos tales que unidades experimentales
pertenecientes a un mismo grupo deben ser similares y pueden ser
analizadas en condiciones experimentales semejantes, en tanto que
unidades experimentales ubicadas en grupos distintos darn lugar,
probablemente, a respuestas diferentes an cuando sean asignadas a un
mismo tratamiento.
Cada uno de los conjuntos de unidades experimentales similares se
denomina bloque.

Del ejemplo anterior se deduce que:


"Bloquear un experimento consiste en distribuir las unidades experimentales
en subgrupos tales que unidades experimentales pertenecientes a un mismo
subgrupo deben ser similares y pueden ser analizadas en condiciones

experimentales semejantes, en tanto que unidades experimentales ubicadas en


subgruposdistintos darn lugar probablemente a respuestas diferentes an
cuando sean asignadas a un mismo tratamiento. Cada uno de estos conjuntos de
unidades experimentales similares se denomina bloque."
Un diseo en bloques es apropiado cuando el objetivo del experimento es
comparar los efectos de diferentes tratamientos promediados sobre un rango de
condiciones experimentales distintas. Con los modelos de diseo de
experimentos en bloques se quiere conseguir dos cosas:
1. evitar que grandes diferencias entre las unidades experimentales
enmascaren diferencias reales entre los tratamientos,
2. medir los efectos de los tratamientos en condiciones experimentales
distintas.
Un ejemplo de utilizacin de un diseo con bloques es el denominado de datos
apareados para comparar dos tratamientos o medias de dos poblaciones

(expuesto en el captulo 1) cuando se aplican los dos tratamientos a los mismos


individuos, en este caso cada individuo es un bloque.
Diseo de bloques completamente aleatorizados:
Modelo matemtico
Estimacion de los parmetros
Prueba Dunnett

PRUEBA DE DUNNETT
En muchos experimentos uno de los tratamientos es el control, y el investigador
est interesado en comparar cada una de las otras K 1 medias de los
tratamientos contra el control, por lo tanto, existen K 1 comparaciones. Un
procedimiento para realizar estas comparaciones es la prueba de Dunnett
(desarrollada en 1964). Si se supone que el control es el tratamiento a, entonces
se desea probar las hiptesis

El procedimiento de Dunnett es una modificacin de la prueba t. Para cada


hiptesis se calcula el valor absoluto de la diferencia de medias observadas

El rechazo de la hiptesis nula se realiza con una probabilidad de error tipo I, si

,
donde la constante
se busca en la tabla T-10. Observe que f es el nmero
de grados de libertad del error y es el nivel de significacin asociado con todos
las K 1 pruebas y utilizado en el anlisis de varianza.
Ejemplo 5: En el ejemplo 1, la compaa desea comparar todas las otras plantas
con la planta A que es la que cumple con los requisitos (control), por lo tanto, la
prueba de Dunnett sera ms adecuada que la de Fisher o la de Tukey para este
caso.

En consecuencia, la nica planta que difiere significativamente de la planta A es


la D.

Prueba de tukey
Para contrastar que no existe interaccin entre el factor tratamiento y el factor
bloque en el diseo por bloques completamente aleatorizado se puede utilizar
el test de Tuckey que permite contrastar la hiptesis de que las interacciones
son de la forma
ij =
i j.. Esto es, se quiere contrastar

Al ajustar el modelo (5.1 ) si

0 se verifica que

de esta expresin se deduce:


Si

i y j son valores grandes y del mismo signo, los residuos son altos, y las

predicciones

ij =

+ i + j estn muy por arriba o por debajo de la media.

Si i y j son valores pequeos y/o de distinto signo, los residuos son


pequeos y las predicciones estn en torno a la media.
En base a sto
el contraste de Tuckey se basa en dibujar la grfica de los residuos eij frente a
las predicciones ij, si existe una interaccin de tipo multiplicativo la nube de
puntos tiene forma parablica.
El contraste de Tuckey tambin se puede hacer de forma analtica. Se dibuja la
nube de puntos de los residuos eij frente a la variable xij = i j, y se ajusta una
recta. Entonces contrastar la hiptesis H0 : = 0 es equivalente a contrastar
que el coeficiente de correlacin entre xij y eij es cero. Si no se acepta H0 el
estimador de es la pendiente de la recta ajustada.
En las Figura 5.1, 5.2. y 5.3. se presentan diferentes grficos de eij frente a
ij, con diferentes posibilidades sobre la interaccion multiplicativa.

Figura 5.1. No hay indicios de que exista interaccin multiplicativa.

Figura 5.2. Existe interaccin entre los factores.

Figura 5.3. Existe interaccin y heterocedasticidad.

El significado de la interaccin
Considrese el modelo con dos factores tratamiento T y T con I y J niveles,
respectivamente. El diseo completo se ha replicado K veces, esto es, para
cada tratamiento (casilla) ij se tienen K observaciones. Se denota

yijk a la k-

sima observacin del tratamiento ij, con k = 1,2,...,K. El tamao del


experimento es n =IJK, el modelo asociado es

Entonces la falta de interaccin entre los factores T y T se interpreta como


sigue:
Se dice que no existe interaccin entre los dos factores tratamiento T y T
cuando sus efectos sobre la respuesta son aditivos. En otros trminos, la
diferencia de las respuestas medias tericas en dos niveles cualesquiera de un
factor es constante en todos los niveles del otro factor y viceversa:

Un grfico ilustrativo de la posible existencia de interaccin es el


denominado grfico de interaccin. Para construir este grfico se marcan en el
eje de abscisas los niveles de uno de los dos factores tratamiento, por ejemplo
el A, y se dibuja la nube de puntos

Uniendo a continuacin con segmentos las medias muestrales

yij. con igual j.

Aunque los grficos de interaccin son muy intuitivos y tiles, pueden conducir
a interpretaciones peligrosas debido a que en ellos no se refleja el tamao del
error experimental. Esto puede llevar a deducir del grfico la existencia de
interaccin y, sin embargo, el error experimental ser lo suficientemente
grande como para que el anlisis de la varianza no detecte la interaccin como
significativa (y viceversa). Por tanto, se debe ser muy prudente con las
conclusiones que se derivan de un grfico de este tipo.
Frecuentemente el inters del diseo radica fundamentalmente en evaluar la
contribucin individual de cada factor tratamiento sobre la respuesta
observada. A los efectos marginales de cada factor se les denomina efectos
principales. Sin embargo, cuando el efecto interaccin entre ambos factores es
importante, puede ser imposible examinar por separado cada uno de los
efectos principales.

Prueba Fisher
R. A. Fisher, quien fue el primero en obtener la distribucin y desarrollar la
prueba, de ah el nombre de la distribucin. La prueba f se utiliza
principalmente para probar la igualdad entre dos varianzas poblacionales que
provienen de poblaciones que tiene una distribucin normal, tambin se ha

desarrollado un procedimiento basado en esta prueba para investigar la


igualdad entre tres ms medias poblacionales, procedimiento que
comnmente se denomina anlisis de varianza (ANOVA).
El estadstico de prueba para la prueba F es la razn de los estimadores
insesgados de de dos varianzas poblacionales
Usada en teora de probabilidad y estadstica, la distribucin F es una
distribucin de probabilidad continua. Tambin se le conoce como distribucin F
de Snedecor (por George Snedecor) o como distribucin F de Fisher-Snedecor.
Una variable aleatoria de distribucin F se construye como el siguiente
cociente:
donde
U1 y U2 siguen una distribucin chi-cuadrado con d1 y d2 grados de libertad
respectivamente, y
U1 y U2 son estadsticamente independientes.
La distribucin F aparece frecuentemente como la distribucin nula de una
prueba estadstica, especialmente en el anlisis de varianza. Vase el test F.
La funcin de densida de una F(d1, d2) viene dada por para todo nmero real
x 0, donde d1 y d2 son enteros positivos, y B es la funcin beta.
La funcin de distribucin es donde I es la funcin beta incompleta
regularizada
En estadstica se denomina prueba F (de Fisher) a cualquier prueba en la que el
estadstico utilizado sigue una distribucin F si la hiptesis nula no puede ser
rechazada. En estadstica aplicada se prueban muchas hiptesis mediante el
test F, entre ellas:
La hiptesis de que las medias de mltiples poblaciones normalmente
distribuidas y con la misma desviacin estndar son iguales. Esta es, quizs, la
ms conocida de las hiptesis verificada mediante el test F y el problema ms
simple del anlisis de varianza.
La hiptesis de que las desviaciones estndar de dos poblaciones
normalmente distribuidas son iguales.
En muchos casos, el test F puede resolverse mediante un proceso directo. Se
requieren dos modelos de regresin, uno de los cuales restringe uno o ms de
los coeficientes de regresin conforme a la hiptesis nula. El test entonces se
basa en un cociente modificado de la suma de cuadrados de residuos de los
dos modelos como sigue:

Dadas n observaciones, donde el modelo 1 tiene k coeficientes no


restringidos, y el modelo 0 restringe m coeficientes, el test F puede calcularse
como
El valor resultante debe entonces compararse con la entrada correspondiente
de la tabla de valores crticos.
CARACTERISTICAS
Una variable con distribucin F es siempre positiva por lo tanto su campo de
variacin es 0 F
La distribucin de la variable es asimtrica, pero su asimetra disminuye
cuando aumentan los grados de libertad del numerador y denominador.
Hay una distribucin F por cada par de grados de libertad.
Parmetros: Grados de libertad asociados al numerador y denominador
Cmo se deduce una distribucin F?
Extraiga k pares de muestras aleatorias independientes de tamao n < 30.
Calcule para cada par el cociente de variancias que proporciona un valor de F.
Graficar los valores de F de los k pares de muestras.
Distribucin F para diferentes grados de libertad.

Prueba ANOVA
Necesitamos poder comparar simultaneamente todas la medias. El test que lo
permite es el test ANOVA (de ANalysis Of VAriance). Como su nombre indica,
compara varianzas aunque lo que contrastamos sean medias. Para ello parte
de 3 requisitos previos: Independencia: las k muestras son independientes,
Normalidad: Xi N(i , 2 i ), i = 1, . . . , k, y Homocedasticidad: 2 1 = 2 2
==2k=2.
Fundamentos del ANOVA (1)(cuadro)
k grupos
12ik
x11 x21 xi1 xk1
x12 x22 xi2 xk2
............

x1n1 x2n2 xini xknk


medias x1 x2 xi xk
varianzas s 2 1 s 2 2 s 2 i s 2 ki

Fundamentos del ANOVA (2) El ANOVA se basa en la comparacion de la


variabilidad media que hay entre los grupos con la que hay dentro de los
grupos. Por que? Recordemos que la media y la varianza muestral verifican
var(x) = 2 n , E(s 2 ) = 2 , lo que nos permite dos estimaciones diferentes
para 2 cuando disponemos de k muestras de una misma poblacion, 2 = s
2 = 1 k X k i=1 s 2 i (1) y 2 = ns2 x = n k 1 X k i=1 (xix) 2 (2)
Fundamentos del ANOVA (3) En la tabla anterior, si las k muestras provienen
de la misma poblacion todas la medias son iguales, (H0 es cierta) y tanto (1)
como (2) son validos. Que ocurre cuando las medias no son iguales? Si
suponemos que i = + i entonces ns2 x = 2 + 1 k 1 X k i=1 ni 2 i
(3) Observese que (1) describe la variabilidad dentro de los grupos, mientras
que (2) y (3) describen la variabilidad entre los grupos.

El test del ANOVA Si la observacion j-esima del grupo i es de la forma Xij = i


+ ij , con i = + i , las hipotesis H0: i = 0, i i = , i, frente a H1:
algun i 6= 0 las i son distintas, se contrastan mediante el cociente de
varianzas F0 = ns2 x s 2 = 2 + 1 k1 Pk i=1 ni 2 i 2 (4)

Falta la tabla en siiii(ver en donde dice


formulas)

Y faltan dos de las primeras por fis

Bibliografia

http://www.ugr.es/~bioestad/_private/cpfund3.pdf
http://www.udc.es/dep/mate/estadistica2/sec5_1.html
http://colposfesz.galeon.com/disenos/teoria/cap13bmj/cap13bmj.htm
http://www.udc.es/dep/mate/estadistica2/sec5_3.html
http://stjose.blogspot.com/2012/04/prueba-de-fisher.html
http://www.uv.es/montes/biomecanica2004/anova

(ver para formulas)

Вам также может понравиться