Вы находитесь на странице: 1из 15

EXPERIMENTOS CON UN SOLO FACTOR Comprende experimentos que se usan cuando el objetivo es comparar ms de dos tratamientos pero que

corresponden a niveles de un mismo factor: Comparar dos o tres mquinas Comparar varios procesos para la obtencin de un producto o resultado dado Comparar varios materiales, Comparar varias dietas Etc.

Con el fin de tomar una decisin en la solucin de un problema real. Por lo general las comparaciones se hacen en trminos de las medias poblacionales, aunque tambin es importante la comparacin de varianzas y capacidad actual para cumplir ciertas especificaciones. Las estructuras de diseos pueden ser en este caso: Factores Tcnicas Diseo de bloque estadsticas Completamente ANOVA, con un solo criterio de 0 al aleatorizado clasificacin En bloques completos ANOVA con dos criterios de 1 aleatorizados clasificacin ANOVA con tres criterios de En cuadrado latino 2 clasificacin ANOVA con cuatro criterios de En cuadrado grecolatino 3 clasificacin Notacin: Y es la variable respuesta; bloques y Modelo estadstico

Yij = + i + ij Yij = + i + j + ij Yijk = + i + j + k + ijk Yijkl = + i + j + k + l + ijkl

la media global; i el efecto del i-simo tratamiento;

j , k , y l , efectos de

es el error aleatorio.

DISEO COMPLETAMENTE ALEATORIZADO: Es el ms simple de todos los diseos, pues contempla slo dos fuentes de variabilidad: los tratamientos y el error aleatorio. Se denominan completamente aleatorizados porque las corridas experimentales se realizan en orden aleatorio completo, dado que no hay restricciones impuestas por factores de bloqueo. ALEATORIZACIN: Para lograr que el diseo sea completamente aleatorizado es necesario un mecanismo para tal fin. A continuacin se explica un procedimiento que puede ser realizado con software que incluya una funcin de generacin de nmeros aleatorios de U(0,1) y que incluya la capacidad de ordenar por los valores de una columna o a mano: Suponga a niveles o tratamientos del factor considerado. Sea ni el nmero de replicaciones a ser tomadas en el i-simo tratamiento, y N=ni el total de observaciones (el nmero total de unidades experimentales). Codifique los tratamientos de 1 hasta a y etique las unidades experimentales de 1 hasta N. Paso 1: En una columna ingrese n1 veces el nmero 1, n2 veces el nmero 2, ..., na veces el nmero a, teniendo as un total de N entradas en dicha columna, que representan a las etiquetas de los tratamientos. Paso 2: Ingrese en otra columna N nmeros aleatorios de una U(0,1) con suficientes dgitos para evitar empates (nmeros iguales). Paso 3: Reordene ambas columnas usando como criterio el orden ascendente de los nmeros aleatorios, as quedan ordenadas las etiquetas de los tratamientos en la primera columna, en forma aleatoria. Paso 4: Asigne la unidad experimental con t-sima etiqueta al tratamiento cuya etiqueta qued en la fila t..

Ver ANEXO 1: Programa SAS para aleatorizacin. Si el nmero total de unidades experimentales n es un entero con k dgitos, entonces los nmeros aleatorios en la columna 2 deberan ser una lista de nmeros aleatorios de k dgitos. Si la sucesin de corridas es aleatoria, cada sucesin posible tiene la misma oportunidad de ocurrir, luego las corridas y las asignaciones se dicen son completamente aleatorias. Sin embargo, an con mecanismos de aleatorizacin pueden aparecer tratamientos en secuencia, y por tanto el experimentador podra no desear ciertos rdenes en la experimentacin, pero no debera al mirar la secuencia resultante decidir cambiarla subjetivamente porque no parece aleatoria. MODELO PARA UN DISEO COMPLETAMENTE ALEATORIZADO, UN FACTOR EFECTOS FIJOS:

Yij = i + ij

(1)

Yij = Variable aleatoria que representa la respuesta de la j-sima unidad experimental asignada al i-esimo tratamiento, i=1, 2, ..., a y j=1, 2, ..., ni. i = Respuesta esperada al i-esimo tratamiento si se sta es observada bajo condiciones experimentales idnticas y medida sin error. ij = El error aleatorio. Una forma alternativa del modelo es reemplazar a i por +i, de modo que

Yij = + i + ij
los efectos i, bajo la restriccin lineal cuadrados

(2)

Donde denota la respuesta global promedio y i es la desviacin o el efecto del i-esimo tratamiento sobre el promedio global. Por tanto el examen de diferencias entre las medias de tratamiento i, es equivalente a examinar las diferencias entre

n
i =1 i

= 0 , para una solucin nica del sistema de ecuaciones de mnimos

(1) es conocido como modelo de medias de tratamientos, en tanto que (2) es conocido como modelo de efectos de tratamientos. En cualquiera de los dos modelos (1) y (2), se establecen lo siguientes supuestos: Los errores son variables aleatorias que se distribuyen: Normales, Independientes, De media cero y Varianza constante 2. Los parmetros del modelo a estimar son las constantes , i, i y 2. ANOVA PARA EL DISEO COMPLETAMENTE ALEATORIZADO (DCA)

Figura 1:

TABLA DE ENTRADA DE DATOS


DATOS RESPUESTA NIVELES FACTOR A A1 A2 ... Aa Y11 Y21 ... Ya1 Y12 Y22 ... Ya2 ... ... ... ... Y1n1 Y2n2 Y1. Y2. Yan2 Ya. ...

totales

Donde:

Yi = Yij Suma de las observaciones en el nivel


j =1
a ni i =1 j =1

ni

o tratamiento i.

Y = Yij Suma o total de todas las N observaciones en el experimento


Con estas cantidades se obtiene los siguientes estimadores (ver ANEXO 3: Funciones estimables de los parmetros):

= Y =

Y Y 1 a Yi = , i = Yi = i , i = Yi Y . i =1 N N ni

Es fcil ver que las respuestas ajustadas para el tratamiento i es corresponden a

Yij = Yi .

Por tanto los residuales del modelo

ij = Yij Yi

Las sumas de cuadrados del modelo ANOVA SST=SSA+SSE, son:


2 SST = (Yij Y ) = Yij2 NYi ,

a ni

a ni

o variabilidad total observada en la respuesta, con N-1 grados de

i =1 j =1 a ni

i =1 j =1 a

libertad.
2 2 SSA = (Yi Y ) = niYi NYi , o variabilidad en la respuesta explicada por el factor A, con a-1 2

i =1 j =1 a ni

i =1

grados de libertad.

SSE = (Yij Yi ) = SST SSA , o variabilidad en la respuesta explicada por la aleatoriedad,


2

con N-a

i =1 j =1

grados de libertad. ANOVA Valores esperados Fuente de variacin g.l Suma de cuadrados Cuadrados Medios Cuadrados medios Factor Error Total a-1 N-a N-1 SSA SSE SST MSA=SSA/(a-1) MSE=SSE/(N-a) F0 MSA/MSE Valor P

2 + i =1

ni i a 1

P ( f a 1, N a > F0 )

La prueba hiptesis fundamental asociada al ANOVA, es la siguiente:

H 0 : 1 = 2 =

= a vs. H1 : algn para i j , o equivalentemente,

H 0 : 1 = 2 =

= a = 0 vs. H1 : algn i 0

Si F0 es grande, se rechaza la hiptesis nula, en tanto que si es pequeo, no se tiene suficiente evidencia en contra de H0. DISTRIBUCIONES MUESTRALES DE LOS ESTIMADORES: Puede demostrarse que

2 2 Y N , , Yi N i , , ni N

1 1 i N i , 2 y que ni N

Por tanto, los correspondientes errores estndar e intervalos de confianza estn dados por: Estimador Error estndar

SY =

Yi

SYi =

MSE N MSE ni

Y t / 2 , N a SY

I.C del (1-)100%

i Yi t / 2 , N a SY

1 1 S i = MSE ni N

i i t / 2 , N a S

Ver ANEXO 2: Programa SAS para ANOVA, y estimacin de medias, efectos y sus I.C VALIDACIN DE SUPUESTOS DEL MODELO ANOVA: Para cada supuesto sobre los errores del modelo existen pruebas analticas y grficas, stas ltimas aunque no son exactas, funcionan relativamente bien con pocos datos, y se requiere que una fuerte evidencia visual en contra de un supuesto est soportada por ms de dos puntos para concluir que no se cumple. Cuando slo un par de puntos se alejan del comportamiento esperado en una grfica de diagnstico, esto puede tratarse como un problema de datos atpicos. Supuesto Normalidad Hiptesis

H 0 : ij Normal vs. H1 : ij no son Normales


2 H 0 : 12 = 2 = 2 = a vs.

test Grfico Shapiro Wilk Grfico de probabilidad normal sobre residuales, o residuales estandarizados Bartlet, Cochran, Leven Grfico de residuales vs. valores ajustado, residuales vs. niveles del factor

Varianza Constante

H1 : algn par i2 2 j
ij i j

Independencia H : corr 0

H1

( , ) = 0 j j : corr ( , ) 0 para algn j j


ij i j

Durbin Grfico de residuales (comunes o Watson estandarizados) vs. orden de corrida Lung-Box

Adicionalmente, se chequean: La forma del modelo (ajuste del modelo), es decir, si realmente las respuestas medias de los tratamientos son adecuadamente descritos por el modelo lineal postulado i = + i mediante el grfico de residuales

estandarizados vs. niveles del factor. Patrones no aleatorios alrededor de la lnea cero de este grfico son indicios de carencia de ajuste. Outliers, mediante grfico de residuales estandarizados vs. niveles del factor; si tolas presunciones del modelo se cumplen incluyendo la normalidad, aproximadamente el 68% de los residuales estandarizados deberan estar entre 1 y +1, aproximadamente el 95% entre 2 y +2, y aproximadamente 99.7% entre 3 y +3. Si hay muchos outliers, los niveles de confianza son ms bajos de los esperados.

NOTAS: El supuesto de independencia debe verificarse antes de los otros supuestos. La no independencia en los errores puede ser causada por la similaridad de las unidades experimentales cercanamente juntas en el tiempo o espacio. La no independencia causa que los verdaderos niveles de significancia de las pruebas de hiptesis sean mucho ms altas que las establecidas y que los niveles de confianza y las potencias de las pruebas sean ms bajas que lo esperado. Las pruebas formales sobre igualdad de varianzas (ver en ANEXO 4, test de Bartlett) tienden a ser poco potentes con pocas rplicas por nivel y muy sensibles a no normalidad. Una regla de dedo que usualmente se aplica es que el estadstico F de la ANOVA y los mtodos de comparaciones mltiples de medias son apropiadas, si se ha probado que la razn de la estimacin de la varianza ms grande a la varianza ms pequea de los a tratamientos es no es mayor de tres (3); sin embargo hay que ser cuidadosos con esta regla porque an cuando las presunciones del modelo son correctas tal razn de varianzas puede dar mayor que 3. La violacin del supuesto de varianza constante es preocupante en particular cundo los diseos son desbalanceados (nmero de rplicas no son iguales). Si el nivel con mayor varianza es el menos replicado, entonces los procedimientos estadsticos son ms liberales y se tiene mayor probabilidad de cometer error tipo I, y menores niveles de confianza que los esperados. Por el contrario, si el tratamiento o nivel de mayor varianza es el ms replicado, entonces los procedimientos estadsticos son ms conservadores, es decir, niveles de significancia son ms bajos y niveles de confianza ms altos de los esperados. En general se recomienda trabajar con diseos balanceados. Pequeas desviaciones de la normalidad no afectan fuertemente a los niveles de significancia, niveles de confianza o la potencia. Con diseos balanceados el caso de mayor preocupacin es cuando la distribucin tiene colas ms pesadas que la normal, y en ese caso deberan usarse mtodos de anlisis de varianza no paramtricos (ej. Kruskall Wallis). Soluciones al problema de varianza no constante: transformaciones de la variable respuesta para estabilizar varianza (ver ANEXO 5) Anlisis con varianzas de error desiguales (ver ANEXO 6) Soluciones al problema de no normalidad: Mtodos no paramtricos Transformar la variable respuesta, tal como la transformacin logartmica. Aunque a veces transformar puede originar problemas de varianza no constante que no exista con los datos originales. Si la varianza no es constante, hay suficientes datos por nivel del factor, analizar la normalidad por separado en cada nivel. Soluciones al problema de no independencia: La no independencia es difcil de corregir; si hay una clara tendencia en el grfico de residuales tal como una lnea recta, es posible incorporar al modelo trminos que representen el efecto temporal o espacial. Por ejemplo, con una tendencia lineal en el tiempo, el modelo adecuado sera

Yij = + i + t ij + ij , ij N 0, 2 y t ij es el tiempo en el cual la observacin j del tratamiento i fue tomada.


Este modelo es uno denominado de anlisis de covarianza.

iid

ANEXO 1: PROGRAMA SAS PARA ALEATORIZACIN Ejemplo: Suponga un diseo de un factor con dos niveles y tres rplicas para cada uno: /*PASOS 1 Y 2:*/ OPTIONS NODATE NOCENTER NONUMBER; DATA DISENO; INPUT TRATAMIENTO @@; RANNO=RANUNI(0); CARDS; 1 1 1 2 2 2 ; RUN; PROC PRINT; RUN; Lo cual produce la siguiente salida:
The SAS System Obs TRATAMIENTO 1 1 2 1 3 1 4 2 5 2 6 2 RANNO 0.89204 0.40674 0.35334 0.96373 0.18264 0.84389

/*PASO 3:*/ PROC SORT DATA=DISENO; BY RANNO; RUN; PROC PRINT DATA=DISENO; RUN; Lo cual produce la salida siguiente, que indica el orden de corrida para los tratamientos:
The SAS System Obs TRATAMIENTO 1 2 2 1 3 1 4 2 5 1 6 2 RANNO 0.18264 0.35334 0.40674 0.84389 0.89204 0.96373

Para el paso 4, las unidades experimentales 1, 4 y 6, son asignadas al tratamiento 2, en tanto que las unidades 2, 3, y 5 son asignadas al tratamiento 1.

ANEXO 2: PROGRAMA SAS PARA ANLISIS DESCRIPTIVO, ANOVA Y OBTENCIN DE ESTIMACIONES: PROC GLM: Sintaxis bsica: Las siguientes declaraciones estn disponibles en el PROC GLM.
PROC GLM < opciones > ; CLASS variables ; MODEL dependientes=independientes < / opciones > ; CONTRAST 'etiqueta' valores efecto < ... valores efecto > < / opciones > ; ESTIMATE 'etiqueta' valores efecto < ... valores efecto > < / opciones > ; LSMEANS effectos < / opciones > ; MEANS effectos < / opciones > ; OUTPUT < OUT=SAS-data-set > keyword=nombres < ... keyword=nombres > < / opciones > ; RANDOM efectos < / opciones > ;

Para usar el PROC GLM, son necesarias las declaraciones PROC GLM y MODEL. Slo puede especificarse una declaracin MODEL. Los factores o variables de clasificacin deben ser listadas en una declaracin CLASS, la cual debe aparecer antes de la declaracin MODEL. Considere el siguiente ejemplo: Un administrador compil datos sobre mejoramientos de la productividad en los ltimos tres aos para una muestra de firmas productoras de equipos de computacin. Las firmas fueron clasificadas de acuerdo a nivel de sus gastos en investigacin y desarrollo en los pasados tres aos, en bajo, moderado y alto. Los resultados del estudio sobre la mejora de la productividad (mprod, medida en una escala de 0 a 100) se presentan en la tabla anexa. Asumiendo que un modelo de efectos fijos es apropiado: obs ID 1 2 3 4 5 6 7 8 9 10 11 12 alto 8.5 9.7 10.1 7.8 9.6 9.5 bajo 7.6 8.2 6.8 5.8 6.9 6.6 6.3 7.7 6.0 medio 6.7 8.1 9.4 8.6 7.8 7.7 8.9 7.9 8.3 8.7 7.1 8.4
/*LECTURA DE DATOS EN SAS:*/ options nodate nocenter nonumber; goptions colors=(black,black,black) cback=white ftext=simplex ftitle=simplex htext=0.9; data productividad; do i=1 to 6; La forma de leer los datos depende de la id='alto'; estructura de estos y si el ingreso es por output; teclado o si se leern desde un archivo end; externo. do i=7 to 15; id='bajo'; output; end; do i=16 to 27; id='medi'; output; end; run; data productividad(drop=i); set productividad; input mprod @@;

htitle=1.0

ANEXO 2: PROGRAMA SAS PARA ANLISIS DESCRIPTIVO, ANOVA Y OBTENCIN DE ESTIMACIONES:


cards; 8.5 9.7 10.1 7.8 9.6 9.5 7.6 8.2 6.8 5.8 6.9 6.6 6.3 7.7 6.0 6.7 8.1 9.4 8.6 7.8 7.7 8.9 7.9 8.3 8.7 7.1 8.4 ; run; /*GRAFICACIN DE LOS DATOS POR NIVEL DEL FACTOR*/ proc sort data=productividad; by id; run; TITLE1'Boxplot comparativo'; TITLE2'Indice de productividad por nivel gasto en I.D'; proc boxplot data=productividad; plot mprod*id/BOXCONNECT=MEAN CCONNECT=RED NOSERIFS CBOXES=black CBOXFILL=YELLOW CFRAME=CXF7E1C2; run; quit; TITLE1'Grafico de comparacion de medias'; TITLE2'Indice de productividad por nivel gasto en I.D'; proc gplot data=productividad; plot mprod*id/frame; symbol1 i=stdj v=dot c=black; run; quit;

Los dos grficos obtenidos son como se presentan a continuacin:

/*ANLISIS DE VARIANZA TEST DE BARTLETT, ESTIMACIONES E I.C PARA MEDIAS Y EFECTOS:*/ proc glm data=productividad; class id; model mprod=id/ss1 clparm; /*obtiene tabla ANOVA*/ Estimacin de efectos: Los means id/clm T hovtest=bartlett; coeficientes usados se obtienen de la estimate 'efecto id alto' id 2 -1 -1/divisor=3; expresin de cada uno de ellos como estimate 'efecto id bajo' id -1 2 -1/divisor=3; un contraste de las medias de niveles estimate 'efecto id alto' id -1 -1 2/divisor=3; del factor output out=sal p=yhat r=res;run;quit;

Lo anterior produce las siguientes salidas SAS

ANEXO 2: PROGRAMA SAS PARA ANLISIS DESCRIPTIVO, ANOVA Y OBTENCIN DE ESTIMACIONES:


The GLM Procedure Class Level Information Class Levels Values id 3 alto bajo medi Number of observations 27 Dependent Variable: mprod Source Model Error Corrected Total R-Square Coeff Var 0.567108 10.06128 Source id Sum of DF Squares Mean Square 2 20.12518519 10.06259259 24 15.36222222 0.64009259 26 35.48740741 Root MSE mprod Mean 0.800058 7.951852 DF 2 Type I SS 20.12518519 Mean Square 10.06259259 F Value 15.72 Pr > F <.0001

F Value 15.72

Pr > F <.0001

The GLM Procedure Bartlett's Test for Homogeneity of mprod Variance Source DF Chi-Square Pr > ChiSq id 2 0.1294 0.9374 The GLM Procedure t Confidence Intervals for mprod Alpha 0.05 Error Degrees of Freedom 24 Error Mean Square 0.640093 Critical Value of t 2.06390 95% Confidence Limits 8.5259 9.8741 7.6567 8.6100 6.3274 7.4282

id alto medi bajo

N 6 12 9

Mean 9.2000 8.1333 6.8778

The GLM Procedure Dependent Variable: mprod Parameter efecto id alto efecto id bajo efecto id alto Parameter efecto id alto efecto id bajo efecto id alto Estimate 1.12962963 -1.19259259 0.06296296

Standard Error 0.24747409 0.22223830 0.20847800

t Value 4.56 -5.37 0.30

Pr > |t| 0.0001 <.0001 0.7652

95% Confidence Limits 0.61886820 1.64039106 -1.65126989 -0.73391529 -0.36731449 0.49324041

/*GRFICOS PARA ANLISIS DE RESIDUALES*/ TITLE1'Graficos de residuales'; proc gplot data=sal; plot res*(yhat id)/vref=0; run; quit; TITLE1'Graficos QQ normal residuales'; proc univariate data=sal noprint normaltest; var res; probplot res; inset normaltest probn;run;quit;

ANEXO 2: PROGRAMA SAS PARA ANLISIS DESCRIPTIVO, ANOVA Y OBTENCIN DE ESTIMACIONES: Y los grficos resultantes son:

ANEXO 3: FUNCIONES DE PARMETROS ESTIMABLES: Una funcin de los parmetros de cualquier modelo se dice estimable si y slo s puede escribirse como el valor esperado de una combinacin lineal de las variables respuesta. Slo las funciones estimables de los parmetros tienen estimadores lineales insesgados. Es importante que el anlisis de un experimento incluya slo funciones estimables. Para un ANOVA de un solo factor efectos fijos, cada funcin estimable es de la forma:
ni a ni a E aijYij = bi ( + i ) , con bi = aij nmeros reales. j =1 i =1 j =1 i =1

, 1 , 2 , , a separadamente como valores esperados, por tanto, estos parmetros no son individualmente estimables, sino cada + i .
No hay valores de bi que den ANEXO 4: TEST DE BARTLETT DE HOMOGENEIDAD DE VARIANZAS: Suponga que se tienen a poblaciones o tratamientos independientes, cada uno con distribucin normal N(i, i2), i=1, 2, ..., a, con varianzas desconocidas. Se quiere probar la hiptesis de igualdad de varianzas:
2 H 0 : 12 = 2 = 2 = a vs.

H1 : algn par i2 2 j
El estadstico de prueba est dado por

= M /C
2 0

2 a 1

con M = ( N a ) log S
2 p

(n
i =1

1) log Si2 , y

C =1+

1 1 1 2 , Sp = 3 ( a 1) i =1 ni 1 N a
a 2

(n
i =1

1) S i2

N K

= MSE

donde S i es la varianza muestral de los ni valores observados de la respuesta con el tratamiento i. Se rechaza H0 aun nivel de significancia si debe comprobarse primero tal supuesto. ANEXO 5: TRANSFORMACIONES PARA IGUALAR VARIANZAS: Las transformaciones orientadas a homogenizar varianzas implican hallar una funcin h(Yij) tal que h(Yij)=* + *i + *ij con *ij~N(0,2) y mutuamente independientes. Una transformacin apropiada puede hallarse por lo general cuando hay una clara relacin entre la varianza del error y la respuesta media. Las relaciones son a menudo de la forma 2i=k(+i)q, donde k y q son constantes. La funcin h es elegida entre las siguientes:

02 > 2,a 1 . Esta prueba es altamente sensible a no normalidad por lo cual

Yij1q / 2 si q 2 h (Yij ) = log (Yij ) si q = 2 y todas las Yij son no nulas log (Yij + 1) si q = 2 y algunas Yij son nulas

ANEXO 5: TRANSFORMACIONES PARA IGUALAR VARIANZAS: Por lo general q es desconocido pero la siguiente es una aproximacin razonable para hallarla. Si se usan los estimadores muestrales en la expresin h( ) y tomando logaritmo natural a ambos lados de la igualdad, se obtiene:

log Si2 = log ( k ) + q log (Yi ) , por tanto la pendiente de la lnea de regresin obtenida de log S i2 vs. log (Yi )

( )

( )

da una estimacin para q. Pero a veces el valor de q es sugerido por consideraciones tericas, como en el caso cuando los datos son poisson, en cuyo caso el valor de q es 1 (la varianza y la media son iguales); luego, la transformacin a usar es

h (Yij ) = Yij1 / 2 . Con datos binomiales(m,p), se tiene que la varianza es (1-p) veces la media, luego una transformacin que

puede estabilizar varianza es h Yij = sin

( )

Yij / m .

Cuando se halla una transformacin que homogenice las varianzas, es necesario tambin chequear los otros supuestos del modelo para los datos transformados. Si no hay problemas, el ANOVA opera sobre los datos transformados. ANEXO 6: ANLISIS CON VARIANZAS DE LOS ERRORES DISTINTAS Una alternativa a la aplicacin de una transformacin para homogenizar varianzas, es usar un mtodo de anlisis de datos diseado para el caso de varianza no constante. Por ejemplo, para la construccin de I.C. El mtodo es aproximado y menos potente, sin embargo tiene la ventaja de mantener a las observaciones en sus unidades originales de medicin. Para el ANOVA sin la presuncin de varianza constante el modelo es:

Yij = + i + ij , con ij N 0, i2 e independientes


Para este modelo cada contraste
a a a

c
i =1 i

permanece estimable, pero su estimador de mnimos cuadrados

a a 2 i2 ci i = ciYi , con ci = 0 , tiene ahora varianza var ciYi = ci n . Que se estima usando para i =1 i =1 i =1 i =1 i =1 i
cada varianza su correspondiente estimador muestral, entonces :

ci i ci i
i =1 i =1

var ci i i =1
a

ci i ci i
i =1 i =1 2 i

aprox .

c S
i =1 2 i

/ ni

~ t

donde los grados de libertad son calculados con la aproximacin Satterthwaite:

a 2 2 ci Si / ni = i =1 2 a ci2 Si2 / ni

i =1

ni 1

ANEXO 6: ANLISIS CON VARIANZAS DE LOS ERORES DISTINTAS Cmo comparar medias cuando no se cumple el supuesto de varianza constante? Para probar la hiptesis de igualdad de medias:

H 0 : 1 = 2 =

= a vs. H1 : algn para i j

cuando no se cumple el supuesto de homogeneidad de varianza, se debe seguir la sugerencia de Box (1954) la cual consiste en ajustar los grados de libertad del estadstico de prueba F de la siguiente manera:

F0 = MSA / MSE

aprox

f v1 ,v2

con

v1 =

a ( n 1) a 1 , v2 = 1 + c2 2 ( a 2) 1+ c a 1

donde

c =
2

( S
i =1

2 i

S2
2 2

)
con

a S

( )

1 a 2 S = Si a i =1
2

ANEXO 7: QU HACER CUANDO NINGN EFECTO ES SIGNIFICATIVO: A veces al correr un experimento puede suceder que ninguno de los factores estudiados resulten significativos, lo cual se refleja en un R2 bajo. Algunas de las razones de esto y posibles soluciones, son: 1. Variacin excesivamente alta en el proceso, conduce a un MSE muy grande, haciendo que sea difcil detectar factores activos. En ese caso hay que evaluar cules otras fuentes de variacin que quedaron en el trmino de error estuvieron activas durante el experimento. En caso de hallarlas, considerar un nuevo experimento donde se controlen o bloqueen tales fuentes de variacin. Niveles de factores poco espaciados, de forma que resulta imperceptible captar variacin entre respuestas medias. Se requiere reescalar y volver a correr el experimento. Si se eligen bien los niveles y un factor es realmente significativo, la dispersin en la variable respuesta durante el experimento debe ser mayor que la dispersin durante la operacin normal del proceso. Una manera de verificar si los niveles son suficientemente amplios es comparar la variacin observada durante el experimento contra la variacin normal del proceso, y si la primera no es ms grande de modo evidente, entonces puede que los niveles no han sido elegidos adecuadamente. Los factores elegidos no son los verdaderos responsables de la variacin en la variable respuesta, por tanto hay otros factores no considerados que deben ser influyentes. Poca variacin en la variable respuesta, bien sea por cualquiera de las dos situaciones anteriores, o porque el tamao de la prueba fue insuficiente para detectar cambios importantes. Esto ocurre en particular cuando la variable respuesta es de conteo, E.j. proporcin de artculos defectuosos en cada corrida, que resulta normalmente pequeo, por lo que se requieren muchas piezas o unidades para observar algn defectuosos. Por tanto si el tamao de prueba no es suficiente habr que volver a correr el experimento para agregar mayor informacin.

2.

3. 4.

Si no se est satisfecho con los resultados de un experimento, antes de desecharlos hay que analizar qu pas, investigar cules de las cuatro situaciones anteriores pudo presentarse. La experimentacin debe ser un proceso de generacin de informacin y aprendizaje.

ANEXO 8: QU SE HACE DESPUS DEL PRIMER EXPERIMENTO: Aunque se haga una buena planeacin y ejecucin de un experimento, a veces el estudio no es definitivo ni concluyente, o bien, o se cometieron errores, o se quiere llegar a ms y mejores decisiones. Qu hacer despus del primer experimento depende de los resultados obtenidos. Existen al menos tres tipos de posibles acciones: 1. El estudio es planeado para realizarse por etapas, ya sea por la gran cantidad de factores o porque as lo establece la metodologa: Cuando se tienen mucho factores de estudio rara vez el primer experimento es definitivo, por lo general al inicio se corre un diseo altamente fraccionado o saturado, que permite estudiar slo los efectos principales y no las interacciones entre factores, para detectar a los pocos factores influyentes y plantear posteriormente con estos un estudio ms completo. El estudio se planea para desarrollarse por etapas, aunque no sean muchos los factores a considerar. Por cuestin de economa y eficiencia no se gastan todos los recursos experimentales de una vez. Se recomienda inicialmente correr un diseo factorial fraccionado de resolucin III IV, y posteriormente si es necesario aclarar confusin de efectos, correr una fraccin adicional. A veces tambin aunque son pocos los factores de estudio, en el anlisis se encuentran dificultades en la determinacin de la significancia de algunos efectos, por lo que luego se corre una rplica adicional para obtener ms potencia en el experimento. Se comete algn error de planeacin. Un error comn es la poca planeacin del experimento en el cual por lo general se incurre en seleccionar inadecuadamente el ancho de los niveles de los factores, lo cual luego slo se corrige corriendo parte o todo el experimento de nuevo. Otro error es no incluir un factor potencialmente importante, y sobre todo cuando su inclusin no aumenta el nmero de corridas, ni el costo experimental.

2.

3.

Algunas de las acciones especficas despus de un primer experimento: a) b) c) Agregar otra fraccin en un diseo factorial fraccionado para eliminar dudas o ambigedades en la interpretacin de efectos en experimentos de resolucin III IV. Reescalar, cuando no se tom un espaciamiento adecuado entre niveles de uno o varios factores, lo cual puede implicar volver a correr todo el experimento de nuevo. Un mal espaciamiento impide detectar el efecto de un factor an cuando ste si sea influyente. Quitar factores (colapsar) sobre los que se ha comprobado no afectan de ningn modo a la respuesta, o agregar otro, que no fue considerado en principio pero que ahora interesa estudiar. En el primer experimento no deberan dejarse por fuera ningn factor controlable que pueda afectar slo o interactuando con otros factores. Obtener ms replicaciones del experimento (todo o parcialmente) cuando no se ha podido ser concluyente sobre algn (o algunos) efecto (s). En el ANOVA tales efectos son reconocidos porque sus valores P estn entre 0.05 y 0.1, y puede ser que sea debido a baja potencia de las pruebas estadsticas. Moverse de lugar. Es parte de la metodologa de superficie de respuesta, para buscar condiciones ptimas de operacin del proceso, donde ms que hallar el mejor tratamiento en el primer experimento, se busca ms las mejores maneras de operar el proceso. Del primer experimento mediante un modelo de regresin ajustado, se sacan conclusiones acerca de hacia qu direccin mover los niveles de los factores (se trabaja con pocos factores), corriendo puntos necesarios para ajustar un modelo de primer orden (slo efectos principales), incluyendo en el diseo el punto central para detectar curvatura. Aumentar el experimento cuando se detecte curvatura significativa, y consiste en seleccionar en forma adecuada puntos adicionales y correrlos, para estudiar tanto los efectos principales e interacciones como efectos cuadrticos puros. Es necesario al menos tres niveles en cada factor para este tipo de estudios. Ej. diseo central compuesto que a partir de un diseo factorial que detect curvatura agrega puntos axiales.

d) e)

f)

Вам также может понравиться