Вы находитесь на странице: 1из 35

4.

DISEOS EXPERIMENTALES

El Diseo de Experimentos se inici en el ao 1935 por Sir Ronald A. Fisher en la


agricultura, quien sent la base de la teora del Diseo Experimental y que a la fecha
se encuentra bastante desarrollada y ampliada a otras reas de las ciencias.
Actualmente las aplicaciones son mltiples, especialmente en la investigacin de las
ciencias naturales, ingeniera, laboratorios y casi todas las ramas de las ciencias
sociales. La experimentacin proporciona datos experimentales, en contraste con los
datos de la observacin que representan, como su nombre lo indica, observaciones
de las unidades elementales de una poblacin o de una muestra, los cuales no
deben ser cambiados ni modificados por ningn intento de parte del investigador en
el curso de la observacin, lo que s ocurre con los datos experimentales.

Un experimento diseado es una prueba o serie de pruebas en las cuales se


inducen cambios deliberados en las variables de entrada de un proceso o sistema,
de manera que sea posible observar e identificar las causas (factores) de los
cambios en la respuesta de salida, situacin que se puede esquematizar de la
siguiente manera:

FACTORES

X1 X2 X3
....

ENTRAD SALI
PROCESO
.....
Y1 Y2 Y3
FACTORES
INCONTROLABLES
Segn el esquema, el proceso del diseo experimental se ve afectado por factores
controlables e incontrolables lo que origina que las salidas estn sometidas a
incertidumbre. Los factores controlables como la variable tipo de publicidad, son
manipulados por el investigador. En cambio los factores incontrolables, como las
expectativas o el tiempo climtico en determinados momentos o el nivel de
produccin de una planta no pueden ser manipulados por el investigador.
En un experimento se manipulan ciertas variables las que bajo ciertas condiciones
producirn ciertos resultados, efectos o respuestas deseados por el investigador, los
que se ven afectados por factores incontrolables alterando as los resultados
deseados.
Cun necesarios son los experimentos para determinar las causas que originan las
respuestas de un proceso o se podra sin ellos llegar a las mismas conclusiones
analizando los datos disponibles de la observacin directa?
La prctica ha demostrado que los datos disponibles provenientes de la observacin
directa no permiten descubrir las variaciones de los factores que intervienen en un
proceso, ni conociendo las variaciones en los efectos, determinar cules variables (o
cules de sus tratamientos) son las causantes de estas variaciones. Por tanto, slo
los experimentos pueden determinar la forma cmo afectan las variables
independientes al proceso, aun cuando en l participan una serie de factores siendo
muchos de ellos incontrolables, causantes del error experimental. Asimismo, los
datos provenientes de la observacin directa pueden llevarnos a obtener datos no
consistentes, desfasados o altamente correlacionados que esconden las verdaderas
causas del efecto o respuesta.

Cuando las variables de un proceso estn correlacionadas, se pueden producir dos


situaciones:

1. Confusin de los efectos, al no poder discriminar con certeza a cules variables


o factores se debe el efecto o resultado de un proceso.
Esto se esquematiza de la siguiente manera:
La Variable 1 y la Variable 2 actan simultneamente para producir un efecto
conjunto en una Variable 3. El problema est en determinar a cul de las
variables 1 o 2 se debe el efecto o qu porcin del efecto corresponde a cada
variable.

Variable
1
Variable
Variable 3

As, si se mezclan 2 variables como la Publicidad y el Tipo de Envase el efecto


es una elevacin de las Ventas. A cul de las 2 variables se debe el efecto y en
qu proporcin?
2. Relacin no causal, cuando existe una variable oculta que influye indirectamente
en la variable dependiente.
As, si se estudia el efecto que tiene la variable Nivel Educativo (variable 1) en el
Nivel de los Salarios (variable 2) puede haber una tercera variable oculta que no
se considera en el estudio como la Experiencia profesional (Variable 3).
RELACIN NO CAUSAL

Variable 1 Variable 2

Variable 3

Estos problemas pueden ser detectados si se realizan experimentos con las


variables que afectan el proceso.

El Diseo de Experimentos est relacionado bsicamente con el planeamiento de la


recoleccin de los datos experimentales y se puede afirmar que un experimento es
UNA MUESTRA de una gran poblacin o superpoblacin de posibles experimentos,
en base a la cual se estimarn los parmetros poblacionales, y se tomarn
decisiones con respecto a la comparacin de las poblaciones en estudio. Cada
experimento es una pregunta que se hace a la naturaleza para que las respuestas
no sean confusas o contradictorias, y para ello es necesario que sea tcnicamente
planeado, cuidadosamente conducido, adecuadamente analizado y cautelosamente
interpretado.

El esquema de un experimento se puede representar de la manera siguiente:


Material experimental

Medio
experimental Unidades
experimentales
Las unidades experimentales, que son individuos (animales, vegetales, personas,
cosas o empresas) se encuentran en un medio ambiente denominado medio
experimental, el cual puede ser natural o artificial (controlado por el investigador) y
que en conjunto se denomina material experimental. A las unidades experimentales
se les aplican factores o estmulos, los cuales son variables cualitativas o
cuantitativas en diferentes niveles con la finalidad de cambiar el comportamiento de
aqullas (las unidades experimentales) en el curso de un experimento. Los factores
son variables controladas por el investigador y se las puede denominar como
variables independientes. El experimento requiere una maduracin en el tiempo, aun
cuando mnima, para observar los efectos en las unidades experimentales. Estos
efectos se denominan respuestas, las que deben necesariamente estar medidas en
una escala cuantitativa y se les asocia con una variable dependiente ya que
dependen de las variables independientes o factores.

Por lo general, un experimento se realiza para identificar las principales causas de


variacin en la respuesta, para encontrar las condiciones que permitan alcanzar un
nivel ptimo en las respuestas o para comparar las respuestas a diferentes niveles
de factores controlados por el investigador seleccionando as el mejor o mejores
niveles que optimicen las respuestas. Adicionalmente, desde el punto de vista
terico, los experimentos se realizan para construir modelos que permitan obtener
predicciones de la respuesta.

Definiciones

Las siguientes definiciones son necesarias:

Variable Respuesta: es la variable en estudio, aquella cuyos cambios se desean


estudiar y puede ser considerada como la variable dependiente. Por ejemplo Altura
de planta, Unidades de producto vendidas. Para realizar comparaciones entre
tratamientos y extraer conclusiones se recomienda que sea medida en una escala
cuantitativa de razn o de intervalos.
Factor: es la variable independiente, la variable que manipula el investigador, para
estudiar sus efectos sobre la respuesta o variable dependiente. Ejm. Niveles de
fertilizacin, Dosis de medicamento, Marca de producto, Tipo de mquina, etc.
Nivel Del Factor: Se refiere a cada una de las categoras, valores o formas
especficas del factor. Ejm. En el Factor Niveles de fertilizacin podran ser: 50 kg de
N, 100 kg de N, 150 kg de N. En el Factor Tipo de mquina: Mquina A, Mquina B,
Mquina C.
Clases de factores: los factores pueden ser de dos tipos: cualitativos y
cuantitativos.
Factor Cualitativo: sus niveles se clasifican por atributos cualitativos. Ejm.
Tipo de publicidad (con categoras Radio, TV, Peridico)
Factor Cuantitativo: sus niveles son cantidades numricas en una escala de
razn o de intervalo. Ejm. Tiempo de publicidad (con niveles 1 hora, 2 horas, 3
horas diarias).

Tipos de experimentos atendiendo al nmero de factores involucrados:


Experimento Unifactorial: es aquel en el que se estudia un solo factor.
Experimento Multifactorial: es aquel en el que se estudia simultneamente
ms de un factor.
Tratamientos: Conjunto de condiciones experimentales que sern impuestas a una
unidad experimental en un diseo elegido.
En experimentos unifactoriales, un tratamiento corresponde a un nivel de factor.
As, en el factor cualitativo Tipo de Publicidad se pueden presentar 3 niveles:
publicidad por radio, publicidad por TV, publicidad escrita. Cada uno de ellos
constituye un tratamiento.
En el factor cuantitativo Tiempo de publicidad se pueden presentar 4 niveles:
20 seg, 30 seg, 40 seg, 60 seg. Cada uno de ellos constituye un tratamiento.
En experimentos multifactoriales, un tratamiento corresponde a la combinacin de
niveles de factores.
Por ejemplo, si estamos experimentando con 2 factores como Fertilizacin
(Qumica y Natural) y Aradura (Superficial y Profunda), al combinar los niveles
del factor
Fertilizacin Qumica X Aradura Superficial
ste se convierte en un tratamiento combinado.
Fertilizacin Qumica X Aradura Profunda
Sera otro tratamiento.

Unidad Experimental: es la parte ms pequea de material experimental expuesta


al tratamiento, independientemente de otras unidades. Las unidades pueden ser:
personas, animales, plantas, minerales, empresas, o cualquier cosa sobre las que se
desee experimentar y se apliquen los factores en estudio.

Error Experimental: Describe la variacin entre las unidades experimentales


tratadas de forma idntica e independiente. Una caracterstica de la naturaleza es
que cualquier proceso est sometido a variacin, por lo que puede considerarse a
ella como innata a cualquier proceso.
Las causas del error experimental se deben por tanto a:
Variacin natural entre unidades experimentales
Variabilidad en la medicin de la respuesta
Imposibilidad de reproducir idnticas condiciones del tratamiento de una
unidad a otra
Interaccin de tratamientos con unidad experimental
Cualquier factor externo no considerado en el experimento, por ejemplo las
horas del da.

Tratamiento Control (testigo): Un control es aquella unidad experimental a la que


no se le aplica tratamiento y revelar las condiciones en que se realiza el
experimento.
Mediciones: Son los valores de la variable dependiente, obtenidos de las unidades
experimentales luego de la aplicacin de tratamientos. Estas mediciones se realizan
en el transcurso del experimento.

Elementos

El diseo de experimentos considera los siguientes elementos: i) Los factores que


incluyen el conjunto de tratamientos incluidos en el estudio ii) El conjunto de
unidades experimentales utilizadas en el estudio iii) Las reglas y procedimientos
de asignacin de los tratamientos a las unidades experimentales (o viceversa) y,
iv) Las mediciones o realizadas a las unidades experimentales luego de aplicar
los tratamientos y que constituyen las respuestas, destacndose que stas se
determinan al final del proceso.

Principios del Diseo de Experimentos

Los principios bsicos de un diseo de experimentos son 3:

1) Control Local (o control del error experimental).


2) Repeticin, reproduccin o replicacin.
3) Aleatorizacin.

1. Control del error (control local)


Son las acciones empleadas por el investigador para disminuir o controlar el
error experimental.

Error experimental: es la variabilidad existente entre unidades experimentales


igualmente tratadas.
Las causas de esta variabilidad provienen de la variabilidad natural entre
unidades experimentales, de la variabilidad de las variables no controladas y la
variabilidad ocasionada por la tcnica experimental utilizada para controlar o
manipular las variables o factores.
Finalmente, las fuentes de variabilidad en la variable respuesta se deben a:
Las variables explicatorias o factores (las cuales pueden ser controladas por
el investigador)
El error experimental (las que no pueden ser controladas, pero si disminuidas)

Control del error


Para controlar (o precisamente, disminuir, el error experimental) se utilizan
unidades experimentales homogneas. Si las unidades experimentales son
heterogneas (como lo son generalmente), se las puede agrupar en unidades
ms o menos homogneas (denominadas bloques) y dentro de estos aplicar los
tratamientos. Esto conduce a utilizar una tcnica experimental ms refinada. El
bloqueo se puede realizar ms de una vez: Si se realiza un bloque la tcnica
adecuada es el de Bloque Completo al Azar, si se bloquea 2 veces, el diseo
adecuado es el de Cuadrado Latino.

2. Repeticin

Consiste en aplicar un tratamiento a ms de una unidad experimental. La


cantidad de rplicas es la cantidad de repeticiones de cada tratamiento e implica
una repeticin independiente del experimento demostrndose que se pueden
reproducir los resultados, bajo las mismas condiciones experimentales.
Asimismo, este principio permite una estimacin del error experimental y mejora
la precisin de un experimento.
Los experimentos pueden tener el mismo nmero de repeticiones por
tratamiento, en cuyo caso se denominan balanceados, y cuando no,
desbalanceados.
Debe considerarse que a mayor cantidad de rplicas, mayor es la precisin del
experimento y mayor es la potencia de la prueba. La cantidad de rplicas (ni)
necesaria para un experimento depende de la variabilidad de la variable
respuesta la magnitud del efecto que se quiere detectar d, el nivel de
significacin y la potencia es decir, la probabilidad de detectar el efecto.

3. Aleatorizacin

Consiste en la asignacin al azar de los tratamientos a las unidades


experimentales. En cambio, en un estudio observacional, consiste en la
seleccin al azar de los individuos. Logra que los factores no controlados por el
experimentador en el diseo experimental y que pueden influir en los resultados
sean asignados al azar a las unidades experimentales.

La tcnica general utilizada en el diseo de experimentos se conoce como


Anlisis de Varianza, que est basada en el anlisis de la variabilidad de las
respuestas registradas en las unidades experimentales. Esta tcnica permite
descomponer la variabilidad de las respuestas en variabilidad de efectos debido
a las variables independientes y al error experimental.

Anlisis de varianza

Es una tcnica estadstica que permite analizar la variacin total de los resultados
experimentales de un diseo en particular, descomponindolo en fuentes de
variacin independientes atribuibles a cada uno de los efectos que constituyen el
diseo experimental.
Esta tcnica tiene como objetivo identificar la importancia de los diferentes factores
tratamientos en estudio y determinar cmo interactan entre s.

El razonamiento es el siguiente, apoyado en el esquema:


T1
Obj101

' '1
R1cDA B
r A ' Dr1 A B ' Dc1 B I
T2 Tj Tt

y11 y12 y13 y1tX


y21 y22 .j y2t

y31 y32 Yij y3t




yr1 yr2 yr3 yrt



..

Dado que un experimento es una muestra de una superpoblacin que contiene una
serie de experimentos a los cuales se aplica un determinado tratamiento, del que se
espera tenga un efecto, entonces, en la situacin inicial, cuando no se aplique
ningn tratamiento la superpoblacin tendr como valor representativo la media
general al cual se igualaran las medias de todos los tratamientos si el
experimento no diera resultado. En otras palabras:
que es la media del Tratamiento 1 (T1) sera igual a la media del tratamiento 2

(T2) y as sucesivamente hasta .t la media del tratamiento t (Tt), igualndose todos
a
..

la media general del experimento.

Esto equivale a sostener que el experimento no dio resultado. En cambio, si el


experimento tuviera resultado, equivaldra a afirmar que existe un efecto tratamiento
j= .j- .. .Esto equivale a la variacin de los tratamientos.
Cada observacin yij difiere de la media general .. de manera que yij- equivale a
la variacin total.

Adicionalmente cada yij difiere de su propia media, pero cuando el experimento tuvo
efecto, la diferencia ser respecto de su efecto tratamiento, es decir
yij- j
Lo que constituye la variacin del error experimental.

Resumiendo:
(yij- ..) = ( .j-) + (yij- .j)
Variacin total variacin de tratamientos variacin del error

Esta ecuacin puede reescribirse as



yij- .. = j + ij
o
ij
yij = .. + j +
que corresponde al modelo del Diseo Completamente al Azar (DCA), donde j es
el efecto tratamiento.

Este modelo equivale a:

Respuesta = Media general + Efecto tratamiento + Error Experimental

Para efectos del anlisis de varianza la variacin total se descompone en dos partes:
variacin debida a los tratamientos y debido al error. Esta es la base del anlisis de
varianza. Si esta variacin se eleva al cuadrado y se realiza a travs de cada
tratamiento y cada repeticin se tiene:
r t r t 2 r t

i 1
(y ij ..) (.j ..)
j1
2

i 1 j1 i 1
(y
j1
ij .j ) 2

Que corresponden a:

Suma de cuadrados = Suma de Cuadrados + Suma de Cuadrados


Del Total de Tratamientos del Error

Bajo la condicin de ortogonalidad.

Hiptesis estadstica en el diseo de experimentos

Es el supuesto que se hace sobre el valor de un parmetro (constante que


caracteriza a una poblacin) el cual puede ser validado mediante una prueba
estadstica. En el experimento este parmetro es el Efecto Tratamiento j.
Las hiptesis a probar en un diseo experimental estn referidas a si los
tratamientos tienen el mismo efecto sobre las unidades experimentales, considerada
como hiptesis nula (H0) y la hiptesis alterna (H 1) que es la negacin de la
hiptesis anterior, pero que en el fondo no es ms que la prueba de la igualdad de
ms de dos medias simultneamente frente a la negacin de esta afirmacin.

H0:j= 0 (Los j tratamientos tienen el mismo efecto sobre las unidades


experimentales, o No tienen efecto o las medias de cada tratamiento son
iguales).
H1:j 0 (Los tratamientos NO tienen el mismo efecto sobre las unidades
experimentales. S tienen efecto, o las medias de los tratamientos son
diferentes).

Al probar cualquier hiptesis estadstica el investigador est propenso a cometer los


siguientes tipos de errores:
Error Tipo I: Se comete cuando se rechaza la hiptesis nula, siendo sta verdadera;
la magnitud de este error es fijado por el investigador y constituye el nivel de
significacin de la prueba; usualmente los valores usados como nivel de
significacin son 0.05 0.01.
Error tipo II: Se comete cuando se acepta la hiptesis nula, siendo esta hiptesis
falsa; la magnitud de este error no se puede fijar, pero si es posible minimizar
utilizando un tamao adecuado de muestra.

Diferencias entre el Anlisis de Regresin y Anlisis de Varianza

Es posible establecer ciertas similitudes y diferencias entre estas tcnicas ya que


ambos anlisis establecen relaciones entre variables denominndose, en el caso del
anlisis de varianza, Variable Respuesta y, en el anlisis de regresin, Variable
Dependiente. Paralelamente, en el anlisis de varianza se denominan factores a lo
que en anlisis de regresin se denominan variables independientes, por lo que
ambas tcnicas estudian la relacin estadstica entre variables para tomar
decisiones, aun cuando en el Anlisis de Regresin el objetivo es predecir.
Tanto en el anlisis de regresin como en el anlisis de varianza las variables
independientes como sus anlogas, los factores pueden ser cualitativos o
cuantitativos. La diferencia radica en la variable respuesta que necesariamente, en
el caso del Anlisis de Varianza, debe ser cuantitativa. En cambio, en el anlisis de
regresin las variables cualitativas dependientes pueden ser tratadas mediante
regresiones no lineales del tipo probit, normit o logit.

En el Anlisis de Varianza el objetivo es comparar los distintos niveles de la o las


variables independientes factores para establecer diferencias significativas en la
variable dependiente respuesta. Aun as, el procesamiento hasta cierto punto
conduce a resultados similares, mediante una codificacin adecuada de las
variables, como se ver posteriormente.

Tipos de Modelos

Los modelos experimentales de clasifican en tres tipos:


Modelos de efectos fijos.
Modelos de efectos Aleatorios.
Modelos Mixtos.(Factores fijos y aleatorios).

Cuando el investigador tiene control sobre el material experimental aplicando slo


los niveles de los factores que le interesan en el modelo, es de efectos fijos.
Cuando se investiga un factor pero no se tiene control sobre los tratamientos, por
ejemplo en los estudios por muestreo, donde los niveles que se aplican son una
muestra extrada al azar de una poblacin de niveles, los modelos son de efectos
aleatorios. Se estudiar slo el primer tipo de modelos.

Modelo de efectos fijos


En este modelo los tratamientos son seleccionados previamente y se aplican en
una sola situacin, por lo que solo existe una muestra en el experimento.

Y ij =.. + j + ij con i=1 , , r y j=1 , t

Modelo de efectos aleatorios


En este modelo se asume que las k muestras seleccionadas son muestras
aleatorias de k situaciones distintas y aleatorias. De modo que un valor aislado
Yij se puede escribir como:

Y ij =.. + A j + ij con i=1 , , r y j=1 , t

Modelo Mixto

Este modelo es la combinacin de los dos anteriores y se presenta cuando


algunos factores son fijados y otros son elegidos al azar. En estos casos las
conclusiones del anlisis de variancia sern vlidas para toda la poblacin de
factores cuando estos son elegidos al azar, y solamente para los factores
usados cuando estos son fijados.

Supuestos del modelo

Los supuestos necesarios del modelo estadstico son:


a. Aditividad: Los factores o componentes del modelo estadstico son aditivos, es
decir la variable respuesta es la suma de los efectos del modelo estadstico.
b. Linealidad: La relacin existente entre los factores o componentes del modelo
estadstico es del tipo lineal.
c. Normalidad: Los valores resultado del experimento provienen de una distribucin
de probabilidad Normal con media y variancia 2 .
d. Independencia: Los resultados observados de un experimento son
independientes entre s.
e. Varianzas Homogneas (Homocedasticidad): Las diversas poblaciones generadas
por la aplicacin de dos o ms tratamientos tienen variancias homogneas
(variancia comn).
De estos supuestos, los tres ltimos necesitan ser probados estadsticamente.

Pruebas de comparacin de medias

Es propsito de todo investigador que realiza un anlisis de varianza en un


experimento en particular, realizar la prueba sobre el efecto de los tratamientos en
estudio, para ello hace uso de la prueba F el cual indicar si los efectos de todos los
tratamientos son iguales o diferentes; en caso de rechazar la hiptesis nula H 0, de
que todos los tratamientos tienen el mismo efecto, es decir, que los tratamientos son
diferentes o no tienen el mismo efecto, entonces es necesario realizar pruebas de
comparacin de promedios a fin de determinar cules tratamientos presentan
diferencias, y para esto es necesario realizar pruebas de comparacin como las
siguientes:

Diferencia Significativa Mnima (DLS):


Es una prueba para comparar dos medias y su uso en comparaciones
simultneas se justifica slo en las siguientes condiciones:
a. Cuando la prueba F resulta significativa.
b. Las comparaciones fueron planeadas antes de ejecutar el experimento.
Cada par de medias se compara con el valor de la DSM (Diferencia Significativa
Mnima) que se obtiene utilizando la ecuacin:
DSM=
2(CMEr) F ,(1, nt)
r . Si la diferencia de las medias supera la DSM

se entiende que es significativa. (CMEr son los cuadrados medios del error).

Prueba de Rangos Mltiples de Duncan:


Se utiliza para realizar comparaciones mltiples de medias; y en esta prueba no
es necesario realizar previamente la prueba F y que sta resulte significativa; sin
embargo, es recomendable efectuarla cuando la prueba F haya resultado
significativa, a fin de evitar contradicciones entre ambas pruebas.

Prueba de Rangos Mltiples de Tukey:


Se utiliza para realizar comparaciones mltiples de medias; esta prueba es
similar a la prueba de Duncan en cuanto a su procedimiento y adems es ms
exigente.

Prueba de Comparacin de Dunnet:


Es til cuando el experimentador est interesado en determinar que tratamiento
es diferente de un testigo, control o tratamiento estndar, y no en hacer todas las
comparaciones posibles (que pasaran a una segunda prioridad); es decir,
cuando se quiere comparar el testigo con cada uno de los tratamientos en
estudio.
Coeficiente de variabilidad

Es una medida de variabilidad relativa (sin unidades de medida) cuyo uso sirve para
cuantificar en trminos porcentuales la variabilidad de las unidades experimentales
frente a la aplicacin de un determinado tratamiento. En experimentacin no
controlada (condiciones de campo) se considera que un coeficiente de variabilidad
mayor a 35% es elevado debindose tener especial cuidado en las interpretaciones
conclusiones. En condiciones de laboratorio se considera un coeficiente de
variabilidad mayor como elevado. La expresin estimada del coeficiente de
variabilidad es:
CV =
CMEr
Y x100

Clases de Diseos

Los diseos experimentales conocidos, basados en la tcnica del anlisis de


varianza son el Diseo Completamente el Azar, el Diseo en Bloque Completo al
Azar, el Diseo en Cuadrado Latino entre los que consideran un solo factor de
anlisis. Entre los que analizan dos o ms factores se tienen los diseos factoriales
completos e incompletos y, como casos particulares los diseos en parcelas
divididas y los diseos en franjas. Una clasificacin general se muestra a
continuacin:

Diseos con un solo factor o variables independientes:


- Diseo completamente al Azar (DCA).
- Diseo en Bloque Completo al Azar (BCA)
- Diseo en Cuadrado Latino (DCL)
Diseos con 2 o ms factores o variables independientes
- Diseos factoriales
- Parcelas Divididas
- Diseos en franjas

Bibliografa
- Cochran, W. y G. Cox. (1973. Diseos experimentales. Editorial Trillas. Segunda
edicin. Mxico.Editorial Revert. Segunda edicin. Barcelona.
- Box, G. y otros (2008). Estadstica para investigadores. Diseo, innovacin y
descubrimiento.
- Ferrn, M. 1997. SPSS para Windows. Editorial McGraw Hill. Primera Edicin.
Madrid.
- Gujarati, D. (2004). Econometra. Editorial Mc Graw Hill. Cuarta edicin. Mxico.
- Kempthorne, O. (1952). The Design and Analysis of Experiments. Edit. John
Wiley and Sons. , New York.
- Kuehl, E. (2001). Diseo de experimentos. Principios estadsticos de diseo y
anlisis de investigacin. Editorial Thompson learning. Segunda edicin. Mxico.
5. DISEO COMPLETAMENTE AL AZAR (DCA) Y SU RELACIN CON
EL ANLISIS DE REGRESIN UTILIZANDO VARIABLES DUMMY

Este modelo es el ms sencillo del diseo de experimentos, en el cual la variable


respuesta puede depender de la influencia de un nico factor, de forma que el resto
de las causas de variacin se engloban en el error experimental.
Se supone que el experimento ha sido aleatorizado por completo, es decir, todas las
unidades experimentales han sido asignadas al azar a los tratamientos. Slo se
considera el modelo de efectos fijos.

La nica restriccin es el nmero de observaciones que se toman en cada


tratamiento. De hecho, si ni es el nmero de observaciones en el j-simo
tratamiento, j= 1,...,t, entonces, los valores n 1,n2,...,nt determinan por completo las
propiedades estadsticas del diseo. Este tipo de diseo se utiliza en experimentos
que no incluyen factores bloque.

El modelo matemtico de este diseo tiene la forma:

Respuesta = Constante + Efecto tratamiento + Error

Notacin

Consideramos Yij, la variable aleatoria que representa el valor de la respuesta en la


i-sima observacin del j-simo tratamiento. En adelante se utilizar la notacin Y ij
para referirse a la variable e yij para referirse a una observacin concreta. j, la
respuesta real del j-simo tratamiento. Es decir, la respuesta que se obtendra
siempre con el j-simo tratamiento si se ejecutase el experimento en, exactamente,
las mismas condiciones. ij, la variable aleatoria que representa la distancia de la i-
sima observacin del j-simo tratamiento a su valor real. Por tanto ij representa la
contribucin de las fuentes de variacin menores y no planificadas. Esta variable se
denomina error experimental.

Para cada j = 1,...,t, i = 1,...,r, el modelo matemtico del diseo es:

Yij = j + ij

En el que los componentes Yij y ij son aleatorios y j es determinista.


Si en este modelo se denota
j = + j para j: 1, ,t
se obtiene la siguiente forma alternativa del modelo

Yij = + j + ij

es una constante que representa la respuesta media de la variable Y, y j


representa la variacin de la media del nivel j respecto a la media de la respuesta:
j= j-o efecto tratamiento. Los parmetros j se llaman efectos.
Examinar las diferencias entre niveles de tratamientos equivale a examinar las
diferencias entre los parmetros j o entre los parmetros j

El modelo es lineal. En su estudio se suponen las siguientes hiptesis:

1. La varianza de la respuesta es constante (supuesto de homocedasticidad),


V(Yij) = 2 para i= 1,,r. para j= 1, ,t
Equivalentemente V ( It) = 2 para i= 1,,r. para j= 1, ,t
2. La distribucin de la respuesta Yij es normal (supuesto de normalidad),
Equivalentemente la distribucin de ij es normal.
3. Las observaciones Yij son independientes. Bajo las hiptesis de normalidad, esto
equivale a que Cov(Yij ,Ykh) =0, con i diferente de k, j diferente de h. Esto mismo
ocurre para los ij.
La tabla ANOVA para el diseo DCA es el siguiente:

Tabla ANOVA del Diseo Completamente al Azar (DCA)


Fuentes Variacin Sumas de g.l Cuadrados F
Cuadrados Medios
Entre Tratamientos SCTrat. t-1 SCTrat/g.l (I) Fo= (I)/(II)
Dentro Trat. (Error) SCError t(r-1) SCError/g.l (II)
Total SC Total rt 1

Mediante la tcnica de Mnimos Cuadrados Ordinarios se obtienen los estimadores


de la media general, el efecto tratamiento y, como consecuencia, del error
experimental.
Si usamos la notacin puntual, entonces:
^= y ..

^ j= y . j y .. para j=1, 2, t

Por tanto las ecuaciones resultantes son:


r t r t 2 r t

i 1
(yij y..) 2 ( y.j y.. )
j1 i 1 j1 i 1
(yj1
ij y.j ) 2

Suma de CuadradosSuma de Cuadrados de Tratamientos


del Total Suma de Cuadrados del Error

Las expresiones parciales de cada fuente de variacin se expresan de la siguiente


manera:
r t r t

(y y..) yij2 n y
2 2
SCTot= ij
i 1 j1 i 1 j 1

r t 2 t

( y.j y.. ) r y . j n y
2 2
SCTrat=
i 1 j1 j 1

r t r t t

(y ij y.j ) 2 yij2 r y. j
2
SCEr= i 1 j1 i 1 j 1 j 1

Con j= 1, 2, , t
I= 1, 2, , r
Denominndose BALANCEADO al modelo por tener el mismo nmero r de
repeticiones en cada tratamiento.
Un diseo es desbalanceado si el nmero de observaciones es diferente en cada
tratamiento j donde j=1, 2, .. . ,t, las expresiones previas son iguales salvo que se
sustituye r por nj.



y ij y ..


t
donde n j=n

j=1
nj

SCTot=
i =1



y . j y ..


t


j=1
nj

SCTrat =
i=1

SCE = SCT SCTrat

Ejemplo 1 (Factor Cualitativo: Mtodo de estudio)


Se comparan 4 mtodos de estudio replicados en 5 estudiantes universitarios. Los
efectos se midieron en las notas en una escala porcentual. Se obtuvieron los
siguientes datos:

Mt. 1 Mt. 2 Mt. 3 Mt. 4

1 19 80 47 95
2 20 61 26 46
3 19 73 25 83
4 30 56 35 78
5 8 80 50 97

El Factor o variable independiente es el Mtodo de Estudio el cual tiene 4 niveles o


tratamientos: Mt. 1, Mt. 2, Mt. 3, Mt. 4 y es una VARIABLE DE TIPO
CUALITATIVO.

Hiptesis del estudio:


Las cuatro son muestras aleatorias simples de las correspondientes poblaciones.
Las respuestas siguen una distribucin normal.
Las respuestas tienen la misma varianza.
Mt. 1 Mt. 2 Mt. 3 Mt. 4 yi . t

1 19 80 47 95 241 4
2 20 61 26 46 153 4
3 19 73 25 83 200 4
4 30 56 35 78 199 4
5 8 80 50 97 235 4
96 350 183 399 1028

r 5 5 5 5 20 y..

y. j
19.2 70 36.6 79.8 51.4 =

t r t r 2 t r

j1
(y ij y..) ( y.j y.. )
i 1
2

j1 i 1 j1
(y
t 1
ij y.j ) 2
r t r t

(y y..) yij2 rt y
2 2
SCTot= ij
i 1 j1 i 1 j 1

5 4 5 4

(y ij y..) 2 yij2 5 x4 y
2

i 1 j1 i 1 j 1

SCTot = (192+ 202+ 192++ 832+ 782+ 972) -20x51.42 =


= 67830- 52839.2= 14990.8
r t 2 t

( y.j y.. ) r y . j n y
2 2
SCTrat=
i 1 j1 j 1

SCTrat = 5(19.22+ 702+ 36.62+79.82) -20x51.42 =


= 5x52839.2= 64881.2-52839.2=12042
r t 5 4 4

(y y.j ) 2 yij2 5 y . j
2
ij
i 1 j1 i 1 j 1 j 1

r t r t t

(y ij y.j ) 2 yij2 r y . j
2
SCEr=
i 1 j1 i 1 j 1 j 1

SCEr= 67830 64881.2= 2948.8

TABLA ANOVA
Fuentes Variacin Sumas de g.l Cuadrados F
Cuadrados Medios
Entre Tratamientos 12042 4-1 =3 4014 Fc=21.78
Dentro Trat. (Error) 2948.8 4(5-1)=16 184.3
Total 14990.8 5x4 1=19

Las hiptesis bajo estudio son:

H0: Los tratamientos son iguales


H1: Por lo menos un tratamiento es diferente.

La Fc=21.78 es mayor que el valor crtico F ,[t-1,r(t-1)]=F0.05,[3,16] =3.24, lo que permite


rechazar la H0 y los tratamientos son diferentes. Por tanto, algn o algunos mtodos
de estudio son diferentes.
A continuacin se selecciona el mejor tratamiento, el que tiene la mejor media o la
media ms alta utilizando para ello la prueba de Diferencia Significativa Mnima
(DSM).
El anlisis descriptivo indica que el Tratamiento 4 es el que tiene la mejor media, lo
que debe corroborarse con la prueba DSM.

Utilizacin de SPSS

Para el tratamiento del diseo DCA utilizaremos el paquete estadstico SPSS ver.22.
El primer paso consiste en ingresar los datos, tal como aparecen a continuacin y
para lo cual se crea una variable Yij y una columna CT de cdigos de tratamientos,
codificando con 1 a las respuestas del tratamiento 1, con 2 a las del tratamiento 2 y
as sucesivamente.
Verificacin de supuestos

Los supuestos de una relacin lineal entre la respuesta y sus componentes como
normalidad y homoscedasticidad deben cumplirse para dar validez a la prueba. El
modelo tiene 3 componentes de los cuales dos son aleatorios el error experimental
ij y la respuesta Yij, y el tercero, la media del tratamiento .j es determinista.
Dado que el nivel de la respuesta est relacionado con el error experimental, resulta
equivalente realizar la prueba de normalidad para los errores o para las respuestas.
Bajo esa condicin se realizan las pruebas en este documento.

Supuesto de normalidad: Prueba de Kolmogorov-Smirnov


Las hiptesis a probar son:
H0: La distribucin de la respuesta Yij es normal
H1: La distribucin de la respuesta Yij NO es normal

Prueba de Kolmogorov-Smirnov para una muestra


Yij
N 20
Z de Kolmogorov-Smirnov ,577
Sig. asintt. (bilateral) ,893

Al Nivel de Significancia del 5% (p_valor=0.893) los errores se distribuyen


normalmente, con lo que el supuesto de normalidad se cumple. Se llega a las
mismas conclusiones si la prueba se realiza con los errores:
Prueba de Kolmogorov-Smirnov para una muestra
Residuo para Yij
N 20
Z de Kolmogorov-Smirnov ,638
Sig. asintt. (bilateral) ,811

Supuesto de Homogeneidad de varianzas

La prueba de homogeneidad de varianzas se realiza utilizando la Prueba de Levene,


y est diseada para efectuarla sobre los residuos o errores e ij, pero por la misma
razn de la dependencia lineal de las respuestas respecto de los errores al ser
ambos aleatorios, los resultados deben ser los mismos, tal como se demuestra a
continuacin:

H0: Las varianzas de las respuestas son homogneas.


H1: Al menos una de las varianzas de las respuestas es diferente.

El p_valor=0.311 no permite rechazar la H 0 al 5%, por lo que se puede determinar


que las varianzas en las respuestas son homogneas.

Prueba de homogeneidad de la varianza para Yij


Estadstico de
Levene gl1 gl2 Sig.
Basada en la media 1,294 3 16 ,311

Se llega a las mismas conclusiones con la prueba aplicada a los errores e ij, tal como
se aprecia en el siguiente cuadro:

Prueba de homogeneidad de la varianza para ij


Estadstico de Levene gl1 gl2 Sig.
Basada en la media 1,294 3 16 ,311

Por tanto, estos supuestos se cumplen y podemos proseguir con nuestro anlisis.
Las hiptesis a probar sobre los tratamientos son:
H0: Los tratamientos son iguales
H1: Por lo menos un tratamiento es diferente.
La tabla ANOVA proporcionada por el SPSS muestra un p_valor=0.000 que conduce
al rechazo de la H0, por lo que se puede concluir que los tratamientos son diferentes
o por lo menos uno de los tratamientos es diferente significativamente del resto.

ANOVA
Suma de Media
cuadrados gl cuadrtica F Sig.
Inter-grupos 12042,000 3 4014,000 21,780 ,000
Intra-grupos 2948,800 16 184,300
Total 14990,800 19

Seleccionando el mejor tratamiento


La Prueba de Diferencia Significativa Mnima (DSM) permite la seleccin del mejor
tratamiento en un procedimiento que compara consecutivamente la diferencia de
pares de tratamientos con el valor DSM calculado de la siguiente manera:

2
DSM= CME . F ,(1,nt )
r

Si la diferencia de medias, en valor absoluto, del par de tratamientos en


comparacin, es mayor que la DSM entonces existe una diferencia significativa y
una de las medias del par es mejor que la otra. Este procedimiento se realiza
consecutivamente entre todos los pares hasta seleccionar el mejor o mejores de
todos. De la siguiente manera:
Si

| y . j y . j|> DSM
'
la diferencia es significativa.

Los resultados del cuadro siguiente conducen a seleccionar el tratamiento 4 como


aquel que tiene la media ms alta, significativamente diferente de las medias de los
tratamientos 1 y 3, pero no diferentes significativamente al tratamiento 2.

El grfico de las medias es ilustrativo al respecto, al mostrar los valores de las


medias en niveles ms altos de los tratamientos 2 y 4 respecto a los tratamientos 1 y
3.
Comandos SPSS para el diseo.
Analizar ANOVA de un factorLista de dependientes: Yij
Factor: CT
Post HocAsumiendo varianzas iguales
Activar: DMS
Continuar
Opciones: Activar: Grfico de las medias
Activar: Prueba de homogeneidad
de varianzas
Continuar
Aceptar

Comandos SPSS para Prueba de normalidad de Kolmogorov-Smirnov

Analizar Pruebas no paramtricas


Cuadro de dilogo antiguosK-S de una muestra
Lista de variables de prueba: Yij
Distribucin de prueba: Activar: Normal
Aceptar

6. DISEO EN BLOQUE COMPLETO AL AZAR Y SU RELACIN CON EL


ANLISIS DE REGRESIN USANDO VARIABLES DUMMY
El Diseo en Bloque Completo al Azar es un plan en el cual las unidades
experimentales se asignan a grupos homogneos, llamados bloques, y los
tratamientos son, luego, asignados al azar dentro de los bloques.
Aparece porque muchos experimentos necesitan diseos que controlen la
variabilidad proveniente de fuentes conocidas, reduciendo el efecto de la variabilidad
proveniente de causas propias del experimento pero independiente del efecto que se
desea estudiar. Para los fines del anlisis de varianza el bloqueo introduce un efecto
adicional ficticio, cuyo objetivo es separar del error experimental, alguna fuente de
variabilidad conocida.

Por tanto, el objetivo del agrupamiento de las unidades experimentales en bloques


es lograr que las unidades dentro de un bloque sean lo ms uniformes posible con
respecto a la variable dependiente, de modo que las diferencias observadas se
deban realmente a los tratamientos. As, al controlar la variacin dentro de los
bloques se reduce la variabilidad del error experimental.

Se denomina Completo porque todos los tratamientos estn incluidos en cada


bloque y, cada bloque constituye una replicacin, en consecuencia,los tratamientos
aparecen una sola vez en cada bloque. Para lograr esto, se divide el material
experimental en tantos bloques como nmeros de replicaciones a utilizar. Cada
bloque es luego dividido en tantas Unidades Experimentales como tratamientos haya
en estudio. Como el DBCA especifica que todos los tratamientos deben aparecer
una vez en cada replicacin, la aleatorizacin se hace separadamente en cada
bloque, siendo este procedimiento aleatorio similar al DCA pero en cada bloque.

El Diseo Completamente el Azar (DCA) se puede graficar de la siguiente manera:

Diseo Completamente al Azar


T r a t a m i e n t o s
Repeticiones T1 T2 T3 Tt

r1 y11 y12 y13 y1t

r2 y21 y22 y23 y2t

r3 y31 y32 y33 y3t

rr yr1 yr2 yr3 yrt

Obsrvese que en una poblacin grande se toman t muestras de tamao r (aun


cuando r no necesariamente debe ser igual en cada muestra). A cada muestra se le
aplica un tratamiento (los cuales son asignados al azar a las unidades
experimentales).
En cambio, en el Diseo en Bloque Completo al Azar (DBCA) el medio experimental
se encuentra formando r Bloques y, por tanto, cada una de las t muestras deben
tomarse considerando una unidad experimental en cada Bloque. De aqu la
denominacin de Bloque Completo. A cada una de las t muestras se le aplica un
tratamiento de inters.
Diseo en Bloque Completo al Azar
T r a t a m i e n t o s

B
T1 T2 T3 Tt

L B1
O y11 y12 y13 y1t
Q B2
L y21 y22 y23 y2t

B3 y33 y3t
E y31 y32
S

Br yr3 yrt
yr1 yr2

Ventajas del diseo

Las ventajas del DBCA son varias y una de las ms importantes es que provee
resultados ms precisos que un DCA del mismo tamao si los agrupamientos de las
unidades experimentales en los bloques son efectivos. Otra ventaja es que sirve
para cualquier nmero de tratamientos y bloques aun cuando los tratamientos no
necesitan tener tamaos de muestras iguales (Bloque Incompleto). El anlisis no se
complica si se debe descartar, por alguna causa, un tratamiento o algn bloque.
Adicionalmente, se puede introducir deliberadamente, variabilidad en las unidades
experimentales para ampliar el rango de validez de los resultados sin sacrificar la
precisin de los resultados.

Desventajas

Las observaciones faltantes dentro de un bloque requiere clculos adicionales ms


complejos y; los grados de libertad para el error experimental disminuyen en relacin
al DCA para un mismo nmero total de unidades experimentales. Se requiere
adicionar supuestos al modelo en relacin a la no interaccin entre tratamientos y
bloques, y varianza constante de bloque a bloque.

Ejemplo 1: Tejidos
Para el Tejido de una prenda se comparan 4 mquinas de diferentes marcas. Como
la operacin de las mquinas requiere cierta destreza prev una diferencia entre los
trabajadores en cuanto a la velocidad con la cual operen las mquinas. Se decide
que se requerirn 6 trabajadores diferentes en un experimento de bloques
aleatorizado para comparar las mquinas.

Entonces, el factor de inters es uno slo, la productividad de las mquinas, pero se


crea otro factor para controlar la variabilidad extraa y excluirla as del error
experimental. Este factor adicional, que no es de inters en el experimento, pero que
puede distorsionar los resultados son las diferentes habilidades de los trabajadores,
por lo que se decide formar bloques con ellos. Por tanto se forman 6 bloques
correspondientes a los trabajadores: B1, B2, B3, B4, B5, B6.

Aleatorizacin: Se realiza al asignar en forma aleatoria la mquina que debe operar


cada trabajador y se asigna el siguiente cdigo a cada tratamiento (mquina), T 1, T2,
T3, y T4 y B1, B2, B3, B4, B5 y B6 a cada bloque.
Bloque 1 Bloque 2 Bloque 3 Bloque 4 Bloque 5 Bloque 6

T2 39.8 T3 40.5 T2 40.5 T445.2 T1 42.9 T243.1


T4 42.3 T1 39.3 T1 39.6 42.3
T2 T344.9 T443.3
T3 40.2 T2 40.1 T4 44.5 39.9
T1 T242.5 T345.1
T1 42.5 T4 43.2 T3 41.3 43.4
T3 T446.9 T143.6

Si las mquinas no difieren en cuanto a la velocidad de operacin, o, visto de otra


forma, en el nmero de piezas tejidas por unidad de tiempo, tendran igual velocidad
promedio o igual nmero promedio de piezas tejidas y las curvas se superpondran
exactamente. As, la hiptesis nula es:

H0 :1= 2 = 3= 4 (Las medias de los 4 tratamientos son iguales)



H0:1=2=3=4=0 (El efecto tratamiento es nulo o no existe)

Pero si las mquinas difieren en cuanto a la velocidad de tejido de la pieza, o el


nmero promedio de unidades tejidas, se supone que las muestras provienen de
poblaciones diferentes, entonces la hiptesis alterna ser:

H1: algn promedio es distinto de los restantes

En el presente caso se tratar del nmero de piezas promedio tejidas.

El modelo

El modelo terico para el DBCA es el siguiente:

Yij = + J + i + ij
El cual es un Modelo Lineal Aditivo, en el que cada respuesta Yij es la suma de los
otros trminos, es decir, de una media general , el efecto tratamiento J, el efecto
bloque i, y el error experimental ij.
Donde Y es la variable respuesta o dependiente, nmero de piezas por minuto, e Y ij
es la observacin perteneciente al i-simo bloque bajo el tratamiento j; las
observaciones son independientes.
es la media general comn a todas las mquinas y a todos los trabajadores.
j es el efecto del tratamiento en el nivel j, propio de cada mquina.
i es el efecto del bloque en el nivel i, propio de cada trabajador.
ij es la variable aleatoria del error con distribucin normal, con media=0 y varianza
2 y se distribuye como una N(0 ;2 ) e independiente.

Cuando el modelo es aditivo quiere decir que la diferencia en respuestas medias


entre dos trabajadores es la misma para todas las mquinas.
Si aplicamos el Mtodo de los Mnimos Cuadrados, para estimar los parmetros del
modelo, resulta:
r t
1
^..= y ..= y ij
rt i=1 j=1

Donde r representa el nmero de bloques y t de los tratamientos.


^ ij = y ij ^ .. ^ j ^ i= y ij y . j y i . + y ..

Cada componente del modelo contribuye a la variabilidad total. La particin de la


Suma de Cuadrados Total involucrar tres fuentes de variacin.
( y. j y..) ( yi . y..) ( yij y . j y i. y.. )
( yij y..)

Variacin total Variacin debido Variacin debido Variacin propia de

( y
i j
ij y..) 2 r ( y. j y..) 2 t ( y i. y..) 2 ( yij y . j y i. y.. ) 2
j i i j
y que por
ortogonalidad de distancias y sumando a travs de bloques y tratamientos se tiene:

y que para efectos prcticos denominamos:


SCTot = SCTrat + SCBloq + SCEr

Cada parte de esta ecuacin puede reescribirse:


SCTot ( yij y..) 2 yij2 rt y ..
2

i j i j

SCTrat ( y. j y..) 2 r ( y. j y..) 2 r y . j rt y ..


2 2

i j j j

SCBloq ( yi. y..) 2 t ( yi. y..) 2 t y i. rt y ..


2 2

i j i i

SCEr ( yij y . j y i. y.. ) 2 y ij r y . j t y i. rt y ..


2 2 2 2

i j i j j i

Por tanto, con estas ecuaciones se puede escribir la tabla ANOVA del DBCA, de la
siguiente manera:

Tabla de Anlisis de Varianza para el DBCA


Suma de Grados
Fuente de Cuadrado de Cuadrados F calculada
variacin s libertad Medios
Tratamientos SCTrat t-1 CMTrat= SCTrat/t-1 CMTrat/CMEr
Bloques SCBloq r -1 CMBloq = SCBloq/b-1 CMBloq/CMEr
Error Experimental SCEr (t - 1)(r-1) CMEr = SCEr/(t-1)(r-1)
Total SCTot t.r -1

Los datos para el anlisis se ordenan de la siguiente manera: Por columna los
bloques (6 trabajadores) y por filas los tratamientos (4 mquinas), con sus clculos
parciales respectivos.

Operario
Mquina 1 2 3 4 5 6 Total Medias
1 42,5 39,3 39,6 39,9 42,9 43,6 247,8 41,3
2 39,8 40,1 40,5 42,3 42,5 43,1 248,3 41,4
3 40,2 40,5 41,3 43,4 44,9 45,1 255,4 42,6
4 42,3 43,2 44,5 45,2 46,9 43,3 265,4 44,2
Total 164,8 163,1 165,9 170,8 177,2 175,1 1016,9
Medias 41,2 40,775 41,475 42,7 44,3 43,775 254,225 42,37

Otra forma de ordenar estos datos es: Por columna, los tratamientos; y por filas, los
bloques, con sus clculos respectivos, y que se adeca al esquema que se utiliza en
prrafos anteriores.
yi . y i .
T1 T2 T3 T4 t
r1 42.50 39.80 40.20 42.30 164.80 4 41.20
r2 39.30 40.10 40.50 43.20 163.10 4 40.78
r3 39.60 40.50 41.30 44.50 165.90 4 41.48
r4 39.90 42.30 43.40 45.20 170.80 4 42.70
r5 42.90 42.50 44.90 46.90 177.20 4 44.30
r6 43.60 43.10 45.10 43.30 175.10 4 43.78
..=
y 101
y. j 248.3 255.4
247.80 0 0 265.40 6.90
r 6 6 6 6 rt=24
y ..= 4
y . j
41.30 41.38 42.57 44.23 2.37

4 6
SCTot ( yij y..) 2 yij2 rt y .. yij2 rt y ..
2 2

i j i j i 1 j 1
Utilizando las frmulas de
sumas de Cuadrados con los datos se obtienen:

SCTot=(42.52+39.3246.92+43.32) 4x6x42.372=43186.61-43086.90=
SCTrat ( y. j y..) 2 r ( y. j y..) 2 r y . j rt y ..
2 2

i j j j
=99.71

SCTrat=6(41.32+41.382++44.342)-4x6x42.372=
=43120.675-43086.90=33.7745
SCBloq ( yi. y..) 2 t ( yi. y..) 2 t y i. rt y ..
2 2

i j i i

SCBloq=4(41.22+40.782+43.782)-4x6x42.372=
=43128.9875-43086.9004=42.0871
SCEr ( yij y . j y i . y.. ) 2 y ij r y . j t y i . rt y ..
2 2 2 2

i j i j j i

SCEr=43186.61-43120.675-43128.9875+43086.90=23.8475

Luego, la tabla ANOVA se completa de la siguiente manera:


Suma de
Fuente de Cuadrado Grados de Cuadrados F calculada
variacin s libertad Medios
Tratamientos 33.7745833 3 CMATrat= 11.2581 7.08
Bloques 42.0870833 5 CMBloq = 8.7174
Error Experimental 23.8479167 15 CMEr = 1.5898
Total 99.71 23

Al realizar la comparacin del valor crtico F[t-1, (r-1)(t-1)], la regla de decisin para
rechazar la H0 se efecta de la siguiente manera:

Si: F[t-1,(r-1)(t-1)]>Fc se rechaza H0.

En el presente caso, Fc= 7.08 y F [t-1,(r-1)(t-1)]= F[3, 15]=3.29. Por tanto Fc>F por lo
que se rechaza la Hiptesis Nula, y existe efecto tratamiento. Alguno de los
tratamientos tuvo efecto. En otras palabras, alguna, o algunas mquinas son
mejores que las otras.
El siguiente paso es realizar una prueba de comparacin de medias para seleccionar
el mejor tratamiento.

Comandos en SPSS ver. 18

En primer lugar se ingresan los datos creando tres variables:


Yij, La columna de las respuestas; CT1, la columna de los cdigos de tratamientos 1,
2, 3, 4 segn el que corresponda a la mquina; CB1, la columna de cdigos de
bloques 1, 2, 3, 4, 5, 6 segn el que corresponda al operario.
De la siguiente manera:
A continuacin, para el procesamiento se sigue la siguiente secuencia de comandos:

Analizarmodelo lineal generalunivariante


Yij a Dependiente
CODIGO TRATAMIENTO (CT1) a Factores fijos
CODIGO BLOQUES (CB1) a Factores fijos
Modelo -activar Personalizado
Arrastrar CT1 a Modelo
Arrastrar CB1 a Modelo
Activar: incluir la interseccin en el modelo
Continuar
Post Hoc: CT1 contraste post hoc
DMS
Continuar
Guardar residuos no tipificados
Continuar
Opciones -mostrar las medias para CT1
Mostrar: estadisticos descriptivos
Continuar
Aceptar

Los reportes proporcionados por el SPSS son los siguientes:


Respecto a la tabla ANOVA: Al realizar la prueba de hiptesis para los bloques el
p_valor asociado (0.005) resulta significativo al 1%, no siendo necesario realizar esta
prueba, pues la formacin de bloques se realiza bajo el supuesto que stos (los
bloques) son diferentes. En caso no se rechazara la hiptesis nula, entonces el
bloqueo no fue necesario y debi utilizarse el diseo DCA.
En el caso de la prueba de hiptesis para tratamientos el p_valor (0.003) permite
rechazar la hiptesis nula al 1%, lo que indica que existe un efecto tratamiento. En
otras palabras, las mquinas tienen diferentes efectos.

Los estadsticos descriptivos mostrados en el siguiente cuadro indican que el


tratamiento 4 tiene la media ms alta. Pero es necesario convalidarlo con una
prueba de diferencia de medias, y, para el presente caso se ha utilizado la prueba de
Diferencia Significativa Mnima (DSM).

Las comparaciones del Tratamiento 1 con los Tratamientos 2 y 3 indican que sus
diferencias de medias resultan no significativas, en cambio, la diferencia de medias
con el Tratamiento 4 (-2.9333*) resulta significativa al 5%. De aqu se desprende que
el Tratamiento 4 tiene mejor media.
Del mismo modelo al realizar las comparaciones del tratamiento 2 con los
tratamientos 1 y 3 resultan no significativos. Anlogamente, entre el Tratamiento 2 y
4 existe una diferencia significativa (-2.8500*) al 5%, de lo que se desprende que el
mejor tratamiento es el 4.
Hasta aqu, los tratamiento 1, 2 y 3 parecen ser iguales, por lo que al comparar el
tratamiento 4 con los tratamientos 1, 2 y 3 se aprecian diferencias significativas
(2.9333*, 2.8500* y 1.6667*) con lo que el Tratamiento 4 tiene mejor media o la
media ms alta.
La verificacin del supuesto de homogeneidad de varianzas se realiza utilizando la
Prueba de Levene con las siguientes hiptesis:

H0:Las varianzas son iguales


H1:Las varianzas son diferentes

La secuencia de comandos es la siguiente:

AnalizarEstadisticos descriptivosexplorar
Dependientes: Yij
Factores: CT1
Activar Grficos: Grficos Diagrama de caja: ninguno
Tallo y hoja: desactivar
Activar: estimacin de potencia
Continuar
Aceptar

El p_valor asociado al estadstico de Levene de 0.221 no permite rechazar la


hiptesis nula, por lo que se puede concluir que las varianzas son iguales,
cumplindose el supuesto.
Para el supuesto de normalidad se utiliza la prueba de Normalidad diseada por
Kolmogorov-Smirnov contrastando las hiptesis:

H0:Los residuos siguen una distribucin normal


H1:Los residuos no siguen una distribucin normal

Dado que las respuestas Yij tienen dependencia lineal con los residuos e ij, y ambos
son aleatorios, realizar la prueba para los residuos es anlogo a realizar la prueba
para las respuestas Yij, por lo que se probar esta ltima.

Analizarpruebas no paramtricasK-S de una muestra


contrastar variables: yij
Distribucin de contraste: Activar normal
Aceptar

El p_valor asociado al estadstico Z de Kolmogorov-Smirnov (0.662) no permite


rechazar la hiptesis nula, con lo que el supuesto de normalidad queda demostrado.

Вам также может понравиться