Вы находитесь на странице: 1из 34

Mtodos Estadsticos II Prof.

Nelfi Gonzlez Escuela de Estadstica


1
DISEO DE EXPERIMENTOS
Planeacin de pruebas experimentales, de forma que los datos generados se analicen estadsticamente para obtener
conclusiones vlidas y objetivas sobre un proceso.
Tcnicas estadsticas para manipular un proceso con el fin de obtener la mayor informacin posible.
Determinar qu pruebas y cmo realizarlas, y el anlisis estadstico de los datos recolectados para extraer conclusiones
y tomar decisiones sobre un proceso.

ALGUNAS APLICACIONES DEL DISEO EXPERIMENTAL
En la industria:
Comparar proveedores del mismo material para elegir el que mejor cumple especificaciones.
Comparar sistemas de medicin para verificar si trabajan con la misma precisin y exactitud.
Proponer nueva manera de operar un proceso, variar sus condiciones y hacer cambios para reducir defectos
Determinar factores o fuentes de variabilidad con impacto en la capacidad del proceso para cumplir requerimientos.
Localizar condiciones de operacin para desempeo ptimo del proceso.
Proponer mtodos de muestreo efectivos y ms econmicos.
Reducir tiempo de ciclo del proceso.
Hacer proceso robusto a oscilaciones de variables no controlables.
Apoyar en el diseo o rediseo del producto o proceso.

En la investigacin:
Validar una hiptesis mediante evidencia objetiva.
Generar conocimiento y aprendizaje de forma eficiente. Direccin del aprendizaje: conocimiento, conjeturas,
imaginacin, experimentacin, anlisis y reflexin.

Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
2
CONSIDERACIONES PRCTICAS
Las metodologas estadsticas por s solas no garantizan investigaciones exitosas:
El conocimiento no estadstico es vital: Se requiere buen conocimiento tcnico y prctico del proceso para seleccionar
mejor factores y el diseo, mejor anlisis estadstico e interpretacin y conclusin.
Reconocer entre significancia estadstica e importancia prctica: diferencias estadsticas no siempre corresponden a
diferencias prcticas de importancia.
Preferir la experimentacin secuencial que un experimento nico y definitivo: La experimentacin secuencial alcanza
paulatinamente mayor precisin en los conocimientos y soluciones. Seguir una estrategia bien definida y pensada. No
confundir secuencia con mover un factor a la vez.

CONCEPTOS BSICOS
Experimento: Cambio deliberado en las condiciones de operacin de un proceso, con el fin de medir el efecto sobre una o
varias propiedades del producto (Obtencin de conocimiento).

Unidad experimental: Objetos u individuos bsicos sobre los cuales se obtiene una medicin o datos representativo:
Una pieza: En el estudio de la resistencia a la traccin de cierta componente
Un lote o grupo de piezas: En el estudio de la proporcin de defectuosos en una operacin.

En todo proceso intervienen distintos tipos de variables o factores y existen unas preguntas a responder:
Cules variables respuesta se van a medir?
Cules factores controlables incluir en el experimento?
Qu niveles debe usarse de cada factor?
Cul diseo experimental es adecuado?

Variable respuesta: Caracterstica, variable de salida o propiedad medida en cada unidad, cuyos cambios se desean
estudiar.

Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
3
Factores controlables: Variables del proceso que se pueden fijar en un valor o nivel de operacin, ya que existe el
mecanismo para cambiar su nivel. Tambin se les llama variables de entrada, condiciones de proceso, o variables de diseo.
Ej. Temperatura, velocidad, presin, concentracin, tiempo de aplicacin, etc.

Factores no controlables o de ruido: Variables que no se pueden controlar durante la operacin normal del proceso. Ej.
Variables ambientales, usos de un producto por los usuarios, etc.

Factores estudiados: Variables cuyos efectos sobre la respuesta se investigan en el experimento: Pueden ser controlables o
no controlables (posibles de controlar durante el experimento). Se requiere probarlos en al menos dos niveles. Los factores en
principio pueden afectar la media o la variabilidad de la variable respuesta.

Niveles: Valores asignados a cada factor de estudio.

Tratamiento o punto de diseo: Combinacin de niveles de factores. Ej.

Error aleatorio: Variabilidad observada que no se puede explicar por los factores estudiados, es debido a causas comunes o
aleatorias, que generan la variabilidad inherente del proceso. Incluye efectos pequeos de factores no estudiados,
variabilidad de las mediciones hechas bajo mismas condiciones, y el error experimental.

Error experimental: Componente del error aleatorio que representa los errores del experimentador en la planeacin y
ejecucin del experimento. Si el factor o factores estudiados son influyentes sobre la variable respuesta, se espera que la
variabilidad observada en sta durante la experimentacin, sea explicada significativamente por tales factores y en menor
medida por el error aleatorio, y que ste ltimo sea realmente aleatorio.

NOTA: No se deben dejar variar libremente a factores que pueden ser influyentes sobre la respuesta: Principio de bloqueo.

Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
4
Un ejemplo: Factores y variables en la fabricacin de un envase plstico:

POSIBLES OBJETIVOS DE LA EXPERIMENTACIN
Encontrar condiciones de operacin para los factores controlables con el fin de optimizar la variable respuesta.
Investigar efectos de factores no controlables buscando alcanzar un proceso robusto (insensible) a tales factores.
Prevencin y control.
Generacin de aprendizaje y conocimiento.

ETAPAS DEL DISEO EXPERIMENTAL
Varias preguntas deben resolverse antes de la experimentacin:
Cuntos tratamientos van a ser estudiados?
Cuntas veces observar cada tratamiento (rplicas)?
Cules son las unidades experimentales?
Cmo se aplicarn los tratamientos a las unidades experimentales disponibles y luego observar las respuestas?
Puede el diseo resultante ser analizado o se pueden hacer las comparaciones deseadas?

Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
5
PRINCIPIOS DEL DISEO
1. Aleatorizacin: Es la base para el desarrollo de la teora para un anlisis correcto. Una correcta aleatorizacin
previene la introduccin de sesgo sistemtico en el experimento. Si no usamos la aleatorizacin, no podemos decir si una
diferencia observada es debida a las diferencias entre los tratamientos o debida al mtodo sistemtico usado para asignar los
tratamientos a las unidades experimentales.

2. Bloqueo:
Mientras ms parecidas sean las unidades experimentales, mejor sern las comparaciones entre los tratamientos.
En la mayora de los experimentos es imposible seleccionar todas las unidades experimentales idnticas.
La no similaridad entre las unidades experimentales contribuye al ruido.
Los experimentos pueden ser mejorados si agrupamos las unidades experimentales dentro de grupos de unidades
cercanamente similares, llamadas unidades homogneas.
Los tratamientos pueden ser comparados sobre las unidades experimentales similares donde la variacin de grupo
puede ser considerada para el anlisis. Los grupos de unidades similares u homogneas son denominados bloques.

2.1. Objetivo del bloqueo: Seleccionar y agrupar el material experimental de modo que el ruido o error experimental en el
experimento sea reducido. As, las unidades experimentales sobre las cuales los tratamientos van a ser comparados deberan
ser tan parecidas como sea posible para que la menor diferencia significativa entre dos tratamientos pueda ser detectada.

2.2. Control factores de bloque y de ruido - Controles posibles sobre fuentes de variacin adicionales a factores de
estudio:
Bloqueo activo durante el experimento, lo que implica que el factor de ruido es parte del estudio y aparece
explcitamente. En la prctica slo controlar factores de bloque que se saben son influyentes y econmicamente
factibles de fijar en distintos niveles: operadores, tipos de producto, lotes, turnos, tipos de material, etc.
Nulificar los efectos al mantenerlos fijos en valor usual durante estudio: Resultados son vlidos slo para nivel
seleccionado.
Aplicar aleatorizacin para nulificar efecto indeseable de factores de ruido: Posible efecto es repartido equitativamente
en todos los tratamientos, y no se puede medir tal efecto posible. E.j. Variables ambientales, cansancio operadores,
calentamiento equipo, variables que en general se mueven solas con el tiempo.

Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
6
3. Replicacin
Una estimacin de la varianza del error no puede obtenerse a menos que algunos o todos los tratamientos sean
replicados.
Una replicacin de un tratamiento es una observacin independiente del tratamiento, e.g. dos replicaciones de un
tratamiento deben involucrar a dos unidades experimentales.
Muy a menudo los investigadores usan muestras duplicadas o partidas para generar dos observaciones y las llaman
rplicas cuando en realidad son submuestras o medidas repetidas y no replicaciones.

3.1. Replicacin vs. Repeticin
Ejemplo 1: Dos medidas independientes de la altura de una persona no proporcionan un medida de la verdadera variacin en
las alturas de la poblacin; tan slo son dos submuestras o repeticiones.

Ejemplo 2: Considere un experimento para comparar las habilidades de tres preservativos para inhibir el crecimiento de
hongos sobre cierto tipo de torta. El panadero hace una torta con cada preservativo. Despus de nueve das de
almacenamiento, se mide el nmero de esporas de hongos por cm3 de torta. El panadero quera 10 replicaciones para el
anlisis, as que dividi cada torta en 10 porciones y obtuvo el conteo de esporas en cada parte. Sin embargo, esas 10
mediciones no resultaron de 10 aplicaciones independientes del preservativo. La variacin medida por sus submuestras es un
ndice de la variacin dentro de la torta y no de la variacin de unidad experimental a unidad experimental. Para tener 10
replicaciones, el panadero necesita batir 10 tortas con cada preservativo, cada una mezclada independientemente de las
dems.

Diferenciar entre una repeticin y una replicacin es importante pues la varianza del error estimada con las submuestras es en
general considerablemente menor que la varianza del error estimada con replicaciones o unidades experimentales diferentes.
El estadstico de la prueba F construido usando la varianza del error estimada con las submuestras ser mucho mayor que lo
que debera ser, llevando a determinar ms diferencias significativas de las que realmente lo son.

ESTRUCTURA DE UN DISEO EXPERIMENTAL
Un diseo experimental consiste de dos estructuras bsicas, y es muy importante ser capaz de identificarlas y diferenciarlas, a
saber:
Estructura de tratamientos
Estructura de diseo

Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
7
El diseo experimental comprende:
eleccin de la estructura de tratamiento,
eleccin de la estructura de diseo y el mtodo de aleatorizacin
ESTRUCTURA DE TRATAMIENTOS:
Consiste del conjunto de tratamientos, combinaciones de tratamientos, o poblaciones que el experimentador ha seleccionado
para estudiar y/o comparar.
Estructura de tratamiento de un slo factor.
Estructura de tratamientos factoriales (dos o ms factores)
Estructura de tratamientos 2kEstructura de tratamientos factoriales fraccionados

ESTRUCTURA DE DISEO:
Agrupamiento de las unidades experimentales dentro de grupos homogneos o bloques:
Diseo completamente aleatorizado
Diseo bloqueado:
o De bloques completos aleatorizados: Cuadrados latinos y grecolatinos
o De bloques incompletos

CLASIFICACIN DE LOS DISEOS EXPERIMENTALES
Para comparar dos o ms tratamientos:
Completamente aleatorizados
En bloques completos e imcompletos
Cuadrados latinos y grecolatinos
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
8
Para estudiar el efecto de varios factores sobre una o ms variables respuestas:
Factoriales 2
k
y 3
k
Factoriales fraccionados 2
k-p

Diseos para optimizar procesos:
Diseos para modelos de primer orden:
o Diseos Factoriales 2
k
y 2
k-p

o Diseos de Plakett-Burman
o Diseos simplex
Diseos para modelos de segundo orden:
o Diseo central compuesto
o Diseo de Box-Behnken
o Diseos factoriales 3
k
y 3
k-p

Diseos robustos:
Arreglos ortogonales (diseos factoriales)
Diseo con arreglo interno y externo
Diseo de mezclas (mezclas de ingredientes o formulacin):
Diseo lattice-simplex
Diseo simplex con centroide
Diseo con restricciones
Diseo axial
Diseos con unidades experimentales de distinto tamao:
Diseos experimentales split - plot
Diseos de medidas repetidas
Estos diseos estn construidos de estructuras de diseo de bloques incompletos y estructuras de tratamiento de arreglos
factoriales que incluyen dos o ms factores o tipos de tratamientos.

Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
9
LA INVESTIGACIN EXPERIMENTAL
La investigacin experimental es esencialmente de tipo secuencial, un experimento antecede a otro ganndose cierto
conocimiento en el proceso y proponindose nuevos interrogantes que pueden mejorar los resultados del proceso
experimental.

En este tipo de investigacin el investigador est interesado en encontrar los factores que tienen influencia sobre las
ejecuciones de cierto proceso. Por ejemplo, uno puede estar interesado en si el grado de concentracin de un compuesto
qumico, el tiempo de coccin, la temperatura de horneado, el grado de refrescante, y la cantidad de presin tiene un efecto ya
sea individual y/o conjunto sobre la ruptura de un tipo de plato de cermica. El procedimiento obvio aqu, es variar los niveles
de esos factores y comparar la ejecucin de las diferentes combinaciones de niveles.

Por el contrario, la investigacin no experimental es la que se realiza sin manipular deliberadamente las variables
independientes, se basa en variables que ya ocurrieron o se dieron en la realidad sin la intervencin directa del investigador.
La investigacin no experimental es conocida como investigacin expost facto (los hechos y las variables ya ocurrieron) y
observa variables y relaciones entre stas en su contexto natural.

CARACTERSTICAS DE LOS DISEOS EXPERIMENTALES
Simplicidad. Seleccin de los tratamientos y la disposicin experimental hecha de la forma ms simple posible.
Grado de precisin. El experimento deber tener la capacidad de medir diferencias entre tratamientos con los grados de
precisin deseados. Se deber partir de un diseo y un nmero de repeticiones adecuados.
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
10
Ausencia de error sistemtico. Se debe planear un experimento para asegurar que las unidades experimentales que reciban
un tratamiento no difieran sistemticamente de aquellas que reciben otro tratamiento, procurando as obtener una estimacin
insesgada del efecto de tratamientos.
Rango de validez de las conclusiones. Deber ser tan amplio como sea posible. Los experimentos que contribuyen a
aumentar el rango de validez del experimento son los experimentos replicados y los experimentos con estructuras factoriales.
Clculo del grado de incertidumbre. En todo experimento existe algn grado de incertidumbre en cuanto a la validacin de
las conclusiones. El experimento deber ser concebido de modo que sea posible calcular la probabilidad de obtener los
resultados observados debido nicamente al azar.

ANLISIS DE VARIANZA - ANOVA
Herramienta estadstica para estudiar la relacin entre una variable respuesta y una o ms variables explicatorias.
No requiere ningn supuesto acerca de la relacin estadstica entre la variable respuesta y las predictoras.
No requiere que las variables predictoras sean cuantitativas.ANOVA VS. REGRESIN

Regresin:
Estudia la relacin estadstica entre una o ms variables predictoras y un variable respuesta.
La funcin de regresin establece la naturaleza de la relacin entre la respuesta media y los niveles de las variables
predictoras.
ANOVA:
Los niveles de las variables predictoras son tratados como poblaciones separadas, cada una conduciendo a una
distribucin de probabilidad diferenciada por su media.
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
11
Las diferencias cuantitativas entre niveles de un factor y sus relaciones estadsticas con los valores separados de la
variable respuesta no son consideradas.

ELECCIN ENTRE ANOVA Y REGRESIN
Si las variables explicatorias son cualitativas, trabajar con variables indicadoras en la regresin o usar modelos ANOVA.
Ambos mtodos llevan a los mismos resultados, sin embargo, el ANOVA simplifica computacin; de cualquier modo no
es fundamental elegir entre regresin y un modelo ANOVA.
Si variables predictoras son cuantitativas, elegir entre los dos tipos de modelacin. Se puede reconocer explcitamente
la naturaleza cuantitativa de las variables predictoras con un modelo de regresin. Otra posibilidad es establecer clases
o rangos para cada variables cuantitativa y emplear bien sea variables indicadoras en un modelo de regresin o un
modelo ANOVA.La estrategia de establecer clases para las variables predictoras cuantitativas es algunas veces usada
en estudios a gran escala como un medio para obtener un ajuste de regresin no paramtrica cuando hay duda
sustancial acerca de la naturaleza de la relacin estadstica. En este caso tambin el anlisis de regresin y los modelos
ANOVA conducen al mismo resultado.Los modelos de anlisis de varianza son aplicados cuando es de inters estudiar
los efectos de una o ms variables predictoras sobre una variables respuesta. Las variables predictoras son
denominadas factores o tratamientos.

USOS DEL ANOVA
Bsicamente para analizar los efectos de las variables explicatorias bajo estudio sobre la variable respuesta.Especficamente,
los estudios de un slo factor son utilizados para comparar los efectos de diferentes niveles del factor, para determinar el
mejor nivel del factor,En los estudios multifactoriales, los modelos ANOVA se usan para determinar si los diferentes factores
interactan, cules factores son claves, cules combinaciones de los factores son las mejores, etc.

MODELO LINEAL DE LA VARIABLE RESPUESTA
Cada respuesta medible, est representada matemticamente en un modelo lineal.
La idea general de un modelo es expresar las observaciones generalmente denotadas por Y, en trminos de efectos
que contribuyen a Y.
Esos efectos se pueden clasificar en tres categoras:
o Efectos de Tratamiento,
o Efectos de Diseo y
o Efectos de Error.
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
12
Los efectos de tratamientos, son un reflejo del efecto de diseo como tambin de los tratamientos simples o combinaciones
de factores.
Los efectos de diseo, son determinados por el diseo de control de error, en particular, efectos debidos a las varias clases
de bloqueo.
Los efectos de error, representan diferentes clases de variacin aleatoria. Estos son: (1) el error experimental y (2) el error
observacional.

EXPERIMENTOS CON UN SOLO FACTOR
Comprende experimentos que se usan cuando el objetivo es comparar ms de dos tratamientos pero que corresponden a
niveles de un mismo factor:
Comparar dos o tres mquinas
Comparar varios procesos para la obtencin de un producto o resultado dado
Comparar varios materiales,
Comparar varias dietas
Etc.
Con el fin de tomar una decisin en la solucin de un problema real.
Por lo general las comparaciones se hacen en trminos de las medias poblacionales, aunque tambin es importante la
comparacin de varianzas y capacidad actual para cumplir ciertas especificaciones.

Las estructuras de diseos pueden ser en este caso:
Diseo
Factores
de bloque
Tcnicas
estadsticas
Modelo
estadstico
Completamente
al aleatorizado
0
ANOVA, con un solo criterio de
clasificacin
ij i ij
Y o c = + +
En bloques completos
aleatorizados
1
ANOVA con dos criterios de
clasificacin
ij i j ij
Y o | c = + + +
En cuadrado latino 2
ANOVA con tres criterios de
clasificacin
ijk i j k ijk
Y o | c = + + + +
En cuadrado grecolatino 3
ANOVA con cuatro criterios de
clasificacin
ijkl i j k l ijkl
Y o | o c = + + + + +
Notacin: Y es la variable respuesta; la media global;
i
o el efecto del i-simo tratamiento;
j
| ,
k
, y
l
o , efectos de
bloques y c es el error aleatorio.
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
13
DISEO COMPLETAMENTE ALEATORIZADO
Es el ms simple de todos los diseos, pues contempla slo dos fuentes de variabilidad: los tratamientos y el error aleatorio.
Se denominan completamente aleatorizados porque las corridas experimentales se realizan en orden aleatorio completo, dado
que no hay restricciones impuestas por factores de bloqueo.

MODELO PARA UN DISEO COMPLETAMENTE ALEATORIZADO, UN FACTOR EFECTOS FIJOS
ij i ij
Y c = + (1)
Yij = Variable aleatoria que representa la respuesta de la j-sima unidad experimental asignada al i-simo tratamiento, i=1, 2, ...,
a y j=1, 2, ..., ni. i = Respuesta esperada al i-simo tratamiento si se sta es observada bajo condiciones experimentales
idnticas y medida sin error. cij = El error aleatorio.

Una forma alternativa del modelo es reemplazar a i por +oi, de modo que
ij i ij
Y o c = + + (2)
Donde denota la respuesta global promedio y oi es la desviacin o el efecto del i-simo tratamiento sobre el promedio
global. Por tanto el examen de diferencias entre las medias de tratamiento i, es equivalente a examinar las diferencias entre
los efectos oi, bajo la restriccin lineal
1
0
a
i i
i
no oo o
= == =
= == =

, para una solucin nica del sistema de ecuaciones de mnimos
cuadrados

(1) es conocido como modelo de medias de tratamientos, en tanto que (2) es conocido como modelo de efectos de
tratamientos. En cualquiera de los dos modelos (1) y (2), se establecen lo siguientes supuestos: Los errores son variables
aleatorias que se distribuyen: Normales, Independientes, De media cero y Varianza constante o
2
. Los parmetros del modelo
a estimar son las constantes , i, oi y o
2
.
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
14
ANOVA PARA EL DISEO COMPLETAMENTE ALEATORIZADO (DCA)
TABLA DE ENTRADA DE DATOS
NIVELES FACTOR A
A1 A2 ... Aa
Y11 Y21 ... Ya1
Y12 Y22 ... Ya2
.
.
.
.
.
.
.
.
.
.
.
. D
A
T
O
S
R
E
S
P
U
E
S
T
A
Y1n
1
Y2n
2
... Yan
2
totales Y1. Y2. Ya.
Donde:
1
i
n
i ij
i
Y Y

=
=

Suma de las observaciones en el nivel o tratamiento i.
1 1
i
n a
ij
i j
Y Y

= =
=

Suma o total de todas las N observaciones en el experimento
Con estas cantidades se obtiene los siguientes estimadores (ver ANEXO 2: Funciones estimables de los parmetros):
1
1

a
i
i
Y
Y Y
N N



=
= = =

i
i i
i
Y
Y
n

= = ,

i i
Y Y o

= .
Es fcil ver que las respuestas ajustadas para el tratamiento i es

ij i
Y Y

= . Por tanto los residuales del modelo


corresponden a

ij ij i
Y Y c

=
Las sumas de cuadrados del modelo ANOVA SST=SSA+SSE, son:

Figura 1:
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
15
( )
2
2 2
1 1 1 1
i i
n n a a
ij ij i
i j i j
SST Y Y Y NY

= = = =
= =

, o variabilidad total observada en la respuesta, con 1 N grados
de libertad.
( )
2
2 2
1 1 1
i
n a a
i i i i
i j i
SSA Y Y nY NY

= = =
= =

, o variabilidad en la respuesta explicada por el factor A, con 1 a
grados de libertad.
( )
2
1 1
i
n a
ij i
i j
SSE Y Y SST SSA

= =
= =

, o variabilidad en la respuesta explicada por la aleatoriedad, N a con
grados de libertad.

La prueba hiptesis fundamental asociada al ANOVA, es la siguiente:
0 1 2 1
: vs. : algn para
a i j
H H = = = = , o equivalentemente,
0 1 2 1
0 0 : vs. : algn
a i
H H o o o o = = = = =
Si F0 es grande, se rechaza la hiptesis nula, en tanto que si es pequeo, no se tiene suficiente evidencia en contra de H0.
ANOVA
Fuente de
variacin g.l
Suma de
cuadrados
Cuadrados
Medios
Valores esperados
Cuadrados
medios F0 Valor P
Factor a-1 SSA MSA=SSA/(a-1)
2
2 1
1
a
i i
i
n
a
o
o
=

MSA/MSE
( )
1 0 , a N a
P f F

>
Error N-a SSE MSE=SSE/(N-a)
2
o
Total N-1 SST
DISTRIBUCIONES MUESTRALES DE LOS ESTIMADORES
Puede demostrarse que
2
, Y N
N
o

| |
|
\ .
,
2
,
i i
i
Y N
n
o

| |
|
\ .
, y que
2
1 1
0

,
i
i
N
n N
o o
| |
(

|
(
|

\ .

Por tanto, los correspondientes errores estndar e intervalos de confianza estn dados por:

Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
16
Estimador Error estndar I.C del (1- )100%
Y

Y
MSE
S
N

= == =
2 / ,N a Y
Y t S




e e e e
i
Y

i
Y
i
MSE
S
n

= == =
2 / ,
i
i i N a Y
Y t S




e e e e

i
o
1 1

i
i
S MSE
n N
o
| |
=
|
\ .
2 / ,

i
i i N a
t S
o o o o
o o o o o o o o

e e e e
VALIDACIN DE SUPUESTOS DEL MODELO ANOVA
Para cada supuesto sobre los errores del modelo existen pruebas analticas y grficas, stas ltimas aunque no son exactas,
funcionan relativamente bien con pocos datos, y se requiere que una fuerte evidencia visual en contra de un supuesto est
soportada por ms de dos puntos para concluir que no se cumple. Cuando slo un par de puntos se alejan del
comportamiento esperado en una grfica de diagnstico, esto puede tratarse como un problema de datos atpicos.

Supuesto Hiptesis test Grfico
Normalidad
0
1
: Normal vs.
: no son Normales
ij
ij
H
H
c
c

Shapiro Wilk Grfico de probabilidad normal sobre
residuales, o residuales estandarizados
Varianza
Constante
2 2 2
0 1 2
2 2
1
: vs.
: algn par
a
i j
H
H
o o o
o o
= = =
=

Bartlet,
Cochran,
Leven
Grfico de residuales vs. valores
ajustado, residuales vs. niveles del factor
Independencia
( )
( )
0
1
0
0


: ,
: , para algn
ij i j
ij i j
H corr j j
H corr j j
c c
c c
= =
= =
Durbin
Watson
Lung-Box
Grfico de residuales (comunes o
estandarizados) vs. orden de corrida
Adicionalmente, se chequean:
La forma del modelo (ajuste del modelo), es decir, si realmente las respuestas medias de los tratamientos son
adecuadamente descritos por el modelo lineal postulado
i i
o = + mediante el grfico de residuales
estandarizados vs. niveles del factor. Patrones no aleatorios alrededor de la lnea cero de este grfico son indicios de
carencia de ajuste.
Outliers, mediante grfico de residuales estandarizados vs. niveles del factor; si tolas presunciones del modelo se
cumplen incluyendo la normalidad, aproximadamente el 68% de los residuales estandarizados deberan estar entre 1 y
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
17
+1, aproximadamente el 95% entre 2 y +2, y aproximadamente 99.7% entre 3 y +3. Si hay muchos outliers, los
niveles de confianza son ms bajos de los esperados.

NOTAS:
El supuesto de independencia debe verificarse antes de los otros supuestos. La no independencia en los errores puede
ser causada por la similaridad de las unidades experimentales cercanamente juntas en el tiempo o espacio. La no
independencia causa que los verdaderos niveles de significancia de las pruebas de hiptesis sean mucho ms altas
que las establecidas y que los niveles de confianza y las potencias de las pruebas sean ms bajas que lo esperado.
Las pruebas formales sobre igualdad de varianzas (ver en ANEXO 3, test de Bartlett) tienden a ser poco potentes con
pocas rplicas por nivel y muy sensibles a no normalidad. Una regla de dedo que usualmente se aplica es que el
estadstico F de la ANOVA y los mtodos de comparaciones mltiples de medias son apropiadas, si se ha probado que
la razn de la estimacin de la varianza ms grande a la varianza ms pequea de los a tratamientos es no es mayor de
tres (3); sin embargo hay que ser cuidadosos con esta regla porque an cuando las presunciones del modelo son
correctas tal razn de varianzas puede dar mayor que 3.
La violacin del supuesto de varianza constante es preocupante en particular cundo los diseos son desbalanceados
(nmero de rplicas no son iguales). Si el nivel con mayor varianza es el menos replicado, entonces los procedimientos
estadsticos son ms liberales y se tiene mayor probabilidad de cometer error tipo I, y menores niveles de confianza que
los esperados. Por el contrario, si el tratamiento o nivel de mayor varianza es el ms replicado, entonces los
procedimientos estadsticos son ms conservadores, es decir, niveles de significancia son ms bajos y niveles de
confianza ms altos de los esperados. En general se recomienda trabajar con diseos balanceados.
Pequeas desviaciones de la normalidad no afectan fuertemente a los niveles de significancia, niveles de confianza o la
potencia. Con diseos balanceados el caso de mayor preocupacin es cuando la distribucin tiene colas ms pesadas
que la normal, y en ese caso deberan usarse mtodos de anlisis de varianza no paramtricos (ej. Kruskall Wallis).

Soluciones al problema de varianza no constante:
transformaciones de la variable respuesta para estabilizar varianza
Anlisis con varianzas de error desiguales

Soluciones al problema de no normalidad:
Mtodos no paramtricos
Transformar la variable respuesta, tal como la transformacin logartmica. Aunque a veces transformar puede originar
problemas de varianza no constante que no exista con los datos originales.
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
18
Si la varianza no es constante, hay suficientes datos por nivel del factor, analizar la normalidad por separado en cada
nivel.

Soluciones al problema de no independencia: La no independencia es difcil de corregir; si hay una clara tendencia en el
grfico de residuales tal como una lnea recta, es posible incorporar al modelo trminos que representen el efecto temporal o
espacial. Por ejemplo, con una tendencia lineal en el tiempo, el modelo adecuado sera
( )
2
0
,
,
iid
ij i ij ij ij
Y t N o c c o = + + + y
ij
t es el tiempo en el cual la observacin j del tratamiento i fue tomada.
Este modelo es uno denominado de anlisis de covarianza.
Problema 1: Un administrador compil datos sobre mejoramientos de la productividad en los ltimos tres aos para una
muestra de firmas productoras de equipos de computacin. Las firmas fueron clasificadas de acuerdo a nivel de sus gastos en
investigacin y desarrollo en los pasados tres aos, en bajo, moderado y alto. Los resultados del estudio sobre la mejora de la
productividad (mprod, medida en una escala de 0 a 100) se presentan en la tabla anexa. Asumiendo que un modelo de efectos
fijos es apropiado:
obs
ID 1 2 3 4 5 6 7 8 9 10 11 12
alto 8.5 9.7 10.1 7.8 9.6 9.5
bajo 7.6 8.2 6.8 5.8 6.9 6.6 6.3 7.7 6.0
medio 6.7 8.1 9.4 8.6 7.8 7.7 8.9 7.9 8.3 8.7 7.1 8.4
a) Plantee un modelo estadstico apropiado para el ANOVA. Identifique sus trminos y los supuestos necesarios.
b) Haga un anlisis descriptivo de los datos. Qu puede concluir de estos en cuanto al promedio de mejoramiento de la
productividad? La variabilidad dentro de cada nivel del gasto en investigacin y desarrollo puede considerarse o no
aproximadamente constante?
c) Calcule la tabla ANOVA, la tabla de parmetros estimados para los datos y la tabla de medias. Analice los resultados
y pruebe a un nivel de significancia de 0.05, si la media de mejoramiento de la productividad difiere segn el nivel de gastos en
investigacin y desarrollo. NOTA: Tenga en cuenta en sus clculos que este problema es un caso de diseo desbalanceado
d) D una expresin general para el clculo de los residuales. Analice los grficos de residuales y selos para validar los
supuestos del modelo. As mismo use los resultados de la prueba de bartlett.
e) Calcule intervalos de confianza del 95% para la mejora media de productividad para cada nivel de gasto en inversin y
desarrollo.
c) Estime los efectos de cada nivel del factor y sus respectivos errores estndar, y pruebe la significancia de cada uno:
1. usando para cada prueba un nivel de significancia de 0.05
2. Controlando la tasa de error experimental a un nivel de 0.05 para las tres pruebas
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
19
NOTA: En los casos donde aplique exprese apropiadamente la prueba de hiptesis, el estadstico de prueba, el criterio de
rechazo.

/*LECTURA DE DATOS EN S /*LECTURA DE DATOS EN S /*LECTURA DE DATOS EN S /*LECTURA DE DATOS EN SAS:*/ AS:*/ AS:*/ AS:*/
options nodate nocenter nonumber;
goptions colors=(black,black,black) cback=white ftext=simplex ftitle=simplex htitle=1.0 htext=0.9;
data productividad;
do i=1 to 6;
id='alto';
output;
end;
do i=7 to 15;
id='bajo';
output;
end;
do i=16 to 27;
id='medi';
output;
end;
run;
data productividad(drop=i);
set productividad;
input mprod @@;
cards;
8.5 9.7 10.1 7.8 9.6 9.5 7.6 8.2 6.8 5.8 6.9 6.6 6.3 7.7
6.0 6.7 8.1 9.4 8.6 7.8 7.7 8.9 7.9 8.3 8.7 7.1 8.4
;
run;
/*GRAFICACIN DE LOS DATOS POR NIVEL DEL FACTOR /*GRAFICACIN DE LOS DATOS POR NIVEL DEL FACTOR /*GRAFICACIN DE LOS DATOS POR NIVEL DEL FACTOR /*GRAFICACIN DE LOS DATOS POR NIVEL DEL FACTOR*/ */ */ */
proc sort data=productividad;
by id;
run;
TITLE1'Boxplot comparativo';
TITLE2'Indice de productividad por nivel gasto en I.D';
proc boxplot data=productividad;
plot mprod*id/BOXCONNECT=MEAN CCONNECT=RED NOSERIFS CBOXES=black CBOXFILL=YELLOW CFRAME=CXF7E1C2;
run;quit;
TITLE1'Grafico de comparacion de medias';
TITLE2'Indice de productividad por nivel gasto en I.D';
proc gplot data=productividad;
plot mprod*id/frame;
symbol1 i=stdj v=dot c=black;
run;quit;

Los dos grficos obtenidos son como se presentan a continuacin:
La forma de leer los datos depende de la
estructura de estos y si el ingreso es por
teclado o si se leern desde un archivo
externo.
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
20
/*ANLISIS DE VARIANZA TEST DE BARTLETT, ESTIMACIONES E I.C PARA MEDIAS Y EFECTOS:*/ /*ANLISIS DE VARIANZA TEST DE BARTLETT, ESTIMACIONES E I.C PARA MEDIAS Y EFECTOS:*/ /*ANLISIS DE VARIANZA TEST DE BARTLETT, ESTIMACIONES E I.C PARA MEDIAS Y EFECTOS:*/ /*ANLISIS DE VARIANZA TEST DE BARTLETT, ESTIMACIONES E I.C PARA MEDIAS Y EFECTOS:*/
proc glm data=productividad;
class id;
model mprod=id/ss1 clparm; /*obtiene tabla ANOVA*/
means id/clm T hovtest=bartlett;
estimate 'efecto id alto' id 2 -1 -1/divisor=3;
estimate 'efecto id bajo' id -1 2 -1/divisor=3;
estimate 'efecto id medio' id -1 -1 2/divisor=3;
output out=sal p=yhat r=res;run;quit;

Lo anterior produce las siguientes salidas SAS:

The GLM Procedure
Class Level Information
Class Levels Values
id 3 alto bajo medi
Number of observations 27
Dependent Variable: mprod
Sum of
Source DF Squares Mean Square F Value Pr > F
Model 2 20.12518519 10.06259259 15.72 <.0001
Error 24 15.36222222 0.64009259
Corrected Total 26 35.48740741
R-Square Coeff Var Root MSE mprod Mean
0.567108 10.06128 0.800058 7.951852

Source DF Type I SS Mean Square F Value Pr > F
id 2 20.12518519 10.06259259 15.72 <.0001

Bartlett's Test for Homogeneity of mprod Variance
Source DF Chi-Square Pr > ChiSq
id 2 0.1294 0.9374

t Confidence Intervals for mprod
Alpha 0.05
Error Degrees of Freedom 24
Error Mean Square 0.640093
Critical Value of t 2.06390

95% Confidence
id N Mean Limits
alto 6 9.2000 8.5259 9.8741
medi 12 8.1333 7.6567 8.6100
bajo 9 6.8778 6.3274 7.4282

Estimacin de efectos: Los
coeficientes usados se obtienen de la
expresin de cada uno de ellos como
un contraste de las medias de niveles
del factor
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
21
Dependent Variable: mprod
Standard
Parameter Estimate Error t Value Pr > |t|
efecto id alto 1.12962963 0.24747409 4.56 0.0001
efecto id bajo -1.19259259 0.22223830 -5.37 <.0001
efecto id medio 0.06296296 0.20847800 0.30 0.7652

Parameter 95% Confidence Limits
efecto id alto 0.61886820 1.64039106
efecto id bajo -1.65126989 -0.73391529
efecto id medio -0.36731449 0.49324041
/*GRFICOS PARA ANLISIS DE RESIDUALES*/ /*GRFICOS PARA ANLISIS DE RESIDUALES*/ /*GRFICOS PARA ANLISIS DE RESIDUALES*/ /*GRFICOS PARA ANLISIS DE RESIDUALES*/
TITLE1'Graficos de residuales';
proc gplot data=sal;
plot res*(yhat id)/vref=0;
run;
quit;
TITLE1'Graficos QQ normal residuales';
proc univariate data=sal noprint normaltest;
var res;
probplot res;
inset normaltest probn;run;quit;

Y los grficos resultantes son:
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
22
INFERENCIAS PARA MEDIAS DE TRATAMIENTOS ANOVA UN FACTOR, DCA
Luego de un ANOVA donde se rechaz la hiptesis nula asociada, es necesario determinar cules tratamientos son
estadsticamente distintos. Para ello, se recurre a diferentes tcnicas de comparacin de medias de tratamiento:
Comparaciones entre pares de medias
Comparaciones mltiples o pruebas de rango mltiple.
Comparaciones por contrastes
Comparaciones de tratamientos con un control

Veremos los tres primeros casos:

COMPARACIONES DE PARES DE MEDIAS DE TRATAMIENTOS MTODO LSD
Para un par dado de medias de tratamientos, las comparaciones pueden realizarse probando la igualdad de tales medias o
construyendo el I.C para la diferencia. En particular, se podran realizar todas las a(a-1)/2 comparaciones entre pares de
medias. Un mtodo sencillo es el mtodo LSD (mnima diferencia significativa), en la cual se tiene (para i=j):

0 1
: vs. :
i j i j
H H = = .
El estadstico de prueba, bajo los supuestos del modelo lineal ANOVA un factor efectos fijos es:
i j
D Y Y

= el cual se
compara con la LSD (mnima diferencia significativa) a un nivel de significancia , dada por
2
1 1
/ , N a
i j
LSD t MSE
n n

| |
= +
|
|
\ .
. Se rechaza H0 si D>LSD.

Ej. Suponga que en un DCA se compararon los tiempos de cuatro mtodos de ensamble A, B, C, y D, usando cuatro rplicas
con cada mtodo. El ANOVA arrojo los siguientes resultados en donde visiblemente la hiptesis de igualdad de todos los
tiempos promedios de ensamble de las cuatro mtodos es rechazada al 5% de significancia:

Las medias muestrales por tratamiento, fueron respectivamente 7.25, 8.50,
12.75, y 10.50 y la media global de 9.75. todas las ni=4. A continuacin se
presentan las comparaciones por pares de medias, a un nivel de significancia
de 0.05, donde LSD=2.42:

FUENTE SC g.l CM F0 VALOR P
Mtodos 69.5 3 23.17 9.42 0.0018
Error 29.5 12 2.46
Total 99.0 15
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
23
Con este procedimiento se concluye que los las medias de tratamientos
estadsticamente iguales pueden agruparse as:
GRUPO 1: A = B
GRUPO 2: B = D
GRUPO 3: C = D
Como puede observarse hay traslape entre estos grupos. Sin embargo este
mtodo no es potente porque no controla la tasa de error experimental de
todas las comparaciones. Dicha tasa es definida como la probabilidad de
cometer error tipo I en al menos una de las a(a-1)/2 comparaciones entre
pares.
Existen otros mtodos de comparacin mltiple ms potentes para detectar diferencias no nulas entre pares de medias, que
controlan la tasa de error experimental conocidos como comparaciones mltiples o pruebas de rango mltiple , entre ellos
el mtodo de Tukey.

MTODO DE TUKEY PARA COMPARAR TODOS LOS PARES, O RANGO ESTUDENTIZADO DE TUKEY
Es un mtodo de comparacin de pares de medias ms conservador que el anterior (menos potente para detectar pequeas
diferencias) pero que s controla la tasa de error experimental; sin embargo proporciona intervalos de confianza para
diferencias por pares ms cortos que los arrojados por mtodos de Bonferroni y Scheff (los cuales no se estudian aqu) y
puede usarse en diseos de bloques completos aleatorizados y diseos de bloques incompletos balanceados. Para un diseo
DCA de un solo factor efectos fijos las diferencias absolutas de pares de medias se comparan a un nivel de significancia con
el valor crtico:
1 1 1
2
( , . )
i j
T q a g l MSE
n n

| |
= +
|
|
\ .
Donde ( , . ) q a g l

es el valor crtico del rango estudentizado los cuales se hayan tabulados, y gl los grados de libertad del
MSE. Los pares de medias de tratamientos i y j difieren significativamente cuando: | |
i i
D Y Y T

= > . Tambin puede
construirse los I.C de Tukey para las diferencias de medias. Si el cero no pertenece a tal intervalo entonces las dos medias
correspondientes son estadsticamente distintas:
( )
1 1 1
2
( , . )
i j i j
i j
Y Y q a g l MSE
n n



| |
| |
|
e +
|
|
|
\ .
\ .
Diferencia
Poblacional
Diferencia
muestral
absoluta
Decisin
A - B
1.25<2.42 Iguales
A - C
5.50>2.42 Diferentes
A - D
3.25>2.42 Diferentes
B - C
4.25>2.42 Diferentes
B - D
2.00<2.42 Iguales
C - D
2.25<2.42 Iguales
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
24
Ej. De nuevo considere el caso de comparacin de los cuatro mtodos de ensamble: La mnima diferencia significativa es
0 05 0 05
1 2
4 12 4 20 0 78 3 28
4
2
. .
( , ) . . . T q MSE
| |
= = =
|
\ .

Con este procedimiento se concluye que los las medias de tratamientos
estadsticamente iguales pueden agruparse as:
GRUPO 1: A = B = D
GRUPO 2: C = D
Como puede observarse hay un traslape entre estos dos grupos.

COMPARACIONES MEDIANTE CONTRASTES
Un contraste es una combinacin lineal de parmetros del mismo tipo, por ejemplo,
contraste de medias de tratamientos
1
a
i i
i
W c
=
=

,
contraste de efectos de tratamientos
1
a
i i
i
V bo
=
=

,
donde
1
0
a
i
i
c
=
=

y
1
0
a
i
i
b
=
=

, respectivamente.
Muchas veces, el inters en la experimentacin es obtener informacin para probar alguna hiptesis relativa a un contraste
dado. Para hacer inferencias sobre un contraste de medias nos basamos en la distribucin muestral del contraste estimado,
bajo las suposiciones del DCA:

2
2
1 1 1

~ ,
a a a
i i i i i
i
i i i
W c Y N c c
n
o

= = =
| |
=
|
|
\ .

(3)

Pruebas de hiptesis sobre un contraste: Bajo los supuestos del DCA, el estadstico de prueba para los test relativos a
contrastes de medias de tratamientos, es:
Diferencia
Poblacional
Diferencia
muestral
absoluta
Decisin
A - B
1.25<3.28 Iguales
A - C
5.50>3.28 Diferentes
A - D
3.25<3.28 Iguales
B - C
4.25>3.28 Diferentes
B - D
2.00<3.28 Iguales
C - D
2.25<3.28 Iguales
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
25
0
0
2
1

~
N a
a
i
i
i
W W
T t
c
MSE
n

(4)

En particular, el test de significancia de un contraste, es decir cuando H0: W=0
vs. H1: W=0, tambin puede realizarse a travs de un ANOVA, determinando la
suma de cuadrados del contraste SSW:
2
2
1

/
W
a
i i
i
W
SS
c n
=
=
| |
|
|
\ .

que tiene un grado de libertad, y construyendo el estadstico F para la prueba como la razn de SSW sobre el MSE del modelo.
Es decir:

0
0 1,
/ ~
H
W N a
F SS MSE f

= . H0 es rechazada si
0 1 , . N a
F f

> o bien si
( )
1 0 , N a
VP P f F

= > < , el nivel


de significancia usado.

Ejemplo: Un experimento fue llevado a cabo para determinar el desempeo relativo de siete filtros de membrana para
soportar el crecimiento de colonias de bacterias. Los siete tipos de filtros son considerados como los siete niveles del factor y
son codificados de 1 a 7. Los tipos de filtros 1, 4 y 7 fueron recibidos preesterilizados. Se recolectaron datos sobre los
conteos de las colonias de coliformes fecales de una muestra de agua de ro que crecieron en cada filtro. Tres filtros de cada
tipo fueron observados y los conteos promedios por colonia fueron:
1 2 3 4 5 6 7
36 0 18 0 27 7 28 0 28 3 37 7 30 3 . , . , . , . , . , . , . Y Y Y Y Y Y Y

= = = = = = = ; el MSE=21.6. Suponga que se desea
probar la hiptesis de que los filtros preesterilizados no difieren de los no preesterilizados en trminos de los conteos promedio
de colonias, contra la hiptesis alternativa bilateral de que s difieren. La hiptesis de inters involucra un contraste de medias
dado por ( ) ( )
1 4 7 2 3 5 6
1 1
3 4
W = + + + + + , de donde 3 508

. W = y SSW=(3.508)
2
/(7/12). La hiptesis a probar
es H0: W=0, vs. H1; W=0, y el estadstico de prueba F0=SSW/MSE=2.931; el valor crtico al 0.05 de significancia es
F.05,1,14,=4.6. Luego no se obtuvo evidencia suficiente en contra de H0, y se concluye que los filtros preesterilizados no difieren
significativamente de los que no se preesterilizaron. Un intervalo de confianza del 95% para el contraste dado es
( )
0 025 14
3 508 21 6 7 36 0 888 7 904
. ,
. . / . , . t = .
Tests Rechazar H0 si VP
H0: W=W0
H1: W=W0
|T0|>t
/2,N-a
P(|t,N-a|>|T0|)
H0: W=W0
H1: W>W0
T0> t
,N-a P(t,N-a>T0)
H0: W=W0
H1: W<W0
T0<- t
,N-a P(t,N-a<T0)
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
26
Problema 2: Se llev a cabo un experimento para probar los efectos de un fertilizante nitrogenado en la produccin de
lechuga. Se aplicaron cinco dosis diferentes de nitrato de amonio a cuatro parcelas (las rplicas) en un diseo totalmente
aleatorizado. Los datos son el nmero de lechugas cosechadas de las parcelas.
Tratamiento
(lb N/acre)
0 104 114 90 140
50 134 130 144 174
100 146 142 152 156
150 147 160 160 163
200 131 148 154 163
lechuga/parcelas
a) Especifique la estructura de tratamiento y de diseo empleado en este experimento Escriba el modelo ANOVA
apropiado con sus supuestos y restricciones.
b) Realice un anlisis descriptivo de los datos experimentales establezca conclusiones preliminares sobre los
posibles efectos en la produccin promedio de los diferentes niveles de aplicacin de nitrato.
c) Realice el test de hiptesis asociado al modelo ANOVA, interprete a la luz del problema.
d) Si el factor de tratamientos es significativo, agrupe las medias de produccin segn nivel de nitrato y pruebe si
aplicar nitrato produce una produccin promedio diferente respecto a no aplicar nitrato. Tambin pruebe si
aplicar nitrato eleva la produccin promedio respecto a no aplicar nitrato.
e) Valide los supuestos del modelo ANOVA de este experimento. Analice el grfico de residuos.

A continuacin, un programa SAS para el ANOVA, la obtencin de los I.C de TUKEY, y LSD, la prueba de homogeneidad de
varianza de Bartlett, las estimaciones de los efectos principales y sus intervalos de confianza, la estimacin y el test de
significancia de un contraste, la obtencin de residuales, los tests de normalidad y loas grficas de residuales
options ps=60 ls=80 nodate nonumber nocenter;
goptions colors=(black,black,black) cback=white
ftext=simplex ftitle=simplex htitle=1.0 htext=0.9;
/*ENTRAD /*ENTRAD /*ENTRAD /*ENTRADA DE DATOS DE LA TABLA */ A DE DATOS DE LA TABLA */ A DE DATOS DE LA TABLA */ A DE DATOS DE LA TABLA */
data lechuga;
do nitrato=0 to 200 by 50;
do ob=1 to 4;
input nlechug @;
output;
end;
end;
cards;
104 114 90 140
134 130 144 174
146 142 152 156
147 160 160 163
131 148 154 163
;
run;

Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
27
/*OBTENCIN DE BOXPLOT COMPARATIVOS PARA LOS /*OBTENCIN DE BOXPLOT COMPARATIVOS PARA LOS /*OBTENCIN DE BOXPLOT COMPARATIVOS PARA LOS /*OBTENCIN DE BOXPLOT COMPARATIVOS PARA LOS DATOS EXPERIMENTALES*/ DATOS EXPERIMENTALES*/ DATOS EXPERIMENTALES*/ DATOS EXPERIMENTALES*/
PROC SORT DATA=lechuga;
BY nitrato;
RUN;
TITLE1'BOXPLOTS PRODUCCION DE LECHUGA';
TITLE2'COMPARACION POR NIVEL DE NITRATO';
PROC BOXPLOT DATA=lechuga;
PLOT nlechug*nitrato/BOXCONNECT=MEAN CCONNECT=RED CBOXES=black CBOXFILL=YELLOW CFRAME=CXF7E1C2;
run;quit;
/*REALIZACIN DEL ANLISIS DE VARIANZA, OBTENCIN DE I.C PARA DIEFERENCIAS DE MEDIAS, TEST DE BARTLETT, ESTIMACIN /*REALIZACIN DEL ANLISIS DE VARIANZA, OBTENCIN DE I.C PARA DIEFERENCIAS DE MEDIAS, TEST DE BARTLETT, ESTIMACIN /*REALIZACIN DEL ANLISIS DE VARIANZA, OBTENCIN DE I.C PARA DIEFERENCIAS DE MEDIAS, TEST DE BARTLETT, ESTIMACIN /*REALIZACIN DEL ANLISIS DE VARIANZA, OBTENCIN DE I.C PARA DIEFERENCIAS DE MEDIAS, TEST DE BARTLETT, ESTIMACIN
DE EFECTOS Y CONTRASTE DE INTERS*/ DE EFECTOS Y CONTRASTE DE INTERS*/ DE EFECTOS Y CONTRASTE DE INTERS*/ DE EFECTOS Y CONTRASTE DE INTERS*/
proc glm data=lechuga alpha=0.05;
class nitrato;
model nlechug=nitrato/SS1 CLPARM;
means nitrato/CLDIFF TUKEY LSD HOVTEST=BARTLETT;
contrast 'con nitrato vs. sin nitrato' nitrato -4 1 1 1 1;
estimate 'con nitrato vs. sin nitrato' nitrato -4 1 1 1 1/divisor=4;
estimate 'efecto nitrato0' nitrato 4 -1 -1 -1 -1/divisor=5;
estimate 'efecto nitrato50' nitrato -1 4 -1 -1 -1/divisor=5;
estimate 'efecto nitrato100' nitrato -1 -1 4 -1 -1/divisor=5;
estimate 'efecto nitrato150' nitrato -1 -1 -1 4 -1/divisor=5;
estimate 'efecto nitrato200' nitrato -1 -1 -1 -1 4/divisor=5;
output out=sal r=res p=pred;
run;quit;
/*OBTENCIN DE PRUEBAS DE NORMALIDAD PARA LOS ERRORES DEL MODELO ANOVA*/ /*OBTENCIN DE PRUEBAS DE NORMALIDAD PARA LOS ERRORES DEL MODELO ANOVA*/ /*OBTENCIN DE PRUEBAS DE NORMALIDAD PARA LOS ERRORES DEL MODELO ANOVA*/ /*OBTENCIN DE PRUEBAS DE NORMALIDAD PARA LOS ERRORES DEL MODELO ANOVA*/
proc univariate data=sal normaltest;
var res;
ods select testsfornormality;
run;
/*GRAFICAS DE RESIDUALES*/;
TITLE1'GRAFICOS DE RESIDUALES MODELO ANOVA PRODUCCION DE LECHUGA SEGUN NIVELES DE NITRATO';
proc gplot data=sal;
plot res*pred=nitrato/VREF=0 LVREF=2;
SYMBOL1 I=NONE V='1' C=RED h=1;
SYMBOL2 I=NONE V='2' C=BLACK h=1;
SYMBOL3 I=NONE V='3' C=BLUE h=1;
SYMBOL4 I=NONE V='4' C=ORANGE h=1;
SYMBOL5 I=NONE V='5' C=BROWN h=1;
RUN;QUIT;

Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
28
TABLA ANOVA: Dependent Variable: nlechug TABLA ANOVA: Dependent Variable: nlechug TABLA ANOVA: Dependent Variable: nlechug TABLA ANOVA: Dependent Variable: nlechug
Sum of Sum of Sum of Sum of
Source DF Squares Mean Square F Value Pr > F Source DF Squares Mean Square F Value Pr > F Source DF Squares Mean Square F Value Pr > F Source DF Squares Mean Square F Value Pr > F
Model 4 4994.800000 1248.700000 5.61 0.0058
Error 15 3338.000000 222.533333
Corrected Total 19 8332.800000
R-Square Coeff Var Root MSE nlechug Mean
0.599414 10.46112 14.91755 142.6000
Source DF Source DF Source DF Source DF Type I SS Mean Square F Value Pr > F Type I SS Mean Square F Value Pr > F Type I SS Mean Square F Value Pr > F Type I SS Mean Square F Value Pr > F
nitrato 4 4994.800000 1248.700000 5.61 0.0058
TEST DE BARTLET DE HOMOGENEIDAD DE VARIANZAS TEST DE BARTLET DE HOMOGENEIDAD DE VARIANZAS TEST DE BARTLET DE HOMOGENEIDAD DE VARIANZAS TEST DE BARTLET DE HOMOGENEIDAD DE VARIANZAS
Bartlett's Test for Homogeneity of nlechug Variance
Source DF Chi-Square Pr > ChiSq
nitrato 4 5.7049 0.2223
COMPARACIONES DE PARES DE MEDIAS MTODO LSD COMPARACIONES DE PARES DE MEDIAS MTODO LSD COMPARACIONES DE PARES DE MEDIAS MTODO LSD COMPARACIONES DE PARES DE MEDIAS MTODO LSD
t Tests (LSD) for nlechug
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.
Alpha 0.05
Error Degrees of Freedom 15
Error Mean Square 222.5333
Critical Value of t 2.13145
Least Significant Difference 22.483
Comparisons significant at the 0.05 level are indicated by ***.
Difference
nitrato Between 95% Confidence
Comparison Means Limits
150 - 200 8.50 -13.98 30.98
150 - 100 8.50 -13.98 30.98
150 - 50 12.00 -10.48 34.48
150 - 0 45.50 23.02 67.98 ***
200 - 100 0.00 -22.48 22.48
200 - 50 3.50 -18.98 25.98
200 - 0 37.00 14.52 59.48 ***
100 - 50 3.50 -18.98 25.98
100 - 0 37.00 14.52 59.48 ***
50 - 0 33.50 11.02 55.98 ***
COMPARACIONES DE PARES DE MEDIAS MTODO DE TUKEY COMPARACIONES DE PARES DE MEDIAS MTODO DE TUKEY COMPARACIONES DE PARES DE MEDIAS MTODO DE TUKEY COMPARACIONES DE PARES DE MEDIAS MTODO DE TUKEY
Tukey's Studentized Range (HSD) Test for nlechug
NOTE: This test controls the Type I experimentwise error rate.
Alpha 0.05
Error Degrees of Freedom 15
Error Mean Square 222.5333
Critical Value of Studentized Range 4.36699
Minimum Significant Difference 32.572
Comparisons significant at the 0.05 level are indicated by ***.

Difference Simultaneous
nitrato Between 95% Confidence
Comparison Means Limits
150 - 200 8.50 -24.07 41.07
150 - 100 8.50 -24.07 41.07
150 - 50 12.00 -20.57 44.57
150 - 0 45.50 12.93 78.07 ***
200 - 100 0.00 -32.57 32.57
200 - 50 3.50 -29.07 36.07
200 - 0 37.00 4.43 69.57 ***
100 - 50 3.50 -29.07 36.07
100 - 0 37.00 4.43 69.57 ***
50 - 0 33.50 0.93 66.07 ***
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
29
ESTIMACIN DE EFECTOS DE CADA NIVEL DE NITRATO Y SUS INTERVALOS DE CONFIANZA ESTIMACIN DE EFECTOS DE CADA NIVEL DE NITRATO Y SUS INTERVALOS DE CONFIANZA ESTIMACIN DE EFECTOS DE CADA NIVEL DE NITRATO Y SUS INTERVALOS DE CONFIANZA ESTIMACIN DE EFECTOS DE CADA NIVEL DE NITRATO Y SUS INTERVALOS DE CONFIANZA
Dependent Variable: nlechug
Standard Standard Standard Standard
Parameter Estimat Parameter Estimat Parameter Estimat Parameter Estimate Error t Value Pr > |t| 95% Confidence Limits e Error t Value Pr > |t| 95% Confidence Limits e Error t Value Pr > |t| 95% Confidence Limits e Error t Value Pr > |t| 95% Confidence Limits
efecto nitrato0 -30.6000000 6.67133170 -4.59 0.0004 -44.8196069 -16.3803931
efecto nitrato50 2.9000000 6.67133170 0.43 0.6700 -11.3196069 17.1196069
efecto nitrato100 6.4000000 6.67133170 0.96 0.3526 -7.8196069 20.6196069
efecto nitrato150 14.9000000 6.67133170 2.23 0.0412 0.6803931 29.1196069
efecto nitrato200 6.4000000 6.67133170 0.96 0.3526 -7.8196069 20.6196069
RESULTADOS PARA EVALUAR SIGNIFICANCIA DEL CONTRASTE DE MEDIAS CON NITRATO VS. RESULTADOS PARA EVALUAR SIGNIFICANCIA DEL CONTRASTE DE MEDIAS CON NITRATO VS. RESULTADOS PARA EVALUAR SIGNIFICANCIA DEL CONTRASTE DE MEDIAS CON NITRATO VS. RESULTADOS PARA EVALUAR SIGNIFICANCIA DEL CONTRASTE DE MEDIAS CON NITRATO VS. SIN NITRATO SIN NITRATO SIN NITRATO SIN NITRATO
Source DF Type I SS Mean Square F Value Pr > F Source DF Type I SS Mean Square F Value Pr > F Source DF Type I SS Mean Square F Value Pr > F Source DF Type I SS Mean Square F Value Pr > F
nitrato 4 4994.800000 1248.700000 5.61 0.0058
Contrast DF Contrast SS Mean Square F Value Pr > F
con nitrato vs. sin nitrato 1 4681.800000 4681.800000 21.04 0.0004
Standard Standard Standard Standard
Parameter Estimate Error t Value Pr > |t| 95% Confidence Limits Parameter Estimate Error t Value Pr > |t| 95% Confidence Limits Parameter Estimate Error t Value Pr > |t| 95% Confidence Limits Parameter Estimate Error t Value Pr > |t| 95% Confidence Limits
con nitrato vs. sin nitrato 38.2500000 8.33916463 4.59 0.0004 20.4754913 56.0245087
TEST DE NORMALIDAD SOBRE LOS ERROR TEST DE NORMALIDAD SOBRE LOS ERROR TEST DE NORMALIDAD SOBRE LOS ERROR TEST DE NORMALIDAD SOBRE LOS ERRORES DEL MODELO ANOVA ES DEL MODELO ANOVA ES DEL MODELO ANOVA ES DEL MODELO ANOVA
The UNIVARIATE Procedure
Variable: res
Tests for Normality
Test --Statistic--- -----p Value------
Shapiro-Wilk W 0.944656 Pr < W 0.2932
Kolmogorov-Smirnov D 0.148708 Pr > D >0.1500
Cramer-von Mises W-Sq 0.057475 Pr > W-Sq >0.2500
Anderson-Darling A-Sq 0.408977 Pr > A-Sq >0.2500
Problema 3: Para el problema 1 sobre mejora de la productividad:
a) Use el procedimiento de Tukey con un nivel de 0.05, para construir todos los intervalos de confianza posibles para las
diferencias de medias por pares. Establezca los grupos de medias.
b) Formule, estime y pruebe la significancia del contraste apropiado para probar si el promedio de mejora en
productividad a un nivel alto de gasto en investigacin y desarrollo, es:
1. Significativamente diferente a los otros dos niveles
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
30
2. Significativamente mayor que el de los otros dos niveles

ANEXO 1: SINTAXIS BSICA DEL PROC GLM:
PROC GLM: Sintaxis bsica: Las siguientes declaraciones estn disponibles en el PROC GLM.

PROC GLM < opciones > ; PROC GLM < opciones > ; PROC GLM < opciones > ; PROC GLM < opciones > ;
CLASS variables ; CLASS variables ; CLASS variables ; CLASS variables ;
MODEL dependientes=independientes < / opciones > ; MODEL dependientes=independientes < / opciones > ; MODEL dependientes=independientes < / opciones > ; MODEL dependientes=independientes < / opciones > ;
CONTRAST 'etiqueta' valores efecto < ... valores efecto > < / opciones > ; CONTRAST 'etiqueta' valores efecto < ... valores efecto > < / opciones > ; CONTRAST 'etiqueta' valores efecto < ... valores efecto > < / opciones > ; CONTRAST 'etiqueta' valores efecto < ... valores efecto > < / opciones > ;
ESTIMATE 'etiqueta' val ESTIMATE 'etiqueta' val ESTIMATE 'etiqueta' val ESTIMATE 'etiqueta' valores efecto < ... valores efecto > < / opciones > ; ores efecto < ... valores efecto > < / opciones > ; ores efecto < ... valores efecto > < / opciones > ; ores efecto < ... valores efecto > < / opciones > ;
LSMEANS effectos < / opciones > ; LSMEANS effectos < / opciones > ; LSMEANS effectos < / opciones > ; LSMEANS effectos < / opciones > ;
MEANS effectos < / opciones > ; MEANS effectos < / opciones > ; MEANS effectos < / opciones > ; MEANS effectos < / opciones > ;
OUTPUT < OUT=SAS OUTPUT < OUT=SAS OUTPUT < OUT=SAS OUTPUT < OUT=SAS- -- -data data data data- -- -set > keyword=nombres < ... keyword=nombres > < / opciones > ; set > keyword=nombres < ... keyword=nombres > < / opciones > ; set > keyword=nombres < ... keyword=nombres > < / opciones > ; set > keyword=nombres < ... keyword=nombres > < / opciones > ;
RANDOM efectos < / opciones > ; RANDOM efectos < / opciones > ; RANDOM efectos < / opciones > ; RANDOM efectos < / opciones > ;
Para usar el PROC GLM, son necesarias las declaraciones PROC GLM y MODEL. Slo puede especificarse una declaracin
MODEL. Los factores o variables de clasificacin deben ser listadas en una declaracin CLASS, la cual debe aparecer antes
de la declaracin MODEL.

ANEXO 2: FUNCIONES DE PARMETROS ESTIMABLES:
Una funcin de los parmetros de cualquier modelo se dice estimable si y slo s puede escribirse como el valor esperado de
una combinacin lineal de las variables respuesta. Slo las funciones estimables de los parmetros tienen estimadores
lineales insesgados. Es importante que el anlisis de un experimento incluya slo funciones estimables. Para un ANOVA de
un solo factor efectos fijos, cada funcin estimable es de la forma:
( )
1 1 1
i
n a a
ij ij i i
i j i
E a Y b o
= = =
(
= +
(


, con
1
i
n
i ij
j
b a
=
=

nmeros reales.
No hay valores de
i
b que den
1 2
, , , ,
a
o o o separadamente como valores esperados, por tanto, estos parmetros
no son individualmente estimables, sino cada
i
o + .
ANEXO 3: TEST DE BARTLETT DE HOMOGENEIDAD DE VARIANZAS:
Suponga que se tienen a poblaciones o tratamientos independientes, cada uno con distribucin normal N(i, oi
2
), i=1, 2, ..., a,
con varianzas desconocidas. Se quiere probar la hiptesis de igualdad de varianzas:
2 2 2
0 1 2
2 2
1
: vs.
: algn par
a
i j
H
H
o o o
o o
= = =
=

Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica


31
El estadstico de prueba est dado por
2 2
0 1
/
a
M C _ _

= con
( ) ( )
2 2
1
1 log log
a
p i i
i
M N a S n S
=
=

, y
( )
1
1 1 1
1
3 1 1
a
i
i
C
a n N a
=
| |
= +
|

\ .

,
( )
2
2
1
1
a
i i
i
p
n S
S MSE
N K
=

= =

donde
2
i
S es la varianza muestral de los ni valores observados de la respuesta con el tratamiento i. Se rechaza H0 aun nivel
de significancia si
2 2
0 1 ,a
_ _

> . Esta prueba es altamente sensible a no normalidad por lo cual debe comprobarse primero
tal supuesto.

ANEXO 4: OBTENCIN RESULTADOS PARA PROBLEMA 1 Y 3 MEDIANTE R:
#ENTRADA DE DATOS: #ENTRADA DE DATOS: #ENTRADA DE DATOS: #ENTRADA DE DATOS:
ID<-c(rep("alto",6),rep("bajo",9),rep("medio",12))

mprod<-c(8.5, 9.7, 10.1, 7.8, 9.6, 9.5, 7.6, 8.2, 6.8, 5.8, 6.9, 6.6, 6.3, 7.7, 6.0, 6.7, 8.1, 9.4, 8.6, 7.8, 7.7,
8.9, 7.9, 8.3, 8.7, 7.1, 8.4)

diseno<-data.frame(ID=factor(ID),mprod=mprod)

#TRES FORMAS DE OBTENER EL MISMO BOXPLOT: #TRES FORMAS DE OBTENER EL MISMO BOXPLOT: #TRES FORMAS DE OBTENER EL MISMO BOXPLOT: #TRES FORMAS DE OBTENER EL MISMO BOXPLOT:
plot(as.factor(ID),mprod) #hace boxplot
boxplot(split(mprod,as.factor(ID)))
boxplot(mprod~as.factor(ID))

#UN BOXPLOT MS ELABORADO: #UN BOXPLOT MS ELABORADO: #UN BOXPLOT MS ELABORADO: #UN BOXPLOT MS ELABORADO:
aux<-split(mprod,as.factor(ID))
medias<-sapply(aux,mean)

medias
alto bajo medio
9.200000 6.877778 8.133333
var<-sapply(aux,var)
var
alto bajo medio
0.7520000 0.6619444 0.5733333

boxplot(mprod~as.factor(ID),col=c("yellow","cyan","red"))
points(c(1:3),medias,pch=19,col=1)
lines(c(1:3),medias,lty=2,col="blue")
legend(locator(),c(paste("media ID alto=",round(medias[[1]],digits=3)),paste("media ID
bajo=",round(medias[[2]],digits=3)),paste("media ID medio=",round(medias[[3]],digits=3)),paste("var ID
alto=",round(var[[1]],digits=3)),paste("var ID bajo=",round(var[[2]],digits=3)),paste("var ID
medio=",round(var[[3]],digits=3))),ncol=1,bty="n",cex=0.7)

#ANLISIS DE VARIANZA: #ANLISIS DE VARIANZA: #ANLISIS DE VARIANZA: #ANLISIS DE VARIANZA:
analys.var<-aov(mprod~ID,diseno)
analys.var

Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
32
Call:
aov(formula = mprod ~ ID, data = diseno)

Terms:
ID Residuals
Sum of Squares 20.12518 15.36222
Deg. of Freedom 2 24

Residual standard error: 0.8000579
Estimated effects may be unbalanced

#OBTENIENDO TABLA ANOVA #OBTENIENDO TABLA ANOVA #OBTENIENDO TABLA ANOVA #OBTENIENDO TABLA ANOVA
anova(analys.var)
Analysis of Variance Table
Response: mprod
Df Sum Sq Mean Sq F value Pr(>F)
ID 2 20.1252 10.0626 15.720 4.331e-05 ***
Residuals 24 15.3622 0.6401
---
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1

#OTRA FORMA DE OBTENER LA TABLA ANOVA: #OTRA FORMA DE OBTENER LA TABLA ANOVA: #OTRA FORMA DE OBTENER LA TABLA ANOVA: #OTRA FORMA DE OBTENER LA TABLA ANOVA:
summary(analys.var)
Df Sum Sq Mean Sq F value Pr(>F)
ID 2 20.1252 10.0626 15.720 4.331e-05 ***
Residuals 24 15.3622 0.6401
---
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1

#ESTIMACIN DE LOS EFECTOS PRINCIPALES: #ESTIMACIN DE LOS EFECTOS PRINCIPALES: #ESTIMACIN DE LOS EFECTOS PRINCIPALES: #ESTIMACIN DE LOS EFECTOS PRINCIPALES:
model.tables(analys.var,type = "effects",se=TRUE)
Design is unbalanced - use se.contrast for se's
Tables of effects
ID
alto bajo medio
1.248 -1.074 0.1815
rep 6.000 9.000 12.0000

#OBTENIENDO MEDIAS POR NIVEL DEL FACTOR #OBTENIENDO MEDIAS POR NIVEL DEL FACTOR #OBTENIENDO MEDIAS POR NIVEL DEL FACTOR #OBTENIENDO MEDIAS POR NIVEL DEL FACTOR
model.tables(analys.var,type = "means",se=TRUE)
Design is unbalanced - use se.contrast for se's
Tables of means
Grand mean

7.951852

ID
alto bajo medio
9.2 6.878 8.133
rep 6.0 9.000 12.000

#CLCULO ERROR ESTNDAR DEL CONTRASTE ID: ALTO VS. DEMS: #CLCULO ERROR ESTNDAR DEL CONTRASTE ID: ALTO VS. DEMS: #CLCULO ERROR ESTNDAR DEL CONTRASTE ID: ALTO VS. DEMS: #CLCULO ERROR ESTNDAR DEL CONTRASTE ID: ALTO VS. DEMS:
se.contrast(analys.var,list(ID=="alto",ID=="bajo", ID=="medio"),coef=c(1,-0.5,-0.5))
[1] 0.3712111

#CLCULO DE ERRORES ESTNDAR DE LOS EFECTOS: #CLCULO DE ERRORES ESTNDAR DE LOS EFECTOS: #CLCULO DE ERRORES ESTNDAR DE LOS EFECTOS: #CLCULO DE ERRORES ESTNDAR DE LOS EFECTOS:
se.efect.alto<-se.contrast(analys.var,list(ID=="alto",ID=="bajo", ID=="medio"),coef=c(2/3,-1/3,-1/3))
se.efect.alto
[1] 0.2474741

Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
33
se.efect.bajo<-se.contrast(analys.var,list(ID=="alto",ID=="bajo", ID=="medio"),coef=c(-1/3,2/3,-1/3))
se.efect.bajo
[1] 0.2222383

se.efect.medio<-se.contrast(analys.var,list(ID=="alto",ID=="bajo", ID=="medio"),coef=c(-1/3,-1/3,2/3))
se.efect.medio
[1] 0.208478

#OBTENIENDO RESIDUOS Y SUS GRFICOS #OBTENIENDO RESIDUOS Y SUS GRFICOS #OBTENIENDO RESIDUOS Y SUS GRFICOS #OBTENIENDO RESIDUOS Y SUS GRFICOS
residuos<-residuals(analys.var)
nf<-layout(rbind(c(1,1,2,2),c(3,3,4,4)))
plot(analys.var)
nf<-layout(rbind(c(0,1,1,0),c(0,2,2,0)))
plot(residuos,as.factor(ID),main="Residuales vs. Factor ID") #hace grfico de punto horizontales
plot(as.factor(ID),residuos,main="Residuales vs. factor") #hace Boxplot

#INVOCANDO LA PRUEBA DE BARTLETT: #INVOCANDO LA PRUEBA DE BARTLETT: #INVOCANDO LA PRUEBA DE BARTLETT: #INVOCANDO LA PRUEBA DE BARTLETT:
bartlett.test(mprod~ID,data=diseno)

Bartlett test for homogeneity of variances
data: mprod by ID
Bartlett's K-squared = 0.1294, df = 2, p-value = 0.9374

#INVOCANDO PRUEBA DE NORMALIDAD: #INVOCANDO PRUEBA DE NORMALIDAD: #INVOCANDO PRUEBA DE NORMALIDAD: #INVOCANDO PRUEBA DE NORMALIDAD:
shapiro.test(residuos)

Shapiro-Wilk normality test
data: residuos
W = 0.9738, p-value = 0.7033

#INTERVALOS DE TUKEY #INTERVALOS DE TUKEY #INTERVALOS DE TUKEY #INTERVALOS DE TUKEY
TukeyHSD(analys.var)
Tukey multiple comparisons of means
95% family-wise confidence level
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
34
Fit: aov(formula = mprod ~ ID, data = diseno)

$ID
diff lwr upr
bajo-alto -2.322222 -3.3752471 -1.26919735
medio-alto -1.066667 -2.0656538 -0.06767956
medio-bajo 1.255556 0.3745317 2.13657937
#O BIEN AS: #O BIEN AS: #O BIEN AS: #O BIEN AS:
TukeyHSD(analys.var,ordered=T,conf.level = 0.95)

TukeyHSD(analys.var,ordered=T)
Tukey multiple comparisons of means
95% family-wise confidence level
factor levels have been ordered

Fit: aov(formula = mprod ~ ID, data = diseno)

$ID
diff lwr upr
medio-bajo 1.255556 0.37453174 2.136579
alto-bajo 2.322222 1.26919735 3.375247
alto-medio 1.066667 0.06767956 2.065654

nf<-layout(rbind(c(0,1,1,0),c(0,2,2,0)))

#OBTEBIENDO GRFICOS DE INTERVALOS DE TUKEY: #OBTEBIENDO GRFICOS DE INTERVALOS DE TUKEY: #OBTEBIENDO GRFICOS DE INTERVALOS DE TUKEY: #OBTEBIENDO GRFICOS DE INTERVALOS DE TUKEY:
plot(TukeyHSD(analys.var,ordered=T,conf.level = 0.95))
plot(TukeyHSD(analys.var,conf.level = 0.95))

Bibliografa
KUELH, R.O. (2001). Diseo de Experimentos. Thomson Learning.
MONTGOMERY, D. C. (2001) Design and analysis of experiments. 5
th
Edition. John Wiley & Sons.
NETER, N. et. Al. (1996) Applied Linear Statistical Models. Irwin.

Вам также может понравиться