Академический Документы
Профессиональный Документы
Культура Документы
=
=
Suma de las observaciones en el nivel o tratamiento i.
1 1
i
n a
ij
i j
Y Y
= =
=
Suma o total de todas las N observaciones en el experimento
Con estas cantidades se obtiene los siguientes estimadores (ver ANEXO 2: Funciones estimables de los parmetros):
1
1
a
i
i
Y
Y Y
N N
=
= = =
i
i i
i
Y
Y
n
= = ,
i i
Y Y o
= .
Es fcil ver que las respuestas ajustadas para el tratamiento i es
ij i
Y Y
ij ij i
Y Y c
=
Las sumas de cuadrados del modelo ANOVA SST=SSA+SSE, son:
Figura 1:
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
15
( )
2
2 2
1 1 1 1
i i
n n a a
ij ij i
i j i j
SST Y Y Y NY
= = = =
= =
, o variabilidad total observada en la respuesta, con 1 N grados
de libertad.
( )
2
2 2
1 1 1
i
n a a
i i i i
i j i
SSA Y Y nY NY
= = =
= =
, o variabilidad en la respuesta explicada por el factor A, con 1 a
grados de libertad.
( )
2
1 1
i
n a
ij i
i j
SSE Y Y SST SSA
= =
= =
, o variabilidad en la respuesta explicada por la aleatoriedad, N a con
grados de libertad.
La prueba hiptesis fundamental asociada al ANOVA, es la siguiente:
0 1 2 1
: vs. : algn para
a i j
H H = = = = , o equivalentemente,
0 1 2 1
0 0 : vs. : algn
a i
H H o o o o = = = = =
Si F0 es grande, se rechaza la hiptesis nula, en tanto que si es pequeo, no se tiene suficiente evidencia en contra de H0.
ANOVA
Fuente de
variacin g.l
Suma de
cuadrados
Cuadrados
Medios
Valores esperados
Cuadrados
medios F0 Valor P
Factor a-1 SSA MSA=SSA/(a-1)
2
2 1
1
a
i i
i
n
a
o
o
=
MSA/MSE
( )
1 0 , a N a
P f F
>
Error N-a SSE MSE=SSE/(N-a)
2
o
Total N-1 SST
DISTRIBUCIONES MUESTRALES DE LOS ESTIMADORES
Puede demostrarse que
2
, Y N
N
o
| |
|
\ .
,
2
,
i i
i
Y N
n
o
| |
|
\ .
, y que
2
1 1
0
,
i
i
N
n N
o o
| |
(
|
(
|
\ .
Por tanto, los correspondientes errores estndar e intervalos de confianza estn dados por:
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
16
Estimador Error estndar I.C del (1- )100%
Y
Y
MSE
S
N
= == =
2 / ,N a Y
Y t S
e e e e
i
Y
i
Y
i
MSE
S
n
= == =
2 / ,
i
i i N a Y
Y t S
e e e e
i
o
1 1
i
i
S MSE
n N
o
| |
=
|
\ .
2 / ,
i
i i N a
t S
o o o o
o o o o o o o o
e e e e
VALIDACIN DE SUPUESTOS DEL MODELO ANOVA
Para cada supuesto sobre los errores del modelo existen pruebas analticas y grficas, stas ltimas aunque no son exactas,
funcionan relativamente bien con pocos datos, y se requiere que una fuerte evidencia visual en contra de un supuesto est
soportada por ms de dos puntos para concluir que no se cumple. Cuando slo un par de puntos se alejan del
comportamiento esperado en una grfica de diagnstico, esto puede tratarse como un problema de datos atpicos.
Supuesto Hiptesis test Grfico
Normalidad
0
1
: Normal vs.
: no son Normales
ij
ij
H
H
c
c
Shapiro Wilk Grfico de probabilidad normal sobre
residuales, o residuales estandarizados
Varianza
Constante
2 2 2
0 1 2
2 2
1
: vs.
: algn par
a
i j
H
H
o o o
o o
= = =
=
Bartlet,
Cochran,
Leven
Grfico de residuales vs. valores
ajustado, residuales vs. niveles del factor
Independencia
( )
( )
0
1
0
0
: ,
: , para algn
ij i j
ij i j
H corr j j
H corr j j
c c
c c
= =
= =
Durbin
Watson
Lung-Box
Grfico de residuales (comunes o
estandarizados) vs. orden de corrida
Adicionalmente, se chequean:
La forma del modelo (ajuste del modelo), es decir, si realmente las respuestas medias de los tratamientos son
adecuadamente descritos por el modelo lineal postulado
i i
o = + mediante el grfico de residuales
estandarizados vs. niveles del factor. Patrones no aleatorios alrededor de la lnea cero de este grfico son indicios de
carencia de ajuste.
Outliers, mediante grfico de residuales estandarizados vs. niveles del factor; si tolas presunciones del modelo se
cumplen incluyendo la normalidad, aproximadamente el 68% de los residuales estandarizados deberan estar entre 1 y
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
17
+1, aproximadamente el 95% entre 2 y +2, y aproximadamente 99.7% entre 3 y +3. Si hay muchos outliers, los
niveles de confianza son ms bajos de los esperados.
NOTAS:
El supuesto de independencia debe verificarse antes de los otros supuestos. La no independencia en los errores puede
ser causada por la similaridad de las unidades experimentales cercanamente juntas en el tiempo o espacio. La no
independencia causa que los verdaderos niveles de significancia de las pruebas de hiptesis sean mucho ms altas
que las establecidas y que los niveles de confianza y las potencias de las pruebas sean ms bajas que lo esperado.
Las pruebas formales sobre igualdad de varianzas (ver en ANEXO 3, test de Bartlett) tienden a ser poco potentes con
pocas rplicas por nivel y muy sensibles a no normalidad. Una regla de dedo que usualmente se aplica es que el
estadstico F de la ANOVA y los mtodos de comparaciones mltiples de medias son apropiadas, si se ha probado que
la razn de la estimacin de la varianza ms grande a la varianza ms pequea de los a tratamientos es no es mayor de
tres (3); sin embargo hay que ser cuidadosos con esta regla porque an cuando las presunciones del modelo son
correctas tal razn de varianzas puede dar mayor que 3.
La violacin del supuesto de varianza constante es preocupante en particular cundo los diseos son desbalanceados
(nmero de rplicas no son iguales). Si el nivel con mayor varianza es el menos replicado, entonces los procedimientos
estadsticos son ms liberales y se tiene mayor probabilidad de cometer error tipo I, y menores niveles de confianza que
los esperados. Por el contrario, si el tratamiento o nivel de mayor varianza es el ms replicado, entonces los
procedimientos estadsticos son ms conservadores, es decir, niveles de significancia son ms bajos y niveles de
confianza ms altos de los esperados. En general se recomienda trabajar con diseos balanceados.
Pequeas desviaciones de la normalidad no afectan fuertemente a los niveles de significancia, niveles de confianza o la
potencia. Con diseos balanceados el caso de mayor preocupacin es cuando la distribucin tiene colas ms pesadas
que la normal, y en ese caso deberan usarse mtodos de anlisis de varianza no paramtricos (ej. Kruskall Wallis).
Soluciones al problema de varianza no constante:
transformaciones de la variable respuesta para estabilizar varianza
Anlisis con varianzas de error desiguales
Soluciones al problema de no normalidad:
Mtodos no paramtricos
Transformar la variable respuesta, tal como la transformacin logartmica. Aunque a veces transformar puede originar
problemas de varianza no constante que no exista con los datos originales.
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
18
Si la varianza no es constante, hay suficientes datos por nivel del factor, analizar la normalidad por separado en cada
nivel.
Soluciones al problema de no independencia: La no independencia es difcil de corregir; si hay una clara tendencia en el
grfico de residuales tal como una lnea recta, es posible incorporar al modelo trminos que representen el efecto temporal o
espacial. Por ejemplo, con una tendencia lineal en el tiempo, el modelo adecuado sera
( )
2
0
,
,
iid
ij i ij ij ij
Y t N o c c o = + + + y
ij
t es el tiempo en el cual la observacin j del tratamiento i fue tomada.
Este modelo es uno denominado de anlisis de covarianza.
Problema 1: Un administrador compil datos sobre mejoramientos de la productividad en los ltimos tres aos para una
muestra de firmas productoras de equipos de computacin. Las firmas fueron clasificadas de acuerdo a nivel de sus gastos en
investigacin y desarrollo en los pasados tres aos, en bajo, moderado y alto. Los resultados del estudio sobre la mejora de la
productividad (mprod, medida en una escala de 0 a 100) se presentan en la tabla anexa. Asumiendo que un modelo de efectos
fijos es apropiado:
obs
ID 1 2 3 4 5 6 7 8 9 10 11 12
alto 8.5 9.7 10.1 7.8 9.6 9.5
bajo 7.6 8.2 6.8 5.8 6.9 6.6 6.3 7.7 6.0
medio 6.7 8.1 9.4 8.6 7.8 7.7 8.9 7.9 8.3 8.7 7.1 8.4
a) Plantee un modelo estadstico apropiado para el ANOVA. Identifique sus trminos y los supuestos necesarios.
b) Haga un anlisis descriptivo de los datos. Qu puede concluir de estos en cuanto al promedio de mejoramiento de la
productividad? La variabilidad dentro de cada nivel del gasto en investigacin y desarrollo puede considerarse o no
aproximadamente constante?
c) Calcule la tabla ANOVA, la tabla de parmetros estimados para los datos y la tabla de medias. Analice los resultados
y pruebe a un nivel de significancia de 0.05, si la media de mejoramiento de la productividad difiere segn el nivel de gastos en
investigacin y desarrollo. NOTA: Tenga en cuenta en sus clculos que este problema es un caso de diseo desbalanceado
d) D una expresin general para el clculo de los residuales. Analice los grficos de residuales y selos para validar los
supuestos del modelo. As mismo use los resultados de la prueba de bartlett.
e) Calcule intervalos de confianza del 95% para la mejora media de productividad para cada nivel de gasto en inversin y
desarrollo.
c) Estime los efectos de cada nivel del factor y sus respectivos errores estndar, y pruebe la significancia de cada uno:
1. usando para cada prueba un nivel de significancia de 0.05
2. Controlando la tasa de error experimental a un nivel de 0.05 para las tres pruebas
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
19
NOTA: En los casos donde aplique exprese apropiadamente la prueba de hiptesis, el estadstico de prueba, el criterio de
rechazo.
/*LECTURA DE DATOS EN S /*LECTURA DE DATOS EN S /*LECTURA DE DATOS EN S /*LECTURA DE DATOS EN SAS:*/ AS:*/ AS:*/ AS:*/
options nodate nocenter nonumber;
goptions colors=(black,black,black) cback=white ftext=simplex ftitle=simplex htitle=1.0 htext=0.9;
data productividad;
do i=1 to 6;
id='alto';
output;
end;
do i=7 to 15;
id='bajo';
output;
end;
do i=16 to 27;
id='medi';
output;
end;
run;
data productividad(drop=i);
set productividad;
input mprod @@;
cards;
8.5 9.7 10.1 7.8 9.6 9.5 7.6 8.2 6.8 5.8 6.9 6.6 6.3 7.7
6.0 6.7 8.1 9.4 8.6 7.8 7.7 8.9 7.9 8.3 8.7 7.1 8.4
;
run;
/*GRAFICACIN DE LOS DATOS POR NIVEL DEL FACTOR /*GRAFICACIN DE LOS DATOS POR NIVEL DEL FACTOR /*GRAFICACIN DE LOS DATOS POR NIVEL DEL FACTOR /*GRAFICACIN DE LOS DATOS POR NIVEL DEL FACTOR*/ */ */ */
proc sort data=productividad;
by id;
run;
TITLE1'Boxplot comparativo';
TITLE2'Indice de productividad por nivel gasto en I.D';
proc boxplot data=productividad;
plot mprod*id/BOXCONNECT=MEAN CCONNECT=RED NOSERIFS CBOXES=black CBOXFILL=YELLOW CFRAME=CXF7E1C2;
run;quit;
TITLE1'Grafico de comparacion de medias';
TITLE2'Indice de productividad por nivel gasto en I.D';
proc gplot data=productividad;
plot mprod*id/frame;
symbol1 i=stdj v=dot c=black;
run;quit;
Los dos grficos obtenidos son como se presentan a continuacin:
La forma de leer los datos depende de la
estructura de estos y si el ingreso es por
teclado o si se leern desde un archivo
externo.
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
20
/*ANLISIS DE VARIANZA TEST DE BARTLETT, ESTIMACIONES E I.C PARA MEDIAS Y EFECTOS:*/ /*ANLISIS DE VARIANZA TEST DE BARTLETT, ESTIMACIONES E I.C PARA MEDIAS Y EFECTOS:*/ /*ANLISIS DE VARIANZA TEST DE BARTLETT, ESTIMACIONES E I.C PARA MEDIAS Y EFECTOS:*/ /*ANLISIS DE VARIANZA TEST DE BARTLETT, ESTIMACIONES E I.C PARA MEDIAS Y EFECTOS:*/
proc glm data=productividad;
class id;
model mprod=id/ss1 clparm; /*obtiene tabla ANOVA*/
means id/clm T hovtest=bartlett;
estimate 'efecto id alto' id 2 -1 -1/divisor=3;
estimate 'efecto id bajo' id -1 2 -1/divisor=3;
estimate 'efecto id medio' id -1 -1 2/divisor=3;
output out=sal p=yhat r=res;run;quit;
Lo anterior produce las siguientes salidas SAS:
The GLM Procedure
Class Level Information
Class Levels Values
id 3 alto bajo medi
Number of observations 27
Dependent Variable: mprod
Sum of
Source DF Squares Mean Square F Value Pr > F
Model 2 20.12518519 10.06259259 15.72 <.0001
Error 24 15.36222222 0.64009259
Corrected Total 26 35.48740741
R-Square Coeff Var Root MSE mprod Mean
0.567108 10.06128 0.800058 7.951852
Source DF Type I SS Mean Square F Value Pr > F
id 2 20.12518519 10.06259259 15.72 <.0001
Bartlett's Test for Homogeneity of mprod Variance
Source DF Chi-Square Pr > ChiSq
id 2 0.1294 0.9374
t Confidence Intervals for mprod
Alpha 0.05
Error Degrees of Freedom 24
Error Mean Square 0.640093
Critical Value of t 2.06390
95% Confidence
id N Mean Limits
alto 6 9.2000 8.5259 9.8741
medi 12 8.1333 7.6567 8.6100
bajo 9 6.8778 6.3274 7.4282
Estimacin de efectos: Los
coeficientes usados se obtienen de la
expresin de cada uno de ellos como
un contraste de las medias de niveles
del factor
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
21
Dependent Variable: mprod
Standard
Parameter Estimate Error t Value Pr > |t|
efecto id alto 1.12962963 0.24747409 4.56 0.0001
efecto id bajo -1.19259259 0.22223830 -5.37 <.0001
efecto id medio 0.06296296 0.20847800 0.30 0.7652
Parameter 95% Confidence Limits
efecto id alto 0.61886820 1.64039106
efecto id bajo -1.65126989 -0.73391529
efecto id medio -0.36731449 0.49324041
/*GRFICOS PARA ANLISIS DE RESIDUALES*/ /*GRFICOS PARA ANLISIS DE RESIDUALES*/ /*GRFICOS PARA ANLISIS DE RESIDUALES*/ /*GRFICOS PARA ANLISIS DE RESIDUALES*/
TITLE1'Graficos de residuales';
proc gplot data=sal;
plot res*(yhat id)/vref=0;
run;
quit;
TITLE1'Graficos QQ normal residuales';
proc univariate data=sal noprint normaltest;
var res;
probplot res;
inset normaltest probn;run;quit;
Y los grficos resultantes son:
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
22
INFERENCIAS PARA MEDIAS DE TRATAMIENTOS ANOVA UN FACTOR, DCA
Luego de un ANOVA donde se rechaz la hiptesis nula asociada, es necesario determinar cules tratamientos son
estadsticamente distintos. Para ello, se recurre a diferentes tcnicas de comparacin de medias de tratamiento:
Comparaciones entre pares de medias
Comparaciones mltiples o pruebas de rango mltiple.
Comparaciones por contrastes
Comparaciones de tratamientos con un control
Veremos los tres primeros casos:
COMPARACIONES DE PARES DE MEDIAS DE TRATAMIENTOS MTODO LSD
Para un par dado de medias de tratamientos, las comparaciones pueden realizarse probando la igualdad de tales medias o
construyendo el I.C para la diferencia. En particular, se podran realizar todas las a(a-1)/2 comparaciones entre pares de
medias. Un mtodo sencillo es el mtodo LSD (mnima diferencia significativa), en la cual se tiene (para i=j):
0 1
: vs. :
i j i j
H H = = .
El estadstico de prueba, bajo los supuestos del modelo lineal ANOVA un factor efectos fijos es:
i j
D Y Y
= el cual se
compara con la LSD (mnima diferencia significativa) a un nivel de significancia , dada por
2
1 1
/ , N a
i j
LSD t MSE
n n
| |
= +
|
|
\ .
. Se rechaza H0 si D>LSD.
Ej. Suponga que en un DCA se compararon los tiempos de cuatro mtodos de ensamble A, B, C, y D, usando cuatro rplicas
con cada mtodo. El ANOVA arrojo los siguientes resultados en donde visiblemente la hiptesis de igualdad de todos los
tiempos promedios de ensamble de las cuatro mtodos es rechazada al 5% de significancia:
Las medias muestrales por tratamiento, fueron respectivamente 7.25, 8.50,
12.75, y 10.50 y la media global de 9.75. todas las ni=4. A continuacin se
presentan las comparaciones por pares de medias, a un nivel de significancia
de 0.05, donde LSD=2.42:
FUENTE SC g.l CM F0 VALOR P
Mtodos 69.5 3 23.17 9.42 0.0018
Error 29.5 12 2.46
Total 99.0 15
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
23
Con este procedimiento se concluye que los las medias de tratamientos
estadsticamente iguales pueden agruparse as:
GRUPO 1: A = B
GRUPO 2: B = D
GRUPO 3: C = D
Como puede observarse hay traslape entre estos grupos. Sin embargo este
mtodo no es potente porque no controla la tasa de error experimental de
todas las comparaciones. Dicha tasa es definida como la probabilidad de
cometer error tipo I en al menos una de las a(a-1)/2 comparaciones entre
pares.
Existen otros mtodos de comparacin mltiple ms potentes para detectar diferencias no nulas entre pares de medias, que
controlan la tasa de error experimental conocidos como comparaciones mltiples o pruebas de rango mltiple , entre ellos
el mtodo de Tukey.
MTODO DE TUKEY PARA COMPARAR TODOS LOS PARES, O RANGO ESTUDENTIZADO DE TUKEY
Es un mtodo de comparacin de pares de medias ms conservador que el anterior (menos potente para detectar pequeas
diferencias) pero que s controla la tasa de error experimental; sin embargo proporciona intervalos de confianza para
diferencias por pares ms cortos que los arrojados por mtodos de Bonferroni y Scheff (los cuales no se estudian aqu) y
puede usarse en diseos de bloques completos aleatorizados y diseos de bloques incompletos balanceados. Para un diseo
DCA de un solo factor efectos fijos las diferencias absolutas de pares de medias se comparan a un nivel de significancia con
el valor crtico:
1 1 1
2
( , . )
i j
T q a g l MSE
n n
| |
= +
|
|
\ .
Donde ( , . ) q a g l
es el valor crtico del rango estudentizado los cuales se hayan tabulados, y gl los grados de libertad del
MSE. Los pares de medias de tratamientos i y j difieren significativamente cuando: | |
i i
D Y Y T
= > . Tambin puede
construirse los I.C de Tukey para las diferencias de medias. Si el cero no pertenece a tal intervalo entonces las dos medias
correspondientes son estadsticamente distintas:
( )
1 1 1
2
( , . )
i j i j
i j
Y Y q a g l MSE
n n
| |
| |
|
e +
|
|
|
\ .
\ .
Diferencia
Poblacional
Diferencia
muestral
absoluta
Decisin
A - B
1.25<2.42 Iguales
A - C
5.50>2.42 Diferentes
A - D
3.25>2.42 Diferentes
B - C
4.25>2.42 Diferentes
B - D
2.00<2.42 Iguales
C - D
2.25<2.42 Iguales
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
24
Ej. De nuevo considere el caso de comparacin de los cuatro mtodos de ensamble: La mnima diferencia significativa es
0 05 0 05
1 2
4 12 4 20 0 78 3 28
4
2
. .
( , ) . . . T q MSE
| |
= = =
|
\ .
Con este procedimiento se concluye que los las medias de tratamientos
estadsticamente iguales pueden agruparse as:
GRUPO 1: A = B = D
GRUPO 2: C = D
Como puede observarse hay un traslape entre estos dos grupos.
COMPARACIONES MEDIANTE CONTRASTES
Un contraste es una combinacin lineal de parmetros del mismo tipo, por ejemplo,
contraste de medias de tratamientos
1
a
i i
i
W c
=
=
,
contraste de efectos de tratamientos
1
a
i i
i
V bo
=
=
,
donde
1
0
a
i
i
c
=
=
y
1
0
a
i
i
b
=
=
, respectivamente.
Muchas veces, el inters en la experimentacin es obtener informacin para probar alguna hiptesis relativa a un contraste
dado. Para hacer inferencias sobre un contraste de medias nos basamos en la distribucin muestral del contraste estimado,
bajo las suposiciones del DCA:
2
2
1 1 1
~ ,
a a a
i i i i i
i
i i i
W c Y N c c
n
o
= = =
| |
=
|
|
\ .
(3)
Pruebas de hiptesis sobre un contraste: Bajo los supuestos del DCA, el estadstico de prueba para los test relativos a
contrastes de medias de tratamientos, es:
Diferencia
Poblacional
Diferencia
muestral
absoluta
Decisin
A - B
1.25<3.28 Iguales
A - C
5.50>3.28 Diferentes
A - D
3.25<3.28 Iguales
B - C
4.25>3.28 Diferentes
B - D
2.00<3.28 Iguales
C - D
2.25<3.28 Iguales
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
25
0
0
2
1
~
N a
a
i
i
i
W W
T t
c
MSE
n
(4)
En particular, el test de significancia de un contraste, es decir cuando H0: W=0
vs. H1: W=0, tambin puede realizarse a travs de un ANOVA, determinando la
suma de cuadrados del contraste SSW:
2
2
1
/
W
a
i i
i
W
SS
c n
=
=
| |
|
|
\ .
que tiene un grado de libertad, y construyendo el estadstico F para la prueba como la razn de SSW sobre el MSE del modelo.
Es decir:
0
0 1,
/ ~
H
W N a
F SS MSE f
= . H0 es rechazada si
0 1 , . N a
F f
> o bien si
( )
1 0 , N a
VP P f F
. W = y SSW=(3.508)
2
/(7/12). La hiptesis a probar
es H0: W=0, vs. H1; W=0, y el estadstico de prueba F0=SSW/MSE=2.931; el valor crtico al 0.05 de significancia es
F.05,1,14,=4.6. Luego no se obtuvo evidencia suficiente en contra de H0, y se concluye que los filtros preesterilizados no difieren
significativamente de los que no se preesterilizaron. Un intervalo de confianza del 95% para el contraste dado es
( )
0 025 14
3 508 21 6 7 36 0 888 7 904
. ,
. . / . , . t = .
Tests Rechazar H0 si VP
H0: W=W0
H1: W=W0
|T0|>t
/2,N-a
P(|t,N-a|>|T0|)
H0: W=W0
H1: W>W0
T0> t
,N-a P(t,N-a>T0)
H0: W=W0
H1: W<W0
T0<- t
,N-a P(t,N-a<T0)
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
26
Problema 2: Se llev a cabo un experimento para probar los efectos de un fertilizante nitrogenado en la produccin de
lechuga. Se aplicaron cinco dosis diferentes de nitrato de amonio a cuatro parcelas (las rplicas) en un diseo totalmente
aleatorizado. Los datos son el nmero de lechugas cosechadas de las parcelas.
Tratamiento
(lb N/acre)
0 104 114 90 140
50 134 130 144 174
100 146 142 152 156
150 147 160 160 163
200 131 148 154 163
lechuga/parcelas
a) Especifique la estructura de tratamiento y de diseo empleado en este experimento Escriba el modelo ANOVA
apropiado con sus supuestos y restricciones.
b) Realice un anlisis descriptivo de los datos experimentales establezca conclusiones preliminares sobre los
posibles efectos en la produccin promedio de los diferentes niveles de aplicacin de nitrato.
c) Realice el test de hiptesis asociado al modelo ANOVA, interprete a la luz del problema.
d) Si el factor de tratamientos es significativo, agrupe las medias de produccin segn nivel de nitrato y pruebe si
aplicar nitrato produce una produccin promedio diferente respecto a no aplicar nitrato. Tambin pruebe si
aplicar nitrato eleva la produccin promedio respecto a no aplicar nitrato.
e) Valide los supuestos del modelo ANOVA de este experimento. Analice el grfico de residuos.
A continuacin, un programa SAS para el ANOVA, la obtencin de los I.C de TUKEY, y LSD, la prueba de homogeneidad de
varianza de Bartlett, las estimaciones de los efectos principales y sus intervalos de confianza, la estimacin y el test de
significancia de un contraste, la obtencin de residuales, los tests de normalidad y loas grficas de residuales
options ps=60 ls=80 nodate nonumber nocenter;
goptions colors=(black,black,black) cback=white
ftext=simplex ftitle=simplex htitle=1.0 htext=0.9;
/*ENTRAD /*ENTRAD /*ENTRAD /*ENTRADA DE DATOS DE LA TABLA */ A DE DATOS DE LA TABLA */ A DE DATOS DE LA TABLA */ A DE DATOS DE LA TABLA */
data lechuga;
do nitrato=0 to 200 by 50;
do ob=1 to 4;
input nlechug @;
output;
end;
end;
cards;
104 114 90 140
134 130 144 174
146 142 152 156
147 160 160 163
131 148 154 163
;
run;
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
27
/*OBTENCIN DE BOXPLOT COMPARATIVOS PARA LOS /*OBTENCIN DE BOXPLOT COMPARATIVOS PARA LOS /*OBTENCIN DE BOXPLOT COMPARATIVOS PARA LOS /*OBTENCIN DE BOXPLOT COMPARATIVOS PARA LOS DATOS EXPERIMENTALES*/ DATOS EXPERIMENTALES*/ DATOS EXPERIMENTALES*/ DATOS EXPERIMENTALES*/
PROC SORT DATA=lechuga;
BY nitrato;
RUN;
TITLE1'BOXPLOTS PRODUCCION DE LECHUGA';
TITLE2'COMPARACION POR NIVEL DE NITRATO';
PROC BOXPLOT DATA=lechuga;
PLOT nlechug*nitrato/BOXCONNECT=MEAN CCONNECT=RED CBOXES=black CBOXFILL=YELLOW CFRAME=CXF7E1C2;
run;quit;
/*REALIZACIN DEL ANLISIS DE VARIANZA, OBTENCIN DE I.C PARA DIEFERENCIAS DE MEDIAS, TEST DE BARTLETT, ESTIMACIN /*REALIZACIN DEL ANLISIS DE VARIANZA, OBTENCIN DE I.C PARA DIEFERENCIAS DE MEDIAS, TEST DE BARTLETT, ESTIMACIN /*REALIZACIN DEL ANLISIS DE VARIANZA, OBTENCIN DE I.C PARA DIEFERENCIAS DE MEDIAS, TEST DE BARTLETT, ESTIMACIN /*REALIZACIN DEL ANLISIS DE VARIANZA, OBTENCIN DE I.C PARA DIEFERENCIAS DE MEDIAS, TEST DE BARTLETT, ESTIMACIN
DE EFECTOS Y CONTRASTE DE INTERS*/ DE EFECTOS Y CONTRASTE DE INTERS*/ DE EFECTOS Y CONTRASTE DE INTERS*/ DE EFECTOS Y CONTRASTE DE INTERS*/
proc glm data=lechuga alpha=0.05;
class nitrato;
model nlechug=nitrato/SS1 CLPARM;
means nitrato/CLDIFF TUKEY LSD HOVTEST=BARTLETT;
contrast 'con nitrato vs. sin nitrato' nitrato -4 1 1 1 1;
estimate 'con nitrato vs. sin nitrato' nitrato -4 1 1 1 1/divisor=4;
estimate 'efecto nitrato0' nitrato 4 -1 -1 -1 -1/divisor=5;
estimate 'efecto nitrato50' nitrato -1 4 -1 -1 -1/divisor=5;
estimate 'efecto nitrato100' nitrato -1 -1 4 -1 -1/divisor=5;
estimate 'efecto nitrato150' nitrato -1 -1 -1 4 -1/divisor=5;
estimate 'efecto nitrato200' nitrato -1 -1 -1 -1 4/divisor=5;
output out=sal r=res p=pred;
run;quit;
/*OBTENCIN DE PRUEBAS DE NORMALIDAD PARA LOS ERRORES DEL MODELO ANOVA*/ /*OBTENCIN DE PRUEBAS DE NORMALIDAD PARA LOS ERRORES DEL MODELO ANOVA*/ /*OBTENCIN DE PRUEBAS DE NORMALIDAD PARA LOS ERRORES DEL MODELO ANOVA*/ /*OBTENCIN DE PRUEBAS DE NORMALIDAD PARA LOS ERRORES DEL MODELO ANOVA*/
proc univariate data=sal normaltest;
var res;
ods select testsfornormality;
run;
/*GRAFICAS DE RESIDUALES*/;
TITLE1'GRAFICOS DE RESIDUALES MODELO ANOVA PRODUCCION DE LECHUGA SEGUN NIVELES DE NITRATO';
proc gplot data=sal;
plot res*pred=nitrato/VREF=0 LVREF=2;
SYMBOL1 I=NONE V='1' C=RED h=1;
SYMBOL2 I=NONE V='2' C=BLACK h=1;
SYMBOL3 I=NONE V='3' C=BLUE h=1;
SYMBOL4 I=NONE V='4' C=ORANGE h=1;
SYMBOL5 I=NONE V='5' C=BROWN h=1;
RUN;QUIT;
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
28
TABLA ANOVA: Dependent Variable: nlechug TABLA ANOVA: Dependent Variable: nlechug TABLA ANOVA: Dependent Variable: nlechug TABLA ANOVA: Dependent Variable: nlechug
Sum of Sum of Sum of Sum of
Source DF Squares Mean Square F Value Pr > F Source DF Squares Mean Square F Value Pr > F Source DF Squares Mean Square F Value Pr > F Source DF Squares Mean Square F Value Pr > F
Model 4 4994.800000 1248.700000 5.61 0.0058
Error 15 3338.000000 222.533333
Corrected Total 19 8332.800000
R-Square Coeff Var Root MSE nlechug Mean
0.599414 10.46112 14.91755 142.6000
Source DF Source DF Source DF Source DF Type I SS Mean Square F Value Pr > F Type I SS Mean Square F Value Pr > F Type I SS Mean Square F Value Pr > F Type I SS Mean Square F Value Pr > F
nitrato 4 4994.800000 1248.700000 5.61 0.0058
TEST DE BARTLET DE HOMOGENEIDAD DE VARIANZAS TEST DE BARTLET DE HOMOGENEIDAD DE VARIANZAS TEST DE BARTLET DE HOMOGENEIDAD DE VARIANZAS TEST DE BARTLET DE HOMOGENEIDAD DE VARIANZAS
Bartlett's Test for Homogeneity of nlechug Variance
Source DF Chi-Square Pr > ChiSq
nitrato 4 5.7049 0.2223
COMPARACIONES DE PARES DE MEDIAS MTODO LSD COMPARACIONES DE PARES DE MEDIAS MTODO LSD COMPARACIONES DE PARES DE MEDIAS MTODO LSD COMPARACIONES DE PARES DE MEDIAS MTODO LSD
t Tests (LSD) for nlechug
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.
Alpha 0.05
Error Degrees of Freedom 15
Error Mean Square 222.5333
Critical Value of t 2.13145
Least Significant Difference 22.483
Comparisons significant at the 0.05 level are indicated by ***.
Difference
nitrato Between 95% Confidence
Comparison Means Limits
150 - 200 8.50 -13.98 30.98
150 - 100 8.50 -13.98 30.98
150 - 50 12.00 -10.48 34.48
150 - 0 45.50 23.02 67.98 ***
200 - 100 0.00 -22.48 22.48
200 - 50 3.50 -18.98 25.98
200 - 0 37.00 14.52 59.48 ***
100 - 50 3.50 -18.98 25.98
100 - 0 37.00 14.52 59.48 ***
50 - 0 33.50 11.02 55.98 ***
COMPARACIONES DE PARES DE MEDIAS MTODO DE TUKEY COMPARACIONES DE PARES DE MEDIAS MTODO DE TUKEY COMPARACIONES DE PARES DE MEDIAS MTODO DE TUKEY COMPARACIONES DE PARES DE MEDIAS MTODO DE TUKEY
Tukey's Studentized Range (HSD) Test for nlechug
NOTE: This test controls the Type I experimentwise error rate.
Alpha 0.05
Error Degrees of Freedom 15
Error Mean Square 222.5333
Critical Value of Studentized Range 4.36699
Minimum Significant Difference 32.572
Comparisons significant at the 0.05 level are indicated by ***.
Difference Simultaneous
nitrato Between 95% Confidence
Comparison Means Limits
150 - 200 8.50 -24.07 41.07
150 - 100 8.50 -24.07 41.07
150 - 50 12.00 -20.57 44.57
150 - 0 45.50 12.93 78.07 ***
200 - 100 0.00 -32.57 32.57
200 - 50 3.50 -29.07 36.07
200 - 0 37.00 4.43 69.57 ***
100 - 50 3.50 -29.07 36.07
100 - 0 37.00 4.43 69.57 ***
50 - 0 33.50 0.93 66.07 ***
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
29
ESTIMACIN DE EFECTOS DE CADA NIVEL DE NITRATO Y SUS INTERVALOS DE CONFIANZA ESTIMACIN DE EFECTOS DE CADA NIVEL DE NITRATO Y SUS INTERVALOS DE CONFIANZA ESTIMACIN DE EFECTOS DE CADA NIVEL DE NITRATO Y SUS INTERVALOS DE CONFIANZA ESTIMACIN DE EFECTOS DE CADA NIVEL DE NITRATO Y SUS INTERVALOS DE CONFIANZA
Dependent Variable: nlechug
Standard Standard Standard Standard
Parameter Estimat Parameter Estimat Parameter Estimat Parameter Estimate Error t Value Pr > |t| 95% Confidence Limits e Error t Value Pr > |t| 95% Confidence Limits e Error t Value Pr > |t| 95% Confidence Limits e Error t Value Pr > |t| 95% Confidence Limits
efecto nitrato0 -30.6000000 6.67133170 -4.59 0.0004 -44.8196069 -16.3803931
efecto nitrato50 2.9000000 6.67133170 0.43 0.6700 -11.3196069 17.1196069
efecto nitrato100 6.4000000 6.67133170 0.96 0.3526 -7.8196069 20.6196069
efecto nitrato150 14.9000000 6.67133170 2.23 0.0412 0.6803931 29.1196069
efecto nitrato200 6.4000000 6.67133170 0.96 0.3526 -7.8196069 20.6196069
RESULTADOS PARA EVALUAR SIGNIFICANCIA DEL CONTRASTE DE MEDIAS CON NITRATO VS. RESULTADOS PARA EVALUAR SIGNIFICANCIA DEL CONTRASTE DE MEDIAS CON NITRATO VS. RESULTADOS PARA EVALUAR SIGNIFICANCIA DEL CONTRASTE DE MEDIAS CON NITRATO VS. RESULTADOS PARA EVALUAR SIGNIFICANCIA DEL CONTRASTE DE MEDIAS CON NITRATO VS. SIN NITRATO SIN NITRATO SIN NITRATO SIN NITRATO
Source DF Type I SS Mean Square F Value Pr > F Source DF Type I SS Mean Square F Value Pr > F Source DF Type I SS Mean Square F Value Pr > F Source DF Type I SS Mean Square F Value Pr > F
nitrato 4 4994.800000 1248.700000 5.61 0.0058
Contrast DF Contrast SS Mean Square F Value Pr > F
con nitrato vs. sin nitrato 1 4681.800000 4681.800000 21.04 0.0004
Standard Standard Standard Standard
Parameter Estimate Error t Value Pr > |t| 95% Confidence Limits Parameter Estimate Error t Value Pr > |t| 95% Confidence Limits Parameter Estimate Error t Value Pr > |t| 95% Confidence Limits Parameter Estimate Error t Value Pr > |t| 95% Confidence Limits
con nitrato vs. sin nitrato 38.2500000 8.33916463 4.59 0.0004 20.4754913 56.0245087
TEST DE NORMALIDAD SOBRE LOS ERROR TEST DE NORMALIDAD SOBRE LOS ERROR TEST DE NORMALIDAD SOBRE LOS ERROR TEST DE NORMALIDAD SOBRE LOS ERRORES DEL MODELO ANOVA ES DEL MODELO ANOVA ES DEL MODELO ANOVA ES DEL MODELO ANOVA
The UNIVARIATE Procedure
Variable: res
Tests for Normality
Test --Statistic--- -----p Value------
Shapiro-Wilk W 0.944656 Pr < W 0.2932
Kolmogorov-Smirnov D 0.148708 Pr > D >0.1500
Cramer-von Mises W-Sq 0.057475 Pr > W-Sq >0.2500
Anderson-Darling A-Sq 0.408977 Pr > A-Sq >0.2500
Problema 3: Para el problema 1 sobre mejora de la productividad:
a) Use el procedimiento de Tukey con un nivel de 0.05, para construir todos los intervalos de confianza posibles para las
diferencias de medias por pares. Establezca los grupos de medias.
b) Formule, estime y pruebe la significancia del contraste apropiado para probar si el promedio de mejora en
productividad a un nivel alto de gasto en investigacin y desarrollo, es:
1. Significativamente diferente a los otros dos niveles
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
30
2. Significativamente mayor que el de los otros dos niveles
ANEXO 1: SINTAXIS BSICA DEL PROC GLM:
PROC GLM: Sintaxis bsica: Las siguientes declaraciones estn disponibles en el PROC GLM.
PROC GLM < opciones > ; PROC GLM < opciones > ; PROC GLM < opciones > ; PROC GLM < opciones > ;
CLASS variables ; CLASS variables ; CLASS variables ; CLASS variables ;
MODEL dependientes=independientes < / opciones > ; MODEL dependientes=independientes < / opciones > ; MODEL dependientes=independientes < / opciones > ; MODEL dependientes=independientes < / opciones > ;
CONTRAST 'etiqueta' valores efecto < ... valores efecto > < / opciones > ; CONTRAST 'etiqueta' valores efecto < ... valores efecto > < / opciones > ; CONTRAST 'etiqueta' valores efecto < ... valores efecto > < / opciones > ; CONTRAST 'etiqueta' valores efecto < ... valores efecto > < / opciones > ;
ESTIMATE 'etiqueta' val ESTIMATE 'etiqueta' val ESTIMATE 'etiqueta' val ESTIMATE 'etiqueta' valores efecto < ... valores efecto > < / opciones > ; ores efecto < ... valores efecto > < / opciones > ; ores efecto < ... valores efecto > < / opciones > ; ores efecto < ... valores efecto > < / opciones > ;
LSMEANS effectos < / opciones > ; LSMEANS effectos < / opciones > ; LSMEANS effectos < / opciones > ; LSMEANS effectos < / opciones > ;
MEANS effectos < / opciones > ; MEANS effectos < / opciones > ; MEANS effectos < / opciones > ; MEANS effectos < / opciones > ;
OUTPUT < OUT=SAS OUTPUT < OUT=SAS OUTPUT < OUT=SAS OUTPUT < OUT=SAS- -- -data data data data- -- -set > keyword=nombres < ... keyword=nombres > < / opciones > ; set > keyword=nombres < ... keyword=nombres > < / opciones > ; set > keyword=nombres < ... keyword=nombres > < / opciones > ; set > keyword=nombres < ... keyword=nombres > < / opciones > ;
RANDOM efectos < / opciones > ; RANDOM efectos < / opciones > ; RANDOM efectos < / opciones > ; RANDOM efectos < / opciones > ;
Para usar el PROC GLM, son necesarias las declaraciones PROC GLM y MODEL. Slo puede especificarse una declaracin
MODEL. Los factores o variables de clasificacin deben ser listadas en una declaracin CLASS, la cual debe aparecer antes
de la declaracin MODEL.
ANEXO 2: FUNCIONES DE PARMETROS ESTIMABLES:
Una funcin de los parmetros de cualquier modelo se dice estimable si y slo s puede escribirse como el valor esperado de
una combinacin lineal de las variables respuesta. Slo las funciones estimables de los parmetros tienen estimadores
lineales insesgados. Es importante que el anlisis de un experimento incluya slo funciones estimables. Para un ANOVA de
un solo factor efectos fijos, cada funcin estimable es de la forma:
( )
1 1 1
i
n a a
ij ij i i
i j i
E a Y b o
= = =
(
= +
(
, con
1
i
n
i ij
j
b a
=
=
nmeros reales.
No hay valores de
i
b que den
1 2
, , , ,
a
o o o separadamente como valores esperados, por tanto, estos parmetros
no son individualmente estimables, sino cada
i
o + .
ANEXO 3: TEST DE BARTLETT DE HOMOGENEIDAD DE VARIANZAS:
Suponga que se tienen a poblaciones o tratamientos independientes, cada uno con distribucin normal N(i, oi
2
), i=1, 2, ..., a,
con varianzas desconocidas. Se quiere probar la hiptesis de igualdad de varianzas:
2 2 2
0 1 2
2 2
1
: vs.
: algn par
a
i j
H
H
o o o
o o
= = =
=
, y
( )
1
1 1 1
1
3 1 1
a
i
i
C
a n N a
=
| |
= +
|
\ .
,
( )
2
2
1
1
a
i i
i
p
n S
S MSE
N K
=
= =
donde
2
i
S es la varianza muestral de los ni valores observados de la respuesta con el tratamiento i. Se rechaza H0 aun nivel
de significancia si
2 2
0 1 ,a
_ _
> . Esta prueba es altamente sensible a no normalidad por lo cual debe comprobarse primero
tal supuesto.
ANEXO 4: OBTENCIN RESULTADOS PARA PROBLEMA 1 Y 3 MEDIANTE R:
#ENTRADA DE DATOS: #ENTRADA DE DATOS: #ENTRADA DE DATOS: #ENTRADA DE DATOS:
ID<-c(rep("alto",6),rep("bajo",9),rep("medio",12))
mprod<-c(8.5, 9.7, 10.1, 7.8, 9.6, 9.5, 7.6, 8.2, 6.8, 5.8, 6.9, 6.6, 6.3, 7.7, 6.0, 6.7, 8.1, 9.4, 8.6, 7.8, 7.7,
8.9, 7.9, 8.3, 8.7, 7.1, 8.4)
diseno<-data.frame(ID=factor(ID),mprod=mprod)
#TRES FORMAS DE OBTENER EL MISMO BOXPLOT: #TRES FORMAS DE OBTENER EL MISMO BOXPLOT: #TRES FORMAS DE OBTENER EL MISMO BOXPLOT: #TRES FORMAS DE OBTENER EL MISMO BOXPLOT:
plot(as.factor(ID),mprod) #hace boxplot
boxplot(split(mprod,as.factor(ID)))
boxplot(mprod~as.factor(ID))
#UN BOXPLOT MS ELABORADO: #UN BOXPLOT MS ELABORADO: #UN BOXPLOT MS ELABORADO: #UN BOXPLOT MS ELABORADO:
aux<-split(mprod,as.factor(ID))
medias<-sapply(aux,mean)
medias
alto bajo medio
9.200000 6.877778 8.133333
var<-sapply(aux,var)
var
alto bajo medio
0.7520000 0.6619444 0.5733333
boxplot(mprod~as.factor(ID),col=c("yellow","cyan","red"))
points(c(1:3),medias,pch=19,col=1)
lines(c(1:3),medias,lty=2,col="blue")
legend(locator(),c(paste("media ID alto=",round(medias[[1]],digits=3)),paste("media ID
bajo=",round(medias[[2]],digits=3)),paste("media ID medio=",round(medias[[3]],digits=3)),paste("var ID
alto=",round(var[[1]],digits=3)),paste("var ID bajo=",round(var[[2]],digits=3)),paste("var ID
medio=",round(var[[3]],digits=3))),ncol=1,bty="n",cex=0.7)
#ANLISIS DE VARIANZA: #ANLISIS DE VARIANZA: #ANLISIS DE VARIANZA: #ANLISIS DE VARIANZA:
analys.var<-aov(mprod~ID,diseno)
analys.var
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
32
Call:
aov(formula = mprod ~ ID, data = diseno)
Terms:
ID Residuals
Sum of Squares 20.12518 15.36222
Deg. of Freedom 2 24
Residual standard error: 0.8000579
Estimated effects may be unbalanced
#OBTENIENDO TABLA ANOVA #OBTENIENDO TABLA ANOVA #OBTENIENDO TABLA ANOVA #OBTENIENDO TABLA ANOVA
anova(analys.var)
Analysis of Variance Table
Response: mprod
Df Sum Sq Mean Sq F value Pr(>F)
ID 2 20.1252 10.0626 15.720 4.331e-05 ***
Residuals 24 15.3622 0.6401
---
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
#OTRA FORMA DE OBTENER LA TABLA ANOVA: #OTRA FORMA DE OBTENER LA TABLA ANOVA: #OTRA FORMA DE OBTENER LA TABLA ANOVA: #OTRA FORMA DE OBTENER LA TABLA ANOVA:
summary(analys.var)
Df Sum Sq Mean Sq F value Pr(>F)
ID 2 20.1252 10.0626 15.720 4.331e-05 ***
Residuals 24 15.3622 0.6401
---
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
#ESTIMACIN DE LOS EFECTOS PRINCIPALES: #ESTIMACIN DE LOS EFECTOS PRINCIPALES: #ESTIMACIN DE LOS EFECTOS PRINCIPALES: #ESTIMACIN DE LOS EFECTOS PRINCIPALES:
model.tables(analys.var,type = "effects",se=TRUE)
Design is unbalanced - use se.contrast for se's
Tables of effects
ID
alto bajo medio
1.248 -1.074 0.1815
rep 6.000 9.000 12.0000
#OBTENIENDO MEDIAS POR NIVEL DEL FACTOR #OBTENIENDO MEDIAS POR NIVEL DEL FACTOR #OBTENIENDO MEDIAS POR NIVEL DEL FACTOR #OBTENIENDO MEDIAS POR NIVEL DEL FACTOR
model.tables(analys.var,type = "means",se=TRUE)
Design is unbalanced - use se.contrast for se's
Tables of means
Grand mean
7.951852
ID
alto bajo medio
9.2 6.878 8.133
rep 6.0 9.000 12.000
#CLCULO ERROR ESTNDAR DEL CONTRASTE ID: ALTO VS. DEMS: #CLCULO ERROR ESTNDAR DEL CONTRASTE ID: ALTO VS. DEMS: #CLCULO ERROR ESTNDAR DEL CONTRASTE ID: ALTO VS. DEMS: #CLCULO ERROR ESTNDAR DEL CONTRASTE ID: ALTO VS. DEMS:
se.contrast(analys.var,list(ID=="alto",ID=="bajo", ID=="medio"),coef=c(1,-0.5,-0.5))
[1] 0.3712111
#CLCULO DE ERRORES ESTNDAR DE LOS EFECTOS: #CLCULO DE ERRORES ESTNDAR DE LOS EFECTOS: #CLCULO DE ERRORES ESTNDAR DE LOS EFECTOS: #CLCULO DE ERRORES ESTNDAR DE LOS EFECTOS:
se.efect.alto<-se.contrast(analys.var,list(ID=="alto",ID=="bajo", ID=="medio"),coef=c(2/3,-1/3,-1/3))
se.efect.alto
[1] 0.2474741
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
33
se.efect.bajo<-se.contrast(analys.var,list(ID=="alto",ID=="bajo", ID=="medio"),coef=c(-1/3,2/3,-1/3))
se.efect.bajo
[1] 0.2222383
se.efect.medio<-se.contrast(analys.var,list(ID=="alto",ID=="bajo", ID=="medio"),coef=c(-1/3,-1/3,2/3))
se.efect.medio
[1] 0.208478
#OBTENIENDO RESIDUOS Y SUS GRFICOS #OBTENIENDO RESIDUOS Y SUS GRFICOS #OBTENIENDO RESIDUOS Y SUS GRFICOS #OBTENIENDO RESIDUOS Y SUS GRFICOS
residuos<-residuals(analys.var)
nf<-layout(rbind(c(1,1,2,2),c(3,3,4,4)))
plot(analys.var)
nf<-layout(rbind(c(0,1,1,0),c(0,2,2,0)))
plot(residuos,as.factor(ID),main="Residuales vs. Factor ID") #hace grfico de punto horizontales
plot(as.factor(ID),residuos,main="Residuales vs. factor") #hace Boxplot
#INVOCANDO LA PRUEBA DE BARTLETT: #INVOCANDO LA PRUEBA DE BARTLETT: #INVOCANDO LA PRUEBA DE BARTLETT: #INVOCANDO LA PRUEBA DE BARTLETT:
bartlett.test(mprod~ID,data=diseno)
Bartlett test for homogeneity of variances
data: mprod by ID
Bartlett's K-squared = 0.1294, df = 2, p-value = 0.9374
#INVOCANDO PRUEBA DE NORMALIDAD: #INVOCANDO PRUEBA DE NORMALIDAD: #INVOCANDO PRUEBA DE NORMALIDAD: #INVOCANDO PRUEBA DE NORMALIDAD:
shapiro.test(residuos)
Shapiro-Wilk normality test
data: residuos
W = 0.9738, p-value = 0.7033
#INTERVALOS DE TUKEY #INTERVALOS DE TUKEY #INTERVALOS DE TUKEY #INTERVALOS DE TUKEY
TukeyHSD(analys.var)
Tukey multiple comparisons of means
95% family-wise confidence level
Mtodos Estadsticos II Prof. Nelfi Gonzlez Escuela de Estadstica
34
Fit: aov(formula = mprod ~ ID, data = diseno)
$ID
diff lwr upr
bajo-alto -2.322222 -3.3752471 -1.26919735
medio-alto -1.066667 -2.0656538 -0.06767956
medio-bajo 1.255556 0.3745317 2.13657937
#O BIEN AS: #O BIEN AS: #O BIEN AS: #O BIEN AS:
TukeyHSD(analys.var,ordered=T,conf.level = 0.95)
TukeyHSD(analys.var,ordered=T)
Tukey multiple comparisons of means
95% family-wise confidence level
factor levels have been ordered
Fit: aov(formula = mprod ~ ID, data = diseno)
$ID
diff lwr upr
medio-bajo 1.255556 0.37453174 2.136579
alto-bajo 2.322222 1.26919735 3.375247
alto-medio 1.066667 0.06767956 2.065654
nf<-layout(rbind(c(0,1,1,0),c(0,2,2,0)))
#OBTEBIENDO GRFICOS DE INTERVALOS DE TUKEY: #OBTEBIENDO GRFICOS DE INTERVALOS DE TUKEY: #OBTEBIENDO GRFICOS DE INTERVALOS DE TUKEY: #OBTEBIENDO GRFICOS DE INTERVALOS DE TUKEY:
plot(TukeyHSD(analys.var,ordered=T,conf.level = 0.95))
plot(TukeyHSD(analys.var,conf.level = 0.95))
Bibliografa
KUELH, R.O. (2001). Diseo de Experimentos. Thomson Learning.
MONTGOMERY, D. C. (2001) Design and analysis of experiments. 5
th
Edition. John Wiley & Sons.
NETER, N. et. Al. (1996) Applied Linear Statistical Models. Irwin.