Вы находитесь на странице: 1из 10

con

Ejemplo test de carencia de ajuste y regresi on


transformaciones

En los siguientes conjuntos de datos se desea dar respuesta a las siguientes cuestiones
1. Indique que informacion
nos proporciona el analisis

del grafico

de Y vs. X acerca de:


a) El tipo de relacion
funcional entre Y vs. X (lineal o no lineal?)
b) El comportamiento de la varianza de Y en cada nivel de X observado Es constante
o no? Si no es constante, como

cambia?
2. Ajuste el modelo de regresion
lineal simple y determine lo siguiente,
a) Interprete los valores ajustados de los parametros.

b) Realice la prueba de significancia de la regresion


(mediante la tabla ANOVA).
c) Realice los test de significancia de cada parametros

(pruebas t).
3. Calcule los residuales estudentizados y responda lo siguiente:
a) De acuerdo a los graficos

de residuales, determine si el supuesto de varianza constante para los respectivos errores se cumple o no.
b) Ahora realice los test de normalidad sobre los errores del modelo, use e interprete
los resultados del test de Shapiro Wilk y el grafico

de probabilidad sobre residuales


estudentizados.
4. Considere de nuevo los graficos

de residuales vs. X, calcule la ANOVA para el test de


carencia de ajuste del modelo y determine si,
a) Hay carencia de ajuste del modelo postulado para la respectiva respuesta media?
(Formule completamente el test de hipotesis,

el estadstico de prueba y los resultados)


b) Caso que exista carencia de ajuste Que modelos seran mas
apropiados? Por que?

1. Ejemplo 1
Se realizo un experimento sobre el efecto del numero

de das de capacitacion
recibida (X)
sobre el desempeno
de los vendedores (Y ) en una serie de situaciones de venta simuladas (Neter et al.,2004). Los datos recolectados sobre 10 vendedores asignados aleatoriamente entre 5
niveles de tratamientos (valores distintos del tiempo de capacitacion),

se ilustran en la Tabla
1. Los ajustes del modelo de RLS aparecen en la Tabla 2 y su ANOVA en la Tabla 3. Ver en
Figura 1 los datos junto con recta ajustada y medias de tratamiento.

Datos experimento capacitacion


vendedores
Obs.
No.dias
Desempeno

1
0.50
42.50
2
0.50
50.60
3
1.00
68.50
4
1.00
80.70
5
1.50
89.00
6
1.50
99.60
7
2.00
105.30
8
2.00
111.80
9
2.50
112.30
10
2.50
125.70

Observaciones
media tratamiento

80
40

60

desempeo

100

120

Tabla 1:

0.5

1.0

1.5

2.0

2.5

No.dias

Figura 1: Datos problema capacitacion


vendedores. Recta ajustada en rojo

vendedores
Tabla 2: Modelos ajustado experimento capacitacion
Parametro

Estimacion

Error estandar

T0
Pr(|t8 | > |T0 |)
0
34.9450
5.9477
5.88
0.0004
35.7700
3.5866
9.97
0.0000
1

MSE = 8.02, R2 = 0.9256, F0 = 99.46, P (f1,8 > F0 ) = 8.66 1006

Tabla 3:
Fuente
No.dias
Error

ANOVA MRLS, experimento capacitacion


vendedores
Df
Sum Sq
Mean Sq
F0
Pr(f1,8 > F0 )
1
6397.46
6397.46
99.46
0.0000
8
514.56
64.32

1
0
1
2

Residuos estudentizados

En la Figura 2 se presentan las graficas

de residuales estudentizados y en la Figura 3 el


grafico

de probabilidad normal usando tambien residuales estudentizados.

50

60

70

80

90

100

110

120

1
0
1
2

Residuos estudentizados

desempeo ajustado

0.5

1.0

1.5

2.0

2.5

No. das

Figura 2: Residuales estudentizados, problema capacitacion


vendedores.

Normal QQ Plot

0
2

Sample Quantiles

statistic
0.933870468059182
p.value
0.487022457826849
method
ShapiroWilk normality test
data.name
rstudent(mod1)

1.5

1.0

0.5

0.0

0.5

1.0

1.5

Theoretical Quantiles

Figura 3: QQplot residuales estudentizados, problema capacitacion


vendedores.

Para el test de carencia de ajuste, se ajusta inicialmente el modelos lineal general Yij =
i + Eij . La ANOVA de este modelo se muestra en la Tabla 4. La ANOVA para el test de
carencia de ajuste se muestra en la Tabla 5.
Tabla 4:

ANOVA ML general, experimento capacitacion


vendedores
Fuente
Df
Sum Sq
Mean Sq
F0
Pr(f4,5 > F0 )
No. dias
4
6637.71
1659.43
30.25
0.0011
Error Puro
5
274.31
54.86

Tabla 5:

ANOVA Test de carencia de ajuste, experimento capacitacion


vendedores
Res.Df
RSS
Df
Sum of Sq
FLOF
Pr(f3,5 > FLOF )
carencia
Error(RLS)
8
514.56
Error(puro)
5
274.31
3
240.25
1.46
0.3313
Fuente


Codigo
R 1.1.
ejemplo1=data.frame(matrix(scan(),ncol=2,byrow=T))
0.5 42.5
0.5 50.6
1.0 68.5
1.0 80.7
1.5 89.0
1.5 99.6
2.0 105.3
2.0 111.8
2.5 112.3
2.5 125.7
names(ejemplo1)=c("No.dias","desempe
no")
attach(ejemplo1)
mod1=lm(desempe
noNo.dias)
summary(mod1)
anova(mod1)
mediasy.i=sapply(split(desempe
no,as.factor(No.dias)),mean) #medias de Y en cada tratamiento
#Gr
afica datos con recta ajustada e indicaci
on de medias observadas
#en cada nivel de tratamiento
plot(No.dias,desempe
no,cex=2)
abline(mod1,lwd=2,col=2)
lines(c(0.5,1,1.5,2,2.5),mediasy.i,lty=2,col=4)
points(c(0.5,1,1.5,2,2.5),mediasy.i,pch=3,col=4)
legend("topleft",legend=c("Observaciones","media tratamiento"),col=c(1,4),pch=c(1,3))
#Gr
afica de residuos estudentizados
layout(rbind(c(0,1,1,0),c(0,2,2,0)))
plot(fitted(mod1),rstudent(mod1),ylab="Residuos estudentizados",xlab="desempe
no ajustado",cex=2,ylim=c(-2.5,2.5))
abline(h=c(-2,0,2),col=2)
plot(No.dias,rstudent(mod1),ylab="Residuos estudentizados",xlab="No. d
as",cex=2,ylim=c(-2.5,2.5))
abline(h=c(-2,0,2),col=2)
test1=shapiro.test(rstudent(mod1)) #Test de normalidad sobre residuales estudentizados
#Gr
afico de normalidad con informaci
on del test Shapiro
qqnorm(rstudent(mod1),cex=1.5)
qqline(rstudent(mod1),lty=2,lwd=2,col=2)
legend("topleft",legend=rbind(names(test1),test1),cex=0.8)
mod.aux=lm(desempe
noas.factor(No.dias))#ajuste modelo lineal general
anova(mod.aux)
#test de carencia de ajuste
anova(mod1,mod.aux)
detach(ejemplo1)

2. Ejemplo 2
Los siguientes datos se recolectaron con el fin de determinar la relacion
existente entre el
peso corporal del ganado vacuno (X) y la rapidez de eliminacion
metabolica/peso

corporal (Y ).
Los datos que aparecen en la Tabla 6 son el resultado de varias realizaciones del experimento,
en distintos niveles del peso. Observe que la variable explicatoria fue observada en cuatro
niveles: 110, 230, 360 y 505, es decir, tenemos replicas de la variable respuesta en al menos
un nivel de X.
Los ajustes del modelo de RLS aparecen en la Tabla 7 y su ANOVA en la Tabla 8. En la
Figura 4 se muestran los datos, la recta ajustada y las medias por nivel de tratamiento.

Tabla 6:

240

Datos experimento ganado vacuno


Peso
Rapidez
Obs.
corporal
elimin. metab.
1
110.00
235.00
2
110.00
198.00
3
110.00
173.00
4
230.00
174.00
5
230.00
149.00
6
230.00
124.00
7
360.00
115.00
8
360.00
130.00
9
360.00
102.00
10
360.00
95.00
11
505.00
122.00
12
505.00
112.00
13
505.00
98.00
14
505.00
96.00

160
100

120

140

rapid.elim

180

200

220

Observaciones
media tratamiento

100

200

300

400

500

peso.corp

Figura 4: Datos problema ganado vacuno. Recta ajustada en rojo

Tabla 7: Modelos ajustado experimento ganado vacuno


Parametro

Estimacion

Error estandar

T0
Pr(|t12 | > |T0 |)
0
212.7209
15.7841
13.48
0.0000
-0.2355
0.0449
-5.25
0.0002
1

MSE = 24.56, R2 = 0.6967, F0 = 27.57, P (f1,12 > F0 ) = 0.0002043

Tabla 8:
Fuente
peso.corp
Error

Df
1
12

ANOVA MRLS, experimento ganado vacuno


Sum Sq
Mean Sq
F0
Pr(f1,12 > F0 )
16634.20
16634.20
27.57
0.0002
7241.01
603.42

1
0
1
3

Residuos estudentizados

En la Figura 5 se presentan las graficas

de residuales estudentizados y en la Figura 6 el


grafico

de probabilidad normal usando tambien residuales estudentizados.

100

120

140

160

180

1
0
1
3

Residuos estudentizados

rapidez de eliminacin ajustada

100

200

300

400

500

Peso corporal

Figura 5: Residuales estudentizados, problema ganado vacuno

Normal QQ Plot

1
0
1

Sample Quantiles

statistic
0.952640455984604
p.value
0.602401838080914
method
ShapiroWilk normality test
data.name
rstudent(mod2)

Theoretical Quantiles

Figura 6: QQplot residuales estudentizados, problema ganado vacuno.

Para el test de carencia de ajuste, se ajusta inicialmente el modelos lineal general Yij =
i + Eij . La ANOVA de este modelo se muestra en la Tabla 9. La ANOVA para el test de
carencia de ajuste se muestra en la Tabla 10.
Tabla 9:
Fuente
peso corp
Error(puro)

ANOVA ML general, problema ganado vacuno


Df
Sum Sq
Mean Sq
F0
Pr(f3,10 > F0 )
3
19514.21
6504.74
14.92
0.0005
10
4361.00
436.10

Tabla 10:
Fuente
Error(RLS)
Error(puro)

ANOVA Test de carencia de ajuste, problema ganado vacuno


Res.Df
RSS
Df
Sum of Sq
FLOF
Pr(f2,10 > FLOF )
carencia
12
7241.01
10
4361.00
2
2880.01
3.30
0.0792

Codigo
R 2.1.
ejemplo2=data.frame(matrix(scan(),ncol=2,byrow=T))
110 235
110 198
110 173
230 174
230 149
230 124
360 115
360 130
360 102

360
505
505
505
505

95
122
112
98
96

names(ejemplo2)=c("peso.corp","rapid.elim")
attach(ejemplo2)
mod2=lm(rapid.elimpeso.corp)
summary(mod2)
anova(mod2)
#C
alculo de medias por tratamiento
medias2y.i=sapply(split(rapid.elim,as.factor(peso.corp)),mean) #medias de Y en cada tratamiento
#Graficando los datos, recta ajustada y se
nalando las medias de tratamiento
plot(peso.corp,rapid.elim,cex=2)
abline(mod2,lwd=2,col=2)
lines(c(110,230,360,505),medias2y.i,lty=2,col=4)
points(c(110,230,360,505),medias2y.i,pch=3,col=4)
legend("topright",legend=c("Observaciones","media tratamiento"),col=c(1,4),pch=c(1,3))
#Gr
aficos de residuales estudentizados
layout(rbind(c(0,1,1,0),c(0,2,2,0)))
plot(fitted(mod2),rstudent(mod2),ylab="Residuos estudentizados",xlab="rapidez de eliminaci
on ajustada",cex=2,ylim=c(-3,3))
abline(h=c(-2,0,2),col=2)
plot(peso.corp,rstudent(mod2),ylab="Residuos estudentizados",xlab="Peso corporal",cex=2,ylim=c(-3,3))
abline(h=c(-2,0,2),col=2)
test2=shapiro.test(rstudent(mod2)) #Test de normalidad sobre residuales estudentizados
#Gr
afico de normalidad con informaci
on del test Shapiro
qqnorm(rstudent(mod2),cex=1.5)
qqline(rstudent(mod2),lty=2,lwd=2,col=2)
legend("topleft",legend=rbind(names(test2),test2),cex=0.8)
mod2.aux=lm(rapid.elimas.factor(peso.corp))#ajuste modelo lineal general
anova(mod2.aux)
#test de carencia de ajuste
anova(mod2,mod2.aux)
detach(ejemplo2)

2.1. Algunos modelos con transformaci


on en este ejemplo
Se propone probar los siguientes modelos con el fin de determinar una transformacion

apropiada, bien sea sobre la respuesta y/o el predictor que corrija la no linealidad al mismo
tiempo que la varianza no constante. Estos modelos son:
i.i.d

Modelo 2: log(Yi ) = 0 + 1 Xi + i , i N (0, 2 )


i.i.d

Modelo 3: log(Yi ) = 0 + 1 log(Xi ) + i , i N (0, 2 )


Modelo 4: Yi = 0 + 1 log(Xi ) + i , i N (0, 2 )
i.i.d

i.i.d

Modelo 5: log(Yi ) = 0 + 1 (1/Xi ) + i , i N (0, 2 )


i.i.d

Modelo 6: Yi = 0 + 1 (1/Xi ) + i , i N (0, 2 )


1. Mediante R ajuste estos cinco modelos
2. Analice los residuales de cada uno de los modelos y realice la prueba de carencia de
ajuste de cada uno de ellos.
3. Con base en el analisis

de residuales y la prueba de carencia de ajuste seleccione el


mejor modelo y resuelva las preguntas siguientes:

a) Se desea calcular la rapidez de eliminacion


metabolica

de un animal de 300 kg.,


encuentre dicha prediccion
y su respectivo intervalo e interprete.
b) Estime la rapidez promedio para un animal de 300 kg, y encuentre un IC del 95 %
de Confianza para dicha estimacion.

NOTA: Tenga presente que para el punto 3. debe primero producir las estimaciones y predicciones en la escala del respectivo modelo y luego destranformar estos resultados, caso que la
variable respuesta en el mejor modelo haya sido transformada.

10