Вы находитесь на странице: 1из 4

PROBLEMA 5: Ejercicio de Regresin Lineal Simple.

Sea X el volumen de lluvia (m3) y Y el volumen de escurrimiento (m3) en determinado lugar.


(Devore, 6a. Edicin. Pg. 517, problema 16)
Var Indep.
No. Observ.
X
1
5
2
12
3
14
4
17
5
23
6
30
7
40
8
47
9
55
10
67
11
72
12
81
13
96
14
112
15
127

Var. Dep. o regresiva


Y
4
10
13
15
15
25
27
46
38
46
53
70
82
99
100

15
798
53.2
38.346540168
1470.4571429
Sxx
20586.4
0.9875570321
Coef. de correlacin, r=
Coef. de determinacin, R2= 0.9752688917
Bo=Y-B1*X
-1.128304771
B1=Sxy/Sxx
0.8269731473
SSE=Syy-B1*Sxy
357.01168409
MSE=SSE/(n-2)
27.462437238

X2
25
144
196
289
529
900
1600
2209
3025
4489
5184
6561
9216
12544
16129

Y2
16
100
169
225
225
625
729
2116
1444
2116
2809
4900
6724
9801
10000

XY
20
120
182
255
345
750
1080
2162
2090
3082
3816
5670
7872
11088
12700

63040

41999

51232

Suma(Y2)
63040

Suma(X2)
41999

Sxy
17024.4

yiestimada
3.0065609658
8.7953729971
10.4493192917
12.9302387337
17.8920776176
23.6808896488
31.950621122
37.7394331533
44.3552183318
54.2788960997
58.4137618363
65.8565201622
78.261117372
91.4926877291
103.897284939

ei
0.9934390342
1.2046270029
2.5506807083
2.0697612663
-2.8920776176
1.3191103512
-4.950621122
8.2605668467
-6.3552183318
-8.2788960997
-5.4137618363
4.1434798378
3.738882628
7.5073122709
-3.8972849389

Bandas de confianza
LIC
LSC
-1.79026099 7.80338293
4.42350582 13.1672402
6.19349156 14.705147
8.84321888 17.0172586
14.1207035 21.6634517
20.2318382 27.129941
28.8474511 35.0537911
34.7756243 40.703242
41.4286154 47.2818213
51.1595169 57.3982753
55.1357477 61.691776
62.2018529 69.5111874
73.7945743 82.7276605
86.008974 96.9764014
97.3815516 110.413018

Bandas de prediccin
LIP
LSP
-9.28904753 15.3021695
-3.34075942 20.9315054
-1.64549601 22.5441346
0.89378499 24.9666925
5.95910857 29.8250467
11.8458382 35.5159411
20.211705 43.6895372
26.0365852 49.4422811
32.6617376 56.0486991
42.5356847 66.0221075
46.6274196 70.2001041
53.9599206 77.7531197
66.0905589 90.4316759
78.9131963 104.072179
90.8348476 116.959722

n=

Sumas
Promedio
Desv.Est. insesgada
Varianza insesgada
Sumas de cuadrados

643
42.8666666667
32.1111166035
1031.1238095238
Syy
14435.7333333333

-3.19744E-014

Intervalo de confianza para el promedio de y dado x:


Si xo se fija en:
50
La estimacin puntual para la respuesta media de yo es:
40.220353
El error estndar estimado de la respuesta media es:
1.3581198
El intervalo de confianza de (1-)100% es:

<- 97.53% de la variacin de Y est explicada por el modelo de regresin


<- Ordenada al origen
<- Pendiente
<- Suma de cuadrados de los errores
<- Cuadrados medios de los errores

Si 1=0, =0, entonces la variacin de X no explica la variacin de Y o no hay regresin lineal entre X y Y
Si = 0.05

/2=

T=

1
1

43.154392

2.1603686565

El estadstico de prueba tiene distribucin T-Student con n-2 grados de libertad.

H 0 : 1=0
H 1 : 1 0

0.025

| t0 |>t/2

La regin de rechazo es:


Prueba de Hiptesis sobre 1:

37.286313

MS E

Intervalo de prediccin para y dado x


Si xo se fija en:
50
La prediccin para la respuesta yo es:

= 22.6418585332

40.220353
El error estndar estimado de la prediccin:

Por lo tanto: Se rechaza Ho

S xx

5.4135872
Un intervalo de prediccin para yo es:
28.525008
a
51.915697

Prueba de Hiptesis sobre el coeficiente de correlacin poblacional


El estadstico de prueba tiene distribucin T-Student con n-2 grados de libertad.

H 0 : =0
H 1 : 0

T=

r n2
1r2

= 22.6418585332
Por lo tanto: Se rechaza Ho

140

Grfica de residuos

10

Diagrama de dispersin

120

f(x) = 0.8269731473x - 1.1283047708


R = 0.9752688917

100

ei
Linear (ei)

4
80

ei

60

0
-2

40
Y
Linea
r (Y)
LIC
LSC
LIP
LSP

20

0
0

-20

f(x) = - 3.76059267322827E-016x + 1.78277495438668E-014


R = 1.11022302462516E-016

20

40

60

-4
-6
80

100

120

140

-8
-10

20

40

60

80

100

120

140

Var Indep.
X
1
2
3
4
5
6

n=

Var. Dep. o regresiva


Y
2.8
4.8
8.2
12
15.2
18.1

X2
1
4
9
16
25
36

Y2
7.84
23.04
67.24
144
231.04
327.61

XY
2.8
9.6
24.6
48
76
108.6

91

800.77

269.6

yiestimada
2.219047619
5.4047619048
8.5904761905
11.7761904762
14.9619047619
18.1476190476

ei
0.580952381
-0.6047619048
-0.3904761905
0.2238095238
0.2380952381
-0.0476190476

Bandas de confianza
LIC
LSC
1.2321869 3.20590834
4.66386912 6.14565469
8.01044504 9.17050734
11.1961593 12.3562216
14.221012 15.7027975
17.1607583 19.1344798

Bandas de prediccin
LIP
LSP
0.53585232 3.90224292
3.85293251 6.9565913
7.10869062 10.0722618
10.2944049 13.257976
13.4100754 16.5137342
16.4644237 19.8308144

Diagrama de dispersin
25
20

Sumas
Promedio

21
3.5

61.1
10.1833333333

Desv.Est. insesgada
Varianza insesgada

1.8708286934
3.5

5.9760912532
35.7136666667

Sumas de cuadrados

Sxx
17.5

Syy
178.5683333333

-1.33227E-015

No. Observ.
1
2
3
4
5
6

f(x) = 3.1857142857x - 0.9666666667


R = 0.9945972397

15
10
5

Sxy
55.75

4
X

Coef. De Correlacin, r= 0.9972949612


Intervalo de confianza para la respuesta media esperada dado x
Coef. De Determinacin,
0.9945972397 <- 99.46% de la variacin de Y est explicada por el modelo de regresin
R2=
Bo=Y-B1*X
B1=Sxy/Sxx

-0.966666667 <- Ordenada al origen


3.1857142857 <- Pendiente

SSE=Syy-B1*Sxy

0.9647619048 <- Suma de cuadrados de los errores

MSE=SSE/(n-2)

0.2411904762 <- Cuadrados medios de los errores

Un intervalo de confianza para la calificacin esperada es:


9.6266688
a
10.739998
Error estndar estimado de la respuesta media:

Si 1=0, =0, entonces la variacin de X no explica la variacin de Y o no hay regresin lineal entre X y Y
Si = 0.05

/2=
La regin de rechazo es:

Intervalo de prediccin para y dado x

2.7764451052
Un intervalo de prediccin para yo es:

Prueba de Hiptesis sobre 1:

H 0 : 1=0
H 1 : 10

El estadstico de prueba tiene distribucin T-Student con n-2 grados de libertad.

T=

1
1

MS E
S xx

= 27.1359962085
Por lo tanto: Se rechaza Ho

Prueba de Hiptesis sobre el coeficiente de correlacin poblacional


El estadstico de prueba tiene distribucin T-Student con n-2 grados de libertad.

H 0 : =0
H 1 : 0

T=

r n2
1r2

0.2004954

Si xo se fija en:
3.5
horas
La prediccin para la respuesta yo es: 10.183333

0.025

| t0 |>t/2

Si xo se fija en:
3.5
horas
La respuesta media esperada sera de: 10.183333

= 27.1359962085
Por lo tanto: Se rechaza Ho

8.7105374

11.656129

Error estndar estimado de la prediccin:

0.530461

No. hrs. estudio


X
1
2
4
4
7
12

No. Observ.
1
2
3
4
5
6

n=

Calificacin del examen


Y
71
71
74
80
80
86

X2
1
4
16
16
49
144

Y2
5041
5041
5476
6400
6400
7396

XY
71
142
296
320
560
1032

yiestimada
71.45
72.8375
75.6125
75.6125
79.775
86.7125

ei
-0.45
-1.8375
-1.6125
4.3875
0.225
-0.7125

Bandas de confianza
LIC
LSC
67.1647411 75.7352589
69.0983479 76.5766521
72.6169957 78.6080043
72.6169957 78.6080043
76.4808953 83.0691047
80.4657154 92.9592846

Bandas de prediccin
LIP
LSP
63.1768167 79.7231833
64.8335399 80.8414601
67.9277642 83.2972358
67.9277642 83.2972358
71.9690251 87.5809749
77.2729854 96.1520146

100
95
90
85

Sumas
Promedio

30
5

462
77

Desv.Est. insesgada
Varianza insesgada

4
16

6
36

Desv. Est. sesgada


Varianza sesgada

3.6514837167
13.333333333

5.4772255751
30

Sxx
80

Syy
180

Sumas de cuadrados

230

35754

2421

-1.42109E-014

75
70
65
60
Sxy
111

55
50

Coef. De Correlacin, r=

f(x) = 1.3875x + 70.0625


R = 0.855625

80

0.925

Intervalo de confianza para la respuesta media esperada dado x


Coef. De Determinacin,
R2=

0.855625

<- 85.56% de la variacin de Y est explicada por el modelo de regresin

Bo=Y-B1*X
B1=Sxy/Sxx

70.0625
1.3875

<- Ordenada al origen


<- Pendiente

SSE=Syy-B1*Sxy

25.9875

<- Suma de cuadrados de los errores

MSE=SSE/(n-2)

6.496875

<- Cuadrados medios de los errores

/2=
La regin de rechazo es:

0.025

| t0 |>t/2

Intervalo de prediccin para y dado x


Si un alumno estudia
La prediccin para su calificacin es de:

2.7764451052
Un intervalo de prediccin para la calificacin es:

Prueba de Hiptesis sobre 1:

H 0 : 1=0
H 1 : 10

El estadstico de prueba tiene distribucin T-Student con n-2 grados de libertad.

T=

1
1

MS E
S xx

4.8688425427
Por lo tanto: Se rechaza Ho

Prueba de Hiptesis sobre el coeficiente de correlacin poblacional


El estadstico de prueba tiene distribucin T-Student con n-2 grados de libertad.

H 0 : =0
H 1 : 0

T=

r n2
1r2

horas
77

Un intervalo de confianza para la calificacin esperada es:


74.110879
a
79.889121

Si 1=0, =0, entonces la variacin de X no explica la variacin de Y o no hay regresin lineal entre X y Y
Si = 0.05

Si los alumnos estudian en promedio:


La calificacin esperada en promedio sera de:

4.8688425427
Por lo tanto: Se rechaza Ho

69.356104

84.643896

5
77

horas

9 10 11 12 13 14 15

FORMULARIO PARA EL AJUSTE DE LA RECTA DE REGRESIN


POR EL MTODO DE MNIMOS CUADRADOS

Y = 0 + 1 X

Verdadera recta de regresin:

y i= 0 + 1 x i+ i

Modelo lineal simple:

i ~ N (0, )

Los i se suponen errores aleatorios con distribucin normal, media cero y varianza 2;
0 y 1 son constantes desconocidas (parmetros del modelo de regresin)
Ahora, el modelo de regresin lineal simple ajustado (o recta estimada) es:

^y = ^ 0 + ^ 1 x

^ 0 = y ^ 1
x

donde:

Suma de cuadrados de X
2

S xx = ( xi x ) = x
i =1

( )

i=1

S xx

i=1

xi

S xy

Suma de cuadrados de Y
n

^ 1=

S yy = ( y i y ) = y

i=1

i =1

( )
yi

i=1

Suma de productos cruzados de X y Y


n

i=1

i=1

S xy = ( x i
x ) y i = xi y i
Coeficiente de correlacin:

r=

( )( )
i=1

R =r

Suma de cuadrados de los errores:

e i= y i ^y i

El residuo o error en la estimacin se define como:


n

i =1

i =1

SS E = e 2i = ( y i ^y i )2

Cuadrado medios de los errores (o varianza residual):

Tambin:

n 2

SS E =S yy ^ 1 S xy

SS E
=
n2

Estimacin de la respuesta media de yo dado un xo:

^ +
^ x
^ ( Y |x ) =
^Y = y
^ 0 =E

0
0
1 0
0
Bandas de confianza para la recta de regresin:

^y 0 t / 2, n2

xi

Coeficiente de determinacin:

S xx S yy

MS E = i=1

i=1

S xy

( y i ^y i ) 2

yi

[
MS E

x )2
1 ( x o
+
n
S xx

Bandas de prediccin:

^y 0 t / 2, n2 MS E

x )2
1 ( x o
1+ +
n
S xx