You are on page 1of 10

ESTADISTICA ------- REGRESION LINEAL SIMPLE

1

EJERCICIOS - REGRESIN LINEAL SIMPLE
1. En una muestra de 10 adultos se registraron las siguientes mediciones de edad
en aos (X) y la hipertensin arterial (HTA) (Y):

X 38 42 43 46 48 50 54 60 65 67
Y 120 124 135 138 135 140 143 150 160 170

a. Indique la tendencia y obtenga la lnea recta de regresin de la HTA en funcin de
la edad. Qu opina Ud. del nivel de correlacin entre las dos variables?
b. Compruebe la idoneidad del modelo lineal de regresin. Si el modelo es apropiado
pronostique la HTA de un adulto de 70 aos.
c. De seguir la tendencia, cunto se espera aumente la HTA para el prximo ao.

























a. Indique la tendencia y obtenga la lnea recta de regresin de la HTA en
funcin de la edad. Qu opina Ud. del nivel de correlacin entre las dos
variables?


Y=A+BX
B = 1.4869
A = 65.2214

Y=65.2214+1.4869X

PERSONAS EDAD(X) HTA(Y) XY XX YY
1 38 120 4560 1444 14400
2 42 124 5208 1764 15376
3 43 135 5805 1849 18225
4 46 138 6348 2116 19044
5 48 135 6480 2304 18225
6 50 140 7000 2500 19600
7 54 143 7722 2916 20449
8 60 150 9000 3600 22500
9 65 160 10400 4225 25600
10 67 170 11390 4489 28900
513 1415 73913 27207 202319

N = 10
MEDIA DE
X = 51.3
MEDIA DE
Y = 141.5
ESTADISTICA ------- REGRESION LINEAL SIMPLE
2






b. Compruebe la idoneidad del modelo lineal de regresin. Si el modelo es
apropiado pronostique la HTA de un adulto de 70 aos.


COEFICIENTE DE
COREELACION DE
PIRSON r=

0.9689

COEFIECIENTE COVARIANZA =

1323.5
r es positiva, indica que tiene una tendencia lineal positiva, a
mayor X, mayor Y
r = 0.9689 0.60, POR LO TANTO LA RECTA DE REGRESION
ES CONFIABLEPARA PREDICIR


SI X=70, ENTONCES
Y= 169.305247

% VARIANZA TOTAL = 100%
% EXPLICADA POR LA
RR= 94%
%VAR NO
EXPLICADA= 6%


c. de seguir la tendencia, cunto se espera aumente la hta para el prximo ao.


la variacin del siguiente ao es =1.5



y = 1.4869x + 65.221
R = 0.9387
0
20
40
60
80
100
120
140
160
180
0 10 20 30 40 50 60 70 80
Chart Title
Series1
Linear (Series1)
Linear (Series1)
ESTADISTICA ------- REGRESION LINEAL SIMPLE
3

2. Un estudio de mercado trata de averiguar si es efectiva la propaganda televisada
de un producto que sali a la venta con relacin al tiempo de publicidad
(horas/semana). Se recopilaron datos a partir de la segunda semana de iniciada
la publicidad resultando la tabla siguiente. No se pudo recopilar datos de la
cuarta semana.

Semana 2 3 4 5 6 7
Tiempo de propaganda 20 25 22 28 36 40
Venta del producto S/. 300 310 - 320 350 420



Semana Tiempo de Venta XX YY XY

Propaganada
(X)
del producto
(Y)
2 20 300 400 90000 6000
3 25 310 625 96100 7750
4 22 297 484 88209 6534
5 28 320 784 102400 8960
6 36 350 1296 122500 12600
7 40 420 1600 176400 16800
Total 171 1997 5189 675609 58644


n=6
Media X =28.5
Media Y =332.8

y = a + bx

b=5.5

a=176.6

a. Es efectiva la publicidad del producto

Y = 176.6 +5.5X


COEFICIENTE DE CORRELACION DE PIRSON r= 0.9309
COEFIECIENTE COVARIANZA = 1729.5

r es positiva, indica que tiene una tendencia lineal positiva, a mayor X, mayor Y


r = 0.9309 0.60, por lo tanto la recta de regresion es confiable para predicir



b. En cuanto estimara las ventas para la semana 4?

Reemplazando datos ala ecuacin 1 del cuadro anterior.
ESTADISTICA ------- REGRESION LINEAL SIMPLE
4

hallamos la venta para la semana cuarta utilizando la formula siguiente:
Media = Y Media= X

(Y)= y
(X)= x


y - Y = b (x-X).. 1

Reemplazando datos ala ecuacin 1 del cuadro anterior.

m -(1700+)/6= b (22-28.5)


Ahora calculamos la b.

= (6(52110+22) 171 (1700+))/ (6(5189) (171) ^2))
= (219603)/1893
(61700)/6=(2196039)/1893(6.5)

(61700)/2=(2196039)/631(6.5)

3155m-631*1700 = (2(21960)-78m) (-6.5m)


3155m-631*(1700) = -285480+507m

2648m = 787220

m = 297.3 = 297.






3. Un editor tom una muestra de 7 libros, anotando el precio y el nmero de pginas
respectivo, si los resultados:

Nro. de Pago. 630 550 400 250 370 320 610
Precio S/. 10 8 7 4 6 6 9


a. Obtenga el modelo de regresin lineal simple entre el precio y el nmero de
pginas, con el fin de predecir precios. Qu porcentaje de la varianza total de
precios se explica por esta funcin?.
b. Estime el precio de un libro de 300 pginas. Si a este libro se le incrementa 20
pginas en una segunda edicin. En cuento se incrementara su precio.
c. Cuntas pginas debera tener un libro cuyo precio se estima en 12.27 soles.




N DE N de Pagina Precio S/. (Y) XX YY XY
ESTADISTICA ------- REGRESION LINEAL SIMPLE
5









a. Obtenga el modelo de regresin lineal simple entre el precio y el nmero de
pginas, con el

Fin de predecir precio. Qu porcentaje de la varianza total de precios se explica por
esta funcin?

Y = 1.216+0.01326X

b. Estima el precio de un libro de 300 pginas. Si a este libro se le incrementa 20
paginas en una segunda edicin. En cuanto se incrementara su precio.



COEFICIENTE DE CORRELACION DE PIRSON r= 0.9723
COEFIECIENTE COVARIANZA =1772.857143


r es positiva, indica que tiene una tendencia lineal positiva, a mayor X, mayor Y

y = 0.0133x + 1.2157
R = 0.9454
0
2
4
6
8
10
12
0 100 200 300 400 500 600 700
PRECIO
LIBROS (X)
1 630 10 396900 100 6300
2 550 8 302500 64 4400
3 400 7 160000 49 2800
4 250 4 62500 16 1000
5 370 6 136900 36 2220
6 320 6 102400 36 1920
7 610 9 372100 81 5490
Total 3130 50 1533300 382 24130
ESTADISTICA ------- REGRESION LINEAL SIMPLE
6


r = 0.9723 0.60, por lo tanto la recta de regresion es confiablepara predicir

SI X=300, ENTONCES Y= 5.19


Si incrementa en 20 paginas entonces seria 320 hojas, entonces x=320

y= 5.46
y ahora la diferencia es = 0.27
RPTA.

% VARIANZA TOTAL = 100%
% EXPLICADA POR LA RR =95%
%VAR NO EXPLICADA= 5%

c. Cuntas pginas debera tener un libro cuyo precio se estima en 12.27 soles.


SI Y = 12.27, ENTONCES X= 833.93

4. Una muestra de 5 varones adultos de quienes se observaron las estaturas (X en
pies, pulgadas) y los pesos (Y en libras) ha dado los siguientes resultados:


X 51 52 53 54 55
Y 125 130 140 145 160



a. Realice una regresin lineal y utilice los datos para verificar que la varianza total de
Y es igual a la varianza residual ms la varianza explicada por la recta de
regresin.
b. Usando la descomposicin de la varianza calcule r
2
e interprete el resultado.


Varones Publicidad (X) Ventanas (Y) XX YY XY
1 0.039 125 0.001521 15625 4.875
2 0.077 130 0.005929 16900 10.01
3 0.116 140 0.013456 19600 16.24
4 0.154 145 0.023716 21025 22.33
5 0.193 160 0.037249 25600 30.88
Total 0.579 700 0.081871 98750 84.335


Publicidad (X)
51= 0.0385
52= 0.077
53=0.1155
54=0.154
55= 0.1925
ESTADISTICA ------- REGRESION LINEAL SIMPLE
7

0.579

1pies*pulg = 7.7*(10*-3)

n=5
Media X =0.12
Media Y =140.0

y = a + bx

b= 220.94

a=114.41

a. Realice una regresin lineal y utilice los datos para verificar que la varianza
total de Y es igual a la varianza residual ms la varianza explicada por la
recta de regresin.

Y = 114.41+ 220.94 X




b. Usando la descomposicin de la varianza calcule r
2
e interprete el resultado.


COEFICIENTE DE CORRELACION DE PIRSON r= 0.982235323

COEFIECIENTE COVARIANZA =3.275


r es positiva, indica que tiene una tendencia lineal positiva, a mayor X, mayor Y


r = 0.98224 0.60, POR LO TANTO LA RECTA DE REGRESION ES
CONFIABLEPARA PREDICIR


r
2 =
0.9648
R = 0.5332
y = 220.94x - 114.41
0
20000
40000
60000
80000
100000
120000
0 1 2 3 4 5 6 7
PESO
Ventanas (Y) XX YY
XY Linear (YY) Linear (YY)
ESTADISTICA ------- REGRESION LINEAL SIMPLE
8


5. Una compaa de alimentos maneja una cadena de tiendas al menudeo. Para
medir la eficiencia de las tiendas se estudi la relacin del nmero de
empleados (X) y el promedio del volumen de ventas mensuales (Y) en cientos de
dlares para todas las tiendas durante el ao pasado. La grfica de los datos
sugiere una relacin lineal entre las variables. Se tiene la siguiente informacin:

n=100, X=600, Y=1600, XY=13600, X
2
=5200, Y
2
=37700

a. Obtenga el modelo de regresin lineal simple para predecir las ventas a partir del
nmero de empleados. En cunto se estiman las ventas para una tienda de 8
empleados?
b. Qu porcentaje de las varianzas de las ventas es explicada por la variabilidad
del nmero de empleados?
c. Cuntos empleados tiene la tienda cuya venta promedio se estima en 1100
dlares.

EMPLEADOS
N.
EMPL.(X)
P. VENT.
(Y)
XY XX YY
600 1600.00 13600 5200 37700

N = 100
MEDIA DE X =6.000
MEDIA DE Y =16.000

Y=A+BX

B =2.50
A =1.00

Y=2.50X-1.00

Covarianza COVxy=4000
coef. Correlacin de Pearson r =0.9091
copef. De determinacin r*r = 0.8264
r es positiva, indica que tiene un a tendencia lineal positiva, a mayor X, mayor Y


y = 155.31x - 184.68
R = 0.9813
0.00
10.00
20.00
30.00
40.00
50.00
60.00
70.00
80.00
1.54 1.56 1.58 1.6 1.62 1.64 1.66
VENTAS
ESTADISTICA ------- REGRESION LINEAL SIMPLE
9

r=0.9723>0.60, por lo tanto la recta de regresion es confiable para predecir.


a. Obtenga el modelo de regresin lineal simple para predecir las ventas a
partir del nmero de empleados. En cunto se estiman las ventas para una
tienda de 8 empleados?


si, X=8, entonces
Y=21.000
el precio incremento se le aumenta 20pag mas si, X=320, entonces
Y= 801.000


b. Qu porcentaje de las varianzas de las ventas es explicada por la
variabilidad del nmero de empleados?

% varianza total= 100%
% var. Explicada por la RR= 82.6%
% var. No explicada= 17.4%

c. Cuntos empleados tiene la tienda cuya venta promedio se estima en 1100
dlares.

El nmero de empleados que tiene la tienda, si su venta promedio es 1100 dlares es:
440.4




6. Sea Y el ndice de precios al consumidor, tomando como base al ao 2000 (es
decir 2000=100). Para los datos que siguen:

Ao 2001 2002 2003 2004 2005 2006 2007
Y 106.0 111.1 117.2 121.3 125.2 128.0 132.6

a. Obtenga la recta de mnimos cuadrados que se ajuste a los datos.
b. Realice la prediccin del ndice de precios para el ao 2008, y compararlo con el
valor verdadero (144.4). En qu ao podemos esperar que el ndice de precios
sea 150.57, suponiendo que las tendencias presentes continen?.

N AO(X)
IND.
CONS.(Y)
XY XX YY
1 2001 106.0 212106 4004001 11236
2 2002 111.1 222422.2 4008004 12343.21
3 2003 117.2 234751.6 4012009 13735.84
4 2004 121.3 243085.2 4016016 14713.69
5 2005 125.2 251026 4020025 15675.04
6 2006 128.0 256768 4024036 16384
7 2007 132.6 266128.2 4028049 17582.76
14028 841.4 1686287.2 28112140 101670.54
ESTADISTICA ------- REGRESION LINEAL SIMPLE
10


N = 7
MEDIA DE X =2004.000
MEDIA DE Y =120.200
Y=A+BX
B =4.3429
A =-8582.9
Y=4.33429X-8582.9
covarianza COVxy=121.6
coef. Correlacin de Pearson r = 0.9942
copef. De determinacin r*r = 0.9885
r es positiva, indica que tiene un a tendencia lineal positiva, a mayor X, mayor Y

r=0.6337>0.60, por lo tanto la recta de regresin es confiable para predecir.
si, Y=150.57, entonces X=2011
% varianza total =100%
% var. Explicada por la RR =98.8%
% var. No explicada =1.2%

y = 4.3429x - 8582.9
R = 0.9885
0.0
20.0
40.0
60.0
80.0
100.0
120.0
140.0
2000 2001 2002 2003 2004 2005 2006 2007 2008
INDICE DE PRECIOS