Академический Документы
Профессиональный Документы
Культура Документы
9
Definicin
En estadstica la regresin lineal o ajuste lineal
es un mtodo matemtico que modela la
relacin bidimensional entre una variable
dependiente Yi , la o las variables independientes
Xi y un trmino aleatorio .
Este modelo puede ser expresado como:
= + X +
10/01/2015 2
Dispersin
De los pares ordenados (datos).
10/01/2015 3
Modelo
= + X +
Donde:
Y = Es un valor de la variable dependiente.
X = Es un valor de la variable independiente
B0 = Valor de Y en el punto base.
B1 = Pendiente de la recta
= Perturbacin aleatorio.
10/01/2015 4
Regresin Lineal
Recta.
Siempre que los puntos de datos marcados
parezcan seguir una lnea recta, se puede usar el
mtodo de mnimos cuadrados.
Es definida por la siguiente ecuacin:
= +
Donde:
Y = Es un valor de pronstico a una fecha dada
X = Medida por incrementos a partir de un punto base
b0 = Valor de Y en el punto base.
b1 = Pendiente de la recta
10/01/2015 5
160.0
RECTA DE TENDENCIA
140.0
120.0
100.0
80.0
60.0
40.0
20.0
0.0
0 200 400 600 800 1000 1200 1400 1600
10/01/2015 6
1.- RECTA DE REGRESION.
Datos: = + X +
Y X
y1 x1 = +
y2 x2
y3 x3 Donde:
y4 x4
y5 x5 = Es un valor estimado de Y (variable dependiente)
Y = Es un valor observado.
X = Variable independiente.
yi xi b0 = Punto de corte al eje Y por la recta.
b1 = Pendiente de la recta.
yn xn b0 y b1 Coeficientes de regresin.
= Perturbacin.
10/01/2015 7
2.- COEFIEINTES DE REGRESION
CALCULO:
a) METODO. Mnimos Cuadrados Ecuaciones Normales
Sumatorias de EMC.
Ecuaciones de Mnimos Cuadrados
Y
Y nb 0 b1 X 1 X
XY b 0 X b1 X 2 2 XY
X 2
10/01/2015 8
= +
Despejando los bs de las ecuaciones de mnimos
cuadrados se tiene:
(x i2 )(y i ) - (xi )(xi yi )
b0 =
nxi2 - (xi ) 2
n x i y i - ( xi )( yi )
b1 =
nxi2 - (xi ) 2
10/01/2015 9
b) METODO. Uso de las funciones del Excel.
= +
= INTERSECCION.EJE( Y, X )
= PENDIENTE( Y, X )
Donde:
Y: Matriz que contiene los datos de Y.
X: Matriz que contiene los datos de X.
Ejemplo: = INTERSECCION.EJE($E$30:$E$54,$D$30:$D$54)
= PENDIENTE($E$30:$E$54,$D$30:$D$54)
10/01/2015 10
3.- PRONOSTICO:
= +
= PRONOSTICO( x, Y, X )
Donde:
= Pronostico de venta para um x fijo.
Y: Matriz que contiene los datos de Y.
X: Matriz que contiene los datos de X.
10/01/2015 11
Ejemplo:
Yi Xi Xi Yi
Se tiene una muestra de 21 datos como y1 x1 716.0 54.3
y2 x2 792.0 79.9
par ordenados sobre el monto de y3 x3 492.0 57.1
y4 x4 650.0 89.3
inversin en publicidad y el impacto y5
y6
x5
x6
865.0 115
1293.0 126
Calcular: y9
y10
x9
x10
484.0 56.7
1501.0 138.8
y11 x11 326.0 47.9
a) Diagrama de dispersin. y12 x12 202.0 42.5
y13 x13 215.0 39.4
b) Los coeficientes de regresin. y14 x14 609.0 68.9
y15 x15 600.0 60.3
c) La recta de regresin. y16
y17
x16
x17
764.0 87.7
304.0 46.9
10/01/2015 12
Solucin.
a) Diagrama de dispersin.
160
DIAGRAMA DE DISPERSION
140
120
100
80
60
40
20
0
0 200 400 600 800 1000 1200 1400 1600
10/01/2015 13
b) Los coeficientes de regresin por ecuaciones de MC. (1)
X
716.0
792.0
Y YX
54.3 38878.8
79.9 63280.8
X2
512656.0
627264.0
Y n b b X
0 1
XY b X b X
492.0 57.1 28093.2 242064.0 2
650.0 89.3 58045.0 422500.0
0 1
865.0 115.0 99475.0 748225.0
1293.0 126.0 162918.0 1671849.0
790.0 76.5 60435.0 624100.0
1760.4 21 b 0 15228 b1
802.0 81.1 65042.2 643204.0
484.0 56.7 27442.8 234256.0
1501.0 138.8 208338.8 2253001.0
10/01/2015 14
b) Los coeficientes de regresin por formula. (2)
X Y YX X2
716.0
792.0
54.3 38878.8
79.9 63280.8
512656.0
627264.0
= .40 =1312163.6
492.0 57.1 28093.2 242064.0
650.0 89.3 58045.0 422500.0 =1760.4 = .
865.0 115.0 99475.0 748225.0
1293.0 126.0 162918.0 1671849.0
790.0 76.5 60435.0 624100.0
10/01/2015 15
b) Los coeficientes de regresin. (3)
usando funciones del Excel.
Yi Xi Yi Xi
y1
y2
x1
x2
79.9 792.0
57.1 492.0
= INTERSECCION.EJE( Y, X )
y3 x3 89.3 650.0
y4 x4 126.0 1293.0 = PENDIENTE( Y, X )
y5 x5 76.5 790.0
y6 x6 81.1 802.0
y7 x7 56.7 484.0 Donde:
y8 x8 138.8 1501.0
y9 x9 47.9 326.0 Y: Matriz que contiene los datos de Y.
y10 x10 42.5 202.0 X: Matriz que contiene los datos de X.
y11 x11 39.4 215.0
y12 x12 68.9 609.0
y13 x13 87.7 764.0
y14 x14 46.9 304.0 = INTERSECCION.EJE($E$30:$E$54,$D$30:$D$54)
y15 x15 44.2 252.0
y16 x16 84.4 746.0 = PENDIENTE($E$30:$E$54,$D$30:$D$54)
y17 x17 64.1 629.0
y18 x18 115.3 1044.0 bo = 21.5229302
y19 x19 40.7 158.0
y20 x20 49.5 176.0 b1 = 0.08026837
y21 x21 14.7 102.0
10/01/2015 16
c) La recta de regresin.
160.0
RECTA DE REGRESION
140.0
120.0
100.0
80.0
60.0
40.0
y = 21.523 + 0.0803x
20.0
0.0
0 200 400 600 800 1000 1200 1400 1600
= . +0.0803X +
10/01/2015 17
d) Modelo lineal simple.
= + X +
= . +0.0803 X +
10/01/2015 18
e) Pronosticar la venta para una inversin en publicidad
de 950. (1)
= . +0.0803 X
En la ecuacin construida se remplaza a por
X=950 y se obtiene el valor de la venta.
= . +0.0803 (950)
= 97.78
10/01/2015 19
e) Pronosticar la venta para una inversin en publicidad
de 950. (2) usando la funcin del Excel.
Yi Xi Yi Xi
y1 x1 716 54.3
y2 x2 792 79.9
y3
y4
x3
x4
492
650
57.1
89.3
= PRONOSTICO( x, Y, X )
y5 x5 865 115.0
y6 x6 1293 126.0 Donde:
y7 x7 790 76.5
y8 x8 802 81.1
y9 x9 484 56.7 = Pronostico de venta para um x fijo.
y10 x10 1501 138.8
y11 x11 326 47.9 Y: Matriz que contiene los datos de Y.
y12 x12 202 42.5
y13 x13 215 39.4
X: Matriz que contiene los datos de X.
y14 x14 609 68.9
y15 x15 600 60.3
y16
y17
x16
x17
764
304
87.7
46.9
=PRONOSTICO(950, $E$30:$E$54, $D$30:$D$54)
y18 x18 252 44.2
y19 x19 746 84.4
y20
y21
x20
x21
629
1044
64.1
115.3
= 97.78
y22 x22 158 40.7
y23 x23 716 79.2
y24 x24 176 49.5
y25 x25 102 14.7
10/01/2015 20
f) Pronosticar las ventas para cada una de las
inversiones en publicidad. (3) usando la funcin del
Excel.
10/01/2015 21
160.0 PRONOSTICO
140.0
120.0
100.0
80.0
60.0
40.0
20.0
0.0
0 200 400 600 800 1000 1200 1400 1600
Donde:
( X, ) = Valor estimado de Y para un x.
( X, Y ) = Valor real de Y para un x.
( ----- ) = Lnea de tendencia.
10/01/2015 22
Regresin No Lineal
Exponencial.
=
200.0
F. EXPONENCIAL
180.0
160.0
140.0
120.0
100.0 =
80.0
60.0
40.0
20.0
0.0
0 200 400 600 800 1000 1200 1400 1600
10/01/2015 23
Linealidad de la funcin exponencial
= =
Y = + X = + X
Y = + X
LogY Log a X Log b
X * LogY X * Log a X * Log b
10/01/2015 24
Resolviendo el ejemplo anterior de RLS bajo el
principio de RNL (Exponencial)
X Y Ln(X) XLn(Y) X2 = =
=
102 14.7 2.68785 274.160 10404.0 35.05 35.05
158 40.7 3.70623 585.584 24964.0 37.46 37.46 =
176 49.5 3.90197 686.747 30976.0 38.26 38.26
202 42.5 3.74950 757.400 40804.0 39.46 39.46
215 39.4 3.67377 789.860 46225.0 40.07 40.07
252 44.2 3.78872 954.759 63504.0 41.87 41.87
304 46.9 3.84802 1169.797 92416.0 44.53 44.53
326 47.9 3.86912 1261.332 106276.0 45.71 45.71 bo = 3.435943566 a = 31.0607066
484 56.7 4.03777 1954.283 234256.0 55.12 55.12
492 57.1 4.04480 1990.044 242064.0 55.64 55.64 b1 = 0.001184996 b = 1.0011857
600 60.3 4.09933 2459.599 360000.0 63.24 63.24
609 68.9 4.23266 2577.688 370881.0 63.92 63.92
= . (. )
629 64.1 4.16044 2616.920 395641.0 65.45 65.45
650 89.3 4.49200 2919.801 422500.0 67.10 67.10
716 54.3 3.99452 2860.079 512656.0 72.56 72.56
716 79.2 4.37198 3130.335 512656.0 72.56 72.56
746 84.4 4.43557 3308.933 556516.0 75.18 75.18
764 87.7 4.47392 3418.076 583696.0 76.81 76.81
790 76.5 4.33729 3426.460 624100.0 79.21 79.21
792 79.9 4.38078 3469.574 627264.0 79.40 79.40 = . .
802 81.1 4.39568 3525.338 643204.0 80.34 80.34
865 115.0 4.74493 4104.366 748225.0 86.57 86.57
1044 115.3 4.74754 4956.429 1089936.0 107.03 107.03
1293 126.0 4.83628 6253.313 1671849.0 143.76 143.76
1501 138.8 4.93303 7404.484 2253001.0 183.94 183.94
15228 1760.4 103.944 66855.36 12264014
10/01/2015 25
GRAFICO DE LA TENDENCIA EXPONENCIAL
200.0
F. EXPONENCIAL
180.0
160.0
140.0
120.0
100.0
80.0
60.0
40.0
20.0
0.0
0 200 400 600 800 1000 1200 1400 1600
10/01/2015 26
4. VARIANZA DE LOS ERRORES.
= + +
Error: =
= +
= +
=
=
= =
10/01/2015 27
La varianza de los errores del ejemplo
anterior es:
X Y YX X2
102 14.7 1499.4 10404.0 29.71 225.31
158 40.7 6430.6 24964.0 34.21 42.18
176 49.5 8712.0 30976.0 35.65 191.82 =
202 42.5 8585.0 40804.0 37.74 22.68
215 39.4 8471.0 46225.0 38.78 0.38
252 44.2 11138.4 63504.0 41.75 6.00
304 46.9 14257.6 92416.0 45.92 0.95
.
326 47.9 15615.4 106276.0 47.69 0.04
= =102.895
484
492
56.7
57.1
27442.8 234256.0
28093.2 242064.0
60.37
61.01
13.49
15.33
600 60.3 36180.0 360000.0 69.68 88.06
609 68.9 41960.1 370881.0 70.41 2.27
629 64.1 40318.9 395641.0 72.01 62.60
650 89.3 58045.0 422500.0 73.70 243.44
716 54.3 38878.8 512656.0 79.00 609.85
716 79.2 56707.2 512656.0 79.00 0.04
746 84.4 62962.4 556516.0 81.40 8.98
764 87.7 67002.8 583696.0 82.85 23.54
790 76.5 60435.0 624100.0 84.93 71.15
792 79.9 63280.8 627264.0 85.10 26.99
802 81.1 65042.2 643204.0 85.90 23.02
865 115.0 99475.0 748225.0 90.96 578.16
1044 115.3 120373.2 1089936.0 105.32 99.54
1293 126.0 162918.0 1671849.0 125.31 0.48
1501 138.8 208338.8 2253001.0 142.01 10.28
15228.0 1760.4 1312163.6 12264014.0 1760.40 2366.58
10/01/2015 28
5. COEFICIENTE DE DETERMINACION.
R2
SCR
(y y) 2
1
SCE
=
=
SCT (y y)
i
2
SCT
( x i ) 2
b x i
2 2
1
n b12 m xx =
R
2
( y i ) 2
m yy
y i
2
n
= COEFICIENTE.R2( Y, X )
10/01/2015 29
El coeficiente de determinacin del ejemplo
anterior, por formula y funcin del Excel:
X Y YX X2 =e
102 14.7 1499.4 10404.0 29.71 -15.01 = = =
158 40.7 6430.6 24964.0 34.21 6.49
176 49.5 8712.0 30976.0 35.65 13.85
202
215
42.5
39.4
8585.0
8471.0
40804.0
46225.0
37.74
38.78
4.76
0.62 = 98.6074895
252 44.2 11138.4 63504.0 41.75 2.45
304
326
46.9
47.9
14257.6 92416.0
15615.4 106276.0
45.92
47.69
0.98
0.21
= 900.8522333
484 56.7 27442.8 234256.0 60.37 -3.67
.
492 57.1 28093.2 242064.0 61.01 -3.91 = = 0.890539774
600 60.3 36180.0 360000.0 69.68 -9.38 .
609 68.9 41960.1 370881.0 70.41 -1.51
629
650
64.1
89.3
40318.9 395641.0
58045.0 422500.0
72.01
73.70
-7.91
15.60
= 0.890539774
716 54.3 38878.8 512656.0 79.00 -24.70
716 79.2 56707.2 512656.0 79.00 0.20 = COEFICIENTE.R2($E$96:$E$120,$D$96:$D$120)
= 0.890539774
746 84.4 62962.4 556516.0 81.40 3.00
764 87.7 67002.8 583696.0 82.85 4.85
790 76.5 60435.0 624100.0 84.93 -8.43
792 79.9 63280.8 627264.0 85.10 -5.20
= . = 0.885780633
802 81.1 65042.2 643204.0 85.90 -4.80
865 115.0 99475.0 748225.0 90.96 24.04
1044
1293
115.3
126.0
120373.2 1089936.0
162918.0 1671849.0
105.32
125.31
9.98
0.69
= 0.885780633
1501 138.8 208338.8 2253001.0 142.01 -3.21
10/01/2015 30
Ejemplo:
Yi Xi Xi Yi
Se tiene una muestra de 21 datos como y1 x1 716.0 54.3
y2 x2 792.0 79.9
par ordenados sobre el monto de y3 x3 492.0 57.1
y4 x4 650.0 89.3
inversin en publicidad y el impacto y5
y6
x5
x6
865.0 115
1293.0 126
Calcular: y9
y10
x9
x10
484.0 56.7
1501.0 138.8
y11 x11 326.0 47.9
a) Diagrama de dispersin. y12 x12 202.0 42.5
y13 x13 215.0 39.4
b) Los coeficientes de regresin. y14 x14 609.0 68.9
y15 x15 600.0 60.3
c) La recta de regresin. y16
y17
x16
x17
764.0 87.7
304.0 46.9
10/01/2015 31
REGRESION: Con herramienta de ANALISIS DE
DATOS del Excel.
Resumen
Estadsticas
de la
regresin
Coeficiente de correlacin mltiple 0.94368415
Coeficiente de determinacin R^2 0.89053977
R^2 ajustado 0.88578063
Error tpico 10.143706
Observaciones 25
Superior
Coeficientes Error tpico Estadstico t Probabilidad Inferior 95% 95%
Intercepcin 21.5229302 4.10987255 5.23688507 2.597E-05 13.0210111 30.0248493
Variable X 1 0.08026837 0.00586789 13.6792538 1.5519E-12 0.06812971 0.09240703
ANLISIS DE VARIANZA
Promedio de
Grados de Suma de los Valor crtico
libertad cuadrados cuadrados F de F
Regresin 1 19253.8739 19253.8739 187.121984 1.5519E-12
Residuos 23 2366.57975 102.894772
Total 24 21620.4536
10/01/2015 32
EJERCICIO DE
REGRESION LINEAL EN SPSS
Ejemplo: Xi Yi
716.0 54.3
792.0 79.9
492.0 57.1
Se tiene una muestra de 25 datos como par 650.0 89.3
865.0 115
ordenados sobre el monto de inversin en 1293.0 126
790.0 76.5
publicidad y el impacto sobre las ventas con esta 802.0 81.1
484.0 56.7
informacin. Calcular: 1501.0 138.8
a) Diagrama de dispersin. 326.0 47.9
202.0 42.5
b) Los coeficientes de regresin. 215.0 39.4
609.0 68.9
c) La recta de regresin. 600.0 60.3
764.0 87.7
d) Modelo lineal simple. 304.0 46.9
252.0 44.2
e) Coeficiente de determinacin. 746.0 84.4
629.0 64.1
f) Error tpico del error. 1044.0 115.3
g) Coeficiente de correlacin. 158.0 40.7
716.0 79.2
176.0 49.5
102.0 14.7
10/01/2015 33
1. Datos en vista de datos del SPSS
10/01/2015 34
2. Diagrama de dispersin en SPSS
Definir
10/01/2015 35
Cuadro de dialogo
Aceptar
10/01/2015 36
Grafico
Diagrama de dispersin
10/01/2015 37
3. Ordenes del SPSS para clculos cuantitativos.
Aceptar
10/01/2015 38
3. Interpretacin y anlisis de resultados.
10/01/2015 39
ANALISIS DEL CUADRO DE COEFICIENTES.
PRONOSTICO:
Valor de Y para x = 950
Y 21.523 0.080(X)
Y950 21.523 0.080(950)
RECTA DE REGRESION:
Y950 97.78
Para hacer estimacin de y para
cualquier valor de x.
10/01/2015 40
ANALISIS DEL CUADRO RESUMEN DEL
MODELO.
R2
i
1
SCT (yi y) 2
2
SCT e
s e2
n-2
se
10/01/2015 41
ANALISIS DEL CUADRO ANOVA
(Anlisis de Varianza)
2 2
Y - Y Y - Y Y - Y
n n n
2
K 1 K 1 K 1
2 2
e 2 Y - Y
n n n
Y - Y
K 1 K 1 K 1
10/01/2015 43
ESTIMACION INTERVALICA
Variabilidad de los datos respecto a la media de Y.
1 (x p x ) 2
s y p s e
n (x i x ) 2
10/01/2015 44
ESTIMACION INTERVALICA
Variabilidad de los datos respecto a la variable Y.
1 (x p x ) 2
s se 1
YP
n (x i x ) 2
10/01/2015 45
ESTIMACION PUNTUAL E INTERVALICA DE Y
Ordenes del SPSS para clculos cuantitativos.
Guardar
Cuadro de dialogo
10/01/2015 46
Cuadro de dialogo
Continuar
Aceptar
10/01/2015 47
RESULTADO:
a. Pronostico de Y para cada X
b. Error del valor real Y y el Y estimado.
c. Pronostico en forma de intervalo respecto a la media de Y
d. Pronostico en forma de intervalo respecto a la cada valor de Y
10/01/2015 48
PRUEBA DE HIPOTESIS DE LOS
COEFICIENTES DE REGRESION
Planteamiento de H: 2
Var(b1 )
H o : B1 0
H a : B1 0
(x i - x ) 2
Var(b1 ) 0.000034
.t calculado:
b B1 0.080 0 Var(b1 ) S2b1
tc 1 13.679
Sb1 0.006
.t de tabla:
tT = IDF(0.975, 23) = 2.069
Decisin:
Luego como: tc > tT (13.679 > 2.069) Se rechaza la Ho
10/01/2015 49
PRUEBA DE HIPOTESIS DE LOS COEFICIENTES
DE REGRESION EN SPSS
10/01/2015 50
ANALISIS DE VARIANZA
Fuente Cuadrado
S.Total gl Fc
de variacin Medio
Regresin SCR k SCR/k SCRk gl /SCE(n-k-1)gl
10/01/2015 51
ANALISIS DE VARIANZA
Planteamiento de la hiptesis:
H o : B0 B1 0
H a : B0 B1 0
SCR/k 19253.874 / 1
Fc calculado: Fc 187.122
SCE /(n k 1) 102.895 / 23
DECISION:
Luego: tc>tT Se rechaza la Ho
10/01/2015 52
ANALISIS DE VARIANZA
Planteamiento de la hiptesis:
H o : B0 B1 0
H a : B0 B1 0
10/01/2015 53
EJERCICIO.
La siguiente muestra contiene el precio y la cantidad de
suministrados de un articulo.
Canti Canti
obs Precio dad obs Precio dad
1 25 60 8 15 40
2 20 85 9 20 55
3 35 110 10 30 90
4 40 95 11 40 115
5 60 140 12 50 120
6 55 160 13 70 180
7 45 80 14 45 95
10/01/2015 54