Академический Документы
Профессиональный Документы
Культура Документы
FEN-1
Objetivos de Aprendizaje
Objetivos:
Como usar el anlisis de regresin para predecir el
valor de una variable dependiente basado en una
variable independiente.
13-1
Introduccin al Anlisis de
Regresin
13-2
13-4
Tipos de Relaciones
Relaciones lineales
Relaciones curvilineas
Y
X
Y
X
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall
13-5
X
Y
X
13-6
FEN-2
Tipos de Relaciones
Fuertes relacin
Tipos de Relaciones
Ninguna
Relacin
Baja Relacin
X
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall
13-7
Variable
Dependiente
Interseccin
Poblacional
Y
Coeficiente
de Pendiente
Poblacional
Variable
independiente
13-8
Yi 0 1Xi i
Componente Lineal
Yi 0 1Xi i
Valor observado
de Y para Xi
Valor de
prediccin de Y
para Xi
Componente del
Error Aleatorio
Pendiente = 1
Intercepcin = 0
Xi
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall
13-9
Valor
estimado de
la interseccin
Valor estimado
de la pendiente
Yi b0 b1Xi
Valor de X
para la
observacin i
13-10
13-11
13-12
FEN-3
Interpretacin de la pendiente y
la intercepcin
Encontrando la Ecuacin de
los mnimos cuadrados
13-13
13-15
13-14
Pies Cuadrados
(X)
245
1400
312
1600
279
1700
308
1875
199
1100
219
1550
405
2350
324
2450
319
1425
255
1700
13-16
Diagrama de Dispersin
House price model: Scatter Plot
1. Choose Data
450
House Price ($1000s)
Datos
400
350
300
250
200
150
100
50
0
0
500
1000
1500
2000
2500
3000
Square Feet
13-17
13-18
FEN-4
Usando PHStat
Add-Ins: PHStat: Regression: Simple Linear Regression
13-19
Excel Output
Regression Statistics
Multiple R
0.76211
R Square
0.58082
Standard Error
0.52842
Representacin Grfica
Modelo Precio Casa: Diagrama Dispersin y la lnea de prediccin
450
41.33032
Observations
Adjusted R Square
10
ANOVA
df
SS
MS
Regression
18934.9348
18934.9348
Residual
13665.5652
1708.1957
Total
32600.5000
Coefficients
Intercept
Square Feet
Standard Error
t Stat
Significance F
11.0848
P-value
0.01039
Lower 95%
Upper 95%
98.24833
58.03348
1.69296
0.12892
-35.57720
232.07386
0.10977
0.03297
3.32938
0.01039
0.03374
0.18580
13-21
Interseccin
= 98.248
500
1000
1500
2000
2500
3000
13-22
50
0
Interpretando b1
Pendiente
= 0.10977
400
350
300
250
200
150
100
Square Feet
Interpretacin de bo
13-20
13-23
13-24
FEN-5
Realizando predicciones
Realizando predicciones
450
317.85
El precio para una casa con 2000 pies cuadrados es
de 317.85($1,000s) = $317,850
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall
400
350
300
250
200
150
100
50
0
0
500
13-25
Suma total
de
cuadrados
SST ( Yi Y )
2500
3000
No tratar de
extrapolar ms
all del rango
observado de Xs
SSR
SSE
Suma de
cuadrados de
regresin
Suma de
cuadrados del
error
SSR ( Yi Y )2
2000
13-26
Medidas de variacin
SST
1500
Square Feet
Medidas de variacin
1000
SSE ( Yi Yi )2
(Variacin Total)
donde:
13-27
Medidas de variacin
Y
Yi
SSE = (Yi - Yi )2
Coeficiente de determinacin, r2
_
Y
Xi
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall
13-28
_
Y
X
13-29
SST
suma de cuadr. totales
note:
0 r2 1
13-30
FEN-6
Valores de
r2 aproximados
Valores de
r2 aproximados
Y
r2 = 1
r2 = 1
0 < r2 < 1
r2 = 1
r2
13-31
Valores de
aproximados
Regression Statistics
r2 = 0
Multiple R
0.76211
R Square
0.58082
Adjusted R Square
Standard Error
10
ANOVA
df
=0
El valor de Y no depende
de X. (Ninguna de la
variacin en Y es explicada
por la variacin en X)
18934.9348
18934.9348
13665.5652
1708.1957
Total
32600.5000
Coefficients
Intercept
13-33
MS
Residual
Standard Error
t Stat
F
11.0848
P-value
Significance F
0.01039
Lower 95%
Upper 95%
98.24833
58.03348
1.69296
0.12892
-35.57720
232.07386
0.10977
0.03297
3.32938
0.01039
0.03374
0.18580
13-34
SS
Regression
Square Feet
SSR 18934.9348
0.58082
SST 32600.5000
58.08% de la variacin en
precios casa es explicada por
la variacin en pies cuadrados
0.52842
41.33032
Observations
r2
13-32
Regression Statistics
Multiple R
0.76211
R Square
0.58082
Adjusted R Square
0.52842
Standard Error
S YX 41.33032
41.33032
Observations
10
S YX
SSE
n2
(Yi Yi ) 2
ANOVA
df
i 1
n2
SS
1
18934.9348
18934.9348
Residual
13665.5652
1708.1957
Total
Donde:
Coefficients
Intercept
Square Feet
13-35
MS
Regression
F
11.0848
Significance F
0.01039
32600.5000
Standard Error
t Stat
P-value
Lower 95%
Upper 95%
98.24833
58.03348
1.69296
0.12892
-35.57720
232.07386
0.10977
0.03297
3.32938
0.01039
0.03374
0.18580
13-36
FEN-7
Asunciones de regresin
L.I.N.E
small SYX
large SYX
Linealidad
La relacin entre X y Y es lineal
Independencia de los errores
Valores de los errores son estadisticamente independientes
Normalidad del Error
Los valores de los errores son normalmente distribudos para
cualquier X
Equal o Igual Varianza (tambin llamado homocedasticidad)
La distribucin de probabilidad de los errores tiene varianza
constante.
13-37
Anlisis Residual
ei Yi Yi
Se chequean las asunciones de la regresin
examinando los residuos.
Linealidad
Evaluar independencia
Evaluar normalidad
Not Linear
13-39
Independent
residuals
residuals
residuals
Linear
13-40
Normalidad
Not Independent
x
residuals
residuals
13-38
13-41
13-42
FEN-8
100
0
-3
-2
-1
x
Non-constant variance
Residual
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall
13-43
Predicted
House Price
80
251.92316
273.87671
-6.923162
38.12329
284.85348
-5.853484
304.06284
3.937162
218.99284
-19.99284
268.38832
-49.38832
-20
356.20251
48.79749
-40
367.17929
-43.17929
-60
254.6674
64.33264
10
284.85348
-29.85348
60
Residuals
40
20
0
0
1000
2000
3000
Square Feet
13-45
15
10
Residuals
13-46
Autocorrelacin
13-44
Constant variance
Medida de Autocorrelacin:
Durbin-Watson Statistic
residuals
residuals
5
0
-5 0
-10
-15
Time (t)
13-47
(e e
i 2
e
i 1
i1
)2
2
i
FEN-9
Probar Autocorrelacin
Positiva
160
140
120
Sales
100
80
y = 30.65 + 4.7038x
60
R = 0.8976
40
20
0
Rechazar H0
No concluyente
No rechazar H0
10
15
20
25
30
Tim e
dL
dU
13-49
Existe Autocorrelacin?
Probando Autocorrelacin
Positiva
160
140
120
Excel/PHStat output:
Sales
100
Durbin-Watson Calculations
Sum of Squared
Difference of Residuals
3296.18
Sum of Squared
Residuals
3279.98
Durbin-Watson
Statistic
1.00494
13-50
80
y = 30.65 + 4.7038x
60
R = 0.8976
40
20
0
0
10
15
20
25
30
Decision: rechazar H0
Tim e
D = 1.00494 < dL
n
(ei ei1 )2
i2
e
i1
3296.18
1.00494
3279.98
13-51
S YX
SSX
S YX
Test statistic
donde:
(Xi X)2
S YX
b 1
t STAT 1
Sb
1
2
13-52
donde:
Sb1
dU=1.45
Sb1
No rechazar H0
dL=1.29
Inferencias acerca de la
pendiente
No concluyente
Rechazar
H0
d.f. n 2
13-53
b1 = coeficiente de la
pendiente de la regresin
1 = Pendiente de la
hiptesis
Sb1 = error estndar de la
pendiente
13-54
FEN-10
Square Feet
(x)
245
1400
312
1600
279
1700
308
1875
199
1100
219
1550
405
2350
324
2450
319
1425
255
1700
H0 : 1 = 0
H1 : 1 0
Coefficients
Intercept
Square Feet
t Stat
P-value
98.24833
Standard Error
58.03348
1.69296
0.12892
0.10977
0.03297
3.32938
0.01039
b1
Sb1
b1 1
Sb
0.10977 0
3.32938
0.03297
13-55
H0 : 1 = 0
H1 : 1 0
d.f. = 10- 2 = 8
Intercept
/2=.025
Reject H0
Do not reject H0
-t/2
-2.3060
Reject H0
t/2
2.3060
Square Feet
Decision: Rechazar H0
/2=.025
3.329
13-57
F Test :
FSTAT
donde:
MSR
t Stat
P-value
98.24833
Standard Error
58.03348
1.69296
0.12892
0.10977
0.03297
3.32938
0.01039
p-value
13-58
13-56
MSR
MSE
Regression Statistics
Multiple R
SSR
k
0.76211
R Square
0.58082
Adjusted R Square
0.52842
Standard Error
MSR 18934.9348
11.0848
MSE 1708.1957
41.33032
Observations
SSE
MSE
n k 1
FSTAT
10
p-value for
the F-Test
ANOVA
df
MS
Regression
18934.9348
18934.9348
11.0848
Residual
13665.5652
SS
1708.1957
Total
32600.5000
Significance F
0.01039
13-59
13-60
FEN-11
Test Statistic:
H0 : 1 = 0
H1 : 1 0
= .05
df2 = 8
df1= 1
b1 t / 2 S b
MSR
FSTAT
11.08
MSE
Decision:
Rechazar H0 at = 0.05
Critical
Value:
Standard Error
98.24833
58.03348
1.69296
0.12892
-35.57720
232.07386
0.10977
0.03297
3.32938
0.01039
0.03374
0.18580
Intercept
Square Feet
F = 5.32
No
rechazar
H0
Rechazar H0
F.05 = 5.32
Square Feet
13-61
Lower 95%
Upper 95%
Lower 95%
Standard Error
t Stat
P-value
98.24833
58.03348
1.69296
0.12892
-35.57720
Upper 95%
232.07386
0.10977
0.03297
3.32938
0.01039
0.03374
0.18580
Hipotesis
H0: = 0
H1: 0
1 r2
n2
13-63
t STAT
1 .762 2
10 2
13-64
r
1 r2
n2
.762 0
1 .762 2
10 2
3.329
/2=.025
/2=.025
3.329
Reject H0
-t/2
-2.3060
13-65
Do not reject H0
Decision:
Rechazar H0
Conclusion:
Hay evidencia de
una asociacin
lineal al 5% nivel
de significancia
d.f. = 10-2 = 8
=.05 , df = 10 - 2 = 8
1 r2
n2
r r 2 if b1 0
(No correlacion)
(correlacion existe)
.762 0
donde
r r 2 if b1 0
(correlation exists)
r -
t STAT
H0: = 0
H1: 0
Test statistic
13-62
Coefficients
t STAT
P-value
t Stat
Conclusion:
= .05
d.f. = n - 2
Reject H0
t/2
2.3060
3.329
13-66
FEN-12
Y = b0+b1Xi
Intervalo de
prediccin para un
valor individual Y,
dado
CopyrightX
2011 Pearson Education, Inc. publishing as Prentice Hall
i
hi
Xi
13-67
1 (Xi X)2 1
(Xi X)2
n
SSX
n (Xi X)2
Y t / 2 S YX 1 hi
1
t
Y
0.025 S YX
n
Este trmino extra aade al ancho de intervalo
para reflejar la incertidumbre adicional para un
caso para un caso individual
13-69
317.85 37.12
13-70
(X i X) 2
(X i X) 2
(X i X ) 2
(X i X ) 2
1
t
Y
0.025 S YX 1
n
13-68
317.85 102.28
Chequear:
confidence and prediction interval for X=
box y entrar el valor X y el nivel de confianza
deseado.
13-71
13-72
FEN-13
Y
Confidence Interval Estimate for Y|X=Xi
Prediction Interval Estimate for YX=Xi
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall
13-73