Вы находитесь на странице: 1из 13

Facultad de Economa y Negocios

FEN-1

Objetivos de Aprendizaje
Objetivos:
Como usar el anlisis de regresin para predecir el
valor de una variable dependiente basado en una
variable independiente.

Mtodos Estadsticos III

El significado de los coeficientes de regresin b0 y b1

Anlisis de Regresin Lineal


Simple

Como evaluar las asunciones del anlisis de regresin


y conocer que hacer si las asunciones son violadas.
Realizar inferencias acerca de la pendiente y el
coeficiente de correlacin.

Vctor Hugo Gonzlez J. PhD (c)

Estimar los valores medios y predecir valores


individuales.
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-1

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Introduccin al Anlisis de
Regresin

Correlacin vs. Regresin

Un diagrama de dispersin puede ser usado


para mostrar las relaciones entre las dos
variables.

Explicar el impacto de cambios en una variable


independiente sobre la variable dependiente.

Variable Dependiente: La variable que


deseamos predecir o explicar

El efecto causal no se da con la correlacin.

Variable Independiente: La variable usada para


predecir o explicar la variable dependiente.

Diagramas de dispersin y Correlacin fueron vistos


en Mtodos estadsticos I.
13-3

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Modelo de Regresin Lineal


Simple

Predecir el valor de una variable dependiente basado


en el valor de por lo menos una variable
independiente.

La correlacin es pertinente solamente con la fuerza


de la relacin.

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

El anlisis de relacin es usado para:

El anlisis de Correlacin es usado para medir


la fuerza de asociacin (relacin lineal) entre
las dos variables.

13-2

13-4

Tipos de Relaciones
Relaciones lineales

Solamente una variable independiente,


X

Relaciones curvilineas
Y

Relacion entre X y Y es descrita por


una funcin lineal.
Cambios en Y son asumidos a ser
relacionados a cambios en X.

X
Y

X
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Vctor Hugo Gonzlez Jaramillo, PhD ( c )

13-5

X
Y

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

X
13-6

Regresin Lineal Simple

Facultad de Economa y Negocios

FEN-2

Tipos de Relaciones
Fuertes relacin

Tipos de Relaciones
Ninguna
Relacin

Baja Relacin

X
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-7

Modelo de Regresin Lineal


Simple

Variable
Dependiente

Interseccin
Poblacional
Y

Coeficiente
de Pendiente
Poblacional

Variable
independiente

13-8

Modelo de Regresin Lineal


Simple
Trmino
de error
aleatorio

Yi 0 1Xi i
Componente Lineal

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Yi 0 1Xi i

Valor observado
de Y para Xi

Valor de
prediccin de Y
para Xi

Componente del
Error Aleatorio

Pendiente = 1

Error aleatorio para


este valor de Xi

Intercepcin = 0

Xi
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-9

Ecuacin de regresin lineal


simple (Lnea de Prediccin)

Valor
estimado de
la interseccin

b0 y b1 son obtenidos al encontrar los valores


que minimizan la suma de las diferencias de
los cuadrados entre Y and Y :

Valor estimado
de la pendiente

Yi b0 b1Xi

min (Yi Yi )2 min (Yi (b0 b1Xi ))2

Valor de X
para la
observacin i

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Vctor Hugo Gonzlez Jaramillo, PhD ( c )

13-10

The Least Squares Method

La ecuacin de regresin lineal simple provee un


estimado de la lnea poblacional de regresin
Estimado (o
predecido)
valor Y para la
observacin i

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-11

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-12

Regresin Lineal Simple

Facultad de Economa y Negocios

FEN-3

Interpretacin de la pendiente y
la intercepcin

Encontrando la Ecuacin de
los mnimos cuadrados

Los coeficientes b0 y b1 , y otros


resultados de regresin, sern
encontrados con Excel.

Formulas son mostradas a continuacin

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-13

Ejemplo de Regresin Lineal


Simple

Una muestra aleatoria de 10 casas es


seleccionada
Variable dependiente(Y) = Precios de casas en
$1000s

Variable independiente(X) = Pies cuadrados

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-15

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-14

Precio Casa $1000s


(Y)

Pies Cuadrados
(X)

245

1400

312

1600

279

1700

308

1875

199

1100

219

1550

405

2350

324

2450

319

1425

255

1700

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-16

Usando funciones de Excel

Diagrama de Dispersin
House price model: Scatter Plot

1. Choose Data

2. Choose Data Analysis


3. Choose Regression

450
House Price ($1000s)

b1 es el cambio estimado en el valor


promedio de Y como un resultado de
una-unidad en incremento en X

Datos

Un agente de bienes races desea examinar la


relacin entre el precio de venta de una casa y su
tamao (medido en pies cuadrados)

b0 es el valor estimado promedio de Y


cuando el valor de X es cero

400
350
300
250
200
150
100
50
0
0

500

1000

1500

2000

2500

3000

Square Feet

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Vctor Hugo Gonzlez Jaramillo, PhD ( c )

13-17

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-18

Regresin Lineal Simple

Facultad de Economa y Negocios

FEN-4

Usando Funcin de Anlisis de


Datos en Excel

Usando PHStat
Add-Ins: PHStat: Regression: Simple Linear Regression

Entre Ys y Xs y opciones deseadas

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-19

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Excel Output
Regression Statistics
Multiple R

0.76211

R Square

0.58082

Standard Error

0.52842

Representacin Grfica
Modelo Precio Casa: Diagrama Dispersin y la lnea de prediccin

La Ecuacin de regresin es:

Precio de la casa 98.24833 0.10977 (Pies cuadrados)

450

41.33032

Observations

House Price ($1000s)

Adjusted R Square

10

ANOVA
df

SS

MS

Regression

18934.9348

18934.9348

Residual

13665.5652

1708.1957

Total

32600.5000

Coefficients
Intercept
Square Feet

Standard Error

t Stat

Significance F

11.0848

P-value

0.01039

Lower 95%

Upper 95%

98.24833

58.03348

1.69296

0.12892

-35.57720

232.07386

0.10977

0.03297

3.32938

0.01039

0.03374

0.18580

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-21

Interseccin
= 98.248

500

1000

1500

2000

2500

3000

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-22

precio casa 98.24833 0.10977 (pies cuadrados)

Porque una casa no puede tener un valor de


pies cuadrados de 0, b0 no tiene aplicacin
prctica

Vctor Hugo Gonzlez Jaramillo, PhD ( c )

50
0

Interpretando b1

b0 es el valor estimado promedio de Y cuando


el valor de X es cero (si X = 0 esta en el rango
de valores observados de X)

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Pendiente
= 0.10977

Precio de la Casa 98.24833 0.10977 (Pies cuadrados)

Precio Casa 98.24833 0.10977 (Pies cuadrados)

400
350
300
250
200
150
100

Square Feet

Interpretacin de bo

13-20

b1 estima el cambio en el valor promedio


de Y como el resultado del incremento de
una unidad en X

13-23

Aqu, b1 = 0.10977 nos dice que el valor medio de


una casa se incrementa por 0.10977($1000) =
$109.77, en promedio, por cada pie cuadrado de
superficie.

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-24

Regresin Lineal Simple

Facultad de Economa y Negocios

FEN-5

Realizando predicciones

Realizando predicciones

Predecir el precio de una casa


con 2000 pies cuadrados:

Cuando usamos un modelo de regresin para prediccin,


solamente se predice sobre un rango relevante.
Rango revelante
para interpolacin

Precio Casa 98.25 0.1098 (pie cuadrado)


98.25 0.1098(2000)

House Price ($1000s)

450

317.85
El precio para una casa con 2000 pies cuadrados es
de 317.85($1,000s) = $317,850
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

400
350
300
250
200
150
100
50
0
0

500

13-25

Suma total
de
cuadrados

SST ( Yi Y )

2500

3000

No tratar de
extrapolar ms
all del rango
observado de Xs

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

SSR

SSE

Suma de
cuadrados de
regresin

Suma de
cuadrados del
error

SSR ( Yi Y )2

2000

13-26

Medidas de variacin

La variacion total est en 2 partes:

SST

1500

Square Feet

Medidas de variacin

1000

SST = Suma de cuadrados totales

SSR = Suma de cuadr. Regresion (Variacin explicada)

SSE ( Yi Yi )2

(Variacin Total)

Medidas de variacin de los valores de Yi alrrededor de la


media Y

Variacin atribuble a la relacin entre X y Y

SSE = Suma de cuadrado del error (Variacin no explicada)

donde:

Variacin en Y atribubles a otros factores diferentes a X

Y = valor medio de la variable dependiente


Yi = valor observado de la variable dependiente

Yi = valor predecido de Y para un dado valor de Xi


Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-27

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Medidas de variacin
Y
Yi

SSE = (Yi - Yi )2

Coeficiente de determinacin, r2

SST = (Yi - Y)2


_
SSR = (Yi - Y)2

_
Y

Xi
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Vctor Hugo Gonzlez Jaramillo, PhD ( c )

13-28

_
Y

X
13-29

El coeficiente de determinacin es la porcin


de la variacin total en la variable
dependiente que es explicada por la variacin
en la variable independiente.
El coeficiente de variacin es tambin llamado
r-squared y es denotado como r2
r2

SSR suma de cuadr. regresin

SST
suma de cuadr. totales
note:

0 r2 1

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-30

Regresin Lineal Simple

Facultad de Economa y Negocios

FEN-6

Valores de
r2 aproximados

Valores de
r2 aproximados
Y

r2 = 1

r2 = 1

0 < r2 < 1

Perfect linear relationship


between X and Y:

Dbil relacin lineal entre X


y Y:

100% of the variation in Y is


explained by variation in X

r2 = 1

Algunos pero no todas las


variaciones en Y es
explicada con las
variaciones en X

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

r2

13-31

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Valores de
aproximados

Ejemplo de un modelo de regresin lineal simple:


Coeficiente de determinacin, r2 en Excel
r2

Regression Statistics

r2 = 0

Multiple R

0.76211

R Square

0.58082

Adjusted R Square
Standard Error

10

ANOVA
df

=0

El valor de Y no depende
de X. (Ninguna de la
variacin en Y es explicada
por la variacin en X)

18934.9348

18934.9348

13665.5652

1708.1957

Total

32600.5000

Coefficients
Intercept

13-33

MS

Residual

Standard Error

t Stat

F
11.0848

P-value

Significance F
0.01039

Lower 95%

Upper 95%

98.24833

58.03348

1.69296

0.12892

-35.57720

232.07386

0.10977

0.03297

3.32938

0.01039

0.03374

0.18580

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-34

Error estndar del estimado en


Excel

Error estandar de la estimacin

SS

Regression

Square Feet

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

SSR 18934.9348

0.58082
SST 32600.5000
58.08% de la variacin en
precios casa es explicada por
la variacin en pies cuadrados

0.52842
41.33032

Observations

No hay relaciones lineales


entre X y Y:

r2

13-32

La desviacin estndard de la variacin de las


observaciones alrrededor de la lnea de
regresin es estimado por:

Regression Statistics
Multiple R

0.76211

R Square

0.58082

Adjusted R Square

0.52842

Standard Error

S YX 41.33032

41.33032

Observations

10

S YX

SSE

n2

(Yi Yi ) 2

ANOVA
df

i 1

n2

SS
1

18934.9348

18934.9348

Residual

13665.5652

1708.1957

Total

Donde:

Coefficients

SSE = Suma de cuadr. Del error


n = tamao muestral
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Vctor Hugo Gonzlez Jaramillo, PhD ( c )

Intercept
Square Feet

13-35

MS

Regression

F
11.0848

Significance F
0.01039

32600.5000

Standard Error

t Stat

P-value

Lower 95%

Upper 95%

98.24833

58.03348

1.69296

0.12892

-35.57720

232.07386

0.10977

0.03297

3.32938

0.01039

0.03374

0.18580

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-36

Regresin Lineal Simple

Facultad de Economa y Negocios

FEN-7

Asunciones de regresin
L.I.N.E

Comparando errores estndar


SYX es una medida de la variacin de los
valores observados de Y desde una lnea de
regresin
Y
Y

small SYX

large SYX

La magnitud de SYX debe siempre ser tomada con respecto al


tamao de los valores de Y values en los datos muestrales.

Linealidad
La relacin entre X y Y es lineal
Independencia de los errores
Valores de los errores son estadisticamente independientes
Normalidad del Error
Los valores de los errores son normalmente distribudos para
cualquier X
Equal o Igual Varianza (tambin llamado homocedasticidad)
La distribucin de probabilidad de los errores tiene varianza
constante.

i.e., SYX = $41.33K es moderadamente pequeo relativo al


precio de las casas en el rango de $200K - $400K
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-37

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Anlisis para linealidad en los


residuos

Anlisis Residual
ei Yi Yi
Se chequean las asunciones de la regresin
examinando los residuos.

Linealidad

Evaluar independencia

Evaluar normalidad

Examinar varianza constante en todos los niveles de X


(homocedasticidad)

Anlisis grfico de los residuos

Not Linear

Graficar residuos vs. X

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-39

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Anlisis de residuos para


independencia

Independent

residuals

residuals

residuals

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Vctor Hugo Gonzlez Jaramillo, PhD ( c )

Linear
13-40

Normalidad

Not Independent

x
residuals

El residual para la observacin i, ei, es la diferencia


entre el valor observado y el predecido.

residuals

13-38

13-41

Examinar el Stem-and-Leaf Display de los


residuos
Examinar el Boxplot of the Residuals
Examinar el Histogram of the Residuals
Construir un grfico de la probabilidad Normal
de los Residuos

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-42

Regresin Lineal Simple

Facultad de Economa y Negocios

FEN-8

Anlisis de normalidad de los


residuos

Anlisis de residuos para igual


varianza

Cuandose usa un normal probability plot,


los errores normales se grafican en una lnea
recta
Percent

100

0
-3

-2

-1

x
Non-constant variance

Residual
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-43

Predicted
House Price

80

251.92316

273.87671

-6.923162
38.12329

284.85348

-5.853484

304.06284

3.937162

218.99284

-19.99284

268.38832

-49.38832

-20

356.20251

48.79749

-40

367.17929

-43.17929

-60

254.6674

64.33264

10

284.85348

-29.85348

60
Residuals

40

20
0
0

1000

2000

3000

Usado cuando los datos son tomados


sombre un tiempo para detectar si la
autocorrelacin est presente
Autocorrelacin existe si los residuos en
un perodo de tiempo estn relacionados a
los residuos en otro perodo de tiempo

Square Feet

13-45

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Autocorrelacin es la correlacin de los errores


(residualess) sobre el tiempo

Durbin-Watson statistic es usado para probar


autocorrelacin

Time (t) Residual Plot

H0: residuos no son correlacionados


H1: autocorrelacin positiva est presente

15

10
Residuals

Aqu, Los residuos


tienen tendencia
cclica, no aleatoria.
Tendencia cclica son
signos de
autocorrelacin positiva

13-46

The Durbin-Watson Statistic

Autocorrelacin

13-44

No parece violar ninguna asuncin de


regresin

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Constant variance

Medida de Autocorrelacin:
Durbin-Watson Statistic

House Price Model Residual Plot


Residuals

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Excel Output de los residuos


RESIDUAL OUTPUT

residuals

residuals

5
0
-5 0

-10
-15

Time (t)

Viola la asuncin de regresin que los residuos


son aleatorios e independientes

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Vctor Hugo Gonzlez Jaramillo, PhD ( c )

13-47

(e e
i 2

e
i 1

i1

)2

2
i

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

El rango est entre 0 D 4


D debera estr cerca a 2 si H0 es
verdad
D menor que 2 puede dar seal positiva
de autocorrelacin , D mayor que 2 puede
ser seal de autocorrelacin negativa
13-48

Regresin Lineal Simple

Facultad de Economa y Negocios

FEN-9

Prueba para Autocorrelacin


Positiva

Probar Autocorrelacin
Positiva

H0: No existe autocorrelacin positiva

H1: autocorrelacin positiva est presente

Supongase que tenemos la siguiente serie de


tiempo:

Calcular Durbin-Watson statistic = D

160

(Durbin-Watson Statistic usando Excel o Minitab)

140
120

Encontrar los valores dL and dU desde la tabla Durbin-Watson

Sales

100

(para muestras de tamao n y nmero de variables independientes k)

Regla de Decisin: reject H0 if D < dL

80

y = 30.65 + 4.7038x

60

R = 0.8976

40
20
0

Rechazar H0

No concluyente

No rechazar H0

10

15

20

25

30

Tim e

dL

dU

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-49

Existe Autocorrelacin?

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Probando Autocorrelacin
Positiva

Prueba para autocorrelacin


Positiva

160

Ejemplo con n = 25:

140

Aqu, n = 25 y hay k = 1 una variable independiente

Usando la tabla Durbin-Watson, dL = 1.29 y dU = 1.45

120

Excel/PHStat output:
Sales

100

Durbin-Watson Calculations
Sum of Squared
Difference of Residuals

3296.18

Sum of Squared
Residuals

3279.98

Durbin-Watson
Statistic

1.00494

13-50

80

y = 30.65 + 4.7038x

60

R = 0.8976

D = 1.00494 < dL = 1.29, entonces rechazar H0 y


concluir que existe autocorrelacin positiva.

40
20
0
0

10

15

20

25

30

Decision: rechazar H0

Tim e

D = 1.00494 < dL
n

(ei ei1 )2
i2

e
i1

3296.18
1.00494
3279.98

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-51

S YX

SSX

S YX

t test para una pendiente poblacional

Hiptesis nula y alternativas son:


(No existe relacin lineal)
(existe relacin lineal)

Test statistic

donde:

Hay una relacin lineal entre X y Y?


H0 : 1 = 0
H1 : 1 0

(Xi X)2

= Estimacin del error estndar de la pendiente

S YX

b 1
t STAT 1
Sb
1

SSE = Error estndar de la estimacin


n2

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Vctor Hugo Gonzlez Jaramillo, PhD ( c )

2
13-52

donde:

Sb1

dU=1.45

Inferencias sobre la pendiente:


t test

El error estandar del coeficiente de la pendiente


de la regresin (b1) es estimado por:

Sb1

No rechazar H0

dL=1.29

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Inferencias acerca de la
pendiente

No concluyente

Rechazar
H0

d.f. n 2
13-53

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

b1 = coeficiente de la
pendiente de la regresin
1 = Pendiente de la
hiptesis
Sb1 = error estndar de la
pendiente
13-54

Regresin Lineal Simple

Facultad de Economa y Negocios

FEN-10

Inferencias sobre la pendiente:


t test - Ejemplo
House Price
in $1000s
(y)

Square Feet
(x)

245

1400

312

1600

279

1700

308

1875

199

1100

219

1550

405

2350

324

2450

319

1425

255

1700

Inferencias sobre la pendiente:


t test - Ejemplo

Ecuacin de regresin estimada:

H0 : 1 = 0
H1 : 1 0

From Excel output:

house price 98.25 0.1098 (sq.ft.)

Coefficients
Intercept
Square Feet

t Stat

P-value

98.24833

Standard Error
58.03348

1.69296

0.12892

0.10977

0.03297

3.32938

0.01039

La pendiente de este modelo es


0.1098

b1

Sb1

Hay una relacin entre los pies


cuadrados de la casa y su precio de
venta o precio de casa?
t STAT

b1 1
Sb

0.10977 0
3.32938
0.03297

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-55

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Inferencias sobre la pendiente:


t test - Ejemplo

Inferencias sobre la pendiente:


t test - Ejemplo
H0 : 1 = 0
H1 : 1 0

H0 : 1 = 0
H1 : 1 0

Test Statistic: tSTAT = 3.329

From Excel output:


Coefficients

d.f. = 10- 2 = 8

Intercept

/2=.025

Reject H0

Do not reject H0

-t/2
-2.3060

Reject H0

t/2
2.3060

Square Feet

Decision: Rechazar H0

/2=.025

3.329

Hay suficiente evidencia


que los pies cuadrados
afectan el precio de venta de
la casa.

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-57

F Test :

FSTAT
donde:

MSR

t Stat

P-value

98.24833

Standard Error
58.03348

1.69296

0.12892

0.10977

0.03297

3.32938

0.01039

Decision: Rechazar H0, si el p-value <

p-value

Hay suficiente evidencia que los pies


cuadrados afectan el precio de venta
de la casa.

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-58

F-Test para significancia:


Output de Excel

F Test para significancia

13-56

MSR
MSE

Regression Statistics
Multiple R

SSR
k

0.76211

R Square

0.58082

Adjusted R Square

0.52842

Standard Error

MSR 18934.9348

11.0848
MSE 1708.1957

41.33032

Observations

SSE
MSE
n k 1

FSTAT

10

With 1 and 8 degrees


of freedom

p-value for
the F-Test

ANOVA
df

donde FSTAT sigue una distribucin F con k numerador y (n k - 1)


denominador grados de libertad

MS

Regression

18934.9348

18934.9348

11.0848

Residual

13665.5652

SS

1708.1957

Total

32600.5000

Significance F
0.01039

(k = el nmero de variables independientes en el modelo de regresin)


Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Vctor Hugo Gonzlez Jaramillo, PhD ( c )

13-59

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-60

Regresin Lineal Simple

Facultad de Economa y Negocios

FEN-11

F Test para significancia

Intervalo de confianza para la


pendiente
Estimacin del intervalo de confianza de la
pendiente:

Test Statistic:

H0 : 1 = 0
H1 : 1 0
= .05
df2 = 8
df1= 1

b1 t / 2 S b

MSR
FSTAT
11.08
MSE

Decision:
Rechazar H0 at = 0.05

Critical
Value:

Excel para los precios casas:


Coefficients

Standard Error

98.24833

58.03348

1.69296

0.12892

-35.57720

232.07386

0.10977

0.03297

3.32938

0.01039

0.03374

0.18580

Intercept
Square Feet

F = 5.32

No
rechazar
H0

Hay suficiente evidencia que el


tamao de la casa afecta el
precio de venta.

Rechazar H0

F.05 = 5.32

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Square Feet

13-61

Lower 95%

Upper 95%

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Lower 95%

Standard Error

t Stat

P-value

98.24833

58.03348

1.69296

0.12892

-35.57720

Upper 95%
232.07386

0.10977

0.03297

3.32938

0.01039

0.03374

0.18580

Siendo las unidades del precio de casa en


$1000s, Tenemos 95% confianza que el impacto
promedio sobre el precio de venta est entre
$33.74 y $185.80 por pie cuadrado de superficie

Hipotesis
H0: = 0
H1: 0

1 r2
n2

13-63

t STAT

1 .762 2
10 2

13-64

r
1 r2
n2

.762 0
1 .762 2
10 2

3.329

/2=.025

/2=.025

3.329

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Vctor Hugo Gonzlez Jaramillo, PhD ( c )

Reject H0

-t/2
-2.3060

13-65

Do not reject H0

Decision:
Rechazar H0
Conclusion:
Hay evidencia de
una asociacin
lineal al 5% nivel
de significancia

d.f. = 10-2 = 8

=.05 , df = 10 - 2 = 8

1 r2
n2

r r 2 if b1 0

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

(No correlacion)
(correlacion existe)

.762 0

donde

t Test para el coeficiente de


correlacin

Hay evidencia de una relacin lineal entre


los pies cuadrados y precios casa al .05
nivel de significancia?

(con n 2 grados de libertad)

r r 2 if b1 0

t Test para el coeficiente de


correlacin

(correlation exists)

r -

t STAT

Conclusion: Hay una relacin significativa entre el precio


de la casa y los pies cuadrados al .05 nivel de significancia

H0: = 0
H1: 0

(no correlation between X and Y)

Test statistic

Este 95% intervalo de confianza no incluye 0.

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-62

t Test para el coeficiente de


correlacin

Coefficients

t STAT

P-value

Al 95% de confianza, el intervalo de confianza para la


pendiente es de (0.0337, 0.1858)

Estimacin del intervalo de


confianza para la pendiente
Intercept

t Stat

Conclusion:

= .05

d.f. = n - 2

Reject H0

t/2
2.3060

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

3.329
13-66

Regresin Lineal Simple

Facultad de Economa y Negocios

FEN-12

Intervalo de confianza para el


promedio Y, dado X

Estimando los valores medios y


prediciendo los valores individuales
Meta: Formar intervalos alrrededor de Y para expresar
incertidumbre acerca del valor Y para un dado Xi
Intervalo de
confianza
para la media
de Y, dado Xi

Estimar el intervalo de confianza para el


Valor medio de Y dado un particular Xi

intervalo de confianza para Y|X X i :


Y t / 2 S YX hi

Y = b0+b1Xi

Tamao del intervalo vara de


acuerdo a la distancia desde la
media, X

Intervalo de
prediccin para un
valor individual Y,
dado
CopyrightX
2011 Pearson Education, Inc. publishing as Prentice Hall
i

hi

Xi

13-67

1 (Xi X)2 1
(Xi X)2


n
SSX
n (Xi X)2

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Intervalo de prediccin para un


valor Y, dado X

Estimacin de los valores


medios: Ejemplo
Estimar el intervalo de confianza para Y|X=X

Estimar el intervalo de confianza para


Valor individual de Y dado un particular Xi

Precio predecidoYi = 317.85 ($1,000s)

Y t / 2 S YX 1 hi

1
t
Y

0.025 S YX
n
Este trmino extra aade al ancho de intervalo
para reflejar la incertidumbre adicional para un
caso para un caso individual

13-69

317.85 37.12

13-70

Encontrar con Excel estos


intervalos

Encontrar el intervalo de prediccin al 95% para una


casa individual con 2,000 pies cuadrados

Para Excel, usar


PHStat | regression | simple linear regression

Precio pronosticado Yi = 317.85 ($1,000s)

(X i X) 2

(X i X) 2

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Estimar intervalos de prediccin para YX=X

(X i X ) 2

(X i X ) 2

Los puntos finales del intervalo de confianza son 280.66


y 354.90, o desde $280,660 a $354,900

Ejemplo de estimacin de los


valores individuales

1
t
Y
0.025 S YX 1
n

Encontrar el intervalo del 95% para el precio medio


de casas de 2,000 pies cuadrados

Intervalo de confianza para YX X i :

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-68

317.85 102.28

Chequear:
confidence and prediction interval for X=
box y entrar el valor X y el nivel de confianza
deseado.

El intervalo es desde 215.50 a 420.07, o desde $215,500


a $420,070
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Vctor Hugo Gonzlez Jaramillo, PhD ( c )

13-71

Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

13-72

Regresin Lineal Simple

Facultad de Economa y Negocios

FEN-13

Encontrar el intervalo de confianza


y Prediccin en Excel
Input values

Y
Confidence Interval Estimate for Y|X=Xi
Prediction Interval Estimate for YX=Xi
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall

Vctor Hugo Gonzlez Jaramillo, PhD ( c )

13-73

Regresin Lineal Simple

Вам также может понравиться