Вы находитесь на странице: 1из 7

Regresin Mltiple

Se utiliza la regresin mltiple cuando se estudia la posible relacin


entre varias variables independientes (predictoras, explicativas,
exgenas) cuantitativas o cualitativas y otra variable dependiente
(respuesta, endgena) cuantitativa.
Y = |
0
+ |
1
X
1
+ |
2
X
2
+ + |
k
X
k
+ c

- Las variables X no deben estar relacionadas entre ellas
- Se supone que la variable c se distribuye normal con media 0 y
varianza constante
- Mtodo de estimacin de los parmetros : Mnimos cuadrados
ordinarios

i
n
2
i 0 1 1 2 2 k
i=1

( (y - ( + x + x + ...+ x ))
k
: mn
n
2
i
i=1

entrega los siguientes resultados:

( ) ( )
0
-1
' 1
k

= XX X'Y

| |
|
|
|
|
|
\ .

- Estimacin de la varianza del modelo:
2
i i 2 2
e
(y - y )
= s = MC(error)
n-k-1
=



Ejemplo Gasto_alim.sav: Una agencia desea estimar los gastos
en alimentacin familiar con base en el ingreso y su tamao. Los
datos que se encuentran en el archivo Gasto_Alim.sav representan
los gastos en alimentacin por mes Y en miles $, el ingreso
mensual X
1
en miles de $ y el tamao de la familia X
2
para 16
familias que se seleccionaron al azar en cierta localidad geogrfica.

Modelo que se estima: Y = |
0
+ |
1
X
1
+ |
2
X
2
+ c


SPSS: Analizar Regresin lineal
(utilice el mtodo introducir considera simultneamente
todas las variables especificadas)

Modelo estimado:

Y = -82,990 + 0,141X
1 +
37,202X
2

Gasto_alim = -82,990 + 0,141Ingreso

+ 37,202T_familia

Interpretacin de las pendientes estimadas por mnimos cuadrados
ordinarios:
1
2

0,141

37,202
=
=






















ANOVA
b
227645,523 2 113822,762 32,839 0,000 < 0,05
a
45059,477 13 3466,114
272705,000 15
Regresin
Residual
Total
Modelo
1
Suma de
cuadrados gl
Media
cuadrtica F Sig.
Variables predictoras: (Constante), Tamao de la f amilia, Ingreso mensual
a.
Variable dependiente: Gasto mensual en alimentacin
b.
Significancia del modelo: H
0
: |
1
= |
2
= = |
k
= 0

H
1
: Por lo menos uno de los parmetros no es igual a cero

Tabla ANOVA en Regresin Mltiple
Fuente de variacin
Suma de cuadrados
SC
gl
Media cuadrtica
MC
F
(estadstico de prueba)
Regresin
2
i
(y - y)

k
2
i
(y - y)
k


MC(Regresin)
MC(Error)

Error (residual)
2
i i
(y - y )

n k -1
2
i i
(y - y )
n - k -1


Total
2
i
(y - y)

n - 1 Regin crtica: cola superior



Resumen del modelo


Modelo
R R cuadrado R cuadrado corregida Error tp. de la
estimacin
1
0,914(a)
Correlacin
Mltiple

0,835 83,5%
Coeficiente de
determinacin
SC(Regresin)
SC(Total)

0,809

(MC(Error))
1-
(Varianza de Y)


58,874

e
S = MC(Error)

a Variables predictoras: (Constante), Tamao de la familia, Ingreso mensual

Inferencia acerca de los parmetros individuales

Despus de probar que el modelo es significativo (con la prueba F -
ANOVA Regresin), se puede realizar test parciales (ejem. X
1

est relacionado linealmente con Y Hip.:
1
0), construir
intervalos de confianza para cada .

j
j j

-
Estadstico que se utiliza T =
S
~ t(n k -1) ; j = 1, 2, , k

e jj

Desvicin estndar estimada de = S c


j
;( Error tp. o error estndar
j

S )
c
jj
= valor de la diagonal de la matriz (XX)
-1

Coeficientes(a)



Modelo
Coeficientes no
estandarizados
Coeficientes
estandarizado
s
H
0
:
j
= 0
H
1
:
j
0
j = 0, 1 ,2

t
Sig.
B ()
Error tp.
j

S
Beta est.
1


(Constante) -82,990 65,087 -1,275 0,225
Ingreso mensual 0,141 0,017 0,978 8,091 0,000
T_familia 37,202 14,906 0,302 2,496 0,027
a Variable dependiente: Gasto mensual en alimentacin

Del ejemplo: Las dos variables independientes estn relacionadas
linealmente con el gasto en alimentacin. Nivel de significacin = 0,05.


Validacin del modelo de regresin mltiple

Multicolinealidad: cuando existen variables independientes
altamente correlacionadas entre s.
Analizar Regresin Diagnstico de colienealidad
Analizar Correlaciones Bivariadas de las variables
independientes

Consecuencia: Afecta a las estimaciones de los

Normalidad de los residuos: En Guardar los e
i
se guardan en
una columna de vista de datos realizar la prueba de normalidad

Homocedasticidad: Los grficos de los residuos frente a y


variables explicativas x pueden ayudar a identificar el problema de
heterocedasticidad y tamben falta de linealidad.

j
residuo
x


Grficos de los residuos frente a y


Ejercicios

1. En una industria de alimentos, quieren saber si se puede predecir la
gravedad especfica de los tubrculos de papa, y a partir de la cantidad
de nitrgeno, x
1
, y fsforo, x
2
, que poseen las mismas. Esta informacin
permitir al Gerente de la industria, elaborar un plan de fertilizacin para
hacer mejores chips (papas fritas). Para este anlisis se tienen 20 datos de
tubrculos tomados al azar.

Gravedad
Especfica (y)
Nitrgeno
p.p.m (x
1
)
Fsforo
p.p.m (x
2)
2 96 40
14 82 36
15 121 30
15 88 42
16 100 28
27 114 26
48 71 33
54 94 26
58 74 15
68 36 25
82 36 25
83 73 15
91 58 26
97 31 25
98 38 24
101 56 11
128 24 22
140 37 11
163 10 24
179 14 10

1. A travs de un anlisis de regresin qu se puede concluir?
- Estimar el modelo Y = |
0
+ |
1
X
1
+ |
2
X
2
+ c. Interpretar
- Significancia del modelo. = 0,05
- Significancia parcial. = 0,05
- Interpretacin del Coeficiente de determinacin.
- Investigue multicolinealidad
- Analice los residuos

2. ESTRES.sav. Como parte de un estudio para investigar la
relacin entre estrs y otras variables, se reunieron los siguientes
datos a partir de una muestra aleatoria de quince ejecutivos de
una corporacin agrcola:


Y = Medicin del estrs
X
1
= Medida del tamao de la empresa
X
2
= N de aos en la posicin actual
X
3
= Sueldo mensual (mill de $)
X
4
= Edad

a. Estime el modelo
Y = |
0
+ |
1
X
1
+ |
2
X
2
+ |
3
X
3
+ |
4
X
4
+ c (Interprete las
estimaciones de los |
j
, j = 1,2,3,4)
Estime la varianza del modelo

b. Analice la significancia del modelo. o = 0.05

c. Pruebe la significancia individual de cada uno de los coeficientes.
o = 0.05.

d. Determine e interprete el valor del coeficiente de determinacin.

e. Prediga con 1 = 0,95, el estrs de las personas

e. Investigue presencia de multicolinelidad.

f. Determine e interpreta la correlaciones parciales
1 2 3 4
2
yx .x x
R
x
,
3 1 2 4
2
yx .x x
R
x
,
4 1 2 3
2
yx .x x
R
x



g. Analice los residuos e
i
del modelo estimado: grfico Box-Plots ,
Grafico
i i
(y , e ) , Prueba de normalidad










Datos
suj Y X
1
X
2
X
3
X
4

1 101 812 15 3,0 38
2 60 334 8 2,0 52
3 10 377 5 2,0 27
4 27 303 10 5,4 36
5 89 505 13 5,2 34
6 60 401 4 2,7 45
7 16 177 6 2,6 50
8 184 598 9 5,2 60
9 34 412 16 3,4 44
10 17 127 2 2,8 39
11 78 601 8 4,2 41
12 141 297 11 8,4 58
13 11 205 4 3,1 51
15 104 603 5 3,8 63
14 76 484 8 4,1 30













h. Estime el modelo propuesto en (a) utilizado el mtodo
Hacia delante

Вам также может понравиться