Вы находитесь на странице: 1из 19

Modelo de regresión Lineal Multiple

Sebastian Barrios C. - 1628783.

Kevin Stiven Quinto R. - 1632069.

Universidad del valle


Estadistica

June 10, 2019

Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 1 / 19


Overview

1 Introducción.

2 Análisis Exploratorio.

3 Ajuste del Modelo Lineal Múltiple.

Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 2 / 19


Introducción

En el presente estudio realizado en Estados Unidos de América, analizare-


mos la información brindada en un periodo intercensal realizada a 534
trabajadores. En dicha investigación fueron estudiadas la variable depen-
diente llamada ”salario” junto a 10 variables predictoras, el objetivo es
observar la correcta explicación de cada variable independiente frente a la
variable de respuesta.

Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 3 / 19


Análisis de las Variables

Nuestra base de datos presenta 11 variables , en las cuales ”salario” es


nuestra variable de respuesta y las variables predictoras son:
Categorı́a Ocupacional.
Sector en que trabaja.
Afiliación a sindicato.
Educación formal(años).
Experiencia(Años).
Edad.
Sexo.
Estado civil.
Raza.
Si es o no del sur.

Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 4 / 19


Análisis Exploratorio

Salarios
F.relativa Trabajadores

0.08
0.00

0 10 20 30 40 50
Trabajadores

0 10 20 30 40 50

Monto salarios US/h$


Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 5 / 19
Análisis Exploratorio

Salarios en función del Sexo


50
40
Monto salarios US/h$

30
20
10
0

hombre mujer

Sexo

Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 6 / 19


Análisis Exploratorio

50 Salarios en función del sexo y zona

Sur
No−Sur
40
Monto salarios US/h$

30
20
10
0

Hombre Hombre Mujer Mujer

Sexo

Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 7 / 19


Análisis Exploratorio

20 30 40 50 60 5 10 15

30
salario

0 10
60

edad
40
20

40
experiencia

20
0
15
10

estudios
5

0 10 20 30 40 0 10 20 30 40 50

Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 8 / 19


Análisis Exploratorio

Salarios en funcion de Años Estudio Salarios en funcion de la Experiencia


50

50
40

40
Monto salarios US$

30

30
20

20
10

10
0

0
[2,6] (6,10] (10,14] (14,18] [0,11] (11,22] (22,33] (33,44] (44,55]

Años Estudio Años Experiencia

Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 9 / 19


Análisis Exploratorio

50 Salarios en funcion de sindicato−raza

Asociado
No−Asociado
40
Monto salarios US$

30
20
10
0

Blanco Blanco Hispano Hispano Otra−raza Otra−raza

Raza

Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 10 / 19


Análisis Exploratorio

C.Ocupacional Salario

Media Mediana D.E n


Administrativo 12.70 10.62 7.57 55
Ventas 7.59 5.72 4.23 38
Clero 7.42 7.5 2.69 97
Servicios 6.54 5.5 3.67 83
Profesional 11.95 10.61 5.52 105
Otro 8.42 7.15 4.25 156

Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 11 / 19


Modelo

Función de Regresión General:

Y = β0 + β1 X1 + β2 X2 + β3 X3 + ....... + β16 X16 + 

Al realizar las estimaciones β̂i con i=1,2...16, el modelo ajustado que re-
sponde a estas estimaciones es el siguiente:

Ŷ = 3.8798 − (4.0638)X1 − (3.2682)X2 − (3.9754)X3 − (1.3336)X4 −


(3.2905)X5 +(1.0409)X6 +(0.4774)X7 −(1.6017)X8 +(0.8128)X9 +(0.2448)X10 −
(0.1580)X11 − (1.9425)X12 + (0.3005)X13 + (0.2314)X14 + (0.8379)X15 −
(0.5627)X16

Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 12 / 19


Variables Modelo ajustado

Ventas (Categorı́a No asociado (Sindicato).


ocupacional). Años de estudio.
Clero (Categorı́a ocupacional). Años de experiencia.
Servicios (Categorı́a
Edad.
ocupacional).
Profesional(Categorı́a Mujer (Sexo).
ocupacional). Soltero (Estado civil).
Otra (Categorı́a ocupacional). Hispano (Raza).
Manufactura (sector). Otra (Raza).
Otro (sector). No sur (zona donde reside).

Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 13 / 19


Hipótesis Parcial

Queremos probar para cada βi donde i=0,1,2,...,16 la siguiente hipótesis:

H0 : βi = 0

H1 : βi 6= 0

Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 14 / 19


Variables Significativas

Table: Resumen modelo lineal múltiple

Variables β(i) t P(T≥ t) α


3,87980 0.577 0.56441
Ventas -4,0638 -4.437 5.579146e-06 0,001
Clero -3,2682 -4.286 1.087433e-05 0,001
Servicios -3,9754 -4.903 6.319823e-07 0,001
Profesional -1,3336 -1.829 3.395443e-02 0,1
Otra(C.O) -3,2905 -4.111 2.294542e-05 0,001
Manufactura 1,0409 1.895 2.931365e-02 0,1
otro (sector) 0,4774 0.494 3.107062e-01 N.s

Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 15 / 19


Variables significativas

Table: Resumen modelo lineal general múltiple

Varaibles β(i) t P(T≥ t) α


No asociado -1,6017 -3.124 9.424746e-04 0,01
A. de estu- 0,8128 0.748 2.274535e-01 N.s
dio
A.experiencia 0,2448 0.226 4.105150e-01 N.s
Edad -0,158 -0.146 4.419108e-01 N.s
Mujer -1,9425 -4.631 2.301122e-06 0,001
Soltero 0,3005 0.731 2.326173e-01 N.s
Hispano 0,2314 0.233 4.077967e-01 N.s
otra(raza) 0,8379 1.458 7.266247e-02 N.s
No sur -0,5627 -1.340 9.034802e-02 N.s

Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 16 / 19


Hipótesis del modelo

En esta prueba se quiere probar :

H0 : β0 = β1 = β2 = ... = β15 = 0
H1 : β0 6= β1 6= β2 6= ... 6= β15 6= 0
R.c ={ Fcal /Fcal ≥ Fα,p−1,n−p−1 }

F0.05,16,517 = 1.663096
Fcal = 15.66 ≥ F0.01,16,517 = 2.034999
F0.1,16,517 = 1.484947

Se puede deducir que de manera conjunta las estimaciones para βi no son


iguales a cero, ya que según la prueba existe al menos 1 parámetro en el
modelo el cual es diferente de cero, y por lo tanto el modelo no es nulo.

Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 17 / 19


Prueba de hipótesis para el estadı́stico F (ANOVA)

Se quiere probar si existen o no diferencias entre las medias de las cate-


gorı́as de cada variable:

H0 : µ0 = µ1 = µ2 = ... = µ15 = 0
H1 : µ0 6= µ1 6= µ2 6= ... 6= µ15 6= 0
Rc={ Fcal /Fcal ≥ Fα,k−1,n−k }
Donde k, son las categorı́as contenidas en las variables

Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 18 / 19


Tabla estadı́stico F

Variables G.L F Valor-p α


Empleo 5 27,6768 2.2e-16 0,001
Sector 2 2,3176 0.09953 0,1
Sindicato 1 22,6377 2,54E-03 0,001
A. estudios 1 32,1984 2,32E-05 0,001
A. experien- 1 27,1235 2,76E-04 0,001
cia
Edad 1 0,0065 0.93568 N.s
Sexo 1 20,2534 8,39E-03 0,001
E.Civil 1 0,5832 0.44541 N.s
Raza 2 1,5014 0.22380 N.s
Zona residencia 1 1,7967 0.18070 N.s

Barrios-Quinto (UV) Modelo lineal multiple June 10, 2019 19 / 19

Вам также может понравиться