Вы находитесь на странице: 1из 20

Universidad Nacional de Loja

Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

SECCIÓN 2.10.2

2.11 El archivo br2.dat contiene datos de 1080 casas vendidas en Baton Rouge, Louisiana, durante
mediados de 2005. Los datos incluyen el precio de venta, el tamaño de la casa en pies cuadrados, su edad,
ya sea Tiene una piscina o chimenea o está en el paseo marítimo. También se incluye una variable
indicadora. TRADICIONAL que indica si el estilo de la casa es tradicional o no.8 Variable Las descripciones
están en el archivo br2.def.
a) Precio de la parcela contra el tamaño de la casa para casas con estilo tradicional.
Figura 1 Precio contra el tamaño de las casas
1000000
200000 400000 600000 800000

0 2000 4000 6000 8000


sqft

price Fitted values

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: Se observa en la figura 1 que existe una relación directa entre la variable precio de la parcela
y tamaño de las casas, ya que a mientras mayor sea el tamaño de la parcela, mayor será el precio de la
casa.

b) Para las casas de estilo tradicional, estimar el modelo de regresión lineal 𝑷𝑹𝑰𝑪𝑬 = 𝜷𝟏 + 𝜷𝟐 𝑺𝑸𝑭𝑻 +
𝒆. Interpreta las estimaciones. Haz un bosquejo de la línea ajustada.
Tabla 1 Datos descriptivos
Variable Obs Mean Std. Dev. Min Max

price 582 143470.6 80988.38 22000 1007000


sqft 582 2329.857 877.7668 741 7099

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: La tabla 1 muestra los estadísticos descriptivos del modelo de regresión lineal 𝑷𝑹𝑰𝑪𝑬 = 𝜷𝟏 +
𝜷𝟐 𝑺𝑸𝑭𝑻 + 𝒆, en donde se puede observar que existen 582 observaciones para cada variable. La media de la
variable precio es $142470,6, mientras que su desviación estándar es $80988,38 Así mismo, el valor mínimo del
precio de venta de las casas es $22 000, mientras que el valor máximo es $1007000. Por otro lado, la media de
la variable sqft es de 2329.857 (cientos de pies cuadrados), mientras que su desviación estándar es 877.7668
(cientos de pies cuadrados). De igual forma, el valor mínimo de área habitable es 741 (cientos de pies cuadrados)
y el valor máximo es 7099 (cientos de pies cuadrados).
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

Tabla 2 ANOVA Modelo de regresión lineal


Source SS df MS Number of obs = 582
F(1, 580) = 1027.92
Model 2.4362e+12 1 2.4362e+12 Prob > F = 0.0000
Residual 1.3746e+12 580 2.3700e+09 R-squared = 0.6393
Adj R-squared = 0.6387
Total 3.8108e+12 581 6.5591e+09 Root MSE = 48683

price Coef. Std. Err. t P>|t| [95% Conf. Interval]

sqft 73.77195 2.30097 32.06 0.000 69.2527 78.2912


_cons -28407.56 5728.161 -4.96 0.000 -39658.02 -17157.09

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

𝑦̂ = −28407.56 + 73.77𝑥1 + 𝜀
Y= Precio de las casas (PRICE)
Cuando la variable casas de estilo tradicional es cero, el precio de las casas es -28407.56
𝒙𝟏 = Tamaño de las casas con estilo tradicional(SQFT)
Cuando la variable tamaña de las casas aumenta en unos pies el precio de las casas aumentara en 73.77

Conclusión: La tabla 2 nos presenta un análisis de regresión del modelo lineal en donde el intercepto es
de -28407.56 donde mientras las demás variables permanezcan constantes este valor seguirá siendo
igual.

Figura 2 Precios contra el tamaño de la casa


1000000
200000 400000 600000 800000

0 2000 4000 6000 8000


sqft

price Fitted values

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: Se observa en la figura 2 que existe una relación directa fuerte entre la variable precio de la
parcela y tamaño de las casas, es decir conforme aumenta el tamaño de las casas también lo hace el
precio, por lo cual se observa que existen datos muy alejados.
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

Figura 3 Residuos vs los valores ajustados


600000
400000
200000
Residuals

0
-200000

0 100000 200000 300000 400000 500000


Fitted values

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la figura 3 se puede constatar que no se cumple el supuesto de homoscedasticidad debido


a que los datos siguen a un patrón. El supuesto de linealidad tampoco se cumple debido a que no muestra
una distribución aleatoria de valores positivos y negativos en los datos.

Figura 4 Probabilidad normal de los residuos


1.00
0.75
0.50
0.25
0.00

0.00 0.25 0.50 0.75 1.00


Empirical P[i] = i/(N+1)

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la figura 4 se puede observar que los puntos trazados se encuentran a 45 grados de la
recta por lo que si cumple con el supuesto de normalidad.
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

Figura 5 Histograma de los residuos


1.5e-05
1.0e-05
Density
5.0e-06

-200000 0 200000 400000 600000


Residuals

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la figura 5 se puede constatar que los residuos siguen una distribución de probabilidad
normal por lo que si se cumple el supuesto de normalidad.

c) Para las casas de estilo tradicional, estimar el modelo de regresión cuadrática 𝑷𝑹𝑰𝑪𝑬 = 𝜶𝟏 + 𝜶𝟐 +
𝑺𝑸𝑭𝑻𝟐 + 𝒆. Calcular el efecto marginal de un adicional de pies cuadrados de sala de estar en una
casa con 2000 pies cuadrados de espacio habitable.
Calcule la elasticidad de PRICE con respecto a SQFT para un hogar con 2000 pies cuadrados de
espacio habitable. Grafica la línea ajustada. En la gráfica, traza la línea que es tangente a la curva
de una casa de 2000 pies cuadrados

Tabla 3 ANOVA Modelo de regresión cuadrático de los precios y el tamaño de las casas

Source SS df MS Number of obs = 582


F(1, 580) = 1213.74
Model 2.5786e+12 1 2.5786e+12 Prob > F = 0.0000
Residual 1.2322e+12 580 2.1245e+09 R-squared = 0.6767
Adj R-squared = 0.6761
Total 3.8108e+12 581 6.5591e+09 Root MSE = 46093

price Coef. Std. Err. t P>|t| [95% Conf. Interval]

sqft2 .0120632 .0003463 34.84 0.000 .0113832 .0127433


_cons 68710.05 2873.195 23.91 0.000 63066.91 74353.18

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

𝑦̂ = 68710.05 + 0.0121𝑥12 + 𝜀
Y= Precio de las casas (PRICE)
Cuando la variable casas de estilo tradicional es cero, el precio de las casas es -28407.56
𝒙𝟏 = Tamaño de las casas con estilo tradicional(𝑺𝑸𝑭𝑻𝟐 )
Cuando la variable tamaña de las casas aumenta en un pie cuadrado, el precio de las casas aumentara en 0.02412

Conclusión: En la tabla 3 nos indica un análisis de regresión de un modelo cuadrático en donde el


intercepto es de $6810.05 y todas las variables permanecen constantes.
A medida que aumente una unidad adicional al tamaño de las casas se espera que el precio de la misma
se incremente en $0.0121 dólares.
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

Efecto marginal
. di "slope at 2000 = " 2*_b[ sqft2 ]*2000
slope at 2000 = 48.252933
Conclusión: El efecto marginal de un adicional de pies cuadrados de sala de estar en una casa con
2000 pies cuadrados de espacio habitable es 48.252933 dólares.

Figura 6 Precios contra 𝐒𝐐𝐅𝐓 𝟐


1000000
200000 400000 600000 800000

0 2000 4000 6000 8000


sqft

price Fitted values

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la figura 6 se observa que en el modelo cuadrático la línea ajustada existe una relación
directa entre el área de la vivienda y el precio de las casas, ya que mientras más grande es el área mayor
será el precio de la casa este modelo tiene muy alejados.
Figura 7 Residuos vs los valores ajustados
600000
400000
Residuals

200000

0
-200000

0 100000 200000 300000 400000 500000


Precio estimado

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la figura 7 se observa que el residuo muestra una distribución aleatoria de valores
positivos y negativos.
que no se cumple el supuesto de linealidad ni el supuesto de homoscedasticidad debido a que los datos
tienen un patrón.
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

Figura Probabilidad normal


1.00
0.75
0.50
0.25
0.00

0.00 0.25 0.50 0.75 1.00


Empirical P[i] = i/(N+1)

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la figura 7 se observa que los puntos trazados en su mayoría se encuentran cerca de la
recta por lo que si cumple con el supuesto de normalidad en el modelo lineal por lo que los datos no se
encuentran muy alejados de la recta a más de 45 grados.

Figura 8 Histograma de los residuos


1.5e-05
1.0e-05
Density
5.0e-06

-400000 -200000 0 200000 400000


Residuals

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la figura 8 se observa que los residuos siguen una distribución de probabilidad normal
por lo tanto cumple el supuesto de normalidad.
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

d) Para las regresiones en (b) y (c) calcule los residuos de mínimos cuadrados y la gráfica ellos contra
SQFT. ¿Alguna de nuestras suposiciones parece violada?
400000

400000
200000
200000

Residuals
Residuals

0
0

-200000
-200000

-400000
-400000

0 2000 4000 6000 8000 0 1.00e+07 2.00e+07 3.00e+07 4.00e+07 5.00e+07


sqft sqft2

Figura 9 Figura 10
Tabla resid
Fuente: Elaboración propia en base a Principals of Fuente: Elaboración propia en base a Principals
Econometrics (2013) en el programa Sata/MP of Econometrics (2013) en el programa Sata/MP
14.0 14.0

Conclusión: En la figura 9 y 10 se observa que no se cumple los supuestos de homoscedasticidad, ni el


supuesto de linealidad ya que el residuo tiene un patrón, pero si se cumple el supuesto de normalidad.

e) Una de las bases para elegir entre estas dos especificaciones es qué tan bien están los datos
ajustado por el modelo. Compare la suma de los residuos cuadrados (SSE) de los modelos en (b)
y (c). ¿Qué modelo tiene un SSE más bajo? ¿Cómo se tiene una SSE más baja? ¿Un modelo de
"mejor ajuste"?
Tabla 4 ANOVA Modelo de Regresion simple

Source SS df Number of obs MS = 582


F(1, 580) = 1027.92
Model 2.4362e+12 1 2.4362e+12 Prob > F = 0.0000
Residual 1.3746e+12 580 2.3700e+09 R-squared = 0.6393
Adj R-squared = 0.6387
Total 3.8108e+12 581 6.5591e+09 Root MSE = 48683
Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Tabla 5 ANOVA Modelo de regresión cuadrático


Source SS df MS Number of obs = 582
F(1, 580) = 1213.74
Model 2.5786e+12 1 2.5786e+12 Prob > F = 0.0000
Residual 1.2322e+12 580 2.1245e+09 R-squared = 0.6767
Adj R-squared = 0.6761
Total 3.8108e+12 581 6.5591e+09 Root MSE = 46093

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En las tablas 4 y 5 se puede constatar que la suma de los residuos cuadrados (SSE) en el
modelo cuadrático es más bajo 1.2322 en comparación con suma de los residuos cuadrados (SSE) del
modelo de regresión simple 1.3746.
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

f) Para las casas de estilo tradicional, estimar el modelo de regresión log-lineal 𝐥𝐧(𝑷𝑹𝑰𝑪𝑬) = 𝜸𝟏 + 𝜸𝟐 +
𝑺𝑸𝑭𝑻 + 𝒆. Interpreta las estimaciones. Grafica la línea ajustada, y dibuje la línea tangente a la curva
para una casa con 2000 pies cuadrados de sala de estar.

Tabla 6 ANOVA Modelo de la regresión log-lineal


Source SS df MS Number of obs = 582
F(1, 580) = 880.41
Model 76.4414878 1 76.4414878 Prob > F = 0.0000
Residual 50.3587111 580 .086825364 R-squared = 0.6028
Adj R-squared = 0.6022
Total 126.800199 581 .218244749 Root MSE = .29466

lprice Coef. Std. Err. t P>|t| [95% Conf. Interval]

sqft .0004132 .0000139 29.67 0.000 .0003859 .0004406


_cons 10.79894 .0346705 311.47 0.000 10.73084 10.86703
Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

ln(𝑷𝑹𝑰𝑪𝑬) = 𝜸𝟏 + 𝜸𝟐 + 𝑺𝑸𝑭𝑻 + 𝒆
ln(𝑷𝑹𝑰𝑪𝑬) = 𝟏𝟎. 𝟕𝟗𝟖𝟗𝟒 + 𝟎. 𝟎𝟎𝟎𝟒𝟏𝑺𝑸𝑭𝑻 + 𝒆
Y= Precio de las casas ln( PRICE)
Cuando la variable casas de estilo tradicional es cero, el precio de las casas es 10.798994 dólares
𝒙𝟏 = Tamaño de las casas con estilo tradicional (𝑺𝑸𝑭𝑻𝟐 )

Conclusión: En la tabla 6 podemos observar que el valor del intercepto es de 10.80 del precio de las
casas cuando todas las demás variables permanezcan constantes.
Cuando la variable tamaña de las casas aumenta en un pie el precio de las casas se espera que el precio
aumente en 0.0004132 dólares.

Figura11 lnPrice y Tamaño de las casas


1000000
200000 400000 600000 800000

0 2000 4000 6000 8000


sqft

price Linear prediction

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la figura 11 se observa que existe una relación directa entre las variables precio y tamaño
de las casas tradicionales la línea no se ajusta a la distribución de los datos.
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

Figura 12 Residuos contra los valores ajustados


1
.5
0
Residuals

-.5
-1
-1.5

11 12 13 14
Fitted values

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la figura 12 se observa que no se cumple el supuesto de homoscedasticidad debido a


que los datos tienen un patrón existe una aglomeración de los datos. El supuesto de linealidad tampoco
se cumple debido a que la distribución de los datos no muestra una distribución aleatoria de valores
positivos y negativos.

Figura 13 Probabilidad normal


1.00
0.75
0.50
0.25
0.00

0.00 0.25 0.50 0.75 1.00


Empirical P[i] = i/(N+1)

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la figura 13 se observa que los puntos trazados en su mayoría se encuentran cerca de la
recta por lo que si cumple con el supuesto de normalidad.
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

Figura 14 Histograma de los residuos


1.5
1
Density

.5
0

-2 -1 0 1 2
Residuals

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la figura 14 se observa que los residuos siguen una distribución de probabilidad normal
y por lo que si se cumple el supuesto de normalidad.

g) ¿Cómo calcularía la suma de los residuales al cuadrado para el modelo en (f) a ¿Es comparable a
los de los modelos en (b) y (c)? Compara esta suma de Residuos cuadrados al SSE a partir de las
especificaciones lineales y cuadráticas. ¿Cuál modelo parece encajar mejor los datos?

Tabla 7 ANOVA Modelo de regresión lineal


Source SS df MS Number of obs = 582
F(1, 580) = 1027.92
Model 2.4362e+12 1 2.4362e+12 Prob > F = 0.0000
Residual 1.3746e+12 580 2.3700e+09 R-squared = 0.6393
Adj R-squared = 0.6387
Total 3.8108e+12 581 6.5591e+09 Root MSE = 48683
Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Tabla 8 ANOVA Modelo de regresión cuadrático

Source SS df MS Number of obs = 582


F(1, 580) = 1213.74
Model 2.5786e+12 1 2.5786e+12 Prob > F = 0.0000
Residual 1.2322e+12 580 2.1245e+09 R-squared = 0.6767
Adj R-squared = 0.6761
Total 3.8108e+12 581 6.5591e+09 Root MSE = 46093

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Tabla 9 ANOVA Modelo de regresión log-lineal

Source SS df MS Number of obs = 582


F(1, 580) = 79.81
Model 15.3384593 1 15.3384593 Prob > F = 0.0000
Residual 111.46174 580 .192175413 R-squared = 0.1210
Adj R-squared = 0.1195
Total 126.800199 581 .218244749 Root MSE = .43838

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

Conclusión: En las tablas 8, 9 y 10 que el modelo que tiene menor suma de Residuos cuadrados al SSE es el
cuadrático 1.2322 mientras que la suma de Residuos cuadrados al SSE de los modelos con lineal 1.375 y log-
lineal 126.080 tiene son más altos
El modelo que encaja los datos es el modelo cuadrático

2.15 ¿Cuánto afecta la educación a los salarios? El archivo de datos cps4_small.dat contiene 1000
observaciones sobre salarios por hora, educación y otras variables del 2008 de la Encuesta de población
actual (CPS).
a) Obtenga los estadísticos e histogramas resumidos para las variables WAGE y EDUC. Discutir las
características de los datos.
Tabla 10 Datos descriptivos

Variable Obs Mean Std. Dev. Min Max

wage 1,000 20.61566 12.83472 1.97 76.39


educ 1,000 13.799 2.711079 0 21

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la tabla 10 se muestra los estadísticos descriptivos de las varibles wage y educ en donde se
observa que la media de los salarios es 20.62 dólares por hora con una dispersión menor con respecto a la media
de 12.83 . La media de los años de educación es 13.799 con una dispersión menor con respecto a su media
de2.17.

Figura 15 Histograma de los salarios


.05
.04
.03
Density

.02
.01
0

0 20 40 60 80
earnings per hour

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la figura15 podemos observar que se encuentra sesgado hacia la derecha por lo tanto las
personas que perciben un mejor salario son las que se encuentran en el rango de 5 a 20 dólares por hora.
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

Figura 16 Histogramas de los años de educación


.5
.4
.3
Density

.2
.1
0

0 5 10 15 20
years of education

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la figura 16 se observa que existe sesgo negativo los datos de los años se encuentran agrupados
a la izquierda del grafico el cual nos dice que los años de educación que más tienen las personas están en un
rango de 10 a 15 años.

b) Estime la regresión lineal regresión 𝑾𝑨𝑮𝑬 = 𝜷𝟏 + 𝜷𝟐 + 𝑬𝑫𝑼𝑪 + 𝒆 y discuta los resultados.

Tabla 11 ANOVA Modelo de regresión lineal


Source SS df MS Number of obs = 1,000
F(1, 998) = 211.66
Model 28794.2878 1 28794.2878 Prob > F = 0.0000
Residual 135771.14 998 136.043226 R-squared = 0.1750
Adj R-squared = 0.1741
Total 164565.428 999 164.730158 Root MSE = 11.664

wage Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ 1.980288 .1361174 14.55 0.000 1.713178 2.247397


_cons -6.710328 1.914156 -3.51 0.000 -10.46656 -2.954096

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

𝑦̂ = −6.7103 + 1.98𝑥1 + 𝜀
Y= Salarios

Cuando todas las demás variables son cero el salario por hora es -11.35 dólares

x1 = Educación

Conclusión: En la tabla 11 se observa que el intersepto es de $-6.71 esto nos indica que cuando las demas
variables permanecen constante esto nos quiere dar a conocer que por cada hora de las personas encuestadas
estarian percibiendo un valor de $-6.71 dolares.
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

Al aumentar un año adicional en la educacion se espera que el salario se incremente en $1.98 dolares por hora.
Figura 17 Salarios y Educación
80
60
40
20
0

0 5 10 15 20
years of education

earnings per hour Linear prediction

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la figura 17 Se observa que existe una relación moderada positiva entre la variable salario por
hora y la variable años de educación, es decir conforme aumenta los años de educación también aumentará el
salario por hora de los trabajadores.
Figura 18 Residuos vs valores ajustados
60
40
20
Residuals

0
-20
-40

-10 0 10 20 30 40
Fitted values

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la figura 18 se muestra la distribución de los residuos del modelo lineal en donde se observa que
no se cumple el supuesto de homoscedasticidad debido a que los datos tienen un patrón existe una aglomeración
de los datos. El supuesto de linealidad tampoco se cumple debido a que la distribución de los datos no muestra
una distribución aleatoria de valores positivos y negativos.
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

Figura 19 Probabilidad normal


1.00
0.75
0.50
0.25
0.00

0.00 0.25 0.50 0.75 1.00


Empirical P[i] = i/(N+1)

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la figura 19 nos indica que los puntos trazados en su mayoría no se encuentran a una distancia de
45 grados de la recta por lo que no se cumple con el supuesto de normalidad.

Figura 20 Histograma de residuos


.05
.04
.03
Density

.02
.01
0

-40 -20 0 20 40 60
Residuals

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la figura 20 se observa que los residuos no tienen media de cero por lo tanto no se cumplen con
el supuesto de normalidad.
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

c) Calcule los residuales de mínimos cuadrados y trácelos contra EDUC. ¿Hay algunos patrones
evidentes? Si las suposiciones SR1 – SR5 se mantienen, si algún patrón es evidente ¿En los
residuos de mínimos cuadrados?

Figura 21 Salarios vs educación


60
40
20
Residuals

0
-20
-40

0 5 10 15 20
years of education

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

Conclusión: En la figura 21 se muestra la distribución de los residuos del modelo lineal en donde se observa que
no se cumple el supuesto de homoscedasticidad debido a que los datos tienen un patrón existe una aglomeración
de los datos. El supuesto de linealidad tampoco se cumple debido a que la distribución de los datos no muestra
una distribución aleatoria de valores positivos y negativos.

d) Estime las regresiones separadas para hombres, mujeres, negros y blancos. Comparar los
resultados.
Mujeres
Tabla 16 ANOVA Modelo de regresión cuadrática
Source SS df MS Number of obs = 514
F(1, 512) = 136.65
Model 17610.9284 1 17610.9284 Prob > F = 0.0000
Residual 65984.275 512 128.875537 R-squared = 0.2107
Adj R-squared = 0.2091
Total 83595.2034 513 162.953613 Root MSE = 11.352

wage Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ 2.357519 .2016737 11.69 0.000 1.961309 2.753729


_cons -14.16805 2.895697 -4.89 0.000 -19.85696 -8.479137

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

𝑦̂ = −14.168 + 2.357𝑥1 + 𝜀
Y= Salario .- Cuando todas la variable educacion es cero el salario por hora es -14.168 dólares

x1 = Educación
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

Conclusión: En tabla 16 se puede constatar que el intersepto es de -14.17 cuando las demas variables
independientes permanecen constantes el salario de las personas encuentas sera de $-14.17.
Al incrementar un año adicional en la educacion de las personas encuentadas en este caso las mujeres ese asume
que el salario aumente a $2.16 por hora.
Hombres

Tabla 12 ANOVA Modelo de regresión lineal

Source SS df MS Number of obs = 486


F(1, 484) = 106.82
Model 14241.1633 1 14241.1633 Prob > F = 0.0000
Residual 64524.9629 484 133.316039 R-squared = 0.1808
Adj R-squared = 0.1791
Total 78766.1262 485 162.404384 Root MSE = 11.546

wage Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ 1.8753 .1814426 10.34 0.000 1.518788 2.231813


_cons -3.054487 2.493527 -1.22 0.221 -7.953963 1.844988

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

𝑾𝑨𝑮𝑬 = 𝜷𝟏 + 𝜷𝟐 𝑬𝑫𝑼𝑪 + 𝒆

𝑾𝑨𝑮𝑬 = −𝟑. 𝟎𝟓𝟒 + 𝟏. 𝟖𝟕𝑫𝑼𝑪 + 𝒆

Y= Salarios

Cuando todas la variable educacion es cero el salario por hora es -3.054 dólares

x1 = Educación

Conclusión: En la tabla 12 nos da a conocer el intersepto que es de -3.054 cuando las demas variables
independientes permanecen constantes el salario por persona encuentada por hora es de $-3.054 dolares.
Al aumentar un año adicional en la educación de las personas se pretende que el salario por persona encuestada
en este caso el salario de los hombres aumente a $1.88 dólares por hora.

Negros
Tabla 13 ANOVA Modelo de regresión lineal

Source SS df MS Number of obs = 112


F(1, 110) = 29.21
Model 3546.40943 1 3546.40943 Prob > F = 0.0000
Residual 13354.3152 110 121.402866 R-squared = 0.2098
Adj R-squared = 0.2027
Total 16900.7247 111 152.258781 Root MSE = 11.018

wage Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ 2.449058 .4531261 5.40 0.000 1.551068 3.347047


_cons -15.08593 6.169276 -2.45 0.016 -27.31198 -2.85987

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.

𝑦̂ = −15.086 + 2.45𝑥1 + 𝜀
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

Y= Salarios

Cuando todas la variable educacion es cero el salario por hora es -15.08592 dólares

x1 = Educación

Conclusión: En la tabla 13 nos da a conocer el intersepto que es de -15.086 cuando las demas variables
independientes permanecen constantes el salario por persona encuentada por hora es de $-15.086 dolares.
Al aumentar un año adicional en la educación de las personas se pretende que el salario por persona encuestada
en este caso el salario de las personas de color de piel negra aumente a $2.45 dólares por hora.

Blancos
Tabla 16 ANOVA Modelo de regresión cuadrática
Source SS df MS Number of obs = 888
F(1, 886) = 181.49
Model 24932.6443 1 24932.6443 Prob > F = 0.0000
Residual 121717.563 886 137.37874 R-squared = 0.1700
Adj R-squared = 0.1691
Total 146650.208 887 165.332816 Root MSE = 11.721

wage Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ 1.924307 .14284 13.47 0.000 1.643963 2.204651


_cons -5.672216 2.016614 -2.81 0.005 -9.630113 -1.714319

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

𝑦̂ = −5.67 + 1.92𝑥1 + 𝜀
Y= Salarios

Cuando la variable educacion es cero el salario por hora es –5.6722 dólares

x1 = Educación

Conclusión: En la tabla 13 nos da a conocer el intersepto que es de -5.67 cuando las demas variables
independientes permanecen constantes el salario por persona encuentada por hora es de $-5.67 dolares.
Al aumentar un año adicional en la educación de las personas se pretende que el salario por persona encuestada
en este caso el salario de las personas de color de piel blanca aumente a $1.92 dólares por hora.
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

e) Estime la regresión cuadrática 𝐖𝐀𝐆𝐄 = 𝛂𝟏 + 𝛂𝟐 𝐄𝐃𝐔𝐂 𝟐 + 𝐞 y discuta los resultados Estimar el efecto
marginal de otro año de educación sobre el salario de una persona con 12 años de educación, y
para una persona con 14 años de educación. Compare estos valores con el efecto marginal
estimado de la educación del Regresión lineal en la parte (b).

Tabla 16 ANOVA Modelo de regresión cuadrática


Source SS df MS Number of obs = 1,000
F(1, 998) = 231.33
Model 30967.2967 1 30967.2967 Prob > F = 0.0000
Residual 133598.131 998 133.865863 R-squared = 0.1882
Adj R-squared = 0.1874
Total 164565.428 999 164.730158 Root MSE = 11.57

wage Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ2 .0734891 .0048318 15.21 0.000 .0640075 .0829706


_cons 6.082831 1.023161 5.95 0.000 4.075038 8.090624

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

𝑦̂ = 6.08 + 0.073𝑥1 + 𝜀
Y= Salarios

Cuando todas las demás variables son cero el salario por hora es 6.082 dólares

x1 = Educación

Conclusión: En la tabla 16 nosindica el analisis de gresion delmodelo cuadratico donde nos indica el intersept
que es de 6.08 cuandolas demas variables independientes permanecen constantes. El salario que laspersonas
encuentadas recibiran por hora es de $6.08 dolares.
Al aumentar una unidad adicional a la educacion de las personas se espera que las personas perciban un salario
de $0.073 dolares por hora.

. di "slope at 12 = " 2*_b[ educ2 ]*12


slope at 12 = 1.7637374

Conclusión: El efecto marginal de otro año de educación sobre el salario de una persona con 12 años de
educación es 1.76 dólares

. di "slope at 14 = " 2*_b[ educ2 ]*14


slope at 14 = 2.0576937
Conclusión: El efecto marginal de otro año de educación sobre el salario de una persona con 14 años de
educación es 2.057 dólares.
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

f) Grafique el modelo lineal ajustado de la parte (b) y los valores ajustados de la cuadrática Modelo
de la parte (e) en el mismo gráfico con los datos en WAGE y EDUC. ¿Cuál modelo parece encajar
mejor los datos?

80
60
40

60
20
Residuals

40
0

20
-20

0
0 5 10 15 20
-40

years of education
0 10 20 30 40 earnings per hour Linear prediction
Fitted values

Figura 22 Figura 23
Tabla resid
Fuente: Elaboración propia en base a Principals of Fuente: Elaboración propia en base a Principals
Econometrics (2013) en el programa Sata/MP of Econometrics (2013) en el programa Sata/MP
14.0 14.0

Conclusión: En la figura 22 nos muestra que existe una relación positiva entre los años de educación y el
salario por hora de las personas, por lo tanto, se puede constatar que a medida que aumenta la educación de
igual manera aumentara el salario por hora, la línea de regresión nos indica que no se adapta al modelo lineal.
En la figura 23 existe la misma relación entre las variables independiente con la variable dependiente pero
aquí vemos que la línea de regresión se adapta de mejor manera distribución de los datos

g) Construya un histograma de ln (WAGE). Compara la forma de este histograma con eso para WAGE de la parte (a).
¿Qué aparece más simétrico y con forma de campana?
.05
.8

.04
.6

.03
Density
Density

.4

.02
.2

.01
0
0

1 2 3 4 5 -40 -20 0 20 40 60
lwage Residuals

Figura 24 Figura 25
Tabla resid
Fuente: Elaboración propia en base a Principals of Fuente: Elaboración propia en base a Principals
Econometrics (2013) en el programa Sata/MP of Econometrics (2013) en el programa Sata/MP
14.0 14.0
Universidad Nacional de Loja
Carrera de Economía
Estadística III
Nombre: George Fernando Lalangui Armijos
Fecha: 21/01/2019
Curso: 3 “A”

Conclusión:En la figura 24 muestra la distribución de datos de log-lineal por lo tanto podemos constatar
que al comparar con el del inciso a) los datos tienen una simetría que siguen una distribución normal por
lo que tiene una forma de campana.

h) Estime la regresión log-lineal 𝐥𝐧(𝑾𝑨𝑮𝑬) = 𝜸𝟏 + 𝜸𝟐 𝑬𝑫𝑼𝑪 + 𝒆. Estimar el efecto marginal de otro año
de educación sobre el salario de una persona con 12 años. años de educación, y para una persona
con 14 años de educación. Compara estos valores a los efectos marginales estimados de la
educación a partir de la regresión lineal en parte (b) y la ecuación cuadrática en la parte (e).

Tabla 17 ANOVA Modelo de regresión log-lineal


Source SS df MS Number of obs = 1,000
F(1, 998) = 216.41
Model 60.015841 1 60.015841 Prob > F = 0.0000
Residual 276.76489 998 .27731953 R-squared = 0.1782
Adj R-squared = 0.1774
Total 336.780731 999 .337117849 Root MSE = .52661

lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ .0904082 .0061456 14.71 0.000 .0783484 .1024681


_cons 1.609444 .0864229 18.62 0.000 1.439853 1.779036

Fuente: Elaboración propia en base a Principals of Econometrics (2013) en el programa Sata/MP 14.0

𝑦̂ = 1.61 + 0.090𝑥1 + 𝜀

Y= Salarios

Cuando todas las demás variables son cero el salario por hora es 1.609 dólares

x1 = Educación

Conclusión: En la figura 17 podemos constatar que el intersepto es de 1.61 cuando las demas variables
independientes permanacesn constantes por lo tanto se estima que el salario por persona esde $1.61 dolares por
hora. . di "slope at 12 = " 2*_b[ educ2 ]*12
. di "slope at 12 = " _b[ educ ]*12
slope aten 12
Al aumentar un alño adicional se estima que elsalario aumente = 1.7637374
un $0.90 dolares por hora de las personas
slope at 12 = 1.0848989
encuentadas.
Inciso e)
. di "slope at 13 = " 2*_b[ educ2 ]*13
. di "slope at 13 = " _b[ educ ]*13 .slope
di "slope
. di "slope at 12 = " _b[ educ ]*12 at 13 at 12 = " 2*_b[ educ2 ]*12
= 1.9107156
slope at 13 = 1.1753072 slope at 12 = 1.7637374
slope at 12 = 1.0848989

. di "slope at 14 = " _b[ educ ]*14 . di "slope at 14 = " 2*_b[ educ2 ]*14
. di "slope at 13 = " _b[ educ ]*13 .slope
di "slope
at 14 at 13 = " 2*_b[ educ2 ]*13
= 2.0576937
slope at 14 = 1.2657154
slope at 13 = 1.1753072 slope at 13 = 1.9107156
Conclusión: Al aumentar un año adicional a las personas de 12 y 14 años de educación podemos observar que
sería igual a $1.084dolaraes y $1.26 dólares por hora. Al comparar con os valores del modelo lineal y cuadrático
. di serían
estos "slope at 15 = " _b[ educ ]*15
menores.
. di "slope at 15 = " 2*_b[ educ2 ]*15
. di "slope at 14 = " _b[ educ ]*14 .slope
di "slope
at 15 at 14 = " 2*_b[ educ2 ]*14
= 2.2046718
slope at 15 = 1.3561237
slope at 14 = 1.2657154 slope at 14 = 2.0576937

Вам также может понравиться