Вы находитесь на странице: 1из 22

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

DECANA DE AMERICA

SOLUCIONARIO DE LA PRACTICA 3 18.1

PROFESORA:
CASTAÑEDA SALDANA FRANCISCA BEATRIZ
AULA:
212
INTEGRANTE
CHACÓN LLANCARI EDDER
ESTRELLA VALVERDE GEORGE BRYAN
HUARANGA PAREDES ALVARO GERARDO
RAMOS CORDOBA ABAD GERONIMO

2018
1. Con el objeto de determinar si existen o no diferencias en las calificaciones obtenidas por
hombres y mujeres en una determinada asignatura, a partir de 25 observaciones se estimó
el modelo:
𝑛𝑜𝑡𝑎 = 5 + 0.75𝑃𝑐 + 1.5 𝑠𝑒𝑥𝑜 + 𝑒𝑡
donde PC es el promedio de prácticas y la variable sexo toma el valor 1 si se trata de una
mujer y 0 para un varón. Los resultados de la estimación fueron los siguientes

𝑛𝑜𝑡𝑎 = 5 + 0.75𝑃𝑐 + 1.5 𝑠𝑒𝑥𝑜 + 𝑒𝑡

𝑅 2 = 0.72

𝛿𝛽1 = 1.2 𝛿𝛽1 = 0.15 𝛿𝛽1 = 0.35

1: Si es mujer
𝑠𝑒𝑥𝑜 0: Si es varón

Interprete los resultados y analice si hay diferencias entre varones y mujeres


Solución
Interpretación de los resultados obtenidos de la regresión

𝑛𝑜𝑡𝑎 = 5 + 0.75𝑃𝑐 + 1.5 𝑠𝑒𝑥𝑜 + 𝑒𝑡

Coeficientes Desviación Estándar T P-value


𝛽1 5 1.2 4.16666667 0.000401602
𝛽2 0.75 0.15 5 5.26841E-05
𝛽3 1.5 0.35 4.28571429 0.00030025

Al estimar. Si la variable dummy nos sale significativa entonces decimos que hubo un
cambio en el intercepto. En este modelo la variable dummy es altamente significativa
entonces estamos ante un caso de cambio en el intercepto

𝛽1 = 5: Es el valor autónomo que toman las Notas independientemente de los


puntajes obtenidos en las practicas calificadas y si es mujer o varón. Podemos
decir que la nota obtenida en la asignatura independientemente será de 5.

𝛽2 = 0.75 Es el incremento de Nota (0.75 u.m.) cuando el puntaje de la practica


calificada en un punto.

𝛽3 = 1.5: Es el efecto diferencial de ser mujer o varón en la Nota de la asignatura.


Es decir, cuando se es mujer, la Nota aumentara de manera autónoma en 1.5
puntos.

Para el caso de que sean mujeres se toma el valor 1 lo que nos dejaría
Nota = 5 + 0.75 Pc + 1.5
Nota (mujeres) = 6.5 + 0.75Pc

Caso contrario: que sean varones se toma el valor de 0, lo que nos dejaría

Nota (varones) = 5 + 0.75Pc

β3 representa el efecto diferencial que tiene las notas si el estudiante es mujer o varón
nos permite decir que β3 = 1.5 nos indica que la nota de las mujeres es 1.5 más que la
nota de los varones. Entonces si existe diferencia entre las notas.

𝑇1 = 0.000401602 : Es altamente significativo.


𝑇2 = 5.26841E − 05: Es altamente significativo .
𝑇3 = 0.00030025: Es altamente significativo.

𝑋𝑡
2. Si el modelo 𝑌𝑡 = 𝛼 + 𝛽𝑋𝑡 + 𝛿𝑍𝑡 + 𝑢𝑡 se cumple que = 𝜆 ¿Qué parámetros se
𝑍𝑡
pueden estimar?
Solución
𝑋𝑡
A partir de = 𝜆 se tiene que 𝑋𝑡 = 𝑍𝑡 𝜆 de forma que sin más que sustituir dicha
𝑍𝑡
expresión en la ecuación del modelo:
𝑌𝑡 = 𝛼 + 𝛽𝑋𝑡 + 𝛿𝑍𝑡 + 𝑢𝑡
Reemplazando dicha expresión no daría:
𝑌𝑡 = 𝛼 + (𝛽𝜆 + 𝛿)𝑍𝑡 + 𝑢𝑡
Se puede estimar 𝛼 y 𝛽𝜆 + 𝛿, luego a no ser que se tenga información a priori, no se
podrían estimar los parámetros originales.
𝑋𝑡 𝛿
Si se opta por 𝑍𝑡 = , se podrá estimar 𝛼 y 𝜆
𝜆
Estamos ante un caso de multicolinealidad.

En el modelo de regresión lineal múltiple 𝑌 = 𝛽0 + 𝛽1 𝑋1𝑡 + 𝛽2 𝑋2𝑡 + 𝛽3 𝑋3𝑡 + 𝑢𝑡 se


verifica que 𝑋1𝑡 = 3𝑋3𝑡
Indique que parámetros son estimables:
a) Cuando no se dispone de información a priori sobre los coeficientes, y
b) Cuando se sabe que β3 = 2

Solución

a) |Cuando no se dispone de información a priori sobre ningún coeficiente

𝑌 = 𝛽0 + 𝛽1 𝑋1𝑡 + 𝛽2 𝑋2𝑡 + 𝛽3 𝑋3𝑡 + 𝑢𝑡


Sabemos que
𝑋1𝑡 = 3𝑋3𝑡
𝑌 = 𝛽0 + 3𝛽1 𝑋3𝑡 + 𝛽2 𝑋2𝑡 + 𝛽3 𝑋3𝑡 + 𝑢𝑡

Con lo cual quedaría de la siguiente forma

𝑌 = 𝛽0 + 𝛽2 𝑋2𝑡 + (3𝛽1 +𝛽3 )𝑋3𝑡 + 𝑢𝑡

Notamos un caso de multicolinealidad perfecta en la regresión


Los parámetros estimables solo serian 𝛽0 y 𝛽2, porque el coeficiente de la variable 𝑋3𝑡 es
una combinación lineal de las otras, en las cual no podemos hallar el valor de cada
parámetro contenida en está

c) Cuando se sabe que 𝛽3 = 2

En este caso, poseemos la información de que 𝛽3 es igual a 2, nuestros parámetros a


estimar serían 𝛽0, 𝛽2 y (3𝛽1 + 2), entonces todos los parámetros del modelo de regresión
son estimables.

3. Una empresa textil se plantea el estudiar las variables que le permitan modelizar su
función de beneficios. Con este fin registra 64 observaciones trimestrales relativas a los
beneficios obtenidos (Y), el precio medio del producto (X1), la calidad del producto (X2),
la presión fiscal (X3) y los gastos en publicidad (X4). Asimismo, se sospecha que la
relación entre estas variables puede especificarse a través de distintas estructuras. Por lo
cual se ha estimado 3 modelos

Modelo 1
Yt = 17 + 0.25 X1t +0.13 X2t – 0.25 X3t + 0.17 X4t + e ; t: 1980-T1 a 1995-T4
SCE= 250

Modelo 2
Yt = 14 + 1.25D2t +6.46 D3t -2.3D4t +0.86 X1t +0.25 X2t – 0.18 X3t + 0.34 X4t + e ; t:
1980-T1 a 1995-T4
Se= 2.05
Donde D jt   
1 si la observación pertenece al trimestre j
0 en caso contrario
Modelo 3
Yt = 12 + 0.27 X1t +0.15 X2t – 0.12 X3t + 0.17 X4t + e ; t: 1980-T1 a 1989-T4
R²=0.98 S 2  130 .42
y

Yt = 15 + 0.32 X1t +0.16 X2t – 0.34 X3t + 0.21 X4t + e ; t: 1990-T1 a 1995-T4
SCE= 130.64
a) Indique que estructura postula cada modelo.
b) Con la información disponible haga los análisis pertinentes y determine cuál es la
estructura apropiada.
Solución

a.1 Indique que estructura postula cada modelo.

Modelo 1
Yt = 17 + 0.25 X1t +0.13 X2t – 0.25 X3t + 0.17 X4t + e ; t: 1980-T1 a 1995-T4
SCE= 250

En este modelo queremos expresar como los beneficios obtenidos mantienen relaciones
estructurales y especificas con los parámetros, los cuales mostrarán en cuanto varían los
beneficios obtenidos al cambiar una o algunas de las variables exógenas, para el periodo
establecido de 1980 a 1995.

Modelo 2
Yt = 14 + 1.25D2t +6.46 D3t -2.3D4t +0.86 X1t +0.25 X2t – 0.18 X3t + 0.34 X4t + e ; t:
1980-T1 a 1995-T4
Se= 2.05
Donde D jt   
1 si la observación pertenece al trimestre j
0 en caso contrario

Si pertenece al trimestre jt

𝑌2𝑡 = 15.25 + 0.86𝑋1𝑡 + 0.25𝑋2𝑡 − 0.18𝑋3𝑡 + 0.34𝑋4𝑡 + 𝑒

𝑌3𝑡 = 20.46 + 0.86𝑋1𝑡 + 0.25𝑋2𝑡 − 0.18𝑋3𝑡 + 0.34𝑋4𝑡 + 𝑒

𝑌4𝑡 = 11.7 + 0.86𝑋1𝑡 + 0.25𝑋2𝑡 − 0.18𝑋3𝑡 + 0.34𝑋4𝑡 + 𝑒

Si no pertenece al trimestre

𝑌𝑡 = 14 + 0.86𝑋1𝑡 + 0.25𝑋2𝑡 − 0.18𝑋3𝑡 + 0.34𝑋4𝑡 + 𝑒

Este modelo es un modelo estacional por cada trimestre que se ha determinado para el
periodo de tiempo, el que se han incluido variables Dummy para poder explicar la
variación de los beneficios obtenidos a causa de cambios en las variables explicativas y
además entender como cambian estos beneficios cuando se cumplen determinadas
condiciones.

Modelo 3
Yt = 12 + 0.27 X1t +0.15 X2t – 0.12 X3t + 0.17 X4t + e ; t: 1980-T1 a 1989-T4
R²=0.98 S 2  130 .42
y

Yt = 15 + 0.32 X1t +0.16 X2t – 0.34 X3t + 0.21 X4t + e ; t: 1990-T1 a 1995-T4
SCE= 130.64

En este modelo queremos analizar el cambio o el quiebre estructural en la relación entre


la variable dependiente y la variable independiente, que ha sucedido en el periodo
correspondiente 1990-T1 a 1995-T4 y cuáles serían los posibles factores que ocasionan
estas variaciones.

b.1Con la información disponible haga los análisis pertinentes y determine cuál es la


estructura apropiada.

Modelo 1
Yt = 17 + 0.25 X1t +0.13 X2t – 0.25 X3t + 0.17 X4t + e ; t: 1980-T1 a 1995-T4
SCE= 250
Modelo 2
Yt = 14 + 1.25D2t +6.46 D3t -2.3D4t +0.86 X1t +0.25 X2t – 0.18 X3t + 0.34 X4t + e ; t:
1980-T1 a 1995-T4
Se= 2.05
Donde D jt   
1 si la observación pertenece al trimestre j
0 en caso contrario
n = 64 k=4

𝑆𝐶𝐸 = ∑ 𝑒 ′ 𝑒 = ∑ 𝑒 2 = 𝑆𝑒2 (𝑛 − 𝑘)

𝑆𝐶𝐸 = (2.05)2 𝑥(64 − 4) = 252.15

Analizando la

Para analizar la cual será la estructura adecuada utilizaremos la prueba F

𝐻0 : 𝛽1 = 𝛽2

𝐻1 : 𝛽1 ≠ 𝛽2

∝ = 0.05 k=2

[𝑆𝐶𝐸(𝑀𝑅) − 𝑆𝐶𝐸(𝑀𝑆𝑅)]/𝑠
𝐹= 𝑒𝑠 𝐹(𝑠,𝑛−𝑘)
𝑆𝐶𝐸(𝑀𝑆𝑅)/(𝑛 − 𝑘)

[252.15 − 250]/3
𝐹= = 0.17 ≈ 𝐹(3,60)
252.15/(64 − 4)
Conclusión

El valor calculado de la prueba de significancia F es 0.25 y el valor del F de la tabla es


3.92, podemos concluir que el valor de la F de la tabla es mucho mayor que el valor
calculado de F, por lo cual no podemos rechazar la hipótesis nula y podemos decir que el
nivel de significancia es la misma para los dos modelos, no afectara mucho tomar
cualquiera de los dos modelos.

Modelo 2
Yt = 14 + 1.25D2t +6.46 D3t -2.3D4t +0.86 X1t +0.25 X2t – 0.18 X3t + 0.34 X4t + e ; t:
1980-T1 a 1995-T4
Se= 2.05
Donde D jt   
1 si la observación pertenece al trimestre j
0 en caso contrario
Modelo 3
Yt = 12 + 0.27 X1t +0.15 X2t – 0.12 X3t + 0.17 X4t + e ; t: 1980-T1 a 1989-T4
R²=0.98 S 2  130 .42
y

𝑆𝐶𝑇
𝑆𝑦2 =
𝑛−1

𝑺𝑪𝑻 = 𝑺𝟐𝒚 (𝒏 − 𝟏) = 𝟏𝟑𝟎. 𝟒𝟐𝒙 (𝟔𝟒 − 𝟏) = 𝟖𝟐𝟏𝟔. 𝟒𝟔


𝑺𝑪𝑬
𝑹𝟐 = 𝟏 −
𝑺𝑪𝑻
𝑺𝑪𝑬
𝟎. 𝟗𝟖 = 𝟏 −
𝟖𝟐𝟏𝟔. 𝟒𝟔

𝑺𝑪𝑬 = 𝟎. 𝟎𝟐𝒙 𝟖𝟐𝟏𝟔. 𝟒𝟔 = 𝟏𝟔𝟒. 𝟑𝟑


Yt = 15 + 0.32 X1t +0.16 X2t – 0.34 X3t + 0.21 X4t + e t: 1990-T1 a 1995-T4
SCE= 130.64

Para saber si hay cambio estructural utilizamos el Test de Chow – Punto de Quiebre

𝐻0 : 𝛽1 = 𝛽2 = 𝛽 𝑁𝑜 ℎ𝑎𝑦 𝑐𝑎𝑚𝑏𝑖𝑜

𝐻1 : 𝛽1 ≠ 𝛽2 𝐻𝑎𝑦 𝑐𝑎𝑚𝑏𝑖𝑜 𝑒𝑠𝑡𝑟𝑢𝑐𝑡𝑢𝑟𝑎𝑙

[𝑆𝐶𝐸(𝑀𝑅) − 𝑆𝐶𝐸(𝑀𝑆𝑅)]/𝑘
𝐹= 𝑒𝑠 𝐹(𝑘,𝑇−2𝑘)
𝑆𝐶𝐸(𝑀𝑆𝑅)/(𝑇 − 2𝑘)

[164.33 − 130.64]/2
𝐹= = 7.74 𝑒𝑠 𝐹(2,60)
130.64/(64 − 4)
Conclusión:

El nivel de significancia calculado por la prueba F, nos muestra que el F calculado


(7.74) es mayor que el F de la tabla (3.92), por lo cual podemos decir que se rechaza
la hipótesis nula y podemos afirmar que si hay cambio estructural

b.2 Teniendo los niveles de significancia de los modelos 1 y 2 ,3 podemos plantear


una prueba f para los modelos 2 y 3

𝐻0 : 𝛽1 = 𝛽2
𝐻0 : 𝛽1 > 𝛽2
∝ = 0.05

[𝑆𝐶𝐸(𝑀𝑅) − 𝑆𝐶𝐸(𝑀𝑆𝑅)]/𝑘
𝐹= 𝑒𝑠 𝐹(𝑘,𝑇−2𝑘)
𝑆𝐶𝐸(𝑀𝑆𝑅)/(𝑇 − 2𝑘)

[252.15 − 164.33]/2
𝐹= = 16.03 ≈ 𝐹(2,60)
164.33/60
Conclusión

Al calcular la el test de Chou para diferentes periodos se obtiene un F calculado de 16.03,


que es mayor que el F de la tabla 3.150, decidimos que se rechaza la hipótesis nula y
aceptamos la hipótesis alternativa de lo cual podemos concluir que la estructura apropiada
seria el modelo 2

5 Se ha estimado el siguiente modelo para las importaciones en función del consumo y 8las
exportaciones

a) Analice el cumplimiento del supuesto de normalidad y la existencia de quiebre


estructural.
b) De haber incumplimiento de algún supuesto proponga un modelo alternativo que
mejore la explicación de las importaciones en el periodo 1971 -1997, especifique con
detalle el modelo.

Dependent Variable: IMPORT


Method: Least Squares
Date: 06/18/15 Time: 23:15 Sample (adjusted): 1971
1997
Included observations: 27 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C -5442255. 1167971. -4.659580 0.0001


CONSUMO 0.812180 0.271779 2.988380 0.0066
CONSUMO(-1) -0.501693 0.271568 -1.847395 0.0776
EXPORT 0.645595 0.114394 5.643612 0.0000

R-squared 0.968259 Mean dependent var 7126477.


Adjusted R-squared 0.964118 S.D. dependent var 3903921.
S.E. of regression 739498.0 Akaike info criterion 30.00128
Sum squared resid 1.26E+13 Schwarz criterion 30.19326
Log likelihood -401.0173 Hannan-Quinn criter. 30.05837
F-statistic 233.8684 Durbin-Watson stat 0.186250
Prob(F-statistic) 0.000000
Empirical Distribution Test for RESID
Hypothesis: Normal
Date: 06/18/15 Time: 23:17 Sample (adjusted):
1971 1997
Included observations: 27 after adjustments

Method Value Adj. Value Probability

Kolmogorov (D+) 0.101263 0.540472 0.5575


Kolmogorov (D-) 0.151799 0.810199 0.2691
Kolmogorov (D) 0.151799 0.810199 0.5276
Kuiper (V) 0.253062 1.365859 0.3098
Cramer-von Mises
(W2) 0.135429 0.125935 0.4395
Watson (U2) 0.115034 0.114770 0.2060
Anderson-Darling
(A2) 0.846403 0.846403 0.4487

0 2.0

-2,000,000
1.5

-4,000,000
1.0
-6,000,000
0.5
-8,000,000

0.0
-10,000,000

-12,000,000 -0.5
76 78 80 82 84 86 88 90 92 94 96 76 78 80 82 84 86 88 90 92 94 96

Recursiv e C(1) Estimates Recursiv e C(2) Estimates


± 2 S.E. ± 2 S.E.

0.4 2

0.0
1

-0.4
0
-0.8

-1
-1.2

-1.6 -2
76 78 80 82 84 86 88 90 92 94 96 76 78 80 82 84 86 88 90 92 94 96

Recursiv e C(3) Estimates Recursiv e C(4) Estimates


± 2 S.E. ± 2 S.E.

Solución

a) Para analizar el cumplimiento del supuesto de normalidad, decimos que si las


perturbaciones 𝜀 tiene una distribución normal multivariante 𝑁(0, 𝜎𝜀2 ), tenemos
que 𝛽̂ 𝑡𝑖𝑒𝑛𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙 𝑁(𝛽, 𝜎𝜀2 (𝑋´𝑋)−1 ). Es decir si las
perturbaciones no son normales no es válido obtener estimaciones interválicas ni
realizar pruebas de hipótesis aplicando las pruebas T, F, Wald, etc.
Para ver el valor 𝑝 de la 𝜀 podemos realizar diversas pruebas, una de ellas es el
Test-Kolmogorov, el cual aplica para pruebas grandes o pequeñas, en este test se
trabajan con probabilidades acumuladas y se plantean las hipótesis:

𝐻0 : 𝑋 𝑒𝑠 𝑛𝑜𝑟𝑚𝑎𝑙
𝐻1 : 𝑋 𝑛𝑜 𝑒𝑠 𝑛𝑜𝑟𝑚𝑎𝑙

Plantemos la frecuencia relativa acumulada:

𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = 𝑝
𝑛𝑖
𝐷𝑜𝑛𝑑𝑒: 𝑝 =
𝑛
Para:

𝑃: 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑡𝑒ó𝑟𝑖𝑐𝑎
𝑝: 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑒𝑚𝑝í𝑟𝑖𝑐𝑎

Estadistico

𝑫 = 𝒎á𝒙{(𝑷 − 𝒑)}

Para un nivel de significancia: ∝


Si: 𝜕 > 𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 (1−∝)
Sin embargo, en el problema planteado se tienen los resultados del test-
kolmogorov con |𝐷|

Date: 06/18/15 Time: 23:17 Sample (adjusted):


1971 1997
Included observations: 27 after adjustments

Method Value Adj. Value Probability

Kolmogorov (D+) 0.101263 0.540472 0.5575


Kolmogorov (D-) 0.151799 0.810199 0.2691
Kolmogorov (D) 0.151799 0.810199 0.5276
Kuiper (V) 0.253062 1.365859 0.3098
Cramer-von Mises
(W2) 0.135429 0.125935 0.4395
Watson (U2) 0.115034 0.114770 0.2060
Anderson-Darling
(A2) 0.846403 0.846403 0.4487

Se observa que el Test tiene un nivel de probabilidad de 0.5276, lo cual nos dice
que tiene un 𝑝 > 5% , es decir alcanza significancia. Por lo cual la perturbación
es normal y no hay problema con el modelo porque es normal 𝑁(0, 𝜎𝜀2 ).
 Para evaluar la existencia del quiebre estructural, planteamos:

𝐻0 : 𝐶𝑜𝑛𝑠𝑢𝑚𝑜(−1) 𝑒𝑠 𝑛𝑜 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜
𝐻1 : 𝐶𝑜𝑛𝑠𝑢𝑚𝑜(−1) 𝑒𝑠 𝑠𝑖𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜
Para un nivel de significancia de 5%

0.05
𝐹(4,24) = 2,78

Estadistica

F=233.8684
Por lo cual:

0 0.05
𝐹(4,24) = 2,78 F=233.8684

ZONA DE NO ZONA DE
RECHAZO RECHAZO

Entonces se rechaza la hipótesis nula y se acepta la alternativa, es decir


𝐻1 : 𝐶𝑜𝑛𝑠𝑢𝑚𝑜(−1) 𝑒𝑠 𝑠𝑖𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜 entonces existe quiebre estructural.
Además, en los 4 gráficos que se brindó inicialmente, que son las estimaciones
interválicas para las estimaciones 𝛽 a lo largo del tiempo, observamos claramente un
quiebre estructural tanto para el intercepto como para los parámetros del modelo.

a) De haber incumplimiento de algún supuesto proponga un modelo alternativo que


mejore la explicación de las importaciones en el periodo 1971 -1997, especifique con
detalle el modelo.

Entonces, luego de concluir en el apartado a) que existe quiebre, se debe analizar ahora
las significancias de los parámetros. En la cual observamos que en la regresión siguiente:

Dependent Variable: IMPORT


Method: Least Squares
Date: 06/18/15 Time: 23:15 Sample (adjusted): 1971
1997
Included observations: 27 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C -5442255. 1167971. -4.659580 0.0001


CONSUMO 0.812180 0.271779 2.988380 0.0066
CONSUMO(-1) -0.501693 0.271568 -1.847395 0.0776
EXPORT 0.645595 0.114394 5.643612 0.0000

R-squared 0.968259 Mean dependent var 7126477.


Adjusted R-squared 0.964118 S.D. dependent var 3903921.
S.E. of regression 739498.0 Akaike info criterion 30.00128
Sum squared resid 1.26E+13 Schwarz criterion 30.19326
Log likelihood -401.0173 Hannan-Quinn criter. 30.05837
F-statistic 233.8684 Durbin-Watson stat 0.186250
Prob(F-statistic) 0.000000

La variable consumo (-1) tiene un P-value de 0.0776, en la cual sería no significativo: es


mayor al 5%. Por lo tanto, no toma relevancia este variable consumo rezagada un periodo
para explicar las importaciones actuales. Además, no se cumple el supuesto de no
multicolinealidad pues:

CONSUMO CONSUMO(-1) EXPORT


CONSUMO 1.000000 0.995247 0.927140
CONSUMO(-1) 0.995247 1.000000 0.928077
EXPORT 0.927140 0.928077 1.000000

Como se observa, el anterior gráfico es la matriz de correlación entre las variables


explicativas. Sin embargo, debemos analizar el Factor de inflación de la varianza (FIV)
del coeficiente de una variable explicativa para poder hallar o detectar si existe un
problema de multicolinealidad. Entonces tenemos:

Variance Inflation Factors


Date: 05/16/18 Time: 19:06
Sample: 1970 1997
Included observations: 27

Coefficient Uncentered Centered


Variable Variance VIF VIF

C 1.36E+12 67.35256 NA
CONSUMO 0.073864 2522.494 106.4299
CONSUMO(-1) 0.073749 2389.156 107.7627
EXPORT 0.013086 34.90751 7.277989

Observamos que la parte resaltada, pertenece a la diagonal de la inversa de la matriz de


correlación de las variables explicativas.

Entonces vemos que esos valores son mayores a 10, por lo que existe alta
multicolinealidad; es decir, se rompe uno de los supuestos.
Explicado lo anterior, debemos mejorar el modelo, uno alternativo, donde el consumo (-
1), esto es, la variable rezagada, no esté presente, pues ha dejado de ser relevante como
se explicó anteriormente.

En el proceso de la búsqueda de un nuevo modelo y puesto que sabemos que hubo un


quiebre estructural, debemos definir una variable dummy. Entonces:
Definiendo la dummy:
0: 𝒕 ≤ 𝟏𝟗𝟗𝟐 (antes del quiebre)

1: 𝒕 > 𝟏𝟗𝟗𝟐 (después del quiebre)

Se puso ese año pues, como se dijo en el apartado (a), aparentemente hubo un quiebre
estructural en el año 1992.
Entonces en el software E-views se realizó lo siguiente:

Primero se realizó lo siguiente en el software E-views, de manera que se especifique un


modelo de quiebre estructural:

genr Z=0
smpl 1992 1997
genr Z=1
ls import c consumo export Z Z*consumo Z*export

Sin embargo, el software no nos quiere botar los resultado debido a la multicolinealidad,
por lo que se copia lo siguiente:

smpl @all
y nuevamente:

ls import c consumo export Z Z*consumo Z*export


Entonces tenemos lo siguiente:

Estimation Command:
=========================
LS IMPORT C CONSUMO EXPORT Z Z*CONSUMO Z*EXPORT

Estimation Equation:
=========================
IMPORT = C(1) + C(2)*CONSUMO + C(3)*EXPORT + C(4)*Z +
C(5)*Z*CONSUMO + C(6)*Z*EXPORT

Substituted Coefficients:
=========================
IMPORT = -6963958.8858 + 0.562340598576*CONSUMO -
0.164043178588*EXPORT - 21413151.9398*Z +
0.535011003196*Z*CONSUMO + 0.584441291449*Z*EXPORT
Donde claramente se ve a partir de:

LS IMPORT C CONSUMO EXPORT Z Z*CONSUMO Z*EXPORT


Que las importaciones serán explicadas por el consumo presente y por las exportaciones
presentes. Además, que se incluyó en el quiebre un efecto diferencial Z, como también
dos efectos interactivos; es decir, el producto de la dummy con la variable explicativa
consumo y con las exportaciones. De tal forma que obtuvimos la siguiente regresión:

Dependent Variable: IMPORT


Method: Least Squares
Date: 05/16/18 Time: 20:40
Sample: 1970 1997
Included observations: 28

Variable Coefficient Std. Error t-Statistic Prob.

C -6963959. 1289193. -5.401799 0.0000


CONSUMO 0.562341 0.101505 5.540021 0.0000
EXPORT -0.164043 0.241948 -0.678010 0.5048
Z -21413152 25433619 -0.841923 0.4089
Z*CONSUMO 0.535011 0.856783 0.624442 0.5388
Z*EXPORT 0.584441 0.369644 1.581092 0.1281

R-squared 0.978389 Mean dependent var 6963220.


Adjusted R-squared 0.973477 S.D. dependent var 3927137.
S.E. of regression 639564.5 Akaike info criterion 29.76237
Sum squared resid 9.00E+12 Schwarz criterion 30.04784
Log likelihood -410.6732 Hannan-Quinn criter. 29.84964
F-statistic 199.1997 Durbin-Watson stat 0.311746
Prob(F-statistic) 0.000000

Vemos en la parte resaltada que las probabilidades o P-values son muy altas, por lo que
las variables consumo y exportaciones presente no difieren significativamente de cero.
Entonces lo que debemos hacer es retirar tanto Z*consumo como Z*export por lo que
se dirá que no hubo cambio estructural en los intercepto; es decir, el efecto de ambas
variables cuantitativas sobre la variable importaciones, no variará antes y después del
quiebre. Finalmente, concluimos que debemos cambiar dicho modelo nuevamente.
Entonces, nuevamente trabajando en el E-views, escribiremos:
ls import c consumo export Z
Y realizando la regresión:

Dependent Variable: IMPORT


Method: Least Squares
Date: 05/16/18 Time: 21:08
Sample: 1970 1997
Included observations: 28

Coefficien
Variable t Std. Error t-Statistic Prob.

C -4316836. 1080561. -3.994994 0.0005


CONSUMO 0.313175 0.067477 4.641173 0.0001
EXPORT 0.473895 0.135918 3.486617 0.0019
Z 1434508. 619056.0 2.317250 0.0293

R-squared 0.968430 Mean dependent var 6963220.


Adjusted R-squared 0.964484 S.D. dependent var 3927137.
S.E. of regression 740096.9 Akaike info criterion 29.99851
Sum squared resid 1.31E+13 Schwarz criterion 30.18883
Hannan-Quinn
Log likelihood -415.9792 criter. 30.05669
F-statistic 245.4064 Durbin-Watson stat 0.392229
Prob(F-statistic) 0.000000

Estimation Command:
=========================
LS IMPORT C CONSUMO EXPORT Z

Estimation Equation:
=========================
IMPORT = C(1) + C(2)*CONSUMO + C(3)*EXPORT + C(4)*Z

Substituted Coefficients:
=========================
IMPORT = -4316836.03348 + 0.313174633486*CONSUMO +
0.473895191973*EXPORT + 1434507.50658*Z

Vemos en la parte resaltada de color celeste, en la regresión, que la variable dummy nos
sale significativo, por lo que decimos que hubo un cambio estructural en el intercepto; es
decir, sí habrá un efecto diferencial y, por consecuencia, el modelo para los periodos
después del punto quiebre cambiará, esto es, el intercepto cambiará.
6. Con la data del archivo wage2.wf1 estime el modelo para explicar los ingresos mensuales
(wage) en función de educ (los años de educación), age (la edad en años), married (ser
casado: 1=casado, 0=no casado)
a) Interprete los resultados
b) analice la multicolinealidad y la normalidad de las perturbaciones.
c) De tener algún incumplimiento en el ítem b, evalúe la pertinencia de incluir a las
variables IQ (coeficiente de inteligencia) y urban (Urbana: 1=labora en zona urbana,
0=Labora en zona no urbana)
d) De persistir el incumplimiento, estime el modelo para la variable ln(wage) y haga el
análisis de sus resultados.

Desarrollo:

Interpretación de los resultados

Dependent Variable: WAGE


Method: Least Squares
Date: 05/16/18 Time: 14:55
Sample: 1 460
Included observations: 460

Variable Coefficient Std. Error t-Statistic Prob.

C -653.3847 217.5509 -3.003364 0.0028


EDUC 59.82441 7.918007 7.555488 0.0000
AGE 20.41687 5.654955 3.610440 0.0003
MARRIED 185.4235 56.18344 3.300324 0.0010

R-squared 0.152707 Mean dependent var 1005.246


Adjusted R-squared 0.147132 S.D. dependent var 409.6735
S.E. of regression 378.3368 Akaike info criterion 14.71810
Sum squared resid 65271275 Schwarz criterion 14.75403
Log likelihood -3381.164 Hannan-Quinn criter. 14.73225
F-statistic 27.39480 Durbin-Watson stat 1.872419
Prob(F-statistic) 0.000000

𝑤𝑎𝑔𝑒 = −653.3847 + 59.82441𝑒𝑑𝑢𝑐 + 20.41687𝑎𝑔𝑒 + 185.4235𝑚𝑎𝑟𝑟𝑖𝑒𝑑 + 𝜀𝑡

𝛽1 = −653.3847 Es valor autónomo o intercepto.

𝛽2 = 59.82441 : Esta nos dice que los ingresos aumentarán en promedio en 59.8
unidades monetarias por cada unidad de aumento de la educación manteniendo
constantes las demás variables.

𝛽3 = 20.41687 : Esta nos dice que los ingresos aumentarán en promedio en 20.4
unidades monetarias por cada unidad de aumento de años manteniendo constantes las
demás variables.
𝛽4 = 185.4235 : Esta nos dice simplemente la diferencia de ingresos entre los casados
y no casados; es decir, en promedio los casados recibirán 185.4 unidades monetarias de
ingreso más que aquellos que no están casados.

d) Analice la multicolinealidad y la normalidad de las perturbaciones:

Para encontrar si nuestro modelo sufre de multicolinealidad alta, debemos analizar los
factores de inflación de las varianzas de los coeficientes de las variables explicativas
(FIV), para eso, hallamos primero la matriz de covarianzas de las explicativas, de tal
forma que, luego, calculemos su inversa, cuya diagonal tendrá como elementos a dichos
factores de inflación.

Matriz de Correlaciones:

EDUC AGE MARRIED


EDUC 1.000000 0.013162 -0.058013
AGE 0.013162 1.000000 0.115201
MARRIED -0.058013 0.115201 1.000000

Hallamos los factores de inflación de la varianza de las variables:

Variance Inflation Factors


Date: 05/16/18 Time: 16:23
Sample: 1 460
Included observations: 460

Coefficient Uncentered Centered


Variable Variance VIF VIF

C 47328.42 152.0977 NA
EDUC 62.69484 38.57995 1.003779
AGE 31.97852 114.0667 1.013856
MARRIED 3156.579 8.997452 1.017103

Donde la parte resaltada serían los elementos de la inversa de la matriz de correlaciones.

Finalmente, concluimos que los valores son menores a 10. Por lo que concluimos que el
modelo no sufre de multicolinealidad alta.

Luego, en el caso de la normalidad de las perturbaciones, usamos el test de Jarque-Bera.


Tenemos el siguiente histograma:
60
Series: Residuals
Sample 1 460
50
Observations 460

40 Mean 1.39e-13
Median -24.73073
30 Maximum 1973.412
Minimum -868.7355
Std. Dev. 377.0984
20
Skewness 1.166321
Kurtosis 6.144713
10
Jarque-Bera 293.8335
0 Probability 0.000000
-800 -400 0 400 800 1200 1600 2000

En la cual tenemos la siguiente condición para nuestro test:


2
𝐽𝐵 ≤ 𝑥(5%;2) = 5.99

Y las siguientes hipótesis:

𝐻0 = 𝜀 𝑡𝑖𝑒𝑛𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙

𝐻1 = 𝜀 𝑛𝑜 𝑡𝑖𝑒𝑛𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙

Mientras más cercano esté a cero nuestro valor JB, aceptaremos la hipótesis nula.
Además, el JB sale 293.8335, lo cual fácilmente concluimos que la perturbación no sigue
una distribución normal.

e) De tener algún incumplimiento en el ítem b, evalúe la pertinencia de incluir a las


variables IQ (coeficiente de inteligencia) y urban (Urbana: 1=labora en zona urbana,
0=Labora en zona no urbana):

Dependent Variable: WAGE


Method: Least Squares
Date: 05/16/18 Time: 16:26
Sample: 1 460
Included observations: 460

Variable Coefficient Std. Error t-Statistic Prob.

C -1244.743 236.5864 -5.261261 0.0000


EDUC 41.94448 8.806658 4.762815 0.0000
AGE 23.30239 5.449195 4.276299 0.0000
MARRIED 198.2025 53.97840 3.671886 0.0003
IQ 5.306824 1.423705 3.727475 0.0002
URBAN 221.9928 40.92326 5.424611 0.0000

R-squared 0.223435 Mean dependent var 1005.246


Adjusted R-squared 0.214883 S.D. dependent var 409.6735
S.E. of regression 362.9987 Akaike info criterion 14.63963
Sum squared resid 59822687 Schwarz criterion 14.69352
Log likelihood -3361.116 Hannan-Quinn criter. 14.66085
F-statistic 26.12525 Durbin-Watson stat 1.939300
Prob(F-statistic) 0.000000

Vemos que las variables son significativas; sin embargo, el problema de normalidad aún
persiste:

80
Series: Residuals
70 Sample 1 460
Observations 460
60

50
Mean 1.22e-13
Median -32.94769
40 Maximum 1839.620
Minimum -811.9635
30 Std. Dev. 361.0161
Skewness 1.162503
20
Kurtosis 6.148904
10
Jarque-Bera 293.6574
0 Probability 0.000000
-800 -400 0 400 800 1200 1600

Pues el Jaque-Bera que es 293.6574 está muy alejado de 0. Por lo que se sigue
rechazando la hipótesis nula: que la distribución de la perturbación es normal.

f) De persistir el incumplimiento, estime el modelo para la variable ln(wage) y haga el


análisis de sus resultados.

MODELO

Dependent Variable: LNWAGE


Method: Least Squares
Date: 05/16/18 Time: 16:32
Sample: 1 460
Included observations: 460

Variable Coefficient Std. Error t-Statistic Prob.

C 4.589041 0.226984 20.21742 0.0000


EDUC 0.036390 0.008449 4.306871 0.0000
AGE 0.023568 0.005228 4.507939 0.0000
MARRIED 0.218490 0.051788 4.218961 0.0000
IQ 0.005654 0.001366 4.139192 0.0000
URBAN 0.233935 0.039262 5.958240 0.0000

R-squared 0.236858 Mean dependent var 6.835596


Adjusted R-squared 0.228453 S.D. dependent var 0.396488
S.E. of regression 0.348266 Akaike info criterion 0.741259
Sum squared resid 55.06539 Schwarz criterion 0.795144
Log likelihood -164.4895 Hannan-Quinn criter. 0.762478
F-statistic 28.18180 Durbin-Watson stat 1.938265
Prob(F-statistic) 0.000000

𝛽1 = 4.589041: Es simplemente el intercepto o valor autónomo.

𝛽2 = 0.036390: Por cada 10 años que aumente la educación, los ingresos aumentarán
en un 0.364%

𝛽3 = 0.023568: Por cada 10 años de edad que aumente una persona, los ingresos
aumentarán en 0.236%

𝛽4 = 0.218490: Esta variable nos dice la diferencia promedio de ingresos entre


aquellos que están casados y aquellos que no lo están; es decir, una persona casada
recibirá en promedio un 21.85% más de ingreso que otra persona que no esté casada.

𝛽5 = 0.005654: Por cada 100 puntos que aumente el IQ, los ingresos aumentarán en un
0.57%

𝛽6 = 0.233935: Esta variable nos dice la diferencia promedio de ingresos entre


aquellos aquellos que laboran en zona urbana y aquellos que no; es decir, una persona
que trabaja en una zona urbana recibirá en promedio un 23.39% más de ingreso que otra
que no labore en una zona urbana.

EDUC AGE MARRIED IQ URBAN


EDUC 1.000000 0.013162 -0.058013 0.502031 0.035086
AGE 0.013162 1.000000 0.115201 -0.062223 -0.048194
MARRIED -0.058013 0.115201 1.000000 -0.027635 -0.058346
IQ 0.502031 -0.062223 -0.027635 1.000000 -0.023725
URBAN 0.035086 -0.048194 -0.058346 -0.023725 1.000000
60
Series: Residuals
Sample 1 460
50
Observations 460

40 Mean 1.34e-15
Median 0.012083
30 Maximum 1.009773
Minimum -1.341453
Std. Dev. 0.346364
20
Skewness -0.195755
Kurtosis 3.606120
10
Jarque-Bera 9.979342
0 Probability 0.006808
-1.0 -0.5 0.0 0.5 1.0