Вы находитесь на странице: 1из 31

FACULTAD DE CIENCIAS EMPRESARIALES Y ECONMICAS

Nombre de la Asignatura

Econometra I

Tipo de Material

GUIA PARA RESOLVER PROBLEMAS

FUENTE: INTRODUCCIN A LA ECONOMETRA

Profesor Responsable:
ROSENDO RAMIREZ TAZA

1
Contenido

Contenido
1. Modelo de Regresin Simple ............................................................................................... 4
2. Modelo de Regresin Mltiple............................................................................................. 7
2.1 Problema de la Heterocedasticidad .............................................................................. 9
2.2 Problema de Correlacin Serial ................................................................................... 12
2.2.1 Pruebas de Correlacin Serial ................................................................................. 23
2.2.2 Correccin de la Correlacin Serial ......................................................................... 26

2
Introduccin
La presente gua para resolver problemas asociados al modelamiento de Mnimos
Cuadrados Ordinarios utiliza la informacin del texto Introduccin a la Econometra del
Profesor Jeffrey Wooldridge que son utilizados en clase.
Es una gua donde se muestra la programacin, resultados e interpretacin econmica
y estadstica de los modelos que se estudian.
En la gua se utiliza el software Eviews y STATA. En una siguiente edicin se utilizar
un software abierto como el R Software que es de acceso gratuito a los estudiantes y
que se encuentra instalado en las computadoras de la Escuela de Negocios de la
Universidad de Lima.
Tambin queda como tarea pendiente una gua para los modelos de panel data que se
utilizan en Econometra III.

3
Gua de Econometra I

1. Modelo de Regresin Simple


La base de datos 401k incluye las variables prate y mrate. Donde prate es el
porcentaje de trabajadores que estn inscritos en el plan de pensiones. La
variable mrate es la cantidad promedio con la que la empresa contribuye al plan
de cada trabajador por cada $ 1 que aporta el trabajador. Podemos estimar un
modelo de regresin simple: = 0 + 1

. clear all

. cd "C:\Users\DELL\Documents\ulima\usb2\econometria_I\capitulo2"
C:\Users\DELL\Documents\ulima\usb2\econometria_I\capitulo2

. use 401k

. summarize prate

Variable Obs Mean Std. Dev. Min Max

prate 1534 87.36291 16.71654 3 100

. summarize mrate

Variable Obs Mean Std. Dev. Min Max

mrate 1534 .7315124 .7795393 .01 4.91

. reg prate mrate

Source SS df MS Number of obs = 1534


F( 1, 1532) = 123.68
Model 32001.7271 1 32001.7271 Prob > F = 0.0000
Residual 396383.812 1532 258.73617 R-squared = 0.0747
Adj R-squared = 0.0741
Total 428385.539 1533 279.442622 Root MSE = 16.085

prate Coef. Std. Err. t P>|t| [95% Conf. Interval]

mrate 5.861079 .5270107 11.12 0.000 4.82734 6.894818


_cons 83.07546 .5632844 147.48 0.000 81.97057 84.18035

. margins, dydx(mrate)

Average marginal effects Number of obs = 1534


Model VCE : OLS

Expression : Linear prediction, predict()


dy/dx w.r.t. : mrate

Delta-method
dy/dx Std. Err. z P>|z| [95% Conf. Interval]

mrate 5.861079 .5270107 11.12 0.000 4.828157 6.894001

El efecto marginal de mrate sobre prate es 5.861079 y es estadsticamente


significativa con un nivel de significancia de 0.05.

Problema 2

La base de datos ceosal contiene informacin sobre directores generales de


empresas (CEO) de los Estados Unidos. La variable salary es el sueldo anual en
miles de dlares y la variable ceoten son los aos de antigedad como CEO de
las empresas. Se estima el siguiente modelo: log() = 0 + 1 +
4
Los salarios anuales tienen un rango desde 100 mil a 5299 miles de dlares
anuales, el valor promedio es de 865.86 miles de dlares. Los CEOs tienen una
antigedad en la empresa en el rango de 0 a 37 aos, con un promedio de 7.95
aos.

. clear all

. cd "C:\Users\DELL\Documents\ulima\usb2\econometria_I\capitulo2"
C:\Users\DELL\Documents\ulima\usb2\econometria_I\capitulo2

. use ceosal2

. summarize salary ceoten

Variable Obs Mean Std. Dev. Min Max

salary 177 865.8644 587.5893 100 5299


ceoten 177 7.954802 7.150826 0 37

. codebook salary ceoten

salary 1990 compensation, $1000s

type: numeric (int)

range: [100,5299] units: 1


unique values: 166 missing .: 0/177

mean: 865.864
std. dev: 587.589

percentiles: 10% 25% 50% 75% 90%


358 471 707 1119 1550

ceoten years as ceo with company

type: numeric (byte)

range: [0,37] units: 1


unique values: 28 missing .: 0/177

mean: 7.9548
std. dev: 7.15083

percentiles: 10% 25% 50% 75% 90%


1 3 6 11 18

Se observa que 5 CEOs tienen 0 aos en la empresa, son las observaciones 85,
129, 137, 170 y 177.

El efecto marginal de ceoten en lsalary es 0.0097236, sin embargo, no es


estadsticamente significativo con un nivel de significancia de 0.05.

Si formulamos un nuevo modelo log() = 0 + 1 log() +

La elasticidad de ceoten en el salario es igual a 0.10723 y es estadsticamente


significativa con un nivel de confianza de 0.05.

5
. list ceoten if ceoten==0

ceoten

85. 0
129. 0
137. 0
170. 0
177. 0

. reg lsalary ceoten

Source SS df MS Number of obs = 177


F( 1, 175) = 2.33
Model .850907024 1 .850907024 Prob > F = 0.1284
Residual 63.795306 175 .364544606 R-squared = 0.0132
Adj R-squared = 0.0075
Total 64.6462131 176 .367308029 Root MSE = .60378

lsalary Coef. Std. Err. t P>|t| [95% Conf. Interval]

ceoten .0097236 .0063645 1.53 0.128 -.0028374 .0222846


_cons 6.505498 .0679911 95.68 0.000 6.37131 6.639686

. margins, dydx(ceoten)

Average marginal effects Number of obs = 177


Model VCE : OLS

Expression : Linear prediction, predict()


dy/dx w.r.t. : ceoten

Delta-method
dy/dx Std. Err. z P>|z| [95% Conf. Interval]

ceoten .0097236 .0063645 1.53 0.127 -.0027505 .0221978

. g lceoten = ln(ceoten)
(5 missing values generated)

. reg lsalary lceoten

Source SS df MS Number of obs = 172


F( 1, 170) = 4.56
Model 1.65654745 1 1.65654745 Prob > F = 0.0342
Residual 61.7744847 170 .363379322 R-squared = 0.0261
Adj R-squared = 0.0204
Total 63.4310322 171 .370941709 Root MSE = .60281

lsalary Coef. Std. Err. t P>|t| [95% Conf. Interval]

lceoten .10723 .0502221 2.14 0.034 .0080908 .2063692


_cons 6.408949 .0982152 65.25 0.000 6.215071 6.602828

. margins, dydx(lceoten)

Average marginal effects Number of obs = 172


Model VCE : OLS

Expression : Linear prediction, predict()


dy/dx w.r.t. : lceoten

Delta-method
dy/dx Std. Err. z P>|z| [95% Conf. Interval]

lceoten .10723 .0502221 2.14 0.033 .0087966 .2056635

6
2. Modelo de Regresin Mltiple
La base de datos wage1 incluye variables como el salario por hora (wage), aos
de educacin (educ), aos de experiencia (exper) y aos de antigedad en el
empleo actual (tenure).
Se tiene el siguiente modelo que explica los salarios

= 0 + 1 + 2 + 3 +

. use wage1

. *regresion simple
. reg wage educ exper tenure

Source SS df MS Number of obs = 526


F( 3, 522) = 76.87
Model 2194.1116 3 731.370532 Prob > F = 0.0000
Residual 4966.30269 522 9.51398984 R-squared = 0.3064
Adj R-squared = 0.3024
Total 7160.41429 525 13.6388844 Root MSE = 3.0845

wage Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ .5989651 .0512835 11.68 0.000 .4982176 .6997126


exper .0223395 .0120568 1.85 0.064 -.0013464 .0460254
tenure .1692687 .0216446 7.82 0.000 .1267474 .2117899
_cons -2.872735 .7289643 -3.94 0.000 -4.304799 -1.440671

. estat hettest, rhs normal

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity


Ho: Constant variance
Variables: educ exper tenure

chi2(3) = 139.52
Prob > chi2 = 0.0000

. estat ovtest

Ramsey RESET test using powers of the fitted values of wage


Ho: model has no omitted variables
F(3, 519) = 7.92
Prob > F = 0.0000
. estat vif

Variable VIF 1/VIF

exper 1.48 0.676765


tenure 1.35 0.741127
educ 1.11 0.898658

Mean VIF 1.31

De acuerdo a los resultados de las pruebas de heterocedasticidad y especificacin


del modelo podemos concluir: (i) Mediante la prueba de Breusch-Pagan, la
condicin de homocedasticidad (/) = 2 es rechaza con un nivel de
significancia de 0.05. (ii) La prueba de especificacin correcta del modelo
Ramsey RESET indica que el modelo no est correctamente especificado con un
nivel de significancia de 0.05. En cuanto a la prueba de multicolinealidad, se
observa que no se encuentra este problema en el modelo, los valores de factor de
inflacin de varianza de las variables exper, tenure y educ son menores a 10.

Alternativamente podemos tener un modelo:


log() = 0 + 1 + 2 + 3 +

7
En este caso se observa que tambin el modelo presenta problemas de
heterocedasticidad e incorrecta especificacin.

. reg lwage educ exper tenure

Source SS df MS Number of obs = 526


F( 3, 522) = 80.39
Model 46.8741776 3 15.6247259 Prob > F = 0.0000
Residual 101.455574 522 .194359337 R-squared = 0.3160
Adj R-squared = 0.3121
Total 148.329751 525 .28253286 Root MSE = .44086

lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ .092029 .0073299 12.56 0.000 .0776292 .1064288


exper .0041211 .0017233 2.39 0.017 .0007357 .0075065
tenure .0220672 .0030936 7.13 0.000 .0159897 .0281448
_cons .2843595 .1041904 2.73 0.007 .0796756 .4890435

. estat hettest, rhs

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity


Ho: Constant variance
Variables: educ exper tenure

chi2(3) = 16.02
Prob > chi2 = 0.0011

. estat ovtest

Ramsey RESET test using powers of the fitted values of lwage


Ho: model has no omitted variables
F(3, 519) = 4.36
Prob > F = 0.0048

. estat vif

Variable VIF 1/VIF

exper 1.48 0.676765


tenure 1.35 0.741127
educ 1.11 0.898658

Mean VIF 1.31

Los problemas de heterocedasticidad y especificacin incorrecta sern abordado


en otros problemas, por ahora lo que interesa es entender que los supuestos de
MCO no se cumplen.

Si analizamos otra base de datos wage2 en donde el salario se mide en el ingreso


mensual, encontramos que el modelo no presenta problemas de variables
omitidas. Debemos precisar que es una base de datos distinta a la base de datos
wage1. El modelo ahora presenta problemas de heterocedasticidad. Corregimos
el problema de la heterocedasticidad con la regresin robusta considerando una
forma especfica de la heterocedasticidad, en este una heterocedasticidad de la
forma White.

8
. use wage2

. reg lwage educ exper tenure

Source SS df MS Number of obs = 935


F( 3, 931) = 56.97
Model 25.6953242 3 8.56510806 Prob > F = 0.0000
Residual 139.960959 931 .150334005 R-squared = 0.1551
Adj R-squared = 0.1524
Total 165.656283 934 .177362188 Root MSE = .38773

lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ .0748638 .0065124 11.50 0.000 .062083 .0876446


exper .0153285 .0033696 4.55 0.000 .0087156 .0219413
tenure .0133748 .0025872 5.17 0.000 .0082974 .0184522
_cons 5.496696 .1105282 49.73 0.000 5.279782 5.713609

. estat ovtest

Ramsey RESET test using powers of the fitted values of lwage


Ho: model has no omitted variables
F(3, 928) = 0.12
Prob > F = 0.9502

. estat hettest, rhs

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity


Ho: Constant variance
Variables: educ exper tenure

chi2(3) = 43.33
Prob > chi2 = 0.0000

. reg lwage educ exper tenure, robust

Linear regression Number of obs = 935


F( 3, 931) = 56.53
Prob > F = 0.0000
R-squared = 0.1551
Root MSE = .38773

Robust
lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ .0748638 .0066536 11.25 0.000 .061806 .0879216


exper .0153285 .0034053 4.50 0.000 .0086455 .0220114
tenure .0133748 .0026574 5.03 0.000 .0081596 .01859
_cons 5.496696 .1120298 49.06 0.000 5.276836 5.716556

2.1 Problema de la Heterocedasticidad

Para esta parte utilizamos la base de datos hprice1. El modelo a estimar es

El modelo presenta problemas de especificacin, utilizando la prueba Ramsey


RESET se rechaza la hiptesis nula con un nivel de significancia de 0.05.

Si el modelo es estimado en logaritmos encontramos que el modelo se encuentra


correctamente especificado. No se rechaza la hiptesis nula con un nivel de
significancia de 0.05, es decir el modelo no tiene variables omitidas.

9
. use hprice1

. reg price lotsize sqrft bdrms

Source SS df MS Number of obs = 88


F( 3, 84) = 57.46
Model 617130.701 3 205710.234 Prob > F = 0.0000
Residual 300723.805 84 3580.0453 R-squared = 0.6724
Adj R-squared = 0.6607
Total 917854.506 87 10550.0518 Root MSE = 59.833

price Coef. Std. Err. t P>|t| [95% Conf. Interval]

lotsize .0020677 .0006421 3.22 0.002 .0007908 .0033446


sqrft .1227782 .0132374 9.28 0.000 .0964541 .1491022
bdrms 13.85252 9.010145 1.54 0.128 -4.065141 31.77018
_cons -21.77031 29.47504 -0.74 0.462 -80.38466 36.84405

. estat ovtest

Ramsey RESET test using powers of the fitted values of price


Ho: model has no omitted variables
F(3, 81) = 4.26
Prob > F = 0.0076

. reg lprice llotsize lsqrft bdrms

Source SS df MS Number of obs = 88


F( 3, 84) = 50.42
Model 5.15504028 3 1.71834676 Prob > F = 0.0000
Residual 2.86256324 84 .034078134 R-squared = 0.6430
Adj R-squared = 0.6302
Total 8.01760352 87 .092156362 Root MSE = .1846

lprice Coef. Std. Err. t P>|t| [95% Conf. Interval]

llotsize .1679667 .0382812 4.39 0.000 .0918404 .244093


lsqrft .7002324 .0928652 7.54 0.000 .5155597 .8849051
bdrms .0369584 .0275313 1.34 0.183 -.0177906 .0917074
_cons -1.297042 .6512836 -1.99 0.050 -2.592191 -.001893

. estat ovtest

Ramsey RESET test using powers of the fitted values of lprice


Ho: model has no omitted variables
F(3, 81) = 2.45
Prob > F = 0.0692

El siguiente paso es investigar si el modelo presenta problemas de


heterocedasticidad. Como se observa, se rechaza la hiptesis nula que la
varianza de los errores es constante (homocedasticidad). Por tanto, el modelo
presenta problemas de heterocedasticidad.

. estat hettest, rhs

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity


Ho: Constant variance
Variables: llotsize lsqrft bdrms

chi2(3) = 10.69
Prob > chi2 = 0.0135

Para corregir el problema de la heterocedasticidad podemos estimar el modelo en


su versin robusta. Se observa que las variables llotsize y lsqrft son
estadsticamente significativas con un nivel de significancia de 0.05.

10
. reg lprice llotsize lsqrft bdrms, robust

Linear regression Number of obs = 88


F( 3, 84) = 49.32
Prob > F = 0.0000
R-squared = 0.6430
Root MSE = .1846

Robust
lprice Coef. Std. Err. t P>|t| [95% Conf. Interval]

llotsize .1679667 .0414734 4.05 0.000 .0854922 .2504412


lsqrft .7002324 .1038288 6.74 0.000 .4937574 .9067074
bdrms .0369584 .0306011 1.21 0.231 -.0238953 .0978121
_cons -1.297042 .7813145 -1.66 0.101 -2.850771 .2566876

Tambin tenemos la opcin de especificar otras formas funcionales de la


Heterocedasticidad.

. reg lprice llotsize lsqrft bdrms, vce(hc2)

Linear regression Number of obs = 88


F( 3, 84) = 48.18
Prob > F = 0.0000
R-squared = 0.6430
Root MSE = .1846

Robust HC2
lprice Coef. Std. Err. t P>|t| [95% Conf. Interval]

llotsize .1679667 .0462581 3.63 0.000 .0759774 .259956


lsqrft .7002324 .1105004 6.34 0.000 .4804902 .9199747
bdrms .0369584 .0325074 1.14 0.259 -.027686 .1016029
_cons -1.297042 .8039352 -1.61 0.110 -2.895755 .3016715

. reg lprice llotsize lsqrft bdrms, vce(hc3)

Linear regression Number of obs = 88


F( 3, 84) = 44.82
Prob > F = 0.0000
R-squared = 0.6430
Root MSE = .1846

Robust HC3
lprice Coef. Std. Err. t P>|t| [95% Conf. Interval]

llotsize .1679667 .053275 3.15 0.002 .0620236 .2739098


lsqrft .7002324 .1213923 5.77 0.000 .4588305 .9416343
bdrms .0369584 .0355755 1.04 0.302 -.0337875 .1077043
_cons -1.297042 .8504573 -1.53 0.131 -2.98827 .3941857

Si tomamos como referencia el modelo con la estimacin robusta procedemos a


realizar las inferencias.

11
. reg lprice llotsize lsqrft bdrms, robust

Linear regression Number of obs = 88


F( 3, 84) = 49.32
Prob > F = 0.0000
R-squared = 0.6430
Root MSE = .1846

Robust
lprice Coef. Std. Err. t P>|t| [95% Conf. Interval]

llotsize .1679667 .0414734 4.05 0.000 .0854922 .2504412


lsqrft .7002324 .1038288 6.74 0.000 .4937574 .9067074
bdrms .0369584 .0306011 1.21 0.231 -.0238953 .0978121
_cons -1.297042 .7813145 -1.66 0.101 -2.850771 .2566876

Mediante la prueba de hiptesis de un solo parmetro, es decir la prueba t


podemos determinar si cada una de las variables llotsize, lsqrft y bdrms es
estadsticamente significativa. Con un nivel de significancia de 0.05 concluimos
que la variable llotsize y lsqrft son estadsticamente significativas, mientras que la
variable bdrms no es estadsticamente significativa.

. test llotsize

( 1) llotsize = 0

F( 1, 84) = 9.94
Prob > F = 0.0022
. test lsqrft

( 1) lsqrft = 0

F( 1, 84) = 33.27
Prob > F = 0.0000

. test bdrms

( 1) bdrms = 0

F( 1, 84) = 1.08
Prob > F = 0.3018

Tambin podemos hacer una prueba conjunta que las variables llotsize y lsqrft son
conjuntamente significativas con un nivel de significancia de 0.05.

. test (llotsize=0) (lsqrft=0)

( 1) llotsize = 0
( 2) lsqrft = 0

F( 2, 84) = 33.23
Prob > F = 0.0000

2.2 Problema de Correlacin Serial

Utilizaremos la programacin en Eviews para esta parte de la gua.

Utilizamos la base de datos hseinv que contiene variables como la inversion real
en vivienda percpita en miles de dlares (invpc) y un ndice de precio de vivienda
(price), igual a 1 en 1982.

Para el anlisis de las series de tiempo, se recomienda investigar las tendencias


que tienen las series.
Podemos observar la evolucin de las variables, en este caso las dos variables
tienen tendencia.

12
cd "K:\econometria_I\capitulo10"
wfopen hseinv
graph figura1.line(s) log(invpc)
graph figura2.line(s) log(price)
graph figura3.merge figura1 figura2

LOG(INVPC)
-0.3

-0.4

-0.5

-0.6

-0.7

-0.8

-0.9

-1.0

-1.1
5 10 15 20 25 30 35 40

LOG(PRICE)
.05

.00

-.05

-.10

-.15

-.20

-.25
5 10 15 20 25 30 35 40

La siguiente regresin no considera la tendencia que tienen las variables. En este


tipo de regresin estamos ante un problema de regresin espuria. La elasticidad
de la inversin percpita respecto al precio es positiva cuando debera ser
negativa.

Dependent Variable: LOG(INVPC)


Method: Least Squares
Date: 06/29/16 Time: 08:39
Sample: 1 42
Included observations: 42

Variable Coefficient Std. Error t-Statistic Prob.

LOG(PRICE) 1.240943 0.382419 3.244981 0.0024


C -0.550235 0.043027 -12.78824 0.0000

R-squared 0.208390 Mean dependent var -0.666155


Adjusted R-squared 0.188599 S.D. dependent var 0.172543
S.E. of regression 0.155423 Akaike info criterion -0.838881
Sum squared resid 0.966256 Schwarz criterion -0.756135
Log likelihood 19.61651 Hannan-Quinn criter. -0.808552
F-statistic 10.52990 Durbin-Watson stat 0.814165
Prob(F-statistic) 0.002376

La prueba de variable omitida indica que la variable t (tendencia) es omitida en el


modelo anterior. La hiptesis nula de esta prueba de omisin de variables es que
la variable que se adiciona no es significativa.

equation model1.ls log(invpc) log(price) c


testadd t

13
Omitted Variables Test
Equation: MODEL1
Specification: LOG(INVPC) LOG(PRICE) C
Omitted Variables: T

Value df Probability
t-statistic 2.798444 39 0.0079
F-statistic 7.831291 (1, 39) 0.0079
Likelihood ratio 7.685577 1 0.0056

F-test summary:
Sum of Sq... df Mean Squares
Test SSR 0.161581 1 0.161581
Restricted SSR 0.966256 40 0.024156
Unrestricted SSR 0.804675 39 0.020633

LR test summary:
Value df
Restricted LogL 19.61651 40
Unrestricted LogL 23.45930 39

Unrestricted Test Equation:


Dependent Variable: LOG(INVPC)
Method: Least Squares
Date: 06/29/16 Time: 08:49
Sample: 1 42
Included observations: 42

Variable Coefficien... Std. Error t-Statistic Prob.

LOG(PRICE) -0.380961 0.678835 -0.561198 0.5779


C -0.913060 0.135613 -6.732814 0.0000
T 0.009829 0.003512 2.798444 0.0079

R-squared 0.340765 Mean dependent var -0.666155


Adjusted R-squared 0.306958 S.D. dependent var 0.172543
S.E. of regression 0.143641 Akaike info criterion -0.974252
Sum squared resid 0.804675 Schwarz criterion -0.850133
Log likelihood 23.45930 Hannan-Quinn criter. -0.928758
F-statistic 10.07976 Durbin-Watson stat 1.048727
Prob(F-statistic) 0.000296

Procedemos entonces a incluir la variable t (tendencia). Ahora, la elasticidad de la


inversin percpita respecto al precio es negativa que tiene sentido econmico,
sin embargo no es estadsticamente significativa al 0.05. La tendencia es
significativa.

Dependent Variable: LOG(INVPC)


Method: Least Squares
Date: 06/29/16 Time: 08:56
Sample: 1 42
Included observations: 42

Variable Coefficient Std. Error t-Statistic Prob.

LOG(PRICE) -0.380961 0.678835 -0.561198 0.5779


T 0.009829 0.003512 2.798444 0.0079
C -0.913060 0.135613 -6.732814 0.0000

R-squared 0.340765 Mean dependent var -0.666155


Adjusted R-squared 0.306958 S.D. dependent var 0.172543
S.E. of regression 0.143641 Akaike info criterion -0.974252
Sum squared resid 0.804675 Schwarz criterion -0.850133
Log likelihood 23.45930 Hannan-Quinn criter. -0.928758
F-statistic 10.07976 Durbin-Watson stat 1.048727
Prob(F-statistic) 0.000296

Otro ejemplo donde se muestra una interpretacin de los coeficientes del modelo
incluyendo la variable tendencia en la regresin.
Utilizamos la base de datos prminwge que incluye datos sobre la tasa de empleo
en Puerto Rico (prepop) proporcin de personas que trabajan respecto a la
poblacin total, el producto nacional bruto de los EEUU en miles de millones de

14
dlares (usgnp) y la importancia de los salarios mnimos en relacin con los
salarios promedios (mincov).

cd "K:\econometria_I\capitulo10"
wfopen prminwge

Observemos la evolucin de las variables para apreciar la tendencia.

graph figura1.line(s) log(prepop)


graph figura2.line(s) log(mincov)
graph figura3.line(s) log(usgnp)
graph figura4.merge figura1 figura2 figura3
LOG(PREPOP)
-0.7

-0.8

-0.9

-1.0

-1.1

-1.2
5 10 15 20 25 30 35

LOG(MINCOV)
-0.4

-0.8

-1.2

-1.6

-2.0

-2.4
5 10 15 20 25 30 35

LOG(USGNP)
8.4

8.2

8.0

7.8

7.6

7.4

7.2

7.0
5 10 15 20 25 30 35

En el siguiente modelo se observa que un incremento de los salarios mnimos


disminuye la tasa de empleo, tenemos una elasticidad de 0.154. Con un nivel de
significancia, la variable usgnp no es estadsticamente significativa.

equation model1.ls log(prepop) log(mincov) log(usgnp) c

15
Dependent Variable: LOG(PREPOP)
Method: Least Squares
Date: 06/29/16 Time: 09:20
Sample: 1 38
Included observations: 38

Variable Coefficient Std. Error t-Statistic Prob.

LOG(MINCOV) -0.154444 0.064901 -2.379674 0.0229


LOG(USGNP) -0.012189 0.088513 -0.137704 0.8913
C -1.054424 0.765406 -1.377600 0.1771

R-squared 0.660474 Mean dependent var -0.944074


Adjusted R-squared 0.641073 S.D. dependent var 0.092978
S.E. of regression 0.055703 Akaike info criterion -2.861897
Sum squared resid 0.108600 Schwarz criterion -2.732614
Log likelihood 57.37604 Hannan-Quinn criter. -2.815899
F-statistic 34.04250 Durbin-Watson stat 0.339628
Prob(F-statistic) 0.000000

Si en el modelo anterior se adiciona la tendencia, tenemos:

equation model2.ls log(prepop) log(mincov) log(usgnp) t c

Dependent Variable: LOG(PREPOP)


Method: Least Squares
Date: 06/29/16 Time: 09:21
Sample: 1 38
Included observations: 38

Variable Coefficient Std. Error t-Statistic Prob.

LOG(MINCOV) -0.168695 0.044246 -3.812641 0.0006


LOG(USGNP) 1.057351 0.176637 5.986025 0.0000
T -0.032354 0.005023 -6.441579 0.0000
C -8.696303 1.295762 -6.711340 0.0000

R-squared 0.847089 Mean dependent var -0.944074


Adjusted R-squared 0.833597 S.D. dependent var 0.092978
S.E. of regression 0.037928 Akaike info criterion -3.606957
Sum squared resid 0.048910 Schwarz criterion -3.434580
Log likelihood 72.53218 Hannan-Quinn criter. -3.545626
F-statistic 62.78374 Durbin-Watson stat 0.907538
Prob(F-statistic) 0.000000

El incremento del producto nacional bruto en EEUU hace que se incremente la


tasa de empleo en Puerto Rico y es estadsticamente significativo con un nivel de
significancia de 0.05.

Procedemos ahora a estimar ecuaciones de cada una de las variables con sus
respectivas tendencias y obtenemos los residuos de esos modelos. Los siguientes
modelos son corroborados con las figuras presentadas anteriormente. La tasa de
empleo en Puerto Rico tiene una tendencia a disminuir. Los salarios mnimos y la
produccin nacional bruta de los EEUU tienen una tendencia a incrementarse.

equation model_prepop.ls log(prepop) c t


model_prepop.makeresids res_prepop

16
Dependent Variable: LOG(PREPOP)
Method: Least Squares
Date: 06/29/16 Time: 09:27
Sample: 1 38
Included observations: 38

Variable Coefficient Std. Error t-Statistic Prob.

C -0.810256 0.017845 -45.40495 0.0000


T -0.006862 0.000798 -8.603246 0.0000

R-squared 0.672774 Mean dependent var -0.944074


Adjusted R-squared 0.663685 S.D. dependent var 0.092978
S.E. of regression 0.053920 Akaike info criterion -2.951428
Sum squared resid 0.104666 Schwarz criterion -2.865239
Log likelihood 58.07713 Hannan-Quinn criter. -2.920763
F-statistic 74.01585 Durbin-Watson stat 0.374118
Prob(F-statistic) 0.000000

equation model_mincov.ls log(mincov) c t


model_mincov.makeresids res_mincov

Dependent Variable: LOG(MINCOV)


Method: Least Squares
Date: 06/29/16 Time: 09:27
Sample: 1 38
Included observations: 38

Variable Coefficient Std. Error t-Statistic Prob.

C -2.092230 0.050929 -41.08094 0.0000


T 0.039420 0.002276 17.31610 0.0000

R-squared 0.892808 Mean dependent var -1.323539


Adjusted R-squared 0.889831 S.D. dependent var 0.463630
S.E. of regression 0.153887 Akaike info criterion -0.854004
Sum squared resid 0.852521 Schwarz criterion -0.767815
Log likelihood 18.22607 Hannan-Quinn criter. -0.823338
F-statistic 299.8473 Durbin-Watson stat 0.495803
Prob(F-statistic) 0.000000

equation model_usgnp.ls log(usgnp) c t


model_usgnp.makeresids res_usgnp

Dependent Variable: LOG(USGNP)


Method: Least Squares
Date: 06/29/16 Time: 09:27
Sample: 1 38
Included observations: 38

Variable Coefficient Std. Error t-Statistic Prob.

C 7.124499 0.012757 558.4577 0.0000


T 0.030398 0.000570 53.30740 0.0000

R-squared 0.987490 Mean dependent var 7.717266


Adjusted R-squared 0.987142 S.D. dependent var 0.339951
S.E. of regression 0.038548 Akaike info criterion -3.622655
Sum squared resid 0.053493 Schwarz criterion -3.536466
Log likelihood 70.83044 Hannan-Quinn criter. -3.591989
F-statistic 2841.678 Durbin-Watson stat 0.446324
Prob(F-statistic) 0.000000

Con los residuos obtenidos en las variables procedemos a estimar el siguiente


modelo.

equation model_res.ls res_prepop res_mincov res_usgnp

Observamos que los coeficientes son los mismos en ambos modelos. Por tanto,
incluir una tendencia como variable explicativa hace que los betas de ese modelo
puedan ser interpretados como si se hubiese eliminado la tendencia en la relacin
entre las variables.

17
En consecuencia tenemos elasticidad negativa para la tasa de empleo de Puerto
Rico con relacin al salario mnimo y elasticidad positiva del empleo de Puerto
Rico con el producto nacional bruto de los EEUU. Con un nivel de significancia de
0.05, las variables son estadsticamente significativas.

Dependent Variable: RES_PREPOP


Method: Least Squares
Date: 06/29/16 Time: 09:27
Sample: 1 38
Included observations: 38

Variable Coefficient Std. Error t-Statistic Prob.

RES_MINCOV -0.168695 0.043000 -3.923175 0.0004


RES_USGNP 1.057351 0.171660 6.159569 0.0000

R-squared 0.532704 Mean dependent var 2.26E-16


Adjusted R-squared 0.519723 S.D. dependent var 0.053187
S.E. of regression 0.036859 Akaike info criterion -3.712220
Sum squared resid 0.048910 Schwarz criterion -3.626032
Log likelihood 72.53218 Hannan-Quinn criter. -3.681555
Durbin-Watson stat 0.907538

Dependent Variable: LOG(PREPOP)


Method: Least Squares
Date: 06/29/16 Time: 09:21
Sample: 1 38
Included observations: 38

Variable Coefficient Std. Error t-Statistic Prob.

LOG(MINCOV) -0.168695 0.044246 -3.812641 0.0006


LOG(USGNP) 1.057351 0.176637 5.986025 0.0000
T -0.032354 0.005023 -6.441579 0.0000
C -8.696303 1.295762 -6.711340 0.0000

R-squared 0.847089 Mean dependent var -0.944074


Adjusted R-squared 0.833597 S.D. dependent var 0.092978
S.E. of regression 0.037928 Akaike info criterion -3.606957
Sum squared resid 0.048910 Schwarz criterion -3.434580
Log likelihood 72.53218 Hannan-Quinn criter. -3.545626
F-statistic 62.78374 Durbin-Watson stat 0.907538
Prob(F-statistic) 0.000000

Procedemos ahora a analizar series de tiempo dbilmente dependientes. Estamos


en el concepto de series de tiempo estacionarias en covarianza.
Para un proceso estocstico { : = 1,2, } con un segundo momento finito
[(2 ) < ] es estacionario en covarianza si (i) ( ) es constante, (ii) ( ) es
constante y (iii) para cualquier , 1, la ( , + ) depende slo de h y no de
t.

Utilizamos la base de datos nyse que tiene la variable rendimiento promedio


semanal (return)

Observamos la evolucin del rendimiento promedio del ndice compuesto de la


Bolsa de Nueva York (NYSE)

cd "K:\econometria_I\capitulo11"
wfopen nyse

graph figura1.line(s) return

18
RETURN
10

-5

-10

-15

-20
76 77 78 79 80 81 82 83 84 85 86 87 88 89

El siguiente modelo se observa que el primer rezago de la variable rendimiento


(returnt-1) no es estadsticamente significativo con un nivel de significancia del
0.05. Estamos frente a un modelo autoregresivo de primer orden AR(1)

Dependent Variable: RETURN


Method: Least Squares
Date: 06/29/16 Time: 10:38
Sample (adjusted): 1/08/1976 3/16/1989
Included observations: 689 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C 0.179634 0.080742 2.224794 0.0264


RETURN(-1) 0.058898 0.038023 1.549010 0.1218

R-squared 0.003480 Mean dependent var 0.191138


Adjusted R-squared 0.002030 S.D. dependent var 2.112540
S.E. of regression 2.110395 Akaike info criterion 4.334526
Sum squared resid 3059.737 Schwarz criterion 4.347690
Log likelihood -1491.244 Hannan-Quinn criter. 4.339618
F-statistic 2.399432 Durbin-Watson stat 1.996912
Prob(F-statistic) 0.121840

Si estimamos un modelo AR(4) tenemos que con un nivel de significancia de 0.05


no son estadsticamente significativas cada uno de los rezagos de la variable
rendimiento.

equation model_return_ar_4.ls return c return(-1) return(-2) return(-3) return(-4)

Dependent Variable: RETURN


Method: Least Squares
Date: 06/29/16 Time: 10:46
Sample (adjusted): 1/29/1976 3/16/1989
Included observations: 686 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C 0.184947 0.081787 2.261315 0.0241


RETURN(-1) 0.062642 0.038192 1.640189 0.1014
RETURN(-2) -0.043226 0.038274 -1.129409 0.2591
RETURN(-3) 0.030399 0.038274 0.794250 0.4273
RETURN(-4) -0.052377 0.038179 -1.371868 0.1706

R-squared 0.008380 Mean dependent var 0.184136


Adjusted R-squared 0.002555 S.D. dependent var 2.112417
S.E. of regression 2.109716 Akaike info criterion 4.338246
Sum squared resid 3031.064 Schwarz criterion 4.371270
Log likelihood -1483.018 Hannan-Quinn criter. 4.351023
F-statistic 1.438713 Durbin-Watson stat 1.996778
Prob(F-statistic) 0.219500

En la prueba conjunta tambin tenemos que no son significativos los 4 rezagos de


la variable rendimiento

wald c(2)=0, c(3)=0, c(4)=0, c(5)=0

19
Wald Test:
Equation: MODEL_RETURN_AR_4

Test Statistic Value df Probability

F-statistic 1.438713 (4, 681) 0.2195


Chi-square 5.754853 4 0.2182

Null Hypothesis: C(2)=0, C(3)=0, C(4)=0, C(5)=0


Null Hypothesis Summary:

Normalized Restriction (= 0) Value Std. Err.

C(2) 0.062642 0.038192


C(3) -0.043226 0.038274
C(4) 0.030399 0.038274
C(5) -0.052377 0.038179

Restrictions are linear in coefficients.

Tambin podemos utilizar el grafico de correlacin para investigar si la serie es


altamente persistente. Observamos que la variable rendimiento no sigue un
proceso AR o MA.

Si la autocorrelacin se reduce ms o menos geomtricamente cuando se


incrementa los rezagos esto es un signo que la serie sigue un proceso
autoregresivo. Si la autocorrelacin se reduce a cero luego de un pequeo
nmero de rezagos es un signo que la serie sigue un proceso promedio mvil MA.
Si el patrn de la autocorrelacin puede ser obtenido por una autoregresin de
orden menor a k, entonces la autocorrelacin parcial en ese rezago ser igual a
cero.

return.correl(24)

Date: 06/29/16 Time: 11:03


Sample: 1/01/1976 1/04/1990
Included observations: 690

Autocorrelation Partial Correlation AC PAC Q-Stat Prob

1 0.059 0.059 2.4039 0.121


2 -0.03... -0.03... 3.2278 0.199
3 0.026 0.031 3.7029 0.295
4 -0.04... -0.05... 5.2643 0.261
5 -0.00... 0.001 5.2998 0.380
6 0.019 0.015 5.5455 0.476
7 0.060 0.061 8.0590 0.327
8 -0.03... -0.04... 8.7957 0.360
9 -0.02... -0.01... 9.1778 0.421
1... -0.06... -0.06... 12.224 0.270
1... -0.04... -0.02... 13.587 0.257
1... -0.01... -0.02... 13.791 0.314
1... -0.00... -0.00... 13.792 0.389
1... -0.01... -0.02... 13.998 0.450
1... -0.08... -0.08... 19.561 0.189
1... 0.049 0.060 21.261 0.169
1... 0.029 0.025 21.876 0.190
1... -0.06... -0.05... 24.588 0.137
1... 0.011 0.005 24.680 0.171
2... 0.069 0.062 28.030 0.109
2... -0.01... -0.02... 28.296 0.132
2... 0.028 0.034 28.842 0.149
2... 0.130 0.111 41.021 0.012
2... -0.02... -0.03... 41.372 0.015

Veamos un caso de una serie persistente. Utilizamos la base de datos fertil3 que
incluye la variable tasa de fertilidad general (gfr) que es el nmero de nios
nacidos por cada 1000 mujeres en edad frtil y la exencin personal de impuesto
promedio (pe).

20
Observamos la persistencia de la variable fertilidad y exencin personal de
impuesto promedio

wfopen fertil3
gfr.correl(24)
pe.correl(24)

De acuerdo a la autocorrelacin tenemos presencia de un proceso autoregresivo


en las variables gfr y pe. El orden de la autoregresin es uno como se observa en
la correlacin parcial.

Date: 06/29/16 Time: 11:24


Sample: 1 72
Included observations: 72

Autocorrelation Partial Correlation AC PAC Q-Stat Prob

1 0.945 0.945 66.977 0.000


2 0.873 -0.18... 124.99 0.000
3 0.807 0.040 175.30 0.000
4 0.734 -0.12... 217.56 0.000
5 0.649 -0.13... 251.11 0.000
6 0.551 -0.16... 275.65 0.000
7 0.450 -0.07... 292.28 0.000
8 0.338 -0.19... 301.81 0.000
9 0.220 -0.10... 305.92 0.000
1... 0.105 -0.07... 306.88 0.000
1... -0.01... -0.13... 306.89 0.000
1... -0.12... -0.08... 308.35 0.000
1... -0.23... -0.01... 313.25 0.000
1... -0.32... 0.014 322.77 0.000
1... -0.39... 0.005 337.61 0.000
1... -0.46... 0.026 357.92 0.000
1... -0.51... -0.03... 383.68 0.000
1... -0.56... -0.09... 415.07 0.000
1... -0.59... 0.049 450.46 0.000
2... -0.60... 0.021 487.58 0.000
2... -0.58... 0.128 523.33 0.000
2... -0.55... -0.00... 556.34 0.000
2... -0.52... 0.002 585.83 0.000
2... -0.47... -0.02... 610.86 0.000

Date: 06/29/16 Time: 11:24


Sample: 1 72
Included observations: 72

Autocorrelation Partial Correlation AC PAC Q-Stat Prob

1 0.947 0.947 67.314 0.000


2 0.878 -0.18... 125.94 0.000
3 0.810 0.009 176.64 0.000
4 0.741 -0.06... 219.70 0.000
5 0.691 0.153 257.64 0.000
6 0.655 0.056 292.25 0.000
7 0.622 -0.01... 323.94 0.000
8 0.585 -0.07... 352.44 0.000
9 0.541 -0.06... 377.20 0.000
1... 0.491 -0.04... 397.88 0.000
1... 0.437 -0.03... 414.55 0.000
1... 0.378 -0.09... 427.23 0.000
1... 0.318 -0.06... 436.34 0.000
1... 0.265 0.015 442.80 0.000
1... 0.223 0.038 447.45 0.000
1... 0.185 -0.03... 450.70 0.000
1... 0.142 -0.10... 452.65 0.000
1... 0.090 -0.10... 453.45 0.000
1... 0.035 -0.02... 453.57 0.000
2... -0.01... 0.028 453.60 0.000
2... -0.06... -0.02... 454.05 0.000
2... -0.10... -0.01... 455.22 0.000
2... -0.14... -0.05... 457.35 0.000
2... -0.17... -0.06... 460.85 0.000

Si estimamos el modelo en niveles tendramos el siguiente resultado. La variable


pe y sus rezagos no son estadsticamente significativas.

21
Dependent Variable: GFR
Method: Least Squares
Date: 06/29/16 Time: 11:40
Sample (adjusted): 3 72
Included observations: 70 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

PE 0.072672 0.125533 0.578906 0.5647


PE(-1) -0.005780 0.155663 -0.037129 0.9705
PE(-2) 0.033827 0.126257 0.267919 0.7896
WW2 -22.12650 10.73197 -2.061737 0.0433
PILL -31.30499 3.981559 -7.862495 0.0000
C 95.87050 3.281957 29.21138 0.0000

R-squared 0.498599 Mean dependent var 94.77429


Adjusted R-squared 0.459427 S.D. dependent var 19.40881
S.E. of regression 14.27008 Akaike info criterion 8.236023
Sum squared resid 13032.64 Schwarz criterion 8.428751
Log likelihood -282.2608 Hannan-Quinn criter. 8.312577
F-statistic 12.72845 Durbin-Watson stat 0.188715
Prob(F-statistic) 0.000000

Como las series son persistentes AR(1), corresponde estimar el modelo en


primera diferencia. Encontramos que un incremento en la exencin personal de
impuesto promedio disminuye la tasa de fertilidad, sin embargo con un nivel de
significancia de 0.05 no es estadsticamente significativa:

equation model3.ls d(gfr) d(pe) c

Dependent Variable: D(GFR)


Method: Least Squares
Date: 06/29/16 Time: 12:26
Sample (adjusted): 2 72
Included observations: 71 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

D(PE) -0.042678 0.028367 -1.504469 0.1370


C -0.784780 0.502040 -1.563182 0.1226

R-squared 0.031761 Mean dependent var -0.835211


Adjusted R-squared 0.017729 S.D. dependent var 4.258742
S.E. of regression 4.220822 Akaike info criterion 5.745701
Sum squared resid 1229.258 Schwarz criterion 5.809439
Log likelihood -201.9724 Hannan-Quinn criter. 5.771048
F-statistic 2.263426 Durbin-Watson stat 1.355471
Prob(F-statistic) 0.137025

Si incluimos ms rezagos de las diferencias tenemos el siguiente modelo. El


segundo rezago de la primera diferencia es estadsticamente significativa. Indica
una relacin positiva entre las variables con un efecto retardado de dos aos.

series dpe = d(pe)


equation model4.ls d(gfr) dpe dpe(-1) dpe(-2) c

22
Dependent Variable: D(GFR)
Method: Least Squares
Date: 06/29/16 Time: 12:46
Sample (adjusted): 4 72
Included observations: 69 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

DPE -0.036202 0.026774 -1.352151 0.1810


DPE(-1) -0.013971 0.027554 -0.507028 0.6139
DPE(-2) 0.109990 0.026880 4.091919 0.0001
C -0.963679 0.467760 -2.060200 0.0434

R-squared 0.232477 Mean dependent var -0.863768


Adjusted R-squared 0.197052 S.D. dependent var 4.307073
S.E. of regression 3.859453 Akaike info criterion 5.595151
Sum squared resid 968.1997 Schwarz criterion 5.724664
Log likelihood -189.0327 Hannan-Quinn criter. 5.646533
F-statistic 6.562656 Durbin-Watson stat 1.414286
Prob(F-statistic) 0.000605

El modelo anterior no es un modelo dinamico completo porque si incluimos un


rezago de la variable dgfr u otros rezagos de la variable dpe como dpe(-4), etc
estas no deberan ser estadisticamente significativas. Como se observa esto no se
cumple. La variable dgfr(-1) es estadisticamente significativa.

series dgfr = d(gfr)


equation model5.ls dgfr dgfr(-1) dpe dpe(-1) dpe(-2) c

Dependent Variable: DGFR


Method: Least Squares
Date: 06/29/16 Time: 12:55
Sample (adjusted): 4 72
Included observations: 69 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

DGFR(-1) 0.300242 0.105903 2.835058 0.0061


DPE -0.045472 0.025642 -1.773367 0.0809
DPE(-1) 0.002064 0.026778 0.077081 0.9388
DPE(-2) 0.105135 0.025590 4.108366 0.0001
C -0.702159 0.453799 -1.547292 0.1267

R-squared 0.318113 Mean dependent var -0.863768


Adjusted R-squared 0.275495 S.D. dependent var 4.307073
S.E. of regression 3.666089 Akaike info criterion 5.505832
Sum squared resid 860.1733 Schwarz criterion 5.667724
Log likelihood -184.9512 Hannan-Quinn criter. 5.570060
F-statistic 7.464285 Durbin-Watson stat 1.941419
Prob(F-statistic) 0.000053

2.2.1 Pruebas de Correlacin Serial

Empezamos por las pruebas de correlacin serial AR(1) con regresores


estrictamente exgenos.

Para este modelo utilizamos la base de datos Phillips que contiene las variables
inflacin (inf) y desempleo (unem).

La curva esttica de Phillips est dada por el siguiente modelo:

cd "K:\econometria_I\capitulo12"
wfopen phillips
smpl 1948 1996
equation model1.ls inf unem c

23
Dependent Variable: INF
Method: Least Squares
Date: 06/29/16 Time: 13:28
Sample: 1948 1996
Included observations: 49

Variable Coefficient Std. Error t-Statistic Prob.

UNEM 0.467626 0.289126 1.617376 0.1125


C 1.423610 1.719015 0.828154 0.4118

R-squared 0.052723 Mean dependent var 4.108163


Adjusted R-squared 0.032568 S.D. dependent var 3.182821
S.E. of regression 3.130562 Akaike info criterion 5.160262
Sum squared resid 460.6198 Schwarz criterion 5.237479
Log likelihood -124.4264 Hannan-Quinn criter. 5.189558
F-statistic 2.615904 Durbin-Watson stat 0.802700
Prob(F-statistic) 0.112490

Realizamos la prueba de correlacin serial AR(1) en el modelo anterior:

equation model1.ls inf unem c


model1.makeresids residuos
equation model2.ls residuos c residuos(-1)

Dependent Variable: RESIDUOS


Method: Least Squares
Date: 06/29/16 Time: 14:13
Sample (adjusted): 1949 1996
Included observations: 48 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C -0.113397 0.359404 -0.315513 0.7538


RESIDUOS(-1) 0.572969 0.116133 4.933720 0.0000

R-squared 0.346048 Mean dependent var -0.102071


Adjusted R-squared 0.331832 S.D. dependent var 3.046154
S.E. of regression 2.489973 Akaike info criterion 4.703194
Sum squared resid 285.1984 Schwarz criterion 4.781161
Log likelihood -110.8767 Hannan-Quinn criter. 4.732658
F-statistic 24.34159 Durbin-Watson stat 1.354317
Prob(F-statistic) 0.000011

La correlacin del residuo del modelo anterior es de 0.572 y es estadsticamente


significativa.

Para otro modelo encontremos la correlacin serial AR(1) sin regresores


estrictamente exgenos.

Estimamos el siguiente modelo:

24
Dependent Variable: LOG(PREPOP)
Method: Least Squares
Date: 06/29/16 Time: 14:19
Sample: 1 38
Included observations: 38

Variable Coefficient Std. Error t-Statistic Prob.

LOG(MINCOV) -0.212261 0.040152 -5.286398 0.0000


LOG(USGNP) 0.486049 0.221982 2.189582 0.0357
LOG(PRGNP) 0.285238 0.080492 3.543677 0.0012
T -0.026663 0.004627 -5.762910 0.0000
C -6.663445 1.257829 -5.297577 0.0000

R-squared 0.889238 Mean dependent var -0.944074


Adjusted R-squared 0.875812 S.D. dependent var 0.092978
S.E. of regression 0.032766 Akaike info criterion -3.876796
Sum squared resid 0.035428 Schwarz criterion -3.661325
Log likelihood 78.65913 Hannan-Quinn criter. -3.800133
F-statistic 66.23381 Durbin-Watson stat 1.013707
Prob(F-statistic) 0.000000

Realizamos la prueba de correlacin serial AR(1) sin regresores estrictamente


exgenos. Observamos que el coeficiente de correlacin de errores es 0.48 y es
estadsticamente significativo.

equation model1.ls log(prepop) log(mincov) log(usgnp) log(prgnp) t c


model1.makeresids residuos
equation model3.ls residuos c log(mincov) log(usgnp) log(prgnp) t residuos(-1)

Dependent Variable: RESIDUOS


Method: Least Squares
Date: 06/29/16 Time: 14:22
Sample (adjusted): 2 38
Included observations: 37 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C -0.850777 1.092688 -0.778609 0.4421


LOG(MINCOV) 0.037500 0.035212 1.064976 0.2951
LOG(USGNP) 0.203933 0.195158 1.044964 0.3041
LOG(PRGNP) -0.078466 0.070524 -1.112615 0.2744
T -0.003466 0.004074 -0.850916 0.4013
RESIDUOS(-1) 0.480510 0.166444 2.886917 0.0070

R-squared 0.242364 Mean dependent var -0.001763


Adjusted R-squared 0.120165 S.D. dependent var 0.029372
S.E. of regression 0.027551 Akaike info criterion -4.198185
Sum squared resid 0.023530 Schwarz criterion -3.936955
Log likelihood 83.66643 Hannan-Quinn criter. -4.106089
F-statistic 1.983349 Durbin-Watson stat 1.693340
Prob(F-statistic) 0.108930

Si consideramos que los regresores son estrictamente exgenos entonces para la


prueba considerar:

equation model1.ls log(prepop) log(mincov) log(usgnp) log(prgnp) t c


model1.makeresids residuos
equation model2.ls residuos c residuos(-1)

En este caso el coeficiente de correlacin de errores es 0.417 y es


estadsticamente significativa.

25
Dependent Variable: RESIDUOS
Method: Least Squares
Date: 06/29/16 Time: 14:15
Sample (adjusted): 2 38
Included observations: 37 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C -0.000895 0.004488 -0.199465 0.8431


RESIDUOS(-1) 0.417323 0.158935 2.625743 0.0127

R-squared 0.164569 Mean dependent var -0.001763


Adjusted R-squared 0.140699 S.D. dependent var 0.029372
S.E. of regression 0.027227 Akaike info criterion -4.316656
Sum squared resid 0.025946 Schwarz criterion -4.229580
Log likelihood 81.85814 Hannan-Quinn criter. -4.285958
F-statistic 6.894529 Durbin-Watson stat 1.584617
Prob(F-statistic) 0.012737

En ambos casos tenemos evidencias de que hay un problema de correlacin


serial AR(1).

2.2.2 Correccin de la Correlacin Serial

Sabemos que el siguiente modelo presenta problemas de correlacion serial AR(1).

Dependent Variable: LOG(PREPOP)


Method: Least Squares
Date: 06/29/16 Time: 16:34
Sample: 1 38
Included observations: 38

Variable Coefficient Std. Error t-Statistic Prob.

LOG(MINCOV) -0.212261 0.040152 -5.286398 0.0000


LOG(USGNP) 0.486049 0.221982 2.189582 0.0357
LOG(PRGNP) 0.285238 0.080492 3.543677 0.0012
T -0.026663 0.004627 -5.762910 0.0000
C -6.663445 1.257829 -5.297577 0.0000

R-squared 0.889238 Mean dependent var -0.944074


Adjusted R-squared 0.875812 S.D. dependent var 0.092978
S.E. of regression 0.032766 Akaike info criterion -3.876796
Sum squared resid 0.035428 Schwarz criterion -3.661325
Log likelihood 78.65913 Hannan-Quinn criter. -3.800133
F-statistic 66.23381 Durbin-Watson stat 1.013707
Prob(F-statistic) 0.000000

Para corregir el problema de la correlacin serial, estimamos la siguiente ecuacin

equation model11.ls log(prepop) log(mincov) log(usgnp) log(prgnp) t c AR(1)

Observamos que la elasticidad de la tasa de empleo en Puerto Rico en relacin al


salario mnimo es -0.11 y es estadsticamente significativa. La elasticidad de la
tasa de empleo en Puerto Rico en relacin al producto nacional bruto de los EEUU
es 0.36 pero no es estadsticamente significativa. La elasticidad de la tasa de
empleo en Puerto Rico en relacin al producto nacional bruto de Puerto Rico es
0.26 y es estadsticamente significativa. El coeficiente de correlacin serial de los
errores es 0.64 y es estadsticamente significativa.

26
Dependent Variable: LOG(PREPOP)
Method: Least Squares
Date: 06/29/16 Time: 16:26
Sample (adjusted): 2 38
Included observations: 37 after adjustments
Convergence achieved after 18 iterations

Variable Coefficient Std. Error t-Statistic Prob.

LOG(MINCOV) -0.110758 0.047030 -2.355036 0.0250


LOG(USGNP) 0.366481 0.223741 1.637968 0.1115
LOG(PRGNP) 0.267362 0.115098 2.322912 0.0269
T -0.024328 0.006076 -4.003911 0.0004
C -5.519040 1.368997 -4.031448 0.0003
AR(1) 0.643322 0.160034 4.019909 0.0003

R-squared 0.920791 Mean dependent var -0.949183


Adjusted R-squared 0.908015 S.D. dependent var 0.088687
S.E. of regression 0.026898 Akaike info criterion -4.246154
Sum squared resid 0.022428 Schwarz criterion -3.984924
Log likelihood 84.55384 Hannan-Quinn criter. -4.154058
F-statistic 72.07402 Durbin-Watson stat 1.630370
Prob(F-statistic) 0.000000

Inverted AR Roots .64

Tambin podemos estimar el modelo anterior con inferencia robusta. Por ejemplo
podemos asumir la matriz de covarianzas de los errores es del tipo White.
equation model12.ls(cov=white) log(prepop) log(mincov) log(usgnp) log(prgnp) t c
AR(1)
Dependent Variable: LOG(PREPOP)
Method: Least Squares
Date: 06/29/16 Time: 16:53
Sample (adjusted): 2 38
Included observations: 37 after adjustments
Convergence achieved after 18 iterations
White heteroskedasticity-consistent standard errors & covariance

Variable Coefficient Std. Error t-Statistic Prob.

LOG(MINCOV) -0.110758 0.045523 -2.432992 0.0209


LOG(USGNP) 0.366481 0.274531 1.334935 0.1916
LOG(PRGNP) 0.267362 0.163287 1.637382 0.1117
T -0.024328 0.007163 -3.396166 0.0019
C -5.519040 1.437936 -3.838167 0.0006
AR(1) 0.643322 0.182174 3.531367 0.0013

R-squared 0.920791 Mean dependent var -0.949183


Adjusted R-squared 0.908015 S.D. dependent var 0.088687
S.E. of regression 0.026898 Akaike info criterion -4.246154
Sum squared resid 0.022428 Schwarz criterion -3.984924
Log likelihood 84.55384 Hannan-Quinn criter. -4.154058
F-statistic 72.07402 Durbin-Watson stat 1.630370
Prob(F-statistic) 0.000000 Wald F-statistic 4.501299
Prob(Wald F-statistic) 0.005535

Inverted AR Roots .64

Se observa que el producto nacional bruto de Puerto Rico no es estadsticamente


significativo con un nivel de confianza de 0.05.

27
Tenemos otro ejemplo tomando la base de datos barium.
El siguiente modelo se estima por MCO:
Dependent Variable: LCHNIMP
Method: Least Squares
Date: 06/29/16 Time: 17:04
Sample: 1 131
Included observations: 131

Variable Coefficient Std. Error t-Statistic Prob.

LCHEMPI 3.117194 0.479202 6.504967 0.0000


LGAS 0.196343 0.906618 0.216566 0.8289
LRTWEX 0.983018 0.400154 2.456600 0.0154
BEFILE6 0.059574 0.260970 0.228279 0.8198
AFFILE6 -0.032406 0.264297 -0.122613 0.9026
AFDEC6 -0.565245 0.285835 -1.977522 0.0502
C -17.80283 21.04538 -0.845926 0.3992

R-squared 0.304862 Mean dependent var 6.174599


Adjusted R-squared 0.271226 S.D. dependent var 0.699738
S.E. of regression 0.597354 Akaike info criterion 1.859340
Sum squared resid 44.24709 Schwarz criterion 2.012976
Log likelihood -114.7867 Hannan-Quinn criter. 1.921769
F-statistic 9.063645 Durbin-Watson stat 1.458415
Prob(F-statistic) 0.000000

Se realizamos la prueba de correlacin serial de los errores.


equation model1.ls lchnimp lchempi lgas lrtwex befile6 affile6 afdec6 c
auto(1)
Breusch-Godfrey Serial Correlation LM Test:

F-statistic 9.977478 Prob. F(1,123) 0.0020


Obs*R-squared 9.829106 Prob. Chi-Square(1) 0.0017

Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 06/29/16 Time: 17:07
Sample: 1 131
Included observations: 131
Presample missing value lagged residuals set to zero.

Variable Coefficient Std. Error t-Statistic Prob.

LCHEMPI -0.016122 0.462772 -0.034839 0.9723


LGAS 0.329091 0.881657 0.373264 0.7096
LRTWEX 0.103582 0.387799 0.267103 0.7898
BEFILE6 -0.026860 0.252150 -0.106523 0.9153
AFFILE6 -0.065503 0.256061 -0.255812 0.7985
AFDEC6 -0.039794 0.276305 -0.144022 0.8857
C -7.918484 20.47660 -0.386709 0.6996
RESID(-1) 0.277165 0.087746 3.158715 0.0020

R-squared 0.075031 Mean dependent var -7.57E-15


Adjusted R-squared 0.022391 S.D. dependent var 0.583406
S.E. of regression 0.576837 Akaike info criterion 1.796611
Sum squared resid 40.92717 Schwarz criterion 1.972196
Log likelihood -109.6780 Hannan-Quinn criter. 1.867959
F-statistic 1.425354 Durbin-Watson stat 2.082118
Prob(F-statistic) 0.201029

Encontramos que el coeficiente de correlacin serial de los errores es 0.27 y es


estadsticamente significativo.
Procedemos a solucionar el problema de la correlacin serial estimando la
siguiente ecuacin.
equation model11.ls lchnimp lchempi lgas lrtwex befile6 affile6 afdec6 c AR(1)
Podemos observar las variables lchempi, lrtwex y afdec6 son estadisticamente
significativas

28
Dependent Variable: LCHNIMP
Method: Least Squares
Date: 06/29/16 Time: 17:11
Sample (adjusted): 2 131
Included observations: 130 after adjustments
Convergence achieved after 9 iterations

Variable Coefficient Std. Error t-Statistic Prob.

LCHEMPI 2.947433 0.648260 4.546687 0.0000


LGAS 1.054864 1.007026 1.047504 0.2969
LRTWEX 1.136922 0.517948 2.195050 0.0301
BEFILE6 -0.016373 0.322554 -0.050761 0.9596
AFFILE6 -0.033083 0.326295 -0.101389 0.9194
AFDEC6 -0.577159 0.345425 -1.670868 0.0973
C -37.32238 23.61363 -1.580544 0.1166
AR(1) 0.293362 0.088307 3.322077 0.0012

R-squared 0.353463 Mean dependent var 6.180590


Adjusted R-squared 0.316367 S.D. dependent var 0.699063
S.E. of regression 0.578000 Akaike info criterion 1.801078
Sum squared resid 40.75827 Schwarz criterion 1.977542
Log likelihood -109.0701 Hannan-Quinn criter. 1.872781
F-statistic 9.528249 Durbin-Watson stat 2.063303
Prob(F-statistic) 0.000000

Inverted AR Roots .29

Podemos realizar la prueba de Heterocedasticidad.


model11.hettest lchempi lgas lrtwex befile6 affile6 afdec6 c
Con un nivel de significancia de 0.1 tenemos problemas de Heterocedasticidad.
Heteroskedasticity Test: Breusch-Pagan-Godfrey

F-statistic 1.992175 Prob. F(6,123) 0.0718


Obs*R-squared 11.51435 Prob. Chi-Square(6) 0.0737
Scaled explained SS 14.43973 Prob. Chi-Square(6) 0.0251

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/29/16 Time: 20:42
Sample: 2 131
Included observations: 130

Variable Coefficient Std. Error t-Statistic Prob.

C 14.37722 18.50185 0.777070 0.4386


LCHEMPI -1.216506 0.419597 -2.899221 0.0044
LGAS -0.272545 0.794702 -0.342952 0.7322
LRTWEX -0.435162 0.350097 -1.242973 0.2162
BEFILE6 0.107276 0.226870 0.472851 0.6372
AFFILE6 0.031413 0.229761 0.136722 0.8915
AFDEC6 0.360513 0.248502 1.450749 0.1494

R-squared 0.088572 Mean dependent var 0.313525


Adjusted R-squared 0.044112 S.D. dependent var 0.531138
S.E. of regression 0.519291 Akaike info criterion 1.579639
Sum squared resid 33.16862 Schwarz criterion 1.734045
Log likelihood -95.67655 Hannan-Quinn criter. 1.642379
F-statistic 1.992175 Durbin-Watson stat 2.284686
Prob(F-statistic) 0.071756

La regresin que considera correlacin serial con Heterocedasticidad es:


equation model11.ls(cov=white) lchnimp lchempi lgas lrtwex befile6 affile6 afdec6
c AR(1)

29
Dependent Variable: LCHNIMP
Method: Least Squares
Date: 06/29/16 Time: 20:45
Sample (adjusted): 2 131
Included observations: 130 after adjustments
Convergence achieved after 9 iterations
White heteroskedasticity-consistent standard errors & covariance

Variable Coefficient Std. Error t-Statistic Prob.

LCHEMPI 2.947433 0.629431 4.682694 0.0000


LGAS 1.054864 0.930659 1.133458 0.2592
LRTWEX 1.136922 0.512843 2.216902 0.0285
BEFILE6 -0.016373 0.329693 -0.049662 0.9605
AFFILE6 -0.033083 0.283140 -0.116843 0.9072
AFDEC6 -0.577159 0.427814 -1.349089 0.1798
C -37.32238 21.30664 -1.751678 0.0823
AR(1) 0.293362 0.088510 3.314429 0.0012

R-squared 0.353463 Mean dependent var 6.180590


Adjusted R-squared 0.316367 S.D. dependent var 0.699063
S.E. of regression 0.578000 Akaike info criterion 1.801078
Sum squared resid 40.75827 Schwarz criterion 1.977542
Log likelihood -109.0701 Hannan-Quinn criter. 1.872781
F-statistic 9.528249 Durbin-Watson stat 2.063303
Prob(F-statistic) 0.000000 Wald F-statistic 5.211985
Prob(Wald F-statistic) 0.000083

Inverted AR Roots .29

Analizamos ahora el modelo de serie de tiempo con Heterocedasticidad.


Estimamos el siguiente modelo:
wfopen nyse
equation model1.ls return c return(-1)
Dependent Variable: RETURN
Method: Least Squares
Date: 06/29/16 Time: 20:10
Sample (adjusted): 1/08/1976 3/16/1989
Included observations: 689 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C 0.179634 0.080742 2.224794 0.0264


RETURN(-1) 0.058898 0.038023 1.549010 0.1218

R-squared 0.003480 Mean dependent var 0.191138


Adjusted R-squared 0.002030 S.D. dependent var 2.112540
S.E. of regression 2.110395 Akaike info criterion 4.334526
Sum squared resid 3059.737 Schwarz criterion 4.347690
Log likelihood -1491.244 Hannan-Quinn criter. 4.339618
F-statistic 2.399432 Durbin-Watson stat 1.996912
Prob(F-statistic) 0.121840

Realizamos la prueba de Heterocedasticidad.


La prueba de Heterocedasticidad de Breusch Pagan indica la presencia de
Heterocedasticidad. El coeficiente de return(-1) es -1.104 y es estadsticamente
significativa.
model1.hettest return(-1) c

30
Heteroskedasticity Test: Breusch-Pagan-Godfrey

F-statistic 30.05446 Prob. F(1,687) 0.0000


Obs*R-squared 28.87859 Prob. Chi-Square(1) 0.0000
Scaled explained SS 94.66445 Prob. Chi-Square(1) 0.0000

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/29/16 Time: 20:11
Sample: 1/08/1976 3/16/1989
Included observations: 689

Variable Coefficient Std. Error t-Statistic Prob.

C 4.656498 0.427678 10.88786 0.0000


RETURN(-1) -1.104128 0.201402 -5.482195 0.0000

R-squared 0.041914 Mean dependent var 4.440837


Adjusted R-squared 0.040519 S.D. dependent var 11.41204
S.E. of regression 11.17844 Akaike info criterion 7.668750
Sum squared resid 85845.88 Schwarz criterion 7.681915
Log likelihood -2639.884 Hannan-Quinn criter. 7.673843
F-statistic 30.05446 Durbin-Watson stat 1.442974
Prob(F-statistic) 0.000000

Tambin podemos realizar la prueba de Heterocedasticidad condicional


autoregresiva.

model1.hettest(type=arch) return(-1) c

Heteroskedasticity Test: ARCH

F-statistic 87.92214 Prob. F(1,686) 0.0000


Obs*R-squared 78.16088 Prob. Chi-Square(1) 0.0000

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/29/16 Time: 20:17
Sample (adjusted): 1/15/1976 3/16/1989
Included observations: 688 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C 2.947435 0.440233 6.695166 0.0000


RESID^2(-1) 0.337062 0.035947 9.376681 0.0000

R-squared 0.113606 Mean dependent var 4.446347


Adjusted R-squared 0.112314 S.D. dependent var 11.41942
S.E. of regression 10.75905 Akaike info criterion 7.592274
Sum squared resid 79409.40 Schwarz criterion 7.605454
Log likelihood -2609.742 Hannan-Quinn criter. 7.597373
F-statistic 87.92214 Durbin-Watson stat 2.028071
Prob(F-statistic) 0.000000

Se observa la presencia de Heterocedasticidad condicional autoregresiva, la


variable resid2t-1 es 0.33 y es estadsticamente significativa.

31

Вам также может понравиться