Вы находитесь на странице: 1из 15

Aplicaciones de

Mnimos Cuadrados
Ordinarios en
Argentina
Santiago Hermo

ndice
Punto 1. Estimacin del modelo de retorno a la educacin para Argentina ........................... 2
1.1) Interpretacin de los parmetros ...................................................................................... 2
1.2) Test t de significatividad individual .................................................................................... 3
1.3) 2 y 2 .............................................................................................................................. 3
1.4) Test F de significatividad global......................................................................................... 4
1.5) Test de White de heterocedasticidad (sin trminos cruzados)......................................... 5
1.6) Test Jarque-Bera de normalidad de los residuos ............................................................. 6
1.7) Conclusin y confiabilidad de la regresin ....................................................................... 7
Punto 2. Estimacin de la curva de Philips para Argentina entre 1993-2012 .......................... 8
2.1)Interpretacin de los parmetros ...................................................................................... 8
2.2)Test t de significatividad individual .................................................................................... 9
2.3) 2 y 2 .............................................................................................................................. 9
2.4)Test F de significatividad global ....................................................................................... 10
2.5) Test de White de heterocedasticidad (sin trminos cruzados) ....................................... 10
2.6) Test Jarque-Bera de normalidad de los residuos ........................................................... 11
2.7) Test de Durbin-Watson de autocorrelacin ................................................................... 11
2.8) Conclusin y confiabilidad de la regresin ..................................................................... 13
Bibliografa Consultada ..................................................................................................... 14

1) Estimacin para Argentina del modelo de retorno a la educacin


Se trata de un modelo para cuantificar el retorno de la educacin tal como lo especific Mincer
(1974).1
ln = 1 + 2 + 3 + 4 ( )2 +
Donde representa el ingreso, los coeficientes poblacionales y el trmino aleatorio.
Con los datos de corte transversal provistos se calcul la regresin mediante Mnimos Cuadrados
Ordinarios (en adelante, MCO), obteniendo los siguientes estimadores:
1 = 6,76859

2 = 0,08688

3 = 0,04067

4 = 0,00058

Ser til a lo largo del anlisis recordar que el tamao de muestra resulta ser = 88 con = 4
variables explicativas (considerando el intercepto).

1.1) Interpretacin de los parmetros


El 1 representa al intercepto estimado, el valor que tomara ln si todas las variables explicativas
fueran cero. Sin embargo, no lo consideramos de este modo ya que estamos manejando datos
muestrales alejados del cero y no conocemos el comportamiento del modelo fuera del rango de
datos considerado. Entonces, nos quedamos con el intercepto como un simple indicador de la
altura de la recta sin considerarlo con poder explicativo.
Los coeficientes ( = 2,3,4) representan cuanto cambia la variable explicada (en este caso,
nuestra variable explicada es = ln ) ante un cambio unitario en la respectiva variable
explicativa. Gujarati los definira como la semielasticidad, ya que el coeficiente de la pendiente mide
el cambio proporcional constante o relativo en Y para un cambio absoluto dado en el valor de la
regresora. 2 En el caso de los modelos log-lin:

ln

= =


2 : Al variar en un ao la educacin el cambio porcentual o tasa de crecimiento de Y es de 0,08688
8,688 %.
3 : Al variar en un ao la experiencia el cambio porcentual o tasa de crecimiento de Y es de 0,04067
4,067 %.
4 : Refleja que el aumento de la experiencia cada vez aporta menos al ingreso. Al variar en un ao
la experiencia el cambio porcentual negativo o tasa de decrecimiento de Y es de 0,00058 0,058 %.

1
2

Juan Jos Merlo (2009): Tesis de Magster.


Gujarati (2009): Econometra 5ta ed. Pgina 163.

Es decir, un ao de experiencia aumenta el ingreso en 4,067 % pero este incremento se desacelera


0,058 % por cada nuevo ao de experiencia.

1.2) Test t de significatividad individual


Recordemos cmo se conforma el test. Su hiptesis nula y alternativa, respectivamente, son:
0 : = 0

1 : 0

El valor crtico, en este caso, considerando un nivel de significancia = 5% y con = 84


grados de libertad es: = 1,9886 (recordar que se trata de una prueba a dos colas).
El estadstico de prueba resulta ser:
=

Recordar que hipotetizamos = 0. Aqu representa el error estndar del coeficiente.


Si | | > | | rechazaremos la hiptesis nula y podremos afirmar que el coeficiente estudiado resulta
significativo al 5%.
Las varianzas de los estimadores de MCO se extrajeron de la diagonal de la matriz de varianzas y
covarianzas . Calculando la raz cuadrada de estos valores se obtuvieron los errores estndares.
Los resultados se presentan en el siguiente cuadro:

:error estndar

0,33505

0,02153

0,01527

0,00029

| | : valor absoluto t

20,20157

4,03453

2,66245

1,99464

P-Value

0,00012

0,00929

0,04932

Se rechaza 0 ?

SI

SI

SI

SI

Se puede observar que, considerados individualmente, los parmetros 1 a 4 resultan


estadsticamente significativos a un nivel de significacin del 5 %. Es importante tener en cuenta
que, de haber considerado un del 1 % , hubiramos rechazado la hiptesis nula en el caso de 4 .
Su significancia individual no resulta ampliamente aceptada, pero indudablemente aporta a la
estimacin. Adems, puede resultar muy importante cuando consideramos la significancia conjunta.
Pero antes de probar la significatividad global necesitaremos introducir el anlisis del coeficiente de
determinacin.

1.3) y
El coeficiente de determinacin nos muestra la bondad del ajuste, se calcula utilizando
variaciones.

2
Variacin Total o Suma de Cuadrados Total (SCT):
=1( )

2
Variacin Explicada o Suma de Cuadrados Explicada (SCE):
=1( )
2
Variacin No Explicada o Suma de Cuadrados Residual (SCR):
=1( )
2 =

= 1

Con los datos provistos la regresin arroj un valor 2 = 0,22517. Este valor resulta ser algo bajo.
Sin embargo, existen varios problemas con el 2, y este slo se usa de manera informal.3 Se
acostumbra a utilizar el coeficiente de determinacin ajustado, 2. ste toma en cuenta el peso de
la cantidad de variables explicativas y el tamao de la muestra.
De todos modos podemos anticipar que el 2 ser como mximo igual al 2 y probablemente menor
(esto se puede analizar comparando las frmulas de ambos coeficientes). As que el coeficiente de
determinacin (ajustado o no) continuar generando incentivos a considerar al modelo poco
explicativo.
2 toma varianzas en lugar de variaciones.
2

()
=1 ( ) ( )

( 1)
2

= 1
=1
=1

2
()
=1( ) ( 1)
( )

El anlisis en estudio nos dio un 2 = 0,1974 .


Pareciera ser que el modelo no resulta explicativo. Sin embargo preferimos considerar que, como
afirm Goldberger, una 2 elevada no es evidencia en favor del modelo y una 2 baja no es
evidencia en su contra.4

1.4) Test F de significatividad global


En el caso en estudio, la hiptesis nula y alternativa del test F, respectivamente, son:
0 : 1 = 2 = 3 = 4 = 0

1 : Algn 0

El valor crtico de la distribucin F, considerando un nivel de significancia = 0,05 y con 1 = 3


grados de libertad en el numerador y = 84 grados de libertad en el denominador es: =
2,7132 (en este caso tenemos una prueba de cola derecha). El estadstico de prueba se calcula como
sigue:

3
4

Pindyck y Rubinfeld (2000): Econometra: Modelos y Pronsticos Pgina 91.


Gujarati: Op. cit. Pgina 206.

( 1)
2 ( 1)
=
(1;)
( ) (1 2 )( )

El ltimo trmino se consigue reemplazando = , dividiendo numerador y


denominador por SCT. Y luego reemplazando de la frmula de 2.
Si > rechazaremos la hiptesis nula y podremos afirmar que la regresin resulta significativa
globalmente con una confianza de 1 = 95% .
Volviendo a la ecuacin de Mincer, el estadstico de prueba result ser = 8,137 con un
= 8,077 105. Con slo observar el P-Value (comparando con se llega a la misma
conclusin) estamos seguros de rechazar la 0 y confirmar que la regresin resulta ampliamente
significativa no slo con = 5%, sino tambin a un = 1%.

1.5) Test de White de heterocedasticidad (sin trminos cruzados)


Esta prueba, propuesta por Hal White, ejecuta la siguiente regresin auxiliar:
2 = 1 + 2 + 3 + 4 ( )2 + 5 ( )2 + 6 ( )4 +
El objetivo es ver si las variables independientes explican la variabilidad del error. Se incluyen los
trminos cuadrticos para cubrir la posibilidad de que las discrepancias al cuadrado sigan una forma
funcional cuadrtica.
Aqu no repetiremos la variable ( )2 , ya que si lo hiciramos existira una colinealidad perfecta
en la matriz de datos. En cuyo caso sta no tendr rango completo, de modo que ser singular y no
inversible. En consecuencia, no sera posible calcular los coeficientes . De modo que esta variable
es descartada inmediatamente.
La hiptesis nula es la homocedasticidad, mientras que la alternativa ser la heterocedasticidad.
Cuando hay homocedasticidad, el estadstico de prueba resulta ser:
2 25
Se puede demostrar que este asintticamente sigue la distribucin ji cuadrada con grados de
libertad igual al nmero de regresoras (sin el trmino constante) en la regresin auxiliar.
Por lo tanto, el valor crtico del test de White con = 5% extrado de una distribucin ji cuadrada
con 5 grados de libertad ser = 11,07.
El coeficiente de determinacin de la regresin auxiliar dio 2 = 0,041067. Recordando que
N=88, el valor emprico del test de White ser = 88 0,041067 = 3,6139.
Dado que < no podemos rechazar la hiptesis nula. Por lo que la evidencia indica que
suponer homocedasticidad es vlido.

1.6) Test Jarque-Bera de normalidad de los residuos


En este caso queremos probar si los residuos tienen normalidad. Este es un supuesto que se hace
ms all de los supuestos de Gauss-Markov y que es importante para la prueba estadstica del
modelo.
Vamos a chequear la normalidad mediante la estadstica Jarque-Bera:
=

( 3)2

[ 2 +
] 2 2
6
4

3
3
Donde = [
=1( ) ] es el coeficiente de asimetra o sesgo igual a cero en la
4
4
distribucin normal-, y = [
=1( ) ] representa la kurtosis igual a tres en el caso

de normalidad-.
El estadstico de JB tiene una distribucin chi-cuadrada con 2 grados de libertad. Por lo que,
considerando = 5% , el valor crtico resulta = 5,99. Calculando el estadstico con el vector de
discrepancias del modelo obtenemos = 0,23.
En vistas de que < no podemos rechazar la hiptesis nula de normalidad, por lo que este
supuesto parece muy razonable.
Observemos el siguiente grfico de probabilidad normal obtenido con la funcin qqnorm() de R.

Recordemos que, en este grfico, una distribucin completamente normal se reproduce en una
recta, como se puede estudiar en cualquier libro de estadstica. Se observa claramente que la
normalidad no es violada en absoluto. El grfico se aproxima bastante a una funcin lineal.

1.7) Conclusin y confiabilidad de la regresin


Una vez analizadas todas las herramientas a nuestra disposicin podemos indicar que la regresin
resulta bastante confiable. Mediante el test t vimos que todos los parmetros estimados resultaron
individualmente significativos al 5%, como as tambin, utilizando el test F, confirmamos la
significatividad conjunta.
Tambin pudimos verificar, valindonos del test de White, que no hay evidencias que indiquen la
existencia de heterocedasticidad. Lo que indica que la obtencin de los estimadores MCO fue
correcta y estos efectivamente son los Mejores Estimadores Lineales Insesgados.
Mediante el test de Jarque-Bera vimos que la suposicin de normalidad de los residuos resulta
vlida. Lo que le da ms confiabilidad a las pruebas t y F.
El nico indicio que descalifica a la regresin es el coeficiente de determinacin. Sin embargo, al
estimarlo dimos los motivos por los que no consideramos que esta sea un estadstico trascendental
como para tener en cuenta, de esta manera le restamos importancia.
Podemos concluir con certeza que la regresin resulta bastante confiable y que la cuantificacin del
retorno a la educacin que teoriz Mincer se presenta, aproximadamente, en la realidad argentina.

2) Estimacin de la curva de Philips para Argentina entre 1993-2012


El modelo de la curva de Phillips, segn Blanchard y Prez Enri, busca establecer una relacin entre
la tasa de inflacin y la tasa de desempleo. En la siguiente ecuacin, extrada de su texto, se puede
deducir que: cuando aumenta la inflacin esperada, aumenta la inflacin; dada la inflacin
esperada, cuanto mayor es el margen de precios que eligen las empresas , o cuanto ms alto son
los factores que afectan a la determinacin de los salarios , mayor es la inflacin; y dada la inflacin
esperada, cuanto mayor es el desempleo, ms baja es la inflacin.5
= ( + + )
Donde es la tasa de inflacin, es la tasa de inflacin esperada, es el margen de precios que
eligen las empresas y resume aquellos factores institucionales asociados a la determinacin de los
salarios.
Esta ecuacin se puede rescribir de la siguiente forma:
= 1 + 2 + 3 2002 +
Donde es la tasa de inflacin del ndice de precios al consumidor en el momento ,
es la tasa de desempleo en el momento , 2002 es una variable dummy que toma
valor 1 nicamente para el ao 2002 y b0 agrupa a las variables + + de la precedente
ecuacin presentada, extrada del texto de Blanchard y Prez Enri.
Con los datos provistos se calcul la regresin a partir del mtodo de MCO, obteniendo como
resultado los siguientes estimadores:
1 = 36,18776

2 = 1,99917

3 = 34,5626

Ser til recordar que la cantidad de observaciones provistas es de N=20 y con k=3 variables
explicativas (incluyendo el intercepto).

2.1) Interpretacin de los parmetros


El 1 representa al valor estimado de la agrupacin de las siguientes variables: tasa de inflacin
esperada, margen de precios que eligen las empresas y factores institucionales asociados a la
determinacin de los salarios. En trminos tericos se trata del intercepto, el valor que tomara la
cuando el desempleo es cero para cualquier ao distinto del 2002 (veremos porqu
sucede esto ms adelante en este mismo apartado).
El 2 refleja cuanto cambia la variable explicada (en este caso la inflacin) ante un cambio unitario
en la variable explicativa . Observamos que ante un aumento de la tasa de desempleo
de 1% , la inflacin desciende en un 1,99917 %.

Blanchard y Prez Enri (2000), Macroeconoma. Teora y Poltica Econmica con Aplicaciones a Amrica
Latina Captulo 17. Pgina 163.

Tener en cuenta que, dado que las unidades de medida son porcentajes, los estimadores se
interpretan porcentualmente. Esto NO indica en absoluto que se trate de elasticidades.
Y, por ltimo, el estimador 3 representa el aumento del intercepto en el ao 2002 (ya que es el
nico ao que toma valor 1 de toda la serie de datos). Trata de expresar que en el ao 2002 la
regresin se encuentra desfasada de la original. Se puede demostrar que, al tomar la esperanza del
modelo, 3 aumenta el intercepto cuando la dummy toma el valor 1.6 En el caso en estudio, nos
indica que en el ao 2002 la inflacin se ve aumentada en 34,5626, ya que dado el alto desempleo
la inflacin tendra que ser muy baja, lo cual no sucedi; la inflacin se dispar debido a la
devaluacin, pero el desempleo continu siendo alto. Aqu es donde la dummy aporta poder
explicativo.

2.2) Test t de significatividad individual


Su hiptesis nula y alternativa, respectivamente, son:
0 : = 0

1 : 0

El valor crtico, en este caso, considerando un nivel de significancia = 0,05 y con = 17


grados de libertad es: = 2.101 (se trata de un test a dos colas).
Dado que ya se record la teora en el apartado 1.2) pasaremos a los resultados rpidamente:

:error estndar

3,76212

0,27574

5,84987

| | : valor absoluto t

9,61897

7,25006

5,90827

P-Value

2,7278*10-8

1,3572*10-6

1,719*10-5

Se rechaza 0 ?

SI

SI

SI

En este caso los tres coeficientes resultan ampliamente significativos. Tenemos la primera evidencia
en favor de la regresin realizada.

2.3) y
En el apartado 1.3) explicamos porqu estos estadsticos se usan de manera informal y no son
considerados trascendentes como estadstico. Sin embargo, un 2 ms alto generalmente es
preferido. Este es el caso.
Los coeficientes para la regresin en estudio son:

Pindyck y Rubinfeld (2000): Op. cit. Pgina 127 a 129

2 = 0,7578

2 = 0,7833

Como era de esperarse, el coeficiente de determinacin ajustado es menor que el


coeficiente de determinacin sin ajuste.
2.4) Test F de significatividad global
En el caso en estudio, la hiptesis nula y alternativa del test F, respectivamente, son:
0 : 1 = 2 = 3 = 4 = 0

1 : Algn 0

El valor crtico de la distribucin F, considerando un nivel de significancia = 5% y con 1 = 2


grados de libertad en el numerador y = 17 grados de libertad en el denominador es: =
3,59153 (en este caso tenemos una prueba de cola derecha). El estadstico de prueba se calcul de
la misma manera que en el apartado 1.4) y arroj un valor de = 30,72762
Dado que = 30,73 > = 3,59 rechazaremos la hiptesis nula y podremos afirmar que la
regresin resulta significativa globalmente con una confianza de 1 = 95% . Reportamos el
= 2,262191 106 que arroj el estadstico calculado, tambin muestra el amplio rechazo
de la hiptesis nula y, en consecuencia, la aceptacin de la significatividad global de la regresin.

2.5) Test de White de heterocedasticidad


Se ejecuta la siguiente regresin auxiliar:
2 = 1 + 2 + 3 2002 + 4 2 +
Como se dijo anteriormente, el objetivo es ver si las variables independientes explican la
variabilidad del error. Anlogamente a lo realizado para el punto 1, aqu no incluimos la posible
variable (2002 )2 , ya que es idnticamente igual a 2002 . Si lo hiciramos nos encontraramos
con el problema de la multicolinealidad, que queremos evitar.
Como se explic en 1.5), el estadstico de prueba resulta ser:
2

23
Anlogamente, el valor crtico del test de White con = 5% extrado de una distribucin ji
cuadrada con, ahora, 3 grados de libertad ser = 7,815.
El coeficiente de determinacin de la regresin auxiliar dio 2 = 0,093965. Recordando que
el nmero de observaciones es N=20, el valor emprico del test de White ser = 20 0,094 =
1,879 .
Dado que < no podemos rechazar la hiptesis nula. Por lo que la evidencia indica que
suponer homocedasticidad es vlido.

10

2.6) Test Jarque-Bera de normalidad de los residuos


La teora subyacente al test ya se formaliz en el apartado 1.6). Recordaremos simplemente que el
estadstico de JB tiene una distribucin ji cuadrada con 2 grados de libertad. Por lo que,
considerando = 5% , el valor crtico resulta = 5,99. Ahora, calculando el estadstico con el
vector de discrepancias del modelo de curva de Phillips obtenemos = 1,75.
En vistas de que < no podemos rechazar la hiptesis nula de normalidad, por lo que el
supuesto de normalidad parece muy razonable.
Al igual que hicimos en 2.6), observemos el grfico de probabilidad normal de los residuos:

Los residuos parecen presentar una asimetra a la derecha, lo cual es consistente con el
coeficiente de asimetra calculado = 0,52. Sin embargo, esta no resulta lo suficientemente
marcada como para provocar el rechazo la hiptesis nula de normalidad.

2.7) Test de Durbin-Watson de autocorrelacin


Con este test lo que se desea detectar es la posible existencia de autocorrelacin serial entre los
residuos. Postularemos que:
= 1 +
11

Para comprobar si esta relacin se cumple en la regresin en exposicin utilizaremos el test de


Durbin-Watson, cuyo estadstico es:
=

=2( 1 )2
= 2 (1 )
=1 2

Como se estudi en clase, este estadstico no sigue una distribucin conocida, sin embargo DurbinWatson han estimado valores crticos en una tabla, la cual que se reproducen en Gujarati.7 All
fuimos con el objetivo de extraer los valores crticos Durbin-Watson con N=19 observaciones
(perdimos una al contrastar los residuos consigo mismos rezagados) y k=2 regresoras

(excluyendo el trmino constante):


= 1,074

= 1,536

4 = 2,464

4 = 2,926

El estadstico arroj un = 2,14637.


Nuevamente con la ayuda de Gujarati, recordemos la regla de decisin de este test:8

Dado que = 1,536 < = 2,146 < 4 = 2,464, no rechazamos 0 . Concluimos que
no existe autocorrelacin. Para ver esto ms claramente podemos despejar de la ecuacin:
2,14637 = 2 (1 )

= 0,073

Este valor es muy cercano a cero y, confirma lo que ya nos haba indicado el test, la ausencia de
autocorrelacin significativa.

7
8

Gujarati: Op. cit. Pgina 888.


Tabla extrada de Gujarati: Op. cit. Pgina 435.

12

2.8) Conclusin y confiabilidad de la regresin


Nuevamente observamos que tanto las pruebas t y la prueba F resultaron apoyar ampliamente la
significatividad de la regresin.
Mediante el test de White mostramos que no hay evidencias que indiquen la existencia de
heterocedasticidad. Lo que indica, nuevamente, que la obtencin de los estimadores MCO fue
correcta y estos efectivamente son los Mejores Estimadores Lineales Insesgados.
El test de Jarque-Bera, vimos, indic que la suposicin de normalidad de los residuos resulta
tambin vlida. Lo que le da ms confiabilidad an a las pruebas t y F.
Al contrario de lo que sucedi en el punto 1, el coeficiente de determinacin result ms alto. Lo
que, siempre teniendo en cuenta que no lo tomamos formalmente como un indicador confiable,
tambin apoya la regresin.
Con el test de Durbin y Watson pudimos confirmar que los residuos no presentan correlacin y que
los estimadores efectivamente poseen las propiedades deseables de ser MELI.
Finalmente, podemos confirmar que la regresin MCO de la Curva de Phillips para la Argentina en
el perodo considerado resulta ampliamente confiable y responde a lo que indica la teora,
evidenciando un claro trade-off entre desempleo e inflacin.

13

Bibliografa Consultada

Juan Jos Merlo (2009): Tesis de Magster. Retornos a la educacin durante una depresin
econmica. Evidencia Emprica para la Argentina.

Damodar N. Gujarati (2009): Econometra 5ta edicin. Editorial: McGraw-Hill.

Robert S. Pindyck y Daniel L. Rubinfeld (2000): Econometra: Modelos y Pronsticos 4ta


edicin. Editorial: McGraw-Hill.

Blanchard y Prez Enri (2000): Macroeconoma. Teora y Poltica Econmica con


Aplicaciones a Amrica Latina.
Notas de Clase.

14

Вам также может понравиться