Вы находитесь на странице: 1из 12

Econometria

Notas de Clases Practicas

Guillermo Bozzoli

Notas de Clases Practicas #7:


ESTIMACION POR EL METODO DE
VARIABLES INSTRUMENTALES:UN
EJEMPLO.
1.- MARCO TEORICO
Muchas veces, los supuestos sobre los cuales los estimadores de Minimos
Cuadrados Ordinarios son Insesgados y Eficientes no se cumplen. Por ejemplo, si se
levanta el supuesto de homoscedasticidad o no autocorrelacion, los estimadores ya no
son los de menor varianza, aunque mantienen su ausencia de sesgo. En el caso que nos
ocupa en estas hojas, el supuesto a levantar es el de regresores no aleatorios, y en
particular, correlacionados con el termino del error.
En el caso de regresores aleatorios pero donde los regresores (X) estan
independientemente distribuidos de los u, es facil probar que se mantiene la propiedad
de insegamiento, ya que
b=(XX)-1XY
b=+(XX)-1Xu
E(b)=+E[(XX)-1X]Eu (por el supuesto de independencia)
E(b)= (siempre que Eu=0)
Pero este es un caso particular: en general, si parte de los regresores son
aleatorios, no es posible discernir que ocurre con E(XX)-1Xu, y es necesario evaluar
que ocurre en el limite (o asintoticamente) con el estimador. Para ello podemos utilizar
nociones de limite probabilistico ( o plim).
Intuitivamente, queremos saber si la distribucion de b cuando n colapsa en un
punto1 y de ser asi, en cual.
Observando que
b=+(XX)-1Xu
b=+(n-1XX)-1n-1Xu
y usando propiedades de operaciones con limites probabilisticos,
plim(b) = + plim [(n-1XX)-1]plim(n-1Xu)
Para que b sea un estimador consistente de , por definicion necesitamos que
plim(b)=.
Esto estaria ganrantizado si plim (n-1XX)=Q (no singular, es decir existe Q-1) y plim (n1
Xu)=q=0 ya que
plim b = + plim [(n-1XX)-1] plim n-1Xu
plim b = + Q-1q =

Si b es un vector con k componentes se entiende que el punto es un vector en Rk.

Econometria

Notas de Clases Practicas

Guillermo Bozzoli

La propiedad sobre la que nos vamos a concentrar es que, para que b sea un
estimador consistente de (y dado que plim (n-1XX)-1=Q-1) necesitamos que plim n1
Xu=0 que se puede resumir como el requisito que X no este correlacionado con u en
el limite. Si esto no ocurre, el estimador seria inconsitente. En este caso, este
problema no se podria resolver , por ejemplo, aumentando el tamao de la muestra.
En este caso, existen metodos de estimacion que dados ciertos supuestos, nos
permiten obtener estimadores consistentes de los parametros de interes.
Para motivar uno de estos estimadores, utilizaremos un ejemplo clasico de variables
correlacionadas con errores: el modelo de ecuaciones simultaneas.

Hasta ahora, hemos considerado que nuestras variables explicativas eran no aleatorias y
que la relacion entre variables podia describirse por medio de una ecuacion.
Ahora consideremos el caso donde las ventas y el precio de un bien se determinan
simultaneamente por la interaccion de la demanda y la oferta.
Imaginemos que en este mercado se resgistran operaciones diarias.
La cantidad demandada (Qdt) depende del precio (pt) y del ingreso de las familias (It),
este ultimo esta dado y no depende de lo que ocurre en este mercado. Una forma de
llamar a esta ultima variable es predeterminada .La cantidad demandada depende
ademas de errores o shocks a la demanda u1t, donde puede pensarse que son por
ejemplo shocks a las preferencias.
Funcion de Demanda:
(1) Qdt =1+2pt+3It+u1t
Ahora pensemos que la cantidad ofrecida (Qst)depende del precio pt y del precio de la
jornada previa
(pt-1), que esta dado antes de que se realicen las transacciones hoy. Supongamos que
podemos asumir que pt-1 esta predeterminado2. Ademas, existen errores o shocks a la
oferta, u2t, que podrian interpretarse como shocks a la funcion de produccion de este
bien, por ejemplo.
Funcion de Oferta:
(2) Qst= 1+2pt+3pt-1+u2t
Despues, cerrariamos el modelo con una market clearing condition o condicion de
consistencia que especifica que en equilibrio las cantidades demandadas deben igualar
a las ofrecidas y el precio ajusta en todo t para que ello ocurra.
2

Esto no es automatico. Por ejemplo, como pt-1 depende de la oferta y demanda previa, esta
correlacionado con los errores de t-1(ut-1), y si los errores de t-1 estan correlacionados con los de t,
entonces, podria ocurrir que pt-1 este correlacionado con los ut y entonces no podria ser considerado
predeterminado. Asumiendo que los u t son independientes entre periodos, podemos tratar a pt-1 como
predeterminada

Econometria

Notas de Clases Practicas

Guillermo Bozzoli

Condicion de Equilibrio:
(3) Qst=Qdt=Q
Reemplazando (3) en (2) y (1) obtenemos una descripcion de los determinantes del
precio y la cantidad como un sistema de dos ecuaciones.
Qt =1+2pt+3It+u1t
Qt= 1+2pt+3pt-1+u2t
Imaginense a un investigador que intentara estimar la ecuacion de demanda y obtiene
datos de p y Q de este mercado. Sin embargo, el investigador dispone de un scatter
plot de precios vs. cantidades. Pero p y Q tienen mas de una relacion involucrada.
Entonces, como podria saber si la linea que mejor ajusta a los puntos es una funcion
de demanda, de oferta o cualquier cosa?
12

10

0
0

0.5

1.5

2.5

GRAFICO 1: OBSERVACIONES DE PRECIOS Y CANTIDADES


Esos puntos (equilibrios de mercado) en el espacio p,Q, pueden haber sido generados
por configuraciones de oferta y demanda muy distintas. El grafico 2 muestra un caso
posible: que se haya desplazado la oferta todo el tiempo y la demanda no haya variado,
en cuyo caso, la recta que mejor ajuste los puntos describiria la demanda.

Econometria

Notas de Clases Practicas

Guillermo Bozzoli

12
S
10

S'

S'

S'''

4
D
2

0
0

0.5

1.5

2.5

Pero podria ocurrir que los puntos se generen al darse desplazamientos en la oferta y en
la demanda, en cuyo caso, la recta que mejor ajusta los puntos no describe ni la
demanda ni la oferta, como muestra el grafico 3.

12
S
10

S'

S'

D'

S'''
D''

D'''

0
0

0.5

1.5

2.5

En estos casos, distintos comportamientos de oferta y demanda pueden generar


exactamente los mismos equilibrios. Entonces teniendo informacion sobre los
equilibrios no puede inferirse las caracteristicas de la demanda o de la oferta. Este
hecto se conoce como problema de identificacion. Si fuera cierto que la oferta estuviera
despalzandose siempre, mientras que la demanda permaneciera inmovil, entonces la
demanda estaria identificada solo con realizar este supuesto y tener datos de p y Q.
En la realidad, para evaluar cuales son las caracteristicas de la oferta y demanda, no se
supone que una funcion esta fija y la otra varia, sino que se especifica un modelo de
ecuaciones simultaneas, que se supone, describen el comportamiento de compradores
y vendedores. Luego, en este modelo se evalua si las ecuaciones estructurales estan
identificadas.
Por ejemplo, el siguiente sistema, describe el comportamiento de los agentes del
mercado:

Econometria

Notas de Clases Practicas

Guillermo Bozzoli

Qt =1+2pt+3It+u1t
Qt= 1+2pt+3pt-1+u2t
A esta forma de describir el mercado, por medio de funciones de comportamiento
(en este caso demanda y oferta) se lo conoce como forma estructural.
Podriamos reescribir las ecuaciones en forma matricial, de la siguiente manera
1 2 Q t 1
1 p =

2 t
1

3
0

1
0
u
I t + 1t

u
3
p t 1 2 t

AYt = Z t + u t
donde :
1 2
Q

A =
; Yt = t ; = 1

G *G
1 2 G*1 p t G*K 1
1
u
Z t = I t ; u t = 1t
K *1
u 2 t
p t 1

3
0

0
3

ademas :
u t ~ IN(0, ),
donde
2
= 1
12

u 12t
12
=
E

22
u 1t u 2 t

u 1t u 2 t

u 22 t

Notar que AYt=t+ut sigue estando en forma estructural ya que las endogenas (p y
Q) siguen interrelacionadas entre si.
Una forma alternativa de expresar estas ecuaciones es despejar las endogenas (p y Q)
en funcion de las predeterminadas (1, I, pt-1).
Yt=A-1Zt+A-1ut
o
Yt=Zt+vt, donde =A-1, vt= A-1ut
Si escribimos las ecuaciones, encontramos que

Econometria

Notas de Clases Practicas

Guillermo Bozzoli

2 3
u 2 u 1t
2 1 1 2
p t 1 + 2 2 t
3 2 It +
2 2
2 2
2 2
2 2
3
3
+ 1
u u1

pt = 1
It +
p t 1 + 2
2 2 2 2
2 2
2 2

Qt =

A este sistema se lo conoce como forma reducida, y describe la solucion para p y Q en


funcion de las predeterminadas y los shocks.
De la solucion para p observamos que esta depende de los shocks, o sea esta
correlacionada con los errores, violando por un lado el supuesto de X no aleatoria y
ademas el de no correlacionada con el error.
Entonces, un investigador que intentara estimar la demanda, es decir la ecuacion 1 por
MCO, estaria utilizando estimadores inconsistentes, y, por lo tanto, sus hallazgos
carecerian de validez.
Existen varios estimadores para estimar la funcion de demanda o de oferta. Nosotros
nos concentraremos en estimadores que nos permitan analizar de una ecuacion por vez,
siendo conocidos como single equation methods. Aun habiendo elegido un metodo
particular,para poder estimar, por ejemplo la elasticidad de la demanda en forma
apropiada, necesitamos que la ecuacion estructural que queremos estimar este, al menos
identificada. Una de las condiciones usadas es la condicion de orden, que es una
condicion necesaria aunque no suficiente de identificacion.
Lema 1: Condicion de Orden para la identificacion (Order Condition)
Sea G la cantidad de variables endogenas en todo el sistema, y Gi la cantidad de
endogenas en la ecuacion estructural i.
Sea K la cantidad de variables predeterminadas en todo el sistema(sin contar las
constantes), y Ki la cantidad de predeterminadas en la ecuacion estructural i(sin contar
la constante).
Si se cumple que
K-KiGi-1,
entonces la ecuacion i esta (al menos) identificada. Si la desigualdad es estricta, esta
sobre identificada, y si no se cumple la condicion, la ecuacion no esta identificada.
En el caso de la ecuacion de la demanda:
K=2 (I, p1)
Ki=1(I)
Gi=2(Q y P)
En nuestro caso, se cumple la condicion de orden para la ecuacion de demanda,
y , por lo tanto, la demanda estaria identificada.

Econometria

Notas de Clases Practicas

Guillermo Bozzoli

Ahora vamos a considerar un estimador alternativo, y derivar sus


propiedades.Consideremos que la ecuacion de la demanda se escribe como
Y=X+u
Ademas, sabemos que
plim(b) = + plim [(n-1XX)-1]plim(n-1Xu)
Como plim n-1Xu difiere de 0, b es un estimador inconsistente.
Ahora, si consideramos un conjunto de variables instrumentales incorporadas en
la matriz W (que van a ser las predeterminadas en nuestro caso, incluyendo a la
constante).
Dicha matriz W debe satisfacer:
i)plim (n-1WX)=, no singular (es decir existe -1). Esta condicion exige que la
matriz de W este correlacionada con los X.
ii)plim (n-1Wu)=0 , exigiendo que los W no esten (a diferencia de los X)
correlacionados con los u.
y consideremos al estimador de Variables Instrumentales (IV)
bIV=(WX)-1WY
Si sustituimos Y= X+u
bIV=(WX)-1W (X+u)=+(WX)-1Wu
y entonces, aplicando plim
plim bIV=+plim(n-1WX)-1plim(n-1 Wu)= !
Entonces, bajo las condiciones plim (n-1WX)-1= 1 y plim (n-1Wu)=0 , el
estimador de variables instrumentales bIV es un estimador consistente de .En la matriz
de W pueden estar variables no correlacionadas con el error, por ejemplo el rezago de p
y el Ingreso.

2.-ESTIMACION EN PCGIVE
Para evaluar cuales serian los efectos de estimar por MCO la ecuacion (1), y como
funcionarian el estimador alternativo que estamos por introducir, generemos una
muestra de 100 observaciones donde las ecuaciones estructurales son:
Qdt =3pt+It+u1t
y
Qst= 3+2pt+0.6pt-1+u2t

Econometria

Notas de Clases Practicas

Guillermo Bozzoli

y
Var(u1t)=1, Var(u2t)=1, y Cov(u1t,u2t)=0.
Es decir
1=3,
2=-1,
3=1,
1=3,
2=2,
3=0.6,
11=1,
12= 21=0,
22=1.
De forma tal que la elasticidad precio de la demanda es (-)1, la elasticidad precio de la
oferta es 2, y la elasticidad ingreso de la demanda es 1 en el modelo poblacional.
Una de las ventajas de simular una muestra es que sabemos cuales son los verdaderos
parametros, entonces podemos evaluar cuan precisos son los estimadores.
Dada una muestra de shocks u1t, u2t (t=1,...,100) sacados de una distribucion que
cumple las caracteristicas de esta simulacion(ut~IN(0,), donde Var(u1t)=1, Var(u2t)=1,
y Cov(u1t,u2t)=0. ), reconstruimos el equilibrio de mercado usando la forma reducida.
Tomemos un cross plot de Q contra p de estos 100 datos. De esta nube de puntos
dificilmente se puede argumentar que se observa una curva de demanda.

qxp

80

78

76

74

72

70

23

23.5

24

24.5

25

25.5

26

26.5

27

27.5

28

28.5

29

Si el investigador tratara de estimar la demanda, corriendo una regresion de Q contra p


y el ingreso, obtendria resultados diferentes al cross-plot. Sin embargo, en la falsa
demanda estimada , el coeficiente de p no es significativamente distinto de 0 y

Econometria

Notas de Clases Practicas

Guillermo Bozzoli

significativamente mayor a 1, que es la verdadera elasticidad de la demanda. Este es un


sintoma (aunque no una confirmacion) de la inconsistencia del estimador de OLS.
Ademas noten que el coeficiente estimado del ingreso es significativamente menor a 1,
que es la elasticidad ingreso de la demanda verdadera.
EQ( 1) Modelling q by OLS (using Data1)
The present sample is: 1 to 100
Variable
Constant
p
I

Coefficient
10.625
0.059193
0.62770

Std.Error
1.9966
0.14572
0.049461

t-value
5.322
0.406
12.691

t-prob
0.0000
0.6855
0.0000

HCSE PartR^2
1.9171 0.2260
0.14597 0.0017
0.047545 0.6241

R^2 = 0.925711 F(2,97) = 604.35 [0.0000] \sigma = 0.755643


RSS = 55.38657387 for 3 variables and 100 observations

DW = 1.87

Como podemos estimar por medio de estimadores consistentes la ecuacion de la


demanda?
Uno de los metodos mas usuales es el de variables instrumentales. Con este metodo,
podemos estimar ecuaciones de la forma estructural en forma consistente.
Lo que necesitamos es que existan una matriz W de instrumentos tal que en el limite:
i)
ii)

las variables incluidas en W esten correlacionados con los X .


las variables incluidas en W no esten correlacionados con los errores.

Para estimar la demanda, consideremos a p1 e I como componentes de W, ya que:


i)
ii)

ambos estan correlacionados con p e I (ver en la forma reducida que p es funcion


de p1 e I, e I es funcion de I, trivialmente)
ambos no estan correlacionados con el error ya que asumimos que eran
predeterminados

El ingreso, al ser predeterminado puede y debe quedar como regresor valido.


Claramente el ingreso (I) debe ser incluido como como exogeno en la ecuacion, en
caso contrario estariamos bajo variables omitidas (el ingreso causa desplazamientos de
la funcion demanda).

Pero porque incluir en W a p1, que pertenece a la oferta? Porque p1 desplaza la oferta!
La idea es que al incluirla como instrumento en la demanda, va a netear el efecto de la
oferta en las cantidades y precios, permitiendonos obtener estimadores consistentes de
los parametros de la demanda.
Para correr la ecuacion de demanda por el metodo de variables instrumentales, vamos a
elegir explicar a q por p, I
y p1. En PcGive>Model>Formulate seleccionamos las variables en este orden, y luego
marcamos una vez p, y apretamos el boton de Endogenous, entonces antes de p va a
aparecer una E. Luego marcamos p1 y marcamos el boton de Instrument, apareciendo
una I antes de p1. Esto indica que, si elegimos correr la ecuacion por variables
instrumentales, p va a ser considerada endogena e y el instrumento sera p1. El ingreso

Econometria

Notas de Clases Practicas

Guillermo Bozzoli

es considerada exogena, pero tambien podria ser intrumentada por si misma (es lo
mismo). Al presionar OK, aparece Estimate Model, donde en Method elegimos
Instrumental Variables. Apretamos OK y en GiveWin>Windows>Results aparece la
siguiente salida. Primero nos va a mostrar dos regresiones de las endogenas como
funcion de las predeterminadas, es decir las estimaciones de la forma reducida para p
y Q.

Modelling Reduced Form for q


Variable
Coefficient
Std.Error
Constant
5.4890
2.1804
I
0.64592
0.017449
p1
0.18724
0.051324

t-value
2.517
37.017
3.648

R^2 = 0.934563 F(2,97) = 692.67 [0.0000] RF \sigma = 0.709196


RSS = 48.78704655 for 3 variables and 100 observations
Modelling Reduced Form for p
Variable
Coefficient
Std.Error
Constant
0.31886
1.3280
I
0.31500
0.010628
p1
-0.21460
0.031259

DW = 1.83

t-value
0.240
29.640
-6.865

R^2 = 0.904913 F(2,97) = 461.56 [0.0000] RF \sigma = 0.431946


RSS = 18.09799125 for 3 variables and 100 observations

DW = 1.94

Luego obtenemos la siguiente salida, que es la estimacion de la demanda por Variables


Instrumentales.
EQ( 2) Modelling q by IVE (using Data1)
The present sample is: 1 to 100
Variable
p
Constant
I

Coefficient
-0.87249
5.7672
0.92075

Std.Error
0.30381
2.7121
0.098099

t-value
-2.872
2.126
9.386

t-prob
0.0050
0.0360
0.0000

Additional Instruments used:


p1
\sigma = 0.90091 DW = 1.87
RSS = 78.7290263 for 3 variabless and 100 observations
2 endogenous and 2 exogenous variables with 3 instruments
Reduced Form \sigma = 0.709196
Testing \beta=0:Chi^2(2) =
858.47 [0.0000] **
AR 1- 2 F( 2, 95) =
ARCH 1 F( 1, 95) =
Normality Chi^2(2)=
Xi^2
F( 4, 92) =
Xi*Xj
F( 5, 91) =

0.25549
0.72413
4.7835
0.89451
1.3388

[0.7751]
[0.3969]
[0.0915]
[0.4706]
[0.2551]

Noten que la elasticidad-precio estimada de la demanda es indistinguible de (-1) y la


elasticidad ingreso es indistinguible de 1, a diferencia de la estimacion por OLS.
Una forma alternativa de obtener los coeficientes (aunque no los errores standard, R2,
etc) es la siguiente:
i) Correr una regresion de p contra I y p1 y guardar los valores de prediccion,
llamemoslos phat. Esto se puede hacer corriendo por OLS la regresion y despues en

Econometria

Notas de Clases Practicas

Guillermo Bozzoli

PcGive eligen Test>Store in Database>Fitted Values, y le ponen de nombre phat.


Noten que la ecuacion es la forma reducida para p. El ingreso es instrumentado por si
mismo (que es la variable incluida en W que explica 100% de la variabilidad de I)
EQ(35) Modelling p by OLS (using Data1)
The present sample is: 1 to 100
Variable
Constant
p1
I

Coefficient
0.31886
-0.21460
0.31500

Std.Error
1.3280
0.031259
0.010628

t-value
0.240
-6.865
29.640

t-prob
0.8107
0.0000
0.0000

HCSE PartR^2
1.3622 0.0006
0.034154 0.3270
0.010703 0.9006

R^2 = 0.904913 F(2,97) = 461.56 [0.0000] \sigma = 0.431946


RSS = 18.09799125 for 3 variables and 100 observations

DW = 1.94

ii)Correr por OLS una regresion de Q contra phat e I.


EQ(36) Modelling q by OLS (using Data1)
The present sample is: 1 to 100
Variable
Constant
phat
I

Coefficient
5.7672
-0.87249
0.92075

Std.Error
2.1349
0.23916
0.077223

t-value
2.701
-3.648
11.923

t-prob
0.0082
0.0004
0.0000

HCSE PartR^2
2.0905 0.0700
0.24364 0.1206
0.078052 0.5944

R^2 = 0.934563 F(2,97) = 692.67 [0.0000] \sigma = 0.709196


RSS = 48.78704655 for 3 variables and 100 observations

DW = 1.83

Los coeficientes estimados son iguales al del metodo de Variables Instrumentales,


mientras que los errores standard, t , S.E.R, R2 difieren por la forma en que se
computan los residuos.

3.-UN TEST DE ENDOGENEIDAD?


Como se puede evaluar la potencial correlacion en el limite de una variable con el
error? Comprobando la correlacion entre los residuos y los X es una opcion poco
fructifera, ya que por construccion, los residuos van a ser ortogonales (tienen
correlacion 0) con los residuos, ya que una de las condiciones que cumplen los
esimadores de OLS es Cov(X,Residuos)=0.
Noten que si no hay correlacion, los estimadores de OLS son consistentes (al igual que
los de IV), mientras que son inconsistentes si hay correlacion en el limite entre algun
regresor y los errores.
Un test comunmente usado es el test de Hausman. No es automaticamente un test de
exogeneidad , solo evalua si hay diferencias entre los estimadores de IV y de OLS. En
realidad, hay varias versiones del test que son asintoticamente equivalentes. En
nuestro caso elegiremos una version, pero en textos pueden encontrar otras formas de
realizar test similares. El test no se calcula automaticamente en Pc-Give, pero se puede
realizar en por medio de dos regresiones:

i) Correr una regresion de la supuesta variable correlacionada con el error contra las
otras variables (potenciales instrumentos y exogenas): en este caso, correr una regresion
de p contra I y p1. Guardar el valor de prediccion: phat.
Esto ya lo hicimos antes.

Econometria

Notas de Clases Practicas

Guillermo Bozzoli

ii) Estimar la ecuacion estructural, esto es q contra p e I, pero agregando phat a dicha
regresion. Si phat resulta significativo, puede interpretarse como evidencia de
correlacion en el limite entre la variable sospechosa y el error.
EQ(38) Modelling q by OLS (using Data1)
The present sample is: 1 to 100
Variable
Constant
I
p
phat

Coefficient
5.7672
0.92075
0.51187
-1.3844

Std.Error
2.0391
0.073756
0.15922
0.27844

t-value
2.828
12.484
3.215
-4.972

t-prob
0.0057
0.0000
0.0018
0.0000

HCSE PartR^2
1.9636 0.0769
0.074582 0.6188
0.14865 0.0972
0.24446 0.2048

R^2 = 0.940923 F(3,96) = 509.66 [0.0000] \sigma = 0.677351


RSS = 44.0452114 for 4 variables and 100 observations

DW = 1.82

En este caso, si hubieramos sospechado que p era potencialmente endogena, y


considerabamos a p1 como intrumento, hubieramos llegado a la conclusion que
realmente era endogena, y entonces la forma apropiada de modelar la ecuacion era por
el metodo Variables Instrumentales.

Вам также может понравиться