Вы находитесь на странице: 1из 35

Econometria I

Tema 5: Estimación por Variables Instrumentales. Mínimos Cuadrados


en 2 Etapas

Universidad Carlos III

Getafe, Madrid

Octubre-November 2008

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 1 / 35


Outline

Motivación: variables omitidas


Estimación VI del modelo de regresión multiple
Mínimos Cuadrados bietápicos
Soluciones VI para problemas de errores en las variables
Contraste de endogeneidad y contraste de sobreidenti…cación
El estimador de MC2E con Heteroscedasticidad

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 2 / 35


Motivación: Variables Omitidas

Ante un posible problema de variables omitidas, tenemos tres


opciones:
Ignorar el problema y afrontar las consecuencias de estimadores
sesgados e inconsistentes.
Podemos intentar encontrar y usar una variable proxy adecuada para la
variable no observada.
Podemos asumir que la variable omitida no cambia en el tiempo y usar
métodos de datos de panel.

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 3 / 35


Método de Variables Instrumentales (VI)
Escribimos el modelo de regresión como

y = β0 + β1 x1 + u

donde

Cov (x, u ) 6= 0

El método de VI funciona independientemente de si x y u están


correlados o no, pero si no lo están es mejor usar MCO.
Para obtener estimadores consistentes de β0 y β1 cuando x y u están
correlados, necesitamos información adicional: una nueva variable z
que satisfaga ciertas propiedades.
La nueva variable z es una Variable Instrumental para x si satisface:
IV 1 : Cov (z, u ) = 0
IV 2 : Cov (z, x ) 6= 0
Julio Cáceres Delpiano (UC3M) Econometria I 10/07 4 / 35
Método de Variables Instrumentales (VI)

Podemos testear estos supuesto?


Es una proxy un buen candidato de Instrumento?.
En el caso de la ecuación de Mincer. Que podemos ocupar como
Instrumento?
Última cifra del número de la Seguridad Social de un individuo?
Educación de los padres?
Numero de Siblings?

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 5 / 35


Ejemplo: asistencia a clase

score = β0 + β1 skipped + u
El problema es que el número de clases no atendidas, skipped, puede
estar correlado con otros factores en u, ya que mejores estudiantes
normalmente faltan menos a clase.
Una buena VI debería no tener efecto directo sobre score y no estar
correlada con la habilidad del estudiante, y a la vez, estar correlada
con skipped.
Distancia entre el domicilio y el campus.

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 6 / 35


Identi…cación

La identi…cación de un parámetro β1 implica que podemos escribir β1


en términos de momentos poblacionales que se pueden estimar
usando una muestra.
Usando el modelo
y = β0 + β1 x + u

vemos que

Cov (z, y ) = β1 Cov (z, x ) + Cov (z, u ).


Los supuestos de validez de z como VI, VI.1-2 suponen que
Cov (z, x ) 6= 0 y Cov (z, u ) = 0, por lo que
Cov (z ,y )
β1 = Cov (z ,x )

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 7 / 35


Identi…cación

El Estimador de Variables Instrumentales (EVI) es el análogo


muestral,

∑i (zi z̄ )(yi ȳ )
β̂1 = ∑i (zi z̄ )(xi x̄ )
El estimador de VI de β0 es simplemente

β̂0 = ȳ β̂1 x̄

Si z = x, entonces EVI=EMCO. Si x es exógena, se puede usar como


su propia VI.

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 8 / 35


Inferencia Estadística con el EVI

Similitud con el EMCO: asintóticamente normal en muestras grandes.


Para hacer inferencia se necesita un error estándar para computar
estadísticos t e IC.
Típicamente necesitamos una condición de homoscedasticidad, en
este caso sobre la VI:

Var (u jz ) = σ2 = Var (u ).

Entonces

σ2
AVar ( β̂1 ) = nσ2x ρ2xz

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 9 / 35


Errores estándar EVI

AVar ( β̂1 ) puede estimarse consist. dada una muestra.


Error estándar: raíz cuadrada de la estimación de AVar ( β̂1 ).

σ̂2
2
STC x R xz

2 es el coef. de determ. de la regresión de x s. z,


donde Rxz

σ̂2 = 1
n 2 ∑ ûi2

Además se puede comparar las AVar de los EVI y de los EMCO:


IV σ2 MCO σ2
AVar ( β̂1 ) = nσ2x ρ2x ,z
, AVar ( β̂1 )= nσ2x

IV MCO
Como ρ2x ,z <= 1 entonces AVar ( β̂1 ) AVar ( β̂1 )

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 10 / 35


VI pobres o débiles

Los EVI tienen una alta varianza si la correlación de la VI con x es


pequeña.
La correlación entre z y u puede tener incluso peores consecuencias en
términos de sesgo:
Corr (x ,u ) σu
plim ( β̂1 ) = β1 + Corr (x ,z ) σx

En este caso, si sólo atendemos a consistencia, no está claro que es


mejor usar EVI que EMCO:
MCO
plim ( β̂1 ) = β1 + Corr (x, u ) σσux

Entonces cuando preferiremos VI sobre MCO?


Entonces, . . . que debemos hacer?

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 11 / 35


Cálculo del R 2 en estimación VIs

La mayoría de paquetes econométricos calculan

SCE
R2 = 1 SCT

donde SCE es la suma de cuadrados de los residuos de la estimación


VI.

En este caso R 2 puede ser negativo ya que SCE puede ser mayor que
SCT.

Además cuando x y u están correlados, no podemos descomponer la


varianza de y en β21 Var (x ) + Var (u ) , por lo que el R 2 no tiene
interpretación natural.
Si el objetivo es reportar el mayor R 2 posible, entonces EMCO es la
solución.
Julio Cáceres Delpiano (UC3M) Econometria I 10/07 12 / 35
Estimación VI del modelo de regresión múltiple

y1 = β0 + β1 y2 + β2 z1 + u1

Mide una relación causal, y estamos interesados en los βj

Nueva notación para distinguir variables endógenas (y1 , y2 ) de las


variables exógenas (z) .
El término de error u satisface E [u ] = 0.
Asumimos que z1 está incorrelada con el término de error, E [z1 u ] = 0.
Pero es posible que y2 esté correlada con u (por ejemplo por que hay
factores omitidos en u).

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 13 / 35


EVI para regresión múltiple

y1 = β0 + β1 y2 + β2 z1 + u1

La idea es buscar un instrumento para y2 .


Aunque z1 está incorrelada con u, no podemos usarla como
instrumento para y2 : ya aparece en la ecuación y no se puede usar
dos veces.

Hay que buscar otra variable z2 que no esté en la ecuación.


El supuesto clave es que z1 y z2 no estén correladas con u1 :
E (u1 ) = 0, Cov (u1 , z1 ) = 0, Cov (u1 , z2 ) = 0.

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 14 / 35


EVI para regresión múltiple (II)

Estas condiciones son equivalentes a

E (u1 ) = 0, E (u1 z1 ) = 0, E (u1 z2 ) = 0.

Y estas condiciones son equivalentes a

∑ni=1 (yi 1 β̂0 β̂1 yi 2 β̂2 zi 1 ) = 0


∑ni=1 zi 1 (yi 1 β̂0 β̂1 yi 2 β̂2 zi 1 ) = 0
∑ni=1 zi 2 (yi 1 β̂0 β̂1 yi 2 β̂2 zi 1 ) = 0

que son un sistema de 3 ecuaciones con 3 incógnitas, β̂0 , β̂1 , β̂2 : los
estimadores de Variables Instrumentales.
Si y2 = z2 porque creemos que es exógena, entonces tenemos que
EVI=EMCO.

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 15 / 35


EMVI: validez de instrumentos
Necesitamos que z2 esté correlado con y2 , pero hay que tener en
cuenta también a z1 .
La condición hace referencia a la correlación parcial:

y2 = π 0 + π 1 z1 + π 2 z2 + v2
donde
E (v2 ) = 0, Cov (v2 , z1 ) = 0, Cov (v2 , z2 ) = 0.
y los π j son parámetros desconocidos.

La condición clave de identi…cación es


π 2 6= 0,
que dice que después de descontar el efecto de z1 , z2 e y2 está
correlados.

El contraste es fácil: se estima el modelo por MCO y se hace un


contraste de la t.
Julio Cáceres Delpiano (UC3M) Econometria I 10/07 16 / 35
EMVI: validez de instrumentos

Pero no se puede hacer un contraste para Cov (u1 , z2 ) = 0.

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 17 / 35


Formas reducidas

Forma reducida de y2
y2 = π 0 + π 1 z1 + π 2 z2 + v2

donde
E (v2 ) = 0, Cov (v2 , z1 ) = 0, Cov (v2 , z2 ) = 0.

Esta ecuación es una forma reducida: explica una variable endógena


en función de variables exógenas.
El nombre sirve para distinguirla de las ecuaciones estructurales, que
miden relaciones causales.

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 18 / 35


EVI para regresión múltiple: más de dos variables

y1 = β0 + β1 y2 + β2 z1 + . . . + βk zk 1 + u1
y2 puede estar correlada con u1 .
Se dispone de una variable zk para hacer de instrumento de y2 .
Asumimos que
E (u1 ) = 0, Cov (u1 , zj ) = 0, j = 1, . . . , k.
La forma reducida para y2 es

y 2 = π 0 + π 1 z1 + . . . + π k zk + v2 .

El supuesto clave es para que zk y y2 estén correladas parcialmente es

π k 6= 0

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 19 / 35


Mínimos cuadrados bietápicos

En ocasiones disponemos de dos o más variables exógenas excluidas


de la ecuación para servir de instrumentos para y2 .
Ambas variables están correladas con y2 y son posibles instrumentos
válidos para y2 .
Consideramos los casos de una y variables variables explicativas
endógenas

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 20 / 35


El caso de una sóla variable explicativa endógena
y 1 = β0 + β1 y2 + β2 z1 + u1
Ahora disponemos de dos variables exógenas excluidas: z2 y z3 , y que
están excluidas de la ecuación.
Restricciones de exclusión: z2 y z3 no aparecen en la ecuación y están
incorreladas con u1 .
Si las dos variables z2 y z3 están correladas con y2 entonces cada una
de ellas se podría usar como VI para y2 .
Entonces tendríamos dos VI y en general ninguna de las dos sería
e…ciente: como z1 , z2 y z3 están incorrelados con u1 , cualquier
combinación lineal también lo estará y será una VI válida.
La VI óptima será la que tenga la correlación máxima con y2 : la
forma reducida de y2 ,
y2 = π 0 + π 1 z1 + π 2 z2 + π 3 z3 + v2
E (v2 ) = 0, Cov (v2 , z1 ) = 0, Cov (v2 , z2 ) = 0, Cov (v2 , z3 ) = 0.

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 21 / 35


VI óptimas

y2 = π 0 + π 1 z1 + π 2 z2 + π 3 z3

Queremos que esta VI no esté perfectamente correlada con z1 (para


que esté correlada parcialmente con y2 aparte del efecto de z1 ).
Para ello necesitamos que
π 2 6= 0 ó π 3 6= 0.

La ecuación no está identi…cada si π 2 = π 3 = 0.


La condición de identi…cación se puede contrastar con un test de la F
para H0 : π 2 = 0 y π 3 = 0.

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 22 / 35


Interpretación 1a etapa

La forma reducida de y2
y2 = π 0 + π 1 z1 + π 2 z2 + π 3 z3 + v2
divide a y2 en dos partes
y2 = π 0 + π 1 z1 + π 2 z2 + π 3 z3 que es la parte de y2 incorrelada con
el error u.
v2 : que es la parte posiblemente correlada con u, por lo que y2
Con los datos sobre zj podemos calcular y2 para cada observación si
se conocen los π j .
En la práctica los π j s deben estimarse por MCO y computar para
cada i, ŷi 2 :
ŷ2 = π̂ 0 + π̂ 1 z1 + π̂ 2 z2 + π̂ 3 z3

En este momento debemos comprobar que z2 y z3 son conjuntamente


signi…cativos. En caso contario esta regresión no conduce a VI válidas.

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 23 / 35


Interpretación 2a etapa

Esta basada en la utilización de ŷ2 como VI para y2

∑ni=1 ŷi 2 (yi 1 β̂0 β̂1 yi 2 β̂2 zi 1 ) = 0

Cuando hay múltiples instrumentos el EVI también se denomina


Estimador de Mínimos Cuadrados Bietápicos o en 2 etapas (EMC2).
La razón del nombre es que el estimador VI se puede obtener por dos
regresiones MCO, ya que la 2a etapa equivale a hacer una regresión
MCO de
y1 sobre ŷ2 , z1 .

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 24 / 35


EMC2

1a etapa: regresión de y2 sobre z1 , z2 y z3 : se obtiene ŷ2 .


2a etapa: regresión de y1 sobre ŷ2 y z1 .
La diferencia con MCO entonces es usar ŷ2 en lugar de y2 .
La idea es que ŷ2 es la versión estimada de y2 , que está incorrelada
con u1 , por lo que EMC2 libera a y2 de su correlación con u1 .
Por tanto la regresión MCO sobre y2 es válida, ya que
y2 = y2 + v2
y1 = β0 + β1 y2 + β2 z1 + u1 + β1 v2
donde el nuevo error u1 + β1 v2 está incorrelado con y2 y con z1 .

Sin embargo los errores estándar de esta segunda etapa no son los
correctos para EMC2.

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 25 / 35


Condiciones para inferencia asintótica válida para EMC2

y1 = β0 + β1 y2 + β2 z1 + . . . + βk zk 1 + u1
Cada zj está incorrelado con u1 .
Necesitamos al menos una variable exógena que esté correlada
parcialmente con y2 (aparte de las zj , j = 1, . . . , k 1 ya presentes
en la ecuación).
Para que los e.s.y estadísticos t habituales sean válidos se necesita
una condición de homoscedasticidad: la varianza de u1 no puede
depender de ningún regresor exógeno.

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 26 / 35


Multicolinealidad y MC2

La multicolinealidad provoca que EMCO tenga grandes err. std.


El problema puede ser todavía más grave para MC2.
La varianza asintótica del EMC2 se puede aproximar por
σ2
SCT 2 (1 R 22 )
donde donde σ2 = Var (u1 ) , SCT2 es la varianza total de ŷ2 y R22 es
el R 2 de la regresión de ŷ2 sobre todas las otras variables exógenas
que aparecen en la ecuación estructural.
Hay dos razones por las que la varianza del EMC2 es mayor que la del
EMCO:
Por construcción ŷ2 tiene menos variación que y2 (ya que ŷ2 es un
residuo).
Además la correlación de ŷ2 con el resto de variables exógenas es
frecuentemente mucho mayor que la de y2 y esas variables.ŷ2 es una
función de esas variables y los otros instrumentos que evitan que la
correlación sea perfecta y R22 = 1.

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 27 / 35


Múltiples Variables endógenas

y1 = β0 + β1 y2 + β2 y3 + β3 z1 + β4 z2 + β5 z3 + u1

donde E (u1 ) = 0, Cov (zj , u1 ) = 0.

y2 y y3 son variables explicativas endógenas y pueden estar correladas


con u1 .
El problema puede ser todavía más grave para MC2.
Para estimar esta ecuación por VI necesitamos al menos dos variables
exógenas que no aparezcan en la ecuación y que estén correladas
parcialmente con y2 y con y3 , por ejemplo z4 y z5 .
Condición necesaria: bien z4 ó z5 deben aparecer en las formas
reducidas de y2 y y3
Condición su…ciente: cada variable z4 y z5 debe aparecer en al menos
una de las dos formas reducidas.

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 28 / 35


Soluciones VI para problemas de errores en las variables

Consideramos el modelo
y1 = β0 + β1 x1 + β2 x2 + u
donde y y x2 son observados, pero no x1 .
Sea x1 una medida observada de x1 :
x1 = x1 + e1
donde e1 es el error de medida.

La correlación entre e1 y x1 hace que el EMCO, cuando se usa x1 en


lugar de x1 , sea sesgado e inconsistente:
y1 = β0 + β1 x1 + β2 x2 + (u β1 e1 )

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 29 / 35


Supuesto clásico de errores en variables (CEV)

En este caso el sesgo en el EMCO es hacia cero, y sin más


información no podemos corregirlo.
En ocasiones podemos usar un método de VI para solucionar el
problema de error de medida.
En la ecuación original asumimos que u está incorrelado con x1 , x1 y
x2 .
En el caso CEV asumimos que e1 está incorrelado con x1 y x2 .
Esto implica que x2 es exógena en la ecuación
y1 = β0 + β1 x1 + β2 x2 + (u β1 e1 )
pero que x1 está correlado con e1 : necesitamos una VI para x1 ,
correlada con x1 pero incorrelada con u y con e1 .

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 30 / 35


Posibles IV para errores de medida

Una segunda medida de x1 : z1 . Necesitamos que el error de medida


a1 en

z1 = x1 + a1

esté incorrelado con e1 y que z1 esté incorrelado con u.

Además z1 estará logicamente correlado con x1 porque ambas son


mediciones de x1
¿Cómo conseguir la segunda medida? Generalmente es complicado.
Otra variable exógena. Por ejemplo si usamos motheduc y fatheduc
como VIs, podemos pensar que están incorreladas con el error de
medida en

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 31 / 35


Contrastes de endogeneidad

El EMC2 es menos e…ciente que el EMCO cuando las variables


explicativas son exógenas.
Por esta razón es útil disponer de un contraste de endogeneidad de
una variable explicativa para ver si es necesario MC2.
Modelo
y1 = β0 + β1 y2 + β2 z1 + β3 z2 + u1
donde z1 y z2 son exógenas.
Se dispone de otras dos variables exógenas z3 y z4 que no aparecen en
la ec. estructural.
Si y2 está incorrelada con u1 entonces deberíamos usar MCO.
¿Cómo se hace este contraste?
Hausman (1978) sugirió comparar directamente los EMCO y EMC2
para ver si las diferencias eran signi…cativas. Si di…eren
sustancialmente es porque EMCO es inconsistente: y2 es endógena.

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 32 / 35


Contrastes de Hausman

Para ver si la diferencia EMCO-EMC2 es signi…cativa es mejor usar


una regresión.
Para ello se emplea la forma reducida de y2 ,
y2 = π 0 + π 1 z1 + π 2 z2 + π 3 z3 + π 4 z4 + v2

Como zj están incorrelada con u1 , y2 está incorrelada con u1 si y sólo


si v2 está incorrelada con u1 .
Podemos escribir
u1 = δ1 v2 + e1
donde e1 está incorrelado con v2 y tiene media cero.
Entonces u1 y v2 están incorrelados si y sólo si
δ1 = 0.

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 33 / 35


Contrastes de restricciones de sobreidenti…cación

Una VI tiene que satisfacer dos requerimientos: estar correlados con


la variable explicativa endógena pero incorrelado con el error.
El primer requerimiento se puede comprobar por medio de contrastes
de la t y de la F .
El segundo requerimiento no se puede comprobar porque implica
errores no observados.
Sin embargo, si tenemos más de una VI sí que podemos contrastar el
supuesto.

Julio Cáceres Delpiano (UC3M) Econometria I 10/07 34 / 35


Contrastes de restricciones de sobreidenti…cación
Modelo
y1 = β0 + β1 y2 + β2 z1 + β3 z2 + u1
donde z1 y z2 son exógenas y se dispone de otras dos variables exógenas z3
y z4 .
Estimamos la ecuación por MC2 usando como VI sólo z3 (que
asumimos es un buen instrumento) y obtenemos residuos

û1 = y1 β̂0 β̂1 y2 β̂2 z1 β̂3 z2

Como z4 no se ha usado en la estimación se puede comprobar si z4 y


û1 están correlados: si están correlados z4 no es una VI válida para la
estimación.
Para llevar a cabo el contraste se hace la estimación MCO de û1
sobre todas las variables exógenas,
û1 sobre z1 , z2 , z3 , z4

Estadístico LM: nR 2 χ21


Julio Cáceres Delpiano (UC3M) Econometria I 10/07 35 / 35

Вам также может понравиться