Вы находитесь на странице: 1из 21

Variaveis Instrumentais

Rafael Terra
Universidade de Braslia-Unb

19 de Agosto, 2015

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 1 / 21
Lidando com o problema de Endogeneidade

Como vimos anteriormente a endogeneidade e o principal problema que nos


impede de determinar a causalidade de x sobre y .
Ha basicamente tres fontes de endogeneidade que violam a hipotese OLS.1
E [x 0 u] = 0
Omissao de variaveis
Erro de mensuracao nos regressores
Simultaneidade
A solucao mais adequada para identificar os parametros e a utilizacao de
variaveis instrumentais.

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 2 / 21
Variaveis Instrumentais

Nesse curso, o caso mais comum de endogeneidade e a omissao de uma ou


mais variaveis relevantes representadas por q, as quais sao correlacionadas
com os regressores em x.
Pk1
Seja o modelo populacional y = 0 + i=1 i xi + k xk + q + , em que
u = q + .

b = (x 0 x)1 x 0 y
b = (x 0 x)1 x 0 x + (x 0 x)1 x 0 u (1)
b = (x 0 x)1 x 0 x + (x 0 x)1 x 0 ( + q),

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 3 / 21
Variaveis Instrumentais

Tomando a Esperanca de b

b = E [(x 0 x)1 x 0 x] + E [(x 0 x)1 x 0 q] + E [(x 0 x)1 x 0 ]


E []
b = + (x 0 x)1 E [x 0 q]
E [] (2)
0
ck ] = k + Cov (xk , q) ,
E [
Var (xk )

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 4 / 21
Variaveis Instrumentais

Entao
0
ck = k + Cov (xk , q)

Var (xk ) (3)
plimk = k +
c

em que e o efeito de xk sobre q .


A direcao do vies depende da relacao esperada entre q e y e entre xk e q.

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 5 / 21
Variaveis Instrumentais

Para corrigir esse problema recorremos `as chamadas variaveis instrumentais.


Uma variavel instrumental z1 e uma variavel correlacionada diretamente com
a variavel end
ogena xk ,mas nao correlacionada diretamente com y uma vez
controlado o efeito de xk sobre y .
Portato, para ter uma variavel instrumental devemos ter:
2SLS.1:Cov (z1 , u) = 0, i.e. z1 e ortogonal ao erro do modelo
populacional.
Chamando (x1 , ..., xk1 , z1 ) de z, a mesma condicao pode ser expressa
como E (z 0 u) = 0 ou, de forma mais rigorosa, podemos impor a
condicao E (u|z) = 0 .

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 6 / 21
Variaveis Instrumentais

O instrumento deve ser correlacionado com xk . Portanto, considerando


a projecao linear de xk sobre os demais regressores e sobre o
instrumento z1 :
k1
X
xk = 0 + z1 + i xi + (4)
i=1

Devemos observar 6= 0.
Para identificacao requeremos ainda que E (z 0 ) = 0 em que
z = (x1 , ..., xk1 , z1 ).
Outra condicao para identificacao e a de que rank(E (z 0 x)) = K .
Finalmente, (x1 , ..., xk1 ) sao instrumentos para si proprios.

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 7 / 21
Variaveis Instrumentais: Estimacao

Para estimar k consistentemente estimamos

bIV = (z 0 x)1 z 0 y (5)

Essa expressao advem de uma expressao mais geral

b2SLS = (x 0 Pz x)1 x 0 Pz y (6)

em que Pz = z(z 0 z)1 z 0 e a matriz de projecao linear, e Pz Pz0 = Pz .

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 8 / 21
Variaveis Instrumentais: Estimacao
A expressao mais geral 2SLS pode ser simplificada para IV quando so ha
uma variavel end ogena e um instrumento (exatamente identificado). Mas,
quando ha mais instrumentos que variaveis end ogenas, nao e possvel usar
IV , pois nao e possvel inverter (z 0 x) - i.e. s
o conseguimos inverter
matrizes quadradas.
O estimador 2SLS (Two Stage Least Squares) deriva seu nome da forma
como e estimado. Se ha uma variavel end
ogena xk e dois instrumentos z1 e
z2 , estimamos 2SLS regredindo
k1
X
xk = 0 + 1 z1 + 2 z2 + i xi + (7)
i=1

obtemos xbk e inserimos em x no lugar de xk , o que resulta na matriz xb.


Regredindo y sobre xb obtemos 2SLS . Portanto, outra forma de representar
2SLS e por

x 0 xb)1 xb0 y
2SLS = (b (8)
Rafael Terra (Unb) Econometria do Setor P
ublico 19 de Agosto, 2015 9 / 21
Variancia de bIV

A Variancia do estimador por variaveis instrumentais pode ser obtida


avaliando E [( IV )0 ( IV )].

E [( IV )0 ( IV )] = E [((z 0 x)1 z 0 u))0 ((z 0 x)1 z 0 u))]


= E [u 0 u](z 0 x)1 (z 0 z)(x 0 z)1 (9)
= bu2 (z 0 x)1 (z 0 z)(x 0 z)1

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 10 / 21
Teste para endogeneidade

Durbin (1954), Wu (1973) e Hausman (1978) prop oem um teste de Wald


para existencia do problema de endogeneidade. De fato, o procedimento
testa uma diferenca entre coeficientes do modelo estimado por OLS e
aqueles estimados por Variaveis instrumentais.
O teste s o sera valido se forem verificadas as condic
oes de exogeneidade dos
instrumentos. A estatstica 2 de Hausman consiste na divisao da diferenca
entre os coeficientes consistentes (variaveis instrumentais) e eficientes (OLS)
pela variancia da diferenca entre esses estimadores.
ormula de calculo da estatstica 2 de Hausman e:
A f

2 = (bIV bOLS )0 AVar (bIV bOLS )1 (bIV bOLS ) (10)

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 11 / 21
Teste para endogeneidade

Essa e a forma classica do teste de Hausman. Note que


AVar (bIV bOLS ) = AVar (bIV ) + AVar (bOLS ) 2Cov (bOLS , bIV ). O termo
desconhecido aqui e a covariancia.
A grande contribuicao de Hausman foi calcular tal termo. O autor notou
que Cov (bOLS , (bOLS bIV )) = 0. Portanto
AVar (bOLS ) Cov (bOLS , bIV ) = 0. Temos, finalmente, que
Cov (bOLS , bIV ) = AVar (bOLS ), e substituindo em (10) resulta em:

2 = (bIV bOLS )0 (AVar (bIV ) AVar (bOLS ))1 (bIV bOLS ) (11)

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 12 / 21
Teste para endogeneidade

Uma vez calculada essa estatstica, realizamos um teste de hipoteses, em


que a hipotese nula e a de que nao ha diferencas sistematicas entre os
coeficientes do estimador eficiente (OLS) e do consistente (IV), e a hipotese
alternativa e a de que ha diferencas sistematicas entre os dois estimadores.
Estatsticas muito altas sugerem a rejeicao da hip
otese nula de igualdade e,
portanto, os coeficientes sao diferentes do ponto de vista estatstico.
Nesse caso (de rejeicao da hipotese nula), podemos dizer que ha
endogeneidade, pois o estimador consistente sempre converge para o
verdadeiro valor do parametro (se satisfeitas as condicoes de ortogonalidade
entre z 0 e u e z 0 e ), enquanto se a hipotese E (x 0 u) = 0 for violada, o
outro estimador (que supomos eficiente) ira divergir do valor do parametro
consistente, entao ele sera inconsistente (inadequado para o nosso caso).

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 13 / 21
Teste para endogeneidade

Na pratica, no entanto, a estimacao da forma quadratica do teste de


Hausman (AVar (bIV ) AVar (bOLS ))1 requer que a variancia de AVar (bIV )
seja maior do que AVar (bOLS ) para cada elemento da diagonal principal.
De outra forma, a diferenca entre parenteses nao sera uma matriz definida
positiva, e o teste de hip
otese nao sera valido. Para inverter a matriz
quando ocorre uma caso desses, recorre-se a matriz pseudo-inversa de
Moore-Penrose. Mas tal procedimento pode ser computacionalmente
trabalhoso.

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 14 / 21
Teste para endogeneidade

Uma opcao mais facil de contornar esses problemas no teste de


endogeneidade e proposta por Hausman. Suponha o modelo populacional
y1 = z1 1 + 1 y2 + u com uma variavel endogena y2 e um conjunto de
regressores z1 nao correlacionados com u.
Queremos estimar 1 consistentemente.
Dispomos de uma matriz de instrumentos z que inclui z1 como subconjunto.
podemos representar a estrategia de identificacao como

y1 = z1 1 + 1 y2 + u
(12)
y2 = z2 +

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 15 / 21
Teste para endogeneidade

Note que se E (u) 6= 0, ha endogeneidade


Podemos, entao, testar se u e sao correlacionados estimando

u = + (13)

Se 6= 0, os erros sao correlacionados, indicando endogeneidade.


Ao inves de estimar essa equacao diretamente, e mais facil plugar essa
igualdade na equacao (12) resultando em

y1 = z1 1 + 1 y2 + + (14)

Dessa forma, s
o precisamos estimar b pelo primeiro estagio de (12).
Um coeficiente estatisticamente significativo implica que ha
endogeneidade.

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 16 / 21
Teste para Restricoes Sobreidentificadas (Exogeneidade
dos instrumentos)

Este teste e extremamente importante para testar a validade dos


instrumentos
Considerando o modelo populacional em notacao vetorial

y1 = z1 1 + y2 1 + u1 (15)

em que z1 e um vetor 1 L1 de variaveis exogenas (i.e. nao correlacionadas


com u1 ) e y2 e um vetor 1 G1 de variaveis end
ogenas.
O vetor z e um vetor 1 L que pode ser particionado de forma que
z = (z1 , z2 ), em que z2 e um vetor 1 L2 de variaveis exogenas (i.e.,
E (z20 u1 ) = 0)) usadas como instrumentos para y2 .
Note que L = L1 + L2 , e L2 > G1 , i.e. s
o e possvel realizar este teste
quando dispomos de uma quantidade de instrumentos maior do que a
quantidade de variaveis end
ogenas.

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 17 / 21
Teste para Restricoes Sobreidentificadas (Exogeneidade
dos instrumentos)

A ideia do teste de sobreidentificacao proposta por Hausman (1978) parte


do pressuposto de que, se E (z20 u1 ) = 0, entao qualquer subconjunto 1 G1
de z2 usado como instrumento produzira estimativas consistentes de 1 , e
IV IV
1,G 1
nao tera diferenca estatstica significativa em relacao a 1,L .
IV IV
Portanto, a comparacao entre os coeficientes em 1,G 1
e 1,L pode ser feita
usando um teste de Hausman de diferencas de coeficientes.
IV IV
A diferenca calculada e (1,G 1
1,L ).
O primeiro modelo com G1 instrumentos deve ter maior variancia (menos
informac
oes usadas, implica menos eficiencia), caso contrario a matriz
IV IV 1
Var (1,G 1
1,L ) nao pode ser invertida como ja vimos, e uma alternativa
como a matriz pseudo-inversa de Moore-Penrose deve ser empregada.

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 18 / 21
Teste para Restricoes Sobreidentificadas (Exogeneidade
dos instrumentos)

Uma solucao alternativa baseada em regress


oes se fundamenta no trabalho
de Sargan (1958).
O teste de Sargan-Hausman produz uma estatstica que e calculada
seguindo os seguintes passos:
1 Obtenha os resduos ub1 estimados da regressao em (15). Usando a
notacao matricial, esses resduos podem ser obtidos fazendo
ub1 = y x(x 0 Pz x)1 x 0 Pz y = (I x(x 0 Pz x)1 x 0 Pz )y = My , em que
M e a matriz produtora de resduos, e x e a matriz que contem todos
os regressores em (15).
2 regrida esses resduos sobre o conjunto de todas as variaveis exogenas z
incluindo uma constante. Isto e, estime = (z 0 z)1 z 0 ub1 .

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 19 / 21
Teste para Restricoes Sobreidentificadas (Exogeneidade
dos instrumentos)

3 Obtenha Ru2 e multiplique por N (no de observacoes). Sob a hipotese


de que E (z 0 u1 ) = 0 e que a variancia do estimador IV seja aquela dada
a
em (9), NRu2 2Q1 , em que Q1 = L2 G1 e o n umero de restricoes
sobreidentificadas.
4 Se rejeitarmos a hip otese nula de exogeneidade e sinal de que algum
instrumento e end ogeno.

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 20 / 21
Referencias

Greene Cap 5
Wooldridge Cap 5

Rafael Terra (Unb) Econometria do Setor P


ublico 19 de Agosto, 2015 21 / 21

Вам также может понравиться