Академический Документы
Профессиональный Документы
Культура Документы
Apostila
ECONOMETRIA
MAT02208
Marcio Valk
Porto Alegre
2014
ii
Sum
ario
1 Revis
ao
1.1
Introduc
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2
Vari
avel Aleat
oria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1
Distribuic
ao de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . .
1.2.2
A Distribuic
ao de Probabilidade Normal e as Distribuicoes Relacionadas
Propriedades de Vari
aveis Aleatorias . . . . . . . . . . . . . . . . . . . . . . . .
1.3.1
1.3.2
Vari
ancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.3
Covari
ancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3.4
Correlac
ao
1.3.5
1.3.6
Vcio/Vies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3.7
Consistencia
1.3.8
Eficiencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3.9
Erro Quadr
atico Medio (EQM) . . . . . . . . . . . . . . . . . . . . . . . 15
1.3
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Regress
ao Liner M
ultipla (RML) . . . . . . . . . . . . . . . . . . . . . . 17
1.4.2
Hip
oteses do modelo de regressao . . . . . . . . . . . . . . . . . . . . . . 17
1.4.3
1.4.4
Testes de Hip
oteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.5
1.6
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
29
Vari
aveis Instrumentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.1.1
2.1.2
Vari
avel proxy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.1.3
Vari
avel Omitida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.1.4
Erros de Mensurac
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
iii
SUMARIO
iv
2.1.5
2.1.6
2.1.7
O Metodo de Estimacao VI . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.1.8
VI em Modelos de Regressao M
ultipla . . . . . . . . . . . . . . . . . . . 37
2.1.9
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3 Equa
c
oes Simult
aneas
3.1
3.2
Equac
oes de Oferta e Demanda . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.1.1
3.1.2
3.1.3
O Problema da Identificacao . . . . . . . . . . . . . . . . . . . . . . . . 50
3.1.4
N
ao Identificada ou Subidentificada . . . . . . . . . . . . . . . . . . . . 50
3.1.5
Exatamente Identificada . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.1.6
Sobreidentificada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.1.7
Condic
ao de Ordem para Identificacao . . . . . . . . . . . . . . . . . . . 52
3.1.8
Condic
ao de Posto (Rank Condition) . . . . . . . . . . . . . . . . . . 53
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4 S
eries Temporais no Contexto de Regress
ao
4.1
4.2
4.1.1
4.1.2
Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.5
Processos Estoc
asticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Medias e Covari
ancias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.3.1
4.4
59
Introduc
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.2.1
4.3
45
Propriedades Importantes . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Regress
ao com dados de Series Temporais . . . . . . . . . . . . . . . . . . . . . 63
4.4.1
4.4.2
Modelos de Regress
ao de Series Temporais . . . . . . . . . . . . . . . . . 63
Suposic
oes para Modelos com Series Temporais . . . . . . . . . . . . . . . . . . 65
4.5.1
4.5.2
Vari
ancia dos Estimadores MQO . . . . . . . . . . . . . . . . . . . . . . 67
4.5.3
4.5.4
Tendencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.5.5
Sazonalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.5.6
SUMARIO
4.5.7
4.6
v
Processos Fracamente Dependente . . . . . . . . . . . . . . . . . . . . . 71
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5 S
eries Temporais e Econometria
5.1
79
Processos Estoc
asticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.2
Medias e Covari
ancias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.3
Estacionariedade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.4
5.5
5.3.1
Estacionariedade estrita . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
5.3.2
5.3.3
5.3.4
Func
ao de autocorrelacao Parcial (FACP) . . . . . . . . . . . . . . . . . 84
5.3.5
5.3.6
Rudo Branco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5.4.2
Passeio Aleat
orio (Random Walk) . . . . . . . . . . . . . . . . . . . . . 91
5.4.3
5.4.4
Modelo Medias-M
oveis (MA(q)) . . . . . . . . . . . . . . . . . . . . . . 97
5.4.5
O modelo MA(1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.4.6
O modelo MA(q) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.4.7
5.4.8
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
6 S
eries Temporais N
ao Estacion
arias
6.0.1
6.1
113
6.1.2
6.1.3
6.2
6.3
Previs
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
6.3.1
6.4
Regress
ao Esp
uria - Cointegracao . . . . . . . . . . . . . . . . . . . . . . . . . . 126
6.4.1
6.5
Erro de previs
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
Quando e possvel regredir duas series I(1) . . . . . . . . . . . . . . . . . 127
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
vi
SUMARIO
Captulo 1
Revis
ao
1.1
Introduc
ao
Para iniciar qualquer curso em que sao utilizadas tecnicas estatsticas, e necessario esclarecer/fundamentar bem o conceito de aleatoriedade.
Na hist
oria antiga, os conceitos de chance e de aleatoriedade eram interligados ao conceito que era atribudo a destino. V
arias pessoas da antig
uidade jogavam dados para determinarem o destino, e posteriormente isso se desenvolveu em jogos de azar. A maioria das
culturas usaram v
arios metodos de adivinhac
oes para tentarem contornar a aleatoriedade e o
destino, ou mesmo a dita sorte. A palavra aleatoriedade e utilizada para exprimir quebra de
ordem, prop
osito, causa, ou imprevisibilidade em uma terminologia n
ao cientfica. Um processo aleat
orio e o processo repetitivo cujo resultado n
ao descreve um padr
ao determinstico,
mas segue uma distribuic
ao de probabilidade. (Wikipedia).
Figura 1.1:
CAPITULO 1. REVISAO
e necessario formalizar e definir alguns conceitos, como sao os casos de variavel aleatoria e
distribuic
ao de probabilidade.
1.2
Vari
avel Aleat
oria
Denomina-se vari
avel uma propriedade (caracterstica) qualquer das unidades da populacao para a qual foi definida uma unidade de medida, que pode ser quantitativa ou qualitativa.
Observe que essa caracterstica e comum a todos os indivduos e portanto e uma caracterstica
da populac
ao. Em geral, queremos fazer afirmacoes sobre caractersticas e temos apenas
informacoes de alguns indivduos (amostra). Assim, toda afirmacao feita a partir de uma
amostra e passvel de erros, ou seja, e uma aproximacao. Alem disso, em alguns casos nao e
possvel medir toda a populac
ao e devemos pensar nessa caracterstica como uma quantidade
aleatoria. Para isso, e necess
ario introduzirmos o conceito de vari
avel aleat
oria.
Defini
c
ao 1.2.1. Espaco amostral de um experimento aleat
orio (fen
omeno que, mesmo repetidos v
arias vezes sob condic
oes semelhantes, apresentam resultados imprevisveis) e o conjunto
de todos os resultados possveis do experimento. Aqui ser
a denotado por ,
Exemplo 1.1. No seguinte experimento: lancar uma moeda e verificar a face voltada para
cima, o espaco amostral e o conjunto {cara,coroa}.
Exemplo 1.2. Se o experimento e lancar um dado de seis faces, o espaco amostral e {1,2,3,4,5,6}.
Todo subconjunto de um espaco amostral e chamado evento. Os subconjuntos de um
espaco amostral contendo apenas um elemento sao chamados de eventos elementares.
Podem existir dois ou mais espacos amostrais possveis. Por exemplo, lancar o dado de
seis faces e verificar se a face superior. Uma possibilidade seria verificar se a face e mpar
e, a outra possibilidade, poderia ser verificar se a face e superior a 3. Um espaco amostral
descrevendo cada resultado do dado individualmente pode ser construdo atraves do produto
cartesiano dos dois espacos amostrais citados. Neste caso, um evento elementar poderia ser
{5}, que e mpar e superior a 3.
Espacos amostrais s
ao importantes na definicao de um espaco de probabilidade (, F, P)
que e definido pelo espaco amostral , por um conjunto de eventos de interesse com certas
propriedades, denotada por a -algebra F, e uma medida de probabilidade P : [0, 1],
que e uma func
ao de em [0, 1].
Uma vari
avel aleat
oria e uma funcao do espaco amostral nos reais, para a qual e possvel
calcular a probabilidade de ocorrencia de seus valores. Em geral, as variaveis aleatorias s
ao
representadas por letras mai
usculas do fim do alfabeto. Temos, para cada elemento ,
um n
umero real X() conforme figura.
Garantimos o c
alculo de probabilidades com variaveis aleatorias ao exigir que, para qualquer I R, o conjunto X 1 (I) seja um evento. Em outras palavras, o conjunto X 1 (I) e
1.2. VARIAVEL
ALEATORIA
um elemento da -
algebra F, ou seja, X 1 (I) F. Lembremos que apenas os elementos
de F tem atribuic
ao de probabilidade. em linguagem matematica mais formal, dizemos que
variavel aleat
oria e qualquer func
ao mensuravel em F. Isto justifica dizer que a variavel X e
F mensuravel. Com frequencia, faz-se mencao ao espaco de probabilidade (, F, P), para
deixar claro o espaco amostral, a -algebra e a probabilidade envolvida. De fato, bastaria
indicar (, F), se ficasse subentendido que as probabilidades aplicadas a X precisam ser aquelas aplicadas aos correspondentes eventos de F por alguma probabilidade P. Formalmente,
definimos
Defini
c
ao 1.2.2. Seja (, F, P) um espaco de probabilidade. Denominamos de vari
avel
aleat
oria, qualquer func
ao X : R tal que
X 1 (I) = { : X() I} F,
para todo intervalo I R. Em palavras, X e tal que sua imagem inversa de intervalos I R
pertencem a -
algebra F.
Defini
c
ao 1.2.3. Vari
avel Aleat
oria Discreta. Se o conjunto dos possveis valores da
vari
avel e finito ou enumer
avel (infinito, porem cont
avel).
Exemplo 1.3. {1, 2, 3, 4, 5, 6}, N, Z, . . .
Defini
c
ao 1.2.4. Vari
avel Aleat
oria Contnua Se o conjunto dos possveis valores da
vari
avel n
ao e enumer
avel.
Exemplo 1.4. O intervalo [0,1], R, Q.
CAPITULO 1. REVISAO
Na pr
atica, e comum a utilizac
ao da variaveis aleatorias contnuas pois e simples trata-las
matematicamente. Quando, por exemplo, falamos que a renda e uma v. a. contnua (na
verdade ela e discreta) e pela conveniencia da aproximacao.
1.2.1
Distribui
c
ao de Probabilidade
A func
ao que descreve as probabilidades da variavel aleatoria X assumir os diferentes
valores do espaco amostral e chamada de funcao massa de probabilidade no caso de variaveis
aleatorias discretas, e func
ao de densidade de probabilidade (denotado como f.d.p.) para
variaveis aleat
orias contnuas. Para que uma funcao qualquer f seja uma densidade de probabilidade e necess
ario que
f (x) 0 x R,
Z
f (x)dx =
f (x)dx = 1.
Z
R
(1.1)
Z
P (a X b) =
f (x)dx.
a
F (c) = P (X c) =
f (x)dx.
Distribui
c
oes conjunta, marginal e condicional
Geralmente estamos interessados nao apenas numa variavel aleatoria mas na relacao entre
algumas vari
aveis aleat
orias. Suponha que temos duas variaveis aleatorias, X e Y . Agora
temos que considerar:
1. A f.d.p. conjunta: f (x, y).
2. As f.d.p.s marginais: f (x) e f (y). Para se obter uma das marginais a partir da conjunta,
basta integrar a conjunta com relacao a outra variavel,
1.2. VARIAVEL
ALEATORIA
Z
f (x) =
Z
f (x, y)dy e f (y) =
f (x, y)dx.
R
3. As f.d.p.s condicionais:
(a) f (x|y), que e a distribuic
ao de X dado Y = y.
(b) f (y|x), que e a distribuic
ao de Y dado X = x.
A densidade conjunta pode ser escrita como o produto das densidades marginal e condicional. Assim
f (x, y) = f (x)f (y|x)
= f (y)f (x|y).
Se f (x, y) = f (x)f (y) para todo x e y, entao x e y sao chamados de independentes. Note que,
se eles sao independentes,
f (x|y) = f (x)
f (y|x) = f (y),
isto e, as distribuic
oes condicionais sao as mesmas que as marginais. Intuitivamente isso faz
sentido uma vez que, para X, o fato de Y ser ou nao fixado em um certo nvel e irrelevante.
De maneira similar, para Y deve ser irrelevante o nvel no qual X e fixado.
1.2.2
A Distribui
c
ao de Probabilidade Normal e as Distribui
c
oes Relacionadas
Se tivermos a distribuic
ao de probabilidade de uma variavel aleatoria X, poderemos determinar a probabilidade de X estar no intervalo (a, b). Existem algumas distribuicoes de
probabilidade cujas probabilidades sao tabuladas e que sao consideradas descricoes cabveis
para uma grande variedade de fen
omenos. Sao estas a distribuicao normal e as distribuic
oes
2 , t e F , as quais discutiremos juntamente com as distribuicoes lognormal e normal bivariada. Existem tambem outras distribuicoes, como as distribuicoes gama e beta, para as quais
tabelas extensivas est
ao disponveis. Na verdade, a distribuicao 2 e um caso particular da
distribuic
ao gama, e as distribuic
oes t e F sao casos particulares da distribuicao beta. N
ao
precisamos aqui de todas as relac
oes.
Pode-se perguntar se a distribuic
ao normal e apropriada para descrever variaveis economicas.
Contudo, mesmo que as vari
aveis nao sejam normalmente distribudas, pode-se considerar
transformac
oes de vari
aveis que facam com que as variaveis transformadas se tornem normalmente distribudas.
CAPITULO 1. REVISAO
6
A Distribui
c
ao Normal
A distribuic
ao normal, que possui forma de sino, e a distribuicao mais amplamente usada
em aplicac
oes estatsticas numa grande variedade de areas. Sua funcao de densidade de
probabilidade e dada por
1
1
2
f (x) = exp 2 (x )
2
2
< x < +.
Locao
Escala
0.4
0.4
=3
=3
=0
0.35
0.35
0.3
0.3
0.25
0.25
0.2
0.2
0.15
0.15
0.1
0.1
0.05
0.05
0
6
2 =1
2=2.25
2=4
0
10
10
Se = 0 e = 1, a distribuic
ao e chamada de distribuicao normal padrao e a func
ao
de densidade de probabilidade reduz-se a,
1
f (x) = e
2
x2
x2 N (2 , 22 )
1.2. VARIAVEL
ALEATORIA
e a correlac
ao entre x1 e x2 e , ent
ao
a1 x1 + a2 x2 N (a1 1 + a2 2 , a21 12 + a22 22 + 2a1 a2 1 2 ).
Em particular,
x1 + x2 N (1 + 2 , 12 + 22 + 21 2 )
e
x1 x2 N (1 2 , 12 + 22 21 2 ).
Distribui
c
oes Relacionadas
Alem da distribuic
ao normal, h
a outras distribuicoes de probabilidade que usaremos com
frequencia. S
ao as distribuic
oes 2 , t e F , tabuladas no apendice. Estas distribuicoes s
ao
derivadas da distribuic
ao normal e definidas como descrito a seguir.
Distribui
c
ao 2
Se x1 , x2 , . . . , xn s
ao vari
aveis normais independentes com media zero e variancia 1, isto
e, xi IN (0, 1), i = 1, 2, . . . , n, ent
ao dizemos que
Z=
x2i
tem distribuic
ao 2 com n graus de liberdade (g.l.), e escrevemos isso como Z 2n . O
subscrito n denota os g.l. A distribuicao 2n e a distribuicao da soma dos quadrados de n
variaveis normais padronizadas independentes.
Se xi IN (0, 2 ), ent
ao Z deve ser definido por
Z=
X x2
i
A distribuic
ao 2 tambem tem uma propriedade de adicao, embora esta seja diferente da
propriedade da distribuic
ao normal e muito mais restritiva. A propriedade e:
Se Z1 2n e Z2 2m e Z1 e Z2 sao independentes, entao Z1 + Z2 2n+m .
Note que precisamos de independencia e apenas podemos considerar adicoes simples, e n
ao
quaisquer combinac
oes lineares. Ate essa propriedade limitada e u
til em aplicacoes praticas.
Existem muitas distribuic
oes para as quais mesmo esta propriedade limitada nao e valida.
Distribui
c
ao t
p
Se xi N (0, 1) e y 2n , e x e y sao independentes, Z = x/ y/n possui a distribuic
ao
t com n g.l. Escrevemos isso como Z tn . O subscrito n novamente denota os g.l.Assim, a
distribuic
ao t e a distribuic
ao de uma variavel normal padronizada dividida pela raiz quadrada
CAPITULO 1. REVISAO
de uma vari
avel media independente com distribuicao x2 (a variavel 2n dividida pelos seus
graus de liberdade). A distribuic
ao t e uma distribuicao de probabilidade simetrica tal qual
a distribuic
ao normal, embora seja mais achatada do que a normal e possua caudas longas.
Quando n g.l. aproxima-se de infinito, a distribuicao t aproxima-se da distribuicao normal.
Distribui
c
ao F
Se y1 2n1 e y2 2n2 e y1 e y2 sao independentes, Z = (y1 /n1 )/(y2 /n2 ) possui distribuicao F com n1 e n2 g.l. Escrevemos isso como
Z Fn1 ,n2 .
O primeiro subscrito n1 , refere-se aos g.l. do numerador, e o segundo subscrito, n2 , refere-se
aos g.l. do denominador. A distribuicao F e, portanto, a distribuicao da razao entre duas
variaveis independentes medias com distribuicao 2 .
Figura 1.4: Func
ao densidade 2 , t-Student e F-Snedecor. Em parenteses os graus de liberdade.
0.25
0.4
0.9
0.35
0.2
0.8
0.3
0.7
0.25
0.15
0.6
0.2
0.5
0.1
0.4
0.15
0.3
0.1
0.05
0.2
0.05
0.1
1.3
1.3.1
10
15
0
5
Propriedades de Vari
aveis Aleat
orias
M
edia, Valor Esperado ou Esperan
ca Matem
atica
Defini
c
ao 1.3.1. M
edia, valor esperado ou esperan
ca matem
atica de vari
aveis
aleat
orias discretas. Supomos que X pode assumir n valores diferentes x1 , x2 , . . ., xn
n
X
xi pi .
i=1
Exemplo 1.5. Seja X o valor da face superior obtida no lancamento de um dado. Se o dado
n
ao e viesado, temos P (X = 1) = P (X = 2) = P (X = 3) = P (X = 4) = P (X = 5) =
P (X = 6) = 61 , ou seja p1 = p2 = p3 = p4 = p5 = p6 = 16 .
E(X) =
6
X
i=1
=
=
1
1
1
1
1
1
pi xi = .1 + .2 + .3 + .4 + .5 + .6
6
6
6
6
6
6
1 6(6 + 1)
1
(1 + 2 + 3 + 4 + 5 + 6) = .
6
6
2
21
7
= = 3, 5.
6
2
Defini
c
ao 1.3.2. Valor Esperado de g(X). Seja g(X) uma func
ao de X. Est
ao E(g(x))
e dado por
E(g(x)) = g(x1 )p1 + + g(xn )pn =
n
X
g(xi )pi .
i=1
E(X ) =
6
X
i=1
=
=
1
1
1
1
1
1
pi x2i = .1 + .4 + .9 + .16 + .25 + .36
6
6
6
6
6
6
1
1 6(6 + 1)(12 + 1)
(1 + 4 + 9 + 16 + 25 + 36) = .
6
6
6
91
= 15, 16666.
6
Defini
c
ao 1.3.3. Valor esperado de vari
aveis aleat
orias contnuas.
Supondo que X tem func
ao densidade de probabilidade f , a esperanca de X e definida por
Z
E[X] =
xf (x)dx.
E[g(X)] =
g(x)f (x)dx.
CAPITULO 1. REVISAO
10
Propriedades da Esperan
ca
E(a) = a;
E2)
E(a + X) = a + E(X);
E3)
E(bX) = bE(X);
E4)
E5)
E6)
Estimador da M
edia
Dada uma amostra x1 , x2 , . . . , xn , o estimador da media e definido como
n
X=
1X
xi .
n
i=1
(1.2)
11
Vari
ancia
(1.3)
Propriedades da vari
ancia
Se a e b forem constantes reais e X uma variavel aleatoria cuja variancia esta definida,
entao:
V1)
Var(aX + b) = a2 Var(X);
Estimador da Vari
ancia ou Vari
ancia Amostral
Considere a amostra aleat
oria x1 , x2 , . . . , xn da variavel aleatoria X. O estimador da
variancia de X, obtido pelo metodo de maxima verossimilhanca e dado por
n
X
=
1X
(xi x)2 .
n
(1.4)
i=1
conhecido que este estimador e viesado. Um estimador consistente e nao viesado e dado
E
por
n
1 X
s =
(xi x)2 .
n1
2
i=1
(1.5)
CAPITULO 1. REVISAO
12
1.3.3
Covari
ancia
A covari
ancia entre duas vari
aveis aleatorias X e Y , com valor esperado E(X) = X e
E(Y ) = Y e definida como uma medida de como duas variaveis variam conjuntamente:
Cov(X, Y ) = E[(X X )(Y Y )].
(1.6)
Desenvolvendo a express
ao para a Covariancia, temos:
Cov(X, Y ) = E[(X X )(Y Y )]
13
Propriedades da Covari
ancia
Se X e Y s
ao vari
aveis aleat
orias de valor real e a, b, c e d constantes (constante, neste
contexto significa n
ao aleat
oria), entao os seguintes propriedades sao uma consequencia da
definicao da covari
ancia:
C1)
Cov(X, X) = Var(X);
C2)
C3)
Cov(aX + b, cY + d) = acCov(X, Y );
P
P P
P
Cov
X
,
Y
i i
j j =
i
j Cov (Xi , Yj ).
C4)
Estimador da covari
ancia
Seja x1 , x2 , . . . , xn e y1 , y2 , . . . , yn amostras aleatorias das variaveis aleatorias X e Y . Ent
ao
um estimador para a covari
ancia e dado por
n
X,Y
1 X
=
(xi x)(yi y).
n1
(1.7)
i=1
1.3.4
Correla
c
ao
correlac
ao, tambem chamada de coeficiente de correlacao, indica a forca e a direcao do
relacionamento linear entre duas variaveis aleatorias. No uso estatstico geral, correlacao ou
co-relacao se refere a medida da relacao entre duas variaveis, embora correlacao nao implique
causalidade. Neste sentido geral, existem varios coeficientes medindo o grau de correlac
ao,
adaptados `
a natureza dos dados.
O coeficiente de correlac
ao X,Y entre duas variaveis aleatorias X e Y com valor esperado
X e Y e desvio padr
ao X e Y , tambem chamado Coeficiente de correlac
ao de Pearson e
definida como:
X,Y =
Cov(X, Y )
E[(X X )(Y Y )]
=
,
X Y
X Y
(1.8)
E(XY ) E(X)E(Y )
p
.
E 2 (X) E(Y 2 ) E 2 (Y )
(1.9)
ou, equivalentemente,
X,Y = p
E(X 2 )
CAPITULO 1. REVISAO
14
A correlac
ao e definida apenas se ambos desvios padroes sao finitos e diferentes de zero.
Pelo corol
ario da desigualdade de Cauchy-Schwarz, a correlacao nao pode exceder 1 em valor
absoluto, || 1..
Estimador da correla
c
ao
Seja x1 , x2 , . . . , xn e y1 , y2 , . . . , yn amostras aleatorias das variaveis aleatorias X e Y . Ent
ao
um estimador para a covari
ancia e dado por
Pn
x
)(yi y)
pPn
.
2
)
)2
i=1 (xi x
i=1 (yi y
X,Y = pPn
1.3.5
i=1 (xi
(1.10)
Dado que temos alguns estimadores definidos acima, e interessante estudar algumas das
propriedades dos estimadores e definir criterios para compara-los.
1.3.6
Vcio/Vi
es
1.3.7
(1.11)
Consist
encia
1.3.8
Efici
encia
Um estimador de e dito ser eficiente se for nao viesado e sua variancia atingir o limite
inferior da desigualdade de Cramer-Rao para todos os possveis valores de . Em outras
1.4. METODO
DE MINIMOS QUADRADOS (MQO)
15
1.3.9
Erro Quadr
atico M
edio (EQM)
O erro quadr
atico medio de um estimador de e definido como
EQM () = E( )2 .
(1.12)
1.4
M
etodo de Mnimos Quadrados (MQO)
Considere o modelo
yi = + xi + ui
em que yi , para i = 1, , n e chamada variavel dependente xi e a vaiavel independente e ui
e termo de erro do modelo.
Qual crit
erio devo utilizar para obter os estimadores dos par
ametros e ?
Podemos minimizar:
1. Soma dos erros: N
ao e um bom criterio pois pode anular positivos e negativos.
2. Soma Absoluta dos Resduos: Gera um estimador pouco utilizado denominado LAD
(Least Absolute Deviations).
3. Soma dos Quadrados dos Erros: Tem propriedades estatsticas que o tornam bastante
atrativo.
CAPITULO 1. REVISAO
16
Entao, devemos resolver o seguinte problema de minimizacao:
min{,}
n
X
u2i = min{b,}
b
i=1
n
X
(yi xi )2 .
i=1
As condic
oes de primeira ordem (CPOs) serao
b : 2
X
X
b i) = 0
(yi
b x
u
bi = 0.
i
Esta CPO nos mostra que a escolha do intercepto otimo implica que a soma dos resduos ser
a
zero. Continuando com essa CPO
X
b i) = 0
(yi
b x
yi
b i = 0
x
b
nx
= 0
ny nb
b
bM QO = y x.
(1.13)
b i) = 0
(yi
b x
X
i
yi x i
X
i
bxi
b 2 = 0
x
i
yi x i =
b
xi + b
yi x i
x2i
b
= (y x)
xi + b
yi x i = y
i2
X
X
b
xi + (
x2 x
xi )
i
P
P
yi x i y i x i
i
P
P
.
( i x2i x i xi )
bM QO =
(1.14)
x)(yi y)
.
2
i (xi x)
i (x
Pi
O estimador MQO acima pode ser escrito tambem de outra forma usual. Basta dividir o
1.4. METODO
DE MINIMOS QUADRADOS (MQO)
17
1.4.1
d
x)(yi y)/n 1
Cov(x,
y)
=
.
2
Vd
ar(x)
i (xi x) /n 1
i (x
Pi
Cov(x,y)
V ar(x) .
Regress
ao Liner M
ultipla (RML)
y1
1 x11
x21
xk1
u1
y2
..
.
1 x12
..
..
.
.
x22
..
.
..
.
xk2
..
.
1
..
.
u2
..
.
1 x1n x2n
xkn
yn
un
ou, y = X + u.
O estimador de e dado por:
= (X 0 X)1 X 0 y.
1.4.2
Hip
oteses do modelo de regress
ao
Hip
otese 1 (Linearidade dos Par
ametros): A relacao entre a variavel dependente y e as
explicativas x1 , . . . , xk e linear
y1 = 0 + 1 x1i + . . . + k xki + ui .
Defini
c
ao 1.4.1. Um modelo de regress
ao e linear nos par
ametros se as CPOs associadas
CAPITULO 1. REVISAO
18
ao problema de obtenc
ao dos EMQ (Estimadores de MQO) gerarem um sistema linear nos
par
ametros.
Exemplo 1.8. Seja o seguinte modelo
yi = + xi + ui .
Assim, o problema de minimizac
ao ser
a
min
{,}
(yi xi )2 .
As CPOs ser
ao
b : 2
b i) = 0
(yi
b x
b : 2
yi = nb
+ b
b i )xi = 0
(yi
b x
n
P
i xi
Pi
xi
2
i xi
#"
yi x i =
b
b
b
xi + b
" P
=
i yi
i yi xi
{,,}
X
(yi xi )2 .
i
A CPO
: 2
X
i
min
xi
"
X
(yi xi ) = 0.
i
Logo n
ao e linear por causa do .
Exemplo 1.10. Seja o seguinte modelo
yi = x1i1 x2i2 eui .
Tomando o ln, teremos
ln yi = ln + 1 ln x1i + 2 ln x2i + ui .
x2i
1.4. METODO
DE MINIMOS QUADRADOS (MQO)
19
1 x11
x21
xk1
X=
1 x12
..
..
.
.
x22
..
.
..
.
xk2
..
.
1 x1n x2n
xkn
n(k+1)
CAPITULO 1. REVISAO
20
1.4.3
O Coeficiente de Determina
c
ao: RLS
Existe alguma medida que me mostre se o meu modelo tem um bom poder preditivo? Ou
seja, se o regressor (x) que eu inclui no meu modelo explica bem a variavel dependente (y).
X
(b
yi )2 = Soma dos Quadrados Explicados (SQE)
u
b2i = Soma dos Quadrados dos Resduos (SQR)
Assim
SQT = SQE + SQR.
Dividindo a express
ao por SQT , teremos
1=
SQE SQR
+
.
SQT SQT
| {z }
R2
SQE
SQR
=1
SQT
SQT
P c2
P 2
Pn
u
(b
yi )
(b
yi y)2
i
i=1
P 2 = Pn
= 1 Pn i i
,
2
2
i=1 (yi y)
i=1 (yi y)
i (yi )
[SQR/(n k 1)]
[SQT /(n 1)]
2
SQR
= 1
, ( 2 =
).
[SQT /(n 1)]
nk1
= 1
1.4. METODO
DE MINIMOS QUADRADOS (MQO)
21
2
Proposi
c
ao 1.4.1. Se adicionamos um novo regressor `
a regress
ao, ent
ao R aumenta a
estatstica t deste novo regressor e maior que 1, em m
odulo.
2
Proposi
c
ao 1.4.2. E se adicionarmos um grupo de vari
aveis `
a regress
ao, ent
ao R aumenta
a estatstica F deste novo grupo de regressores e maior que 1.
2
Uma f
ormula alternativa para o R e
R
R
[SQR/(n k 1)]
[SQT /(n 1)]
(1 R2 )(n 1)
SQR
= 1
, (
= 1 R2 ).
(n k 1)
SQT
= 1
Propriedade de N
ao Vi
es do EMQ
Assumindo X n
ao estoc
astico, tomando a esperanca de EMqO em versao matricial, obtemos:
= E[(X 0 X)1 X 0 y] = E[(X 0 X)1 X 0 (X + u)]
E()
= E[(X 0 X)1 X 0 X] + E[(X 0 X)1 X 0 u]
= + (X 0 X)1 E[X 0 u] = ,
se vale a hip
otese E[X 0 u] = 0. Ou seja, se as variaveis regressoras nao sao correlacionadas com
u, o MQO ser
a n
ao viesado.
Vari
ancia do EMQ
Para um modelo de regress
ao linear m
ultipla, a variancia do estimador de cada j e dado
por
V ar(j ) =
em que SQTj =
u2
,
SQTj (1 Rj2 )
P
(xji xj )2 , e Rj2 e o R2 da regressao de xj contra os demais regressores.
CAPITULO 1. REVISAO
22
1.4.4
Testes de Hip
oteses
Teste t
Se queremos testar individualmente a significancia (H0 : j = 0) do modelo
yi = 0 + 1 x1i + + k xki + ui
, a estatsticade teste e dada por
j j
t= q
tnk1
V arj
Observa
c
ao 1.4.2. Se houver problema de multicolineariedade, Rj2 ser
a alto, a vari
ancia
ser
a alta, e a estatstica de teste t ser
a baixa, e os estimadores ser
ao pouco significativos
(neste caso assumindo j = 0).
Teste F
A estatstica F para um modelo com intercepto, que serve para testar se o modelo e
significante, ou seja se todos os regressores sao conjuntamente significantes, i.e. H0 : 0 =
1 = = k = 0 vs. H1 : pelo menos um j 6= 0, e dada por
F =
R2 /k
Fk,nk1 .
1 R2 /n k 1
Observa
c
ao 1.4.3. Se temos um problema de multicolineariedade, ainda assim a estatstica
F e R2 do modelo de y contra x n
ao depende da correlac
ao entre os regressores(apenas do
SQR e SQT, ou seja, da soma dos quadrados dos resduos e da vari
avel dependente) e, assim,
se tivermos regressores relevantes para explicar y, ent
ao F e R2 indicar
ao que o modelo como
um todo ter
a um alto poder explicativo.
1.5
23
CAPITULO 1. REVISAO
24
1.6
Exerccios
1
n
Pn
i=1 Xi
V ar(X);
Cov(X, X).
1.6. EXERCICIOS
25
exista e seja u
(b) Determine a(s) hip
otese(s) necess
aria(s) para que o estimado, ,
nico.
(c) Determine a(s) hip
otese(s) necess
aria(s) para que seja n
ao viesado.
(d) Determine a(s) hip
otese(s) necess
aria(s) para que seja eficiente.
(e) Determine a(s) hip
otese(s) necess
aria(s) para que se possa fazer inferencia estatstica.
Exerccio 1.4. Os dados da tabela relacionam o peso de plantas, Y (em gramas) com o
percentual de materia org
anica na terra, X1 e os Kilogramas de nitrogenio suplementares
agregados a terra por 1000m2 , X2 :
y
x1
x2
78.5
2.6
74.3
2.9
104.3
11
5.6
87.6
11
3.1
95.9
5.2
109.2
11
5.5
102.7
7.1
Soma:
652.5
51
32.0
media:
93.21
7.29
4.57
1.80
0.07 0.25
652.50
CAPITULO 1. REVISAO
26
(f ) Se dp(2 ) = 0.6274, teste a hip
otese H0 : 2 = 1.
Exerccio 1.5. Ad
ao Ismiti queria verificar se a produtividade aumentava com a divis
ao do
trabalho. Para isso, fez a seguinte experiencia: regrediu a produtividade (p) de n trabalhadores
de f
abricas de alfinetes contra o n
umero de func
oes exercidas pelo trabalhador (F ), os anos
de escolaridade (E), o sal
ario (w) e o n
umero de filhos (N ). Formalmente, a regress
ao foi:
pi = 1 + 2 Fi + 3 Ei + 4 i + 5 Ni + ui
Usando o teste t-Student, Ismiti n
ao rejeitou a hip
otese nula de par
ametro igual a zero
para 3 . Retirou a vari
avel E da regress
ao e estimou o modelo restrito, observando que 5
se tornou tambem, estatisticamente n
ao significativo. Finalmente, retirou N da regress
ao e
estimou o modelo novamente.
(a) Por que n
ao foi preciso fazer o teste F em 3 para retirar E do modelo?
(b) Justifique se o procedimento adotado por Ismiti est
a correto ou equivocado, para ter eliminado a vari
avel N do modelo.
1.6. EXERCICIOS
27
i=0 |xi |
Pn
Pn
1
x=1 x
1
x=1 x2
2
i=0 xi
2
i=0 xi
< .
= .
= .
< , ent
ao
i=0 |xi |
< .
28
CAPITULO 1. REVISAO
Captulo 2
2.1
Vari
aveis Instrumentais
Vari
avel proxy
Considere a regress
ao para explicar a renda em funcao do nvel de escolaridade (educ) e a
aptidao para determinada tarefa (aptid),
29
CAPITULO 2. MODELOS COM VARIAVEIS
INSTRUMENTAIS (VI)
30
(2.1)
Vari
avel Omitida
(2.2)
em que ui e bem comportado, x1 = educ e x2 = aptid. Como nao podemos observar aptid
ao,
vamos supor que o modelo seja mal especificado, da seguinte forma:
yi = 0 + 1 x1i + vi .
(2.3)
Estimando a equac
ao (2.3) via MQO, obtemos para 1 :
Pn
(x1i x1 )yi
1 = Pi=1
.
n
2
i=1 (x1i x1 )
(2.4)
(2.5)
Pn
i=1 (x1i x1 )E[yi ]
E [
1 ] = P
.
n
2
i=1 (x1i x1 )
(2.6)
Assim,
2.1. VARIAVEIS
INSTRUMENTAIS
31
(2.7)
Logo, E [
1 ] = 1 se e somente se x1 e x2 forem nao correlacionados na amostra. O que
geralmente n
ao acontece. Esse e o caso em que o estimador de MQO, produz estimativas
viciadas quando o regressor e correlacionado com o erro. No entanto, se um instrumento est
a
disponvel, estimativas consistentes ainda podem ser obtida. Veja o seguinte exemplo:
Exemplo 2.1. Suponha que um pesquisador deseja estimar o efeito causal do tabagismo
sobre a sa
ude geral, como em Leigh e Schembri 2004 [1]). Em princpio, a existencia de
correlac
ao entre a sa
ude e o h
abito de fumar n
ao implica necessariamente que o fumo piora
a sa
ude, porque outras vari
aveis podem afetar tanto a sa
ude quanto o h
abito de fumar. Por
exemplo, pode ocorrer por acaso que pessoas de uma certa cidade exposta `
a poluic
ao radioativa
fumem muito, mas e a poluic
ao que realmente causa problemas de sa
ude `
a esta populac
ao em
estudo. Mesmo que o tabagismo cause realmente problemas, a sa
ude em si pode afetar o
h
abito de fumar (digamos, um paciente muito doente pode se sentir instigado a fumar mais).
Fazer estudos controlados (por exemplo, colocar uma pessoa num laborat
orio, sem exposic
ao
`
a poluic
ao, fumando quantidades controladas) pode ser difcil, caro ou anti-etico. Uma opc
ao
alternativa, portanto, seria o pesquisador tentar estimar o efeito causal do tabagismo sobre a
sa
ude a partir de dados observacionais, utilizando, por exemplo, a alquota de imposto sobre
o tabaco como um instrumento para fumar em uma regress
ao de sa
ude. Se as alquotas de
imposto sobre o tabaco afetam apenas (positivamente, imagina-se) a sa
ude porque eles afetam
o h
abito de fumar (mantendo as outras vari
aveis do modelo fixas), a correlac
ao entre impostos
sobre o tabaco e a sa
ude e uma evidencia de que o tabagismo provoca alterac
oes na sa
ude.
Uma estimativa do efeito do tabagismo sobre a sa
ude podem ser feita tambem fazendo uso da
correlac
ao entre os impostos e os h
abitos de fumar.
2.1.4
Erros de Mensura
c
ao
(2.8)
CAPITULO 2. MODELOS COM VARIAVEIS
INSTRUMENTAIS (VI)
32
em que Cov(x , u) = E(x u) = 0. Nesse modelo, a estimacao por MQO deveria gerar estimadores consistentes dos par
ametros. Supoe-se, porem, que a variavel x seja observada com
erro. Isto e, o que observamos na pratica e:
x = x + e,
(2.9)
em que
E(e) = 0;
Cov(x , e) = E(x e) = 0;
Cov(e, u) = E(eu) = 0.
Exemplo 2.2. Para explicar o rendimento de um aluno da UFRGS, podemos estar interessados em usar como vari
aveis explicativas (dentre outras): renda familiar, n
umero de horas
dedicadas ao estudo, tempo necess
ario para o trajeto casa-UFRGS, etc. Todas essas vari
aveis
est
ao sujeitas a erros de mensurac
ao, pois os alunos podem errar (deliberadamente ou n
ao)
ao responder `
a pesquisa. Se os erros forem puramente aleat
orios, isto e, n
ao estiverem correlacionados com outras vari
aveis relevantes, as hip
oteses do modelo acima ser
ao satisfeitas.
Reescrevendo o modelo (2.8) em funcao da variavel observada x:
y = + x + u
= + (x e) + u
= + x + (u e)
= + x + .
Agora, a estimac
ao por MQO n
ao gera estimadores consistentes dos parametros, pois
Cov(x, ) = E(x)
= E[(x + e)(u e)]
= E[x u + eu x e e2 ]
= E(x u) + E(eu) E(x e) E(e2 )
= e2
6= 0.
Lembre que
2.1. VARIAVEIS
INSTRUMENTAIS
33
Pn
Pn
(xi x)i
i=1 (xi x)yi
P
= + Pi=1
.
=
n
n
2
2
x)
(x
i=1 i
i=1 (xi x)
E note que V ar(x) = V ar(x ) + V ar(e) = x + e
Cov(x, )
V ar(x)
e2
e2
= 2
.
= 1 2
x + e2
x + e2
P lim() = +
2.1.5
Considere o modelo
y = + x + ,
(2.10)
(2.11)
Cov(z, x) 6= 0.
(2.12)
CAPITULO 2. MODELOS COM VARIAVEIS
INSTRUMENTAIS (VI)
34
Mas, educac
ao da m
ae tambem deve ser correlacionada com a habilidade do indivduo, presente no erro? Nesse caso, n
ao seria um bom instrumento.
Um bom instrumento seria o n
umero de irm
aos - nao correlacionado com aptid correlacionado com educ (negativamente).
2.1.6
Diferen
ca entre Proxy e VI
A vari
avel proxy e caracterizada por:
1. nao ser correlacionada com o termo de erro do modelo;
2. correlacionada com a vari
avel nao observada.
A vari
avel instrumental e caracterizada por
1. nao ser correlacionada com o termo de erro do modelo, ou seja, nao correlacionada com
aptid no exemplo 2.3;
2. correlacionada com a vari
avel endogena, ou seja, no caso do exemplo 2.3, ela deve ser
correlacionada com educ.
No exemplo 2.3 uma boa proxy seria:
n
ao correlacionada com aptid e, portanto, nao correlacionada com o erro;
nir=
correlacionada com educacao (negativamente),
2.1.7
O M
etodo de Estima
c
ao VI
(2.13)
A condic
ao (2.12) exige que Cov(x, z) 6= 0. Ou seja, no modelo
x = 0 + 1 z + v,
(2.14)
Cov(x, z)
.
V ar(z)
(2.15)
2.1. VARIAVEIS
INSTRUMENTAIS
35
1 = i=1
2
i=1 (zi z)
(2.16)
o que poder
a ser facilmente testado via teste t de significancia. A necessidade da condic
ao
(2.11) ficar
a evidente a seguir.
Voltando ao modelo original,
y = 0 + 1 x + u
= 0 + 1 (0 + 1 z + v) + u
= 0 + 1 0 + 1 1 z + 1 v + u
= (0 + 1 0 ) + 1 1 z + (1 v + u)
= 0 + 1 z + .
No modelo acima temos que z e n
ao correlacionado com . Podemos entao estimar 1 de
forma consistente, via MQO.
Quem e o estimador de VI para 1 ?
Sabe-se que
Pn
(z z)(yi y)
Pn i
1 = i=1
= 1
1.
2
i=1 (zi z)
(2.17)
Como
1 e dado em (2.16), segue que o estimador VI para 1 e
Pn
(zi z)(yi y)
1 1
1 =
= Pni=1
.
1
i=1 (zi z)(xi x)
(2.18)
Teoricamente,
1V I =
Cov(y, z)
Cov(x, z)
(2.19)
(2.20)
CAPITULO 2. MODELOS COM VARIAVEIS
INSTRUMENTAIS (VI)
36
1V I
2
1 , 2 2
nx xz
,
(2.21)
ou seja, a vari
ancia assint
otica do estimador e dada por
V arass (1V I ) =
V ar()
.
nV ar(x)[Corr(x, z)]2
(2.22)
(2.23)
2 , que
Tambem e conhecido que um bom estimador para 2xz e o Rxz
e o R2 d
a regress
ao (2.14).
Ent
ao porque usamos VI?
Teste de Hip
oteses neste Caso
Consideremos o seguinte problema
log(sal
ario) = 0 + 1 educ + u,
(2.24)
Pn
(niri nir)(yi y)
= Pni=1
;
i=1 (niri nir)(xi x)
2. Obter
Pn
2
2iV I
i=1 u
n2
em que u
Vi I = yi 0V I 1V I educ;
2
3. Obter Reduc,nir
, que e o R2 de
educ = 0 + 1 nir + v;
2.1. VARIAVEIS
INSTRUMENTAIS
37
H :
0
5. Teste:
H :
1
2.1.8
2
;
2 2
i=1 (xi x) Reduc,nir
Pn
1V I = 0;
1V I 6= 0.
VI em Modelos de Regress
ao M
ultipla
(2.25)
(2.26)
em que y1 = log(sal
ario), y2 = educ e z1 = exper. Assim, estamos supondo que exper e
exogeno e, por raz
oes habituais, presumimos que educ seja correlacionado com u1 .
Se estimarmos (2.25) por MQO, todos os estimadores serao viesados e inconsistentes.
Assim, seguimos a estrategia da secao anterior para encontrar uma VI para y2 . Como z1
aparece como vari
avel explicativa, devemos procurar outra variavel exogena (vamos chama-la
de z2 ) que seja correlacionada com y2 = educ.
A correlac
ao de z2 e y2 pode ser afetada por z1 que aparece na regressao (2.25). Devemos
nos certificar que na presenca de z1 , y2 e z2 ainda sao correlacionados. Essa condicao pode
ser verificada a partir da regress
ao
y2 = 0 + 1 z1 + 2 z2 + v2 ,
(2.27)
(2.28)
CAPITULO 2. MODELOS COM VARIAVEIS
INSTRUMENTAIS (VI)
38
(2.29)
Se zk e uma vari
avel ex
ogena e queremos usa-la como uma VI para y2 , devemos proceder de
forma semelhante a (2.27), escrevendo a equacao na forma reduzida
y2 = 0 + 1 z1 + 2 z2 + + k1 zk1 + k zk + v2 ,
(2.30)
(2.31)
Nesta subsec
ao vamos mostrar a equivalencia do estimador VI com MQ2E. Para isso
consideremos a equac
ao estrutural com uma variavel endogena
yi = 0 + 1 xi + ui ,
(2.32)
(2.33)
(2.34)
2.1. VARIAVEIS
INSTRUMENTAIS
39
x
i =
0 +
1 zi
1z +
1 zi
= x
= x+
1 (zi z).
De (2.34), segue que
Pn
(
xi x
)(yi y)
.
1 = i=1
Pn
)2
xi x
i=1 (
Pode-se mostrar facilmente que x
= x. Logo,
1 =
=
=
=
=
Pn
(z z)(yi y)
i=1
Pn 1 i
(
1 (zi z))2
Pni=1
(z z)(yi y)
Pni
1 i=1
2
1V I .
(2.35)
(2.36)
(2.37)
Se essa hip
otese de identificac
ao, a qual pode ser testada usando-se um teste F , for satisfeita,
entao podemos usar y2 como VI para y2 .
CAPITULO 2. MODELOS COM VARIAVEIS
INSTRUMENTAIS (VI)
40
Observa
c
ao 2.1.4. Quando o problema e a existencia de vari
aveis explicativas end
ogenas
m
ultiplas, ser
a necess
aria que existam pelo menos tantas vari
aveis ex
ogenas excludas do
modelo quantas forem as end
ogenas includas.
2.1.10
Testes de Endogeneidade
Como visto anteriormente, a condicao (2.11) nao pode ser testada, logo nao podemos ter
certeza se os regressores (vari
aveis explicativas) estao ou nao correlacionados com o erro. Se
nao houver correlac
ao, e melhor utilizar mnimos quadrados ordinarios que o estimador de
variaveis instrumentais ou MQ2E. No entanto, pela estimacao pura e simples e impossvel
descobrir se h
a correlac
ao entre os regressores e o erro.
Teste de Hausmann
O teste de especificac
ao proposto por Hausmann em 1978 e um teste utilizado para avaliar a
consistencia de um estimador comparado a um outro estimador alternativo e pode ser utilizado
no contexto de endogeneidade.
A logica de Hausmann e a seguinte: sob a hipotese nula (ausencia de correlacao entre os
regressores e o termo de erro), o econometrista tem em maos dois estimadores consistentes para
a matriz de par
ametros: o estimador de mnimos quadrados ordinarios M QO e o estimador de
variaveis instrumentais V I . Sob a hipotese alternativa, no entanto, somente um destes, V I ,
e consistente. Portanto, a sugest
ao foi examinar a diferenca d = V I M QO . O resultado
desta diferenca converge em probabilidade para zero apenas sob a hipotese nula. Podemos
testar esta hip
otese usando o teste de Wald.
Teste de Regress
ao
Para ilustrar, suponha que temos uma u
nica variavel suspeita de ser endogena,
y1 = 0 + 1 y2 + 2 z1 + 3 z2 + u1 ,
(2.38)
em que z1 e z2 s
ao ex
ogenos. Temos duas outras variaveis exogenas, z3 e z4 , que nao aparecem no modelo (2.38). Se y2 for nao correlacionado com u1 , devemos estimar (2.38) por
MQO. Wooldridge 2011 sugere que e mais facil usar um teste de regressao para testar se y2 e
endogena. Isto e feito com base na estimacao da forma reduzida de y2 , que neste caso e
y2 = 0 + 1 z1 + 2 z2 + 3 z3 + 4 z4 + v2 .
(2.39)
(2.40)
2.2. EXERCICIOS
41
e testar se 1 = 0. No entanto, n
ao temos u1 nem v2 . A sugestao e usar v2 como um regressor
em (2.38).
O metodo pode ser resumido da seguinte forma:
1. Obter via MQO os resduos
v2 = y2
0 +
1 z1 +
2 z2 +
3 z3 +
4 z4 ;
2. Estimar via MQO a regress
ao
y1 = 0 + 1 y2 + 2 z1 + 3 z2 + 1 y2 + e;
3. Testar H0 : 1 = 0 via teste t (robusto a heterocedasticidade). Se rejeitamos H0 a
um pequeno nvel de signific
ancia, conclumos que y2 e endogeno porque v2 e u1 s
ao
correlacionados.
2.2
Exerccios
Exerccio 2.4. Seja X a matriz cujas colunas sao compostas pelas variaveis x1 , . . . , xk . As
condicoes E[u/X] = 0 e Cov(u, xj ) = 0, para todo j = 1, . . . , k, sao equivalentes? Explique o
que estas condic
oes significam na pratica.
42
Monte Carlo que investiga o desempenho dos metodos MQO e IV ao estimar a equac
ao de
inflac
ao dos precos no modelo de inflac
ao de precos/inflac
ao do sal
ario. Valores numericos
foram atribudos aos par
ametros das equac
oes da seguinte forma:
p = 1.5 + 0.5w + up
(2.41)
2.2. EXERCICIOS
43
VI
Sample
b1
e.p.(b1 )
b2
e.p.(b2 )
b1
e.p.(b1 )
b2
e.p.(b2 )
0.36
0.39
1.11
0.22
2.33
0.97
0.16
0.45
0.45
0.38
1.06
0.17
1.53
0.57
0.53
0.26
0.65
0.27
0.94
0.12
1.13
0.32
0.70
0.15
0.41
0.39
0.98
0.19
1.55
0.59
0.37
0.30
0.92
0.46
0.77
0.22
2.31
0.71
0.06
0.35
0.26
0.35
1.09
0.16
1.24
0.52
0.59
0.25
0.31
0.39
1.00
0.19
1.52
0.62
0.33
0.32
1.06
0.38
0.82
0.16
1.95
0.51
0.41
0.22
-0.08
0.36
1.16
0.18
1.11
0.62
0.45
0.33
10
1.12
0.43
0.69
0.20
2.26
0.61
0.13
0.29
Exerccio 2.12. (ANPEC 2008)Suponha que o modelo abaixo descreva as relacoes entre
quatro vari
aveis aleat
orias escalares: y,X,Z, e V .
E(y/X, Z) = 0 + 1 X + 2 Z
X = 0 + 1 Z + v, E(v/Z, X) = E(v/Z) = E(v/X) = E(v) = 0.
Suponha, ainda, que 0 6= 0, 1 6= 0, 2 6= 0, 0 6= 0 e 1 6= 0.
(a) Calcule E(y/Z).
(b) Seja y = 0 + 1 X + 2 Z + u. Calcule E(u/X, Z).
(c) Calcule E(X/Z).
(d) Seja
y = 0 + 1 Z +
em que 0 = 0 + 1 0 e 1 = 1 1 + 2 . Calcule E(/Z).
(e) Considere uma amostra de tamanho n das variaveis y, X e Z. O estimador
P
nyi (zi z)
T = Pi=1
2
i=1 n(zi z)
44
Captulo 3
Equaco
es Simult
aneas
Outra forma importante de endogeneidade de variaveis explicativas e a simultaneidade.
Ela ocorre quando uma ou mais das variaveis explicativas sao determinadas conjuntamente
com a vari
avel dependente, em geral por meio de um mecanismo de equilibrio (como veremos
a seguir). Um exemplo pode ser encontrado em Macedo e Carvalho (2010) em que o aumento
da penetrac
ao do servico de acesso `
a internet em banda larga e seu possvel impacto economico
e analisado atraves de sistema de equacoes simultaneas de oferta e demanda.
Neste captulo veremos metodos de estimar modelos de equacoes simultaneas. O principal
e o metodo de VI.
3.1
Equac
oes de Oferta e Demanda
Exemplos de Equa
c
oes de Oferta e Demanda
Qdt = 0 + 1 Pt + 2 Yt + ut
Qst = 0 + 1 Pt + vt
Qdt = Qst .
45
CAPITULO 3. EQUAC
OES
SIMULTANEAS
46
Ct = 0 + 1 Yt + 2 Ct1 + ut
It = 0 + 1 Yt + 2 Yt1 + vt
Gt = G
Yt = C t + I t + G t .
wt = 0 + 1 Ut + 2 pt + ut
pt = 0 + 1 wt + 2 it + 3 mt + vt .
qid = 0 + 1 pi + ui
Oferta:
qis = 0 + 1 pi + vi
Equilbrio:
qid = qis .
(3.1)
3.1. EQUAC
OES
DE OFERTA E DEMANDA
47
Assumimos que cov(ui , vi ) = 0, E(ui ) = 0 e E(vi ) = 0. Pela condicao de equilbrio, temos que
qid = qis = qi .
Assim o sistema pode ser reescrito como
qi = 0 + 1 pi + ui
Equac
oes
qi = 0 + 1 pi + vi ,
Estruturais
em que p e q s
ao vari
aveis end
ogenas. Resolvendo para pi e qi , temos
0 + 1 pi + ui = 0 + 1 pi + vi
pi (1 1 ) = 0 0 + vi ui
0 0
vi ui
pi =
+
1 1 1 1
e
1 0 0 1 1 vi 1 ui
+
+ vi
1 1
1 1
1 0 0 1 1 vi 1 ui
+
,
1 1
1 1
qi = 0 +
=
1
var(ui ),
1 1
(3.2)
cov(pi , vi ) =
1
var(vi ).
1 1
(3.3)
enquanto que
Observa
c
ao 3.1.1. Como 1 < 0 e 1 > 0, temos que o preco e positivamente correlacionado
com ui , ou seja, com deslocamentos na demanda.
Ja vimos que n
ao podemos estimar o modelo via MQO. Temos uma segunda questao: Se
estimarmos qi contra pi estaremos captando a reta estimada de oferta ou de demanda?
CAPITULO 3. EQUAC
OES
SIMULTANEAS
48
3.1.2
(3.4)
(3.5)
em que renda e a renda anual e educ e idade sao indicadas em anos e sao variaveis exogenas.
Essa suposic
ao, baseada na maximizacao da utilidade, e bem razoavel indicando que poupf
e gastof s
ao cada uma func
ao da renda, educacao, idade e outras variaveis que afetem o
problema da maximizac
ao da utilidade, tais como as diferentes taxas de retorno sobre gastos
familiares e outras poupancas.
Para definir o metodo MQI vamos considerar o seguinte sistema de equacoes simultaneas
q d = 0 + 1 p + 2 y + u;
(demanda)
q s = 0 + 1 p + 2 R + u;
(oferta)
qd = qs,
(equilbrio)
em que q e p s
ao end
ogenas e y e R sao exogenas (renda e chuva, por exemplo).
Escrevendo as equac
oes acima na forma reduzida
(3.6)
3.1. EQUAC
OES
DE OFERTA E DEMANDA
49
equa
c
oes na forma reduzida
(3.7)
p = 0 + 1 y + 2 R + v 2 .
Observe que R e y s
ao ex
ogenas e, portanto, podemos estimar as equacoes via MQO e obter
estimativas consistentes.
Note tambem que temos seis parametros estruturais (3.6) e seis parametros na equac
ao
reduzida (3.7). Ap
os a estimac
ao teremos um sistema com seis equacoes e seis incognitas.
Assim, e possvel estimar, consistentemente, os parametros estruturais mas de forma indireta.
Esse procedimento e chamado mnimos quadrados indiretos (MQI).
Exemplo 3.4. Se o modelo for
q = 0 + 1 p + 2 y + u1 ;
q = 0 + 1 p + u2 ,
(demanda)
(oferta)
(3.8)
(3.9)
a forma reduzida e
p =
2
0 0
+
y + v1
1 1 1 1
q =
2 1
0 1 0 1
+
y + v2 ,
1 1
1 1
CAPITULO 3. EQUAC
OES
SIMULTANEAS
50
que pode ser reescrito como
p = 0 + 1 y + v 1
q = 0 + 1 y + v2 .
Agora e possvel obter estimadores consistentes via MQO. Mas, ap
os as estimativas teremos 5 par
ametros estruturais e 4 equac
oes (par
ametros na forma reduzida). Assim, n
ao
e possvel estimar todos os par
ametros estruturais. Mas e possvel obter as estimativas dos
par
ametros estruturais da equaca
o de oferta, que s
ao
1
1 =
1
0 = 0 1 0 .
Exemplo
3.1.3
O Problema da Identifica
c
ao
O problema pode ser descrito como sendo a possibilidade de estimar os parametros estruturais a partir dos coeficientes estimados na forma reduzida. Uma equacao pode ser
N
ao identificada (ou subidentificada)
Exatamente Identificada
Identificada
Super Identificada
3.1.4
N
ao Identificada ou Subidentificada
q = 0 + 1 p + u1 ;
(demanda)
q = 0 + 1 p + u2 ,
(oferta)
3.1. EQUAC
OES
DE OFERTA E DEMANDA
51
p =
0 0
u2 u1
+
1 1 1 1
q =
1 0 1 0 1 u2 0 u1
+
.
1 1
1 1
Observe que neste caso temos quatro parametros estruturais e duas equacoes (dois coeficientes
estimados na equac
ao reduzida). Assim, nao e possvel recuperar o parametro da forma
estrutural.
3.1.5
Exatamente Identificada
Considere o problema
q = 0 + 1 p + 2 y + u1 ;
q = 0 + 1 p + u2 ,
(demanda)
(oferta)
p =
0 0
2 y
+ v1
1 1 1 1
q =
2 1
1 0 1 0
+
+ v2 .
1 1
1 1
Podemos deduzir, ap
os alguns c
alculos simples que
1 =
1
1
0 = 0 1 0 .
Assim, a equac
ao de oferta e exatamente identificada e a equacao de demanda e subidentificada.
Se o modelo em quest
ao for
q = 0 + 1 p + 2 y + u1 ;
(demanda)
q = 0 + 1 p + 2 R + u2 ,
(oferta)
CAPITULO 3. EQUAC
OES
SIMULTANEAS
52
p = 0 + 1 y + 2 R + v1
q = 0 + 1 y + 2 R + v 2 .
Logo, teremos 6 coeficientes estruturais e 6 equacoes (ou seis coeficientes estimados via MQO
na forma reduzida) e, portanto, ambas as equacoes sao exatamente identificadas.
3.1.6
Sobreidentificada
Considere o problema
q = 0 + 1 p + 2 y + 3 W + u1 ;
q = 0 + 1 p + 2 R + u2 ,
(demanda)
(oferta)
p = 0 + 1 y + 2 R + 3 W + v1
q = 0 + 1 y + 2 R + 3 W + v 2 .
Neste caso temos sete par
ametros estruturais e oito equacoes. Assim, com mais equacoes do
que incognitas e possvel encontrar mais de uma solucao, ou seja, mais do que uma estimativa
para cada par
ametro estrutural.
3.1.7
Condi
c
ao de Ordem para Identifica
c
ao
Nas subsec
oes anteriores estudamos casos em que e necessario um previo conhecimento
do estado das equac
oes antes que se aplique qualquer metodo de estimacao. A condicao de
ordem e uma condic
ao necess
aria para que exista a possibilidade de estimacao. A condic
ao
determina que o n
umero de vari
aveis ex
ogenas excludas em que a equac
ao deve ser pelo
menos t
ao grande quanto o n
umero de vari
aveis includas end
ogenos, menos um.
Podemos escrever a condic
ao de ordem da seguinte forma:
m: end
ogenas includas na equacao;
K: ex
ogenas includas no sistema;
3.1. EQUAC
OES
DE OFERTA E DEMANDA
53
: ex
ogenas includas na equacao.
Para que uma equac
ao seja identificada e necessario que:
K m 1.
(3.10)
A igualdade deve ser satisfeita para que o sistema seja exatamente identificado e a desigualdade
deve valer para que o sistema seja sobreidentificado.
No entanto, um argumento mais forte e a condic
ao de posto que e necessaria e suficiente
para a identificac
ao.
3.1.8
Condi
c
ao de Posto (Rank Condition)
Y1
Y2
Y3
Z1
Z2
Z3
Equac
ao 1
Equac
ao 2
Equac
ao 3
De acordo com o quadro anterior a primeira equacao e constituda por duas variaveis
endogenas, Y1 e Y3 , e duas ex
ogenas, Z1 e Z3 , a segunda equacao por uma variavel endogena
Y1 e duas ex
ogenas, Z1 e Z3 , e a terceira equacao por duas endogenas Y2 e Y3 e duas exogenas,
Z1 e Z2 .
A regra de identificac
ao das equacoes pela Condic
ao de Posto e a seguinte: Observamos
os zeros da equac
ao a ser identificada e consideramos os outros elementos da respectiva coluna formando uma matriz A com os elementos restantes (coeficientes). Seja o n
umero
de variaveis excludas da equac
ao a ser identificada e G o n
umero de variaveis endogenas
encontradas no sistema.
(a) quando o posto da matriz A for igual a G 1, (r(A) = G 1), a equacao e exatamente
identificada;
(b) quando o posto da matriz A for superior a G 1, (r(A) > G 1), a equacao e sobreidentificada;
CAPITULO 3. EQUAC
OES
SIMULTANEAS
54
(c) quando a caracterstica da matriz A for inferior a G 1, (r(A) < G 1), a equacao e
subidentificada.
A Condic
ao de Posto e uma condicao necessaria e suficiente.
De acordo com a Condic
ao de Ordem, a 1a e 3a equacoes do nosso exemplo sao exatamente
identificadas (uma vez que = G 1 = 2) mas a 2a equacao e sobreidentificada (dado que
= 3 e G 1 = 2, assim > G 1).
De acordo com a Condic
ao de Posto a 1a equacao nao e identificada (subidentificada),
uma vez que r(A) = 1 < G 1, com
"
A=
+ +
e a 2a e 3a equac
oes s
ao exatamente identificadas, dado que r(A) = 2 = G 1, com
"
A=
+ + +
"
e A=
+ +
+ +
#
, respectivamente.
3.2. EXERCICIOS
3.2
55
Exerccios
Exerccio 3.1. Quando usamos modelos de equacao simultaneas? O que e o vies de simultaneidade em MQO? Como identificar e estimar a equacao estrutural?
y1 = 1 y2 + 2 x1 + u1 ;
y2 = 3 y1 + 4 x2 + u2 ,
em que x1 e x2 s
ao ex
ogenas e independente dos termos de perturbac
ao u1 e u2 . A forma
reduzida do modelo e:
y1 = 1 x1 + 2 x2 + u1 ;
y2 = 3 x1 + 4 x2 + u2 ,
(a) Se 1 = 1, 2 = 4, 3 = 2 e 4 = 2, determine os valores de 1 , 2 , 3 e 4 .
(b) Se x1 , x2 , u1 e u2 s
ao vari
aveis aleat
orias com distribuic
ao N(0,1), encontre o valor
predito para y1 dado que y2 = x1 = 1.
CAPITULO 3. EQUAC
OES
SIMULTANEAS
56
Ct = 1 + 2 Yt + t
It = 1 + 2 Yt + 3 Gt1 + ut
Yt = C t + I t + G t
3.2. EXERCICIOS
57
Qot = 1 + 2 Pt + t
Qdt = 1 + 2 Pt + 3 Yt + 4 Pt1 + ut
Qdt = Qot
(a) A equac
ao de oferta est
a identificada? O que acontece se a equac
ao de oferta for estimada
por MQO?
(b) A equac
ao de demanda est
a identificada? O que acontece se a equac
ao de oferta for
estimada por MQO?
(c) Se voce fosse solicitado a estimar a equac
ao de oferta usando vari
aveis instrumentais, o
que voce faria?
(d) Se voce fosse solicitado a estimar a equac
ao de oferta usando MQ2E, o que voce faria?
(e) Voce usaria MQI para estimar a equac
ao de demanda? Por que sim ou por que n
ao?
Y1 = 1 + 2 Y2 + 4 X1 + 5 X2 + u1
Y2 = 1 + 3 Y3 + 5 X2 + u2
Y3 = 1 + 2 Y2 + u3
CAPITULO 3. EQUAC
OES
SIMULTANEAS
58
t = 0 + 1 pt + 2 ut + 1t
pt = 0 + 1 t + 2 yt + 2t
t = 0 + 1 pt + 2 ut + 3 qt + 1t
pt = 0 + 1 t + 2 yt + 2t
t = 0 + 1 pt + 2 ut + 3 qt + 1t
pt = 0 + 1 t + 2t
Captulo 4
S
eries Temporais no Contexto de Regress
ao
Neste captulo abordamos regressao no contexto de series temporais. Comecamos definindo
o que e uma serie temporal e introduzimos algumas propriedades teoricas.
4.1
Introduc
ao
CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO
60
estudado nestas notas de aulas, para detalhes o aluno deve consultar Jenkins e Watts (1968),
Koopmans (1974), Morettin (1979), Marple (1987) e Kay (1988).
4.1.1
Exemplos de S
eries Temporais
Cada curva do gr
afico e chamada de trajet
oria ou serie temporal ou func
ao amostral. No
gr
afico acima Z(j) (t) e o valor da temperatura no instante t, para a j-esima trajet
oria (j-esimo
ponto de observac
ao). Para cada t fixo, teremos os valores de uma vari
avel aleat
oria Z(t) que
ter
a certa distribuic
ao de probabilidade. Na realidade o que chamamos de serie temporal, e
uma parte de uma trajet
oria, dentre muitas que poderiam ter sido observadas. O par
ametro
t pode ser func
ao de algum outro par
ametro fsico como por exemplo: espaco e volume.
4.1.2
Objetivos
Dada uma serie temporal {Z(t1 ), . . . , Z(tN )}, observada nos instantes t1 , . . . , tN , podemos
estar interessados em:
i) Investigar o mecanismo gerador da serie temporal;
ii) Fazer previs
oes de valores futuros da serie; podendo ser a curto ou longo prazo;
FORMAL
4.2. SERIES
TEMPORAIS: DEFINIC
AO
61
4.2
S
eries Temporais: Definic
ao Formal
Neste captulo vamos descrever os conceitos basicos utilizados dentro da teoria dos modelos
de series temporais. Inicialmente vamos introduzir os conceitos de processos estocasticos,
media e func
ao de covari
ancia, processo estacionario, e funcao de autocorrelacao.
4.2.1
Processos Estoc
asticos
(4.1)
(r, t) =
...
(4.2)
(4.3)
CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO
62
4.3
M
edias e Covari
ancias
(4.4)
e a funcao de autocovari
ancia (facov) como
(t, s) = Cov(Zt , Zs ) = E[(Zt t )(Zs s )], para t, s = 0, 1, 2, . . .
(4.5)
(t, s)
,
(t, t)(s, s)
(4.6)
Propriedades Importantes
1. (t, t) = V ar(Zt ),
(t, t) = 1;
m
n
m X
n
X
X
X
Cov
ci Z(ti ),
dj Z(sj ) =
ci dj Cov[Z(ti ), Z(sj )]
i=1
j=1
(4.7)
i=1 j=1
V ar
" n
X
i=1
#
ci Z(ti ) =
n
X
i=1
c2i V ar[Z(ti )] + 2
n n1
X
X
i=2 j=1
(4.8)
4.4. REGRESSAO
TEMPORAIS
4.4
63
Regress
ao com dados de S
eries Temporais
Nesta sec
ao estudaremos modelos de regressao cujas variaveis sao series temporais. O
interesse principal recai sobre as condicoes necessarias para que o estimador de MQO apresente
boas propriedades.
4.4.1
Diferen
ca entre Dados de S
eries Temporais e Dados de Corte Transversal
A primeira diferenca entre dados de series temporais e dados de corte transversal e que
uma serie temporal tem uma ordenacao temporal. Outra caracterstica, e que nao temos
mais independencia entre as observacoes, ou seja, nao temos mais uma amostra aleatoria de
indivduos. Logo, para estimar um modelo do tipo
yt = 0 + 1 + 2 xt1 + xt2 + . . . + k xtk + ut ,
(4.9)
sao necess
arias novas suposic
oes para que o estimador de MQO tenha boas propriedades.
4.4.2
Modelos de Regress
ao de S
eries Temporais
Modelos Est
aticos
Suponha que temos dados de series temporais disponveis para duas variaveis, digamos y
e z, em que yt e zt s
ao datadas contemporaneamente. Um modelo que relaciona y a z e:
yt = 0 + 1 zt + ut , t = 1, 2, . . . , n.
(4.10)
(4.11)
(4.12)
CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO
64
Para interpretar os coeficientes em (4.12) suponha que z seja constante igual a c, em todos
os perodos de tempo antes de t (. . . , zt2 = c, zt1 = c). Em t, z aumenta em uma unidade,
ou seja, zt = c + 1, e, em seguida, retorna ao seu nvel anterior em t + 1, isto e, zt+1 = c.
Para enfatizar o efeito ceteris paribus de z sobre y, suponhamos que o termo de erro em
cada perodo seja zero. Ent
ao,
yt1 = 0 + 0 c + 1 c + 2 c
yt = 0 + 0 (c + 1) + 1 c + 2 c
yt+1 = 0 + 0 c + 1 (c + 1) + 2 c
yt+2 = 0 + 0 c + 1 c + 2 (c + 1)
yt+3 = 0 + 0 c + 1 c + 2 c,
4.5. SUPOSIC
OES
PARA MODELOS COM SERIES
TEMPORAIS
65
(4.13)
4.5
Suposic
oes para Modelos com S
eries Temporais
Nesta sec
ao o objetivo e mostrar como as hipoteses classicas devem ser alteradas para
cobrir regress
ao de series temporais.
4.5.1
Inexist
encia de Vi
es do MQO
Para que as estimativas via MQO dos parametros de um modelo de regressao com series
temporais n
ao sejam viesadas s
ao necessarias a seguintes hipoteses:
Suposi
c
ao TS.1 (linearidade nos par
ametros).
O processo estoc
astico {(xt1 , xt2 , . . . , yt ) : t = 1, 2, . . . , n}
segue o modelo linear:
yt = 0 + 1 xt1 + + k xtk + ut ,
em que {ut : t = 1, 2, . . . , n} e a sequencia de erros ou perturbacoes.
Suposi
c
ao TS.2 (Inexistencia de colineariedade Perfeita).
Na amostra, nenhuma das vari
aveis independentes e constante ou
combinac
ao linear perfeita das outras.
66
CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO
As hip
oteses TS.1 e TS.2 s
ao essencialmente as mesmas daquelas usadas no contexto de
Suposi
c
ao TS.3 (Media condicional zero ou exogeneidade estrita).
O termo de erro em qualquer dado perodo e nao correlacionado com
as vari
aveis explicativas em todos os perodos de tempo, ou seja
E(ut |X) = 0, para t = 1, 2, . . . , n.
Analisando-se a hip
otese TS.3, percebemos que ela difere da hipotese classica. Observe
que a hip
otese TS.3 exige que o erro no tempo t, ut seja nao correlacionado com cada variavel
explicativa em todos os perodos de tempo.
Se em termos de media condicional, temos somente a condicao de nao correlacao somente
no tempo t, da forma
E(ut |x1t , . . . , xtk ) = E(ut |Xt ) = 0,
(4.14)
Exemplo 4.3. Suponha que a taxa de homicdios (homit ) em uma cidade em termos do
n
umero de policiais per capita (polpct )
homit = 0 + 1 polpct + ut .
O termo de erro u precisaria ser n
ao correlacionados com os valores atuais, os valores
passados e futuros de polpct . Podemos aceitar que u n
ao e correlacionado com valores corrente
e valores passados do regressor. Mas e evidente que um aumento em u hoje, provavelmente,
levar
a a polticas que tentem aumentar polpct no futuro. Logo TS.3 falha.
Quando u e correlacionado com o passado dos regressores, podemos resolver o problema
incluindo defasagens dos regressores e utilizando um modelo de defasagem distribuda. Mas
nao podemos ter, de forma alguma, a influencia de u no futuro dos regressores.
Teorema 4.5.1. Sob as Hip
oteses ST.1, ST.2 e ST.3 os estimadores de MQO s
ao n
ao viesa-
4.5. SUPOSIC
OES
PARA MODELOS COM SERIES
TEMPORAIS
67
4.5.2
(4.15)
Vari
ancia dos Estimadores MQO
necess
E
ario mais duas hip
oteses para completar o conjunto de hipoteses de Gauss-Markov
para regress
oes de series temporais. A primeira delas e familiar da analise de corte transversal.
Suposi
c
ao TS.4 (Homoscedasticidade).
Condicional a X, a vari
ancia de ut e a mesma para todo t:
V ar(ut |X) = V ar(ut ) = 2 , para t = 1, 2, . . . , n.
Suposi
c
ao TS.5 (Inexistencia de Correlac
ao Serial).
Condicional a X, os erros em dois perodos de tempos diferentes
sao n
ao correlacionados:
Corr(ut , us |X) = 0, para todo t 6= s.
Com este conjunto de condic
oes podemos enunciar o teorema de Gauss-Markov no contexto
de series temporais.
Teorema 4.5.2. (Teorema de Gauss-Markov). Sob as Hip
oteses ST.1 a ST.5 os estimadores
de MQO s
ao os melhores estimadores lineares n
ao viesados condicionais a X, ou seja, s
ao
BLUE.
4.5.3
Infer
encia sob as Hip
oteses do Modelo Linear Cl
assico
CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO
68
Suposi
c
ao TS.6 (Normalidade).
Os erros ut s
ao independentes de X e sao i.i.d. com distribuicao
normal com media zero e vari
ancia 2
ut N (0, 2 ),
para t = 1, 2, . . . , n.
4.5.4
Tend
encia
Quando trabalhamos com series temporais e necessario saber reconhecer se estas series
contem uma tendencia temporal. Ignorar o fato de que duas series temporais podem ser
correlacionadas somente porque ambas estao apresentando uma mesma tendencia ao longo do
tempo, em vez de uma relac
ao causal, pode levar a conclusoes erroneas e a possibilidade de
uma regress
ao esp
uria. Vejamos o exemplo de uma serie temporal com tendencia temporal:
4.5. SUPOSIC
OES
PARA MODELOS COM SERIES
TEMPORAIS
69
t = 1, 2, . . . ,
(4.16)
em que assume-se que {et } e i.i.d. com E(et ) = 0 e var(et ) = 2 . Observe que o parametro 1
multiplica o tempo, resultando em uma tendencia temporal linear. Assim, 1 mede a mudanca
em yt , de um perodo para o pr
oximo, motivado pela passagem do tempo, mantendo-se todos
os outros fatores fixos.
Outros modelos podem ser usados para capturar tendencias temporais, dependendo da
situacao. No modelo em que o logaritmo natural de yt (presumindo que yt > 0) apresenta
uma tendencia temporal linear,
log(yt ) = 0 + 1 t + et ,
t = 1, 2, . . . ,
(4.17)
t = 1, 2, . . . .
(4.18)
Usando vari
aveis de tend
encia na an
alise de regress
ao
Suponha que existam dois fatores observados, xt1 e xt2 que afetam yt . Alem disso, existem
fatores n
ao observados que est
ao sistematicamente crescendo ou decrescendo ao longo do
tempo. Um modelo que captura isso e:
yt = 0 + 1 xt1 + 2 xt2 + 3 t + ut .
(4.19)
Permitindo uma tendencia temporal no modelo, reconhece-se que yt pode estar crescendo ou
decrescendo ao longo do tempo por razoes essencialmente nao relacionadas a xt1 e xt2 .
A omiss
ao da vari
avel t pode levar ao vies por omissao de variavel, especialmente se xt1
ou xt2 apresentarem algum tipo de tendencia, pois elas podem ser altamente correlacionadas
com t.
Adicionando um termo de tendencia linear em um modelo de regressao e a mesma coisa
que usar serie destendenciadanuma regressao. Os estimadores 1 e 2 do modelo (4.19)
podem ser obtidos atraves de um procedimento de remocao da tendencia temporaldas series
originais:
Destendenciar uma serie envolve regredir cada variavel do modelo em t e uma constante
CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO
70
(4.20)
4.5.5
Sazonalidade
Sazonalidade ocorre quando uma serie exibe comportamentos semelhantes em determinados perodos. Um exemplo e o PIB trimestral (industria)
comum que as series de dados mensais e trimestrais exibam padroes sazonais, mas isso
E
nao e uma regra. Por exemplo, n
ao existe padrao sazonal observavel nas taxas de juros ou
de inflacao. Alem disso, series que exibem padroes sazonais sao ajustadas sazonalmente
antes de serem informadas para o p
ublico.
Uma serie ajustada sazonalmente e a serie que teve os fatores sazonais removidos. Existem
varios metodos para isso. Um dos metodos mais simples e incluir um conjunto de variaveis
4.5. SUPOSIC
OES
PARA MODELOS COM SERIES
TEMPORAIS
71
(4.21)
4.5.6
Processos de covari
ancia estacion
aria
Um processo estoc
astico e covariancia estacionaria se E(xt ) e constante, V ar(xt ) e constante e para qualquer t, h 1, Cov(xt , xt+h ) depende apenas em h, e nao em t. Mais adiante
abordaremos essa definic
ao com maior profundidade.
4.5.7
72
CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO
Exemplo: AR(1) pg 356 Wooldridge.
4.6. EXERCICIOS
4.6
73
Exerccios
74
CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO
Exerccio 4.4.
Considere uma serie temporal de 10 anos contendo PIB (em R$) e n
umero de homicdios (em
unidades) em um determinado pas. O primeiro modelo estimado foi pibt = 0 +1 homict +ut .
Os resultados da estimac
ao se encontram na tabela 1. Um segundo modelo foi pibt = 0 +
1 homict + 2 t + ut , em que t e um termo de tendencia. Os resultados da estimac
ao desse
modelo se encontram na tabela 2:
(Intercept)
homic
(Intercept)
homic
t
Estimate
-3461194.26
102.63
Tabela 1
Std. Error
314948.06
6.12
t-value
-10.99
16.76
Pr(t)
0.00
0.00
Estimate
5564710.45
-123.64
423054.01
Tabela 2
Std. Error
2539866.04
63.59
118647.95
t-value
2.19
-1.94
3.57
Pr(t)
0.06
0.09
0.01
4.6. EXERCICIOS
75
t
s2
s3
s4
Residuals
Df
1
1
1
1
53
Tabela 3. ANOVA
Sum Sq
2287298699531.79
1216754395.49
31129772.60
5037536508.88
106216397798.70
Mean Sq
2287298699531.79
1216754395.49
31129772.60
5037536508.88
2004082977.33
CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO
76
(Xt Xt1 ), em que , tal que 0 < < 1, e conhecido como coeficiente de expectativas.
a) Mostre que podemos escrever esse modelo como Yt = 0 + 1 Xt + 2 Yt1 + vt . Quem s
ao
os 0 s em termos dos 0 s e ? Quem e vt em termos de ut ?
b) O que podemos dizer a respeito dos estimadores de MQO nesse caso? Justifique.
4.6. EXERCICIOS
77
c) Imagine que no modelo original ut siga o esquema auto-regressivo de primeira ordem, i.e.,
ut = ut1 + t , em que e o coeficiente de autocorrelac
ao e onde t satisfaz as premissas
cl
assicas. Se = , como voce estimaria o modelo? Justifique.
d) As estimativas obtidas no item anterior s
ao n
ao-viciadas? Consistentes? Justifique sua
resposta.
h 2
,
12
h = 1, 2, 3, . . .. O processo yt e
de covari
ancia estacion
aria? Justifique.
c) Calcule a autocorrelac
ao de ordem h para o processo yt . Faca o correlograma ate quatro
defasagens para esse processo considerando = 0, 5.
78
CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO
Captulo 5
S
eries Temporais e Econometria
5.1
S
eries Temporais: Definic
ao Formal
Neste captulo vamos descrever os conceitos basicos utilizados dentro da teoria dos modelos
de series temporais. Inicialmente vamos introduzir os conceitos de processos estocasticos,
media e func
ao de covari
ancia, processo estacionario, e funcao de autocorrelacao.
5.1.1
Processos Estoc
asticos
Especifica
c
ao de um Processo Estoc
astico
Sejam t1 , t2 , . . . , tn elementos quaisquer de T e consideremos
F (Z1 , . . . , Zn ; t1 , . . . , tn ) = P {Z(t1 ) z1 , . . . , Z(tn ) zn }
(5.1)
79
(5.2)
CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA
80
ou
(r, t) =
...
(5.3)
5.2
M
edias e Covari
ancias
(5.4)
e a funcao de autocovari
ancia (FACV) como
(t, s) = Cov(Zt , Zs ) = E[(Zt t )(Zs s )], para t, s = 0, 1, 2, . . .
(5.5)
(t, s)
,
(t, t)(s, s)
(5.6)
em que
(t, s) = Cov(Zt , Zs ),
(t, t) = V ar(Zt )
e
(s, s) = V ar(Zs ).
Observe que estas func
oes dependem do tempo, mas existem processos em que essas quantidades n
ao possuem dependencia temporal. Processos com estas caractersticas serao abordados mais adiante.
Propriedades Importantes
1. (t, t) = V ar(Zt ),
(t, t) = 1;
5.3. ESTACIONARIEDADE
p
3. |(t, s)|
81
Na correlac
ao podemos verificar que valores proximos de 1 indicam forte dependencia
(linear) e valores pr
oximos de 0 indicam fraca dependencia (linear). Se (t, s) = 0, Zt e Zs
sao nao-correlacionadas. Agora se Zt e Zs sao independentes, entao (t, s) = 0.
Para analisar as propriedades da covariancia de varios modelos de series temporais, o
seguinte resultado ser
a utilizado: se c1 , c2 , . . . , cm e d1 , d2 , . . . , dn sao constantes e t1 , t2 , . . . , tm
e s1 , s2 , . . . , sn s
ao pontos no tempo, entao
m
n
m X
n
X
X
X
Cov
ci Z(ti ),
dj Z(sj ) =
ci dj Cov[Z(ti ), Z(sj )]
i=1
j=1
(5.7)
i=1 j=1
V ar
" n
X
#
ci Z(ti ) =
i=1
5.3
n
X
i=1
c2i V ar[Z(ti )] + 2
n n1
X
X
(5.8)
i=2 j=1
Estacionariedade
CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA
82
5.3.1
Estacionariedade estrita
5.3. ESTACIONARIEDADE
83
t s,
(t, s) = (0, |t s|, onde |t s| =
s t,
para t > s;
para s > t.
A covari
ancia entre Zt e Zs depende somente da diferenca temporal |t s| e nao dos
tempos t e s. Alem disso, para um processo estacionario simplificando a notacao temos
(k) = Cov(Zt , Ztk )
(5.9)
(5.10)
|(k)| 1.
5.3.2
Fracamente estacion
ario ou estacionariedade de segunda ordem
Uma definic
ao que e semelhante a estritamente estacionaria mas e matematicamente mais
fraca, e a seguinte: um processo estocastico Zt e dito ser fracamente (ou de segunda-ordem)
estacion
ario se:
1. a func
ao media e constante para todo tempo t;
2. (t, t k) = (0, k) para todo tempo t e de lag k.
5.3.3
m
X
k=1
2k (
)
(5.11)
CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA
84
(5.12)
k=1
que se distribui como uma qui-quadrado com m graus de liberdade em grandes amostras. A
estatstica LB possui maior poder para amostras pequenas que a estatstica Q.
5.3.4
Fun
c
ao de autocorrela
c
ao Parcial (FACP)
A func
ao de autocorrelac
ao parcial (FACP) e a correlacao entre as variaveis yt e yt+k dado
que sao conhecidos yt+1 , yt+2 , . . . , yt+k1 .
A FACP para um processo estacionario com media zero pode ser obtida a partir da
regressao
yt+k = k1 yt+k1 + k2 yt+k2 + + kk yt + t+k .
(5.13)
Multiplicando ambos os lados por yt+kj e calculando o valor dividindo pela variancia,
tem-se
j = k1 j1 + k2 j2 + + kk kj .
Entao para j = 1, 2, . . . , k, temos:
1 = k1 0 + k2 1 + + kk k1 ;
2 = k1 1 + k2 0 + + kk k2 ;
..
.
k = k1 k1 + k2 k2 + + kk 0 ;
Para k = 1 11 = 1 .
Para k = 2 1 = 21 + 22 1 e 2 = 21 1 + 22 .
Ou podemos escrever a ultima equacao em notacao matricial:
" #
1
2
"
=
#" #
21
22
5.3. ESTACIONARIEDADE
85
cuja soluc
ao para o estimador de 22 e dada pela regra de Cramer:
22
1
1
1 2
=
1 1
1 1
33
1
1
2
=
1
1
2
1 1
1 2
1 3
,
1 2
1 1
1 1
e assim sucessivamente.
5.3.5
Em series temporais e usual trabalhar com operadores que defasam a variavel. Definimos
entao o operador de defasagem L como um operador linear tal que:
Lj yt = ytj
Sao v
alidas as seguintes propriedades do operador L:
1. O lag de uma constante e a propria constante Lc = c;
(5.14)
CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA
86
yt
1 aL
5.3.6
aL
yt
1 aL
Rudo Branco
5.3. ESTACIONARIEDADE
87
Muitos processos podem ser construdos a partir do rudo branco. Pode-se verificar facilmente que a sequencia {at } e estritamente estacionaria
P [a(t1 ) x1 , a(t2 ) x2 , , a(tn ) xn ]
= P [a(t1 ) x1 ]P [a(t2 ) x2 ] . . . P [a(tn ) xn ]
= P [a(t1 k) x1 ]P [a(t2 k) x2 ] . . . P [a(tn k) xn ]
= P [a(t1 k) x1 , a(t2 k) x 2, , a(tn k) xn ].
A primeira igualdade e devido a independencia das variaveis e a segunda por serem identicamente distribudas.
Temos tambem que t = E(at ) e constante com FACV dada por
V ar(a ),
t
(t, s) =
0,
se t = s;
se s 6= t.
1,
(k) =
0,
se t = s;
se s 6= t.
O termo rudo branco resulta do fato que em uma analise de frequencia do modelo, podemos mostrar que todas as frequencias sao iguais.
As caracteristicas de um processo rudo branco ficam explcitas quando analisamos o
seguinte gr
afico
Exemplo 5.1. (M
edia-M
ovel de ordem 1)
Suponha
Yt = at 0.5at1 ,
emm que at s
ao v.a.i.i.d. com media zero e vari
ancia a2 .
t = E(Yt ) = E(at ) 0.5E(at1 ) = 0
e
V ar(Yt ) = V ar(at 0.5at1 ) = a2 + 0.5a2 = 1.25a2 .
CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA
88
Tambem
Cov(Yt , Yt1 ) = Cov(at 0.5at1 , at1 0.5at2 ) = 0.5Cov(at1 , at1 ),
ou
(t, t 1) = 0.5a2 .
Alem disso
Cov(Yt , Ytk ) = 0, para k 2
ent
ao podemos concluir que
0.5 2 ,
a
(t, s) =
0,
se |t s| = 1;
se |t s| > 1.
0.4,
(t, s) =
0,
se |t s| = 1;
se |t s| > 1.
5.4
89
Na an
alise de series temporais, a metodologia de Box-Jenkins, em homenagem ao estatsticos George Box e Jenkins Gwilym, aplica-se os modelos autorregressivo de media movel
ARMA ou ARIMA para encontrar o melhor ajuste dos valores passados de uma serie temporal,
para entao fazer previs
oes. O procedimento pode ser resumido em tres etapas:
1. Identificac
ao e selec
ao do modelo. Verificar se as variaveis sao estacionarias, identificando possvel sazonalidade na serie (retirando a sazonalidade, se necessario), e uso das
autocorrelac
oes e autocorrelac
oes parcial para decidir por modelos autorregressivos e/ou
de medias m
oveis.
2. Estimac
ao dos par
ametros usando algoritmos computacionais para chegar a coeficientes
que melhor se adaptam ao modelo selecionado ARIMA. Os metodos mais comuns sao o
maxima verossimilhanca ou mnimos quadrados nao lineares.
3. Verificac
ao do modelo por meio de testes. Se o modelo estimado esta em conformidade
com as especificac
oes de um processo estacionario univariado. Verificacao do resduos.
Em particular, os resduos devem ser independentes e com media e variancia constante
ao longo do tempo. (Plotagem da media e variancia dos resduos ao longo do tempo e o
teste Ljung-Box ou plotagem das autocorrelacoes e autocorrelacoes parciais dos resduos
sao u
teis para identificar m
a especificacao.) Se a estimativa e inadequada, temos que
voltar para a primeira etapa e tentar encontrar um modelo melhor.
Um dos modelos mais simples e bastante u
til e o modelo autorregressivo. Consideremos o
caso mais simples.
5.4.1
(5.15)
= c + + 0,
CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA
90
c
.
1
2
.
1 2
yt = c + yt1 + t ;
(1 L)yt = c + t ;
yt =
X
c
+
j tj = + (L)t ,
1
j=0
em que = c/1 e
(L) = (1 L)1 = 1 + L + 2 L2 + .
Pode-se ent
ao calcular
Eyt = +
j E(tj ) = .
j=0
V ar(yt ) = E(yt )2 = E
2
j tj =
j=0
A func
ao de autocovari
ancia de defasagem j e:
X
j=0
2j E(2tj ) =
2
.
1 2
91
= E[(yt )(ytj )]
"
!
!#
X
X
s
s
= E
ts
tsj
s=0
s=0
= 2 (j + 2j + j+4 + )
j
=
2.
1 2
Como a media e as covari
ancias nao sao funcoes do tempo o processo e fracamente estacionario, independente do valor de .
A func
ao de autocorrelac
ao de ordem j e dada por
j =
j
2
12
2
12
= j .
5.4.2
Passeio Aleat
orio (Random Walk)
ou
Zt = Zt1 + at .
(5.16)
CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA
92
Obtendo a func
ao media de (5.16) temos:
t = E(Zt ) = E(a1 + a2 + + at )
= E(a1 ) + E(a2 ) + + E(at )
= 0 + 0 + + 0 = 0,
como E(at ) = 0, n
os temos:
t = 0, para todo t,
e tambem
V ar(Zt ) = V ar(a1 + a2 + + at )
= V ar(a1 ) + V ar(a2 ) + + V ar(at )
= 2 + 2 + + 2 = t 2 .
ou
V ar(Zt ) = ta2 .
Observe que a vari
ancia do processo cresce linearmente com o tempo. Suponha agora que
1 t s, teremos ent
ao,
(t, s) = Cov(Zt , Zs )
= Cov(a1 + a2 + + at , a1 + a2 + . . . + as )
= Cov(a1 , a1 ) + Cov(a2 , a2 ) + + Cov(at , at )
= a2 + a2 + + a2 = ta2
em que
Cov(at , as ) = 0, para t 6= s
temos ent
ao que a FACV e dada por
(t, s) = ta2 , para 1 t s
(5.17)
t
, para 1 t s.
s
(5.18)
O passeio aleat
orio e um exemplo simples que representa diversos fenomenos como o
movimento comum de precos e ttulos e tambem a posicao de pequenas partculas suspensas
dentro de um fludo, chamado movimento Browniano.
93
5.4.3
(5.19)
p (L) = 1 1 L 2 L2 . . . p Lp .
(5.20)
em que
94
CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA
Figura 5.4: AR(1) simulado com coeficiente 1 = 0.5, FAC amostral e FACP amostral.
Figura 5.5: AR(1) simulado com coeficiente 1 = 0.5, FAC amostral e FACP amostral.
95
Figura 5.6: AR(1) simulado com coeficiente 1 = 0.8, FAC amostral e FACP amostral.
Figura 5.7: AR(2) simulado com coeficientes 1 = 0.5 e 2 = 0.7, FAC amostral e FACP amostral.
96
CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA
Figura 5.8: AR(2) simulado com coeficientes 1 = 0.5, 2 = 0.7 e 3 = 0.6, FAC amostral e FACP
amostral.
97
Modelo M
edias-M
oveis (MA(q))
(5.21)
em que t e um RB(0, 2 ).
Esta
terminologia
vem
do
fato
que
yt
obtido
aplicando
os
pesos
1, 1 , 2 , . . . , q , as vari
aveis t t1 t2 . . . tq e entao movendo os mesmos
pesos 1 unidade do tempo a frente e aplicando-lhes a t+1 t t1 . . . tq+1 para obter
yt+1 .
Usando o operador L, podemos reescrever o modelo (5.21) como
yt = q (L)t ,
(5.22)
q (L) = 1 + 1 L + 2 L2 + . . . + q Lq .
(5.23)
em que
5.4.5
O modelo MA(1)
0 = V ar(yt )
= V ar(t 1 t1 )
= 2 + 12 2 = 2 (1 + 2 ).
temos ainda que a func
ao de autocovariancia e:
(5.24)
CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA
98
1 = Cov(yt , yt1 )
= Cov(t 1 t1 , t1 1 t2 )
= 1 Cov(t1 , t1 ) = 1 2
e para k 2 teremos
k = Cov(yt , ytk ) = 0.
E a FAC ser
a dada por:
k =
5.4.6
1+2
se
k = 0;
se
k = 1;
se
k 2.
O modelo MA(q)
0 = V ar(yt )
= V ar(t + 1 t1 + 2 t2 + . . . + q tq )
= (1 + 12 + . . . + q2 ) 2
a funcao de autocovari
ancia e dada por
1 = Cov(yt , yt1 )
= Cov(t + 1 t1 + 2 t2 + . . . + q tq , t + 1 t1 + 2 t2 + . . . + q tq )
= 1 2 + 1 2 2 + + q1 q 2
= (1 + 1 2 + + q1 q ) 2 , para k = 1;
e
2 = (2 + 1 3 + . . . + q2 q ) 2 , para k = 2;
e para k q + 1 vamos ter k = 0.
Enquanto que a FAC ser
a dada por
k =
k + 1 k+1 + . . . + qk q
,
1 + 12 + . . . + q2
para k = 1, . . . , q.
Figura 5.9: MA(1) simulado com coeficiente 1 = 1, FAC amostral e FACP amostral.
99
100
CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA
Figura 5.10: MA(1) simulado com coeficiente 1 = 0.8, FAC amostral e FACP amostral.
Figura 5.11: MA(2) simulado com coeficientes 1 = 0.8 e 2 = 0.4, FAC amostral e FACP amostral.
101
Figura 5.12: MA(2) simulado com coeficientes 1 = 0.8, 2 = 0.4 e 3 = 1.4, FAC amostral e FACP
amostral.
CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA
102
5.4.7
Modelo ARMA(p,q)
(5.25)
2 (L)yt = 3 (L)t
(1 1 L 2 L2 )yt = (1 + 1 L + 2 L2 + 3 L3 )t
yt = 1 yt1 + 2 yt2 + t + 1 t1 + 2 t2 + 3 t3 .
Exemplos de modelos ARMA simulados
Figura 5.13: ARMA(1,1) simulado com coeficientes 1 = 0.5 e 1 = 0.8, FAC amostral e FACP
amostral.
103
Figura 5.14: ARMA(1,3) simulado com coeficientes 1 = 0.5, 1 = 0.8, 2 = 0.4 e 3 = 1.4, FAC
amostral e FACP amostral.
Figura 5.15: ARMA(3,1) simulado com coeficientes 1 = 0.5, 2 = 0.7, 3 = 0.6 e 1 = 0.8, FAC
amostral e FACP amostral.
CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA
104
5.4.8
j=0 |j |
<e
yt = (L)et .
yt = (yt2 + et1 ) + et
= 2 yt2 + et1 + et .
Repetindo este processo k 1 vezes, vamos ter:
yt = et + et1 + 2 et2 + + k1 et(k1) + k ytk .
Para k grande vamos ter:
yt = et + et1 + 2 et2 + . . .
= 0 et + 1 et1 + 2 et2 + . . . ,
em que || < 1 e j = j .
O que acontece com a vari
ancia de yt ?
Assim, essa representac
ao somente faz sentido se
se, || < 1.
j=0 j
105
Invertibilidade
Mostramos que um processo AR pode ser reescrito como um processo MA de ordem infinita
atraves de pesos j s. Alem disso podemos escrever um processo MA como um autorregressivo.
Defini
c
ao 5.4.2. Um processo linear {yt } e invertivel (estritamennte, uma func
ao invertvel
de {et }) se existe
(L) = 0 + 1 L + 2 L2 + ,
com
j=0 |j |
<e
et = (L)yt .
et = yt + (yt1 + et2 )
= yt + yt1 + 2 yt2
Se || < 1, podemos continuar a substituicao e obter:
et = yt + yt1 + 2 yt2 + . . . ,
ou seja,
yt = yt1 2 yt2 . . . + et .
Logo se || < 1, vimos que o MA(1) pode ser invertido (transformado) para um AR().
Neste caso dizemos que o modelo MA(1) e invertvel.
Polin
omio Caracterstico
Nos exemplos mostrados acima tratamos da causalidade e invertibilidade dos casos AR(1)
e MA(1) em particular. Para os casos mais gerais AR(p) e MA(q) utilizamos os chamados
polin
omios caractersticos para decidir se os processos sao causais e/ou invertvel.
CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA
106
(5.26)
(5.27)
Teorema 5.4.2. Um processo MA(q) e invertvel se, e somente se, as razes de (z) est
ao
fora do crculo unit
ario, isto e,
|z| 1 (z) = 1 + 1 z + 2 z 2 + + q z q 6= 0.
Teorema 5.4.3. Se () e () n
ao possuem fatores em comum, existe (
unica) soluc
ao estacion
aria {yt } para (L)yt = (L)et se, e somente se,
|z| = 1 (z) = 1 1 z p z p 6= 0.
Esse processo ARMA(p, q) e causal se, e somente se,
|z| 1 (z) = 1 1 z p z p 6= 0.
107
CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA
108
5.5
Exerccios
5.5. EXERCICIOS
109
onde et iid(0, e2 ) e 6= 0.
(a) Os processos acima possuem as mesmas autocorrelac
oes? Verifique.
(b) Os processos acima s
ao invertveis? Verifique.
Exerccio 5.9. (a) Supondo que E(yt ) = e que yt = c0 + 1 yt1 + et + 1 et1 , calcule o
valor de c0 em termos de e 1 .
(b) Explique como se comportam os gr
aficos da FAC e da FACP em processos ARMA(p, q).
110
CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA
(c) Esboce os gr
aficos da FAC e FACP para um processos ARMA(1,1).
Exerccio 5.10. Explique os passos que devem ser seguidos para a modelagem de uma serie
temporal na metodologia ARMA.
5.5. EXERCICIOS
111
Tabela 1
10
0.51
0.13
0.01
0.04
0.03
0.00
0.04
0.02
0.08
0.01
k,k
0.51
-0.18
0.03
0.06
-0.03
-0.00
0.07
-0.05
0.13
-0.11
112
CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA
Captulo 6
S
eries Temporais N
ao Estacion
arias
Nos captulos anteriores assumimos que
E(Zt ) = 0;
V ar(Zt ) = 2 , para todo t, e
Cov(Zt , Ztk ) = 2 k , para todos os t e k,
em que k e a correlac
ao serial das defasagens k. Se essas hipoteses sao satisfeitas a serie Zt
e chamada de covari
ancia estacion
aria ou simplesmente estacion
aria. A intuicao e de que
uma serie temporal estacion
aria y (ou de tendencia estacionaria) tem a tendencia de retornar
a uma media constante (ou flutuar em torno de uma tendencia deterministica). Portanto,
valores grandes devem ser seguidos de valores menores e valores menores devem ser seguidos
de valores maiores.
No entanto muitas series temporais economicas sao claramente nao estacionarias no sentido
de que a media e a vari
ancia dependem do tempo, e elas tendem a se afastar permanentemente
de qualquer valor `
a medida que o tempo passa. Se esse movimento e predominantemente em
uma direc
ao (para cima ou para baixo), dizemos que a serie exibe uma tendencia.
A tendencia das series temporais nao-estacionarias e frequentemente removida antes que
analises adicionais sejam feitas. Existem dois procedimentos usados para remover a tendencia:
1. Estimac
ao das regress
oes no tempo;
2. Diferenciac
ao sucessiva.
Estimac
ao das regress
oes no tempo foi apresentado no captulo ????, no entanto retomamos
nesta secao. Na figura a seguir o exemplo classico de dados de companhias aereas apresentados
por Box & Jenkins. Os dados apresentam o total mensal de passageiros internacionais no
perodo de 1949 `
a 1960. Observe que a serie Zt apresenta nao estacionariedade causada por
uma tendencia determinstica. A defasagem, no caso Zt4 , apresenta a mesma tendencia da
113
ESTACIONARIAS
CAPITULO 6. SERIES
TEMPORAIS NAO
114
serie original. Esta tendencia determintica pode ser eliminada por uma diferenca, o que fica
evidenciado no gr
afico, no entanto essa nao e a forma recomendada. Recomenda-se eliminar
600
500
Srie de passageiros
Srie defasada X(t4)
300
200
100
100
Passageiros/milhes
400
Srie diferenciada
1950
1952
1954
1956
1958
1960
anos
6.0.1
(6.1)
em que t RB(0, 2 ) e um rudo branco, torna-se um rudo branco com tendencia determinstica. O modelo AR(1) com tendenca determinstica pode ser escrito da segunte forma
Yt = a + bt + Yt1 + t .
(6.2)
115
Ja para a diferenca de Yt temos
260
240
pop
220
200
180
160
140
1950
1955
1960
1965
1970
1975
1980
1985
const
time
Coeficiente
Erro Padr
ao
147,858
2,41152
0,529293
0,0188056
M
edia var. dependente
Soma resd. quadrados
R2
F (1, 46)
Log da verossimilhanca
Crit
erio de Schwarz
206,9404
149,8604
0,997210
16444,00
95,43313
198,6087
0,938893
raz
ao-t
p-valor
279,3504
128,2342
0,0000
0,0000
33,80851
1,804947
0,997150
2,07e60
194,8663
196,2805
0,035818
1990
1995
ESTACIONARIAS
CAPITULO 6. SERIES
TEMPORAIS NAO
116
ajustado
efetivo
260
240
pop
220
200
180
160
140
1950
1955
1960
1965
1970
1975
1980
1985
1990
1995
Figura 6.3: Ajuste x efetivo para populacao dos EUA entre 1948-1995
nao mais apresenta tendencia determinstica, como pode ser observado na figura
Resduo do ajuste (observado - ajustado)
0,6
0,4
resduo
0,2
-0,2
-0,4
-0,6
1950
1955
1960
1965
1970
1975
1980
1985
1990
1995
117
ano
pop(milhoes)
t2
t3
1948
146,631
1949
149,188
1950
152,271
27
1951
154,878
16
64
1952
157,553
25
125
1953
..
.
160,184
..
.
6
..
.
36
..
.
216
..
.
ESTACIONARIAS
CAPITULO 6. SERIES
TEMPORAIS NAO
118
6.1
Uma serie com uma tendencia estocastica se diferencia de outra com uma tendencia determinstica, pois as mudancas na mesma deixam de ter um carater transitorio e passam a
apresentar um car
ater permanente [(Pereira, 1988) e (Gujarati, 2000)]. A presenca de uma
tendencia estoc
astica implica que flutuacoes em uma serie temporal sao o resultado de choques
nao somente no componente transit
orio ou cclico, mas tambem no componente de tendencia.
[Balke (1991) apud Gujarati (2000, p. 730)]
Os testes de raz unit
aria s
ao u
teis para identficar tendencia estocastica numa serie temporal. Caso a serie apresente uma raz unitaria, a serie sera nao estacionaria e isso afeta
diretamente a abordagem/modelagem. Um dos testes mais conhecidos na literatura de series
temporais e o teste de Dickey Fuller.
6.1.1
(6.3)
em que yt e a vari
avel de interesse, t e o ndice temporal, e coeficente e ut e o termo de erro.
Uma raz unit
aria est
a presente se = 1. O modelo sera nao estacionario.
Nota-se que, quando = 1
yt = a0 + yt1 + ut
pode ser reescrito como
yt = y0 +
t
X
ui + a0 t
i=1
(6.4)
A estatstica para cada um dos modelos pode ser obtida da seguinte forma:
=
s()
(6.5)
e o desvio padr
em que s()
ao de
Pn
yt1 yt
= Pt=1
1,
n
2
t=1 yt1
que e a estimativa (via mnimos quadrados) de menos 1, para garantir que sob H0 : = 0.
O desvio padr
ao pode ser obtido a partir do calculo da variancia amostral
n
1X
t1 ).
S =
( y
T
2
t=1
Cada vers
ao do teste ( , e ) tem sua propria estatstica de teste e portanto tem seu
proprio valor crtico o qual depende do tamanho amostral. Esses valores foram obtidos a
ESTACIONARIAS
CAPITULO 6. SERIES
TEMPORAIS NAO
120
partir e simulac
oes de Monte Carlo.
A tabela a seguir apresenta alguns valores crticos para o teste de Dickey Fuller
Estatstica
1%
2.5%
5%
10%
25
-2.66
-2.26
-1.95
-1.60
50
-2.62
-2.25
-1.95
-1.61
100
-2.60
-2.24
-1.95
-1.61
250
-2.58
-2.23
-1.95
-1.61
500
-2.58
-2.23
-1.95
-1.61
500
-2.58
-2.23
-1.95
-1.61
25
-3.75
-3.33
-3.00
-2.62
50
-3.58
-3.22
-2.93
-2.60
100
-3.51
-3.17
-2.89
-2.58
250
-3.46
-3.14
-2.88
-2.57
500
-3.44
-3.13
-2.87
-2.57
500
-3.43
-3.12
-2.86
-2.57
25
-4.38
-3.95
-3.60
-3.24
50
-4.15
-3.80
-3.50
-3.18
100
-4.04
-3.73
-3.45
-3.15
250
-3.99
-3.69
-3.43
-3.13
500
-3.98
-3.68
-3.42
-3.13
Dickey-Fuller Aumentado
Eliminando tend
encia estoc
astica - Diferen
cas sucessivas
O metodo de diferenciac
ao sucessivas e utilizado para eliminar tendencia estocastica.
Conisdere o Operador Diferen
ca
=1B
(6.6)
Zt = (1 B)Zt
= Zt BZt
= Zt Zt1 .
2 Zt = (1 B)2 Zt
= Zt 2BZt + B 2 Zt
= Zt 2Zt1 + Zt2 .
Na figura a seguir temos uma aplicacao do operador diferenca.
Passeio Aleatrio
10
Passeio Aleatrio
10
20
40
60
80
tempo
100
ESTACIONARIAS
CAPITULO 6. SERIES
TEMPORAIS NAO
122
6.2
Modelagem ARIMA
Quando uma series temporal apresenta tendencia estocatica (nao estacionaria) diz-se que
necess
esta e integrada (I()). E
ario retirar a tendencia para entao analisar o rudo. Esse rudo
nao necess
ariamente e um rudo branco. Pode ser um modelo ARMA, por exemplo. Como
visto anteriormente, a maneira de retirar a tendencia estocastica de uma serie temporal e
diferencindo-
a. Algumas vezes, e necessario diferenciar mais do que uma vez a serie temporal
ate torna-la estacion
aria.
Diz que uma serie sem nenhuma raz unitaria e I(0).
A serie e dita I(1) se for necess
ario diferencia-la uma vez para torna-la estacionaria.
A serie e dita I(d) se for necess
ario diferencia-la d vezez para torna-la estacionaria.
0 10 20 30 40 50 60
Vendas
Na figura 6.7 s
ao apresentados a serie sobre dados de vendas BJsales de Box & Jankins.
50
100
150
0
4
diff(diff(Vendas))
2
0
2
diff(Vendas)
50
100
Time
150
50
100
Time
150
6.3. PREVISAO
6.3
123
Previs
ao
lg
previso
Intervalo a 95 por cento
6,6
6,4
6,2
6
5,8
5,6
5,4
5,2
1955
1956
1957
1958
1959
1960
1961
1962
A ideia da previs
ao e utilizar o conhecimento/observacoes que se tem ate o tempo t,
(digamos que temos observac
oes para uma certa variavel durante os u
ltimos 20 anos e, assim,
t seria o u
ltimo ano observado e , yt2 , yt1 , yt as observacoes). E conveniente definir
Et (ys ) = E(Ys |yt , yt1 , , y2 , y1 ),
como sendo a experanca condicionada em todas as observacoes ate o tempo t. Assim,
Et (ys ) = ys , se s t
Para um exemplo de previs
ao, consideremos o modelo AR(1):
yt+1 = c + yt + t .
Assim,
(6.7)
ESTACIONARIAS
CAPITULO 6. SERIES
TEMPORAIS NAO
124
Assim, yt (h) = Et (yt+h ) representa previsao h-passos a frente, dado que observamos ate o
tempo t.
6.3.1
Erro de previs
ao
O erro de previs
ao e definido como sendo o valor observado menos o valor previsto. Para
um perodo h, et (h) e dado por:
Tomando-se a esperanca do erro de previsao, podemos observar que estes sao nao viesados,
E(et (h)) = 0;
A variancia do erro de previs
ao e dada por:
V ar(et (h)) = V ar h1 t+1 + h2 t+2 + t+h1 + t+h
= 2 2(h1) + 2(h2) + + 2 + 1
Note que a vari
ancia converge para uma constante, quando h , que e
variancia n
ao condicional da serie yt .
2
12
que e a
6.3. PREVISAO
125
Se a distribuic
ao dos resduos t e a Normal, entao o intervalo de confianca para os resduos
e dado portanto
h1
X
1
2
i1 + h y 2 2(h1) + 2(h2) + + 2 + 1
i=1
Medidas de desempenho
Diferentes modelos produzem previsoes distintas, o que torna necessarios avaliar essas
previsoes. Para isso s
ao utilizadas algumas medidas de desempenho. As estatsticas mais
conhecidas s
ao:
1. MSE- Mean Square Error (erro quadratico medio)
s
PH
2
h=1 et (h)
M SEt,H =
Para calcul
a-los, deve-se deixar algumas observacoes fora da amostra. Por exemplo, em
uma serie com n observac
oes , deixa-se as H u
ltimas observacoes fora da amostra e
estima-se o modelo agora com n H observacoes restantes.
2. MAE- Mean Absolute Error (erro absoluto medio)
PH
M AEt,H =
M AP Et,H
H
X
et (h)
=
Hyt+h
h=1
Previs
ao din
amica e est
atica
Quando faz-se previs
oes h passos a frente, yt (h), usando somente a informacao ate o tempo
t, tem-se a previs
ao din
amica cuja variancia acaba sendo maior. Quando, para prever algum
passo a frente usa-se as observac
oes ate o tempo imediatamente anterior, tem-se a previs
ao
estatica. A previs
ao est
atica s
o e u
til para efeito de comparacao de modelos. Na pratica, a
previsao din
amica e a u
nica que interessa de fato.
ESTACIONARIAS
CAPITULO 6. SERIES
TEMPORAIS NAO
126
6.4
Regress
ao Esp
uria - Cointegrac
ao
A utilizac
ao dos modelos de regressao envolvendo series temporais nao estacionarias pode
conduzir ao problema que se convencionou chamar de regressao esp
uria, isto e quando temos
um alto R2 sem uma relac
ao significativa entre as variaveis (Harris, 1995). Assim, na presenca
de raz unit
aria podem-se encontrar relacoes econometricas entre duas variaveis economicas
sem qualquer relac
ao de causalidade entre uma e outra por puro acaso. Por exemplo, a
regressao de uma vari
avel I(1) com outra I(1) obtida independentemente gera alto R2 e estatstica t significante. No entanto o resultado nao tem significado economico.
Fizemos a seguinte esperiencia. Geramos duas series I(1) independentes entre si e regredimos um contra a outra. O resultado segue.
Call:
lm(formula = Y X)
Residuals:
Min 1Q Median 3Q Max
-25.861 -7.875 0.179 6.713 30.970
Coefficients:
Estimate Std. Error t value Pr(t)
(Intercept) -6.971267 0.538128 -12.96 2e-16 ***
X 0.527969 0.005861 90.08 2e-16 ***
ESPURIA
6.4. REGRESSAO
- COINTEGRAC
AO
127
20
40
60
80
500
1000
1500
2000
2500
tempo
A interpretac
ao econ
omica da cointegracao e que se duas (ou mais) variaveis possuem
uma relac
ao de equilbrio de longo prazo, entao mesmo que as series possam conter tendencias
estocasticas (isto e, serem n
ao estacionarias), elas irao mover-se juntas no tempo e a diferenca
entre elas ser
a est
avel (isto e, estacionaria). Em suma, o conceito de cointegracao indica
a existencia de um equilbrio de longo prazo, para o qual o sistema economico converge no
tempo (Harris, 1995).
6.4.1
Quando
e possvel regredir duas s
eries I(1)
ESTACIONARIAS
CAPITULO 6. SERIES
TEMPORAIS NAO
128
6.5
Exerccios
Exemplo 6.1. Para este exerccio consideremos uma serie temporal de taxa de c
ambio da
It
alia (EXRIT L). Foram realizados testes de raz unit
aria para a serie EXRIT L e para a
sua primeira diferenca d EXRIT L.
Teste Aumentado de Dickey-Fuller para EXRITL
incluindo 5 defasagens de (1-L)EXRITL
dimens
ao de amostragem 196
hip
otese nula de raiz unit
aria: a = 1
teste com constante
modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e
coeficiente de 1a ordem para e: -0,002
diferencas defasadas: F(5, 189) = 5,488 [0,0001]
valor estimado de (a - 1): -0,00802367
estatstica de teste: c (1) = -1,46078
p-valor assint
otico 0,5537
com constante e tendencia
modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e
coeficiente de 1a ordem para e: -0,003
diferencas defasadas: F(5, 188) = 5,557 [0,0001]
valor estimado de (a - 1): -0,0140724
estatstica de teste: ct (1) = -1,4575
p-valor assint
otico 0,8439
a) O que podemos afirmar a respeito da tendencia da serie EXRIT L? Use os resultados dos
testes de hip
oteses para justificar a sua resposta.
b) O que podemos afirmar a respeito da tendencia da primeira diferenca da serie EXRIT L?
Use os resultados dos testes de hip
oteses para justificar a sua resposta.
c) Dos gr
aficos apresentados na figura 6.10, qual(is) pode(m) representar a serie EXRIT L?
E qual(is) pode(m) representar a primeira diferenca da serie EXRIT L? Explique.
d) Na figura 6.11 qual(is) dos gr
aficos de FAC e FACP pode(m) corresponder `
a FAC e FACP
de um rudo branco? Justifique.
e) Na figura 6.11 qual(is) dos gr
aficos de FAC e FACP pode(m) corresponder `
a FAC e FACP
de um rudo branco? Justifique.
f ) Na figura 6.11 qual(is) dos gr
aficos de FAC e FACP pode(m) corresponder `
a FAC e FACP
da Serie EXRIT L? Justifique.
6.5. EXERCICIOS
129
7.8
7.6
3
7.4
2
7.2
S2
-1
6.8
-2
6.6
-3
6.4
-4
-5
6.2
1974
1976
1978
1980
1982
1984
1986
1988
1990
1974
1976
1978
(a) Serie S1
1980
1982
1984
1986
1988
(b) Serie S2
150
100
50
S3
S1
-50
-100
-150
1974
1976
1978
1980
1982
1984
1986
1988
1990
(c) Serie S3
ACF para X1
ACF para X2
0,2
0,15
0,1
0,05
0
-0,05
-0,1
-0,15
-0,2
+- 1,96/T0,5
10
15
+- 1,96/T0,5
0,3
0,2
0,1
0
-0,1
-0,2
-0,3
20
10
defasagem
PACF para X1
+- 1,96/T0,5
20
PACF para X2
0,2
0,15
0,1
0,05
0
-0,05
-0,1
-0,15
-0,2
0
15
defasagem
10
15
+- 1,96/T0,5
0,3
0,2
0,1
0
-0,1
-0,2
-0,3
20
10
defasagem
15
20
defasagem
+- 1,96/T ,5
0,5
0
-0,5
-1
0
10
defasagem
15
20
PACF para X3
1
+- 1,96/T0,5
0,5
0
-0,5
-1
0
10
15
20
defasagem
1990
ESTACIONARIAS
CAPITULO 6. SERIES
TEMPORAIS NAO
130
ACF para Z2
0.2
0.15
0.1
0.05
0
-0.05
-0.1
-0.15
-0.2
+- 1.96/T0.5
0.4
0.2
0
-0.2
-0.4
0
10
15
20
+- 1.96/T0.5
10
defasagem
PACF para dY11
0.4
0.2
0
-0.2
-0.4
5
10
20
PACF para Z2
0.2
0.15
0.1
0.05
0
-0.05
-0.1
-0.15
-0.2
+- 1.96/T0.5
15
defasagem
15
20
+- 1.96/T0.5
10
defasagem
15
20
defasagem
ACF para Z3
0
0.4
0.3
0.2
0.1
0
-0.1
-0.2
-0.3
-0.4
+- 1.96/T .5
10
15
20
defasagem
PACF para Z3
+- 1.96/T0.5
0.4
0.3
0.2
0.1
0
-0.1
-0.2
-0.3
-0.4
0
10
15
20
defasagem
Figura 6.12: FAC e FACP dos resduos do ajuste de tres modelos a serie EXRIT L.
6.5. EXERCICIOS
Def
1
2
3
4
5
6
7
8
9
10
ACF
-0.483
-0.079
0.089
-0.029
0.044
-0.095
0.072
-0.002
-0.108
0.167
***
**
131
Teste 1
PACF
-0.483
***
-0.408
***
-0.254
***
-0.216
***
-0.098
-0.189
***
-0.121
*
-0.100
-0.249
***
-0.090
Teste 2
[p-valor]
ACF LJUNG-BOX
PACF
Tabela
6.1: Teste
[0.00]
-0.406
***
-0.406
Q-stat
47.49
48.77
50.40
50.58
50.98
52.87
53.99
53.99
56.49
62.44
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
Coeficiente
const
1
1
0.00586445
0.350312
1.00000
M
edia var. dependente
M
edia de inovac
oes
Log da verossimilhanca
Crit
erio de Schwarz
0.044
0.016
0.030
0.008
-0.020
0.027
0.045
-0.096
0.122
-0.145
-0.026
0.042
0.052
0.008
0.023
0.075
-0.056
0.073
Erro Padr
ao
0.0315017
0.0665472
0.0124930
0.303518
0.280781
990.5755
2002.324
Q-stat
31.42
31.79
31.85
32.03
32.04
32.12
32.27
32.68
34.52
37.54
***
**
p-valor
0.1862
5.2641
80.0449
0.8523
0.0000
0.0000
[p-valor]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
ACF
-0.031
-0.121
0.089
0.038
0.066
0.034
0.053
-0.031
0.043
0.048
Teste 3
PACF
Q-stat
-0.031
0.19
-0.122
*
3.22
0.082
4.88
0.029
5.19
0.091
6.12
0.040
6.37
0.070
6.96
-0.035
7.18
0.045
7.58
0.023
8.09
60.82785
34.59412
1989.151
1994.482
436
437
438
439
440
yt
9.88
10.42
11.08
8.12
11.71
ebt
-0.21
0.40
1.33
-1.30
0.38
446
447
448
449
450
yt
9.79
10.22
7.43
12.41
8.35
ebt
-0.52
0.21
-2.34
0.87
-0.60
[p-va
[0.6
[0.1
[0.1
[0.2
[0.2
[0.3
[0.4
[0.5
[0.5
[0.6
ESTACIONARIAS
CAPITULO 6. SERIES
TEMPORAIS NAO
132
Exemplo 6.4. Escreva cada um dos seguintes processos usando o operador de defasagem B.
(a) Xt = 0.3Xt1 + at ;
(b) Xt =
Pt
j=1 at ,
t 1;
446
447
448
449
450
yt
12.16
11.69
11.56
10.32
10.87
ebt
0.56
-0.07
0.19
-0.75
0.62
Exemplo 6.6. Considere o modelo autorregressivo de primeira ordem, AR(1), definido por
Yt = a + bYt1 + ut ,
em que a e b s
ao par
ametros e ut e uma seq
uencia de vari
aveis aleat
orias independentes e
igualmente distribudas, com media nula e vari
ancia 2 . Suponha que |b| < 1. A previs
ao n
passos-`
a-frente para a vari
avel Y convergir
a para
6.5. EXERCICIOS
133
(a) a.
(b) a media de ut .
(c)
a
1b .
(d) E(Yt ).
(e) .
a2 = 4.
Exemplo 6.8. Explique os passos que devem ser seguidos para a modelagem de uma serie
temporal na metodologia ARIMA. Considere a possibilidade de n
ao-estacionariedade da serie.
ESTACIONARIAS
CAPITULO 6. SERIES
TEMPORAIS NAO
134
t
436
437
438
439
440
yt
20.52
20.04
20.52
19.64
16.13
ebt
-0.092
-1.29
1.27
-1.66
-2.33
436
437
438
439
440
yt
782.78
803.30
823.34
843.86
863.50
ebt
1.34
-0.08
-1.30
1.26
-1.65
b0
b1
Estimativa
dp()
0.162
0.435
0.099
0.025
Sabendo-se que n = 777, faca o teste DF e responda se a serie inf apresenta raiz unit
aria.
Nota: A tabela com os valores crticos para o teste de DF se encontra no final da lista. Note
que se refere ao modelo sem constante, ao modelo com constante e ao modelo com
tendencia.
6.5. EXERCICIOS
135
Exemplo 6.13. Utilizando os dados anuais (1959-1995) de log(P IB) norte americano, a
seguinte regress
ao foi proposta: log(P IB)t = 0 + 1 t + 2 log(P IB)t1 + 3 log(P IB)t1 +
ut . As estimativas seguem abaixo:
b0
b1
b2
b3
Estimativa
dp()
1.650
0.670
0.0059
0.003
-0.320
0.087
0.264
0.126
n = 35
(a) Faca o teste ADF e responda se a serie inf apresenta raiz unit
aria.
(b) A inclus
ao da vari
avel log(P IB)t1 no modelo acima parece ser necess
aria? Justifique.
b0
b1
b2
Estimativa
dp()
1.360
0.517
-0.310
0.103
0.138
0.126
n = 47
(a) Faca o teste ADF e responda se a serie inf apresenta raiz unit
aria.
(b) A inclus
ao da vari
avel inft1 no modelo acima parece ser necess
aria? Justifique.
ESTACIONARIAS
CAPITULO 6. SERIES
TEMPORAIS NAO
136
(e) O processo pode ser escrito em uma forma alternativa como yt = yt1 + t em que
= 1 1 e yt = yt yt1 . V
6.5. EXERCICIOS
137
Exemplo 6.20. Sejam Yt e Xt duas series temporais. Considere os resultados dos seguintes
modelos de regress
ao estimados por mnimos quadrados ordin
arios (MQO):
Yt = 4, 8788 0, 1512Yt1
(1,70)
t = 0, 1094 0, 1807Xt1 .
X
(1,97)
(1,26)
(1,97)
et = 0, 0730 0, 4157et1
(0,06)
(3,43)
(2,21)
ESTACIONARIAS
CAPITULO 6. SERIES
TEMPORAIS NAO
138
Os n
umeros entre parenteses s
ao os valores do teste t de signific
ancia individual dos
par
ametros. Dado que o valor crtico a 5% da estatstica de Dickey-Fuller e -2,938, e correto
afirmar que:
(a) Yt e Xt s
ao series temporais integradas de ordem 1.
(b) A regress
ao de Yt em Xt e esp
uria.
(c) A hip
otese de cointegrac
ao entre Yt e Xt e rejeitada pois os resduos da regress
ao de Yt
em Xt s
ao n
ao-estacion
arios.
(d) Para que duas vari
aveis sejam cointegradas e necess
ario que ambas tenham a mesma
ordem de integrac
ao.
(e) A rejeic
ao da hip
otese nula do teste Dickey-Fuller implica que a vari
avel em quest
ao e
n
ao-estacion
aria.