Вы находитесь на странице: 1из 144

i

Apostila

ECONOMETRIA

MAT02208

Marcio Valk

Porto Alegre
2014

ii

Sum
ario

1 Revis
ao

1.1

Introduc
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2

Vari
avel Aleat
oria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2.1

Distribuic
ao de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . .

1.2.2

A Distribuic
ao de Probabilidade Normal e as Distribuicoes Relacionadas

Propriedades de Vari
aveis Aleatorias . . . . . . . . . . . . . . . . . . . . . . . .

1.3.1

Media, Valor Esperado ou Esperanca Matematica . . . . . . . . . . . . .

1.3.2

Vari
ancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.3.3

Covari
ancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.3.4

Correlac
ao

1.3.5

Propriedades dos Estimadores . . . . . . . . . . . . . . . . . . . . . . . . 14

1.3.6

Vcio/Vies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.3.7

Consistencia

1.3.8

Eficiencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.3.9

Erro Quadr
atico Medio (EQM) . . . . . . . . . . . . . . . . . . . . . . . 15

1.3

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.3.10 Vcio versus Vari


ancia Mnima . . . . . . . . . . . . . . . . . . . . . . . 15
1.4

Metodo de Mnimos Quadrados (MQO) . . . . . . . . . . . . . . . . . . . . . . 15


1.4.1

Regress
ao Liner M
ultipla (RML) . . . . . . . . . . . . . . . . . . . . . . 17

1.4.2

Hip
oteses do modelo de regressao . . . . . . . . . . . . . . . . . . . . . . 17

1.4.3

O Coeficiente de Determinacao: RLS . . . . . . . . . . . . . . . . . . . . 20

1.4.4

Testes de Hip
oteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

1.5

Formas Funcionais Logartmicas . . . . . . . . . . . . . . . . . . . . . . . . . . 23

1.6

Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2 Modelos com Vari


aveis Instrumentais (VI)
2.1

29

Vari
aveis Instrumentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.1.1

Conceito da exogeneidade dos regressores . . . . . . . . . . . . . . . . . 29

2.1.2

Vari
avel proxy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.1.3

Vari
avel Omitida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.1.4

Erros de Mensurac
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
iii


SUMARIO

iv
2.1.5

Caractersticas de um bom Instrumento . . . . . . . . . . . . . . . . . . 33

2.1.6

Diferenca entre Proxy e VI . . . . . . . . . . . . . . . . . . . . . . . . . 34

2.1.7

O Metodo de Estimacao VI . . . . . . . . . . . . . . . . . . . . . . . . . 34

2.1.8

VI em Modelos de Regressao M
ultipla . . . . . . . . . . . . . . . . . . . 37

2.1.9

O Estimador VI como Mnimos Quadrados em Dois Estagios (MQ2E) . 38

2.1.10 Testes de Endogeneidade . . . . . . . . . . . . . . . . . . . . . . . . . . 40


2.2

Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3 Equa
c
oes Simult
aneas
3.1

3.2

Equac
oes de Oferta e Demanda . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.1.1

Exemplos de Equacoes de Oferta e Demanda . . . . . . . . . . . . . . . 45

3.1.2

Mnimos Quadrados Indiretos (MQI) . . . . . . . . . . . . . . . . . . . . 48

3.1.3

O Problema da Identificacao . . . . . . . . . . . . . . . . . . . . . . . . 50

3.1.4

N
ao Identificada ou Subidentificada . . . . . . . . . . . . . . . . . . . . 50

3.1.5

Exatamente Identificada . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

3.1.6

Sobreidentificada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

3.1.7

Condic
ao de Ordem para Identificacao . . . . . . . . . . . . . . . . . . . 52

3.1.8

Condic
ao de Posto (Rank Condition) . . . . . . . . . . . . . . . . . . 53

Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4 S
eries Temporais no Contexto de Regress
ao
4.1

4.2

4.1.1

Exemplos de Series Temporais . . . . . . . . . . . . . . . . . . . . . . . 60

4.1.2

Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

Series Temporais: Definic


ao Formal . . . . . . . . . . . . . . . . . . . . . . . . . 61

4.5

Processos Estoc
asticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

Medias e Covari
ancias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.3.1

4.4

59

Introduc
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4.2.1
4.3

45

Propriedades Importantes . . . . . . . . . . . . . . . . . . . . . . . . . . 62

Regress
ao com dados de Series Temporais . . . . . . . . . . . . . . . . . . . . . 63
4.4.1

Diferenca entre Dados de Series Temporais e Dados de Corte Transversal 63

4.4.2

Modelos de Regress
ao de Series Temporais . . . . . . . . . . . . . . . . . 63

Suposic
oes para Modelos com Series Temporais . . . . . . . . . . . . . . . . . . 65
4.5.1

Inexistencia de Vies do MQO . . . . . . . . . . . . . . . . . . . . . . . . 65

4.5.2

Vari
ancia dos Estimadores MQO . . . . . . . . . . . . . . . . . . . . . . 67

4.5.3

Inferencia sob as Hipoteses do Modelo Linear Classico . . . . . . . . . . 67

4.5.4

Tendencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

4.5.5

Sazonalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

4.5.6

Processos de covariancia estacionaria . . . . . . . . . . . . . . . . . . . 71


SUMARIO
4.5.7
4.6

v
Processos Fracamente Dependente . . . . . . . . . . . . . . . . . . . . . 71

Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

5 S
eries Temporais e Econometria
5.1

79

Series Temporais: Definic


ao Formal . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.1.1

Processos Estoc
asticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

5.2

Medias e Covari
ancias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

5.3

Estacionariedade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

5.4

5.5

5.3.1

Estacionariedade estrita . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

5.3.2

Fracamente estacionario ou estacionariedade de segunda ordem . . . . . 83

5.3.3

Teste para Signific


ancia das Autocorrelacoes . . . . . . . . . . . . . . . . 83

5.3.4

Func
ao de autocorrelacao Parcial (FACP) . . . . . . . . . . . . . . . . . 84

5.3.5

Operador de Defasagem ou Operador lag . . . . . . . . . . . . . . . . . 85

5.3.6

Rudo Branco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

Metodologia de Box-Jenkins - Modelagem ARMA . . . . . . . . . . . . . . . . . 89


5.4.1

Modelo Autorregressivo de Ordem 1 AR(1) . . . . . . . . . . . . . . . . 89

5.4.2

Passeio Aleat
orio (Random Walk) . . . . . . . . . . . . . . . . . . . . . 91

5.4.3

Modelos Autorregressivos de Ordem p, AR(p) . . . . . . . . . . . . . . . 93

5.4.4

Modelo Medias-M
oveis (MA(q)) . . . . . . . . . . . . . . . . . . . . . . 97

5.4.5

O modelo MA(1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

5.4.6

O modelo MA(q) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

5.4.7

Modelo ARMA(p,q) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

5.4.8

Causalidade, Invertibilidade e Estacionariedade . . . . . . . . . . . . . . 104

Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

6 S
eries Temporais N
ao Estacion
arias
6.0.1
6.1

113

Como lidar com tentencia determinstica . . . . . . . . . . . . . . . . . . 114

Testes de raz unit


aria - Identificando tendencia estocastica . . . . . . . . . . . 118
6.1.1

Teste de Dickey Fuller (DF) . . . . . . . . . . . . . . . . . . . . . . . . . 118

6.1.2

Dickey-Fuller Aumentado . . . . . . . . . . . . . . . . . . . . . . . . . . 120

6.1.3

Eliminando tendencia estocastica - Diferencas sucessivas . . . . . . . . . 120

6.2

Modelagem ARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

6.3

Previs
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
6.3.1

6.4

Regress
ao Esp
uria - Cointegracao . . . . . . . . . . . . . . . . . . . . . . . . . . 126
6.4.1

6.5

Erro de previs
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
Quando e possvel regredir duas series I(1) . . . . . . . . . . . . . . . . . 127

Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

vi

SUMARIO

Captulo 1

Revis
ao
1.1

Introduc
ao

Para iniciar qualquer curso em que sao utilizadas tecnicas estatsticas, e necessario esclarecer/fundamentar bem o conceito de aleatoriedade.
Na hist
oria antiga, os conceitos de chance e de aleatoriedade eram interligados ao conceito que era atribudo a destino. V
arias pessoas da antig
uidade jogavam dados para determinarem o destino, e posteriormente isso se desenvolveu em jogos de azar. A maioria das
culturas usaram v
arios metodos de adivinhac
oes para tentarem contornar a aleatoriedade e o
destino, ou mesmo a dita sorte. A palavra aleatoriedade e utilizada para exprimir quebra de
ordem, prop
osito, causa, ou imprevisibilidade em uma terminologia n
ao cientfica. Um processo aleat
orio e o processo repetitivo cujo resultado n
ao descreve um padr
ao determinstico,
mas segue uma distribuic
ao de probabilidade. (Wikipedia).

Figura 1.1:

As tecnicas estatsticas surgem para encontrar algum padr


ao de variac
ao. Para tal tarefa


CAPITULO 1. REVISAO

e necessario formalizar e definir alguns conceitos, como sao os casos de variavel aleatoria e
distribuic
ao de probabilidade.

1.2

Vari
avel Aleat
oria

Denomina-se vari
avel uma propriedade (caracterstica) qualquer das unidades da populacao para a qual foi definida uma unidade de medida, que pode ser quantitativa ou qualitativa.
Observe que essa caracterstica e comum a todos os indivduos e portanto e uma caracterstica
da populac
ao. Em geral, queremos fazer afirmacoes sobre caractersticas e temos apenas
informacoes de alguns indivduos (amostra). Assim, toda afirmacao feita a partir de uma
amostra e passvel de erros, ou seja, e uma aproximacao. Alem disso, em alguns casos nao e
possvel medir toda a populac
ao e devemos pensar nessa caracterstica como uma quantidade
aleatoria. Para isso, e necess
ario introduzirmos o conceito de vari
avel aleat
oria.
Defini
c
ao 1.2.1. Espaco amostral de um experimento aleat
orio (fen
omeno que, mesmo repetidos v
arias vezes sob condic
oes semelhantes, apresentam resultados imprevisveis) e o conjunto
de todos os resultados possveis do experimento. Aqui ser
a denotado por ,
Exemplo 1.1. No seguinte experimento: lancar uma moeda e verificar a face voltada para
cima, o espaco amostral e o conjunto {cara,coroa}.
Exemplo 1.2. Se o experimento e lancar um dado de seis faces, o espaco amostral e {1,2,3,4,5,6}.
Todo subconjunto de um espaco amostral e chamado evento. Os subconjuntos de um
espaco amostral contendo apenas um elemento sao chamados de eventos elementares.
Podem existir dois ou mais espacos amostrais possveis. Por exemplo, lancar o dado de
seis faces e verificar se a face superior. Uma possibilidade seria verificar se a face e mpar
e, a outra possibilidade, poderia ser verificar se a face e superior a 3. Um espaco amostral
descrevendo cada resultado do dado individualmente pode ser construdo atraves do produto
cartesiano dos dois espacos amostrais citados. Neste caso, um evento elementar poderia ser
{5}, que e mpar e superior a 3.
Espacos amostrais s
ao importantes na definicao de um espaco de probabilidade (, F, P)
que e definido pelo espaco amostral , por um conjunto de eventos de interesse com certas
propriedades, denotada por a -algebra F, e uma medida de probabilidade P : [0, 1],
que e uma func
ao de em [0, 1].
Uma vari
avel aleat
oria e uma funcao do espaco amostral nos reais, para a qual e possvel
calcular a probabilidade de ocorrencia de seus valores. Em geral, as variaveis aleatorias s
ao
representadas por letras mai
usculas do fim do alfabeto. Temos, para cada elemento ,
um n
umero real X() conforme figura.
Garantimos o c
alculo de probabilidades com variaveis aleatorias ao exigir que, para qualquer I R, o conjunto X 1 (I) seja um evento. Em outras palavras, o conjunto X 1 (I) e

1.2. VARIAVEL
ALEATORIA

um elemento da -
algebra F, ou seja, X 1 (I) F. Lembremos que apenas os elementos
de F tem atribuic
ao de probabilidade. em linguagem matematica mais formal, dizemos que
variavel aleat
oria e qualquer func
ao mensuravel em F. Isto justifica dizer que a variavel X e
F mensuravel. Com frequencia, faz-se mencao ao espaco de probabilidade (, F, P), para
deixar claro o espaco amostral, a -algebra e a probabilidade envolvida. De fato, bastaria
indicar (, F), se ficasse subentendido que as probabilidades aplicadas a X precisam ser aquelas aplicadas aos correspondentes eventos de F por alguma probabilidade P. Formalmente,
definimos
Defini
c
ao 1.2.2. Seja (, F, P) um espaco de probabilidade. Denominamos de vari
avel
aleat
oria, qualquer func
ao X : R tal que
X 1 (I) = { : X() I} F,
para todo intervalo I R. Em palavras, X e tal que sua imagem inversa de intervalos I R
pertencem a -
algebra F.

Figura 1.2: Variavel aleatoria

Defini
c
ao 1.2.3. Vari
avel Aleat
oria Discreta. Se o conjunto dos possveis valores da
vari
avel e finito ou enumer
avel (infinito, porem cont
avel).
Exemplo 1.3. {1, 2, 3, 4, 5, 6}, N, Z, . . .
Defini
c
ao 1.2.4. Vari
avel Aleat
oria Contnua Se o conjunto dos possveis valores da
vari
avel n
ao e enumer
avel.
Exemplo 1.4. O intervalo [0,1], R, Q.


CAPITULO 1. REVISAO

Na pr
atica, e comum a utilizac
ao da variaveis aleatorias contnuas pois e simples trata-las
matematicamente. Quando, por exemplo, falamos que a renda e uma v. a. contnua (na
verdade ela e discreta) e pela conveniencia da aproximacao.
1.2.1

Distribui
c
ao de Probabilidade

A func
ao que descreve as probabilidades da variavel aleatoria X assumir os diferentes
valores do espaco amostral e chamada de funcao massa de probabilidade no caso de variaveis
aleatorias discretas, e func
ao de densidade de probabilidade (denotado como f.d.p.) para
variaveis aleat
orias contnuas. Para que uma funcao qualquer f seja uma densidade de probabilidade e necess
ario que
f (x) 0 x R,
Z
f (x)dx =
f (x)dx = 1.

Z
R

(1.1)

Geralmente, para uma vari


avel aleatoria contnua, a ocorrencia de qualquer exato valor
de X pode ser vista como tendo probabilidade zero. Assim, probabilidades sao discutidas em
termos de alguns intervalo. Essas probabilidades sao obtidas por meio de integracao de f (x)
no intervalo especificado. Por exemplo, P (a X b) e dada por
b

Z
P (a X b) =

f (x)dx.
a

A probabilidade de que a vari


avel aleatoria X assuma valores inferiores ou igual ao n
umero
c e geralmente escrita como F (c) = P (X c). A funcao F (x) representa, para diferentes
valores de x, a probabilidade acumulada e, portanto, e chamada de funcao de distribuic
ao
acumulada (denotada por f.d.a.), ou somente funcao de distribuicao. Logo,
Z

F (c) = P (X c) =

f (x)dx.

Distribui
c
oes conjunta, marginal e condicional
Geralmente estamos interessados nao apenas numa variavel aleatoria mas na relacao entre
algumas vari
aveis aleat
orias. Suponha que temos duas variaveis aleatorias, X e Y . Agora
temos que considerar:
1. A f.d.p. conjunta: f (x, y).
2. As f.d.p.s marginais: f (x) e f (y). Para se obter uma das marginais a partir da conjunta,
basta integrar a conjunta com relacao a outra variavel,

1.2. VARIAVEL
ALEATORIA

Z
f (x) =

Z
f (x, y)dy e f (y) =

f (x, y)dx.
R

3. As f.d.p.s condicionais:
(a) f (x|y), que e a distribuic
ao de X dado Y = y.
(b) f (y|x), que e a distribuic
ao de Y dado X = x.
A densidade conjunta pode ser escrita como o produto das densidades marginal e condicional. Assim
f (x, y) = f (x)f (y|x)
= f (y)f (x|y).
Se f (x, y) = f (x)f (y) para todo x e y, entao x e y sao chamados de independentes. Note que,
se eles sao independentes,
f (x|y) = f (x)

f (y|x) = f (y),

isto e, as distribuic
oes condicionais sao as mesmas que as marginais. Intuitivamente isso faz
sentido uma vez que, para X, o fato de Y ser ou nao fixado em um certo nvel e irrelevante.
De maneira similar, para Y deve ser irrelevante o nvel no qual X e fixado.
1.2.2

A Distribui
c
ao de Probabilidade Normal e as Distribui
c
oes Relacionadas

Se tivermos a distribuic
ao de probabilidade de uma variavel aleatoria X, poderemos determinar a probabilidade de X estar no intervalo (a, b). Existem algumas distribuicoes de
probabilidade cujas probabilidades sao tabuladas e que sao consideradas descricoes cabveis
para uma grande variedade de fen
omenos. Sao estas a distribuicao normal e as distribuic
oes
2 , t e F , as quais discutiremos juntamente com as distribuicoes lognormal e normal bivariada. Existem tambem outras distribuicoes, como as distribuicoes gama e beta, para as quais
tabelas extensivas est
ao disponveis. Na verdade, a distribuicao 2 e um caso particular da
distribuic
ao gama, e as distribuic
oes t e F sao casos particulares da distribuicao beta. N
ao
precisamos aqui de todas as relac
oes.
Pode-se perguntar se a distribuic
ao normal e apropriada para descrever variaveis economicas.
Contudo, mesmo que as vari
aveis nao sejam normalmente distribudas, pode-se considerar
transformac
oes de vari
aveis que facam com que as variaveis transformadas se tornem normalmente distribudas.


CAPITULO 1. REVISAO

6
A Distribui
c
ao Normal

A distribuic
ao normal, que possui forma de sino, e a distribuicao mais amplamente usada
em aplicac
oes estatsticas numa grande variedade de areas. Sua funcao de densidade de
probabilidade e dada por


1
1
2
f (x) = exp 2 (x )
2
2

< x < +.

Sua media e e sua vari


ancia, 2 , que sao tambem chamados, respectivamente, parametros
de locacao e escala. Se x possui distribuicao normal com media e variancia 2 , escrevemos
compactamente que x N (, 2 ).
Figura 1.3: Func
ao densidade Normal com diferentes parametros de locacao e escala.

Locao

Escala

0.4

0.4
=3

=3

=0

0.35

0.35

0.3

0.3

0.25

0.25

0.2

0.2

0.15

0.15

0.1

0.1

0.05

0.05

0
6

2 =1

2=2.25

2=4

0
10

10

Se = 0 e = 1, a distribuic
ao e chamada de distribuicao normal padrao e a func
ao
de densidade de probabilidade reduz-se a,


1
f (x) = e
2

x2

Uma propriedade importante da distribuicao normal e que qualquer funcao linear de


variaveis normalmente distribudas tambem e normalmente distribuda. Isso e verdade se
as variaveis s
ao independentes ou correlatas. Se
x1 N (1 , 12 )

x2 N (2 , 22 )

1.2. VARIAVEL
ALEATORIA

e a correlac
ao entre x1 e x2 e , ent
ao
a1 x1 + a2 x2 N (a1 1 + a2 2 , a21 12 + a22 22 + 2a1 a2 1 2 ).
Em particular,
x1 + x2 N (1 + 2 , 12 + 22 + 21 2 )
e
x1 x2 N (1 2 , 12 + 22 21 2 ).
Distribui
c
oes Relacionadas
Alem da distribuic
ao normal, h
a outras distribuicoes de probabilidade que usaremos com
frequencia. S
ao as distribuic
oes 2 , t e F , tabuladas no apendice. Estas distribuicoes s
ao
derivadas da distribuic
ao normal e definidas como descrito a seguir.
Distribui
c
ao 2
Se x1 , x2 , . . . , xn s
ao vari
aveis normais independentes com media zero e variancia 1, isto
e, xi IN (0, 1), i = 1, 2, . . . , n, ent
ao dizemos que
Z=

x2i

tem distribuic
ao 2 com n graus de liberdade (g.l.), e escrevemos isso como Z 2n . O
subscrito n denota os g.l. A distribuicao 2n e a distribuicao da soma dos quadrados de n
variaveis normais padronizadas independentes.
Se xi IN (0, 2 ), ent
ao Z deve ser definido por
Z=

X x2
i

A distribuic
ao 2 tambem tem uma propriedade de adicao, embora esta seja diferente da
propriedade da distribuic
ao normal e muito mais restritiva. A propriedade e:
Se Z1 2n e Z2 2m e Z1 e Z2 sao independentes, entao Z1 + Z2 2n+m .
Note que precisamos de independencia e apenas podemos considerar adicoes simples, e n
ao
quaisquer combinac
oes lineares. Ate essa propriedade limitada e u
til em aplicacoes praticas.
Existem muitas distribuic
oes para as quais mesmo esta propriedade limitada nao e valida.
Distribui
c
ao t
p
Se xi N (0, 1) e y 2n , e x e y sao independentes, Z = x/ y/n possui a distribuic
ao
t com n g.l. Escrevemos isso como Z tn . O subscrito n novamente denota os g.l.Assim, a
distribuic
ao t e a distribuic
ao de uma variavel normal padronizada dividida pela raiz quadrada


CAPITULO 1. REVISAO

de uma vari
avel media independente com distribuicao x2 (a variavel 2n dividida pelos seus
graus de liberdade). A distribuic
ao t e uma distribuicao de probabilidade simetrica tal qual
a distribuic
ao normal, embora seja mais achatada do que a normal e possua caudas longas.
Quando n g.l. aproxima-se de infinito, a distribuicao t aproxima-se da distribuicao normal.
Distribui
c
ao F
Se y1 2n1 e y2 2n2 e y1 e y2 sao independentes, Z = (y1 /n1 )/(y2 /n2 ) possui distribuicao F com n1 e n2 g.l. Escrevemos isso como
Z Fn1 ,n2 .
O primeiro subscrito n1 , refere-se aos g.l. do numerador, e o segundo subscrito, n2 , refere-se
aos g.l. do denominador. A distribuicao F e, portanto, a distribuicao da razao entre duas
variaveis independentes medias com distribuicao 2 .
Figura 1.4: Func
ao densidade 2 , t-Student e F-Snedecor. Em parenteses os graus de liberdade.

0.25

0.4

0.9
0.35
0.2

0.8
0.3
0.7
0.25

0.15

0.6

0.2

0.5

0.1

0.4
0.15
0.3
0.1

0.05

0.2
0.05
0.1

1.3

1.3.1

10

15

0
5

Propriedades de Vari
aveis Aleat
orias

M
edia, Valor Esperado ou Esperan
ca Matem
atica

Defini
c
ao 1.3.1. M
edia, valor esperado ou esperan
ca matem
atica de vari
aveis
aleat
orias discretas. Supomos que X pode assumir n valores diferentes x1 , x2 , . . ., xn

1.3. PROPRIEDADES DE VARIAVEIS


ALEATORIAS

e que a probabilidade de xi e pi , para i {1, 2, . . . , n}. Ent


ao
E(X) = x1 p1 + x2 p2 + + xn pn =

n
X

xi pi .

i=1

Exemplo 1.5. Seja X o valor da face superior obtida no lancamento de um dado. Se o dado
n
ao e viesado, temos P (X = 1) = P (X = 2) = P (X = 3) = P (X = 4) = P (X = 5) =
P (X = 6) = 61 , ou seja p1 = p2 = p3 = p4 = p5 = p6 = 16 .
E(X) =

6
X
i=1

=
=

1
1
1
1
1
1
pi xi = .1 + .2 + .3 + .4 + .5 + .6
6
6
6
6
6
6

1 6(6 + 1)
1
(1 + 2 + 3 + 4 + 5 + 6) = .
6
6
2
21
7
= = 3, 5.
6
2

Defini
c
ao 1.3.2. Valor Esperado de g(X). Seja g(X) uma func
ao de X. Est
ao E(g(x))
e dado por
E(g(x)) = g(x1 )p1 + + g(xn )pn =

n
X

g(xi )pi .

i=1

Exemplo 1.6. Para o Exemplo considere g(X) = X 2 .


2

E(X ) =

6
X
i=1

=
=

1
1
1
1
1
1
pi x2i = .1 + .4 + .9 + .16 + .25 + .36
6
6
6
6
6
6

1
1 6(6 + 1)(12 + 1)
(1 + 4 + 9 + 16 + 25 + 36) = .
6
6
6
91
= 15, 16666.
6

Defini
c
ao 1.3.3. Valor esperado de vari
aveis aleat
orias contnuas.
Supondo que X tem func
ao densidade de probabilidade f , a esperanca de X e definida por
Z

E[X] =

xf (x)dx.

O valor esperado de uma func


ao qualquer g(X) e definido por
Z

E[g(X)] =

g(x)f (x)dx.

Exemplo 1.7. Se X N (, 2 ), ent


ao E[X] = .


CAPITULO 1. REVISAO

10
Propriedades da Esperan
ca

Nas seguintes propriedades, X, Y sao variaveis aleatorias, a, b, c sao constantes.


E1)

E(a) = a;

E2)

E(a + X) = a + E(X);

E3)

E(bX) = bE(X);

E4)

E(a + bX) = a + bE(X);

E5)

E(X + Y ) = E(X) + E(Y );

E6)

E(a + bX + cY ) = a + bE(X) + cE(Y );

Estas propriedades podem ser generalizadas para qualquer n


umero de variaveis aleatorias.
O valor esperado de uma combinacao linear de variavel aleatoria/variaveis aleatorias e a
combinac
ao linear dos seus valores esperados:
E7)

E[aX + bY ] = aE[X] + bE[Y ];

Por esse motivo, a func


ao E[] que associa a cada variavel aleatoria o seu valor esperado e
um operador linear, chamado de operador esperanca.
No caso geral, temos que
E[XY ] 6= E[X]E[Y ].
No caso particular de X e Y serem vari
aveis aleat
orias independentes, temos que:
E[XY ] = E[X]E[Y ].

Estimador da M
edia
Dada uma amostra x1 , x2 , . . . , xn , o estimador da media e definido como
n

X=

1X
xi .
n
i=1

(1.2)

1.3. PROPRIEDADES DE VARIAVEIS


ALEATORIAS
1.3.2

11

Vari
ancia

Se = E(X) e o valor esperado (media) da variavel aleatoria X, entao a variancia e


Var(X) = E[(X )2 )] = E(X 2 ) [E(X)]2 .

(1.3)

Isto e, e o valor esperado do quadrado do desvio de X da sua propria media. Em linguagem


comum isto pode ser expresso como A media do quadrado da dist
ancia de cada ponto ate a
assim a media do quadrado dos desvios. A variancia da variavel aleatoria X e
media. E
2 , ou simplesmente 2 .
geralmente designada por Var(X), X

Note que a definic


ao acima pode ser usada quer para variaveis aleatorias discretas, quer
para contnuas.

Propriedades da vari
ancia
Se a e b forem constantes reais e X uma variavel aleatoria cuja variancia esta definida,
entao:
V1)

Var(aX + b) = a2 Var(X);

V2) Var(X + Y ) = Var(X) + Var(Y ) + 2Cov(X, Y ).


Aqui Cov e a covari
ancia, a qual e zero para variaveis aleatorias nao correlacionadas.

Estimador da Vari
ancia ou Vari
ancia Amostral
Considere a amostra aleat
oria x1 , x2 , . . . , xn da variavel aleatoria X. O estimador da
variancia de X, obtido pelo metodo de maxima verossimilhanca e dado por
n

X
=

1X
(xi x)2 .
n

(1.4)

i=1

conhecido que este estimador e viesado. Um estimador consistente e nao viesado e dado
E
por
n

1 X
s =
(xi x)2 .
n1
2

i=1

(1.5)


CAPITULO 1. REVISAO

12
1.3.3

Covari
ancia

A covari
ancia entre duas vari
aveis aleatorias X e Y , com valor esperado E(X) = X e
E(Y ) = Y e definida como uma medida de como duas variaveis variam conjuntamente:
Cov(X, Y ) = E[(X X )(Y Y )].

(1.6)

Desenvolvendo a express
ao para a Covariancia, temos:
Cov(X, Y ) = E[(X X )(Y Y )]

Cov = E[(X E(X))(Y E(Y )]

Cov(X, Y ) = E[XY XE(Y ) Y E(X) + E(X)E(Y )]


Usando a propriedade de que a Esperanca (Valor esperado) de uma variavel aleatoria X
qualquer e um operador linear, determinamos que a Esperanca de uma soma e a soma das
Esperancas:
Cov(X, Y ) = E(XY ) E[XE(Y )] E[Y E(X)] + E[E(X)E(Y )].
Novamente utilizando da linearidade da Esperanca, temos que a Esperanca de uma constante K qualquer multiplicada pela variavel X e equivalente `a constante K multiplicada pela
Esperanca da vari
avel X. Sendo a Esperanca de X um n
umero qualquer definido no conjunto
dos R, podemos fator
a-la em dois fatores:
Cov(X, Y ) = E(XY ) E(Y )E(X) E(X)E(Y ) + E(X)E(Y ).
Isto equivale `
a seguinte f
ormula, a qual e geralmente usada para fazer os calculos:
Cov(X, Y ) = E(XY ) E(X)E(Y ).
Se X e Y s
ao independentes, entao a sua covariancia e zero. Isto acontece porque sob
independencia
E(XY ) = E(X)E(Y ) = X Y .
O inverso, no entanto, n
ao e verdadeiro: e possvel que X e Y nao sejam independentes e
terem no entanto covari
ancia zero. Variaveis aleatorias cuja covariancia e zero sao chamadas
nao correlacionadas.

1.3. PROPRIEDADES DE VARIAVEIS


ALEATORIAS

13

Propriedades da Covari
ancia
Se X e Y s
ao vari
aveis aleat
orias de valor real e a, b, c e d constantes (constante, neste
contexto significa n
ao aleat
oria), entao os seguintes propriedades sao uma consequencia da
definicao da covari
ancia:
C1)

Cov(X, X) = Var(X);

C2)

Cov(X, Y ) = Cov(Y, X);

C3)

Cov(aX + b, cY + d) = acCov(X, Y );
P
 P P
P
Cov
X
,
Y
i i
j j =
i
j Cov (Xi , Yj ).

C4)

Estimador da covari
ancia
Seja x1 , x2 , . . . , xn e y1 , y2 , . . . , yn amostras aleatorias das variaveis aleatorias X e Y . Ent
ao
um estimador para a covari
ancia e dado por
n

X,Y

1 X
=
(xi x)(yi y).
n1

(1.7)

i=1

1.3.4

Correla
c
ao

correlac
ao, tambem chamada de coeficiente de correlacao, indica a forca e a direcao do
relacionamento linear entre duas variaveis aleatorias. No uso estatstico geral, correlacao ou
co-relacao se refere a medida da relacao entre duas variaveis, embora correlacao nao implique
causalidade. Neste sentido geral, existem varios coeficientes medindo o grau de correlac
ao,
adaptados `
a natureza dos dados.
O coeficiente de correlac
ao X,Y entre duas variaveis aleatorias X e Y com valor esperado
X e Y e desvio padr
ao X e Y , tambem chamado Coeficiente de correlac
ao de Pearson e
definida como:
X,Y =

Cov(X, Y )
E[(X X )(Y Y )]
=
,
X Y
X Y

(1.8)

E(XY ) E(X)E(Y )
p
.
E 2 (X) E(Y 2 ) E 2 (Y )

(1.9)

ou, equivalentemente,
X,Y = p

E(X 2 )


CAPITULO 1. REVISAO

14

A correlac
ao e definida apenas se ambos desvios padroes sao finitos e diferentes de zero.
Pelo corol
ario da desigualdade de Cauchy-Schwarz, a correlacao nao pode exceder 1 em valor
absoluto, || 1..

Estimador da correla
c
ao
Seja x1 , x2 , . . . , xn e y1 , y2 , . . . , yn amostras aleatorias das variaveis aleatorias X e Y . Ent
ao
um estimador para a covari
ancia e dado por
Pn

x
)(yi y)
pPn
.
2
)
)2
i=1 (xi x
i=1 (yi y

X,Y = pPn

1.3.5

i=1 (xi

(1.10)

Propriedades dos Estimadores

Dado que temos alguns estimadores definidos acima, e interessante estudar algumas das
propriedades dos estimadores e definir criterios para compara-los.

1.3.6

Vcio/Vi
es

Seja um estimador do par


ametro . o vcio/vies (bias, em ingles) e definido como
= E()
.
b()

1.3.7

(1.11)

Consist
encia

Em estatstica, uma seq


uencia de estimadores para o parametro e dito ser consistente
(ou assintoticamente consistente) se esta sequencia converge em probabilidade para . Isso
significa que as distribuic
oes dos estimadores tornar-se mais e mais concentrados perto do
verdadeiro valor do par
ametro a ser estimado, de modo que a probabilidade do estimador ser
arbitrariamente perto converge para um.

1.3.8

Efici
encia

Um estimador de e dito ser eficiente se for nao viesado e sua variancia atingir o limite
inferior da desigualdade de Cramer-Rao para todos os possveis valores de . Em outras


1.4. METODO
DE MINIMOS QUADRADOS (MQO)

15

palavras, um estimador 0 de e eficiente se sua variancia for menor ou igual a variancia de


ou seja,
qualquer outro estimador ,
para qualquer outro estimador de .
Var(0 ) Var(),

1.3.9

Erro Quadr
atico M
edio (EQM)

O erro quadr
atico medio de um estimador de e definido como
EQM () = E( )2 .

(1.12)

Podemos reescrever esta ultima expressao como


+ b().

EQM () = Var() + [E() ]2 = Var()


Assim, o erro quadr
atico medio e definido como a variancia do estimador mais o quadrado
= 0, ou equivalentemente E()
= , i.e. o
do seu vies. Um caso particular ocorre quando b()
vcio do estimador e nulo.
1.3.10

1.4

Vcio versus Vari


ancia Mnima

M
etodo de Mnimos Quadrados (MQO)

Considere o modelo
yi = + xi + ui
em que yi , para i = 1, , n e chamada variavel dependente xi e a vaiavel independente e ui
e termo de erro do modelo.
Qual crit
erio devo utilizar para obter os estimadores dos par
ametros e ?
Podemos minimizar:
1. Soma dos erros: N
ao e um bom criterio pois pode anular positivos e negativos.
2. Soma Absoluta dos Resduos: Gera um estimador pouco utilizado denominado LAD
(Least Absolute Deviations).
3. Soma dos Quadrados dos Erros: Tem propriedades estatsticas que o tornam bastante
atrativo.


CAPITULO 1. REVISAO

16
Entao, devemos resolver o seguinte problema de minimizacao:
min{,}

n
X

u2i = min{b,}
b

i=1

n
X
(yi xi )2 .
i=1

As condic
oes de primeira ordem (CPOs) serao

b : 2

X
X
b i) = 0
(yi
b x
u
bi = 0.
i

Esta CPO nos mostra que a escolha do intercepto otimo implica que a soma dos resduos ser
a
zero. Continuando com essa CPO
X

b i) = 0
(yi
b x

yi

b i = 0
x

b
nx
= 0
ny nb
b

bM QO = y x.

(1.13)

Este e o estimador de Mnimos Quadrados Ordinarios do intercepto ().


b
Obtendo a CPO para :
X

b i) = 0
(yi
b x

X
i

yi x i

X
i

bxi

b 2 = 0
x
i

yi x i =
b

xi + b

yi x i

x2i

b
= (y x)

xi + b

yi x i = y

i2

X
X
b
xi + (
x2 x
xi )
i

P
P
yi x i y i x i
i
P
P
.
( i x2i x i xi )

bM QO =

(1.14)

Assim, o estimador MQO do pode ser escrito como


P
bM QO =

x)(yi y)
.
2
i (xi x)

i (x
Pi

O estimador MQO acima pode ser escrito tambem de outra forma usual. Basta dividir o


1.4. METODO
DE MINIMOS QUADRADOS (MQO)

17

numerador e denominador por n 1 e assim:


P
bM QO =
Assim, temos que =

1.4.1

d
x)(yi y)/n 1
Cov(x,
y)
=
.
2
Vd
ar(x)
i (xi x) /n 1

i (x
Pi

Cov(x,y)
V ar(x) .

Regress
ao Liner M
ultipla (RML)

Considere o modelo de regress


ao linear m
ultipla
yi = 0 + 1 x1i + 2 x2i + + k xki + ui
em que temos k vari
aveis explicativas x1 , . . . , xk . De forma matricial o modelo pode ser escrito
como

y1

1 x11

x21

xk1

u1

y2
..
.

1 x12
..
..
.
.

x22
..
.

..
.

xk2
..
.

1
..
.

u2
..
.

1 x1n x2n

xkn

yn

un

ou, y = X + u.
O estimador de e dado por:
= (X 0 X)1 X 0 y.

1.4.2

Hip
oteses do modelo de regress
ao

Hip
otese 1 (Linearidade dos Par
ametros): A relacao entre a variavel dependente y e as
explicativas x1 , . . . , xk e linear
y1 = 0 + 1 x1i + . . . + k xki + ui .
Defini
c
ao 1.4.1. Um modelo de regress
ao e linear nos par
ametros se as CPOs associadas


CAPITULO 1. REVISAO

18

ao problema de obtenc
ao dos EMQ (Estimadores de MQO) gerarem um sistema linear nos
par
ametros.
Exemplo 1.8. Seja o seguinte modelo
yi = + xi + ui .
Assim, o problema de minimizac
ao ser
a
min

{,}

(yi xi )2 .

As CPOs ser
ao

b : 2

b i) = 0
(yi
b x

b : 2

yi = nb
+ b

b i )xi = 0
(yi
b x

n
P

i xi

Pi

xi

2
i xi

#"

yi x i =
b

b
b

xi + b

" P
=

i yi

i yi xi

Exemplo 1.9. Seja o seguinte modelo


yi = + xi + ui .
o problema de minimizac
ao e

{,,}

X
(yi xi )2 .
i

A CPO
: 2

X
i

Logo e o sistema linear e o modelo e linear nos par


ametros.

min

xi

"

X
(yi xi ) = 0.
i

Logo n
ao e linear por causa do .
Exemplo 1.10. Seja o seguinte modelo
yi = x1i1 x2i2 eui .
Tomando o ln, teremos
ln yi = ln + 1 ln x1i + 2 ln x2i + ui .

x2i


1.4. METODO
DE MINIMOS QUADRADOS (MQO)

19

Portanto, o modelo e linear.


Hip
otese 2 (Amostragem Aleat
oria): Podemos extrair uma amostra aleatoria
{(x1i , . . . , xki , yi ), i = 1, . . . , n}
da populac
ao.
Observa
c
ao 1.4.1. Nos livros-texto esta hip
otese e geralmente substituda por uma hip
otese
de que X e n
ao-estoc
astico (aleat
orio).
Hip
otese 3 (M
edia Condicional Zero): E(u|X) = 0
Hip
otese 4 (N
ao h
a Multicolinearidade Perfeita): As variaveis explicativas 1, x1 , . . . , xk
sao linearmente independentes. Logo, xj , j = 1, . . . , k nao podem ser constantes.

1 x11

x21

xk1

X=

1 x12
..
..
.
.

x22
..
.

..
.

xk2
..
.

1 x1n x2n

xkn

n(k+1)

Esta hipotese implica que posto(X) = k + 1, pois n k + 1. Relembre das propriedades de


algebra matricial que
posto(X) = posto(X 0 X) = k + 1.
Assim, (X 0 X) e uma matriz invertvel pois possui posto pleno (ou posto cheio ou maximo).
Assim, (X 0 X)1 e portanto, podemos obter parametros estimados
(X 0 X)b = X 0 Y
(X 0 X)1 (X 0 X)b = (X 0 X)1 X 0 Y
b = (X 0 X)1 X 0 Y.
Hip
otese 5 (Homocedasticidade): V ar(ui |X) = 2 , i, ou seja, a variancia do erro e
constante.
Hip
otese 6 (Aus
encia de (Auto)Correla
c
ao (Serial)): Cov(ui , uj |X) = 0, i, j, i 6= j.
Hip
otese 7 (Normalidade): ui N (0, 2 ) para todo i. Tal hipotese sera necessaria para
inferencia.
Teorema 1.4.1. (de Gauss-Markov) Dentro da classe dos estimadores lineares e n
ao-viesados,
e dadas as hip
oteses do MCRL, os EMQs s
ao estimadores que possuem a menor vari
ancia
(BLUE - Best Linear Unbiased Estimator).


CAPITULO 1. REVISAO

20
1.4.3

O Coeficiente de Determina
c
ao: RLS

Existe alguma medida que me mostre se o meu modelo tem um bom poder preditivo? Ou
seja, se o regressor (x) que eu inclui no meu modelo explica bem a variavel dependente (y).
X

(yi )2 = Soma dos Quadrados Totais (SQT )

(b
yi )2 = Soma dos Quadrados Explicados (SQE)

u
b2i = Soma dos Quadrados dos Resduos (SQR)

Assim
SQT = SQE + SQR.
Dividindo a express
ao por SQT , teremos
1=

SQE SQR
+
.
SQT SQT
| {z }
R2

O R2 mede o quanto da variac


ao da variavel dependente pode ser explicado pela variac
ao
do regressor. Assim
R2 =
R2 =

SQE
SQR
=1
SQT
SQT
P c2
P 2
Pn
u
(b
yi )
(b
yi y)2
i
i=1
P 2 = Pn
= 1 Pn i i
,
2
2
i=1 (yi y)
i=1 (yi y)
i (yi )

onde R2 [0, 1].


Se o R2 nunca diminui quando adicionamos regressores, necessitamos de um coeficiente
que penalize em certo grau a inclus
ao de regressores. Tal coeficiente e chamado R2 ajustado
R

[SQR/(n k 1)]
[SQT /(n 1)]
2
SQR
= 1
, ( 2 =
).
[SQT /(n 1)]
nk1
= 1

O R2 ajustado tambem recebe o nome em ingles de R-bar squared ou ainda R2 corrigido.


A import
ancia dessa medida e que ela impoe uma penalidade por se adicionar regressores
ao modelo.
Assim, SQR/(n k 1) e um estimador nao-viesado de 2 , que e a variancia populacional
do erro, e SQT /(n 1) e um estimador nao-viesado de y2 , que e a variancia populacional de
y.


1.4. METODO
DE MINIMOS QUADRADOS (MQO)

21
2

Proposi
c
ao 1.4.1. Se adicionamos um novo regressor `
a regress
ao, ent
ao R aumenta a
estatstica t deste novo regressor e maior que 1, em m
odulo.
2

Proposi
c
ao 1.4.2. E se adicionarmos um grupo de vari
aveis `
a regress
ao, ent
ao R aumenta
a estatstica F deste novo grupo de regressores e maior que 1.
2

Uma f
ormula alternativa para o R e

R
R

[SQR/(n k 1)]
[SQT /(n 1)]
(1 R2 )(n 1)
SQR
= 1
, (
= 1 R2 ).
(n k 1)
SQT
= 1

Alem de se comparar modelos ao se incluir regressores, o R serve tambem para escolher


entre modelos nonnested (n
ao encaixantes). Por exemplo, um modelo 1 que tem x1 , x2 e
x3 e um outro modelo 2 que tem x1 , x2 e x4 . Mas ele nao serve para escolher entre formas
funcionais diferentes da vari
avel dependente.

Propriedade de N
ao Vi
es do EMQ
Assumindo X n
ao estoc
astico, tomando a esperanca de EMqO em versao matricial, obtemos:
= E[(X 0 X)1 X 0 y] = E[(X 0 X)1 X 0 (X + u)]
E()
= E[(X 0 X)1 X 0 X] + E[(X 0 X)1 X 0 u]
= + (X 0 X)1 E[X 0 u] = ,
se vale a hip
otese E[X 0 u] = 0. Ou seja, se as variaveis regressoras nao sao correlacionadas com
u, o MQO ser
a n
ao viesado.

Vari
ancia do EMQ
Para um modelo de regress
ao linear m
ultipla, a variancia do estimador de cada j e dado
por
V ar(j ) =
em que SQTj =

u2
,
SQTj (1 Rj2 )

P
(xji xj )2 , e Rj2 e o R2 da regressao de xj contra os demais regressores.


CAPITULO 1. REVISAO

22
1.4.4

Testes de Hip
oteses

Teste t
Se queremos testar individualmente a significancia (H0 : j = 0) do modelo
yi = 0 + 1 x1i + + k xki + ui
, a estatsticade teste e dada por
j j
t= q
tnk1
V arj
Observa
c
ao 1.4.2. Se houver problema de multicolineariedade, Rj2 ser
a alto, a vari
ancia
ser
a alta, e a estatstica de teste t ser
a baixa, e os estimadores ser
ao pouco significativos
(neste caso assumindo j = 0).

Teste F
A estatstica F para um modelo com intercepto, que serve para testar se o modelo e
significante, ou seja se todos os regressores sao conjuntamente significantes, i.e. H0 : 0 =
1 = = k = 0 vs. H1 : pelo menos um j 6= 0, e dada por
F =

R2 /k
Fk,nk1 .
1 R2 /n k 1

Observa
c
ao 1.4.3. Se temos um problema de multicolineariedade, ainda assim a estatstica
F e R2 do modelo de y contra x n
ao depende da correlac
ao entre os regressores(apenas do
SQR e SQT, ou seja, da soma dos quadrados dos resduos e da vari
avel dependente) e, assim,
se tivermos regressores relevantes para explicar y, ent
ao F e R2 indicar
ao que o modelo como
um todo ter
a um alto poder explicativo.

1.5. FORMAS FUNCIONAIS LOGARITMICAS

1.5

23

Formas Funcionais Logartmicas

Considere o seguinte modelo:


[y = 0 + 1 log x1 + 2 x2 .
log
Ele e log-log de y em relac
ao a x1 e e log-linear em relacao a x2 .
1 mede a elasticidade de y em relacao a x1 , fixado x2 .
A interpretac
ao de 1 e que para o aumento de 1% em x1 temos um aumento de 1 % em y.
2 pode ser interpretado como: um aumento de uma unidade em x2 da um aumento exato de
100[exp 2 1]% em y.
Uma medida aproximada, para uma mudanca pequena em x2 seria 1002 %. Este coeficiente
e denominado muitas vezes como semi-elasticidade.


CAPITULO 1. REVISAO

24

1.6

Exerccios

Exerccio 1.1. O custo de produca


o de certo bem e uma vari
avel aleat
oria com func
ao densidade de probabilidade:
f (x) = kx2 , 1 x 4.
(a) Calcule o valor de k;
(b) Calcule o custo medio do produto;
(c) Calcule a probabilidade do custo ser menor do que 2;
(d) Calcule a vari
ancia do custo do produto;
(e) Calcule a probabilidade do custo ser maior do que 3;

Exerccio 1.2. Sejam X e Y duas vari


aveis aleat
orias independentes com media X =
E(X) = 4,
2 = V ar(X) = 1 e 2 = V ar(Y ) = 2.
Y = E(Y ) = 5, X
Y

(a) Calcule E(X 2 ) e E(Y 2 );


(b) Calcule V ar(4X 2Y );
(c) Calcule Cov(X, Y );
(d) Calcule Cov(X, 2X 3Y )
(e) Suponha que X1 , X2 , , Xn s
ao vari
aveis aleat
orias independentes entre si e independentes de X, mas com a mesma distribuic
ao de probabilidade de X, ou seja, X1 , X2 , , Xn
e X s
ao vari
aveis aleat
orias independentes e identicamente distribudas (i.i.d) com media
= 4 e vari
ancia 2 = 1. Calcule:
E(X) = E

1
n

Pn

i=1 Xi

V ar(X);
Cov(X, X).

Exerccio 1.3. Suponha o seguinte modelo linear: y = X + , em que y e s


ao vetores
n 1, X < e uma matriz n k e e um vetor k 1.
(a) Determine a(s) hip
otese(s) necess
aria(s) para estimar esse modelo por MQO.

1.6. EXERCICIOS

25

exista e seja u
(b) Determine a(s) hip
otese(s) necess
aria(s) para que o estimado, ,
nico.
(c) Determine a(s) hip
otese(s) necess
aria(s) para que seja n
ao viesado.
(d) Determine a(s) hip
otese(s) necess
aria(s) para que seja eficiente.
(e) Determine a(s) hip
otese(s) necess
aria(s) para que se possa fazer inferencia estatstica.
Exerccio 1.4. Os dados da tabela relacionam o peso de plantas, Y (em gramas) com o
percentual de materia org
anica na terra, X1 e os Kilogramas de nitrogenio suplementares
agregados a terra por 1000m2 , X2 :
y

x1

x2

78.5

2.6

74.3

2.9

104.3

11

5.6

87.6

11

3.1

95.9

5.2

109.2

11

5.5

102.7

7.1

Soma:

652.5

51

32.0

media:

93.21

7.29

4.57

(a) Defina a equac


ao de regress
ao com intercepto em que y e a vari
avel dependente e x1 e x2
s
ao vari
aveis explicativas. N
ao esqueca da suposic
ao para o termo de erro do modelo.
(b) Se

1.80

0.07 0.25

652.50

(X T X)1 = 0.07 0.01 0.00 , e X T Y = 4915.30 ,


0.25 0.00 0.06
3103.66
via MQO.
determine
= (51.56, 1.49, 6.72).
Resposta:
(c) Se SQres = 27.58 e SQtotal = 28.30, calcule o coeficiente de determinac
ao.
Resposta:R2 = 0.9745,
(d) Teste 0 = 1 = 2 = 0, ou seja, a signific
ancia do modelo.
(e) Se dp(1 ) = 0.2636, (dp=desvio padr
ao), teste se a vari
avel X1 e relevante para o modelo.


CAPITULO 1. REVISAO

26
(f ) Se dp(2 ) = 0.6274, teste a hip
otese H0 : 2 = 1.

Exerccio 1.5. Ad
ao Ismiti queria verificar se a produtividade aumentava com a divis
ao do
trabalho. Para isso, fez a seguinte experiencia: regrediu a produtividade (p) de n trabalhadores
de f
abricas de alfinetes contra o n
umero de func
oes exercidas pelo trabalhador (F ), os anos
de escolaridade (E), o sal
ario (w) e o n
umero de filhos (N ). Formalmente, a regress
ao foi:
pi = 1 + 2 Fi + 3 Ei + 4 i + 5 Ni + ui
Usando o teste t-Student, Ismiti n
ao rejeitou a hip
otese nula de par
ametro igual a zero
para 3 . Retirou a vari
avel E da regress
ao e estimou o modelo restrito, observando que 5
se tornou tambem, estatisticamente n
ao significativo. Finalmente, retirou N da regress
ao e
estimou o modelo novamente.
(a) Por que n
ao foi preciso fazer o teste F em 3 para retirar E do modelo?
(b) Justifique se o procedimento adotado por Ismiti est
a correto ou equivocado, para ter eliminado a vari
avel N do modelo.

Exerccio 1.6. Suponha um modelo de regress


ao linear m
ultiplo em que exista, seja n
ao
viesado e eficiente, pois u e homoced
astico. Suponha que voce imponha falsas restric
oes sobre
os par
ametros do modelo.
(a) Mostre que as estimativas nesse caso s
ao viesadas.
(b) Mostre que a vari
ancia das estimativas do modelo com restric
oes e menor que a vari
ancia
das estimativas do modelo sem restric
oes.
(c) Qual e a implicac
ao desse resultado em termos de previs
ao? Qual e a intuic
ao desse
resultado?
Sugest
ao: Lembre o que e o EQM, ou seja, o erro quadr
atico medio.

Exerccio 1.7. Responda:


(a) Cite pelo menos dois testes para a hip
otese de homocedasticidade.
(b) Cite pelo menos um teste para a hip
otese de autocorrelac
ao dos resduos.

1.6. EXERCICIOS

27

(c) Em caso de rejeic


ao da hip
otese nula em (a), por qual metodo voce estimaria o modelo?
(d) Em caso de rejeic
ao da hip
otese nula em (b), por qual metodo voce estimaria o modelo?

Exerccio 1.8. Desafio: Faca os seguinte exerccios.


(a) Suponha que

i=0 |xi |

< . Mostre que

(b) Prove (ou n


ao) que limn

Pn

(c) Prove (ou n


ao) que limn

Pn

(d) Prove (ou n


ao) que, se

1
x=1 x
1
x=1 x2

2
i=0 xi

2
i=0 xi

< .

= .
= .

< , ent
ao

i=0 |xi |

< .

28

CAPITULO 1. REVISAO

Captulo 2

Modelos com Vari


aveis Instrumentais (VI)

2.1

Vari
aveis Instrumentais

Em estatstica, econometria, epidemiologia e areas relacionadas, o metodo de variaveis


instrumentais e usado para estimar relacoes causais, quando experimentos controlados n
ao
sao viaveis. O metodo VI permite estimacoes consistentes quando as variaveis explicativas
sao endogenas.
2.1.1

Conceito da exogeneidade dos regressores

Nos modelos econometricos estruturais de uma equacao a variavel dependente (endogena)


e explicada atraves de um conjunto de variaveis explicativas (nao estocasticas) e do termo
de erro. Nos modelos econometricos estruturais de uma equacao, as variaveis explicativas
sao a causa que explicam a variac
ao da variavel dependente e a variavel endogena reflete o
efeito provocado pela variac
ao das variaveis explicativas. Uma das hipoteses basicas iniciais
da regress
ao MQO admite a ausencia de correlacao das variaveis explicativas com o termo
de erro Cov(Xi , u) = 0, tornando assim as variaveis explicativas exogenas (sentido estrito
de exogeneidade). Contudo, a hip
otese da exogeneidade das variaveis explicativas, e muitas
vezes infringida, tornando impr
oprio o metodo de estimacao dos parametros via MQO.
Podem ser v
arias as causas da endogeneidade das variaveis explicativas, entre elas pode-se
citar erros de mensurac
ao das vari
aveis, variavel omitida e simultaneidade. Nestas situacoes,
a regressao linear simples geralmente produz estimativas viesadas e inconsistentes.
Quando temos um problema de endogeneidade causado por uma variavel nao observavel,
uma possvel soluc
ao e a utilizac
ao de uma variavel proxy.
2.1.2

Vari
avel proxy

Considere a regress
ao para explicar a renda em funcao do nvel de escolaridade (educ) e a
aptidao para determinada tarefa (aptid),

29


CAPITULO 2. MODELOS COM VARIAVEIS
INSTRUMENTAIS (VI)

30

log(salario) = 0 + 1 educ + 2 aptid + u.

(2.1)

Observe que aptid e uma vari


avel inata, nao observavel. Podemos esperar que aptid seja
correlacionada com educ, logo se omitimos a variavel aptid da regressao (2.1), a estimativa
via MQO de 1 seja viciada e inconsistente.
Poderamos pensar numa vari
avel que represente bem o comportamento da variavel
aptid, mas que seja observ
avel. Tal variavel e denominada variavel proxy.
Caractersticas da vari
avel proxy
1. Ser altamente correlacionada com a variavel nao observada que pretende substituir;
2. Nao ser correlacionada com o termo de erro da regressao.
Com uma boa proxy, podemos estimar o modelo por MQO e obter boas estimativas se
estivermos interessados em estimar 1 em (2.1).
2.1.3

Vari
avel Omitida

Vamos supor que n


ao temos uma boa proxy disponvel e queremos estimar o seguinte
modelo:
yi = 0 + 1 x1i + 2 x2i + ui ,

(2.2)

em que ui e bem comportado, x1 = educ e x2 = aptid. Como nao podemos observar aptid
ao,
vamos supor que o modelo seja mal especificado, da seguinte forma:
yi = 0 + 1 x1i + vi .

(2.3)

Estimando a equac
ao (2.3) via MQO, obtemos para 1 :
Pn
(x1i x1 )yi

1 = Pi=1
.
n
2
i=1 (x1i x1 )

(2.4)

Ao olharmos o vies de 1 , temos:


b(
1 ) = E [
1 ] 1 .

(2.5)

Pn
i=1 (x1i x1 )E[yi ]
E [
1 ] = P
.
n
2
i=1 (x1i x1 )

(2.6)

Assim,

Como yi e dado em 2.2, segue que


2.1. VARIAVEIS
INSTRUMENTAIS

31

E[yi ] = 0 + 1 x1i + 2 x2i ,


ja que E[ui ] = 0. Ent
ao,
P
P
P
0 ni=1 (x1i x1 ) 1 ni=1 (x1i x1 )x1i 2 ni=1 (x1i x1 )x2i
E [
1 ] = Pn
+ Pn
+ Pn
2
2
2
i=1 (x1i x1 )
i=1 (x1i x1 )
i=1 (x1i x1 )
Pn
2
(x1i x1 )x2i
= 0 + 1 + Pni=1
.
2
i=1 (x1i x1 )

(2.7)

Logo, E [
1 ] = 1 se e somente se x1 e x2 forem nao correlacionados na amostra. O que
geralmente n
ao acontece. Esse e o caso em que o estimador de MQO, produz estimativas
viciadas quando o regressor e correlacionado com o erro. No entanto, se um instrumento est
a
disponvel, estimativas consistentes ainda podem ser obtida. Veja o seguinte exemplo:

Exemplo 2.1. Suponha que um pesquisador deseja estimar o efeito causal do tabagismo
sobre a sa
ude geral, como em Leigh e Schembri 2004 [1]). Em princpio, a existencia de
correlac
ao entre a sa
ude e o h
abito de fumar n
ao implica necessariamente que o fumo piora
a sa
ude, porque outras vari
aveis podem afetar tanto a sa
ude quanto o h
abito de fumar. Por
exemplo, pode ocorrer por acaso que pessoas de uma certa cidade exposta `
a poluic
ao radioativa
fumem muito, mas e a poluic
ao que realmente causa problemas de sa
ude `
a esta populac
ao em
estudo. Mesmo que o tabagismo cause realmente problemas, a sa
ude em si pode afetar o
h
abito de fumar (digamos, um paciente muito doente pode se sentir instigado a fumar mais).
Fazer estudos controlados (por exemplo, colocar uma pessoa num laborat
orio, sem exposic
ao
`
a poluic
ao, fumando quantidades controladas) pode ser difcil, caro ou anti-etico. Uma opc
ao
alternativa, portanto, seria o pesquisador tentar estimar o efeito causal do tabagismo sobre a
sa
ude a partir de dados observacionais, utilizando, por exemplo, a alquota de imposto sobre
o tabaco como um instrumento para fumar em uma regress
ao de sa
ude. Se as alquotas de
imposto sobre o tabaco afetam apenas (positivamente, imagina-se) a sa
ude porque eles afetam
o h
abito de fumar (mantendo as outras vari
aveis do modelo fixas), a correlac
ao entre impostos
sobre o tabaco e a sa
ude e uma evidencia de que o tabagismo provoca alterac
oes na sa
ude.
Uma estimativa do efeito do tabagismo sobre a sa
ude podem ser feita tambem fazendo uso da
correlac
ao entre os impostos e os h
abitos de fumar.
2.1.4

Erros de Mensura
c
ao

Considere o modelo de regress


ao simples:
y = + x + u,

(2.8)


CAPITULO 2. MODELOS COM VARIAVEIS
INSTRUMENTAIS (VI)

32

em que Cov(x , u) = E(x u) = 0. Nesse modelo, a estimacao por MQO deveria gerar estimadores consistentes dos par
ametros. Supoe-se, porem, que a variavel x seja observada com
erro. Isto e, o que observamos na pratica e:
x = x + e,

(2.9)

em que
E(e) = 0;
Cov(x , e) = E(x e) = 0;
Cov(e, u) = E(eu) = 0.

Exemplo 2.2. Para explicar o rendimento de um aluno da UFRGS, podemos estar interessados em usar como vari
aveis explicativas (dentre outras): renda familiar, n
umero de horas
dedicadas ao estudo, tempo necess
ario para o trajeto casa-UFRGS, etc. Todas essas vari
aveis
est
ao sujeitas a erros de mensurac
ao, pois os alunos podem errar (deliberadamente ou n
ao)
ao responder `
a pesquisa. Se os erros forem puramente aleat
orios, isto e, n
ao estiverem correlacionados com outras vari
aveis relevantes, as hip
oteses do modelo acima ser
ao satisfeitas.
Reescrevendo o modelo (2.8) em funcao da variavel observada x:
y = + x + u
= + (x e) + u
= + x + (u e)
= + x + .
Agora, a estimac
ao por MQO n
ao gera estimadores consistentes dos parametros, pois
Cov(x, ) = E(x)
= E[(x + e)(u e)]
= E[x u + eu x e e2 ]
= E(x u) + E(eu) E(x e) E(e2 )
= e2
6= 0.
Lembre que


2.1. VARIAVEIS
INSTRUMENTAIS

33

Pn
Pn
(xi x)i
i=1 (xi x)yi

P
= + Pi=1
.
=
n
n
2
2
x)
(x

i=1 i
i=1 (xi x)
E note que V ar(x) = V ar(x ) + V ar(e) = x + e

Cov(x, )
V ar(x)


e2
e2
= 2
.
= 1 2
x + e2
x + e2

P lim() = +

2.1.5

Caractersticas de um bom Instrumento

Considere o modelo
y = + x + ,

(2.10)

em que Cov(x, ) 6= 0, ou seja, x e endogena.


Para que seja considerada um bom instrumento, uma variavel z deve ser altamente correlacionados com a vari
avel explicativa endogena x mas nao correlacionados com o termo de
erro da equac
ao , ou seja, deve satisfazer as seguintes condicoes:
Cov(z, ) = 0,

(2.11)

Cov(z, x) 6= 0.

(2.12)

Quando uma vari


avel z satisfaz ambas as condicoes acima, dizemos que z e um instrumento
valido para x.
Vale notar que a condic
ao (2.11) nao e testavel, pois refere-se `a covariancia entre z e um

erro nao observ


avel. E necess
ario uma boa historinha para justificar o instrumento! A
condicao (2.12), porem, pode ser testada em uma regressao de x em z [teste de significancia
de qual coeficiente?]
Infelizmente, n
ao e sempre f
acil encontrar instrumentos validos para os modelos. Na
verdade, e muito difcil. Uma das razoes dessa dificuldade reside no fato de que as duas
condicoes requeridas de um instrumento sao muitas vezes conflitantes.

Exemplo 2.3. Estima


c
ao de equa
c
ao de sal
ario em fun
c
ao da educa
c
ao
Variavel omitida: aptid
ao do indivduo - torna viesado o coeficiente da educacao.
Possvel instrumento: educac
ao da mae (correlacionada com a educacao do indivduo).


CAPITULO 2. MODELOS COM VARIAVEIS
INSTRUMENTAIS (VI)

34

Mas, educac
ao da m
ae tambem deve ser correlacionada com a habilidade do indivduo, presente no erro? Nesse caso, n
ao seria um bom instrumento.
Um bom instrumento seria o n
umero de irm
aos - nao correlacionado com aptid correlacionado com educ (negativamente).
2.1.6

Diferen
ca entre Proxy e VI

A vari
avel proxy e caracterizada por:
1. nao ser correlacionada com o termo de erro do modelo;
2. correlacionada com a vari
avel nao observada.
A vari
avel instrumental e caracterizada por
1. nao ser correlacionada com o termo de erro do modelo, ou seja, nao correlacionada com
aptid no exemplo 2.3;
2. correlacionada com a vari
avel endogena, ou seja, no caso do exemplo 2.3, ela deve ser
correlacionada com educ.
No exemplo 2.3 uma boa proxy seria:

correlacionada com aptid;


QI=
nao correlacionada com o erro,
e um bom instrumento e o n
umero de irmaos (nir), como visto anteriormente.

n
ao correlacionada com aptid e, portanto, nao correlacionada com o erro;
nir=
correlacionada com educacao (negativamente),
2.1.7

O M
etodo de Estima
c
ao VI

Para descrever o metodo de estimacao por variavel instrumental, considere o seguinte


modelo:
y = 0 + 1 x + u.

(2.13)

A condic
ao (2.12) exige que Cov(x, z) 6= 0. Ou seja, no modelo
x = 0 + 1 z + v,

(2.14)

queremos que 1 6= 0, em que


1 =

Cov(x, z)
.
V ar(z)

(2.15)


2.1. VARIAVEIS
INSTRUMENTAIS

35

Na verdade queremos que


1 6= 0, em que
Pn
(z z)(xi x)
Pn i
,

1 = i=1
2
i=1 (zi z)

(2.16)

o que poder
a ser facilmente testado via teste t de significancia. A necessidade da condic
ao
(2.11) ficar
a evidente a seguir.
Voltando ao modelo original,
y = 0 + 1 x + u
= 0 + 1 (0 + 1 z + v) + u
= 0 + 1 0 + 1 1 z + 1 v + u
= (0 + 1 0 ) + 1 1 z + (1 v + u)
= 0 + 1 z + .
No modelo acima temos que z e n
ao correlacionado com . Podemos entao estimar 1 de
forma consistente, via MQO.
Quem e o estimador de VI para 1 ?
Sabe-se que
Pn
(z z)(yi y)
Pn i
1 = i=1
= 1
1.
2
i=1 (zi z)

(2.17)

Como
1 e dado em (2.16), segue que o estimador VI para 1 e
Pn
(zi z)(yi y)
1 1

1 =
= Pni=1
.
1
i=1 (zi z)(xi x)

(2.18)

Teoricamente,
1V I =

Cov(y, z)
Cov(x, z)

(2.19)

Aqui percebemos a import


ancia da condicao (2.12) de um bom instrumento, i.e., Cov(x, z) 6=
0.
Observa
c
ao 2.1.1. Pode-se mostrar que
0V I = y 1V I x.
Infer
encia com o Estimador VI
Pode-se mostrar que

(2.20)


CAPITULO 2. MODELOS COM VARIAVEIS
INSTRUMENTAIS (VI)

36

1V I

2
1 , 2 2
nx xz


,

(2.21)

ou seja, a vari
ancia assint
otica do estimador e dada por
V arass (1V I ) =

V ar()
.
nV ar(x)[Corr(x, z)]2

(2.22)

Por essa raz


ao, devemos procurar um instrumento que tenha a mais alta correlacao possvel
com x, ou seja, para que a vari
ancia de 1V I seja pequena.
Observa
c
ao 2.1.2. Sabemos que
2
V ar(1M QO ) =
.
nx2

(2.23)

2 , que
Tambem e conhecido que um bom estimador para 2xz e o Rxz
e o R2 d
a regress
ao (2.14).

Isso permite a comparac


ao entre as vari
ancias estimadas MQOVI:
2 = 1, ent
1. Se Rxz
ao V ar(1M QO ) = V ar(1V I ).
2 , maior ser
2. Quanto menor Rxz
a V ar(1V I ).

Ent
ao porque usamos VI?
Teste de Hip
oteses neste Caso
Consideremos o seguinte problema
log(sal
ario) = 0 + 1 educ + u,

(2.24)

em que Cov(educ, u) 6= 0. Seja o n


umero de irm
aos, (nir) um instrumento. Queremos testar

a significancia de 1V I . Os passos para esse teste sao:


1. Obter
1V I

Pn
(niri nir)(yi y)
= Pni=1
;
i=1 (niri nir)(xi x)

2. Obter

Pn
2

2iV I
i=1 u

n2

em que u
Vi I = yi 0V I 1V I educ;
2
3. Obter Reduc,nir
, que e o R2 de

educ = 0 + 1 nir + v;


2.1. VARIAVEIS
INSTRUMENTAIS

37

4. Obter a estimativa do desvio padrao


s
S(1V I ) =

H :
0
5. Teste:
H :
1
2.1.8

2
;
2 2
i=1 (xi x) Reduc,nir

Pn

1V I = 0;
1V I 6= 0.

VI em Modelos de Regress
ao M
ultipla

O estimador de VI para o modelo de regressao simples e facilmente extendido para o caso


de regress
ao m
ultipla. Consideremos inicialmente o caso em que somente um dos regressores
e endogeno. A equac
ao estrutural do modelo linear padrao com duas variaveis explicativas e
y1 = 0 + 1 y2 + 2 z1 + u1 .

(2.25)

Usamos essa notac


ao para identificar as variaveis endogenas (ys) e as variaveis exogenas (zs).
Um exemplo para (2.25) e
log(sal
ario) = 0 + 1 educ + 2 exper + u1 ,

(2.26)

em que y1 = log(sal
ario), y2 = educ e z1 = exper. Assim, estamos supondo que exper e
exogeno e, por raz
oes habituais, presumimos que educ seja correlacionado com u1 .
Se estimarmos (2.25) por MQO, todos os estimadores serao viesados e inconsistentes.
Assim, seguimos a estrategia da secao anterior para encontrar uma VI para y2 . Como z1
aparece como vari
avel explicativa, devemos procurar outra variavel exogena (vamos chama-la
de z2 ) que seja correlacionada com y2 = educ.
A correlac
ao de z2 e y2 pode ser afetada por z1 que aparece na regressao (2.25). Devemos
nos certificar que na presenca de z1 , y2 e z2 ainda sao correlacionados. Essa condicao pode
ser verificada a partir da regress
ao
y2 = 0 + 1 z1 + 2 z2 + v2 ,

(2.27)

em que E(v2 ) = 0, Cov(z1 , v2 ) = 0, Cov(z2 , v2 ) = 0 e os j sao parametros desconhecidos. A


condicao de identificac
ao fundamental e que
2 6= 0,

(2.28)

a qual pode ser testada usando-se um teste t.


Observa
c
ao 2.1.3. A equaca
o (2.27) e um exemplo de uma equacao na forma reduzida,


CAPITULO 2. MODELOS COM VARIAVEIS
INSTRUMENTAIS (VI)

38

significando que escrevemos uma vari


avel end
ogena em func
ao de ex
ogenas. O nome ajuda a
distingui-l
a da equac
ao estrutural (2.25).
A adic
ao de mais vari
aveis explicativas exogenas ao modelo e direta. O modelo estrutural
com k 1 vari
aveis ex
ogenas (z1 , z2 , . . . , zk1 ) e uma variavel endogena (y2 ) e
y1 = 0 + 1 y2 + 2 z1 + 3 z2 + . . . + k zk1 + u1 .

(2.29)

Se zk e uma vari
avel ex
ogena e queremos usa-la como uma VI para y2 , devemos proceder de
forma semelhante a (2.27), escrevendo a equacao na forma reduzida
y2 = 0 + 1 z1 + 2 z2 + + k1 zk1 + k zk + v2 ,

(2.30)

para a qual e necess


ario que exista alguma correlacao parcial entre zk e y2 :
k 6= 0.
2.1.9

(2.31)

O Estimador VI como Mnimos Quadrados em Dois Est


agios (MQ2E)

Nesta subsec
ao vamos mostrar a equivalencia do estimador VI com MQ2E. Para isso
consideremos a equac
ao estrutural com uma variavel endogena
yi = 0 + 1 xi + ui ,

(2.32)

em que Cov(xi , ui ) 6= 0, para todo i = 1, . . . , n. Seja z um instrumento para x.


O procedimento MQ2E consiste em:
1. Estimar a equac
ao reduzida
x i = 0 + 1 zi + v i ,

(2.33)

encontrando as estimativas de 0 e 1 via MQO.


2. Obter
x
i =
0 +
1 zi .
3. Estimar 0 e 1 via MQO no seguinte modelo:
yi = 0 + 1 x
i + i ,

(2.34)

para i = 1, . . . , n, ou seja, usar x


como uma VI para x.
Esse procedimento resulta em uma estimativa para 1 equivalente a 1V I , como ser
a
demonstrado a seguir.
Note que:


2.1. VARIAVEIS
INSTRUMENTAIS

39

x
i =
0 +
1 zi
1z +
1 zi
= x
= x+
1 (zi z).
De (2.34), segue que
Pn
(
xi x
)(yi y)
.
1 = i=1
Pn
)2
xi x
i=1 (
Pode-se mostrar facilmente que x
= x. Logo,
1 =
=
=

=
=

Pn

(z z)(yi y)
i=1
Pn 1 i
(
1 (zi z))2
Pni=1
(z z)(yi y)
Pni

1 i=1
2

1 i=1 (zi z)2


Pn
i=1 (zi z)(yi y)
Pn
Pn
i=1
2
Pn(zi z)(xi2x)
i=1 (zi z)
(z
z)
i
i=1
Pn
(z z)(yi y)
Pni=1 i
i=1 (zi z)(xi x)

1V I .

Quando existir mais de uma VI disponvel, digamos z1 , z2 z3 , qualquer combinacao linear


destas VIs tambem ser
a uma VI v
alida. Devemos escolher a combinacao linear com a mais
alta correlac
ao com a vari
avel end
ogena y2 . Isto acaba sendo fornecido pela equacao na forma
reduzida de y2 , que e dada por
y2 = 0 + 1 z1 + 2 z2 + +3 z3 + v2 ,

(2.35)

em que E(v2 ) = 0, Cov(z1 , v2 ) = 0, Cov(z2 , v2 ) = 0 e Cov(z3 , v2 ) = 0. Portanto, a melhor VI


de y2 e a combinac
ao linear dos zj , que denotaremos por
y2 = 0 + 1 z1 + 2 z2 + +3 z3 .

(2.36)

Para que esta VI n


ao seja perfeitamente correlacionada com z1 , precisamos que
1 6= 0 ou 2 6= 0.

(2.37)

Se essa hip
otese de identificac
ao, a qual pode ser testada usando-se um teste F , for satisfeita,
entao podemos usar y2 como VI para y2 .


CAPITULO 2. MODELOS COM VARIAVEIS
INSTRUMENTAIS (VI)

40

Observa
c
ao 2.1.4. Quando o problema e a existencia de vari
aveis explicativas end
ogenas
m
ultiplas, ser
a necess
aria que existam pelo menos tantas vari
aveis ex
ogenas excludas do
modelo quantas forem as end
ogenas includas.
2.1.10

Testes de Endogeneidade

Como visto anteriormente, a condicao (2.11) nao pode ser testada, logo nao podemos ter
certeza se os regressores (vari
aveis explicativas) estao ou nao correlacionados com o erro. Se
nao houver correlac
ao, e melhor utilizar mnimos quadrados ordinarios que o estimador de
variaveis instrumentais ou MQ2E. No entanto, pela estimacao pura e simples e impossvel
descobrir se h
a correlac
ao entre os regressores e o erro.
Teste de Hausmann
O teste de especificac
ao proposto por Hausmann em 1978 e um teste utilizado para avaliar a
consistencia de um estimador comparado a um outro estimador alternativo e pode ser utilizado
no contexto de endogeneidade.
A logica de Hausmann e a seguinte: sob a hipotese nula (ausencia de correlacao entre os
regressores e o termo de erro), o econometrista tem em maos dois estimadores consistentes para
a matriz de par
ametros: o estimador de mnimos quadrados ordinarios M QO e o estimador de
variaveis instrumentais V I . Sob a hipotese alternativa, no entanto, somente um destes, V I ,
e consistente. Portanto, a sugest
ao foi examinar a diferenca d = V I M QO . O resultado
desta diferenca converge em probabilidade para zero apenas sob a hipotese nula. Podemos
testar esta hip
otese usando o teste de Wald.
Teste de Regress
ao
Para ilustrar, suponha que temos uma u
nica variavel suspeita de ser endogena,
y1 = 0 + 1 y2 + 2 z1 + 3 z2 + u1 ,

(2.38)

em que z1 e z2 s
ao ex
ogenos. Temos duas outras variaveis exogenas, z3 e z4 , que nao aparecem no modelo (2.38). Se y2 for nao correlacionado com u1 , devemos estimar (2.38) por
MQO. Wooldridge 2011 sugere que e mais facil usar um teste de regressao para testar se y2 e
endogena. Isto e feito com base na estimacao da forma reduzida de y2 , que neste caso e
y2 = 0 + 1 z1 + 2 z2 + 3 z3 + 4 z4 + v2 .

(2.39)

Agora, como cada zj e n


ao correlacionado com u1 , y2 sera nao correlacionado com u1 se, e
somente se, v2 for correlacionado com u1 ; isso e o que queremos testar. Deveramos escrever
o modelo
u1 = 1 v2 + 1

(2.40)

2.2. EXERCICIOS

41

e testar se 1 = 0. No entanto, n
ao temos u1 nem v2 . A sugestao e usar v2 como um regressor
em (2.38).
O metodo pode ser resumido da seguinte forma:
1. Obter via MQO os resduos
v2 = y2
0 +
1 z1 +
2 z2 +
3 z3 +
4 z4 ;
2. Estimar via MQO a regress
ao
y1 = 0 + 1 y2 + 2 z1 + 3 z2 + 1 y2 + e;
3. Testar H0 : 1 = 0 via teste t (robusto a heterocedasticidade). Se rejeitamos H0 a
um pequeno nvel de signific
ancia, conclumos que y2 e endogeno porque v2 e u1 s
ao
correlacionados.

2.2

Exerccios

Exerccio 2.1. Qual a motivac


ao para o uso da estimacao por variaveis instrumentais? Como
se pode definir um bom instrumento?

Exerccio 2.2. O que s


ao vari
aveis endogenas e exogenas?

Exerccio 2.3. Quais s


ao as caractersticas de uma boa variavel proxy e um bom instrumento?

Exerccio 2.4. Seja X a matriz cujas colunas sao compostas pelas variaveis x1 , . . . , xk . As
condicoes E[u/X] = 0 e Cov(u, xj ) = 0, para todo j = 1, . . . , k, sao equivalentes? Explique o
que estas condic
oes significam na pratica.

Exerccio 2.5. De um exemplo em que a condicao E[u/X] nao e valida.

Exerccio 2.6. Quais as propriedades do estimador de variaveis instrumentais quando se


possui uma vari
avel instrumental fraca (fraco instrumento)?

42

CAPITULO 2. MODELOS COM VARIAVEIS


INSTRUMENTAIS (VI)

Exerccio 2.7. Qual a diferenca da estimacao de variaveis instrumentais para a estimac


ao
de mnimos quadrados em dois estagios? Explique e mostre as hipoteses de identificac
ao
necessarias.

Exerccio 2.8. Em um modelo com duas variaveis regressoras,


y = 0 + 1 x1 + 2 x2 + u,
em que Cov(x1 , x2 ) 6= 0, as estimativas dos parametros 1 e 2 obtidas via MQO ser
ao
viesadas?

Exerccio 2.9. Em um modelo com duas variaveis regressoras,


y = 0 + 1 x1 + 2 x2 + u,
em que x2 e end
ogena, a estimativa do parametro 1 obtida via MQO e viesada mesmo que
Cov(x1 , x2 ) = 0?

Exerccio 2.10. No modelo


y = 0 + 1 x1 + 2 x2 + u,
a omissao de uma vari
avel explicativa relevante x2 , para explicar a variavel dependente y
torna a estimativa dos coeficientes 0 e 1 obtidas via MQO viesadas?

Exerccio 2.11. Experimento de Monte Carlo.

Este exerccio relata um experimento de

Monte Carlo que investiga o desempenho dos metodos MQO e IV ao estimar a equac
ao de
inflac
ao dos precos no modelo de inflac
ao de precos/inflac
ao do sal
ario. Valores numericos
foram atribudos aos par
ametros das equac
oes da seguinte forma:
p = 1.5 + 0.5w + up

(2.41)

w = 2.5 + 0.5p 0.4U + uw ,


em que para U foi atribudo os valores 2, 2.25, 2.50, aumentando em passos de 0.25 ate
6.75. uw foi gerado como uma vari
avel aleat
oria normal com media 0 e vari
ancia unit
aria,
escalado por um fator 0.8. O termo dist
urbio uw foi gerado de forma independente, como uma
vari
avel aleat
oria normal com media 0 e vari
ancia unit
aria. Cada repetic
ao do experimento

2.2. EXERCICIOS

43

utilizou uma amostra de 20 observac


oes. A tabela a seguir mostra as estimativas via MQO
e VI do intercepto, b1 , e do coeficiente de w, b2 , da equac
ao (2.41), e os respectivos erros
padr
oes (e.p.).
MQO

VI

Sample

b1

e.p.(b1 )

b2

e.p.(b2 )

b1

e.p.(b1 )

b2

e.p.(b2 )

0.36

0.39

1.11

0.22

2.33

0.97

0.16

0.45

0.45

0.38

1.06

0.17

1.53

0.57

0.53

0.26

0.65

0.27

0.94

0.12

1.13

0.32

0.70

0.15

0.41

0.39

0.98

0.19

1.55

0.59

0.37

0.30

0.92

0.46

0.77

0.22

2.31

0.71

0.06

0.35

0.26

0.35

1.09

0.16

1.24

0.52

0.59

0.25

0.31

0.39

1.00

0.19

1.52

0.62

0.33

0.32

1.06

0.38

0.82

0.16

1.95

0.51

0.41

0.22

-0.08

0.36

1.16

0.18

1.11

0.62

0.45

0.33

10

1.12

0.43

0.69

0.20

2.26

0.61

0.13

0.29

Compare as estimativas via MQO e VI em termos de vcio e vari


ancia.

Exerccio 2.12. (ANPEC 2008)Suponha que o modelo abaixo descreva as relacoes entre
quatro vari
aveis aleat
orias escalares: y,X,Z, e V .
E(y/X, Z) = 0 + 1 X + 2 Z
X = 0 + 1 Z + v, E(v/Z, X) = E(v/Z) = E(v/X) = E(v) = 0.
Suponha, ainda, que 0 6= 0, 1 6= 0, 2 6= 0, 0 6= 0 e 1 6= 0.
(a) Calcule E(y/Z).
(b) Seja y = 0 + 1 X + 2 Z + u. Calcule E(u/X, Z).
(c) Calcule E(X/Z).
(d) Seja
y = 0 + 1 Z +
em que 0 = 0 + 1 0 e 1 = 1 1 + 2 . Calcule E(/Z).
(e) Considere uma amostra de tamanho n das variaveis y, X e Z. O estimador
P
nyi (zi z)
T = Pi=1
2
i=1 n(zi z)

44

CAPITULO 2. MODELOS COM VARIAVEIS


INSTRUMENTAIS (VI)
e um estimador n
ao tendencioso para 1 = 1 1 + 2 ?

Captulo 3

Equaco
es Simult
aneas
Outra forma importante de endogeneidade de variaveis explicativas e a simultaneidade.
Ela ocorre quando uma ou mais das variaveis explicativas sao determinadas conjuntamente
com a vari
avel dependente, em geral por meio de um mecanismo de equilibrio (como veremos
a seguir). Um exemplo pode ser encontrado em Macedo e Carvalho (2010) em que o aumento
da penetrac
ao do servico de acesso `
a internet em banda larga e seu possvel impacto economico
e analisado atraves de sistema de equacoes simultaneas de oferta e demanda.
Neste captulo veremos metodos de estimar modelos de equacoes simultaneas. O principal
e o metodo de VI.

3.1

Equac
oes de Oferta e Demanda

Um exemplo de simultaneidade e a equacao de oferta e demanda. No modelo de oferta


e demanda (de um determinado produto) encontramos duas variaveis endogenas, o preco Pt
e as quantidades Qt , que s
ao simultaneamente determinadas pela interacao entre a oferta
e a demanda. Assim, a equac
ao de oferta, a equacao de demanda a condicao de equilibrio
determinam o preco do mercado e a quantidade de oferta (demanda) quando o mercado est
a
em equilbrio.
3.1.1

Exemplos de Equa
c
oes de Oferta e Demanda

Exemplo 3.1. Modelo de oferta e demanda


Demanda:
Oferta:
Equilbrio:

Qdt = 0 + 1 Pt + 2 Yt + ut
Qst = 0 + 1 Pt + vt
Qdt = Qst .

Nesse modelo encontramos duas variaveis endogenas, o preco Pt e as quantidades Qt , que


sao simultaneamente determinadas pela interacao entre a oferta e a procura. A variavel Yt
(rendimento) e a u
nica vari
avel predeterminada (exogena).

45

CAPITULO 3. EQUAC
OES
SIMULTANEAS

46

Exemplo 3.2. Modelo Keynesiano de equilbrio macroeconomico


Func
ao de Consumo:
Func
ao de Investimento:
Func
ao das Despesas P
ublicas:
Condic
ao de Equilbrio:

Ct = 0 + 1 Yt + 2 Ct1 + ut
It = 0 + 1 Yt + 2 Yt1 + vt
Gt = G
Yt = C t + I t + G t .

No modelo Keynesiano encontramos tres variaveis endogenas: o consumo Ct , o investimento


It e o rendimento Yt , que s
ao simultaneamente determinadas. As variaveis Ct1 , Yt1 e Gt
(gastos p
ublicos) s
ao as predeterminadas.

Exemplo 3.3. Modelo de Phillips


Func
ao de Crescimento dos Salarios:
Func
ao de Crescimento dos Precos:

wt = 0 + 1 Ut + 2 pt + ut
pt = 0 + 1 wt + 2 it + 3 mt + vt .

No modelo de Phillips encontramos duas variaveis endogenas: a taxa de crescimento dos


salarios nominais wt e a taxa de crescimento dos precos internos pt , que sao simultaneamente determinadas. As vari
aveis Ut , (taxa de desemprego), it (taxa de juro) e mt (taxa de
crescimento dos precos de bens importados) sao as exogenas.

Nos sistemas de equac


oes simult
aneas distinguimos os seguintes tipos de variaveis:
as vari
aveis end
ogenas, cujos valores sao determinados dentro do sistema,
as vari
aveis predeterminadas, cujos valores sao determinados fora do sistema.
As vari
aveis predeterminadas podem ser:
vari
aveis ex
ogenas, e
vari
aveis lag (defasadas).
Considerando o seguinte modelo de oferta e demanda
Demanda:

qid = 0 + 1 pi + ui

Oferta:

qis = 0 + 1 pi + vi

Equilbrio:

qid = qis .

(3.1)


3.1. EQUAC
OES
DE OFERTA E DEMANDA

47

Assumimos que cov(ui , vi ) = 0, E(ui ) = 0 e E(vi ) = 0. Pela condicao de equilbrio, temos que
qid = qis = qi .
Assim o sistema pode ser reescrito como
qi = 0 + 1 pi + ui

Equac
oes

qi = 0 + 1 pi + vi ,

Estruturais

em que p e q s
ao vari
aveis end
ogenas. Resolvendo para pi e qi , temos
0 + 1 pi + ui = 0 + 1 pi + vi
pi (1 1 ) = 0 0 + vi ui
0 0
vi ui
pi =
+
1 1 1 1
e

1 0 0 1 1 vi 1 ui
+
+ vi
1 1
1 1
1 0 0 1 1 vi 1 ui
+
,
1 1
1 1

qi = 0 +
=

que sao as equa


c
oes na forma reduzida de p e q. Segue que

cov(pi , ui ) = E[(pi Epi )(ui Eui )]



 
vi ui
= E
ui
1 1


u2i
1
= E
var(ui ),
=
1 1
1 1
ou seja, a covari
ancia entre a vari
avel explicativa p e o termo de erro u e diferente de zero e
e dada por
cov(pi , ui ) =

1
var(ui ),
1 1

(3.2)

cov(pi , vi ) =

1
var(vi ).
1 1

(3.3)

enquanto que

Observa
c
ao 3.1.1. Como 1 < 0 e 1 > 0, temos que o preco e positivamente correlacionado
com ui , ou seja, com deslocamentos na demanda.
Ja vimos que n
ao podemos estimar o modelo via MQO. Temos uma segunda questao: Se
estimarmos qi contra pi estaremos captando a reta estimada de oferta ou de demanda?

CAPITULO 3. EQUAC
OES
SIMULTANEAS

48
3.1.2

Mnimos Quadrados Indiretos (MQI)

Podemos nos deparar com situac


oes mais complexas, como por exemplo despesas e poupanca
familiares. Suponhamos que, para uma famlia escolhida aleatoriamente na populacao, presumimos que os gastos e poupanca familiares anuais sejam conjuntamente determinados por
gastof = 1 poupf + 0 + 1 renda + 2 educ + 3 idade + u,

(3.4)

poupf = 1 gastof + 0 + 1 renda + 2 educ + 3 idade + v,

(3.5)

em que renda e a renda anual e educ e idade sao indicadas em anos e sao variaveis exogenas.
Essa suposic
ao, baseada na maximizacao da utilidade, e bem razoavel indicando que poupf
e gastof s
ao cada uma func
ao da renda, educacao, idade e outras variaveis que afetem o
problema da maximizac
ao da utilidade, tais como as diferentes taxas de retorno sobre gastos
familiares e outras poupancas.
Para definir o metodo MQI vamos considerar o seguinte sistema de equacoes simultaneas

q d = 0 + 1 p + 2 y + u;

(demanda)

q s = 0 + 1 p + 2 R + u;

(oferta)

qd = qs,

(equilbrio)

em que q e p s
ao end
ogenas e y e R sao exogenas (renda e chuva, por exemplo).
Escrevendo as equac
oes acima na forma reduzida

(3.6)


3.1. EQUAC
OES
DE OFERTA E DEMANDA

49

equa
c
oes na forma reduzida

Escrevendo de outra forma temos


q = 0 + 1 y + 2 R + v1

(3.7)

p = 0 + 1 y + 2 R + v 2 .
Observe que R e y s
ao ex
ogenas e, portanto, podemos estimar as equacoes via MQO e obter
estimativas consistentes.
Note tambem que temos seis parametros estruturais (3.6) e seis parametros na equac
ao
reduzida (3.7). Ap
os a estimac
ao teremos um sistema com seis equacoes e seis incognitas.
Assim, e possvel estimar, consistentemente, os parametros estruturais mas de forma indireta.
Esse procedimento e chamado mnimos quadrados indiretos (MQI).
Exemplo 3.4. Se o modelo for
q = 0 + 1 p + 2 y + u1 ;

q = 0 + 1 p + u2 ,

(demanda)

(oferta)

(3.8)
(3.9)

a forma reduzida e

p =

2
0 0
+
y + v1
1 1 1 1

q =

2 1
0 1 0 1
+
y + v2 ,
1 1
1 1

CAPITULO 3. EQUAC
OES
SIMULTANEAS

50
que pode ser reescrito como

p = 0 + 1 y + v 1

q = 0 + 1 y + v2 .
Agora e possvel obter estimadores consistentes via MQO. Mas, ap
os as estimativas teremos 5 par
ametros estruturais e 4 equac
oes (par
ametros na forma reduzida). Assim, n
ao
e possvel estimar todos os par
ametros estruturais. Mas e possvel obter as estimativas dos
par
ametros estruturais da equaca
o de oferta, que s
ao

1
1 =
1

0 = 0 1 0 .

Dizemos que a equac


ao de oferta e identificada, mas a equaca
o de demanda n
ao e identificada. Como podemos
Como podemos observar, nem sempre temos o mesmo n
umeros de equacoes e incognitas.
Entao, antes de estimar, temos que resolver o problema da identificacao.

Exemplo
3.1.3

O Problema da Identifica
c
ao

O problema pode ser descrito como sendo a possibilidade de estimar os parametros estruturais a partir dos coeficientes estimados na forma reduzida. Uma equacao pode ser

N
ao identificada (ou subidentificada)

Exatamente Identificada

Identificada

Super Identificada
3.1.4

N
ao Identificada ou Subidentificada

Para exemplificar o problema da subidentificacao de uma equacao no contexto de equac


oes
simultaneas, considere o seguinte problema:

q = 0 + 1 p + u1 ;

(demanda)

q = 0 + 1 p + u2 ,

(oferta)


3.1. EQUAC
OES
DE OFERTA E DEMANDA

51

em que cov(u1 , u2 ) = 0. A forma reduzida e

p =

0 0
u2 u1
+
1 1 1 1

q =

1 0 1 0 1 u2 0 u1
+
.
1 1
1 1

Observe que neste caso temos quatro parametros estruturais e duas equacoes (dois coeficientes
estimados na equac
ao reduzida). Assim, nao e possvel recuperar o parametro da forma
estrutural.
3.1.5

Exatamente Identificada

Considere o problema

q = 0 + 1 p + 2 y + u1 ;

q = 0 + 1 p + u2 ,

(demanda)

(oferta)

em que cov(u1 , u2 ) = 0. A forma reduzida e

p =

0 0
2 y

+ v1
1 1 1 1

q =

2 1
1 0 1 0
+
+ v2 .
1 1
1 1

Podemos deduzir, ap
os alguns c
alculos simples que

1 =

1
1

0 = 0 1 0 .

Assim, a equac
ao de oferta e exatamente identificada e a equacao de demanda e subidentificada.
Se o modelo em quest
ao for
q = 0 + 1 p + 2 y + u1 ;

(demanda)

q = 0 + 1 p + 2 R + u2 ,

(oferta)

CAPITULO 3. EQUAC
OES
SIMULTANEAS

52

em que cov(u1 , u2 ) = 0. Para a forma reduzida encontraremos

p = 0 + 1 y + 2 R + v1

q = 0 + 1 y + 2 R + v 2 .
Logo, teremos 6 coeficientes estruturais e 6 equacoes (ou seis coeficientes estimados via MQO
na forma reduzida) e, portanto, ambas as equacoes sao exatamente identificadas.
3.1.6

Sobreidentificada

Considere o problema

q = 0 + 1 p + 2 y + 3 W + u1 ;

q = 0 + 1 p + 2 R + u2 ,

(demanda)

(oferta)

em que cov(u1 , u2 ) = 0. A forma reduzida e

p = 0 + 1 y + 2 R + 3 W + v1

q = 0 + 1 y + 2 R + 3 W + v 2 .
Neste caso temos sete par
ametros estruturais e oito equacoes. Assim, com mais equacoes do
que incognitas e possvel encontrar mais de uma solucao, ou seja, mais do que uma estimativa
para cada par
ametro estrutural.
3.1.7

Condi
c
ao de Ordem para Identifica
c
ao

Nas subsec
oes anteriores estudamos casos em que e necessario um previo conhecimento
do estado das equac
oes antes que se aplique qualquer metodo de estimacao. A condicao de
ordem e uma condic
ao necess
aria para que exista a possibilidade de estimacao. A condic
ao
determina que o n
umero de vari
aveis ex
ogenas excludas em que a equac
ao deve ser pelo
menos t
ao grande quanto o n
umero de vari
aveis includas end
ogenos, menos um.
Podemos escrever a condic
ao de ordem da seguinte forma:
m: end
ogenas includas na equacao;
K: ex
ogenas includas no sistema;


3.1. EQUAC
OES
DE OFERTA E DEMANDA

53

: ex
ogenas includas na equacao.
Para que uma equac
ao seja identificada e necessario que:
K m 1.

(3.10)

A igualdade deve ser satisfeita para que o sistema seja exatamente identificado e a desigualdade
deve valer para que o sistema seja sobreidentificado.
No entanto, um argumento mais forte e a condic
ao de posto que e necessaria e suficiente
para a identificac
ao.
3.1.8

Condi
c
ao de Posto (Rank Condition)

Podemos explicar este metodo atraves de um exemplo. Consideramos um sistema de


equacoes simult
aneas constitudo por tres equacoes, tres variaveis endogenas Y1 , Y2 e Y3 e tres
variaveis ex
ogenas Z1,Z2 e Z3. Assinalamos com (+) o fato de a variavel estar includa na
equacao e com () o fato de a vari
avel ser excluda da equacao.
Assim:

Y1

Y2

Y3

Z1

Z2

Z3

Equac
ao 1

Equac
ao 2

Equac
ao 3

De acordo com o quadro anterior a primeira equacao e constituda por duas variaveis
endogenas, Y1 e Y3 , e duas ex
ogenas, Z1 e Z3 , a segunda equacao por uma variavel endogena
Y1 e duas ex
ogenas, Z1 e Z3 , e a terceira equacao por duas endogenas Y2 e Y3 e duas exogenas,
Z1 e Z2 .
A regra de identificac
ao das equacoes pela Condic
ao de Posto e a seguinte: Observamos
os zeros da equac
ao a ser identificada e consideramos os outros elementos da respectiva coluna formando uma matriz A com os elementos restantes (coeficientes). Seja o n
umero
de variaveis excludas da equac
ao a ser identificada e G o n
umero de variaveis endogenas
encontradas no sistema.
(a) quando o posto da matriz A for igual a G 1, (r(A) = G 1), a equacao e exatamente
identificada;
(b) quando o posto da matriz A for superior a G 1, (r(A) > G 1), a equacao e sobreidentificada;

CAPITULO 3. EQUAC
OES
SIMULTANEAS

54

(c) quando a caracterstica da matriz A for inferior a G 1, (r(A) < G 1), a equacao e
subidentificada.
A Condic
ao de Posto e uma condicao necessaria e suficiente.
De acordo com a Condic
ao de Ordem, a 1a e 3a equacoes do nosso exemplo sao exatamente
identificadas (uma vez que = G 1 = 2) mas a 2a equacao e sobreidentificada (dado que
= 3 e G 1 = 2, assim > G 1).
De acordo com a Condic
ao de Posto a 1a equacao nao e identificada (subidentificada),
uma vez que r(A) = 1 < G 1, com
"
A=

+ +

e a 2a e 3a equac
oes s
ao exatamente identificadas, dado que r(A) = 2 = G 1, com
"
A=

+ + +

"
e A=

+ +
+ +

#
, respectivamente.

Para tornar as equac


oes identific
aveis a regra e introduzir (ou retirar) variaveis nas equac
oes,
principalmente vari
aveis desfasadas.
Estima
c
ao
Se a equac
ao e exatamente identificada pode-se utilizar MQI ou MQ2E para a estimac
ao
e estes ser
ao equivalentes. No entanto, se a equacao e sobreidentificada somente podera ser
estimada via MQ2E.

3.2. EXERCICIOS

3.2

55

Exerccios

Exerccio 3.1. Quando usamos modelos de equacao simultaneas? O que e o vies de simultaneidade em MQO? Como identificar e estimar a equacao estrutural?

Exerccio 3.2. Detalhe a estimac


ao de equacoes simultaneas quando se tem sistemas com
mais de duas equac
oes.

Exerccio 3.3. Considere o seguinte modelo de equac


ao simult
anea.

y1 = 1 y2 + 2 x1 + u1 ;
y2 = 3 y1 + 4 x2 + u2 ,
em que x1 e x2 s
ao ex
ogenas e independente dos termos de perturbac
ao u1 e u2 . A forma
reduzida do modelo e:
y1 = 1 x1 + 2 x2 + u1 ;
y2 = 3 x1 + 4 x2 + u2 ,
(a) Se 1 = 1, 2 = 4, 3 = 2 e 4 = 2, determine os valores de 1 , 2 , 3 e 4 .
(b) Se x1 , x2 , u1 e u2 s
ao vari
aveis aleat
orias com distribuic
ao N(0,1), encontre o valor
predito para y1 dado que y2 = x1 = 1.

Exerccio 3.4. Um modelo macroecon


omico simples consiste de uma func
ao consumo e uma
identidade de renda:
C = 1 + 2 Y + u
Y = C + I,
em que C e o consumo agregado, I e o investimento agregado, Y e a renda agregada, e u e
um termo de perturbac
ao. Supondo que I e ex
ogena, derive as equac
oes de forma reduzida
para C e Y .

CAPITULO 3. EQUAC
OES
SIMULTANEAS

56

Exerccio 3.5. Um pesquisador est


a investigando o impacto da publicidade sobre as vendas
usando cross-section data de empresas produtoras de bens de lazer. Para cada empresa
h
a dados sobre as vendas, S e despesas com publicidade, A, ambos medidos em unidades
apropriadas, para um ano recente. O pesquisador prop
oe o seguindo o modelo:
S = 1 + 2 A + uS
A = 1 + 2 S + uA ,
em que uS e uA s
ao termos de perturbac
ao. A primeira relac
ao reflete o efeito positivo
da publicidade sobre as vendas, e o segundo, o fato de grandes empresas, quando medidas
pelas vendas, tendem a gastar mais em publicidade. Faca uma an
alise matem
atica do que
aconteceria se o pesquisador tentasse ajustar o modelo usando MQO.

Exerccio 3.6. Considere o modelo:

Ct = 1 + 2 Yt + t
It = 1 + 2 Yt + 3 Gt1 + ut
Yt = C t + I t + G t

(a) Construa o sistema na forma reduzida.

(b) Considerando a condic


ao de ordem, a equac
ao da func
ao consumo e identificada? E
sobreidentificada?
sobrei(c) Considerando a condic
ao de ordem, a equac
ao de investimento e identificada? E
dentificada?
(d) O que aconteceria com a propens
ao marginal a consumir se ela tivesse sido estimada por
mnimos quadrados ordin
arios com uma equac
ao da forma Ct = a + bYt + t ?

Exerccio 3.7. Considere o modelo de oferta e demanda:

3.2. EXERCICIOS

57

Qot = 1 + 2 Pt + t
Qdt = 1 + 2 Pt + 3 Yt + 4 Pt1 + ut
Qdt = Qot

(a) A equac
ao de oferta est
a identificada? O que acontece se a equac
ao de oferta for estimada
por MQO?
(b) A equac
ao de demanda est
a identificada? O que acontece se a equac
ao de oferta for
estimada por MQO?
(c) Se voce fosse solicitado a estimar a equac
ao de oferta usando vari
aveis instrumentais, o
que voce faria?
(d) Se voce fosse solicitado a estimar a equac
ao de oferta usando MQ2E, o que voce faria?
(e) Voce usaria MQI para estimar a equac
ao de demanda? Por que sim ou por que n
ao?

Exerccio 3.8. Considere o sistema de tres equac


oes:

Y1 = 1 + 2 Y2 + 4 X1 + 5 X2 + u1
Y2 = 1 + 3 Y3 + 5 X2 + u2
Y3 = 1 + 2 Y2 + u3

(a) Usando a condic


ao de ordem, qual das equac
oes acima (se e que h
a uma) n
ao e identificada? Qual e exatamente identificada? Qual e sobreidentificada?
(b) Verifique a condic
ao de posto para cada equac
ao. Qual a conclus
ao final sobre a identificac
ao de cada uma das equac
oes acima?

Exerccio 3.9. A teoria econ


omica sugere que a evoluc
ao do crescimento dos sal
arios nominais (w) pode ser explicada pela taxa de inflac
ao (p), da taxa de desemprego (u), da taxa de
crescimento do produto real (y) e da taxa de crescimento do emprego (l). Considere o seguinte
sistema:

CAPITULO 3. EQUAC
OES
SIMULTANEAS

58

t = 0 + 1 pt + 2 ut + 1t
pt = 0 + 1 t + 2 yt + 2t

(a) Verifique se o sistema e identificado pela condic


ao de ordem e pela condica
o de posto.
(b) Apresente a forma reduzida do modelo.
(c) Suponha agora que a produtividade (q) faca parte da primeira equac
ao.

t = 0 + 1 pt + 2 ut + 3 qt + 1t
pt = 0 + 1 t + 2 yt + 2t

Verifique novamente se o sistema e identificado (especificando que tipo de soluc


oes existem
para os coeficientes estruturais). Indique o metodo de estimac
ao mais adequado para o
modelo.
(d) Considere uma forma alternativa do item anterior:

t = 0 + 1 pt + 2 ut + 3 qt + 1t
pt = 0 + 1 t + 2t

Verifique se o sistema e identificado e, conforme sua resposta, indique o metodo de estimac


ao mais adequado.

[1] Macedo e Carvalho (2010) - http : //www.ipea.gov.br/portal/images/stories/P DF s/T Ds/td1 495.pdf

Captulo 4

S
eries Temporais no Contexto de Regress
ao
Neste captulo abordamos regressao no contexto de series temporais. Comecamos definindo
o que e uma serie temporal e introduzimos algumas propriedades teoricas.

4.1

Introduc
ao

Uma serie temporal e qualquer conjunto de observacoes ordenadas no tempo. Alguns


exemplos s
ao citados abaixo:
a) Estimativas trimestrais do Produto Interno Bruto (PIB);
b) Valores di
arios da temperatura em Campo Bom;
c) Indices di
arios da bolsa de valores de Sao Paulo;
d) Quantidade anual de chuva na cidade do Recife;
e) Um registro de mares no porto de Santos.
Nos exemplos de a) a d) temos series temporais discretas, enquanto que e) e um exemplo
de serie contnua. Podemos obter uma serie temporal discreta a partir da amostragem de uma
serie temporal contnua considerando intervalos de tempos iguais, t. Assim para analisar
a serie e) ser
a necess
ario amostr
a-la, convertendo-a e observando-a no intervalo de tempo
[0, T ], supondo uma serie discreta com N pontos, em que N = t/T (T horas). Existem dois
enfoques utilizados na an
alise de series temporais. Em ambos, o objetivo e construir modelos
para estas series. No primeiro enfoque, a analise e feita no domnio temporal e os modelos
propostos s
ao modelos parametricos (com um n
umero finito de parametros). No segundo,
a analise e conduzida no domnio de frequencias e os modelos propostos sao modelos n
aoparametricos. Dentre os modelos parametricos temos, por exemplo, os modelos ARIMA, que
serao estudados neste curso nos pr
oximos captulos. No domnio de frequencias temos a analise
espectral, que tem in
umeras aplicacoes em ciencias fsicas e engenharia, principalmente na
engenharia eletrica, e que consiste em decompor a serie dada em componentes de frequencias
e onde a existencia do espectro e a caracterstica fundamental. Este tipo de analise nao ser
a
59

CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO

60

estudado nestas notas de aulas, para detalhes o aluno deve consultar Jenkins e Watts (1968),
Koopmans (1974), Morettin (1979), Marple (1987) e Kay (1988).
4.1.1

Exemplos de S
eries Temporais

Exemplo 4.1. Vamos supor que desejamos medir a temperatura m


axima do ar, de um local,
durante 24 horas, poderamos obter um gr
afico semelhante a figura abaixo:

Figura 4.1: Temperatura m


axima diaria medidas em pontos diferentes durante o ano de 2008

Cada curva do gr
afico e chamada de trajet
oria ou serie temporal ou func
ao amostral. No
gr
afico acima Z(j) (t) e o valor da temperatura no instante t, para a j-esima trajet
oria (j-esimo
ponto de observac
ao). Para cada t fixo, teremos os valores de uma vari
avel aleat
oria Z(t) que
ter
a certa distribuic
ao de probabilidade. Na realidade o que chamamos de serie temporal, e
uma parte de uma trajet
oria, dentre muitas que poderiam ter sido observadas. O par
ametro
t pode ser func
ao de algum outro par
ametro fsico como por exemplo: espaco e volume.
4.1.2

Objetivos

Dada uma serie temporal {Z(t1 ), . . . , Z(tN )}, observada nos instantes t1 , . . . , tN , podemos
estar interessados em:
i) Investigar o mecanismo gerador da serie temporal;
ii) Fazer previs
oes de valores futuros da serie; podendo ser a curto ou longo prazo;


FORMAL
4.2. SERIES
TEMPORAIS: DEFINIC
AO

61

iii) Descrever apenas o comportamento da serie atraves de graficos;


iv) Procurar periodicidades relevantes nos dados. Em todos estes casos podemos construir
modelos probabilsticos ou estocasticos, tanto no domnio do tempo como no domnio da
freq
uencia, por exemplo: um sinal aleatorio com frequencia medida em Hz. Devemos
construir modelos simples e com menor n
umero de parametros possveis.

4.2

S
eries Temporais: Definic
ao Formal

Neste captulo vamos descrever os conceitos basicos utilizados dentro da teoria dos modelos
de series temporais. Inicialmente vamos introduzir os conceitos de processos estocasticos,
media e func
ao de covari
ancia, processo estacionario, e funcao de autocorrelacao.
4.2.1

Processos Estoc
asticos

Seja T um conjunto arbitr


ario de ndices. Um processo estocastico e uma famlia Z =
{Zt , t T } tal que, para cada t T , Zt e uma variavel aleatoria (v.a.) definida num espaco de
probabilidades (, A, P ). O conjunto T e normalmente tomado como o conjunto dos inteiros
Z = {0, 1, 2, . . .} ou o conjunto dos reais R. Como, para t T , Zt e uma v.a. definida
sobre , na realidade Zt e uma funcao de dois argumentos, Z(t, ), t T , .
Especifica
c
ao de um Processo Estoc
astico
Sejam t1 , t2 , . . . , tn elementos quaisquer de T e consideremos
F (Z1 , . . . , Zn ; t1 , . . . , tn ) = P {Z(t1 ) z1 , . . . , Z(tn ) zn }

(4.1)

entao, o processo estoc


astico Z = {Z(t), t T } estara especificado se as distribuicoes finitodimensionais de (5.1), s
ao conhecidas para todo n 1. Contudo, em termos praticos, n
ao
conhecemos todas essas distribuic
oes finito- dimensionais. Estudaremos entao certas caractersticas associadas a (5.1) e que sejam simples de calcular e interpretar. Uma maneira de
especificar o processo Z seria determinar todos os produtos dos momentos, ou seja,
(r1 , . . . , rn ; t1 , . . . , tn ) = EZ r1 (t1) . . . Z rn (tn)
ou

(r, t) =

...

Z1r1 . . . Z1rn f (z1 , . . . , zn ; t1 , . . . , tn )dz1 . . . dzn

(4.2)

(4.3)

em que f (Z, t) e a func


ao de densidade de F (Z, t). Porem o que vai nos interessar s
ao
os momentos de baixa ordem, ou seja, os chamados processos estacionarios de 2a ordem.
Consideramos somente os momentos de primeira e segunda ordem, que serao apresentados a
seguir.

CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO

62

4.3

M
edias e Covari
ancias

Para um processo estoc


astico {Zt : t = 0, 1, 2, . . .} a funcao media (f.m.) e definida por
t = E(Zt ), para t = 0, 1, 2, . . .

(4.4)

e a funcao de autocovari
ancia (facov) como
(t, s) = Cov(Zt , Zs ) = E[(Zt t )(Zs s )], para t, s = 0, 1, 2, . . .

(4.5)

em que E[(Zt t )(Zs s )] = E(Zt Zs ) t s .


A func
ao de autocorrelac
ao (fac) e dada por
(t, s) = Corr(Zt , Zs ) =

(t, s)
,
(t, t)(s, s)

(4.6)

em que (t, s) = Cov(Zt, Zs), (t, t) = V ar(Zt ) e (s, s) = V ar(Zs ).


4.3.1

Propriedades Importantes

1. (t, t) = V ar(Zt ),

(t, t) = 1;

2. (t, s) = (s, t), (t, s) = (s, t).


p
3. |(t, s)| (t, t)(s, s), |(t, s)| 1, ou 1 (t, s) 1.
Na correlac
ao podemos verificar que valores proximos de 1 indicam forte dependencia
(linear) e valores pr
oximos de 0 indicam fraca dependencia (linear). Se (t, s) = 0, Zt e Zs
sao nao-correlacionadas. Agora se Zt e Zs sao independentes, entao (t, s) = 0.
Para analisar as propriedades da covariancia de varios modelos de series temporais, o
seguinte resultado ser
a utilizado: se c1 , c2 , . . . , cm e d1 , d2 , . . . , dn sao constantes e t1 , t2 , . . . , tm
e s1 , s2 , . . . , sn s
ao pontos no tempo, entao

m
n
m X
n
X
X
X
Cov
ci Z(ti ),
dj Z(sj ) =
ci dj Cov[Z(ti ), Z(sj )]
i=1

j=1

(4.7)

i=1 j=1

podemos dizer que, a covari


ancia entre duas combinacoes lineares e a soma de todas as covariancias entre termos de suas combinacoes lineares. Esta expressao pode ser verificada
utilizando as propriedades de esperanca e covariancia. Como caso especial, podemos obter o
seguinte resultado

V ar

" n
X
i=1

#
ci Z(ti ) =

n
X
i=1

c2i V ar[Z(ti )] + 2

n n1
X
X
i=2 j=1

ci cj Cov[Z(ti ), Z(tj )].

(4.8)

COM DADOS DE SERIES

4.4. REGRESSAO
TEMPORAIS

4.4

63

Regress
ao com dados de S
eries Temporais

Nesta sec
ao estudaremos modelos de regressao cujas variaveis sao series temporais. O
interesse principal recai sobre as condicoes necessarias para que o estimador de MQO apresente
boas propriedades.
4.4.1

Diferen
ca entre Dados de S
eries Temporais e Dados de Corte Transversal

A primeira diferenca entre dados de series temporais e dados de corte transversal e que
uma serie temporal tem uma ordenacao temporal. Outra caracterstica, e que nao temos
mais independencia entre as observacoes, ou seja, nao temos mais uma amostra aleatoria de
indivduos. Logo, para estimar um modelo do tipo
yt = 0 + 1 + 2 xt1 + xt2 + . . . + k xtk + ut ,

(4.9)

sao necess
arias novas suposic
oes para que o estimador de MQO tenha boas propriedades.
4.4.2

Modelos de Regress
ao de S
eries Temporais

Modelos Est
aticos
Suponha que temos dados de series temporais disponveis para duas variaveis, digamos y
e z, em que yt e zt s
ao datadas contemporaneamente. Um modelo que relaciona y a z e:
yt = 0 + 1 zt + ut , t = 1, 2, . . . , n.

(4.10)

O nome Modelo Est


atico deriva do fato de relacionar as variaveis de forma contemporanea.
Exemplo 4.2. Um exemplo de modelo est
atico e a curva de Phillips estatica, representada
por:
inft = 0 + 1 desempt + ut ,

(4.11)

em que inft e a inflac


ao anual e desempt e a taxa de desemprego.
Este modelo e usado para estudar a relacao de trocas contemporanea entre inft e desempt
pressupondo uma taxa natural de desemprego e expectativas inflacionarias constantes.
Modelos de Defasagem Distribuda Finita
Em um modelo de defasagem distribuda finita (MDD) permite-se que uma ou mais
variaveis afetem y com defasagens
yt = 0 + 0 zt + 1 zt1 + 2 zt2 + ut ,

(4.12)

que e um MDD de ordem 2. De modo mais geral, um modelo de defasagem distribuda de


ordem q incluir
a q defasagens de z.

CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO

64

Para interpretar os coeficientes em (4.12) suponha que z seja constante igual a c, em todos
os perodos de tempo antes de t (. . . , zt2 = c, zt1 = c). Em t, z aumenta em uma unidade,
ou seja, zt = c + 1, e, em seguida, retorna ao seu nvel anterior em t + 1, isto e, zt+1 = c.
Para enfatizar o efeito ceteris paribus de z sobre y, suponhamos que o termo de erro em
cada perodo seja zero. Ent
ao,
yt1 = 0 + 0 c + 1 c + 2 c
yt = 0 + 0 (c + 1) + 1 c + 2 c
yt+1 = 0 + 0 c + 1 (c + 1) + 2 c
yt+2 = 0 + 0 c + 1 c + 2 (c + 1)
yt+3 = 0 + 0 c + 1 c + 2 c,

e assim por diante. Das duas primeiras equacoes temos


yt yt1 = 0 ,
mostra que 0 e a mudanca imediata em y em razao do aumento de uma unidade em z no
tempo t. Denomina-se 0 como propens
ao de impacto ou multiplicador de impacto.
Da mesma forma,
1 = yt+1 yt1 ,
e a mudanca em y ap
os a mudanca temporaria e
2 = yt+2 yt1 ,
e a mudanca em y dois perodos apos a mudanca. Em t + 3, y retornou ao seu nvel inicial
yt+3 = yt1 . Isso ocorre porque presumimos que apenas duas defasagens de z aparecem em
(4.12).
Quando tracamos um gr
afico de j como uma funcao de j obtemos a distribuic
ao de
defasagem, que resume o efeito din
amico que um aumento temporario em z tem em y.
No entanto, o aumento em z pode ser permanente. Suponhamos que antes do tempo t z e
constante igual a c, ou seja, zs = c, para s < t, e no tempo t, z sofre um aumento permanente
de uma unidade no tempo t, ou seja, zs = c + 1 para s t. Novamente, fazendo os erros

4.5. SUPOSIC
OES
PARA MODELOS COM SERIES
TEMPORAIS

65

iguais a zero, temos


yt1 = 0 + 0 c + 1 c + 2 c
yt = 0 + 0 (c + 1) + 1 c + 2 c
yt+1 = 0 + 0 (c + 1) + 1 (c + 1) + 2 c
yt+2 = 0 + 0 (c + 1) + 1 (c + 1) + 2 (c + 1)

e assim por diante. Com o aumento permanente em z, depois de um perodo y aumentou


0 + 1 , e depois de dois perodos, y aumentou 0 + 1 + 2 . Isso mostra que a soma dos
coeficientes de z atual e defazadas,
0 + 1 + 2

(4.13)

e a mudanca de longo prazo em y quando ha um aumento permanente em z. A equacao (4.13)


e chamada propens
ao de longo prazo (PLP).
A generalizac
ao para q defasagens e imediata.

4.5

Suposic
oes para Modelos com S
eries Temporais

Nesta sec
ao o objetivo e mostrar como as hipoteses classicas devem ser alteradas para
cobrir regress
ao de series temporais.
4.5.1

Inexist
encia de Vi
es do MQO

Para que as estimativas via MQO dos parametros de um modelo de regressao com series
temporais n
ao sejam viesadas s
ao necessarias a seguintes hipoteses:

Suposi
c
ao TS.1 (linearidade nos par
ametros).
O processo estoc
astico {(xt1 , xt2 , . . . , yt ) : t = 1, 2, . . . , n}
segue o modelo linear:
yt = 0 + 1 xt1 + + k xtk + ut ,
em que {ut : t = 1, 2, . . . , n} e a sequencia de erros ou perturbacoes.

Suposi
c
ao TS.2 (Inexistencia de colineariedade Perfeita).
Na amostra, nenhuma das vari
aveis independentes e constante ou
combinac
ao linear perfeita das outras.

66

CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO
As hip
oteses TS.1 e TS.2 s
ao essencialmente as mesmas daquelas usadas no contexto de

dados de cortes transversais.

Suposi
c
ao TS.3 (Media condicional zero ou exogeneidade estrita).
O termo de erro em qualquer dado perodo e nao correlacionado com
as vari
aveis explicativas em todos os perodos de tempo, ou seja
E(ut |X) = 0, para t = 1, 2, . . . , n.

Analisando-se a hip
otese TS.3, percebemos que ela difere da hipotese classica. Observe
que a hip
otese TS.3 exige que o erro no tempo t, ut seja nao correlacionado com cada variavel
explicativa em todos os perodos de tempo.
Se em termos de media condicional, temos somente a condicao de nao correlacao somente
no tempo t, da forma
E(ut |x1t , . . . , xtk ) = E(ut |Xt ) = 0,

(4.14)

diz-se que vale a exogeneidade contempor


anea das variaveis explicativas. Exogeneidade contemporanea s
o ser
a suficiente em grandes amostras.
A hip
otese TS.3 e muito forte e muitas vezes nao verificada. Nos seguintes exemplos
podemos ver como ela pode ser verificada na pratica.

Exemplo 4.3. Suponha que a taxa de homicdios (homit ) em uma cidade em termos do
n
umero de policiais per capita (polpct )
homit = 0 + 1 polpct + ut .
O termo de erro u precisaria ser n
ao correlacionados com os valores atuais, os valores
passados e futuros de polpct . Podemos aceitar que u n
ao e correlacionado com valores corrente
e valores passados do regressor. Mas e evidente que um aumento em u hoje, provavelmente,
levar
a a polticas que tentem aumentar polpct no futuro. Logo TS.3 falha.
Quando u e correlacionado com o passado dos regressores, podemos resolver o problema
incluindo defasagens dos regressores e utilizando um modelo de defasagem distribuda. Mas
nao podemos ter, de forma alguma, a influencia de u no futuro dos regressores.
Teorema 4.5.1. Sob as Hip
oteses ST.1, ST.2 e ST.3 os estimadores de MQO s
ao n
ao viesa-

4.5. SUPOSIC
OES
PARA MODELOS COM SERIES
TEMPORAIS

67

dos condicionados a X e, portanto, tambem incondicionalmente:


E(j ) = j , j = 1, . . . , k.

4.5.2

(4.15)

Vari
ancia dos Estimadores MQO

necess
E
ario mais duas hip
oteses para completar o conjunto de hipoteses de Gauss-Markov
para regress
oes de series temporais. A primeira delas e familiar da analise de corte transversal.

Suposi
c
ao TS.4 (Homoscedasticidade).
Condicional a X, a vari
ancia de ut e a mesma para todo t:
V ar(ut |X) = V ar(ut ) = 2 , para t = 1, 2, . . . , n.

Suposi
c
ao TS.5 (Inexistencia de Correlac
ao Serial).
Condicional a X, os erros em dois perodos de tempos diferentes
sao n
ao correlacionados:
Corr(ut , us |X) = 0, para todo t 6= s.
Com este conjunto de condic
oes podemos enunciar o teorema de Gauss-Markov no contexto
de series temporais.
Teorema 4.5.2. (Teorema de Gauss-Markov). Sob as Hip
oteses ST.1 a ST.5 os estimadores
de MQO s
ao os melhores estimadores lineares n
ao viesados condicionais a X, ou seja, s
ao
BLUE.

4.5.3

Infer
encia sob as Hip
oteses do Modelo Linear Cl
assico

Para que sejam v


alidos os testes t, F e outros testes estatsticos baseadas nos erros padr
oes
e necessario adicionar mais uma hipotese a respeito da distribuicao dos erros. Esta hipotese
e analoga `
a hip
otese de normalidade usada para analise de corte transversal.

CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO

68

Suposi
c
ao TS.6 (Normalidade).
Os erros ut s
ao independentes de X e sao i.i.d. com distribuicao
normal com media zero e vari
ancia 2
ut N (0, 2 ),

para t = 1, 2, . . . , n.

Teorema 4.5.3. Sob as hip


oteses TS.1 a TS.6, as hip
oteses do modelo linear cl
assico para
series temporais, os estimadores MQO s
ao normalmente distribudos, condicional em X.
Alem disso, a estatstica t tem uma distribuic
ao t, e cada estatstica F tem uma distribuica
o
F.

4.5.4

Tend
encia

Quando trabalhamos com series temporais e necessario saber reconhecer se estas series
contem uma tendencia temporal. Ignorar o fato de que duas series temporais podem ser
correlacionadas somente porque ambas estao apresentando uma mesma tendencia ao longo do
tempo, em vez de uma relac
ao causal, pode levar a conclusoes erroneas e a possibilidade de
uma regress
ao esp
uria. Vejamos o exemplo de uma serie temporal com tendencia temporal:

Figura 4.2: Consumo mensal aparente de


alcool carburante (media das quantidades di
arias) em milhares de Barris. Fonte: Agencia Nacional do Petr
oleo (ANP).

4.5. SUPOSIC
OES
PARA MODELOS COM SERIES
TEMPORAIS

69

Um modelo que captura tendencia temporal e:


yt = 0 + 1 t + et ,

t = 1, 2, . . . ,

(4.16)

em que assume-se que {et } e i.i.d. com E(et ) = 0 e var(et ) = 2 . Observe que o parametro 1
multiplica o tempo, resultando em uma tendencia temporal linear. Assim, 1 mede a mudanca
em yt , de um perodo para o pr
oximo, motivado pela passagem do tempo, mantendo-se todos
os outros fatores fixos.
Outros modelos podem ser usados para capturar tendencias temporais, dependendo da
situacao. No modelo em que o logaritmo natural de yt (presumindo que yt > 0) apresenta
uma tendencia temporal linear,
log(yt ) = 0 + 1 t + et ,

t = 1, 2, . . . ,

(4.17)

diz-se que yt tem uma tend


encia exponencial .
Outra possibilidade e que em vez de uma tendencia temporal linear, poderamos ter uma
tend
encia temporal quadr
atica,
yt = 0 + 1 t + t2 + et ,

t = 1, 2, . . . .

(4.18)

Usando vari
aveis de tend
encia na an
alise de regress
ao
Suponha que existam dois fatores observados, xt1 e xt2 que afetam yt . Alem disso, existem
fatores n
ao observados que est
ao sistematicamente crescendo ou decrescendo ao longo do
tempo. Um modelo que captura isso e:
yt = 0 + 1 xt1 + 2 xt2 + 3 t + ut .

(4.19)

Permitindo uma tendencia temporal no modelo, reconhece-se que yt pode estar crescendo ou
decrescendo ao longo do tempo por razoes essencialmente nao relacionadas a xt1 e xt2 .
A omiss
ao da vari
avel t pode levar ao vies por omissao de variavel, especialmente se xt1
ou xt2 apresentarem algum tipo de tendencia, pois elas podem ser altamente correlacionadas
com t.
Adicionando um termo de tendencia linear em um modelo de regressao e a mesma coisa
que usar serie destendenciadanuma regressao. Os estimadores 1 e 2 do modelo (4.19)
podem ser obtidos atraves de um procedimento de remocao da tendencia temporaldas series
originais:
Destendenciar uma serie envolve regredir cada variavel do modelo em t e uma constante

CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO

70

(no caso de (4.19), regredir yt , xt1 e xt2 contra t e uma constante).


Os resduos destas regress
oes, yt , x
t1 e x
t2 , constituem uma serie temporal sem tendencia.
Em seguida, realizar a regress
ao com variaveis retificada,
yt = 1 x
t1 + 2 x
t2 + v,

(4.20)

(nao precisa intercepto, ser


a igual a 0). As estimativas via MQO, 1 e 2 serao iguais as
estimativas 1 e 2 da regress
ao (4.19).

4.5.5

Sazonalidade

Sazonalidade ocorre quando uma serie exibe comportamentos semelhantes em determinados perodos. Um exemplo e o PIB trimestral (industria)

Figura 4.3: PIB trimestral: dados observados industria. Fonte: IBGE.

comum que as series de dados mensais e trimestrais exibam padroes sazonais, mas isso
E
nao e uma regra. Por exemplo, n
ao existe padrao sazonal observavel nas taxas de juros ou
de inflacao. Alem disso, series que exibem padroes sazonais sao ajustadas sazonalmente
antes de serem informadas para o p
ublico.
Uma serie ajustada sazonalmente e a serie que teve os fatores sazonais removidos. Existem
varios metodos para isso. Um dos metodos mais simples e incluir um conjunto de variaveis

4.5. SUPOSIC
OES
PARA MODELOS COM SERIES
TEMPORAIS

71

dummies sazonais. Seja o seguinte modelo para dados mensais:


yt = 0 + 1 f evt + 2 mart + + 11 dezt + 1 xt1 + + k xtk + ut .

(4.21)

em que f evt , mart , , dezt s


ao variaveis dummy indicando se o perodo de tempo t correspondo ao mes apropriado. Nesta formulacao, janeiro e o mes-base e 0 seu intercepto. Se
colocarmos janeiro no modelo e um intercepto, teremos um problema de multicolineariedade.
Se nao existir sazonalidade em yt , dado que controlamos os regressores xtj , entao os
coeficientes 1 ; . . . ; 11 devem ser todos iguais a zero, o que pode ser testado atraves de um
teste F .
Considere o modelo (4.21), para k = 2, ou seja 2 regressores. Podemos obter os seus
estimadores, 1 e 2 , atraves do seguinte procedimento:
1. Regrida a vari
avel dependente, e cada um dos regressores, separadamente, contra uma
constante e as dummies mensais e guarde os resduos, digamos yt , x
t1 e x
t2 . Po exemplo,
yt = yt
0
1 f evt
2 mart
11 dezt .
Este e o metodo para dessazonalizar uma serie temporal mensal.
2. Roda a regress
ao de yt contra x
t1 e x
t2 sem as dummies mensais.

4.5.6

Processos de covari
ancia estacion
aria

Um processo estoc
astico e covariancia estacionaria se E(xt ) e constante, V ar(xt ) e constante e para qualquer t, h 1, Cov(xt , xt+h ) depende apenas em h, e nao em t. Mais adiante
abordaremos essa definic
ao com maior profundidade.

4.5.7

Processos Fracamente Dependente

Uma serie temporal estacion


aria e fracamente dependente se xt e xt+h sao quase independentes, quando h aumenta.
Se, para um processo de covari
ancia estacionaria Corr(xt , xt+h ) 0 quando h ,
dizemos que este processo de covari
ancia estacionaria e fracamente dependente.
Essa definic
ao e necess
aria para usar Leis dos Grandes N
umeros e Teorema Central do
Limite.

Exemplo: MA(1) pg 356 Wooldridge.

72

CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO
Exemplo: AR(1) pg 356 Wooldridge.

4.6. EXERCICIOS

4.6

73

Exerccios

Exerccio 4.1. Sobre regress


ao com series temporais responda:
a) Quais as principais diferencas entre dados transversais e series temporais?
b) Explique o que e exogeneidade contempor
anea e exogeneidade estrita.
c) Comente sobre a diferenca entre homocedasticidade e correlac
ao serial.
d) A suposic
ao de normalidade dos erros e necess
aria para se obter estimadores consistentes
via MQO? Qual e o objetivo ao se fazer uma suposic
ao para distribuic
ao dos erros?

Exerccio 4.2. (anpec-2010) Considere o modelo de regress


ao linear m
ultipla com regressores
estoc
asticos yt = 1 x1t +2 x2t +t , no qual t n
ao e autocorrelacionado e tem media e vari
ancia
condicionais a x1t e x2t iguais a zero e s2 , respectivamente. Por simplicidade, suponha que
as vari
aveis s
ao expressas como desvios com relac
ao `
as respectivas medias. Responda:
a) Se 2 = 0 e incluirmos x2t na regress
ao, o estimador de mnimos quadrados ordin
arios de
1 ser
a viesado?
b) Se n
ao conseguirmos observar x1t , mas apenas x1t = x1t + ut , em que ut e um erro de
medida, e se substituirmos x1t por x1t na regress
ao, o estimador de mnimos quadrados
ordin
arios de 1 ainda assim ser
a consistente?
c) Se x2t = yt1 e relaxarmos a hip
otese de que os erros t s n
ao s
ao autocorrelacionados,
o estimador de mnimos quadrados ordin
arios de 2 ser
a consistente, porem n
ao ser
a
eficiente?
d) Seja c uma constante diferente de zero. Defina y = cyt , x
1t = cx1t e x
2t = cx2t . Os
estimadores de mnimos quadrados ordin
arios (MQO) em uma regress
ao de y contra x
1t e
x
2t coincidem com os estimadores de MQO em uma regress
ao de yt contra x1t e x2t ?
e) A vari
ancia do estimador de mnimos quadrados ordin
arios diverge para infinito `
a medida
que a correlac
ao entre x1t e x2t aproxima-se de 1;
f ) Denote por bt o resduo da regress
ao de mnimos quadrados ordin
arios. A hip
otese de que
1 PT
o erro e correlacionado com x1t pode ser testada utilizando a estatstica T i=1 x1i bi ?

74

CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO

Exerccio 4.3. Em uma equac


ao de dados anuais, supondo que
jurt = 1, 6 + 0, 48inft 0, 15inft1 + 0, 32inft2 + ut ,
em que jur e a taxa de juros e inf e a taxa de inflaca
o.
a) Supondo v
alida a hip
otese de exogeneidade estrita, como deve ter sido estimado o modelo
acima? Justifique?
b) Qual e o efeito de curto prazo (propens
ao de impacto) da taxa de inflac
ao sobre a taxa
juros? Qual e o efeito de longo prazo da taxa de inflac
ao sobre a taxa de juros?

Exerccio 4.4.
Considere uma serie temporal de 10 anos contendo PIB (em R$) e n
umero de homicdios (em
unidades) em um determinado pas. O primeiro modelo estimado foi pibt = 0 +1 homict +ut .
Os resultados da estimac
ao se encontram na tabela 1. Um segundo modelo foi pibt = 0 +
1 homict + 2 t + ut , em que t e um termo de tendencia. Os resultados da estimac
ao desse
modelo se encontram na tabela 2:

(Intercept)
homic

(Intercept)
homic
t

Estimate
-3461194.26
102.63

Tabela 1
Std. Error
314948.06
6.12

t-value
-10.99
16.76

Pr(t)
0.00
0.00

Estimate
5564710.45
-123.64
423054.01

Tabela 2
Std. Error
2539866.04
63.59
118647.95

t-value
2.19
-1.94
3.57

Pr(t)
0.06
0.09
0.01

a) O coeficiente de homic e significativo no primeiro modelo a 5% de signific


ancia? Interprete
o valor desse coeficiente.
b) O coeficiente de homic e significativo no segundo modelo a 5% de signific
ancia? Interprete
o valor desse coeficiente.
c) O coeficiente de t e significativo no segundo modelo a 5% de signific
ancia? Interprete o
valor desse coeficiente.

4.6. EXERCICIOS

75

d) Explique o resultado (surpreendente) encontrado no primeiro modelo, ressaltando a import


ancia do procedimento adotado no segundo modelo.
Exerccio 4.5. Considere uma serie do PIB brasileiro com incio no primeiro trimestre 1996
e fim no segundo bimestre de 2010. Essa serie foi decomposta em sua tendencia (t) e vari
aveis
dummy para a sazonalidade, em que Si = 1, se a observac
ao pertence ao trimestre i e Si = 0,
caso contr
ario.
a) Se tentarmos estimar o modelo pibt = 0 + 1 S1 + 2 S2 + 3 S3 + 4 S4 + t + ut , qual
problema encontraremos? Explique porque isso ocorre.
b) No modelo pibt = 1 S1 + 2 S2 + 3 S3 + 4 S4 + t + ut , o que mede cada um dos 0 s?
c) No modelo pibt = 0 + 2 S2 + 3 S3 + 4 S4 + t + ut , o que mede 2 ?
d) No modelo pibt = 0 + t + 2 S2 + 3 S3 + 4 S4 + ut , foi estimado e apresentou a seguinte
tabela ANOVA (Tabela 3). Faca um teste F para a hip
otese nula de que n
ao h
a sazonalidade. Use = 5%

t
s2
s3
s4
Residuals

Df
1
1
1
1
53

Tabela 3. ANOVA
Sum Sq
2287298699531.79
1216754395.49
31129772.60
5037536508.88
106216397798.70

Mean Sq
2287298699531.79
1216754395.49
31129772.60
5037536508.88
2004082977.33

Exerccio 4.6. Considere o modelo yt = 0 + 0 zt + 1 zt1 + 2 zt2 + ut .


a) Por que devemos considerar a possibilidade de multicolinearidade nesse modelo?
b) Reparametrize o modelo de modo a isolar o efeito de longo prazo como coeficiente da
vari
avel zt .
c) Qual o benefcio dessa reparametrizac
ao se estivermos interessados em testar a signific
ancia
do efeito de LP da z sobre y?

Exerccio 4.7. Considere o seguinte modelo est


atico crimet = 0 + 1 + polt + ut , em que
crimet e um ndice de criminalidade no perodo t e polt e o n
umero de policiais em t.

CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO

76

a) Supondo que pol seja estritamente ex


ogeno na equaca
o, como voce estimaria 0 e 1 . Quais
as propriedades do estimador proposto em termos de vies e consistencia?
b) Suponha agora que o n
umero de policiais em t seja definido em func
ao do ndice de criminalidade do perodo anterior. A hip
otese de exogeneidade estrita continua v
alida? Justifique.

Exerccio 4.8. Um modelo de ajustamento parcial e dado por:


yt = 0 + 1 xt + et
yt yt1 = (yt yt1 ),
em que yt e o nvel desej
avel ou
otimo de y, e yt e o nvel efetivo (observado). Por exemplo,
yt e o crescimento desej
avel nos estoques de uma firma e xt e o crescimento de vendas da
firma. O par
ametro mede a velocidade do ajustamento e satisfaz 0 < < 1.
a) Insira a primeira equac
ao na segunda equaca
o e mostre que podemos escrever yt = 0 +
1 yt1 + 2 xt + ut . Quem s
ao os 0 s em termos dos 0 s e ? Quem e ut em termos de
et ?
b) Supondo que E(et |xt , yt1 ) = 0 e todas as series sejam fracamente dependentes, como voce
consistente? Justifique sua resposta. O estimador proposto e viciado?
estimaria os 0 s? E
c) Seja
1 = 0, 7 e
2 = 0, 2. (i) Qual o coeficiente de ajustamento estimado? (ii) Qual o
efeito de CP (curto prazo) de um crescimento das vendas da firma sobre o crescimento de
estoques da firma? (iii) Qual e o efeito de LP (longo prazo)?

Exerccio 4.9. Imagine o seguinte modelo: Yt = 0 + 1 Xt + ut , onde Y e a demanda por


moeda, X e a taxa de juros esperada no longo prazo e u e um termo de erro cl
assico, n
ao
correlacionado com X . Como a vari
avel de expectativa X n
ao e diretamente observ
avel,

proporemos a seguinte hip


otese para formac
ao de expectativas (adaptativas): Xt Xt1
=

(Xt Xt1 ), em que , tal que 0 < < 1, e conhecido como coeficiente de expectativas.
a) Mostre que podemos escrever esse modelo como Yt = 0 + 1 Xt + 2 Yt1 + vt . Quem s
ao
os 0 s em termos dos 0 s e ? Quem e vt em termos de ut ?
b) O que podemos dizer a respeito dos estimadores de MQO nesse caso? Justifique.

4.6. EXERCICIOS

77

c) Imagine que no modelo original ut siga o esquema auto-regressivo de primeira ordem, i.e.,
ut = ut1 + t , em que e o coeficiente de autocorrelac
ao e onde t satisfaz as premissas
cl
assicas. Se = , como voce estimaria o modelo? Justifique.
d) As estimativas obtidas no item anterior s
ao n
ao-viciadas? Consistentes? Justifique sua
resposta.

Exerccio 4.10. Seja o processo yt = et + 1 et1 , em que et iid(0, 2 ).


1. Calcule E(yt ), V ar(yt ) e Cov(yt , yth ), h = 1, 2, 3, . . .. O processo yt e de covari
ancia
estacion
aria?
2. Calcule as autocorrelac
oes de primeira ordem e de segunda ordem para esse processo.
Podemos dizer que o processo e fracamente dependente? Justifique.
3. Faca o correlograma (gr
afico da func
ao de autocorrelac
ao em func
ao das defasagens)
para esse processo.

Exerccio 4.11. Seja o processo yt = c + yt1 + et , em que et iid(0, 2 ).


a) Qual e a condic
ao de estabilidade para esse processo? Calcule E(yt ) e V ar(yt ) considerando
v
alida a condic
ao de estabilidade.
b) Para o processo yt acima temos que Cov(yt , yth ) =

h 2
,
12

h = 1, 2, 3, . . .. O processo yt e

de covari
ancia estacion
aria? Justifique.
c) Calcule a autocorrelac
ao de ordem h para o processo yt . Faca o correlograma ate quatro
defasagens para esse processo considerando = 0, 5.

78

CAPITULO 4. SERIES
TEMPORAIS NO CONTEXTO DE REGRESSAO

Captulo 5

S
eries Temporais e Econometria
5.1

S
eries Temporais: Definic
ao Formal

Neste captulo vamos descrever os conceitos basicos utilizados dentro da teoria dos modelos
de series temporais. Inicialmente vamos introduzir os conceitos de processos estocasticos,
media e func
ao de covari
ancia, processo estacionario, e funcao de autocorrelacao.

5.1.1

Processos Estoc
asticos

Seja T um conjunto arbitr


ario de ndices. Um processo estocastico e uma famlia Z =
{Zt , t T } tal que, para cada t T , Zt e uma variavel aleatoria (v.a.) definida num espaco de
probabilidades (, A, P ). O conjunto T e normalmente tomado como o conjunto dos inteiros
Z = {0, 1, 2, . . .} ou o conjunto dos reais R. Como, para t T , Zt e uma v.a. definida
sobre , na realidade Zt e uma funcao de dois argumentos, Z(t, ), t T , .

Especifica
c
ao de um Processo Estoc
astico
Sejam t1 , t2 , . . . , tn elementos quaisquer de T e consideremos
F (Z1 , . . . , Zn ; t1 , . . . , tn ) = P {Z(t1 ) z1 , . . . , Z(tn ) zn }

(5.1)

entao, o processo estoc


astico Z = {Z(t), t T } estara especificado se as distribuicoes finitodimensionais de (5.1), s
ao conhecidas para todo n 1. Contudo, em termos praticos, n
ao
conhecemos todas essas distribuic
oes finito- dimensionais. Estudaremos entao certas caractersticas associadas a (5.1) e que sejam simples de calcular e interpretar. Uma maneira de
especificar o processo Z seria determinar todos os produtos dos momentos, ou seja,
(r1 , . . . , rn ; t1 , . . . , tn ) = EZ r1 (t1) . . . Z rn (tn)

79

(5.2)


CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA

80
ou

(r, t) =

...

Z1r1 . . . Z1rn f (z1 , . . . , zn ; t1 , . . . , tn )dz1 . . . dzn

(5.3)

em que f (Z, t) e a func


ao de densidade de F (Z, t). Porem o que vai nos interessar s
ao
os momentos de baixa ordem, ou seja, os chamados processos estacionarios de 2a ordem.
Consideramos somente os momentos de primeira e segunda ordem, que serao apresentados a
seguir.

5.2

M
edias e Covari
ancias

Para um processo estoc


astico {Zt : t = 0, 1, 2, . . .} a funcao media (f.m.) e definida por
t = E(Zt ), para t = 0, 1, 2, . . .

(5.4)

e a funcao de autocovari
ancia (FACV) como
(t, s) = Cov(Zt , Zs ) = E[(Zt t )(Zs s )], para t, s = 0, 1, 2, . . .

(5.5)

em que E[(Zt t )(Zs s )] = E(Zt Zs ) t s .


A func
ao de autocorrelac
ao (FAC) e dada por
(t, s) = Corr(Zt , Zs ) =

(t, s)
,
(t, t)(s, s)

(5.6)

em que
(t, s) = Cov(Zt , Zs ),

(t, t) = V ar(Zt )
e
(s, s) = V ar(Zs ).
Observe que estas func
oes dependem do tempo, mas existem processos em que essas quantidades n
ao possuem dependencia temporal. Processos com estas caractersticas serao abordados mais adiante.

Propriedades Importantes
1. (t, t) = V ar(Zt ),

(t, t) = 1;

2. (t, s) = (s, t), (t, s) = (s, t).

5.3. ESTACIONARIEDADE
p

3. |(t, s)|

81

(t, t)(s, s), |(t, s)| 1, ou 1 (t, s) 1.

Na correlac
ao podemos verificar que valores proximos de 1 indicam forte dependencia
(linear) e valores pr
oximos de 0 indicam fraca dependencia (linear). Se (t, s) = 0, Zt e Zs
sao nao-correlacionadas. Agora se Zt e Zs sao independentes, entao (t, s) = 0.
Para analisar as propriedades da covariancia de varios modelos de series temporais, o
seguinte resultado ser
a utilizado: se c1 , c2 , . . . , cm e d1 , d2 , . . . , dn sao constantes e t1 , t2 , . . . , tm
e s1 , s2 , . . . , sn s
ao pontos no tempo, entao

m
n
m X
n
X
X
X
Cov
ci Z(ti ),
dj Z(sj ) =
ci dj Cov[Z(ti ), Z(sj )]
i=1

j=1

(5.7)

i=1 j=1

podemos dizer que, a covari


ancia entre duas combinacoes lineares e a soma de todas as covariancias entre termos de suas combinacoes lineares. Esta expressao pode ser verificada
utilizando as propriedades de esperanca e covariancia. Como caso especial, podemos obter o
seguinte resultado

V ar

" n
X

#
ci Z(ti ) =

i=1

5.3

n
X
i=1

c2i V ar[Z(ti )] + 2

n n1
X
X

ci cj Cov[Z(ti ), Z(tj )].

(5.8)

i=2 j=1

Estacionariedade

Uma serie temporal e estacion


aria quando ela se desenvolve aleatoriamente, no tempo,
em torno de uma media constante, refletindo alguma forma de equilbrio estavel. Entretanto, a maior parte das series que encontramos na pratica apresenta alguma forma de n
ao
estacionariedade. As series econ
omicas apresentam em geral tendencias lineares positivas
ou negativas. Podemos ter, tambem, uma forma de nao-estacionariedade explosiva, como o
crescimento de uma col
onia de bacterias. A classe dos modelos ARIMA (autorregressivo integrado de medias m
oveis), ser
ao capaz de descrever de maneira satisfatoria series estacionarias
e nao-estacion
arias, mas que n
ao apresentam comportamento explosivo. A serie pode ser
estacionaria, flutuando ao redor de um nvel, por um certo tempo, depois mudar de nvel e
flutuar ao redor de um novo nvel e assim por diante, ou entao mudar de inclinacao, ou ambas
as coisas. A figura 5.1 ilustra esta forma de nao-estacionariedade.


CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA

82

Figura 5.1: Series temporais nao estacionarias

5.3.1

Estacionariedade estrita

Especificamente um processo estocastico Z(t) e considerado estritamente estacion


ario se
a distribuic
ao conjunta de Z(t1 ), Z(t2 ), . . . , Z(tn ) e a mesma distribuicao conjunta de Z(t1
k), Z(t2 k), . . . , Z(tn k), para todos os tempos t1 , t2 , . . . , tn e para todos os lags (posicoes)
k (constante). Quando n = 1, a distribuicao de Zt e igual a distribuicao de Ztk para qualquer
k, ou seja, se os Z 0 s s
ao identicamente distribudos, E(Zt ) = E(Zt k), para todo t e k, e as
funcoes media, t , e vari
ancia V ar(Zt ) = V ar(Zt k) sao constantes para todo tempo t.
Quando n = 2, a distribuic
ao de (Zt , Zs ) e a mesma de (Ztk , Zsk ), do qual temos
Cov(Zt , Zs ) = Cov(Zt k, Zsk ), para todo t, s e k.
Fazendo k = s temos:
(t, s) = Cov(Zt , Zs ) = Cov(Ztk , Zsk )
= Cov(Zts , Zss ) = Cov(Zt s, Z0 )
= (t s, 0);
e se k = t,

(t, s) = Cov(Ztt , Zst ) = Cov(Z0 , Zst )


= Cov(Z0 , Zts )
= (0, s t),

5.3. ESTACIONARIEDADE

83

onde podemos concluir que

t s,
(t, s) = (0, |t s|, onde |t s| =
s t,

para t > s;
para s > t.

A covari
ancia entre Zt e Zs depende somente da diferenca temporal |t s| e nao dos
tempos t e s. Alem disso, para um processo estacionario simplificando a notacao temos
(k) = Cov(Zt , Ztk )

(5.9)

(k) = corr(Zt , Ztk ).

(5.10)

As propriedades gerais para um processo estacionario sao:


1. 0 = V ar(Zt ), (0) = 1;
2. (k) = (k), (k) = (k);
3. |(k)| (0),

|(k)| 1.

Se um processo e estritamente estacionario e tem variancia finita, entao a FACV depende


somente de um certo lag k.

5.3.2

Fracamente estacion
ario ou estacionariedade de segunda ordem

Uma definic
ao que e semelhante a estritamente estacionaria mas e matematicamente mais
fraca, e a seguinte: um processo estocastico Zt e dito ser fracamente (ou de segunda-ordem)
estacion
ario se:
1. a func
ao media e constante para todo tempo t;
2. (t, t k) = (0, k) para todo tempo t e de lag k.

5.3.3

Teste para Signific


ancia das Autocorrela
c
oes

Para testar a hip


otese conjunta de que todos os k s sao simultaneamente iguais a zero
pode-se usar a estatstica Q desenvolvida por Box e Pierce, definida por:
Q(m) = n

m
X
k=1

2k (
)

(5.11)


CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA

84

em que n e o tamanho da amostra (serie) e m e a defasagem (ou lag) considerado. A estatstica


Q em grandes amostras tem distribuicao qui-quadrado com m graus de liberdade
Outro teste usual para verificar a significancia de k e o teste de Ljung-Box (LB). A
estatstica LB e dada por:
m
X
2k (
)
Q(m) = n(n + 2)
nk

(5.12)

k=1

que se distribui como uma qui-quadrado com m graus de liberdade em grandes amostras. A
estatstica LB possui maior poder para amostras pequenas que a estatstica Q.

5.3.4

Fun
c
ao de autocorrela
c
ao Parcial (FACP)

A func
ao de autocorrelac
ao parcial (FACP) e a correlacao entre as variaveis yt e yt+k dado
que sao conhecidos yt+1 , yt+2 , . . . , yt+k1 .
A FACP para um processo estacionario com media zero pode ser obtida a partir da
regressao
yt+k = k1 yt+k1 + k2 yt+k2 + + kk yt + t+k .

(5.13)

Multiplicando ambos os lados por yt+kj e calculando o valor dividindo pela variancia,
tem-se
j = k1 j1 + k2 j2 + + kk kj .
Entao para j = 1, 2, . . . , k, temos:

1 = k1 0 + k2 1 + + kk k1 ;
2 = k1 1 + k2 0 + + kk k2 ;
..
.
k = k1 k1 + k2 k2 + + kk 0 ;

Para k = 1 11 = 1 .
Para k = 2 1 = 21 + 22 1 e 2 = 21 1 + 22 .
Ou podemos escrever a ultima equacao em notacao matricial:
" #
1
2

"
=

#" #
21
22

5.3. ESTACIONARIEDADE

85

cuja soluc
ao para o estimador de 22 e dada pela regra de Cramer:

22



1
1



1 2

=

1 1


1 1

Para k = 3 temos as equac


oes:
1 = 31 + 32 1 + 33 2
2 = 31 1 + 32 + 33 1
3 = 31 + 32 1 + 33 .
Em notac
ao matricial temos:


1
1 1 2
31


2 = 1 1 1 32 .
3
2 1 1
33
cuja soluc
ao para o estimador de 33 e dada por:

33


1


1

2
=
1


1

2


1 1

1 2

1 3
,
1 2

1 1

1 1

e assim sucessivamente.

5.3.5

Operador de Defasagem ou Operador lag

Em series temporais e usual trabalhar com operadores que defasam a variavel. Definimos
entao o operador de defasagem L como um operador linear tal que:
Lj yt = ytj
Sao v
alidas as seguintes propriedades do operador L:
1. O lag de uma constante e a propria constante Lc = c;

(5.14)


CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA

86

2. O operador lag segue a propriedade distributiva em relacao `a soma


(Li + Lj )yt = Li yt + Lj yt = yti + ytj ;
v
3. E
alida a propriedade associativa da multiplicacao
Li Lj yt = Li (Lj yt ) = Li (ytj ) = ytij .
Ou ainda Li Lj yt = Li+j yt = ytij ;
4. Potencias negativas de L significam um operador de avanco, Li yt = Lj yt , fazendo
j = i. Ent
ao Li yt = Lj yt = ytj = yt+i ;
5. Se |a| < 1 a soma infinita
(1 + aL + a2 L2 + )yt =

yt
1 aL

6. Se |a| > 1 a soma infinita


(1 + (aL)1 + (aL)2 + )yt =

5.3.6

aL
yt
1 aL

Rudo Branco

Um importante exemplo de processo estacionario e o rudo branco, o qual e definido como


uma sequencia de vari
aveis aleat
orias {at }
t= com as seguintes propriedades:
1. E(at ) = 0, para todo t R;
2. E(a2t ) = 2 para todo t R;
3. E(at as ) = 0, para todo t 6= s, com t, s R.
Denotaremos um processo rudo branco por RB(0, 2 ).

5.3. ESTACIONARIEDADE

87

Muitos processos podem ser construdos a partir do rudo branco. Pode-se verificar facilmente que a sequencia {at } e estritamente estacionaria
P [a(t1 ) x1 , a(t2 ) x2 , , a(tn ) xn ]
= P [a(t1 ) x1 ]P [a(t2 ) x2 ] . . . P [a(tn ) xn ]
= P [a(t1 k) x1 ]P [a(t2 k) x2 ] . . . P [a(tn k) xn ]
= P [a(t1 k) x1 , a(t2 k) x 2, , a(tn k) xn ].
A primeira igualdade e devido a independencia das variaveis e a segunda por serem identicamente distribudas.
Temos tambem que t = E(at ) e constante com FACV dada por

V ar(a ),
t
(t, s) =
0,

se t = s;
se s 6= t.

e FAC dada por

1,
(k) =
0,

se t = s;
se s 6= t.

O termo rudo branco resulta do fato que em uma analise de frequencia do modelo, podemos mostrar que todas as frequencias sao iguais.
As caracteristicas de um processo rudo branco ficam explcitas quando analisamos o
seguinte gr
afico

Exemplo 5.1. (M
edia-M
ovel de ordem 1)
Suponha
Yt = at 0.5at1 ,
emm que at s
ao v.a.i.i.d. com media zero e vari
ancia a2 .
t = E(Yt ) = E(at ) 0.5E(at1 ) = 0
e
V ar(Yt ) = V ar(at 0.5at1 ) = a2 + 0.5a2 = 1.25a2 .


CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA

88

Figura 5.2: Rudo branco gaussiano simulado,FAC amostral e FACP amostral

Tambem
Cov(Yt , Yt1 ) = Cov(at 0.5at1 , at1 0.5at2 ) = 0.5Cov(at1 , at1 ),
ou
(t, t 1) = 0.5a2 .
Alem disso
Cov(Yt , Ytk ) = 0, para k 2
ent
ao podemos concluir que

0.5 2 ,
a
(t, s) =
0,

se |t s| = 1;
se |t s| > 1.

Para (t, s) temos

0.4,
(t, s) =
0,

se |t s| = 1;
se |t s| > 1.

5.4. METODOLOGIA DE BOX-JENKINS - MODELAGEM ARMA

5.4

89

Metodologia de Box-Jenkins - Modelagem ARMA

Na an
alise de series temporais, a metodologia de Box-Jenkins, em homenagem ao estatsticos George Box e Jenkins Gwilym, aplica-se os modelos autorregressivo de media movel
ARMA ou ARIMA para encontrar o melhor ajuste dos valores passados de uma serie temporal,
para entao fazer previs
oes. O procedimento pode ser resumido em tres etapas:
1. Identificac
ao e selec
ao do modelo. Verificar se as variaveis sao estacionarias, identificando possvel sazonalidade na serie (retirando a sazonalidade, se necessario), e uso das
autocorrelac
oes e autocorrelac
oes parcial para decidir por modelos autorregressivos e/ou
de medias m
oveis.
2. Estimac
ao dos par
ametros usando algoritmos computacionais para chegar a coeficientes
que melhor se adaptam ao modelo selecionado ARIMA. Os metodos mais comuns sao o
maxima verossimilhanca ou mnimos quadrados nao lineares.
3. Verificac
ao do modelo por meio de testes. Se o modelo estimado esta em conformidade
com as especificac
oes de um processo estacionario univariado. Verificacao do resduos.
Em particular, os resduos devem ser independentes e com media e variancia constante
ao longo do tempo. (Plotagem da media e variancia dos resduos ao longo do tempo e o
teste Ljung-Box ou plotagem das autocorrelacoes e autocorrelacoes parciais dos resduos
sao u
teis para identificar m
a especificacao.) Se a estimativa e inadequada, temos que
voltar para a primeira etapa e tentar encontrar um modelo melhor.
Um dos modelos mais simples e bastante u
til e o modelo autorregressivo. Consideremos o
caso mais simples.

5.4.1

Modelo Autorregressivo de Ordem 1 AR(1)

Um processo autorregressivo de ordem 1 e definido como


yt = c + yt1 + t ,

(5.15)

em que t e um processo rudo branco com media zero e variancia 2 .


Por simplicidade, assumimos que os momentos incondicionais seja iguais, o que implica
que Eyt = Eyt1 .
A media do processo e
= Eyt = Ec + Eyt1 + Et
o que implica em

= c + + 0,


CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA

90

c
.
1

Observe que = 0, quando c = 0.


A vari
ancia e
var(yt ) = E(yt2 ) 2 =

2
.
1 2

Observe que se || > 1, a vari


ancia sera negativa, o que e um absurdo. Quando || = 1, a
variancia de yt ser
a infinita, o que impossibilita, em princpio, a inferencia estatstica.
Deste pequeno exemplo, ent
ao, e possvel concluir que e necessario estabelecer algumas
restricoes sobre a serie temporal para que se possa estima-la. Em particular, uma condic
ao
necessaria para estimar a serie temporal e que || < 1.
Podemos encontrar o mesmo resultado sem a suposicao de que os momentos incondicionais
sejam iguais. Para isso usamos o operador defasagem L para reescrever o AR(1) como um
MA() (processo que ser
a definido a seguir )

yt = c + yt1 + t ;

(1 L)yt = c + t ;

yt =

X
c
+
j tj = + (L)t ,
1
j=0

em que = c/1 e
(L) = (1 L)1 = 1 + L + 2 L2 + .
Pode-se ent
ao calcular
Eyt = +

j E(tj ) = .

j=0

V ar(yt ) = E(yt )2 = E

2
j tj =

j=0

A func
ao de autocovari
ancia de defasagem j e:

X
j=0

2j E(2tj ) =

2
.
1 2

5.4. METODOLOGIA DE BOX-JENKINS - MODELAGEM ARMA

91

= E[(yt )(ytj )]
"
!
!#
X
X
s
s
= E
ts
tsj
s=0

s=0

= 2 (j + 2j + j+4 + )
j
=
2.
1 2
Como a media e as covari
ancias nao sao funcoes do tempo o processo e fracamente estacionario, independente do valor de .
A func
ao de autocorrelac
ao de ordem j e dada por

j =

j
2
12
2
12

= j .

Podemos ver que a func


ao de autocorrelacao decresce.

5.4.2

Passeio Aleat
orio (Random Walk)

Quando = 1 no caso anterior, temos o processo chamado passeio aleatorio. Sejam


a1 , a2 , . . . vari
aveis aleat
orias independentes, identicamente distribudas, cada uma com media
0 e variancia 2 . A serie temporal, Zt , e construda da seguinte maneira:
Z1 = a1 ;
Z2 = a1 + a2 ;
..
.
Zt = a1 + a2 + . . . + at ;

ou
Zt = Zt1 + at .

(5.16)


CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA

92

Obtendo a func
ao media de (5.16) temos:
t = E(Zt ) = E(a1 + a2 + + at )
= E(a1 ) + E(a2 ) + + E(at )
= 0 + 0 + + 0 = 0,

como E(at ) = 0, n
os temos:
t = 0, para todo t,
e tambem
V ar(Zt ) = V ar(a1 + a2 + + at )
= V ar(a1 ) + V ar(a2 ) + + V ar(at )
= 2 + 2 + + 2 = t 2 .
ou
V ar(Zt ) = ta2 .
Observe que a vari
ancia do processo cresce linearmente com o tempo. Suponha agora que
1 t s, teremos ent
ao,
(t, s) = Cov(Zt , Zs )
= Cov(a1 + a2 + + at , a1 + a2 + . . . + as )
= Cov(a1 , a1 ) + Cov(a2 , a2 ) + + Cov(at , at )
= a2 + a2 + + a2 = ta2
em que
Cov(at , as ) = 0, para t 6= s
temos ent
ao que a FACV e dada por
(t, s) = ta2 , para 1 t s

(5.17)

e a FAC e dada por


r
(t, s) =

t
, para 1 t s.
s

(5.18)

O passeio aleat
orio e um exemplo simples que representa diversos fenomenos como o
movimento comum de precos e ttulos e tambem a posicao de pequenas partculas suspensas
dentro de um fludo, chamado movimento Browniano.

5.4. METODOLOGIA DE BOX-JENKINS - MODELAGEM ARMA

93

Figura 5.3: Passeio aleatorio simulado, FAC amostral e FACP amostral

5.4.3

Modelos Autorregressivos de Ordem p, AR(p)

O processo autorregressivo de ordem p e definido como

yt = c + 1 yt1 + 2 yt2 + + p ytp + t


p
X
= c+
j ytj + t .
j=1

Podemos reescrever o modelo utilizando o operador defasagem


p (L)yt = t ,

(5.19)

p (L) = 1 1 L 2 L2 . . . p Lp .

(5.20)

em que

Alguns processos simulados:

94

CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA

Figura 5.4: AR(1) simulado com coeficiente 1 = 0.5, FAC amostral e FACP amostral.

Figura 5.5: AR(1) simulado com coeficiente 1 = 0.5, FAC amostral e FACP amostral.

5.4. METODOLOGIA DE BOX-JENKINS - MODELAGEM ARMA

95

Figura 5.6: AR(1) simulado com coeficiente 1 = 0.8, FAC amostral e FACP amostral.

Figura 5.7: AR(2) simulado com coeficientes 1 = 0.5 e 2 = 0.7, FAC amostral e FACP amostral.

96

CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA

Figura 5.8: AR(2) simulado com coeficientes 1 = 0.5, 2 = 0.7 e 3 = 0.6, FAC amostral e FACP
amostral.

5.4. METODOLOGIA DE BOX-JENKINS - MODELAGEM ARMA


5.4.4

97

Modelo M
edias-M
oveis (MA(q))

Considere a serie yt , chamamos de medias-moveis de ordem q o modelo:


yt = t + 1 t1 + 2 t2 + . . . + q tq

(5.21)

em que t e um RB(0, 2 ).
Esta

terminologia

vem

do

fato

que

yt

obtido

aplicando

os

pesos

1, 1 , 2 , . . . , q , as vari
aveis t t1 t2 . . . tq e entao movendo os mesmos
pesos 1 unidade do tempo a frente e aplicando-lhes a t+1 t t1 . . . tq+1 para obter
yt+1 .
Usando o operador L, podemos reescrever o modelo (5.21) como
yt = q (L)t ,

(5.22)

q (L) = 1 + 1 L + 2 L2 + . . . + q Lq .

(5.23)

em que

5.4.5

O modelo MA(1)

Para q = 1, obtemos o modelo:


yt = t 1 t1 ,
em que t e um RB(0, 2 ). Segue que
E(yt ) = 0,
e a variancia e igual a:

0 = V ar(yt )
= V ar(t 1 t1 )
= 2 + 12 2 = 2 (1 + 2 ).
temos ainda que a func
ao de autocovariancia e:

(5.24)


CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA

98

1 = Cov(yt , yt1 )
= Cov(t 1 t1 , t1 1 t2 )
= 1 Cov(t1 , t1 ) = 1 2
e para k 2 teremos
k = Cov(yt , ytk ) = 0.
E a FAC ser
a dada por:

k =

5.4.6

1+2

se

k = 0;

se

k = 1;

se

k 2.

O modelo MA(q)

Considere o modelo de ordem q, o qual foi definido em (5.21)


yt = t + 1 t1 + 2 t2 + . . . + q tq
em que t e um RB(0, 2 ). Segue que
E(yt ) = 0
e a variancia e

0 = V ar(yt )
= V ar(t + 1 t1 + 2 t2 + . . . + q tq )
= (1 + 12 + . . . + q2 ) 2
a funcao de autocovari
ancia e dada por

5.4. METODOLOGIA DE BOX-JENKINS - MODELAGEM ARMA

1 = Cov(yt , yt1 )
= Cov(t + 1 t1 + 2 t2 + . . . + q tq , t + 1 t1 + 2 t2 + . . . + q tq )
= 1 2 + 1 2 2 + + q1 q 2
= (1 + 1 2 + + q1 q ) 2 , para k = 1;
e
2 = (2 + 1 3 + . . . + q2 q ) 2 , para k = 2;
e para k q + 1 vamos ter k = 0.
Enquanto que a FAC ser
a dada por
k =

k + 1 k+1 + . . . + qk q
,
1 + 12 + . . . + q2

para k = 1, . . . , q.

Figura 5.9: MA(1) simulado com coeficiente 1 = 1, FAC amostral e FACP amostral.

99

100

CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA

Figura 5.10: MA(1) simulado com coeficiente 1 = 0.8, FAC amostral e FACP amostral.

Figura 5.11: MA(2) simulado com coeficientes 1 = 0.8 e 2 = 0.4, FAC amostral e FACP amostral.

5.4. METODOLOGIA DE BOX-JENKINS - MODELAGEM ARMA

101

Figura 5.12: MA(2) simulado com coeficientes 1 = 0.8, 2 = 0.4 e 3 = 1.4, FAC amostral e FACP
amostral.


CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA

102
5.4.7

Modelo ARMA(p,q)

Um modelo mais geral e dado pela representacao AR e MA, chamada ARMA,


p (L)yt = q (L)t ,

(5.25)

em que t e um RB(0, 2 ), L e o operador lag, p (L) e p (L) sao polinomios de graus p


e q, respectivamente, definidos em (5.20) e (5.23). O polinomio p (L) define a parte autorregressiva (AR) do modelo enquanto o polinomio p (L) define a parte media movel (MA).
Assim, o modelo em (5.25) denominado ARMA(p, q). Por exemplo, o modelo ARMA(2,3) e
escrito como

2 (L)yt = 3 (L)t
(1 1 L 2 L2 )yt = (1 + 1 L + 2 L2 + 3 L3 )t
yt = 1 yt1 + 2 yt2 + t + 1 t1 + 2 t2 + 3 t3 .
Exemplos de modelos ARMA simulados

Figura 5.13: ARMA(1,1) simulado com coeficientes 1 = 0.5 e 1 = 0.8, FAC amostral e FACP
amostral.

5.4. METODOLOGIA DE BOX-JENKINS - MODELAGEM ARMA

103

Figura 5.14: ARMA(1,3) simulado com coeficientes 1 = 0.5, 1 = 0.8, 2 = 0.4 e 3 = 1.4, FAC
amostral e FACP amostral.

Figura 5.15: ARMA(3,1) simulado com coeficientes 1 = 0.5, 2 = 0.7, 3 = 0.6 e 1 = 0.8, FAC
amostral e FACP amostral.


CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA

104
5.4.8

Causalidade, Invertibilidade e Estacionariedade

O conceito de causalidade consiste em escrever um processo AR(q) como um MA().


Defini
c
ao 5.4.1. Um processo linear {yt } e causal (estritamente, uma func
ao causal de {et })
se existe
(L) = 0 + 1 L + 2 L2 +
com

j=0 |j |

<e
yt = (L)et .

Considere o modelo AR(1):


yt = yt1 + et ,
substituindo t por t 1, temos:
yt1 = yt2 + et1 ,
agora substituindo yt1 em yt , temos:

yt = (yt2 + et1 ) + et
= 2 yt2 + et1 + et .
Repetindo este processo k 1 vezes, vamos ter:
yt = et + et1 + 2 et2 + + k1 et(k1) + k ytk .
Para k grande vamos ter:
yt = et + et1 + 2 et2 + . . .
= 0 et + 1 et1 + 2 et2 + . . . ,
em que || < 1 e j = j .
O que acontece com a vari
ancia de yt ?
Assim, essa representac
ao somente faz sentido se
se, || < 1.

j=0 j

< , o que ocorre se, e somente

5.4. METODOLOGIA DE BOX-JENKINS - MODELAGEM ARMA

105

Invertibilidade
Mostramos que um processo AR pode ser reescrito como um processo MA de ordem infinita
atraves de pesos j s. Alem disso podemos escrever um processo MA como um autorregressivo.
Defini
c
ao 5.4.2. Um processo linear {yt } e invertivel (estritamennte, uma func
ao invertvel
de {et }) se existe
(L) = 0 + 1 L + 2 L2 + ,
com

j=0 |j |

<e
et = (L)yt .

Considere o modelo MA(1)


yt = et et1 ,
em que et e um RB(0, 2 ). Reescrevendo a equacao acima como
et = yt + et1
e substituindo t por t 1 e et1 na equacao modificada, temos:

et = yt + (yt1 + et2 )
= yt + yt1 + 2 yt2
Se || < 1, podemos continuar a substituicao e obter:

et = yt + yt1 + 2 yt2 + . . . ,
ou seja,
yt = yt1 2 yt2 . . . + et .
Logo se || < 1, vimos que o MA(1) pode ser invertido (transformado) para um AR().
Neste caso dizemos que o modelo MA(1) e invertvel.

Polin
omio Caracterstico
Nos exemplos mostrados acima tratamos da causalidade e invertibilidade dos casos AR(1)
e MA(1) em particular. Para os casos mais gerais AR(p) e MA(q) utilizamos os chamados
polin
omios caractersticos para decidir se os processos sao causais e/ou invertvel.


CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA

106

Para um modelo geral AR(p), definimos o polin


omio caracterstico AR como
(z) = 1 1 z + 2 z 2 + + p z p .

(5.26)

Teorema 5.4.1. Uma (


unica) soluc
ao estacion
aria para (L)yt = et existe se, e somente, as
razes de (z) n
ao pertence ao crculo de raio um, ou seja,
|z| = 1 (z) = 1 1 z p z p 6= 0.
O processo AR(p) e causal se, e somente se as razes de (z) est
ao fora do crculo unit
ario,
ou seja,
|z| 1 (z) = 1 1 z p z p 6= 0.
Para um modelo geral MA(q), definimos o polin
omio caracterstico MA como
(z) = 1 + 1 z + 2 z 2 + + q z q .

(5.27)

Teorema 5.4.2. Um processo MA(q) e invertvel se, e somente se, as razes de (z) est
ao
fora do crculo unit
ario, isto e,
|z| 1 (z) = 1 + 1 z + 2 z 2 + + q z q 6= 0.

Estacionariedade e causalidade de um processo ARMA


Para um processo ARMA, as condicoes para causalidade, invertibilidade e estacionariedade
sao dadas no seguinte teorema.

Teorema 5.4.3. Se () e () n
ao possuem fatores em comum, existe (
unica) soluc
ao estacion
aria {yt } para (L)yt = (L)et se, e somente se,
|z| = 1 (z) = 1 1 z p z p 6= 0.
Esse processo ARMA(p, q) e causal se, e somente se,
|z| 1 (z) = 1 1 z p z p 6= 0.

5.4. METODOLOGIA DE BOX-JENKINS - MODELAGEM ARMA


Ser
a invertvel se, e somente se
|z| 1 (z) = 1 + 1 z + 2 z 2 + + q z q 6= 0.

107


CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA

108

5.5

Exerccios

Exerccio 5.1. Defina processo estoc


astico e ilustre graficamente. Explique o que e a realizac
ao de um processo estoc
astico e por que series econ
omicas podem ser entendidas como
geradas por um processo estoc
asticos.
Exerccio 5.2. Seja {yt }Tt=1 uma serie temporal. Quais caractersticas essa serie deve apresentar para ser considerada uma serie de covari
ancia estacion
aria?

Exerccio 5.3. Faca os seguintes items:


(a) Defina o que e um processo rudo branco.
(b) Defina o que e um processo independente e identicamente distribudo (i.i.d.).
(c) Defina rudo branco Gaussiano.
(d) Qual a relac
ao entre rudo branco, rudo branco Gaussiano e processo i.i.d.?
(e) Esses processos s
ao estacion
arios?

Exerccio 5.4. Considere um processo MA(1): yt = et + 1 et1 ; onde et RB(0, e2 ).


(a) Calcule a media e vari
ancia de yt .
(b) Calcule as autocovari
ancias de lags 1 e 2 para a serie yt .
(c) Esse processo e estacion
ario? (Justifique sua resposta usando os valores encontrados nos
itens anteriores juntamente com o conceito de estacionariedade definido na Quest
ao 1).
(d) Comente a afirmativa: Todo processo MA(q), onde q < , e estacion
ario.
(e) Suponha que 1 = 0.5. O processo e invertvel?
(f ) Calcule a autocorrelac
ao de ordem 1 para o processo do item anterior e faca o gr
afico da
FAC com 5 lags.

Exerccio 5.5. Considere um processo MA(2): yt = et +1 et1 +2 et2 ; onde et RB(0, e2 ).


(a) Calcule a media e vari
ancia de yt .

5.5. EXERCICIOS

109

(b) Calcule as autocovari


ancias de lags 1, 2 e 3 para a serie yt .
(c) Esse processo e estacion
ario? (Justifique sua resposta usando os valores encontrados nos
itens anteriores juntamente com o conceito de estacionariedade definido na Quest
ao 1).
(d) Suponha que 1 = 0.65 e que 2 = 0.20. O processo e invertvel?
(e) Calcule a autocorrelac
ao de ordem 1 e 2 para o processo do item anterior e faca o gr
afico
da FAC com 5 lags.

Exerccio 5.6. Considere os seguintes processos


1
yt = et + et1 e yt = et + et1 ,

onde et iid(0, e2 ) e 6= 0.
(a) Os processos acima possuem as mesmas autocorrelac
oes? Verifique.
(b) Os processos acima s
ao invertveis? Verifique.

Exerccio 5.7. Considere um processo AR(1): yt = 5 + 0.9yt1 + et , onde et RB(0, e2 ).


(a) Esse processo e estacion
ario? Verifique.
(b) Calcule as autocorrelac
oes de ordem 1, 2 e 3 para esse processo. Faca um esboco do
gr
afico da FAC para esse processo com 5 lags.
(c) O que significa o coeficiente de yt1 num processo AR(1)?
(d) Faca um gr
afico da FACP desse processo com 5 lags.

Exerccio 5.8. (a) Explique como se comportam os gr


aficos da FAC e da FACP em processos
AR(p) e em processos MA(q).
(b) Esboce os gr
aficos da FAC e FACP para os seguintes processos: AR(1), AR(3), MA(2)
e MA(3).

Exerccio 5.9. (a) Supondo que E(yt ) = e que yt = c0 + 1 yt1 + et + 1 et1 , calcule o
valor de c0 em termos de e 1 .
(b) Explique como se comportam os gr
aficos da FAC e da FACP em processos ARMA(p, q).

110

CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA

(c) Esboce os gr
aficos da FAC e FACP para um processos ARMA(1,1).

Exerccio 5.10. Explique os passos que devem ser seguidos para a modelagem de uma serie
temporal na metodologia ARMA.

Exerccio 5.11. Considere uma serie temporal com 200 observac


oes. A figura 1 mostra a
evoluc
ao da serie ao longo do tempo. A tabela 1 fornece as autocorrelaco
es, s, e autocorrelac
oes parciais, s, estimados a partir dessa serie.

Figura 5.16: serie temporal simulada

5.5. EXERCICIOS

111
Tabela 1

10

0.51

0.13

0.01

0.04

0.03

0.00

0.04

0.02

0.08

0.01

k,k

0.51

-0.18

0.03

0.06

-0.03

-0.00

0.07

-0.05

0.13

-0.11

(a) Analisando a Figura 1 a serie parece ser estacion


aria? Explique.
(b) Faca o gr
afico da FAC e FACP para esse processo.
(c) Calcule o criterio para decis
ao quanto `
a signific
ancia das autocorrelac
oes estimadas e
represente esse criterio nos gr
aficos da FAC e FACP.
(d) Qual(is) modelo(s) voce prop
oe para ajustar essa serie temporal? Justifique.

Exerccio 5.12. Usando a esperanca condicional, calcule as previs


oes 1, 2 e 3 passos a frente
(b
yT (1), ybT (2), ybT (3)) para os seguintes processos:
(a) AR(1);
(b) AR(2);
(c) MA(1);
(d) MA(3);
(e) ARMA(1,1);
(f ) ARMA(2,2).

Exerccio 5.13. Abaixo (Figura 2) encontram-se os gr


aficos da FAC e FACP calculados para
uma serie {yt }200
t=1 .

(a) Analisando a Figura 2 a serie parece ser estacion


aria? Explique.
(b) Usando os gr
aficos da FAC e FACP, qual(is) modelo(s) voce prop
oe para ajustar essa
serie temporal? Justifique. (Note que o primeiro lag e o 1 em ambos os gr
aficos).

112

CAPITULO 5. SERIES
TEMPORAIS E ECONOMETRIA

Figura 5.17: lags de ACF e PACF

Captulo 6

S
eries Temporais N
ao Estacion
arias
Nos captulos anteriores assumimos que

E(Zt ) = 0;
V ar(Zt ) = 2 , para todo t, e
Cov(Zt , Ztk ) = 2 k , para todos os t e k,
em que k e a correlac
ao serial das defasagens k. Se essas hipoteses sao satisfeitas a serie Zt
e chamada de covari
ancia estacion
aria ou simplesmente estacion
aria. A intuicao e de que
uma serie temporal estacion
aria y (ou de tendencia estacionaria) tem a tendencia de retornar
a uma media constante (ou flutuar em torno de uma tendencia deterministica). Portanto,
valores grandes devem ser seguidos de valores menores e valores menores devem ser seguidos
de valores maiores.
No entanto muitas series temporais economicas sao claramente nao estacionarias no sentido
de que a media e a vari
ancia dependem do tempo, e elas tendem a se afastar permanentemente
de qualquer valor `
a medida que o tempo passa. Se esse movimento e predominantemente em
uma direc
ao (para cima ou para baixo), dizemos que a serie exibe uma tendencia.
A tendencia das series temporais nao-estacionarias e frequentemente removida antes que
analises adicionais sejam feitas. Existem dois procedimentos usados para remover a tendencia:
1. Estimac
ao das regress
oes no tempo;
2. Diferenciac
ao sucessiva.
Estimac
ao das regress
oes no tempo foi apresentado no captulo ????, no entanto retomamos
nesta secao. Na figura a seguir o exemplo classico de dados de companhias aereas apresentados
por Box & Jenkins. Os dados apresentam o total mensal de passageiros internacionais no
perodo de 1949 `
a 1960. Observe que a serie Zt apresenta nao estacionariedade causada por
uma tendencia determinstica. A defasagem, no caso Zt4 , apresenta a mesma tendencia da
113


ESTACIONARIAS

CAPITULO 6. SERIES
TEMPORAIS NAO

114

serie original. Esta tendencia determintica pode ser eliminada por uma diferenca, o que fica
evidenciado no gr
afico, no entanto essa nao e a forma recomendada. Recomenda-se eliminar

600

com regressores no tempo.

500

Srie de passageiros
Srie defasada X(t4)

300
200
100
100

Passageiros/milhes

400

Srie diferenciada

1950

1952

1954

1956

1958

1960

anos

Figura 6.1: Passageiros do tansporte aereo americano de 1949-1960

6.0.1

Como lidar com tent


encia determinstica

Quando a tenencia e determinstica recomenda-se incluir uma variavel tempo t no modelo.


Podemos dar alguns exemplos de modelos com tendencia deteminstica: O modelo
Yt = a + bt + t

(6.1)

em que t RB(0, 2 ) e um rudo branco, torna-se um rudo branco com tendencia determinstica. O modelo AR(1) com tendenca determinstica pode ser escrito da segunte forma
Yt = a + bt + Yt1 + t .

(6.2)

Quando diferenciamos um modelo com tendencia determinstica, acrescentamos rudo a


serie, isto e, aumentamos a sua vari
ancia. Como exemplo disso consideremos o modelo (6.1),
cuja variancia e
V ar(Yt ) = V ar(a + bt + t ) = V ar(t ) = 2 .

115
Ja para a diferenca de Yt temos

V ar(Yt ) = V ar(a + bt + t a b(t 1) t1 )


= V ar(t ) + V ar(t1 ) = 22 .
Assim, a vari
ancia da diferenca e duas vezes a variancia da serie e isso se refletira na previs
ao.
Logo, quando uma serie possui tendencia determinstica e mais eficiente utilizar uma variavel
tempo. Vejamos o seguinte exemplo:
280

260

240

pop

220

200

180

160

140

1950

1955

1960

1965

1970

1975

1980

1985

Figura 6.2: Populacao dos EUA (em milhoes) 1948-1995

Ajustando o modelo Yt = a + bt + t via mnimos quadrados, temos


Modelo 1: MQO, usando as observac
oes 19481995 (T = 48)
Vari
avel dependente: pop

const
time

Coeficiente

Erro Padr
ao

147,858
2,41152

0,529293
0,0188056

M
edia var. dependente
Soma resd. quadrados
R2
F (1, 46)
Log da verossimilhanca
Crit
erio de Schwarz

206,9404
149,8604
0,997210
16444,00
95,43313
198,6087
0,938893

raz
ao-t

p-valor

279,3504
128,2342

0,0000
0,0000

D.P. var. dependente


E.P. da regress
ao
R2 ajustado
P-valor(F )
Crit
erio de Akaike
HannanQuinn
DurbinWatson

O resduo, obtido da seguinte forma


t = yt yt
= yt a
bt
= yt 147, 858 2, 41152t,

33,80851
1,804947
0,997150
2,07e60
194,8663
196,2805
0,035818

1990

1995


ESTACIONARIAS

CAPITULO 6. SERIES
TEMPORAIS NAO

116

pop efetivo e ajustado


280

ajustado
efetivo

260

240

pop

220

200

180

160

140

1950

1955

1960

1965

1970

1975

1980

1985

1990

1995

Figura 6.3: Ajuste x efetivo para populacao dos EUA entre 1948-1995

nao mais apresenta tendencia determinstica, como pode ser observado na figura
Resduo do ajuste (observado - ajustado)
0,6

0,4

resduo

0,2

-0,2

-0,4

-0,6

1950

1955

1960

1965

1970

1975

1980

1985

1990

1995

Figura 6.4: Populac


ao dos EUA entre 1948-1995 eliminando-se a tendencia

Em alguns casos e necess


ario incluir potencias da variavel tempo. Cada potencia da
variavel tempo e uma nova vari
avel. Para o exemplo anterior, teramos

117
ano

pop(milhoes)

t2

t3

1948

146,631

1949

149,188

1950

152,271

27

1951

154,878

16

64

1952

157,553

25

125

1953
..
.

160,184
..
.

6
..
.

36
..
.

216
..
.

No caso em que yt e uma func


ao do tempo, constituindo uma serie com tendencia determinstica, o procedimento e semelhante ao exemplo apresentado. Devemos estimar yt contra
o tempo e armazenar os resduos. Estes resduos constituem uma nova serie que devera ser
modelada separadamente. Resumidamente,
1. Estime por mnimos quadrados ordinarios o modelo:
yt = 0 + 1 t + 2 t2 + + n tn + t .
Comece com n = 1. Enquanto os testes t, F nao rejeitam a significancia dos 0 s, deve-se
tentar colocar uma potencia maior (n + 1).
2. Estima o modelo ARMA(p,q) para os resduos estimados, conforme o captulo anterior.
Como vimos, neste caso n
ao e necessario diferenciar a serie. Uma variavel tempo resolve
o problema. No entanto, em algumas situacoes existe tendencia, mas esta nao e previsvel, o
que chamamos de tendencia estosc
atica.


ESTACIONARIAS

CAPITULO 6. SERIES
TEMPORAIS NAO

118

6.1

Testes de raz unit


aria - Identificando tend
encia estoc
astica

Uma serie com uma tendencia estocastica se diferencia de outra com uma tendencia determinstica, pois as mudancas na mesma deixam de ter um carater transitorio e passam a
apresentar um car
ater permanente [(Pereira, 1988) e (Gujarati, 2000)]. A presenca de uma
tendencia estoc
astica implica que flutuacoes em uma serie temporal sao o resultado de choques
nao somente no componente transit
orio ou cclico, mas tambem no componente de tendencia.
[Balke (1991) apud Gujarati (2000, p. 730)]
Os testes de raz unit
aria s
ao u
teis para identficar tendencia estocastica numa serie temporal. Caso a serie apresente uma raz unitaria, a serie sera nao estacionaria e isso afeta
diretamente a abordagem/modelagem. Um dos testes mais conhecidos na literatura de series
temporais e o teste de Dickey Fuller.
6.1.1

Teste de Dickey Fuller (DF)

Considere o modelo autorregessivo de ordem 1, AR(1)


yt = a0 + yt1 + ut

(6.3)

em que yt e a vari
avel de interesse, t e o ndice temporal, e coeficente e ut e o termo de erro.
Uma raz unit
aria est
a presente se = 1. O modelo sera nao estacionario.
Nota-se que, quando = 1
yt = a0 + yt1 + ut
pode ser reescrito como

yt = y0 +

t
X

ui + a0 t

i=1

com uma tendencia determinstica vindo de a0 t e um intercepto estocastico vindo de y0 +


Pt
e conhecido como tendencia estocastica.
i=1 ui , resultando no que
O modelo (6.4) de regress
ao pode ser escrito como
yt = ( 1)yt1 + ut = yt1 + ut ,

(6.4)

em que e a operador diferenca. Testar a presenca de raz unitaria neste modelo ( = 1) e


equivalente a atestar se = 0 em que = 1. Como o teste e feito sobre os resduos, nao e
possvel usar o teste t de signific
ancia devido a nao normaliade dos resduos. Para isso existe
uma estatstica de teste especfica, cujos valores crticos estao dispostos na tabela de Dickey
Fuller.
Existem tres vers
oes principais do teste:

6.1. TESTES DE RAIZ UNITARIA


- IDENTIFICANDO TENDENCIA
ESTOCASTICA119
Teste para raz unit
aria:
yt = yt1 + ut ;
Teste para raz unit
aria com drift:
yt = + yt1 + ut ;
Teste de raz unit
aria com drift e tendecia temporal determinstica.:
yt = + at + yt1 + ut
o teste de Dickey Fuller e um teste unilateral a esquerda(veja figura)

Figura 6.5: Distribuic


ao da estatstica e a regiao crtica do teste de Dickey Fuller

A estatstica para cada um dos modelos pode ser obtida da seguinte forma:
=

s()

(6.5)

e o desvio padr
em que s()
ao de
Pn
yt1 yt
= Pt=1
1,
n
2
t=1 yt1
que e a estimativa (via mnimos quadrados) de menos 1, para garantir que sob H0 : = 0.
O desvio padr
ao pode ser obtido a partir do calculo da variancia amostral
n
1X
t1 ).
S =
( y
T
2

t=1

Cada vers
ao do teste ( , e ) tem sua propria estatstica de teste e portanto tem seu
proprio valor crtico o qual depende do tamanho amostral. Esses valores foram obtidos a


ESTACIONARIAS

CAPITULO 6. SERIES
TEMPORAIS NAO

120

partir e simulac
oes de Monte Carlo.
A tabela a seguir apresenta alguns valores crticos para o teste de Dickey Fuller
Estatstica

1%

2.5%

5%

10%

25

-2.66

-2.26

-1.95

-1.60

50

-2.62

-2.25

-1.95

-1.61

100

-2.60

-2.24

-1.95

-1.61

250

-2.58

-2.23

-1.95

-1.61

500

-2.58

-2.23

-1.95

-1.61

500

-2.58

-2.23

-1.95

-1.61

25

-3.75

-3.33

-3.00

-2.62

50

-3.58

-3.22

-2.93

-2.60

100

-3.51

-3.17

-2.89

-2.58

250

-3.46

-3.14

-2.88

-2.57

500

-3.44

-3.13

-2.87

-2.57

500

-3.43

-3.12

-2.86

-2.57

25

-4.38

-3.95

-3.60

-3.24

50

-4.15

-3.80

-3.50

-3.18

100

-4.04

-3.73

-3.45

-3.15

250

-3.99

-3.69

-3.43

-3.13

500

-3.98

-3.68

-3.42

-3.13

Em cada caso, a hip


otese nula de que existe raz unit
aria, = 0. Para estes testes e
conhecido que eles tem baixo poder no sentido de que frequentemente nao conseguem distinguir
entre processos com raz unit
aria ( = 0) de processos com raz quase unitaria ( proximo de
zero).
6.1.2

Dickey-Fuller Aumentado

Existe uma extenc


ao do teste de Dickey-Fuller (DF) chamado de Teste de Dickey-Fuller aumentado (ADF) o qual remove todos os efeitos estuturais (autocorrelacoes) da serie temporal
e entao testa usando o mesmo procedimento.
Existem outro testes bem reconhecidos, que surgiram para resolver o problema de baixo
poder do teste de Dickey Fuller. Estes testes devem ser tambem utilizados em caso de d
uvida
na hora da modelagem. S
ao os testes de Phillips-Perron, KPSS, ERS, NG e Perron
entre outros. Alguns est
ao disponveis no Gretl, na opcao vari
avel- testes de raz unit
aria.
6.1.3

Eliminando tend
encia estoc
astica - Diferen
cas sucessivas

O metodo de diferenciac
ao sucessivas e utilizado para eliminar tendencia estocastica.
Conisdere o Operador Diferen
ca

6.1. TESTES DE RAIZ UNITARIA


- IDENTIFICANDO TENDENCIA
ESTOCASTICA121

=1B

(6.6)

em que B e o operador de defasagem (retardo). O resultado de aplicar o operador diferenca


a uma serie Zt com T observac
oes e obter uma nova serie com T 1 observacoes. Assim,

Zt = (1 B)Zt
= Zt BZt
= Zt Zt1 .

2 Zt = (1 B)2 Zt
= Zt 2BZt + B 2 Zt
= Zt 2Zt1 + Zt2 .
Na figura a seguir temos uma aplicacao do operador diferenca.
Passeio Aleatrio

10

Passeio Aleatrio

10

Passeio Aleatrio diferenciado

20

40

60

80

tempo

Figura 6.6: Passeio Aleatorio e sua diferenca

Obs: No Gretl tem uma opc


ao para acrescentar uma vari
avel diferenca.

100


ESTACIONARIAS

CAPITULO 6. SERIES
TEMPORAIS NAO

122

6.2

Modelagem ARIMA

Quando uma series temporal apresenta tendencia estocatica (nao estacionaria) diz-se que
necess
esta e integrada (I()). E
ario retirar a tendencia para entao analisar o rudo. Esse rudo
nao necess
ariamente e um rudo branco. Pode ser um modelo ARMA, por exemplo. Como
visto anteriormente, a maneira de retirar a tendencia estocastica de uma serie temporal e
diferencindo-
a. Algumas vezes, e necessario diferenciar mais do que uma vez a serie temporal
ate torna-la estacion
aria.
Diz que uma serie sem nenhuma raz unitaria e I(0).
A serie e dita I(1) se for necess
ario diferencia-la uma vez para torna-la estacionaria.
A serie e dita I(d) se for necess
ario diferencia-la d vezez para torna-la estacionaria.

0 10 20 30 40 50 60

Vendas

Na figura 6.7 s
ao apresentados a serie sobre dados de vendas BJsales de Box & Jankins.

50

100

150

0
4

diff(diff(Vendas))

2
0
2

diff(Vendas)

50

100
Time

150

50

100
Time

Figura 6.7: Serie de vendas, primeira e segunda diferencas

150


6.3. PREVISAO

6.3

123

Previs
ao

Um dos objetivos finais na an


alise de series temporais e a previsao. Assim, pode-se usar
informacoes do passado para tomar decisoes para o futuro. Existem outros metodos de previsao para series temporais, como o de M
edia M
oveis Smples (MMS), Suavizamento
Exponencial (SE), entre outros, mas estes metodos nao dependem de um ajuste de um
modelo e n
ao s
ao considerados agora. Para uma boa previsao e fundamental que o modelo
esteja bem ajustado e por isso deixamos este topico para o final. Como e feita a previsao na
pratica? A figura 6.8 mostra a previsao feita para o log da serie de passageiros das companhias
aereas americanas.
6,8

lg
previso
Intervalo a 95 por cento

6,6
6,4
6,2
6
5,8
5,6
5,4
5,2

1955

1956

1957

1958

1959

1960

1961

1962

Figura 6.8: Previs


ao para o log da serie de passageiros das companhias aereas americanas

A ideia da previs
ao e utilizar o conhecimento/observacoes que se tem ate o tempo t,
(digamos que temos observac
oes para uma certa variavel durante os u
ltimos 20 anos e, assim,

t seria o u
ltimo ano observado e , yt2 , yt1 , yt as observacoes). E conveniente definir
Et (ys ) = E(Ys |yt , yt1 , , y2 , y1 ),
como sendo a experanca condicionada em todas as observacoes ate o tempo t. Assim,
Et (ys ) = ys , se s t
Para um exemplo de previs
ao, consideremos o modelo AR(1):
yt+1 = c + yt + t .
Assim,

(6.7)


ESTACIONARIAS

CAPITULO 6. SERIES
TEMPORAIS NAO

124

Et (yt+1 ) = c + yt = yt+1 t+1


Et (yt+2 ) = c + Et (yt+1 ) = c + (c + yt )
..
.
h1
X
Et (yt+h ) = c
i1 + h yt .
i=1

Assim, yt (h) = Et (yt+h ) representa previsao h-passos a frente, dado que observamos ate o
tempo t.
6.3.1

Erro de previs
ao

O erro de previs
ao e definido como sendo o valor observado menos o valor previsto. Para
um perodo h, et (h) e dado por:

et (1) = yt+1 Et (yt+1 ) = t+1


et (2) = yt+2 Et (yt+2 ) = c + yt+1 + t+2 c Et (yt+1 )
= t+1 + t+2
et (3) = yt+3 Et (yt+3 ) = c + yt+2 + t+3 c Et (yt+2 )
= 2 t+1 + t+2 + t+3
..
.
et (h) = yt+h Et (yt+h ) = h1 t+1 + h2 t+2 + t+h1 + t+h

Tomando-se a esperanca do erro de previsao, podemos observar que estes sao nao viesados,
E(et (h)) = 0;
A variancia do erro de previs
ao e dada por:



V ar(et (h)) = V ar h1 t+1 + h2 t+2 + t+h1 + t+h


= 2 2(h1) + 2(h2) + + 2 + 1
Note que a vari
ancia converge para uma constante, quando h , que e
variancia n
ao condicional da serie yt .

2
12

que e a


6.3. PREVISAO

125

Se a distribuic
ao dos resduos t e a Normal, entao o intervalo de confianca para os resduos
e dado portanto

h1
X


1
2
i1 + h y 2 2(h1) + 2(h2) + + 2 + 1

i=1

Medidas de desempenho
Diferentes modelos produzem previsoes distintas, o que torna necessarios avaliar essas
previsoes. Para isso s
ao utilizadas algumas medidas de desempenho. As estatsticas mais
conhecidas s
ao:
1. MSE- Mean Square Error (erro quadratico medio)
s

PH

2
h=1 et (h)

M SEt,H =

Para calcul
a-los, deve-se deixar algumas observacoes fora da amostra. Por exemplo, em
uma serie com n observac
oes , deixa-se as H u
ltimas observacoes fora da amostra e
estima-se o modelo agora com n H observacoes restantes.
2. MAE- Mean Absolute Error (erro absoluto medio)
PH
M AEt,H =

h=1 |et (h)|

3. MAPE- Mean Absolute Percentual Error (erro absoluto percentual medio)

M AP Et,H


H
X
et (h)


=
Hyt+h
h=1

Previs
ao din
amica e est
atica
Quando faz-se previs
oes h passos a frente, yt (h), usando somente a informacao ate o tempo
t, tem-se a previs
ao din
amica cuja variancia acaba sendo maior. Quando, para prever algum
passo a frente usa-se as observac
oes ate o tempo imediatamente anterior, tem-se a previs
ao
estatica. A previs
ao est
atica s
o e u
til para efeito de comparacao de modelos. Na pratica, a
previsao din
amica e a u
nica que interessa de fato.


ESTACIONARIAS

CAPITULO 6. SERIES
TEMPORAIS NAO

126

6.4

Regress
ao Esp
uria - Cointegrac
ao

A utilizac
ao dos modelos de regressao envolvendo series temporais nao estacionarias pode
conduzir ao problema que se convencionou chamar de regressao esp
uria, isto e quando temos
um alto R2 sem uma relac
ao significativa entre as variaveis (Harris, 1995). Assim, na presenca
de raz unit
aria podem-se encontrar relacoes econometricas entre duas variaveis economicas
sem qualquer relac
ao de causalidade entre uma e outra por puro acaso. Por exemplo, a
regressao de uma vari
avel I(1) com outra I(1) obtida independentemente gera alto R2 e estatstica t significante. No entanto o resultado nao tem significado economico.
Fizemos a seguinte esperiencia. Geramos duas series I(1) independentes entre si e regredimos um contra a outra. O resultado segue.
Call:
lm(formula = Y X)
Residuals:
Min 1Q Median 3Q Max
-25.861 -7.875 0.179 6.713 30.970
Coefficients:
Estimate Std. Error t value Pr(t)
(Intercept) -6.971267 0.538128 -12.96 2e-16 ***
X 0.527969 0.005861 90.08 2e-16 ***

Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1


Residual standard error: 10.69 on 2498 degrees of freedom
Multiple R-squared: 0.7646, Adjusted R-squared: 0.7645
F-statistic: 8115 on 1 and 2498 DF, p-value: 2.2e-16

Como podemos observar, econtramos um R2 = 0.76 alto e estatsticas significativas. No


entanto, as series s
ao independentes. O resultado disso, e que quando colocamos no mesmo
grafico, a serie Y e o predito, podemos observar que o predito nao e nem de perto razoavel.
Veja figura 6.9.
Isto ocorre devido ao fato de que a presenca de uma tendencia, decrescente ou crescente,
em ambas as series leva a um alto valor do R2 mas nao necessariamente, a presenca de uma
relacao verdadeira entre series (Gujarati, 2000).
Dectada a presenca de raiz unitaria, entao se deve trabalhar com as series temporais
diferenciadas e n
ao em nvel, ou seja, a tendencia precisa ser removida. Assim, quando uma
serie econ
omica apresentar uma tendencia estocastica tornar-se-a estacionaria apos a aplicac
ao
de uma ou mais diferencas, pois ter
a pelo menos uma raiz unitaria. No entanto, ao se remover
a tendencia, elementos de longo prazo entre as variaveis sao eliminados.

ESPURIA

6.4. REGRESSAO
- COINTEGRAC
AO

127

20

40

60

80

Regresso de Dois Passeios Aleatrios


Ajustado em Azul

500

1000

1500

2000

2500

tempo

Figura 6.9: Series com relacao esp


uria

A interpretac
ao econ
omica da cointegracao e que se duas (ou mais) variaveis possuem
uma relac
ao de equilbrio de longo prazo, entao mesmo que as series possam conter tendencias
estocasticas (isto e, serem n
ao estacionarias), elas irao mover-se juntas no tempo e a diferenca
entre elas ser
a est
avel (isto e, estacionaria). Em suma, o conceito de cointegracao indica
a existencia de um equilbrio de longo prazo, para o qual o sistema economico converge no
tempo (Harris, 1995).
6.4.1

Quando
e possvel regredir duas s
eries I(1)

Para que a regress


ao entre duas series temporais nao seja esp
uria, elas devem satisfazer
uma das seguintes situac
oes:
1. {Yt } e {Xt } devem ser estacionarias.
2. {Yt } e {Xt } devem ser integradas de mesma ordem e o resduo deve ser estacionario.
Se {Yt } e {Xt } s
ao integrados de ordens diferesntes ou se {Yt } e {Xt } sao integrados de mesma
ordem e o resduo ainda e integrado, entao a regressao e esp
uria.


ESTACIONARIAS

CAPITULO 6. SERIES
TEMPORAIS NAO

128

6.5

Exerccios

Exemplo 6.1. Para este exerccio consideremos uma serie temporal de taxa de c
ambio da
It
alia (EXRIT L). Foram realizados testes de raz unit
aria para a serie EXRIT L e para a
sua primeira diferenca d EXRIT L.
Teste Aumentado de Dickey-Fuller para EXRITL
incluindo 5 defasagens de (1-L)EXRITL
dimens
ao de amostragem 196
hip
otese nula de raiz unit
aria: a = 1
teste com constante
modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e
coeficiente de 1a ordem para e: -0,002
diferencas defasadas: F(5, 189) = 5,488 [0,0001]
valor estimado de (a - 1): -0,00802367
estatstica de teste: c (1) = -1,46078
p-valor assint
otico 0,5537
com constante e tendencia
modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e
coeficiente de 1a ordem para e: -0,003
diferencas defasadas: F(5, 188) = 5,557 [0,0001]
valor estimado de (a - 1): -0,0140724
estatstica de teste: ct (1) = -1,4575
p-valor assint
otico 0,8439

Teste de Dickey-Fuller para d EXRIT L


dimens
ao de amostragem 200
hip
otese nula de raiz unit
aria: a = 1
teste com constante
modelo: (1-L)y = b0 + (a-1)*y(-1) + e
coeficiente de 1a ordem para e: -0,006
valor estimado de (a - 1): -0,685419
estatstica de teste: c (1) = -10,1243
p-valor 2,166e-16
com constante e tendencia
modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + e
coeficiente de 1a ordem para e: -0,005
valor estimado de (a - 1): -0,690473
estatstica de teste: ct (1)= -10,1693
p-valor 1,241e-15

a) O que podemos afirmar a respeito da tendencia da serie EXRIT L? Use os resultados dos
testes de hip
oteses para justificar a sua resposta.
b) O que podemos afirmar a respeito da tendencia da primeira diferenca da serie EXRIT L?
Use os resultados dos testes de hip
oteses para justificar a sua resposta.
c) Dos gr
aficos apresentados na figura 6.10, qual(is) pode(m) representar a serie EXRIT L?
E qual(is) pode(m) representar a primeira diferenca da serie EXRIT L? Explique.
d) Na figura 6.11 qual(is) dos gr
aficos de FAC e FACP pode(m) corresponder `
a FAC e FACP
de um rudo branco? Justifique.
e) Na figura 6.11 qual(is) dos gr
aficos de FAC e FACP pode(m) corresponder `
a FAC e FACP
de um rudo branco? Justifique.
f ) Na figura 6.11 qual(is) dos gr
aficos de FAC e FACP pode(m) corresponder `
a FAC e FACP
da Serie EXRIT L? Justifique.

6.5. EXERCICIOS

129

7.8

7.6

3
7.4
2
7.2

S2

-1

6.8

-2
6.6
-3
6.4

-4
-5

6.2
1974

1976

1978

1980

1982

1984

1986

1988

1990

1974

1976

1978

(a) Serie S1

1980

1982

1984

1986

1988

(b) Serie S2
150

100

50

S3

S1

-50

-100

-150
1974

1976

1978

1980

1982

1984

1986

1988

1990

(c) Serie S3

Figura 6.10: Series Temporais S1,S2 e S3

ACF para X1

ACF para X2

0,2
0,15
0,1
0,05
0
-0,05
-0,1
-0,15
-0,2

+- 1,96/T0,5

10

15

+- 1,96/T0,5

0,3
0,2
0,1
0
-0,1
-0,2
-0,3
20

10

defasagem
PACF para X1
+- 1,96/T0,5

20

PACF para X2

0,2
0,15
0,1
0,05
0
-0,05
-0,1
-0,15
-0,2
0

15

defasagem

10

15

+- 1,96/T0,5

0,3
0,2
0,1
0
-0,1
-0,2
-0,3
20

10

defasagem

15

20

defasagem

(a) FAC e FACP - Modelo 1

(b) FAC e FACP - Modelo 2


ACF para X3

+- 1,96/T ,5
0,5
0
-0,5
-1
0

10
defasagem

15

20

PACF para X3
1

+- 1,96/T0,5

0,5
0
-0,5
-1
0

10

15

20

defasagem

(c) FAC e FACP - Modelo 3

Figura 6.11: FAC e FACP para tres series temporais distintas X1 , X2 e X3 .

1990


ESTACIONARIAS

CAPITULO 6. SERIES
TEMPORAIS NAO

130

g) Dos seguintes modelos: AR(1), MA(1), ARMA(1,1), ARIMA(1,1,1), ARIMA(3,1,2) e


ARIMA(1,2,1), qual(is) poderiam ajustar corretamente a serie temporal EXRIT L? Justifique.
h) Foram ajustados 3 modelos para a serie EXRIT L: ARMA(1,1) (AIC =417,1), ARIMA(2,1,3)(AIC
=422,12) e ARIMA(1,1,2) (AIC =417,5). A FAC e FACP dos resduos dos ajustes s
ao
apresentados na figura 6.12. Qual e o melhor modelo? Justifique.

ACF para dY11

ACF para Z2
0.2
0.15
0.1
0.05
0
-0.05
-0.1
-0.15
-0.2

+- 1.96/T0.5

0.4
0.2
0
-0.2
-0.4
0

10

15

20

+- 1.96/T0.5

10

defasagem
PACF para dY11
0.4
0.2
0
-0.2
-0.4
5

10

20

PACF para Z2
0.2
0.15
0.1
0.05
0
-0.05
-0.1
-0.15
-0.2

+- 1.96/T0.5

15
defasagem

15

20

+- 1.96/T0.5

10

defasagem

15

20

defasagem

(a) FAC e FACP dos resduos ARMA(1,1)

(b) FAC e FACP dos resduos ARIMA(2,1,3)

ACF para Z3
0

0.4
0.3
0.2
0.1
0
-0.1
-0.2
-0.3
-0.4

+- 1.96/T .5

10

15

20

defasagem
PACF para Z3
+- 1.96/T0.5

0.4
0.3
0.2
0.1
0
-0.1
-0.2
-0.3
-0.4
0

10

15

20

defasagem

(c) FAC e FACP dos resduos ARIMA(1,1,2)

Figura 6.12: FAC e FACP dos resduos do ajuste de tres modelos a serie EXRIT L.

i) Faca a correspondencia da tabela 1 com a figura 6.12 explicando o seu raciocnio.


j) Escreva a equac
ao do modelo para a seguinte sada do gretl:
Modelo 2: ARIMA, usando as observac
oes 1973:041989:10 (T = 199)
Vari
avel dependente: (1 L)S 3
Erros padr
ao baseados na Hessiana

6.5. EXERCICIOS

Def
1
2
3
4
5
6
7
8
9
10

ACF
-0.483
-0.079
0.089
-0.029
0.044
-0.095
0.072
-0.002
-0.108
0.167

***

**

131

Teste 1
PACF
-0.483
***
-0.408
***
-0.254
***
-0.216
***
-0.098
-0.189
***
-0.121
*
-0.100
-0.249
***
-0.090

Teste 2
[p-valor]
ACF LJUNG-BOX
PACF
Tabela
6.1: Teste
[0.00]
-0.406
***
-0.406

Q-stat
47.49
48.77
50.40
50.58
50.98
52.87
53.99
53.99
56.49
62.44

[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]

Coeficiente
const
1
1

0.00586445
0.350312
1.00000

M
edia var. dependente
M
edia de inovac
oes
Log da verossimilhanca
Crit
erio de Schwarz

0.044
0.016
0.030
0.008
-0.020
0.027
0.045
-0.096
0.122

-0.145
-0.026
0.042
0.052
0.008
0.023
0.075
-0.056
0.073

Erro Padr
ao
0.0315017
0.0665472
0.0124930

0.303518
0.280781
990.5755
2002.324

Q-stat
31.42
31.79
31.85
32.03
32.04
32.12
32.27
32.68
34.52
37.54

***
**

p-valor

0.1862
5.2641
80.0449

0.8523
0.0000
0.0000

D.P. var. dependente


D.P. das inovac
oes
Crit
erio de Akaike
HannanQuinn

[p-valor]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]
[0.00]

ACF
-0.031
-0.121
0.089
0.038
0.066
0.034
0.053
-0.031
0.043
0.048

Teste 3
PACF
Q-stat
-0.031
0.19
-0.122
*
3.22
0.082
4.88
0.029
5.19
0.091
6.12
0.040
6.37
0.070
6.96
-0.035
7.18
0.045
7.58
0.023
8.09

60.82785
34.59412
1989.151
1994.482

Exemplo 6.2. Seja {yt }440


erie temporal. Essa serie foi ajustada de acordo com um
t=1 uma s
modelo AR(2). A equac
ao estimada foi: yt = 14.62 0.61yt1 + 0.15yt2 . Os seguintes dados
est
ao disponveis:
t

436

437

438

439

440

yt

9.88

10.42

11.08

8.12

11.71

ebt

-0.21

0.40

1.33

-1.30

0.38

(a) Calcule a previs


ao um passo a frente e dois passos a frente para a serie yt , ou seja, yb440 (1)
e yb440 (2). R: yb440 (1) = 8.6949 e yb440 (2) = 11.07261.
(b) Calcule o erro de previs
ao um e dois passos a frente, e440 (1) e e440 (2), sabendo-se que
y441 = 8.83 e y442 = 12.24. R: e440 (1) = 0.1351 e e440 (2) = 1.167389.

Exemplo 6.3. Seja {yt }450


erie temporal. Essa serie foi ajustada de acordo com um
t=1 uma s
modelo MA(2). A equac
ao estimada foi: yt = 10.01 + et 0.64et1 + 0.22et2 . Os seguintes
dados est
ao disponveis:
t

446

447

448

449

450

yt

9.79

10.22

7.43

12.41

8.35

ebt

-0.52

0.21

-2.34

0.87

-0.60

(a) Calcule a previs


ao um, dois e tres passos a frente para a serie yt , ou seja, yb450 (1), yb450 (2)
e yb450 (3). R: yb450 (1) = 10.5854, yb450 (2) = 9.878 e yb450 (3) = 10.01.

[p-va
[0.6
[0.1
[0.1
[0.2
[0.2
[0.3
[0.4
[0.5
[0.5
[0.6


ESTACIONARIAS

CAPITULO 6. SERIES
TEMPORAIS NAO

132

(b) Calcule o erro de previs


ao um, dois e tres passos a frente, e450 (1), e450 (2) e e450 (3),
sabendo-se que y451 = 9.80, y452 = 8.78 e y453 = 9.33. R: e450 (1) = 0.7767, e450 (2) =
1.098 e e450 (3) = 0.68.

Exemplo 6.4. Escreva cada um dos seguintes processos usando o operador de defasagem B.
(a) Xt = 0.3Xt1 + at ;
(b) Xt =

Pt

j=1 at ,

t 1;

(c) Xt = at + 0.4at1 0.2at2 + 0.17at3 ;


(d) Xt = 1.5Xt1 0.75Xt2 + at + 4.0;
(e) Xt = 0.5Xt1 + at + 0.4at1 0.2at2 ;
(f ) Xt Xt1 = 0.3Xt1 + at + 0.4at1 ;

Exemplo 6.5. Seja {yt }450


erie temporal. Essa serie foi ajustada de acordo com um
t=1 uma s
modelo ARMA(2,2). A equac
ao estimada foi: yt = 1.61 + 1.39yt1 0.55yt2 + et 0.81et1 +
0.25et2 . Os seguintes dados est
ao disponveis:
t

446

447

448

449

450

yt

12.16

11.69

11.56

10.32

10.87

ebt

0.56

-0.07

0.19

-0.75

0.62

(a) Calcule a previs


ao um, dois e tres passos a frente para a serie yt , ou seja, yb450 (1), yb450 (2)
e yb450 (3). R: yb450 (1) = 10.3536, yb450 (2) = 10.178 e yb450 (3) = 10.06295.
(b) Calcule o erro de previs
ao um, dois e tres passos a frente, e450 (1), e450 (2) e e450 (3),
sabendo-se que y451 = 9.80, y452 = 8.78 e y453 = 9.33. R: e450 (1) = 1.5264, e450 (2) =
2.051996 e e450 (3) = 0.6870544.

Exemplo 6.6. Considere o modelo autorregressivo de primeira ordem, AR(1), definido por
Yt = a + bYt1 + ut ,
em que a e b s
ao par
ametros e ut e uma seq
uencia de vari
aveis aleat
orias independentes e
igualmente distribudas, com media nula e vari
ancia 2 . Suponha que |b| < 1. A previs
ao n
passos-`
a-frente para a vari
avel Y convergir
a para

6.5. EXERCICIOS

133

(a) a.
(b) a media de ut .
(c)

a
1b .

(d) E(Yt ).
(e) .

Exemplo 6.7. As vendas mensais de um certo produto s


ao representadas pelo modelo
Zt = 3 + at + 0.5at1 0.25at2 ,

a2 = 4.

(a) Obtenha Z(`),


` = 1, 2, 3, 100;
(b) Calcule Var[et (`)], ` = 1, 2, 3, 100;
(c) Dados Z1 = 3.25, Z2 = 4.75, Z3 = 2.25 e Z4 = 1.75, calcule Z4 (`) para ` = 1, 2, 3, 100;

Exemplo 6.8. Explique os passos que devem ser seguidos para a modelagem de uma serie
temporal na metodologia ARIMA. Considere a possibilidade de n
ao-estacionariedade da serie.

Exemplo 6.9. Usando a esperanca condicional, calcule as previs


oes 1, 2 e 3 passos a frente
(b
yT (1), ybT (2), ybT (3)) para os seguintes processos:
(a) ARIMA(1,1,0)
(b) ARIMA(1,1,1)
(c) ARIMA(1,2,1)
(d) ARIMA(2,1,2)

Exemplo 6.10. Seja {yt }440


erie temporal. Essa serie foi ajustada de acordo com um
t=1 uma s
modelo ARIMA(1,1,1). O coeficiente estimado para o componente auto-regressivo foi 0,6347
e o coeficiente estimado referente `
a parte MA foi 0,3711. As seguintes informac
oes est
ao
disponveis:


ESTACIONARIAS

CAPITULO 6. SERIES
TEMPORAIS NAO

134
t

436

437

438

439

440

yt

20.52

20.04

20.52

19.64

16.13

ebt

-0.092

-1.29

1.27

-1.66

-2.33

(a) Escreva o modelo usando a notac


ao do operador lag.
(b) Calcule a previs
ao um passo a frente e dois passos a frente para a serie yt , ou seja, yb440 (1)
e yb440 (2). R: yb440 (1) = 13.05 e yb440 (2) = 11.09.
(c) Calcule o erro de previs
ao um e dois passos a frente, e440 (1) e e440 (2), sabendo-se que
y441 = 12.57 e y442 = 9.93. R: e440 (1) = 0.478 e e440 (2) = 1.157.

Exemplo 6.11. Seja {yt }440


erie temporal. Essa serie foi ajustada de acordo com um
t=1 uma s
modelo ARIMA(1,2,1). O coeficiente estimado para o componente auto-regressivo foi 0,6364
e o coeficiente estimado referente a parte MA foi 0,3599. As seguintes informac
oes est
ao
disponveis:
t

436

437

438

439

440

yt

782.78

803.30

823.34

843.86

863.50

ebt

1.34

-0.08

-1.30

1.26

-1.65

(a) Escreva o modelo usando a notac


ao do operador lag.
(b) Calcule a previs
ao um passo a frente e dois passos a frente para a serie yt , ou seja, yb440 (1)
e yb440 (2). R: yb440 (1) = 881.99 e yb440 (2) = 899.74.
(c) Calcule o erro de previs
ao um e dois passos a frente, e440 (1) e e440 (2), sabendo-se que
y441 = 879.64 e y442 = 892.21. R: e440 (1) = 2.35 e e440 (2) = 7.53.

Exemplo 6.12. Seja yt o logaritmo de taxa de c


ambio iene/US$. A seguinte regress
ao foi
proposta: yt = 0 + 1 yt1 + ut . As estimativas seguem abaixo:

b0
b1

Estimativa

dp()

0.162

0.435

0.099

0.025

Sabendo-se que n = 777, faca o teste DF e responda se a serie inf apresenta raiz unit
aria.
Nota: A tabela com os valores crticos para o teste de DF se encontra no final da lista. Note
que se refere ao modelo sem constante, ao modelo com constante e ao modelo com
tendencia.

6.5. EXERCICIOS

135

Exemplo 6.13. Utilizando os dados anuais (1959-1995) de log(P IB) norte americano, a
seguinte regress
ao foi proposta: log(P IB)t = 0 + 1 t + 2 log(P IB)t1 + 3 log(P IB)t1 +
ut . As estimativas seguem abaixo:

b0
b1
b2
b3

Estimativa

dp()

1.650

0.670

0.0059

0.003

-0.320

0.087

0.264

0.126

n = 35
(a) Faca o teste ADF e responda se a serie inf apresenta raiz unit
aria.
(b) A inclus
ao da vari
avel log(P IB)t1 no modelo acima parece ser necess
aria? Justifique.

Exemplo 6.14. Utilizando os dados anuais (1948-1996) de inflac


ao norte americana, a
seguinte regress
ao foi proposta: inft = 0 + 1 inft1 + 2 inft1 + ut . As estimativas
seguem abaixo:

b0
b1
b2

Estimativa

dp()

1.360

0.517

-0.310

0.103

0.138

0.126

n = 47
(a) Faca o teste ADF e responda se a serie inf apresenta raiz unit
aria.
(b) A inclus
ao da vari
avel inft1 no modelo acima parece ser necess
aria? Justifique.

Exemplo 6.15. Responda V ou F, justificando sua resposta: Seja o processo auto-regressivo:


yt = 1 yt1 + t . Pode-se afirmar que:
(a) O processo e estacion
ario para 1 < 1. F
(b) Se 1 = 1, o processo e dito um passeio aleat
orio. V
(c) O estimador de MQO do par
ametro 1 e n
ao-viciado. F
(d) A estatstica t-Student pode ser usada para testar a presenca de raiz unit
aria. F


ESTACIONARIAS

CAPITULO 6. SERIES
TEMPORAIS NAO

136

(e) O processo pode ser escrito em uma forma alternativa como yt = yt1 + t em que
= 1 1 e yt = yt yt1 . V

Exemplo 6.16. Responda V ou F, justificando sua resposta: Um econometrista estimou uma


func
ao consumo usando 25 observaco
es anuais da renda pessoal disponvel e consumo, a partir
do modelo: Ct = 0 + 1 Yt + ut em que Ct representa consumo em t; Yt representa renda
pessoal disponvel em t e ut e um erro aleat
orio. O econometrista fez o teste de Dickey-Fuller
aumentado (ADF) para as series de renda e de consumo, obtendo estimativas para a estatstica
do teste menores que os valores crticos tabelados, a 1%, 5% e 10%. Consequentemente, o
econometrista:
(a) Aceitou a hip
otese nula do teste ADF, concluindo que as series de renda e consumo s
ao
n
ao-estacion
arias. V
(b) Concluiu que o teste t n
ao e v
alido. V
(c) Concluiu que a regress
ao estimada e esp
uria. F
(d) Necessita fazer mais outros testes para verificar se a regress
ao estimada e esp
uria. V

Exemplo 6.17. Responda V ou F, justificando sua resposta. Considere o modelo de regress


ao
linear Ct = 0 + 1 Yt + ut . As vari
aveis s
ao definidas como na quest
ao anterior.
(a) se Ct e Yt s
ao I(1), ent
ao ut ser
a obrigatoriamente estacion
ario. F
(b) se Ct e Yt s
ao integradas, mas com ordens de integrac
ao diferentes, ent
ao a regress
ao
ser
a inv
alida. V
(c) se Ct e Yt s
ao I(1), ent
ao o teste ADF aplicado aos resduos da regress
ao poder
a identificar
a presenca de co-integrac
ao entre as vari
aveis. V
(d) se Ct e Yt s
ao I(1), mas os resduos s
ao I(0), ent
ao h
a co-integraca
o entre as vari
aveis.
V
(e) se Ct e Yt s
ao I(1) e os resduos tambem s
ao I(1), ent
ao a regress
ao de Ct em Yt e
inv
alida. F

Exemplo 6.18. Responda V ou F, justificando sua resposta. Considere a seguinte regress


ao
entre yt e zt : yt = zt + ut , em que ut e o erro. S
ao corretas as afirmativas:

6.5. EXERCICIOS

137

(a) se yt for I(1) e zt for I(0), ent


ao yt e zt s
ao co-integradas. F
(b) se yt for I(0) e zt for I(1), ent
ao yt e zt s
ao co-integradas. F
(c) se yt for I(1) e zt for I(1), ent
ao yt e zt s
ao co-integradas. F
(d) se yt for I(1), zt for I(1) e ut for I(0), ent
ao yt e zt s
ao co-integradas. V

Exemplo 6.19. Responda V ou F, justificando sua resposta. Com respeito `


a teoria das series
temporais, s
ao corretas as afirmativas:
(a) Considere uma serie temporal Yt auto-regressiva de ordem 1 com par
ametro . No modelo:
Yt Yt1 = Yt1 + ut , em que ut e um rudo branco e = 1, se for de fato igual
a zero, a serie Yt ser
a n
ao estacion
aria. V
(b) Numa regress
ao linear simples de duas series temporais n
ao estacion
arias de ordem 1, o
teste usual t de Student ainda e v
alido. F
(c) Numa regress
ao linear m
ultipla de series temporais de ordem 1, mas cointegr
aveis, n
ao
se corre o risco de os resultados serem esp
urios. V
(d) Numa regress
ao linear m
ultipla de series temporais de ordem 1, mas cointegr
aveis, os
resduos da regress
ao s
ao estacion
arios. V
(e) Se uma serie temporal tiver que ser diferenciada n vezes antes de se tornar estacion
aria,
a serie original e integrada de ordem n 1. F

Exemplo 6.20. Sejam Yt e Xt duas series temporais. Considere os resultados dos seguintes
modelos de regress
ao estimados por mnimos quadrados ordin
arios (MQO):
Yt = 4, 8788 0, 1512Yt1
(1,70)

t = 0, 1094 0, 1807Xt1 .
X

(1,97)

(1,26)

Considere tambem os resultados da regress


ao de Yt em Xt .
Yt = 23, 3924 + 14, 4006Xt + et ,
(1,70)

(1,97)

em que et e o resduo. Finalmente, considere a seguinte regress


ao:

et = 0, 0730 0, 4157et1
(0,06)

(3,43)

(2,21)


ESTACIONARIAS

CAPITULO 6. SERIES
TEMPORAIS NAO

138

Os n
umeros entre parenteses s
ao os valores do teste t de signific
ancia individual dos
par
ametros. Dado que o valor crtico a 5% da estatstica de Dickey-Fuller e -2,938, e correto
afirmar que:
(a) Yt e Xt s
ao series temporais integradas de ordem 1.
(b) A regress
ao de Yt em Xt e esp
uria.
(c) A hip
otese de cointegrac
ao entre Yt e Xt e rejeitada pois os resduos da regress
ao de Yt
em Xt s
ao n
ao-estacion
arios.
(d) Para que duas vari
aveis sejam cointegradas e necess
ario que ambas tenham a mesma
ordem de integrac
ao.
(e) A rejeic
ao da hip
otese nula do teste Dickey-Fuller implica que a vari
avel em quest
ao e
n
ao-estacion
aria.

Exemplo 6.21. Faca o exerccio 18.5 do livro do Wooldridge.

Exemplo 6.22. Desafio: Faca o exerccio 18.8, itens 1, 2 e 3 do livro do Wooldridge.

Вам также может понравиться