You are on page 1of 14

UNIVERSIDADE FEDERAL DO PARÁ

INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS


FACULDADE DE ESTATÍSTICA

Modulo I

Séries Temporais: ARIMA

Curso: Bacharelado em Estatística

Disciplina: Estatística Aplicada

Nome: Verena Santos

Matrícula: 11028003401

Belém-PA
2014
Introdução

Os modelos aqui apresentados são os modelos auto-regressivos integrados de médias


móveis, ARIMA( p,d,q), conhecido como abordagem de Box e Jenkins (1970),. são
modelos matemáticos que visam captar o comportamento da autocorrelação entre os
valores da série temporal, e com base nesse comportamento realizar previsões futuras.

Segundo Fava (2000), os modelos ARIMA resultam da combinação de três


componentes denominados “filtros”: o componente auto-regressivo (AR), o filtro de
integração (I) e o componente de médias móveis (MA). Uma série pode ser modelada
pelos três filtros ou apenas um subconjunto deles, resultando em vários modelos
abordados a seguir.

Etapas da Metodologia de Box e Jenkins

Morettin e Toloi (1987) mostram que a construcão dos modelos ARIMA e baseada em
um ciclo iterativo, no qual a escolha do modelo é feita com base nos próprios dados.
Segundo Box e Jenkins (1976). Os estágios do ciclo iterativo são:

a. Identificação: análise de autocorrelações, auto-correlações parciais e outros


critérios;
b. Estimação, na qual os parâmetros do modelo identificado são estimados;
c. verificação ou diagnóstico do modelo ajustado: feita através da análise de
resíduos, para saber se o modelo é adequado para os objetivos, por exemplo,
previsões.

Caso o modelo não seja adequado, o ciclo é repetido, voltando-se à fase de


identificação.

Modelos ARIMA

Modelos lineares Estacionários

Uma série temporal é dita estacionária quando ela se desenvolve no tempo


aleatoriamente ao redor de uma média constante, refletindo alguma forma de
equilíbrio estável.
Operador de defasagem: é o termo usado para designar o operador que representa o
número de períodos associados a uma observação precedente.

Modelos Auto Regressivos (AR)

Em um modelo auto-regressivo, a série de dados Zt é descrita por seus valores passados


Zt−1,Zt−2,..., Zt−p e pelo ruído branco(resíduos são não correlacionados)

A estrutura auto-regressiva geral é expressa por:

𝑍𝑡 = 𝜙1 𝑍𝑡−1 + 𝜙2 𝑍𝑡−2 + ...+ 𝜙𝑝 𝑍𝑡−𝑝 + 𝑎𝑡

Onde:
ϕi são parâmetros da estrutura, i = 1,..., p (ordem da estrutura)
at é ruído branco com média zero e variância 𝜎 2 𝑎 .

O modelo AR(p) pode ser reescrito, utilizando o operador


de defasagem B.

𝜙 𝐵 = 1 − 𝜙1 𝐵 − 𝜙2 𝐵2 − … − 𝜙𝑝 𝐵𝑝

Então pode-se escrever: 𝜙 𝐵 𝑍𝑡−1 = 𝑎𝑡

Função de autocorrelação

ρj = φ1 ρ j –1 + φ2 ρ j –2 + ...+ φp ρ j – p

Então
ρ1 = φ1 ρ j –1 + φ2 ρ j –2 + ...+ φpρ p – 1

ρ2 = φ1 ρ j –1 + φ2 ρ j –2 + ...+ φpρ p – 2

....
ρ p = φ1 ρ j –1 + φ2 ρ j –2 + ...+ φp

Sendo que, neste caso, para j = 1, 2,..., p estas equações são denominadas de Yule-
Walker, onde, em forma matricial, ficam:

Modelos Médias Móveis(MA)

Os modelos médias móveis são formados por combinação linear do ruído


branco, at, ocorridos no período corrente e nos períodos passados.

A estrutura de médias móveis geral é expressa por:


𝑍𝑡 = µ + 𝑎𝑡− Ѳ1 𝑎𝑡−1 − Ѳ2 𝑎𝑡−2 − ⋯ − Ѳ𝑞 𝑎𝑡−𝑞
Onde:
θi são parâmetros da estrutura, i = 1,..., q (a ordem da estrutura)
at é ruído branco com média zero e variância 𝜎 2 𝑎 .

O modelo MA(q) pode ser reescrito, utilizando o operador


de defasagem B.

θ(B) = 1− θ1B −θ2𝐵2 −... − θ2θ𝑞 𝐵𝑞 .

Função de auto correlação

Modelos Auto Regressivos e de Médias Móveis (ARMA)


Esse modelo é uma combinação dos dois anteriores onde Zt é descrito por
seus valores passados e pelos ruídos branco corrente e passados.

A estrutura geral ARMA(p,q) é expressa por:

Zt = ϕ1Zt-1 + ϕ2Zt-2 +... + ϕpZt-p + at - θ1at-1 - θ2at-2 -.... - θqat-q

Onde:
ϕi são os parâmetros da estrutura auto-regressiva, i = 1,..., p
θ i são os parâmetros da estrutura médias móveis, i = 1,..., q
at .ruído branco

Se 𝜙 𝐵 e Ѳ 𝐵 são os operadores auto-regressivos e de médias móveis


,respectivamente, podemos escrever na forma compacta:

𝜙 𝐵 𝑍𝑡 = Ѳ(𝐵)𝑎𝑡

Função de auto correlação

ρj = φ1 ρ j –1 + φ2 ρ j –2 + ...+ φp ρ j – p

As auto-correlações para os lags j > q se comportam como nos modelos


autoregressivos.

Modelos lineares não Estacionários

Modelos Auto Regressivos, Integrados e de Médias Móveis

O modelo ARIMA (p, d, q) é adequado para a previsão de séries temporais cujo


processo estocástico não é estacionário. Logo, a série original passará por algumas
diferenciações a fim de torná-la estacionária (Box & Jenkins, 1994).
O número necessário de diferença para tornar uma série estacionária é
denominado ordem de integração (d).
Para detectar a não-estacionariedade de uma série, o comportamento temporal pode ser
analisado graficamente, buscando padrões como a inclinação nos dados e a variação
dos dados não permanece essencialmente constante sobre o tempo, isto é, indicando que a
variância está se alterando ou, então,aplicando os testes estatísticos de raiz unitária. O teste
de raiz unitária mais usado é o de Dickey-Fuller.

A estrutura geral ARIMA(p, d, q) é expressa por:

ϕ(B) ∇𝑑 𝑍𝑡 = Ѳ(𝐵)𝑎𝑡

Onde:
ϕ(B) representa o operador auto-regressivo de ordem p
ϴ(B) representa o operador médias móveis de ordem q
at ruído branco
d representa o número de diferenças
∇ =1− B representa o operador diferença

1º Estágio para escolha da estrutura do modelo

Identificação de Modelos ARIMA

Para a identificação dos modelos apropriados, inicialmente deve-se analisar o gráfico


do tempo da série em estudo. A análise desse gráfico pode indicar a presença de
tendência ou alteração de variância, revelando se a série é ou não estacionária.
Análise da funções de autocorrelações (ACF) e de autocorrelações parciais (PACF), indica
qual o modelo a ser utilizado, bem como auxilia no uso dos testes de raízes unitárias para
confirmar a estacionariedade.
O objetivo da identificação é determinar os valores de p, d e q do modelo
ARIMA(p,d,q) , além de estimativas preliminares dos parâmetros a serem usadas no
estágio de estimação.

Etapas:
a) Verificar se existe a necessidade de uma transformação na série original, com
objetivo de estabilizar a variância;
b) Tornar a série estacionária por meio de diferenças, de modo que o processo dZt
seja reduzido a um ARMA(p,q)
c) Identificar o processo ARMA(p,q) resultante.
d) Verificação da estacionariedade e da invertibilidade.
Condições de estacionariedade/invertibilidade :

Diferença entre FAC e FACP.

FAC : correlação simples entre Zt e Zt – k em função da defasagem k.


FACP: correlação entre Zt e Zt – k em função da defasagem k, filtrado o efeito de todas
as outras defasagens sobre Zt e Zt – k.

Propriedades teóricas da FAC e FACP

i) FAC decai exponencialmente ou senoidal: indício de processo AR. Nesse caso, a


FACP ajuda a determinar a ordem do processo.
ii) FAC apresenta um corte brusco depois de poucas defasagens: indício de
processo MA. Isso se confirma se a FACP decai exponencialmente.
iii) Estrutura ARMA(p, q)
Como a estrutura ARMA(p, q) corresponde a uma estrutura AR(p) de ordem
infinita ou a uma estrutura MA(q) de ordem também infinita, dos resultados
anteriores pode-se concluir que a função de autocorrelação parcial de uma
estrutura ARMA(p,q) comporta-se de um modo misto mas sem particularidades
notáveis (Souza e Camargo, 2004).

Assim, a partir das FAC. estimadas, tentamos identificar um padrão que se comporte
teóricamente com algum modelo.

Critério de Informação
São alguns procedimentos de identificação utilizado que minimizam funções
penalizadoras particulares.
Consideram não apenas a qualidade do ajuste, mas também penalizam a inclusão de
parâmetros extras.
Os critérios de informação são utilizados para comparação de modelos e que levam em
conta a variância do erro, o tamanho da amostra N e os valores de p, q.

Regra básica: selecionar o modelo cujo critério de informação calculado seja mínimo.
Critérios de informação mais usados:

a. Akaike (AIC) :

AIC(k)=(–2)loge [Verossimilhança Maximizada]+ 2k

k : número de parâmetros estimados (para ARMA(p, q) , k = p + q +1).

Para dados normalmente distribuídos


AIC(k) = N ln(RSS) + 2k

b. Schwarz (SIC) :
SIC(k) = N ln(RSS) + k ln (N)

c. Bayesiano (BIC): (SBC)

BIC(k)=-2logVerossimilhança Maximizada + k +k ln N

n : número de observações
k : número de parâmetros estimados
RSS : Soma dos quadrados dos resíduos

Deve-se manter N fixo para comparar os modelos

1º Estágio para escolha da estrutura do modelo

Estimação de Modelos ARIMA

Identificado a ordem de um modelo ARIMA para uma série temporal precisamos agora
estimar os parâmetros deste modelo. Para isso, podemos utilizar método dos momentos,
estimadores de minimos quadrados e estimadores máxima verossimelhança.

3º Estágio para escolha da estrutura do modelo

Diagnóstico de Modelos ARIMA

Essa etapa consiste em verificar se o modelo identificado e estimado é adequado. Em caso


positivo, ele pode ser utilizado para fazer previsões.Em caso negativo, será necessário
identificar outro modelo e repetir as etapas de estimativa e verificação. Segundo
Fava(2000), as formas de verificação comumente utilizadas são: análise de resíduos e
avaliação da ordem do modelo.
Alguns testes de adequação do modelo
 Teste de autocorrelação residual
 Teste de Box-Pierce
 Teste da autocorrelação cruzada
Previsão com modelos ARIMA

A partir do momento que conseguimos identificar e estimar um modelo ARIMA


adequado às observações, vamos então estudar métodos que possamos utilizar a
modelagem ARIMA para prever os valores das observações h passos a frente.

Vale a pena ressaltar que previsões utilizando modelos ARIMA serão eficazes para um
período curto e as melhores previsões serão aquelas que apresentam um errro quadrático
médio(EQM) mínimo.
Aplicação

Figura 1. Gráfico da série Produto Interno Bruto (PIB) do Brasil, observações anuais de
1861 a 1986

900

800

700

600

500

400

300

200

100

1 13 26 39 52 65 78 91 104 117

Identificação do Modelo

Para a identificação dos modelos apropriados, inicialmente deve-se analisar o gráfico


do tempo da série em estudo.
A análise do gráfico da série PIB na Figura 1, indica a presença de tendência
crescente, indicando a não estacionariedade da série.

O próximo passo é analisar as funções de autocorrelações (FAC) e de autocorrelações


parciais(FACP) da série PIB. O comportamento dessas funções auxilia na verificação
da estacionariedade e na proposição do modelo.

Figura 2. Correlogramas das FAC e FACP da série PIB.

Função de Autocorrelação da série PIB

1,0

0,8

0,6

0,4
Autocorrelação

0,2

0,0

-0,2

-0,4

-0,6

-0,8

-1,0

2 4 6 8 10 12 14 16 18 20

Função de Autocorrelação Parcial da série PIB

1,0

0,8

0,6
Autocorrelatção Parcial

0,4

0,2

0,0

-0,2

-0,4

-0,6

-0,8

-1,0

2 4 6 8 10 12 14 16 18 20

A Figura 2. Mostra a FAC e a FACP da série PIB revelando que as autocorrelações da


FAC apresentam decaimento exponencial, típico do processo auto-regressivo, e o
correlograma da FACP, apresenta a primeira defasagem(lag) diferentes de zero
significativamente. Assim, há uma indicaçãoo de que a ordem do modelo auto-
regressivo é p=1, no caso um modelo AR(1).

Figura 3: Correlograma das FAC’S da 1ª e 2ª diferenças da série PIB.

FAC da 1ª Diferença

1,0

0,8

0,6

0,4
Autocorrelação

0,2

0,0

-0,2

-0,4

-0,6

-0,8

-1,0

2 4 6 8 10 12 14 16 18 20

FAC 2ª Diferença

1,0

0,8

0,6

0,4
Autocorrelação

0,2

0,0

-0,2

-0,4

-0,6

-0,8

-1,0

2 4 6 8 10 12 14 16 18 20

A obtenção do valor de ordem “d” é feita através da escolha do correlograma da FAC


que apresentar menor flutuação em suas defasagens após aplicadas as
diferenciações. Conforme a análise do gráfico da Figura 3, o valor de d = 2, isto
porque o correlograma da 2 ª diferença apresentou menor flutuação que o da 1ª
diferença. Portanto, o diagnóstico da análise inicial, indicou como modelo para
representar a série, o modelo ARIMA (1,2,0).

Estimativa do Modelo

Uma vez indicados os valores de p,d,q, passa-se para a estimativa do parâmetro do


modelo proposto. A estimativa do parâmetro do modelo foi 𝜙1 =-0,2343.

Verificação do Modelo
Essa etapa consiste em verificar se o modelo identificado é adequado. Em caso
negativo, será necessário identificar outro modelo e repetir as etapas de estimativa e
verificação. A forma de verificação utilizada foi:

– Análise de resíduos: os resíduos devem apresentar comportamento de ”ruído


branco“ se o modelo estiver adequadamente especificado, isto é, suas correlações
devem ser não significantes.Utiliza-se o teste de Box-Pierce para reforçar essa
afirmativa.

Figura 4. Correlograma dos Resíduos do Modelo ARIMA (1,2,0).


FACP do Resíduo do PIB

1,0

0,8

0,6

0,4
Autocorrelação

0,2

0,0

-0,2

-0,4

-0,6

-0,8

-1,0

2 4 6 8 10 12 14 16 18 20

A Figura 4 revela que os resíduos efetivamente apresentam comportamento de ruído branco,


logo, o modelo é adequado no que se refere à análise dos resíduos. Embora os lags 4 e 6
apresentem picos no limite de significância.
Essa conclusão é reforçada após a utilização do teste de Box-Pierce .
𝐻0: Os resíduos não são correlacionados (ruído branco)
𝐻1: Os resíduos são correlacionados
Teste de Box-Pierce não apresentou evidências para rejeitar 𝐻0 ,ou seja,os resíduos não
são correlacionados,sendo assim o modelo proposto é adequado.
Referências

[1] MORETTIN, Pedro A. e TOLOI, Clélia M. S´eries Temporais, 2a ed. Editora Atual,
1987.

[2] http://www.portalaction.com.br/1479-47-diagn%C3%B3stico-de-modelos-arima