Вы находитесь на странице: 1из 100

Escola de Administrao Fazendria ESAF

Tema: Ajuste Fiscal e Dvida Pblica


SubTema: Ajuste Fiscal e Equilbrio Macroeconmico
Ttulo: MODELO DE PREVISO PARA ARRECADAO TRIBUTRIA
i
SUMRI O
1 - INTRODUO 1
2 - REVISO BIBLIOGRFICA 6
2.1 - SRIES TEMPORAIS 6
2.1.1 - Estacionariedade 7
2.1.2 - Funo de autocorrelao 8
2.1.3 - Operador de diferena e operador de defasagem 10
2.1.4 - O modelo auto-regressivo (AR) 11
2.1.4.1 - A funo de autocorrelao parcial (PACF) 13
2.1.5 - O modelo de mdias mveis (MA) 15
2.1.6 - O modelo auto-regressivo de mdias mveis (ARMA) 16
2.1.7 - O modelo auto-regressivo integrado de mdias mveis (ARIMA) 17
2.1.8 - O modelo sazonal auto-regressivo integrado de mdias mveis (SARIMA)
17
2.2- MTODOS DE PREVISO 19
2.2.1 - Alisamento exponencial 20
2.2.2 - Mtodo de Box-Jenkins 24
2.2.2.1 - Identificao 25
2.2.2.2 - Estimao 29
2.2.2.3 - Verificao de diagnstico 30
2.3 - Mtodos de comparao de previso 31
2.4 - Softwares estatsticos 33
2.4.1 - O programa R 33
2.4.2 - O programa ITSM2000 33
3 - ANLISE DO MTODO DE PREVISO UTILIZADO PELA SECRETARIA DA
RECEITA FEDERAL (SRF) 35
3.1 - Descrio do mtodo de indicadores 35
3.2 - Resultados 37
3.3 - Anlise economtrica 41
4 - ANLISE E PREVISO DA SRIE TEMPORAL DO IMPOSTO SOBRE A
RENDA (IR) 43
4.1 - Consideraes gerais 43
ii
4.2 - Anlise exploratria 44
4.3 - Modelagem e previso 50
4.3.1 - Alisamento exponencial 50
4.3.2 - Mtodo Box-Jenkins 52
5 - DISCUSSO DOS RESULTADOS 71
5.1 - Comparao de resultados 71
5.2 - Escolha do mtodo de previso 77
5.3 - Escolha de um modelo SARIMA 79
5.4 - Resultados da previso para outros impostos 80
5.5 - Previses com horizonte reduzido 84
6 - CONCLUSO 88
7 - REFERNCIAS BIBLIOGRFICAS 91
APNDICE A 93
APNDICE B 95
1
1 - I NTRODUO
Uma das finalidades da Secretaria da Receita Federal (SRF), estabelecida em
seu Regimento Interno pela Portaria n 227, de 03 de maro de 1998, a de
realizar a previso, o acompanhamento, a anlise e o controle das receitas sob sua
administrao, assim como a de coordenar e consolidar as previses das demais
receitas federais, para subsidiar a proposta oramentria da Unio. Alm de
expresso no Regimento Interno, a atividade de previso de receitas pblicas um
dos requisitos essenciais da Responsabilidade na Gesto Fiscal, instituda pela
denominada Lei de Responsabilidade Fiscal (Lei Complementar n 101, de 04 de
maio de 2000, artigo 11).
Dentro desse contexto institucional, a atividade de previso consiste em
produzir estimativas da arrecadao de todos os tributos e contribuies
administrados pela SRF e demais receitas federais para o exerccio seguinte. Ento,
pode-se ter como objetivos bsicos da atividade de previso da arrecadao
tributria federal a de constituir-se em um instrumento gerencial aos administradores
e a de subsidiar a elaborao da proposta do Oramento Geral da Unio.
Dessa maneira, a previso da arrecadao dos tributos federais uma
atividade que exerce influncia na atividade econmica do pas e no pode ser
relegada a uma atividade meramente cumpridora de exigncias legais. Por isso, a
atividade de previso dos tributos deve possuir caractersticas que faam dela uma
ferramenta segura de apoio para a tomada de decises futura dos policymakers,
2
como planos de investimentos governamentais e planejamento de polticas pblicas
de longo prazo. Assim, as previses devem caracterizar-se pela preciso ou
acurcia de seus resultados, pela simplicidade dos mtodos empregados e,
sobretudo, pela confiabilidade estatstica dos modelos empregados para gerar as
previses.
Em vista disso, o presente trabalho tem por objetivo principal desenvolver um
mtodo de previso baseado em modelos estatsticos e economtricos para a
previso das receitas tributrias federais. Secundariamente, o trabalho mostrar que
o mtodo de previso utilizado atualmente no mbito da Secretaria, denominado
mtodo de indicadores, trata-se de uma prtica, embora intuitiva,
econometricamente limitada.
Para cumprir os objetivos, analisou-se o poder preditivo do mtodo de
indicadores e comparou-o a alguns mtodos de previso existentes, como
alisamento exponencial e modelos ARIMA (metodologia Box-Jenkins). A anlise
detalhada dos procedimentos foi efetuada para a srie temporal da arrecadao
agregada do Imposto sobre a Renda (IR) de julho de 1994 a junho de 1999, com os
meses do ano de 2000 servindo como parmetros de comparao para as previses
geradas. Foram estimadas tambm as previses para os Impostos de Renda das
Pessoas Fsicas e Jurdicas e o Imposto de Renda Retido na Fonte - Rendimentos
do Trabalho.
Esta dissertao encontra-se organizada em trs partes principais: uma
reviso bibliogrfica que aborda os conceitos bsicos de sries temporais e os
3
softwares utilizados nos clculos; a apresentao dos resultados obtidos para a
previso dos valores futuros da srie do IR para o ano de 2000 pelos mtodos dos
indicadores, pelo mtodo de alisamento exponencial e pelo mtodo de Box-Jenkins;
e a discusso sobre os resultados obtidos.
A reviso bibliogrfica compreende o estudo dos conceitos bsicos de sries
temporais, buscando apresent-los de forma simples e didtica, para que esses
conceitos pudessem ser aplicados no embasamento terico das metodologias de
previso. Alm disso, os softwares, R para Windows e ITSM2000 para Windows,
tambm foram objeto de abordagem detalhada.
Os resultados so apresentados por meio de grficos e tabelas. A
comparao dos resultados se d na parte da discusso, onde os resultados para os
trs mtodos so analisados detidamente e seus desempenhos preditivos colocados
prova. Nessa parte, uma metodologia de previso indicada como satisfatria
para gerar as previses dos tributos federais administrados pela Receita Federal.
A continuao desta dissertao est organizada em mais 5 captulos: reviso
bibliogrfica, anlise do mtodo dos indicadores, anlise e previso do IR, discusso
dos resultados e concluso.
No captulo 2 realizado um resumo dos principais conceitos sobre sries
temporais, que envolvem a caracterizao da estacionariedade de uma srie,
funes de autocorrelao e autocorrelao parcial, modelos auto-regressivos, de
mdias mveis e sua combinao, modelos integrados e modelos sazonais. Em
4
seguida, faz-se uma apresentao do mtodo de previso por alisamento
exponencial, mostrando-se os algoritmo de Holt-Winters sazonal aditivo e
multiplicativo, e da metodologia de Box-Jenkins, apresentando-se as trs etapas do
ciclo iterativo que a compe. A seguir, mostram-se os mtodos mais utilizados para
a comparao dos resultados de previso, os chamados ndices de acurcia ou
preciso, e uma medida de acurcia, o MSE, escolhida. Conclui-se o captulo com
uma apresentao dos programas estatsticos empregados nesta dissertao, o R
para Windows e o ITSM2000 para Windows.
No captulo 3 feita uma anlise dos mtodos dos indicadores com a
descrio do mtodo, a apresentao dos resultados das previses geradas para 12
meses do ano de 2000 para os impostos de Renda agregado, o imposto de renda
sobre Pessoas Fsicas e Jurdicas e o imposto de Renda Retido na Fonte -
Rendimentos sobre o Trabalho. A seguir, uma anlise economtrica empregada no
mtodo para se determinar a confiana estatstica das previses geradas pelo
mtodo utilizado pela Receita Federal.
No captulo 4 efetuada uma anlise exploratria da srie do IR agregado e
possveis valores outliers so considerados. Ressalta-se que por causa dos outliers
6 diferentes sries do IR sero analisadas. Em seguida, so geradas previses para
a srie do IR pelos mtodos de alisamento exponencial e Box-Jenkins. Todas as
etapas da metodologia de Box-Jenkins so explicadas e possveis modelos so
escolhidos por meio de um critrio de seleo de modelos, o BIC. Os modelos
escolhidos so testados pelos mtodos de diagnstico disponveis no programa R.
5
No captulo 5 os resultados obtidos nos captulos 3 e 4 so comparados
utilizando os valores do BIC e do MSE. A seguir, faz-se uma escolha do mtodo com
melhores capacidades preditivas que servir como sugesto para a utilizao pela
Secretaria da Receita Federal. Em seguida, so apresentadas as previses para as
sries desagregadadas do IR, ou seja, as sries do IRPF, IRPJ e IRRF (rendimentos
do trabalho) e comparadas com as previses obtidas pelo mtodo dos indicadores.
Conclui-se apresentando previses para horizontes reduzidos, com 1 passo e 3
passos frente, de maneira que tal procedimento possa servir como uma espcie de
ajuste de previses j realizadas.
O captulo final faz uma concluso sobre os mtodos empregados na
dissertao, sugere mudanas na forma de produo de previses e indica
possveis extenses do trabalho.
6
2 - REVI SO BI BLI OGRFI CA
Neste captulo sero apresentados os conceitos bsicos de sries temporais para
subsidiar a explicao dos mtodos de previso por alisamento exponencial e
metodologia Box-Jenkins. Alm disso, os softwares estatsticos utilizados neste
trabalho so analisados e seu funcionamento apresentado.
2. 1 - SRI ES TEMPORAI S
Uma srie temporal caracteriza-se como um conjunto de observaes que
representa uma varivel observada ao longo do tempo. Quando as observaes so
obtidas continuamente, isto , a todo instante ao longo do tempo, diz-se que a srie
temporal contnua, cuja representao X(t). Contrariamente, uma srie temporal
discreta aquela em que as observaes so tomadas em um conjunto discreto, ou
seja, em intervalos fixos de tempo, cuja representao dada por X
t
.
Uma srie temporal {x
t
} a realizao de uma famlia de variveis aleatrias
{X
t
}. De outra maneira, um modelo de srie temporal para dados observados {x
t
}
uma especificao das distribuies de uma seqncia de variveis aleatrias {X
t
}
da qual {x
t
} denominada uma realizao [Brockwell & Davis, 1996]. So
necessrios para a caracterizao da seqncia de variveis aleatrias somente os
momentos de primeira e segunda ordem da distribuio conjunta [Granger &
Newbold, 1986]. O momento de primeira ordem definido como o valor esperado ou
mdia de X
t
:
7
( ).
t t
X E
O momento de segunda ordem definido como o produto esperado ou a covarincia
entre X
t
e X
s
:
( ) ( )( ) [ ] . , cov
, s s t t s t s t
X X E X X
Define-se tambm a varincia de X
t
como
( ) ( ) ( )( ) [ ] ( ) [ ]. var , cov
2
, t t t t t t t t t t t
X E X X E X X X
2.1.1 - Est aci onar i edade
Uma srie temporal {X
t
} dita ser (fracamente) estacionria se
( ) ;
t
X E (i)
;
2
,
<
x t t
(ii)
.
, s t s t
(iii)


Ento, um processo estacionrio apresenta mdia (condio (i)) e
varincia (condio (ii)) constantes ao longo do tempo t e a covarincia (condio
(iii)) entre os dois pontos dependente da distncia entre esses pontos e
independente do tempo t [Granger & Newbold, 1986].
Em vista da condio (iii), tem-se que
0
2

x
e a covarincia usualmente escrita como
( ). , cov
t h t h
X X
+

(1.4)
(1.5)
(1.2)
(1.3)
(1.1)
8
2.1.2 - Funo de aut ocor r el ao
Define-se a funo de autocovarincia de uma srie temporal
estacionria {X
t
} como
( ) ( ) . , cov
t h t x
X X h
+

A funo de autocorrelao (ACF) de uma srie temporal estacionria
{X
t
} definida como
( )
( )
( )
( ). ,
0
t h t
x
x
x
X X cor
h
h
+

As funes de autocovarincia e de autocorrelao fornecem uma


medida til do grau de dependncia entre os valores de uma srie temporal em
diferentes perodos. As autocorrelaes medem ainda o tamanho e a fora da
memria do processo.
O grfico das autocorrelaes amostrais versus h chamado de
correlograma. Tal grfico apresenta valores que sero utilizados para caracterizar as
propriedades lineares ou no do mecanismo gerador do processo [Granger &
Newbold, 1986]. Porm, no simples examinar um correlograma e extrair dele as
correspondentes propriedades populacionais. O que se faz necessrio averiguar
alguns modelos plausveis que provejam correlogramas de formas reconhecidas.
As funes de autocovarincia e autocorrelao amostrais podem ser
(1.6)
(1.7)
9
calculadas para qualquer conjunto de dados e no esto restritas a observaes de
sries temporais estacionrias [Brockwell & Davis, 1996]. Para dados contendo
tendncia, a ACF exibir um decaimento lento na medida que t aumenta, conforme
mostra a Figura 1.1. Para dados com um componente peridico determinstico,
como sazonalidade, a ACF exibir um comportamento similar ao perodo, conforme
a Figura 1.2.
-1.00
-.80
-.60
-.40
-.20
.00
.20
.40
.60
.80
1.00
0 5 10 15 20 25 30 35 40
SampleACF
Figura 1.1 - Correlograma para um srie com tendncia
-1.00
-.80
-.60
-.40
-.20
.00
.20
.40
.60
.80
1.00
0 5 10 15 20 25 30 35 40
ACF amostral
10
Figura 1.2 - Correlograma para um srie com sazonalidade
Assim, o correlograma pode ser utilizado como um indicador de no-
estacionariedade da srie temporal [Brockwell & Davis, 1996]. Deve-se notar que as
linhas tracejadas nas Figuras 1.1 e 1.2 representam limites de significncia
estatstica, acima dos quais as autocorrelaes so consideradas significativamente
diferentes de zero.
2. 1. 3 - Oper ador de di f er ena e oper ador de def asagem
Considere a srie temporal {X
t
}, com t = 0,..., n. A primeira diferena da
srie definida como
,... 3 , 2 , 1 ,
1


t x x x
t t t
O operador denominado operador de diferena. Generalizando (1.8), a n-sima
diferena da srie dada por
( )
( )
.
! !
!
, 1
.
0
1
1 1
r n r
n
r
n
onde x
r
n
x x x
r t
r
n
r
t
n
t
n
t
n

,
_

,
_

Deve-se notar que n observaes so perdidas ao se calcular a n-sima diferena.


O operador de defasagem B definido como
.
1

t t
x Bx
Generalizando (1.10),
,... 2 , 1 , 0 ,

n x x B
n t t
n
O operador B pode ser utilizado na forma polinomial, de maneira que
(1.8)
(1.9)
(1.10)
11
t n t n t t t
k x d x d x d x + + + +

L
2 2 1 1
pode ser escrito como
( )
t t
n
n
k x B d B d B d + + + + L
2
2 1
1
ou
( ) ,
t t
k x B d
onde
( ) ( ). 1
1
n
n
B d B d B d + + + L
2. 1. 4 - O model o aut o- r egr essi v o ( AR)
Um modelo auto-regressivo definido de maneira que os valores da
srie no tempo t dependem dos valores passados. Mais especificamente o modelo
autoregressivo de orem p AR(p)
,
1
1 2 1 1


+ + + + +
p
j
t j t j t p t p t t t
X X X X c X L
onde a srie {
t
} rudo branco
1
com mdia zero e E[X
t

t+s
] = 0, para s>0.
Escrevendo a equao (1.12) em termos do polinmio do operador de defasagem B
tem-se que
( ) .
t t
c X B +
O polinmio (B) de ordem p chamado de polinmio AR e tem-se que
( ) . 1
2
2 1
p
p
B B B B L
Para que a condio de estacionariedade para modelos AR(p) seja
(1.11)
(1.12)
(1.13)
12
satisfeita necessrio que as razes do polinmio (B) estejam foram do crculo
unitrio (no plano complexo). Para um modelo AR(1),
,
1 1 t t t
X c X + +

a condio de estacionariedade satisfeita quando | |<1.
Assumindo que a condio de estacionariedade est satisfeita, a mdia
do processo AR(p) obtida tomando os valores esperados em (1.12),
, ...
2 1

p
c + + + +
ou ainda,
( )
p
c

L
2 1
1
As autocovarincias so calculadas multiplicando-se ambos os lados de (1.14) por
(X
t-j
- ) e tomando os valores esperados,
. 0 ,
, 2 , 1 ,
2
1 1
1 1
{
+ + +
+ +


h
h
p p
p h p h
h

L
L L
A autocorrelao obtida dividindo-se a equao (1.15) por
0,
L L , 2 , 1 ,
1 1
+ +

h
p h p h h

As p equaes obtidas de (1.16) so denominadas de equaes de Yule-Walker e
podem ser escritas na forma matricial como
, P
onde
( ) ( )

p 2 1 1
, , , , , , ,
2
L L
p

1
Para definio sobre o processo rudo branco consultar [Granger & Newbold, 1986]
(1.15)
(1.16)
.
(1.14)
13
e
1
1
1
1
1
]
1

1
1
1
3 2 1
2 1 1
1 2 1
K
M M M
K
K
p p p
p
p



P
.
Ento,
, P
1

de forma que os parmetros auto-regressivos podem ser expressos como uma


funo das p autocorrelaes [Mills, 1990].
O comportamento da funo de autocorrelao de um processo auto-
regressivo uma mistura de decaimento exponencial e/ou decaimento senoidal. Se
as razes da equao auto-regressiva forem reais, ento as autocorrelaes
decairo exponencialmente. Caso as razes sejam complexas, o decaimento ser na
forma senoidal [Granger & Newbold, 1986].
2.1.4.1 - A f uno de aut ocor r el ao par ci al ( PACF)
Em um processo AR(1), X
t
e X
t-2
so correlacionados, mesmo que X
t-2
no aparea diretamente no modelo. O valor da correlao entre X
t
e X
t-2
(i.e.,
2
)
igual correlao entre X
t
e X
t-1
(
1
) multiplicada pela correlao entre X
t-1
e X
t-2
(
1
),
de forma que
2
=
1
2
. Assim, toda essa correlao indireta est presente na ACF
de qualquer processo auto-regressivo [Enders, 1995].
Dessa maneira, define-se a funo de autocorrelao parcial
14
(PACF) como a seqncia de correlaes entre (X
t
e X
t-1
), (X
t
e X
t-2
), (X
t
e X
t-3
) e
assim por diante, desde que os efeitos de defasagens anteriores sobre X
t
permaneam constantes [Hill, Griffiths & Judge, 1999]. A PACF calculada como o
valor do coeficiente
kk
na equao
.
2 2 1 1 t k t kk t k t k t
e X X X X + + + +

L
O coeficiente
kk
obtido das equaes de Yule-Walker aplicadas a
(1.17). Tais equaes so dadas por (1.16) e, substituindo p = k e
i
=
ii
, tem-se
[Mills, 1990]
.
1
1
1
1
1
1 2 1
2 3 1
1 2 1
1 2 1
2 3 1
1 2 1





L
M M L M M
L
L
L
M M L M M
L
L



k k
k k
k k
k k k
k
k
kk
Assim, para um processo AR(p) no h correlao entre X
t
e X
t-k
para
k > p [Mills, 1990]. Ento, todos os valores de
kk
para k > p so zero e a PACF para
um processo AR(p) puro apresenta um corte para zero para defasagens maiores
que p [Enders, 1995].
Assim, pode-se resumir que um processo AR(p) descrito por:
- possuir uma funo de autocorrelao, ACF, que uma
combinao de decaimentos exponenciais e senoidais e tamanho
(1.17)
15
infinito; e
- possuir uma funo de autocorrelao, PACF, que zero para
defasagens maiores que p.
2. 1. 5 - O model o de mdi as mv ei s ( MA)
O modelo de mdias mveis de ordem q, MA(q), dado pela forma
, 1 ,
0
0 2 2 1 1


+ + + + + +
q
j
j t j q t q t t t t
X L
onde {
t
} rudo branco com mdia zero. Alternativamente,
( ) ( ) , 1 ,
1
q
q t t
B B B B X + + + L
onde (B) o polinmio do operador de defasagem B. Um processo MA(q) dito ser
invertvel se as razes de
0 1
2
2 1
+ + + +
q
q
z z z L
se encontrarem fora do crculo unitrio.
As autocovarincias de ordem superior so
( )( ) ( )( )
q j t q j t j t q t q t t j t t j
E X X E

+ + + + + + L L
1 1 1 1
e, como os termos envolvendo produtos de s em diferentes instantes de tempo tm
valor esperado zero, para j > q,
j
= 0, seguindo que
( ) , , , 2 , 1 ,
2
1 1 1
q j
j q q j j
L L + + +
+

. , 0 q j
j
>
Dessa feita, para um processo MA(q) a ACF apresenta um corte para zero para
(1.18)
(1.19)
16
defasagens maiores que q [Mills, 1990]. A funo de autocorrelao parcial de um
processo MA(q) possui tamanho infinito [Mills, 1990].
Pode-se resumir que um processo MA(q) descrito por:
- possuir uma ACF que zero para defasagens maiores que q; e
- possuir uma PACF que uma combinao de decaimentos
exponenciais e senoidais e tamanho infinito.
2. 1. 6 - O model o aut o- r egr essi v o de mdi as mv ei s
( ARMA)
Um processo ARMA(p,q) uma generalizao dos modelos AR(p) e
MA(q), sendo definido como
q t q t t t p t p t t t
X X X c X

+ + + + + + + + + L L
2 2 1 1 2 2 1 1
ou ainda na forma polinomial
( ) ( ) .
t t
B c X B +
A srie temporal {X
t
} estacionria se e somente se as razes de (z)
estiverem fora do crculo unitrio. A srie temporal {X
t
} invertvel se e somente se
as razes de (z) estiverem fora do crculo unitrio. Para os modelos ARMA, as
funes de autocorrelao (ACF) e autocorrelao parciais (PACF) decaem at o
infinito em vez de apresentarem um corte em alguma defasagem particular, como
ocorre com os processos AR e MA puros [Mills, 1990]. Assim, para um processo
ARMA(p,q), a ACF decair, seja diretamente ou oscilando ao redor de zero, a partir
(1.20)
17
da defasagem q. Por sua vez, a PACF decair, seja diretamente ou oscilando ao
redor de zero, a partir da defasagem p [Enders, 1995].
2. 1. 7 - O model o aut o- r egr essi v o i nt egr ado de mdi as
mvei s ( ARI MA)
Se d for um nmero inteiro no-negativo, ento uma srie temporal {X
t
}
dita ser um processo ARIMA(p,d,q) ou um processo integrado de ordem d se
( )
t
d
t
d
t
X X B Y 1
for um processo ARMA(p,q) causal [Brockwell & Davis, 1996]. Um processo
integrado utilizado para sries no-estacionrias.
Assim, um modelo ARMA(p,q) um modelo ARIMA(p,0,q).
Alternativamente, {X
t
} deve satisfazer
( ) ( ) ( ) , ] 1 [
t t
d
B X B B
onde {
t
} rudo branco com mdia zero, (B) e (B) so polinmios de ordem p e q,
respectivamente, (B) um operador estacionrio, a mdia de
d
X
t
e d a
ordem de diferenciao. A ordem de diferenciao ser 0 ou 1 para a maioria dos
processos e raramente d = 2 [Granger & Newbold, 1986].
2. 1. 8 - O model o sazonal aut o- r egr essi v o i nt egr ado de
mdi as mvei s ( SARI MA)
Suponha uma srie temporal sazonal no-estacionria {X
t
} observada s
(1.21)
18
perodos por ano, de maneira que s = 4 para sries trimestrais e s = 12 para sries
mensais. Uma forma de remover a sazonalidade da srie e transform-la em uma
srie estacionria {Z
t
}, para que um modelo ARIMA possa ser empregado, efetuar
uma diferenciao sazonal, nos moldes da diferenciao vista anteriormente. Assim,
( ) . 1
t t
s
s t t
Z X B X X

Contudo, em muitos casos necessrio adicionar ao modelo uma modelagem de Z
t
determinada por seu padro sazonal, ento
( )( ) ( ) , 1
t
s
t
D
s s
Z B X B B
onde
( ) ( ) , 1
1
Ps
Ps
s
s
s
B B B L
( ) ( ). 1
1
Qs
Qs
s
s
s
B B B + + + L
Pela equao (1.22), nota-se que o padro sazonal aleatrio entre os ciclos s
[Brockwell & Davis, 1996].
Se a sazonalidade da srie Z
t
tiver sido filtrada, um modelo
ARIMA(p,d,q) regular pode representar Z
t
, assim
( )( ) ( ) , 1
t t
d
B X B B
onde
( ) ( ), 1
1
p
p
B B B L
( ) ( ), 1
1
q
q
B B B + + + L
e {
t
} rudo branco com mdia zero.
Combinando (1.22) e (1.23), chega-se a classe de modelos sazonais
(1.22)
(1.23)
19
multiplicativos ARIMA(p,d,q)x(P,D,Q) ou SARIMA,
( ) ( )( ) ( ) ( ) ( ) , 1 1
t
s
t
D
s d s
B B X B B B B
onde {
t
} rudo branco com mdia zero. Nessa classe de modelos permite-se tanto
a diferenciao regular quanto a diferenciao sazonal. Nota-se que a srie
diferenciada pode ser representada usando tanto componentes auto-regressivos e
de mdias mveis regulares quanto sazonais. Em geral, o valor para D raramente
maior que um e os valores de P e Q no ultrapassam 2 [Brockwell & Davis, 1996].
O processo representado por (1.24) causal se e somente se (B) 0
e (B) 0, para | z | 1, ou seja, se as razes do polinmios auto-regressivos se
encontrarem fora do crculo unitrio [Brockwell & Davis, 1996]. Um modelo particular
dessa classe de modelos o chamado modelo airline, um modelo
SARIMA(0,1,1)(0,1,1).
A seguir, os modelos tericos apresentados nessa seo sero
aplicados nas metodologias de previso de alisamento exponencial e Box-Jenkins.
Tais metodologias utilizam conceitos e procedimentos diferentes para produzir
prognsticos de sries univariadas, que so sries que possuem somente um
conjunto de dados.
2. 2- MTODOS DE PREVI SO
Nesta seo, sero apresentados dois mtodos de previso. O primeiro
mtodo, denominado de alisamento exponencial (exponential smoothing),
(1.24)
20
considerado um mtodo automtico de previso e seu procedimento bem simples.
O segundo mtodo, denominado de metodologia Box-Jenkins, um mtodo de
utilizao mais complexa que o anterior e emprega a classe de modelos
ARIMA/SARIMA em sua concepo.
2.2.1 - Al i sament o ex ponenci al
O alisamento exponencial um procedimento geral para obteno de
algoritmos de previso automtica que produz resultados relativamente acurados, de
maneira rpida e barata [Granger & Newbold, 1986].
A forma mais simples de alisamento exponencial aquela para sries
temporais que no possuem sazonalidade nem tendncia crescente ou decrescente.
O objetivo estimar o nvel (ou a mdia) presente da srie e usar esse nvel
como previso de valores futuros. O nvel da srie no tempo t estimado como
( ) ( ) , 1 1
2
2
1
L + + +
t t t t
x x x x
com 0 < < 1. Uma forma mais simples de clculo obtida substituindo t por t-1 e
multiplicando os dois lados de (1.46) por (1-), o que leva a
( ) . 1
1
+
t t t
x x x
A previso de todos os valores futuros (f
n,h
), com h = 1, 2,. . ., obtida utilizando-se a
equao (1.26), i.e.,
.
, n h n
x f
Para se iniciar o algoritmo necessrio especificar um valor inicial, que usualmente
[Granger & Newbold, 1986]
.
1 1
x x
(1.25)
(1.26)
21
O peso de cada termo determinado pelo valor de , a constante de
suavizao. A escolha dessa constante feita de maneira que seu valor minimize a
soma dos erros quadrados [Janacek, 2001]. O erro de previso definido como
,
1 , 1

t t t
f x e
para t = 3, 4, ... , n. Ento, a soma dos erros quadrados dada por
( ) .
3
2
1 , 1
3
2


n
t
t t
n
t
t
f x e S
Caso a srie temporal apresente tendncia, a equao (1.26) no
capaz de fazer previses de movimentos crescentes ou decrescentes futuros. O
algoritmo de alisamento exponencial de Holt-Winters leva em considerao esses
movimentos e permite estimar tambm a inclinao atual da srie.
O nvel e a inclinao da srie so dados, respectivamente, por
( )( )
( ) ( ) , 1
, 1
1 1
1 1


+
+ +
t t t t
t t t t
T x x T
T x x x


com 0 < < 1 e 0 < < 1, constantes de suavizao. As previses so obtidas
supondo um acrscimo ou decrscimo continuado dado pela ltima estimativa de
inclinao; assim,
. , , 4 , 3 ,
,
n h hT x f
n n h n
K +
Os possveis valores iniciais do algoritmo so
.
,
1 2 2
2 2
x x T
x x

Os valores para as constantes de suavizao so obtidos como anteriormente, de


forma que seus valores minimizem a soma dos quadrados dos erros de previso um
(1.27)
22
passo frente. O erro de previso dado por
( ) . , , 5 , 4 ,
1 1 1 , 1
n t T x x f x e
t t t t t t
K +

Ento, a soma dos erros quadrados
( ) .
4
2
1 , 1
4
2


n
t
t t
n
t
t
f x e S
Se a srie temporal contiver movimentos sazonais de perodo s, o
algoritmo de Holt-Winters precisa ser modificado para que a sazonalidade seja
estimada. Assim, o algoritmo de Holt-Winters sazonal definido de modo que para
cada perodo seja necessrio estimar um fator de sazonalidade, F
t
. No instante t, a
ltima estimativa do fator de sazonalidade para o perodo F
t-s
(obtido do mesmo
perodo do ano anterior) [Cribari-Neto, 2000]. As equaes para o nvel, a inclinao
e para o fator de sazonalidade so, considerando que a sazonalidade seja aditiva,
( ) ( )( )
( ) ( )
( ) ( )( ) , 1
, 1
, 1
1 1
1 1
s t t t t
t t t t
t t s t t t
F x x F
T x x T
T x F x x



+
+
+ +



com 0 < < 1 , 0 < < 1 e 0 < < 1, constantes de suavizao. As previses so
dadas por
M
K
K
, 2 , , 2 , 1 ,
, , , 2 , 1 ,
2
,
s s s h F hT x
s h F hT x f
s h t n n
s h t n n h n
+ + + +
+ +
+
+
Considerando a sazonalidade multiplicativa, as equaes para o nvel,
a inclinao e para o fator de sazonalidade so, respectivamente,
(1.28)
23
( )( )
( ) ( )
( )( ) , 1
, 1
, 1
1 1
1 1
s t
t
t
t
t t t t
t t
s t
t
t
F
x
x
F
T x x T
T x
F
x
x

,
_

+
+ +

,
_




com 0 < < 1 , 0 < < 1 e 0 < < 1, constantes de suavizao. As previses so
dadas por
( )
( )
.
, 2 , , 2 , 1 ,
, , , 2 , 1 ,
2
,
M
K
K
s s s h F hT x
s h F hT x f
s h t n n
s h t n n h n
+ + +
+
+
+
Os possveis valores iniciais do algoritmo podem ser [Brockwell & Davis, 1996]
( )
( ) ( ) . , , 1 , 1
,
,
1
1 1
1
1 1
s i i T x x F
s
x x
T
x x
s i i i
s
s
s s
K +

+
+
+
+ +
Tanto para a sazonalidade aditiva quanto para a sazonalidade
multiplicativa, os valores das constantes de suavizao so calculados de forma a
minimizar a soma dos quadrados dos erros de previso um passo frente. O erro de
previso
( ) . , , 5 1 , 14 ,
1 1 1 , 1
n t F T x x f x e
s t t t t t t t
K + +

Ento, a soma dos erros quadrados
( ) .
14
2
1 , 1
14
2


n
t
t t
n
t
t
f x e S
As formas aditivas e multiplicativas do algoritmo de Holt-Winters
sazonal podem fornecer previses bem diferentes. Se a srie apresentar oscilaes
(1.29)
24
sazonais aproximadamente constantes, o modelo aditivo mais indicado. Porm, se
as oscilaes sazonais forem proporcionais ao nvel da srie, o modelo multiplicativo
mais indicado. Alternativamente, pode-se utilizar os dois procedimentos e escolher
aquele que fornece a menor soma dos erros de previso um passo frente ao
quadrado [Cribari-Neto, 2000].
2. 2. 2 - Mt odo de Box - Jenk i ns
Dada uma srie temporal no-sazonal no-estacionria {X
t
}, considere
que ela possa ser representada por um modelo da classe ARIMA(p,d,q),

( )( ) ( ) , 1
t t
d
B X B B
onde
( ) ( ) , 1
1
p
p
B B B L
( ) ( ). 1
1
q
q
B B B + + + L
O objetivo da metodologia de Box-Jenkins [Box & Jenkins, 1970]
encontrar um modelo estocstico linear da classe ARIMA que possa ter gerado {X
t
} e
que esse modelo possa ser utilizado para fornecer previses de valores futuros da
srie [Granger & Newbold, 1986]. Caso a srie temporal {X
t
} apresente
sazonalidade, {X
t
} pode ser representada por um modelo da classe
SARIMA(p,d,q) (P,D,Q), conforme a equao (1.24).
A estratgia de modelagem, tanto para modelos sazonais quanto para
no-sazonais, baseada em um ciclo de trs etapas iterativas:
25
(i) identificao do modelo;
(ii) estimao do modelo; e
(iii) verificao de diagnstico.
A etapa de identificao consiste em selecionar valores para p, d, q e
P, D, Q (no caso de modelos sazonais). Essa etapa envolve subjetividade e
julgamento pessoal. Na etapa de estimao, os coeficientes identificados na etapa
anterior so estimados usando tcnicas estatsticas. A ltima etapa indica se o
modelo identificado e estimado descreve adequadamente o comportamento dos
dados da srie {X
t
}. Caso o modelo no seja adequado, o ciclo deve comear
novamente [Cribari-Neto, 2000].
Um conceito importante nessa metodologia o princpio da parcimnia
[Enders, 1995]. Tal princpio sugere que modelos mais simples, com poucos
parmetros, produzem melhores previses que modelos superparametrizados. Um
modelo parcimonioso ajusta bem os dados sem incorporar coeficientes inteis. O
objetivo se aproximar do processo gerador original dos dados e no descrev-lo
exatamente [Enders, 1995].
2.2.2.1 - I dent i f i cao
Essa etapa considerada a mais difcil e delicada, e no h consenso
sobre qual a melhor estratgia a ser seguida [Granger & Newbold, 1986]. Dentre as
vrias estratgias existentes, duas se destacam: a anlise das funes de
26
autocorrelao e autocorrelao parcial amostrais, e o uso de um critrio de seleo
de modelos.
Para utilizar a primeira estratgia necessrio reconhecer modelos
AR, MA e ARMA por meio das caractersticas da ACF e da PACF. A Tabela 2.1
resume as propriedades da ACF e da PACF para diversos modelos ARIMA [Mills,
1990]. Para modelos sazonais, o comportamento da ACF e da PACF deve ser
analisado tambm prximo da defasagem sazonal, por exemplo, defasagem 12 para
dados mensais e defasagem 4 para dados trimestrais. A Tabela 2.2 resume as
propriedades da ACF e da PACF para modelos SARIMA [Bowerman & OConnell,
1987].
Tabela 2.1 - Propriedades da ACF e da PACF para vrios modelos ARIMA
Modelo ACF PACF
(1,d,0)
Decaimento exponencial ou
oscilatrio

kk
=0 para k > 1
(2,d,0)
Decaimento exponencial ou
senoidal

kk
=0 para k > 2
(p,d,0)
Decaimento exponencial e/ou
senoidal

kk
=0 para k > p
(0,d,1)

k
= 0 para k > 1 Dominado por decaimento
exponencial
(0,d,2)

k
= 0 para k > 2 Dominado por decaimento
exponencial ou senoidal
(0,d,q)

k
= 0 para k > q Dominado pela combinao
linear de decaimento
exponencial e/ou senoidal
(1,d,1)
Decaimento exponencial a
partir da defasagem 1
Dominado por decaimento
exponencial a partir da
defasagem 1
(p,d,q)
Decaimento exponencial e/ou
senoidal depois da defasagem
q-p
Dominado por decaimento
exponencial ou senoidal
depois da defasagem q-p
27
Tabela 2.2 - Propriedades da ACF e da PACF para modelos SARIMA
Modelo ACF PACF
(P,D,0) Decaimento Picos nas defasagens s, 2s, ...Ps
e corte aps Ps
(0,D,Q) Picos nas defasagens s, 2s, ...Qs
e corte aps Qs
Decaimento
(P,D,0)
ou
(0,D,Q)
Picos nas defasagens s, 2s, ...Qs
e corte aps Qs
Picos nas defasagens s, 2s, ...Ps
e corte aps Ps
(P,D,0)
e
(0,D,Q)
Decaimento rpido na
defasagem sazonal
Decaimento rpido na
defasagem sazonal
Nenhum
operador
sazonal
Valores pequenos em todas as
defasagens sazonais (no h
picos)
Valores pequenos em todas as
defasagens sazonais (no h
picos)
Alm de identificar os valores para p e q (e os valores de P e Q para
modelos SARIMA), o grau de diferenciao da srie (valor d e valor D para modelos
sazonais) precisa ser conhecido. Para tanto, utiliza-se tambm a inspeo da ACF e
da PACF amostrais. Para um modelo no-sazonal, um comportamento suave
persistente nas autocorrelaes amostrais em defasagens altas indica no-
estacionariedade, i.e., necessidade de diferenciao. Assim, deve-se diferenciar a
srie para sucessivos valores positivos de d e examinar o correlograma de {
d
X
t
}
[Cribari-Neto, 2000].
A segunda estratgia para identificar os valores de p, d, q utilizar um
critrio de informao que selecione os modelos por meio de um conjunto de
regras [Mills, 1990]. Os critrios de seleo para modelos ARIMA mais utilizados
so o AIC (Akaike information criterion), o AICC (Akaike information criterion
corrected) e o BIC (Bayesian information criterion). Esses critrios incorporam um
termo de penalidade para o aumento do nmero de parmetros (p e q) no modelo,
28
de forma que modelos mais parcimoniosos, ou seja, com o menor nmero de
parmetros, sejam escolhidos. As equaes para esses critrios, sendo T o nmero
de observaes, so [Cribari-Neto, 2000]
( )
( )
( ) , log

log 2
,
1
2

log 2
, 2

log 2
T q p L BIC
q p T
T q p
L AICC
q p L AIC
+ +

+
+
+ +
onde L representa a verossimilhana maximizada.
O critrio AIC superestima assintoticamente a ordem verdadeira do
modelo [Granger & Newbold, 1986] apresentando tendncia a escolher modelos
superparametrizados [Cribari-Neto, 2000]. O AICC uma verso corrigida do AIC
que incorpora uma correo de vis para amostras finitas, possuindo uma
penalidade mais forte para modelos de ordem elevada [Brockwell & Davis, 1996].
O BIC um critrio consistente, de forma que ele fornece estimativas
de p e q que convergem em probabilidade para os valores verdadeiros medida que
T tende a infinito [Brockwell & Davis, 1996]. J os critrios AIC e AICC no so
consistentes. Por outro lado, o AIC assintoticamente eficiente para modelos
puramente auto-regressivos.
Na prtica, a seleo de modelos feita calculando o valor do critrio
(o BIC, por exemplo) para todos os modelos ARIMA associados aos valores de p, d
e q de forma que p,q =0,1,2,3,4,5 e d =0,1. Assim, seleciona-se o modelo que
apresenta o menor valor do BIC e modelos alternativos cuja diferena para o valor
^
29
mnimo do BIC seja inferior a 2 [Brockwell & Davis, 1996]. Para a modelagem
SARIMA, a quantidade de modelos investigados maior, pois alm dos valores de
p, d e q, deve-se incluir ainda os valores para P,Q = 0,1,2 e D = 0,1. Porm, os
modelos so selecionados pelos mesmos critrios que os utilizados para os modelos
ARIMA.
2.2.2.2 - Est i mao
Assumindo que um modelo ARIMA da forma
( )( ) ( )
t
q
q t
d p
p
B B X B B B + + + L L
1 1
1 1 1
seja escolhido conforme a etapa anterior, o objetivo agora estimar, utilizando o
mtodo de mxima verossimilhana (ML)
2
, os parmetros = (
1
,...,
p
),
= (
1
,...,
q
) e
2
, a varincia de
t
.
A estimao da ML difcil e geralmente requer muito tempo de
processamento computacional. Desta forma, existem alternativas que aproximam a
funo de mxima verossimilhana. Duas dessas alternativas so o MQE (mnimos
quadrados exatos) e o MQC (mnimos quadrados condicional). Contudo, alguns
estudos tm sugerido [Ansley & Newbold, 1980] que o mtodo de mxima
verossimilhana superior aos demais.
Para a modelagem SARIMA o procedimento idntico ao mostrado
para a modelagem ARIMA, com a superioridade da estimao por mxima

2
Para uma demonstrao da estimativa de ML, consultar [Mills, 1990].
(1.30)
30
verossimilhana sendo ainda mais pronunciada para modelos sazonais [Ansley &
Newbold, 1980].
2.2.2.3 - Ver i f i cao de di agnst i co
A correta especificao de um modelo ARIMA ou SARIMA verificada
no termo
t
, pois ele deve constituir um processo rudo branco [Granger & Newbold,
1986]. Assim, a verificao da adequabilidade do modelo efetuada nas
autocorrelaes amostrais dos erros (
t
), as quais seguem assintoticamente uma
distribuio normal, com mdia zero e desvio padro n
-
, se forem provenientes de
um rudo branco. Como os erros verdadeiros (
t
) no so conhecidos, a inferncia
baseia-se nas estimativas dos erros, os resduos
t
.
Dessa forma, se o modelo estiver corretamente especificado, os
resduos no devem apresentar correlao serial, pois toda a dinmica dos dados j
foi capturada pelo modelo [Cribari-Neto, 2000]. A autocorrelao amostral dos
resduos de ordem j calculada como [Granger & Newbold, 1986]
( ) .

1
2
1

T
t
t
T
j t
j t t
j
r

Ento, os valores das autocorrelaes residuais devem estar contidos no intervalo


de confiana assinttico de 95% que [Cribari-Neto, 2000]
1
]
1

T T
2
,
2
,
31
onde T indica o nmero de observaes da srie.
Em adio ao exame das autocorrelaes individuais dos resduos um
teste conjunto das primeiras m autocorrelaes pode ser utilizado, que conhecido
por teste Ljung-Box. Tal teste portmanteau compara o valor de
( ) ( ) ( )
j j
m
j
r j T T T Q 2
2
1
1

+
com valores tabulados da distribuio do
2
(qui-quadrado) com (m - p - q) graus de
liberdade e com a rejeio da hiptese nula (de que o modelo adequado) para
valores de Q maiores que o valor crtico assinttico [Granger & Newbold, 1986]. O
valor de m deve ser pelo menos igual a T [Cribari-Neto, 2000].
2. 3 - Mt odos de compar ao de pr ev i so
Um dos mtodos de escolha do melhor mecanismo de previso a
comparao dos valores previstos (X
t
) com os valores observados da srie (X
t
), o
que caracteriza a acurcia ou a capacidade preditiva do mecanismo utilizado. Os
trs mtodos mais populares de medio da acurcia utilizam os resduos em seus
clculos [Kvanli et al.,1996]. Esses mtodos so o desvio absoluto mdio (MAD), o
erro quadrtico mdio (MSE) e o erro percentual absoluto mdio (MAPE). Assim, os
resduos so definidos como
.

t t t
X X e
O desvio absoluto mdio (MAD) definido como a mdia dos valores
^
32
absolutos de cada resduo e representado por
,
n
e
MAD
t

onde n o nmero de valores previstos obtidos dos dados passados.


O erro quadrtico mdio (MSE) a mdia dos valores quadrticos de cada
resduo, assim
.
2
n
e
MSE
t

O erro percentual absoluto mdio (MAPE) considera o erro relativo de cada


previso. O erro relativo em cada perodo t definido como e
t
/X
t
. Ento,
.
n
X
e
MAPE
t
t

No h consenso entre os estatsticos sobre qual mtodo prefervel. Assim,


se erros elevados de previso so inaceitveis, ento o uso do MSE faz-se
necessrio. Entretanto, se possvel ignorar alguns erros elevados, o MAD funciona
melhor. E o MAPE utilizado para comparar a acurcia (preciso) de duas sries
temporais diferentes [Kvanli, et al., 1996]. Dessa forma, o MSE ser utilizado como
critrio de acurcia para as comparaes dos mtodos de previso apresentados
neste trabalho.
33
2.4 - Sof t w ar es est at st i cos
2. 4. 1 - O pr ogr ama R
O programa R um sistema para computao estatstica e grfica. Ele
prov, dentre outras coisas, uma linguagem de programao, ferramentas grficas
de alto nvel, interface com outras linguagens de programao e ferramentas para
depurao. O R uma verso gratuita do programa S-PLUS comercializado pela
MathSoft, Inc. Essa plataforma possui vrias qualidades. A primeira ser um
programa gratuito e de livre distribuio. A segunda permitir a criao de novas
funes e a possibilidade de modificao das funes internas. O R pode ser obtido
via Internet no endereo www.r-project.org e possui verses para os sistemas
operacionais Windows, Unix e Macintosh.
2. 4. 2 - O pr ogr ama I TSM2000
O programa ITSM2000, diferentemente do R, um programa
proprietrio. No h a possibilidade de alterao de suas funes, nem a
possibilidade de distribuio gratuita. O programa (verso Windows) acompanha o
livro Introducion to Time Series and Forecasting de Peter Brockwell & Richard
Davis. Trata-se de um programa simples e bastante intuitivo, baseado em escolhas
de menu e botes, seguindo o padro dos programas para o sistema operacional
Windows.
Contudo, o ITSM2000 um programa razoavelmente preciso e
34
completo, permitindo estimao de modelos ARIMA por mxima verossimilhana
exata [Cribari-Neto, 2000]. O critrio de seleo de modelos utilizado no programa
o AICC.
No prximo captulo, o mtodo de previso utilizado no mbito da
Secretaria da Receita Federal ser descrito e detalhado. A descrio envolve a
formulao terica do mtodo, bem como os resultados obtidos na sua aplicao.
Os resultados mostrados neste captulo restringem-se ao Imposto sobre a Renda e
seus componentes mais significativos.
35
3 - Anl i se do mt odo de pr evi so ut i l i zado
pel a Secr et ar i a da Recei t a Feder al ( SRF)
Este captulo descreve sucintamente o mtodo de previso utilizado pela SRF,
mostra as previses geradas por tal mtodo e faz uma anlise economtrica,
mostrando sua inadequabilidade como instrumento estatisticamente confivel de
previso.
3. 1 - Descr i o do mt odo de i ndi cador es
O mtodo utilizado no mbito da SRF, denominado de indicadores, consiste
na multiplicao da arrecadao do perodo anterior por:
- um ndice de preo que represente a variao inflacionria a que
est sujeito o fato econmico gerador da arrecadao;
- um ndice de quantidade que represente a variao real desse fato
gerador;
- um ndice que represente o efeito causado na arrecadao por
modificaes na legislao tributria;
- outros ndices que representem quaisquer influncias na
arrecadao tributria.
Esse mtodo pode ser resumido genericamente na frmula
36
( )( )( )( ), 1 1 1 1
1
U L Q P X X
t t
+ + + +

onde
X
t
= arrecadao prevista para determinado perodo do ano t;
X
t-1
= arrecadao efetiva do mesmo perodo do ano t-1;
P = variao percentual do indicador de preos;
Q = variao percentual do indicador de quantidades;
L = variao percentual decorrente de alteraes da legislao; normalmente
significa variao de alquotas;
U = variao percentual de qualquer outro indicador que tenha influncia na
arrecadao e no possa ser enquadrado nos indicadores bsicos (preo,
quantidade e legislao).
Os termos (1+P), (1+Q) e (1+L) so denominados, respectivamente,
Efeito-Preo, Efeito-Quantidade e Efeito-Legislao. O termo (1+U) representa o
Efeito-Residual. A qualidade da previso com a utilizao desse mtodo depende da
obteno de bons indicadores de preo e quantidade especficos para cada caso
(tributo, setor econmico ou item de receita).
Os rgos de pesquisa de preos e acompanhamento da conjuntura
econmica (IBGE, FGV, IPEA) so fontes importantes para se identificar quais os
ndices de preo e quantidade melhor se adequam aos vrios tributos. Na Tabela 3.1
esto relacionados alguns tributos e seus principais indicadores de preo e
quantidade.
(3.1)
37
A SRF mantm registro de sries histricas dos principais indicadores de
preos e algumas sries de quantidade. As projees dos parmetros
macroeconmicos (inflao, PIB, taxa de cmbio e taxa de juros) que influenciam os
diversos indicadores so elaboradas pela Secretaria de Poltica Econmica do
Ministrio da Fazenda (SPE).
Tabela 3.1 - Tributos e seus indicadores de preo e quantidade
INDICADORES ESPECFICOS TRIBUTO/CONTRIBUIO
PREO QUANTIDADE
Imposto de Importao Taxa de cmbio
Volume de importaes
tributadas, em dlar
IPI - Bebidas ndice de preos de bebidas
Volume de vendas de bebidas ao
mercado interno
IPI - Automveis
ndice de preos da indstria
automobilstica
Volume de vendas de
automveis ao mercado interno
Imposto de Renda Pessoa
Fsica - IRPF
IGP - ndice Geral de Preos Nmero de contribuintes
Imposto de Renda Pessoa
Jurdica - IRPFJ
IGP - ndice Geral de Preos PIB
Imposto de Renda Retido na
Fonte - IRRF - Trabalho
Variao nominal de salrios Nvel de emprego
Imposto de Renda Retido na
Fonte - IRRF - Capital
Taxa de juros
Volume em R$ de aplicaes
financeiras
IOF - Imposto sobre
operaes financeiras
Variao nominal do volume de credito e prmios de seguro (em
R$)
COFINS IGP - ndice Geral de Preos PIB
3. 2 - Resul t ados
Os resultados obtidos pela SRF com a utilizao do mtodo dos indicadores
para os componentes mais significativos da srie do Imposto de Renda esto
mostrados na Tabela 3.2, juntamente com os valores reais da arrecadao, a
diferena percentual entre a previso e o valor observado (%) e o valor do critrio
38
de acurcia MSE.
Tabela 3.2 - Previso gerada pelo mtodo dos indicadores
Srie Imposto sobre a Renda - Agregado
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Total
previso 5.042 3.619 5.641 4.079 4.777 3.820 3.952 4.486 3.666 3.854 4.154 4.847 51.937
Real
5.156 4.206 5.718 4.713 4.113 4.261 4.937 4.619 4.375 4.825 4.705 6.546 58.174
%
-2,22 -13,97 -1,35 -13,46 16,13 -10,34 -19,96 -2,88 -16,20 -20,12 -11,70 -25,95 -10,72
% mdia -10,17
MSE
585.247
Srie Imposto de Renda Pessoa Fsica - IRPF
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Total
previso 136 106 124 819 424 401 405 383 381 138 124 136 3.578
Real
209 159 173 829 407 334 371 336 334 182 226 194 3.754
% -35,09 -33,33 -28,14 -1,20 4,30 20,09 9,05 13,97 14,19 -23,96 -45,14 -30,04 -4,70
% mdia -11,28
MSE
3.062
Srie Imposto de Renda Pessoa Jurdica - IRPJ
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Total
previso 1.305 1.029 2.338 1.180 1.019 871 1.195 1.014 857 1.177 854 937 13.777
Real
1.519 1.629 2.652 1.501 963 1.013 1.866 1.285 1.111 1.901 1.159 1.592 18.191
%
-14,11 -36,84 -11,82 -21,37 5,83 -13,99 -35,97 -21,07 -22,84 -38,09 -26,34 -41,12 -24,26
% mdia -23,14
MSE
188.725
Srie Imposto de Renda Retido na Fonte - Rendimentos do Trabalho
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Total
previso 1.370 1.302 1.454 1.052 1.557 1.219 1.222 1.528 1.236 1.246 1.723 2.072 16.980
Real
1.462 1.306 1.625 1.227 1.494 1.333 1.350 1.547 1.476 1.435 1.755 2.870 18.880
% -6,31 -0,32 -10,53 -14,29 4,20 -8,53 -9,49 -1,24 -16,24 -13,17 -1,80 -27,82 -10,06
% mdia -8,80
MSE
69.494
As Figuras 3.1, 3.2, 3.3 e 3.4 mostram o grfico da srie temporal do imposto,
somente para o ano de 1999, em preto, o valor da arrecadao real no ano de 2000
em azul e o valor da previso para o ano de 2000 em vermelho pontilhado, para
cada um dos impostos constantes na Tabela 3.2. Todos os valores da arrecadao
so mostrados a preos constantes de junho de 2000.
39
Figura 3.1 - Grfico do valor real e da previso gerada
Figura 3.2 - Grfico do valor real e da previso gerada
40
Figura 3.3 - Grfico do valor real e da previso gerada
Figura 3.4 - Grfico do valor real e da previso gerada
41
3. 3 - Anl i se economt r i ca
Considere novamente a equao que descreve o mtodo dos indicadores
( )( )( )( ). 1 1 1 1
1
U L Q P X X
t t
+ + + +

Substituindo o resultado da multiplicao dos ndices entre parnteses por uma
constante c
t
, a equao (3.2) fica
.
1

t t t
X c X
Caso P, Q, L e U sejam simultaneamente zero, ou seja, no ocorram
alteraes percentuais em nenhum dos ndices, o valor de c
t
em (3.3) ser igual a 1
e a previso ser igual ao ltimo valor observado. Caso um dos ndices apresente
variao percentual positiva, por exemplo P = 10%, ceteris paribus, o valor de c
t
em
(3.3) ser igual a 1,1. Caso a variao percentual seja negativa, por exemplo P = -
10%, ceteris paribus, o valor de c
t
em (3.3) ser igual a 0,9. Assim, c
t
pode assumir,
dependendo do sinal da variao percentual, valores maiores ou menores que 1.
Generalizando, caso haja variaes positivas e negativas simultneas em todos os
ndices, o valor de c
t
na equao (3.3) pode assumir valores maiores ou menores
que zero.
A equao (3.3) assemelha-se a uma estrutura AR(1), conforme mostra a
equao (1.12), a menos do termo de erro
t
e do fato que em (3.3) c
t
varia com t.
Assim, o mtodo dos indicadores deve ser considerado como uma representao de
um modelo auto-regressivo de ordem 1 uma vez que X
t-1
representa a arrecadao
efetiva no perodo anterior.
(3.3)
(3.2)
42
Contudo, alm de no conter um termo residual, o mtodo dos indicadores
falha em reproduzir um AR(1) ao possibilitar que o valor de c
t
possa assumir
qualquer valor diferente de zero. E, como j foi visto, todo processo auto-regressivo
de ordem 1 que apresenta o valor absoluto de sua raiz como maior que 1 no pode
representar um processo estacionrio. Ento, no h perda alguma em se
desconsiderar processos AR(1) com |
1
| > 1 [Brockwell & Davis, 1996].
Desta maneira, o mtodo dos indicadores utilizado pela Secretaria da Receita
Federal no est reproduzindo um processo auto-regressivo causal, estacionrio.
Suas previses no so confiveis, uma vez que as condies bsicas de
estacionariedade no so satisfeitas. Por isso, tal mtodo deveria ser abandonado
em prol de alguma outra metodologia mais adequada.
Tal metodologia pode ser alguma das que sero mostradas no prximo
captulo, que inicia-se com uma anlise exploratria da srie agregada do Imposto
sobre a Renda. Depois, as metodologias de previso por alisamento exponencial e
modelagem SARIMA sero empregadas para essa srie e os resultados das
previses obtidas passaro por uma anlise detalhada.
43
4 - Anl i se e pr evi so da sr i e t empor al do
I mpost o sobr e a Renda ( I R)
Este captulo comea com consideraes gerais sobre a srie temporal do IR e suas
especificidades na utilizao desse trabalho. A seguir, so empregadas as
metodologias de previso de Holt-Winters sazonal e Box-Jenkins para a obteno de
valores futuros para a srie do IR.
4. 1 - Consi der aes ger ai s
O Imposto sobre a Renda foi escolhido para a anlise nesse trabalho devido a
sua importncia na arrecadao federal. De acordo com a Tabela 4.1, verifica-se
que esse imposto correspondeu a mais de 30% tanto das receitas administradas
pela SRF quanto do total arrecadado pela Unio Federal no ano de 2000 (em
valores nominais).
Existem dados mensais da srie histrica do Imposto de Renda, assim como
de todos os tributos federais, desde janeiro de 1986. Dessa forma, h mais de 180
observaes na srie temporal. Apesar de ser um nmero razovel de observaes,
deve-se considerar as inmeras mudanas econmicas ocorridas no Brasil desde
ento para se utilizar todos esses dados em uma anlise economtrica. Assim,
neste trabalho optou-se por utilizar os dados disponveis aps a implementao do
Plano Real, por ser esse um perodo de estabilidade inflacionria persistente.
44
Tabela 4.1 - Participao do Imposto sobre a Renda na arrecadao total da
SRF - 2000
Imposto R$ - milhes % - administradas % - arrecadao
Imposto sobre a Importao 8.510,1 5,12 4,83
Imposto sobre a Exportao 2,5 0,00 0,00
Imposto sobre Produtos Industrializados 18.839,1 11,33 10,70
Imposto sobre a Renda 56.396,6 33,92 32,04
I.O.F. - Imposto s/ Operaes Financeiras 3.126,7 1,88 1,78
I.T.R. - Imposto Territorial Rural 267,0 0,16 0,15
CPMF - Contrib. Movimentao Financeira 14.544,6 8,75 8,26
Cofins - Contribuio Seguridade Social 39.903,2 24,00 22,67
Contribuio para o Pis/Pasep 10.043,0 6,04 5,71
CSLL - Contribuio Social s/ Lucro 9.278,0 5,58 5,27
Contrib. p/ Plano Seg. Social Servidores 3.626,6 2,18 2,06
Contribuio para o Fundaf 372,4 0,22 0,21
Outras Receitas Administradas 1.350,3 0,81 0,77
Receitas de Loterias 951,6 0,57 0,54
Demais 398,7 0,24 0,23
Receitas Administradas pela SRF 166.260,10 100,00 94,45
Total da Arrecadao Federal 176.020,60 100,00
Fonte: Secretaria da Receita Federal - MF
Desta maneira, os dados analisados foram divididos em duas partes. A
primeira parte corresponde aos valores observados a partir de julho de 1994 at o
ms de dezembro de 1999. Esses dados sero utilizados pelos mtodos de
alisamento exponencial e de Box-Jenkins para prever os dados conhecidos da
segunda parte, os valores da arrecadao do ano de 2000. A medida de acurcia de
previso empregada ser o MSE. A seguir, ser feita uma anlise exploratria sobre
a srie do Imposto de Renda.
4. 2 - Anl i se ex pl or at r i a
O Imposto de Renda possui a seguinte classificao: IRPF - Pessoa Fsica,
IRPJ - Pessoa Jurdica, IRRF - Retido na Fonte. O IRRF apresenta ainda quatro
subdivises, a saber: Rendimentos do Trabalho, Rendimentos do Capital, Remessas
45
para o Exterior e Outros Rendimentos
Desta maneira, oito sries distintas de dados precisam ser analisadas. Para
simplificao e para evitar repetio de procedimentos, somente a srie agrupada do
imposto ser descrita e analisada detalhadamente. Para as sries do IRPF , do IRPJ
e do IRRF - Rendimentos do Trabalho, somente os resultados sero apresentados.
A srie do imposto de renda {IR} analisada possui 66 observaes e seu
grfico apresentado na Figura 4.1 em milhes de reais. Os dados foram ajustados
pelo ndice de preos IGP-DI divulgado pela Fundao Getlio Vargas em janeiro de
2000, com base em junho de 2000. Assim, os dados so expressos em reais de
junho de 2000 e podem ser interpretados como a preos constantes, sem centavos.
A Tabela 4.2 mostra os valores em milhes de reais das observaes da srie {IR}.
Figura 4.1 - Grfico da srie do IR
46
Tabela 4.2 - Valores do Imposto sobre a Renda agregado em R$-milhes
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
1994 2.546 2.677 2.731 2.507 2.574 4.052
1995 3.950 3.041 4.245 3.042 5.295 3.568 3.411 3.550 3467 3.425 3.458 4.309
1996 3.532 2.883 6.992 3.502 3.629 3.260 3.657 3.201 3.397 3.339 3.359 6.101
1997 4.095 3.102 4.093 4.375 3.411 3.419 4.145 3.345 3.511 4.055 3.492 5.987
1998 6.331 4.366 5.869 4.780 3.463 3.575 5.246 4.989 4.529 4.189 3.834 5.890
1999 5.139 5.718 6.127 5.187 4.083 4.268 4.519 3.683 5184 4.210 3.654 5.952
2000 5.156 4.206 5.718 4.713 4.113 4.261 4.937 4.619 4.375 4.825 4.705 6.546
A srie {IR} apresenta uma mdia amostral de 4,099 bilhes de reais com um
desvio padro de 1,047 bilhes de reais. O valor mximo das observaes de
6,992 bilhes de reais, que corresponde ao ms de maro de 1996, e o valor mnimo
de 2,507 bilhes de reais, referente ao ms de outubro de 1994. Nota-se, pela
Figura 4.1, que h uma flutuao considervel na srie, que pode estar sendo
causada por movimentos sazonais. A distribuio de freqncias de {IR} est
mostrada no histograma da Figura 4.2, em milhes de reais. Verifica-se que a
distribuio positivamente assimtrica, com o valor do coeficiente de assimetria de
Pearson igual a 0,809. O coeficiente de curtose 2,90 e a distribuio do {IR} dita
platicrtica relativamente distribuio normal.
Figura 4.2 - Histograma da srie
47
A presena de movimentos sazonais na srie {IR} pode ser observada na
Figura 4.3, que mostra a componente de sazonalidade presente na srie. Nota-se
claramente um comportamento sazonal homogneo e estvel em todos os anos da
srie, o que caracteriza a srie como uma srie sazonal.
Figura 4.3 - Componente sazonal do IR
Em relao ao crescimento da arrecadao do IR, a taxa mdia de
crescimento de 5,43% ao ms, com a taxa mediana ficando em 0,23% ao ms. O
grfico na Figura 4.4 mostra a taxa de crescimento da srie {IR} e a Figura 4.5
mostra o histograma da taxa de crescimento da srie. Pelo grfico da Figura 4.4,
nota-se que o crescimento mximo foi entre os meses de fevereiro e maro de 1996,
142,5%. Esse crescimento elevado deveu-se principalmente ao pagamento
antecipado do ajuste anual do IRPJ realizado em maro daquele ano. Anteriormente,
esse pagamento era estendido at o ms de maio [Folha de S. Paulo, 1996].
O crescimento mnimo foi entre os meses de maro e abril de 1996, -49,9%.
48
Tal decrscimo deveu-se em parte na deciso da Secretaria da Receita Federal em
processar as declaraes do IRPF, recolhidas at o dia 31 de abril, apenas no final
de maio [Folha de S. Paulo, 1996]. O valor elevado do desvio padro, 32,58%,
evidencia a alta variabilidade na arrecadao desse imposto, o que pode ser
corrigido mediante o uso da srie transformada em logaritmo.
Figura 4.4 - Grfico da taxa de crescimento do IR
Figura 4.5 - Histograma da taxa de crescimento
49
Pelo grfico da Figura 4.4, pelo histograma na Figura 4.5 e pela descrio dos
valores mximos e mnimos da taxa de crescimento, verifica-se que claramente o
valor de maro de 1996, 6,99 bilhes de reais, uma observao que destoa das
demais, ou seja, essa observao um outlier e pode distorcer todo o
comportamento da srie.
A evoluo da arrecadao pode ser observada na Figura 4.6, que mostra a
componente de tendncia da srie. Observam-se quatro nveis principais nesse
grfico, o 1 nvel, que vai at novembro de 1995, apresenta um elevado
crescimento da srie; o 2 nvel, que compreende os meses de dezembro de 1995 a
fevereiro de 1997, mostra um crescimento quase nulo da arrecadao; o 3 nvel,
que vai at janeiro de 1999, mostra novamente um crescimento elevado da srie e o
4 nvel, que compreende o ano de 1999, apresenta um incio de diminuio da
arrecadao.
Figura 4.6 - Componente de tendncia da srie - crescimento da arrecadao
50
Devido elevada variabilidade da srie, a transformao de Box-Cox com
= 0 (transformao logartmica) ser empregada e a srie resultante ser tambm
modelada. Dado que o valor de maro de 1996 um outlier, ele ser substitudo
pelo menor valor para o ms de maro na srie e tambm pelo valor mdio dos
meses de maro na srie [Venables & Ripley, 1999]. Desta maneira, alm da srie
original do IR, sero modeladas mais 5 sries: uma srie utilizando o valor do ms
de maro como o menor valor dos meses de maro {IRmodif}, outra srie utilizando
o valor mdio dos meses de maro {IRmodif2} e as transformaes logartmicas de
{IR}, {IRmodif} e {IRmodif2}, que sero denominadas log{IR}, log{IRmodif} e
log{IRmodif2}.
4. 3 - Model agem e pr ev i so
4.3.1 - Al i sament o ex ponenci al
Como o mtodo de alisamento exponencial considerado um
procedimento automtico de previso, no se faz necessrio aplicar nenhuma
estratgia de modelagem, a menos para verificar se existem tendncias ou
sazonalidades. Desta maneira, o algoritmo de Holt-Winters sazonal aditivo ser
empregado para a previso das sries por meio da utilizao do programa
ITSM2000. A Tabela 4.3 mostra os valores otimizados das constantes de suavizao
da equao (1.28), , e , para cada uma das sries analisadas. As Tabelas 4.4,
4.5 e 4.6 mostram as previses obtidas para cada uma das sries, a diferena
percentual entre a previso e o valor observado (%) e o valor do MSE.
51
Tabela 4.3 - Coeficientes otimizados
Coeficientes otimizados
Sries

{IR} 0,09 0,07 0,48
log{IR} 0,13 0,10 0,55
{IRmodif} 0,10 0,06 0,69
log{IRmodif} 0,14 0,07 0,68
{IRmodif2} 0,10 0,07 0,61
log{IRmodif2} 0,13 0,10 0,64
Tabela 4.4 - Previses geradas para as sries {IR} e log {IR}
Srie {IR} Srie log{IR}
Ms/2000
Arrecadao Real
em R$ milhes previso % MSE Previso % MSE
Janeiro 5.156 5.670 9,97 - 5.622 9,04 -
Fevereiro 4.206 5.135 22,09 - 4.996 18,78 -
Maro 5.718 6.180 8,08 - 6.072 6,19 -
Abril 4.713 5.126 8,76 - 4.977 5,60 -
Maio 4.113 4.376 6,39 - 4.070 -1,05 -
Junho 4.261 4.350 2,09 - 4.111 -3,52 -
Julho 4.937 4.994 1,15 - 4.788 -3,02 -
Agosto 4.619 4.427 -4,16 - 4.140 -10,37 -
Setembro 4.375 5.030 14,97 - 4.841 10,65 -
Outubro 4.825 4.538 -5,95 - 4.289 -11,11 -
Novembro 4.705 4.140 -12,01 - 3.845 -18,28 -
Dezembro 6.546 6.355 -2,92 - 6.225 -4,90 -
Total 58.174 60.321 3,69 207.963 57.976 -0,34 221.613
Diferena percentual mdia 4,04 -0,17
Tabela 4.5 - Previses geradas para as sries {IRmodif} e log{IRmodif}
Srie {IRmodif} Srie log{IRmodif}
Ms/2000
Arrecadao Real
em R$ milhes previso % MSE previso % MSE
Janeiro 5.156 5.709 10,73 - 5.706 10,67 -
Fevereiro 4.206 5.488 30,48 - 5.309 26,22 -
Maro 5.718 6.140 7,38 - 6.038 5,60 -
Abril 4.713 5.225 10,86 - 5.092 8,04 -
Maio 4.113 4.163 1,22 - 4.020 -2,26 -
Junho 4.261 4.289 0,66 - 4.139 -2,86 -
Julho 4.937 4.915 -0,45 - 4.806 -2,65 -
Agosto 4.619 4.285 -7,23 - 4.141 -10,35 -
Setembro 4.375 5.187 18,56 - 5.055 15,54 -
Outubro 4.825 4.499 -6,76 - 4.376 -9,31 -
Novembro 4.705 4.043 -14,07 - 3.903 -17,05 -
Dezembro 6.546 6.332 -3,27 - 6.364 -2,78 -
Total 58.174 60.275 3,61 312.879 58.949 1,33 281.221
Diferena percentual mdia 4,01 1,57
52
Tabela 4.6 - Previses geradas para a srie {IRmodif2}
Srie {IRmodif2} Srie log{IRmodif2}
Ms/2000
Arrecadao Real
em R$ milhes previso % MSE previso % MSE
Janeiro 5.156 5.687 10,30 - 5.652 9,62 -
Fevereiro 4.206 5.327 26,65 - 5.185 23,28 -
Maro 5.718 6.107 6,80 - 6.027 5,40 -
Abril 4.713 5.164 9,57 - 5.034 6,81 -
Maio 4.113 4.183 1,70 - 3.995 -2,87 -
Junho 4.261 4.271 0,23 - 4.087 -4,08 -
Julho 4.937 4.921 -0,32 - 4.746 -3,87 -
Agosto 4.619 4.309 -6,71 - 4.083 -11,60 -
Setembro 4.375 5.089 16,32 - 4.915 12,34 -
Outubro 4.825 4.475 -7,25 - 4.280 -11,30 -
Novembro 4.705 4.037 -14,20 - 3.815 -18,92 -
Dezembro 6.546 6.306 -3,67 - 6.199 -5,30 -
Total 58.174 59.876 2,93 260.900 58.018 -0,27 272.674
Diferena percentual mdia 3,29 -0,04
4. 3. 2 - Mt odo Box - Jenk i ns
A estratgia de modelagem de Box-Jenkins consiste de trs etapas,
conforme explicitado anteriormente. Para a etapa de identificao utilizado o
correlograma da srie, para uma aproximao inicial, e um procedimento de procura
dos menores valores do critrio de seleo BIC. Inicialmente, a anlise recair sobre
as funes de autocorrelao amostral.
O correlograma da srie {IR} est mostrado na Figura 4.7, com o
nmero de defasagens indo de 0

a 36 (36 corresponde a 3 no eixo horizontal). Os
picos nas autocorrelaes de ordem 1, 3 e 9 indicam a no-estacionariedade da
srie e sugerem a necessidade de diferenciao, talvez d = 1. Alm disso, os valores
das autocorrelaes indicam que o valor do termo de mdias mveis pode ser de
ordem 1 ou 3, p = 0 e q = 1 ou 3.
53
Figura 4.7 - Funo de autocorrelao amostral de {IR}
Ao se analisar o correlograma da primeira diferena de {IR},
mostrado na Figura 4.8, evidencia-se fortemente que o termo de mdias mveis
pode ser de ordem 1, uma vez que todas as autocorrelaes amostrais entre as
defasagens 2 e 10 so estatisticamente iguais a zero.
Figura 4.8 - Funo de autocorrelao amostral da primeira diferena de
{IR}
54
J os valores de (12) = 0,44, (24) = 0,21 e (36) = 0,08 na srie {IR}
indicam a presena de sazonalidade e sugerem que o valor do termo de mdias
mveis sazonal pode ser de ordem 1, P = 0 e Q = 1, alm da necessidade de
diferenciao sazonal, D = 1. A sazonalidade pode ser evidenciada tambm no
grfico da primeira diferena da srie, cujos valores de (12), (24) e (36) so 0,45,
0,32 e 0,19, respectivamente.
O grfico da diferena sazonal, D = 1, confirma a suspeita de no-
estacionariedade e da existncia de sazonalidade na srie original {IR}. O resultado,
mostrado na Figura 4.9, indica autocorrelaes amostrais estatisticamente iguais a
zero em todas as defasagens, menos nas defasagens 12 e 29, sendo que esse
ltimo valor pode ser explicado como erro amostral [Granger & Newbold, 1986].
Figura 4.9 - Funo de autocorrelao amostral da 12 diferena de { IR}
Esses resultados sugerem o exame da srie diferenciada duas vezes,
55
uma diferenciao regular e outra sazonal, de forma que d = 1 e D = 1
simultaneamente. O correlograma para essa diferenciao dupla est mostrado na
Figura 4.10. Notam-se valores estatisticamente diferentes de zero na defasagem 1,
o que sugere um termo MA(1), e nas defasagens 12 e 13, o que sugere fortemente a
presena de sazonalidades, de forma que Q = 1. Ento, um modelo SARIMA(p = 0,
d = 1, q = 1)(P = 0, D = 1, Q = 1), representado por
( )( ) ( )( ) , 1 1 1 1
12
1 1
12
t t
B B X B B + +
pode ser uma estimada inicial para a anlise da srie em questo. Essa anlise
revela-se idntica para a srie do log{IR}.
Figura 4.10 - ACF amostral da 1 e 12 diferenas de { IR}
A srie {IRmodif} apresenta um comportamento que se aproxima da
estacionariedade mais do que a srie original {IR}, o que comprova o fato que o
outlier de maro de 1996 distorce a srie. O correlograma da primeira diferena para
a srie {IRmodif} no apresenta um valor estatisticamente diferente de zero na
56
defasagem 11, mas os valores referentes s defasagens 1 e 12 so significativos. J
o correlograma da 12 diferena mostra-se totalmente estacionrio, representando
um processo rudo branco, o que significa que todo movimento sazonal foi absorvido
pela diferenciao, caracterizando o termo de mdia mvel sazonal como zero,
Q = 0.
O correlograma para a dupla diferenciao no apresenta pico na
defasagem 12, mas nas defasagens 1 e 13 o valor da autocorrelao amostral
significativo. Assim, tanto a 1 diferena quanto a 12 diferena produzem resultados
estacionrios, o que pode ser indicativo que d = D = 1. Dessa maneira, espera-se
que os modelos SARIMA(0,1,1)(0,1,0) ou SARIMA(0,1,1)(0,1,1) possam representar
adequadamente a srie {IRmodif}.
Para a srie log{IRmodif}, o comportamento da srie se aproxima mais
da condio de estacionariedade do que a srie {IRmodif}. O correlograma da
primeira diferena idntico ao da srie {IRmodif}. O correlograma da 12 diferena
apresenta somente um valor estatisticamente diferente de zero na defasagem 1, o
que sugere q = 1 e Q = 0. O correlograma da 1 e 12 diferenas simultneas
apresenta tambm somente um valor elevado na defasagem 1, o que sugere que
novamente q = 1 e Q = 0. Assim, tanto pode ocorrer a diferenciao regular ou no,
de forma que d = 0 ou d = 1 e espera-se que os modelos SARIMA(0,1,1)(0,1,0) e
SARIMA(0,0,1)(0,1,0) possam representar adequadamente a srie log{IRmodif}.
A srie {IRmodif2} no se aproxima tanto da condio de
estacionariedade do quanto a srie {IRmodif}, mostrando-se bem prxima da srie
57
original {IR}. Assim, os correlogramas da 1 diferena e da 1 e 12 diferenas
simultneas possuem um comportamento similar ao correlograma da srie {IR}. O
correlograma da 12 diferena apresenta somente um valor estatisticamente
diferente de zero na defasagem 12, o que caracterstico de srie sazonal. Assim,
espera-se que um modelo SARIMA(0,1,1)(0,1,1) possa representar adequadamente
a srie {IRmodif2}.
A srie log{IRmodif2} apresenta no correlograma da 1 diferena um
comportamento similar ao correlograma de {IR}. O correlograma da 12 diferena
apresenta um valor estatisticamente diferente de zero na defasagem 11,
caracterizando o termo sazonal. No correlograma da 1 e 12 diferenas simultneas
h picos na defasagem 1 e 12. Ento, espera-se que um modelo
SARIMA(0,1,1)(0,1,1) possa representar adequadamente a srie log{IRmodif2}.
Deve-se destacar que para as 5 sries descritas acima o correlograma
da srie sem diferenciao semelhante ao da srie original {IR}, com picos nas
defasagens 1, 3 e 12, caracterizando a necessidade de diferenciao serial.
Aps a anlise feita com os correlogramas, a identificao dos modelos
a serem estimados utilizar um critrio de seleo de modelos. A escolha dos
modelos se baseia na minimizao do valor do BIC. Esse critrio foi utilizado por ser
um critrio consistente, ou seja, quanto maior as observaes, mais ele seleciona
um modelo que se aproxima do verdadeiro mecanismo gerador de dados, e por ele
ser parcimonioso, ou seja, por tipicamente escolher modelos com poucos
parmetros.
58
Aqueles modelos que apresentarem o menor valor para o BIC e os que
tiverem valor at duas unidades a mais que o menor valor do BIC sero escolhidos.
Deve-se notar que a funo interna do R, a funo arima0, no informa o valor do
critrio BIC, mas sim do AIC. Dessa maneira, a funo arima0 foi modificada para
que o valor do BIC fosse informado.
Assim, ser utilizada uma funo externa ao programa R obtida de
[Cribari-Neto, 2000] que se encontra no Apndice A. Tal funo calcula, para um
dado conjunto inicial de d, P, D, e Q, o valor do BIC para diferentes valores de p e q,
com 0 p 4 e 0 q 4. Assim, esses valores do BIC so armazenados em uma
matriz, cuja posio (ij) representa os valores p e q, calculados como
. 1 1 j q e i p
Os intervalos possveis para os valores de d, P, D, e Q so definidos
como D = [1], P = [0,2], Q = [0,2], d = [0,1]. Assim, para cada srie so examinados
450 modelos e seus respectivos valores do BIC, uma vez que h 18 combinaes
possveis de modelos com os valores de d, P, D, e Q conforme definidos acima e a
matriz gerada pela funo externa de tamanho 5x5, ou seja, apresenta 25
elementos ou 25 valores de p e q. A Tabela 4.7 traz, para cada srie, os modelos
escolhidos pelo menor valor do critrio BIC e aqueles modelos que diferem em at
duas unidades do menor valor do BIC. Os resultados resumidos dos 450 modelos
possveis de cada srie esto mostrados no Apndice B.
Assim, para a srie {IR}, a Tabela 4.7 mostra que o modelo que
apresenta o menor valor do critrio BIC o modelo airline, ou seja, um modelo
59
SARIMA(0,1,1)(0,1,1). O modelo alternativo que tambm ser estimado um
modelo SARIMA(0,1,1)(1,1,0). Essa concluso coincide com a oriunda da anlise
dos correlogramas.
Tabela 4.7 - Valores do BIC e modelos escolhidos
Modelos
Srie
(p,d,q) (P,D,Q)
BIC
(0,1,1) (0,1,1) 873
{IR}
(0,1,1) (1,1,0) 874,9
(0,1,1) (0,1,1) -18,5
(0,1,1) (1,1,0) -16,7 log{IR}
(1,0,1) (0,1,1) -16,4
(0,1,1) (0,1,0) 857,2
(0,1,1) (0,1,1) 857,9
(0,1,1) (1,1,0) 859,1
{IRmodif}
(1,1,1) (0,1,0) 859,3
(0,0,1) (0,1,0) -32,8
(0,1,1) (0,1,0) -32,3
(1,0,1) (0,1,0) -31,7
(0,1,1) (0,1,1) -30,9
(1,0,0) (0,1,1) -30,7
log{IRmodif}
(1,0,0) (1,1,0) -30,7
(0,1,1) (0,1,1) 861,6
(0,1,1) (1,1,0) 863,3
(0,1,2) (0,1,1) 863,5
{IRmodif2}
(1,1,1) (0,1,1) 863,8
(1,0,0) (0,1,0) -27,3
(0,0,1) (0,1,0) -26,7
(0,1,1) (0,1,1) -26,7
(0,1,1) (0,1,0) -25,5
log{IRmodif2}
(0,1,1) (1,1,0) -25,3
Nota-se, para a srie log{IR}, que o modelo que apresenta o menor
valor do critrio BIC novamente o modelo airline, ou seja, um modelo
SARIMA(0,1,1)(0,1,1). Os modelos alternativos que tambm sero estimados so
um modelo SARIMA(0,1,1)(1,1,0) e um modelo SARIMA(1,0,1)(0,1,1). Outra vez, a
anlise efetuada com os correlogramas acertou ao sugerir o modelo airline como um
modelo adequado para a srie log{IR}.
60
Para a srie {IRmodif} o modelo com menor valor do BIC um
SARIMA(0,1,1)(0,1,0), mas o modelo airline, SARIMA(0,1,1)(0,1,1), apresenta um
valor do BIC muito prximo ao daquele modelo. Assim, alm desses dois, um
modelo SARIMA(0,1,1)(1,1,0) e outro SARIMA(1,1,1)(0,1,0) tambm sero
estimados. Para essa srie, a anlise dos correlogramas est novamente certa, pois
sugeriu os mesmos dois modelos que tambm apresentaram o menor valor para o
BIC.
A srie log{IRmodif} apresentou 6 modelos diferentes para serem
estimados. O modelo que possui o menor BIC um SARIMA(0,0,1)(0,1,0), mas o
modelo SARIMA(0,1,1)(0,1,0) possui o valor do BIC muito prximo ao do modelo
anterior. Esses dois modelos se distinguem por causa da diferenciao regular, ou
seja, o valor de d. E tal fato foi previsto corretamente na anlise dos correlogramas
da srie. Alm desses dois modelos, os modelos SARIMA(1,0,1)(0,1,0),
SARIMA(1,0,0)(0,1,1), SARIMA(0,1,1)(0,1,1) e SARIMA (1,0,0)(1,1,0) sero tambm
estimados.
Para a srie {IRmodif2} o modelo que apresenta o menor valor do BIC
novamente um modelo airline, SARIMA(0,1,1)(0,1,1). Alm desse modelo, os
modelos SARIMA(0,1,1)(1,1,0), SARIMA(0,1,2)(0,1,1) e SARIMA(1,1,1)(0,1,1) sero
estimados. O exame das autocorrelaes amostrais feito anteriormente revelou
tambm que um possvel modelo para estimao era o modelo airline.
O modelo que possui o menor valor do BIC, para a srie log{IRmodif2},
um SARIMA(1,0,0)(0,1,0). Mais 4 modelos apresentam um valor de BIC prximo
ao do menor valor, SARIMA(0,0,1)(0,1,0), SARIMA(0,1,1)(0,1,1),
61
SARIMA(0,1,1)(0,1,0) e SARIMA(0,1,1)(1,1,0). Nessa srie, a anlise do
correlograma no revelou apropriadamente o modelo principal a ser estimado,
porm ainda assim o modelo airline foi especificado.
Aps a identificao dos provveis modelos, a etapa da estimao
gerar os valores estimados dos parmetros , , e e, por conseqncia, as
previses. Para essa etapa, as funes internas do R arima0 e predict sero
utilizadas. Assim, de posse dos modelos escolhidos pela etapa anterior, que so
aqueles com menor valor do BIC e aqueles com uma diferena para o menor BIC
no superior a 2 unidades, calcula-se para cada srie a previso para 12 meses, a
diferena percentual entre o valor previsto e o valor real (%) e o valor do MSE.
As Tabelas 4.8, 4.9, 4.10, 4.11, 4.12 e 4.13 mostram os resultados das
previses para as sries {IR}, log{IR}, {IRmodif}, log{IRmodif}, {IRmodif2} e
log{IRmodif2}, respectivamente. A Tabela 4.14 mostra o clculo das estatsticas t,
que medem a significncia estatstica dos parmetros estimados, para serem
comparados com o valor de 1,96 que corresponde ao nvel assinttica da
distribuio normal a 95% de significncia, para aqueles modelos com o menor valor
do BIC, conforme mostrados na Tabela 4.7.
As Figuras 4.11, 4.12, 4.13, 4.14, 4.15 e 4.16 mostram,
respectivamente, para cada uma das sries {IR}, log{IR}, {IRmodif}, log{IRmodif},
{IRmodif2} e log{IRmodif2}, um grfico da previso gerada pelos modelos com o
menor valor do BIC. O grfico composto da srie temporal do imposto de renda
somente para o ano de 1999 em preto, o valor da arrecadao real no ano de
62
2000 em azul e o valor da previso gerada para o ano de 2000 em vermelho
pontilhado.
Tabela 4.8 - Previses geradas para a srie {IR} - valores em R$ milhes
(0,1,1)(0,1,1) (0,1,1)(1,1,0)
Ms Real
Prev. % Prev. %
Jan 5.156 5.708 10,71 6.232 20,87
Fev 4.206 5.058 20,26 5.555 32,07
Mar 5.718 6.443 12,68 6.504 13,75
Abr 4.713 5.293 12,31 5.491 16,51
Mai 4.113 4.750 15,49 4.282 4,11
Jun 4.261 4.573 7,32 4.430 3,97
Jul 4.937 5.161 4,54 5.382 9,01
Ago 4.619 4.681 1,34 4.832 4,61
Set 4.375 5.098 16,53 5.365 22,63
Out 4.825 4.773 -1,08 4.704 -2,51
Nov 4.705 4.439 -5,65 4.247 -9,73
Dez 6.546 6.560 0,21 6.426 -1,83
Total 58.174 62.537 7,50 63.450 9,07
% mdia 7,89 9,45
MSE 253.846 476.673
Figura 4.11 - Grfico da previso gerada para o modelo SARIMA(0,1,1)(0,1,1)
63
Tabela 4.9 - Previses geradas para a srie log{IR} - valores em R$ milhes
(0,1,1)(0,1,1) (0,1,1)(1,1,0) (1,0,1)(0,1,1)
Ms Real
Prev. % Prev. % Prev. %
Jan 5.156 5.636 9,31 6.025 16,85 5.586 8,34
Fev 4.206 4.967 18,09 5.464 29,91 4.930 17,21
Mar 5.718 6.401 11,94 6.451 12,82 6.319 10,51
Abr 4.713 5.223 10,82 5.372 13,98 5.158 9,44
Mai 4.113 4.370 6,25 4.081 -0,78 4.294 4,40
Jun 4.261 4.322 1,43 4.243 -0,42 4.249 -0,28
Jul 4.937 5.027 1,82 5.165 4,62 4.935 -0,04
Ago 4.619 4.378 -5,22 4.497 -2,64 4.287 -7,19
Set 4.375 5.010 14,51 5.247 19,93 4.912 12,27
Out 4.825 4.561 -5,47 4.505 -6,63 4.458 -7,61
Nov 4.705 4.118 -12,48 4.000 -14,98 4.016 -14,64
Dez 6.546 6.616 1,07 6.354 -2,93 6.446 -1,53
Total 58.174 60.629 4,22 61.404 5,55 59.590 2,43
% mdia 4,34 5,81 2,57
MSE 207.871 397.849 193.268
Figura 4.12 - Grfico da previso gerada para o modelo SARIMA(0,1,1)(0,1,1)
64
Tabela 4.10 - Previses geradas para a srie {IRmodif} - valores em R$ milhes
(0,1,1)(0,1,0) (0,1,1)(0,1,1) (0,1,1)(1,1,0) (1,1,1)(0,1,0)
Ms Real
Prev. % Prev. % Prev. % Prev. %
Jan 5.156 5.153 -0,06 5.505 6,77 5.547 7,58 5.388 4,50
Fev 4.206 5.732 36,28 5.283 25,61 5.521 31,26 6.015 43,01
Mar 5.718 6.141 7,40 6.040 5,63 6.190 8,25 6.437 12,57
Abr 4.713 5.201 10,35 5.181 9,93 5.215 10,65 5.500 16,70
Mai 4.113 4.097 -0,39 4.137 0,58 4.060 -1,29 4.396 6,88
Jun 4.261 4.282 0,49 4.239 -0,52 4.228 -0,77 4.582 7,53
Jul 4.937 4.533 -8,18 4.860 -1,56 4.817 -2,43 4.833 -2,11
Ago 4.619 3.697 -19,96 4.194 -9,20 4.118 -10,85 3.997 -13,47
Set 4.375 5.198 18,81 5.047 15,36 5.153 17,78 5.498 25,67
Out 4.825 4.224 -12,46 4.401 -8,79 4.330 -10,26 4.524 -6,24
Nov 4.705 3.668 -22,04 3.922 -16,64 3.821 -18,79 3.968 -15,66
Dez 6.546 5.966 -8,86 6.171 -5,73 6.062 -7,39 6.266 -4,28
Total 58.174 57.892 -0,48 58.980 1,39 59.062 1,53 61.404
% mdia 0,12 1,79 1,98 6,26
MSE 517.505 264.761 374.351 584.730
Figura 4.13 - Grfico da previso gerada para o modelo SARIMA(0,1,1)(0,1,0)
65
Tabela 4.11 - Previses geradas para a srie log{IRmodif} - valores em R$
milhes
(0,0,1)(0,1,0) (0,1,1)(0,1,0) (1,0,1)(0,1,0) (0,1,1)(0,1,1) (1,0,0)(0,1,1) (1,0,0)(1,1,0)
Ms Real
Prev. % Prev. % Prev. % Prev. % Prev. % Prev. %
Jan 5.156 5.171 0,29 5.100 -1,09 5.114 -0,81 5.431 5,33 5.238 1,59 5.243 1,69
Fev 4.206 5.718 35,95 5.674 34,90 5.695 35,40 5.217 24,04 5.583 32,74 5.615 33,50
Mar 5.718 6.127 7,15 6.080 6,33 6.106 6,79 6.032 5,49 6.094 6,58 6.113 6,91
Abr 4.713 5.187 10,06 5.147 9,21 5.172 9,74 5.143 9,12 5.149 9,25 5.158 9,44
Mai 4.113 4.083 -0,73 4.052 -1,48 4.073 -0,97 4.035 -1,90 4.026 -2,12 4.034 -1,92
Jun 4.261 4.268 0,16 4.235 -0,61 4.260 -0,02 4.157 -2,44 4.202 -1,38 4.212 -1,15
Jul 4.937 4.519 -8,47 4.484 -9,18 4.512 -8,61 4.781 -3,16 4.570 -7,43 4.570 -7,43
Ago 4.619 3.683 -20,26 3.655 -20,87 3.678 -20,37 4.049 -12,34 3.770 -18,38 3.768 -18,42
Set 4.375 5.184 18,49 5.144 17,58 5.178 18,35 5.001 14,31 5.114 16,89 5.132 17,30
Out 4.825 4.210 -12,75 4.178 -13,41 4.206 -12,83 4.321 -10,45 4.207 -12,81 4.208 -12,79
Nov 4.705 3.654 -22,34 3.626 -22,93 3.651 -22,40 3.814 -18,94 3.667 -22,06 3.667 -22,06
Dez 6.546 5.952 -9,07 5.906 -9,78 5.948 -9,14 6.157 -5,94 5.947 -9,15 5.947 -9,15
Total 58.174 57.756 -0,72 57.281 -1,54 57.593 -1,00 58.138 -0,06 57.567 -1,04 57.667 -0,87
% mdia -0,13 -0,84 -0,41 0,26 -0,52 -0,34
MSE 518.353 516.689 512.026 278.206 455.430 467.035
Figura 4.14 - Grfico da previso gerada para o modelo SARIMA(0,1,1)(0,1,0)
66
Tabela 4.12 - Previses geradas para a srie {IRmodif2} - valores em R$
milhes
(0,1,1)(0,1,1) (0,1,1)(1,1,0) (0,1,2)(0,1,1) (1,1,1)(0,1,1)
Ms Real
Prev. % Prev. % Prev. % Prev. %
Jan 5.156 5.624 9,08 5.847 13,40 5.720 10,94 5.704 10,63
Fev 4.206 5.194 23,49 5.523 31,31 5.406 28,53 5.378 27,86
Mar 5.718 6.151 7,57 6.320 10,53 6.332 10,74 6.325 10,62
Abr 4.713 5.247 11,33 5.327 13,03 5.428 15,17 5.425 15,11
Mai 4.113 4.360 6,01 4.147 0,83 4.503 9,48 4.507 9,58
Jun 4.261 4.370 2,56 4.306 1,06 4.533 6,38 4.533 6,38
Jul 4.937 5.021 1,70 5.061 2,51 5.183 4,98 5.184 5,00
Ago 4.619 4.420 -4,31 4.431 -4,07 4.567 -1,13 4.570 -1,06
Set 4.375 5.079 16,09 5.236 19,68 5.264 20,32 5.260 20,23
Out 4.825 4.571 -5,26 4.487 -7,01 4.728 -2,01 4.729 -1,99
Nov 4.705 4.139 -12,03 4.002 -14,94 4.285 -8,93 4.289 -8,84
Dez 6.546 6.358 -2,87 6.214 -5,07 6.512 -0,52 6.515 -0,47
Total 58.174 60.534 4,06 60.901 4,69 62.461 7,37 62.419 7,30
% mdia 4,45 5,10 7,83 7,75
MSE 225.266 372.106 326.076 317.364
Figura 4.15 - Grfico da previso gerada para o modelo SARIMA(0,1,1)(0,1,1)
67
Tabela 4.13 - Previses geradas para a srie log{IRmodif2} - valores em R$
milhes
(0,0,1)(0,1,0) (0,1,1)(0,1,0) (1,0,1)(0,1,0) (0,1,1)(0,1,1) (1,0,0)(0,1,1)
Ms Real
Prev. % Prev. % Prev. % Prev. % Prev. %
Jan 5.156 5.160 0,08 5.173 0,33 5.502 6,71 5.143 -0,25 5.714 10,82
Fev 4.206 5.727 36,16 5.718 35,95 4.993 18,71 5.723 36,07 5.448 29,53
Mar 5.718 6.131 7,22 6.127 7,15 6.101 6,70 6.132 7,24 6.281 9,85
Abr 4.713 5.188 10,08 5.187 10,06 5.134 8,93 5.191 10,14 5.251 11,42
Mai 4.113 4.083 -0,73 4.083 -0,73 4.162 1,19 4.086 -0,66 4.024 -2,16
Jun 4.261 4.268 0,16 4.268 0,16 4.193 -1,60 4.271 0,23 4.190 -1,67
Jul 4.937 4.519 -8,47 4.519 -8,47 4.889 -0,97 4.523 -8,39 4.929 -0,16
Ago 4.619 3.683 -20,26 3.683 -20,26 4.208 -8,90 3.686 -20,20 4.222 -8,59
Set 4.375 5.184 18,49 5.184 18,49 4.944 13,01 5.188 18,58 5.158 17,90
Out 4.825 4.210 -12,75 4.210 -12,75 4.418 -8,44 4.213 -12,68 4.369 -9,45
Nov 4.705 3.654 -22,34 3.654 -22,34 3.949 -16,07 3.657 -22,27 3.857 -18,02
Dez 6.546 5.952 -9,07 5.952 -9,07 6.362 -2,81 5.957 -9,00 6.166 -5,81
Total 58.174 57.759 -0,71 57.758 -0,72 58.855 1,17 57.770 -0,69 59.609 2,47
% mdia -0,12 -0,12 1,37 -0,10 2,80
MSE 520.964 518.359 194.672 518.733 359.625
Figura 4.16 - Grfico da previso gerada para o modelo SARIMA(1,0,0)(0,1,0)
68
Tabela 4.14 - Clculo das estatsticas t para os modelos com menor BIC
Parmetros estimados
Srie Modelo
erro-padro
estatstica t
(em valor absoluto)
-1,00 -0,69
{IR} (0,1,1)(0,1,1)
0,13 0,27
7,69 2,55
-0,84 -0,57
log{IR} (0,1,1)(0,1,1)
0,12 0,20
7,00 2,85
-0,78
{IRmodif} (0,1,1)(0,1,0)
0,12
6,50
0,41
log{IRmodif} (0,0,1)(0,1,0)
0,11
3,72
-0,87 -0,50
{IRmodif2} (0,1,1)(0,1,1)
0,15 0,20
5,80 2,50
0,39
log{IRmodif2} (0,0,1)(0,1,0)
0,12
8,33
Aps a obteno das previses, a prxima etapa do mtodo de Box-
Jenkins a verificao da qualidade do ajuste. Por causa da quantidade de modelos
selecionados, somente aqueles modelos que apresentaram o menor valor do BIC
so verificados. Para essa verificao, a funo interna do R arima0.diag ser
utilizada, mas com algumas modificaes. Como a funo original no traa as
bandas assintticas da distribuio normal (1,96 e -1,96) no grfico dos Resduos
Normalizados, tais linhas foram incorporadas.
A funo original calcula os valores p para a estatstica Box-Pierce e
no para a estatstica Ljung-Box, e isso tambm foi modificado, uma vez que a
estatstica Ljung-Box tipicamente mais precisa em amostras pequenas. Nesse
mesmo grfico, como todos os valores p devem estar acima de 0,05 e abaixo de 1, o
limite do eixo vertical foi aumentado para que uma linha tracejada fosse traada
justamente no limite de y = 1. Alm disso, os ttulos e as legendas dos grficos esto
em portugus.
69
Os grficos de diagnstico para o modelo SARIMA(0,1,1)(0,1,1) da
srie {IR}, cuja equao estimada dada por
( )( ) ( )( )
[ ] [ ] 27 , 0 13 , 0
, 69 , 0 1 1 1 1
12 12
t t
B B X B B
onde os valores entre colchetes representam os valores aproximados do erro padro
para os parmetros estimados, sugerem a validade do modelo.
Os grficos de diagnstico para o modelo SARIMA(0,1,1)(0,1,1) da
srie log{IR}, cuja equao estimada dada por
( )( ) ( )( )
[ ] [ ] 20 , 0 12 , 0
, 57 , 0 1 84 , 0 1 1 1
12 12
t t
B B X B B
onde os valores entre colchetes representam os valores aproximados do erro padro
para os parmetros estimados, sugerem a validade do modelo.
Os grficos de diagnstico para o modelo SARIMA(0,1,1)(0,1,0) da srie
{IRmodif}, cuja equao estimada dada por
( )( ) ( )
[ ] 12 , 0
, 78 , 0 1 1 1
12
t t
B X B B
onde os valores entre colchetes representam os valores aproximados do erro padro
para os parmetros estimados, sugerem a validade do modelo.
Os grficos de diagnstico para o modelo SARIMA(0,0,1)(0,1,0) da srie
log{IRmodif}, cuja equao estimada dada por
( ) ( )
[ ] 11 , 0
, 41 , 0 1 1
12
t t
B X B +
70
onde os valores entre colchetes representam os valores aproximados do erro padro
para os parmetros estimados, sugerem a validade do modelo.
Os grficos de diagnstico para o modelo SARIMA(0,1,1)(0,1,1) da srie
{IRmodif2}, cuja equao estimada dada por
( )( ) ( )( )
[ ] [ ] 20 , 0 15 , 0
, 50 , 0 1 87 , 0 1 1 1
12 12
t t
B B X B B
onde os valores entre colchetes representam os valores aproximados do erro padro
para os parmetros estimados, sugerem a validade do modelo.
Os grficos de diagnstico para o modelo SARIMA(0,0,1)(0,1,0) da srie
log{IRmodif2}, cuja equao estimada dada por
( )( )
[ ] 12 , 0
, 1 39 , 0 1
12
t t
X B B +
onde os valores entre colchetes representam os valores aproximados do erro padro
para os parmetros estimados, sugerem a validade do modelo.
Aps a apresentao dos resultados obtidos para as previses
oriundas dos diversos mtodos, no prximo captulo discutir-se-o as previses e
ser feita uma comparao entre os trs mtodos de previso apresentados at
aqui. Depois da comparao, um dos mtodos ser recomendado para realizar
previses na SRF. De posse desse mtodo, sero geradas previses para as sries
desagregadadas do IR (IRPF, IRPJ e IRRF-trab) e seus resultados sero
comparados com os valores obtidos pelo mtodo dos indicadores. Por fim, sero
realizadas previses com o horizonte reduzido para 1 passo e 3 passos frente.
71
5 - Di scusso dos r esul t ados
Neste captulo, sero comparados os resultados obtidos pelo mtodo de
indicadores, pelo algoritmo de Holt-Winters sazonal e pela modelagem de Box-
Jenkins para a srie {IR} e faz-se a escolha de um mtodo de previso para
representar os dados. Sero apresentados ainda os resultados para mais trs
impostos que compem o Imposto sobre a Renda. Alm disso, so obtidas
previses para 1 passo e 3 passos frente.
5. 1 - Compar ao de r esul t ados
Apesar de o mtodo utilizado pela SRF no ser estatisticamente confivel,
deve-se comparar os resultados obtidos pelo mtodo dos indicadores com os
oriundos dos mtodos de alisamento exponencial e Box-Jenkins, para analisar o
melhoramento nos resultados de previso introduzido pela adoo dessas novas
tcnicas economtricas, estatisticamente mais confiveis.
Como o mtodo dos indicadores utiliza somente a srie de dados sem
transformao, inicialmente a comparao ser feita com os resultados para a srie
intitulada {IR}. Teoricamente, a comparao pode se basear no valor do MSE, uma
vez que os valores reais esto disponveis. A Tabela 5.1 resume os resultados das
Tabelas 3.2, 4.3 e 4.7. O modelo SARIMA escolhido foi aquele de menor valor do
BIC, que coincidentemente tambm possui o menor valor de MSE.
72
Tabela 5.1 - Comparao de resultados para a srie {IR}
ndices
Mtodo
% agregada % mdia MSE
Indicadores -10,72 -10,17 585.247
Holt-Winters sazonal 3,69 4,04 207.963
SARIMA(0,1,1)( 0,1,1) 7,5 7,9 253.846
Apesar de o valor da diferena percentual ser um ndice meramente
ilustrativo, que mostra quo prximo o modelo previu o valor observado, esse valor
pode ser utilizado como comparao didtica entre os modelos. Assim, os modelos
de alisamento exponencial e de Box-Jenkins aproximam-se melhor dos valores
observados para a srie{IR} quando comparados aos valores das diferenas
percentuais dos mtodos. Verifica-se ainda que as previses geradas pelo mtodo
de indicadores subestimam as receitas anuais totais em mais de 10% e subestimam,
na mdia, as arrecadaes mensais em mais de 10%.
Alm disso, nota-se que as metodologias de alisamento exponencial e Box-
Jenkins superaram a capacidade preditiva do mtodos de indicadores, pois elas
apresentam menores valores de MSE. A diferena do MSE entre os dois mtodos e
do mtodos de indicadores maior que 100%, o que indica a presena de grandes
resduos gerados pelo mtodo utilizado pela SRF, caracterizando novamente a
inadequabilidade desse mtodo. A comparao entre os mtodos de Holt-Winters e
Box-Jenkins ser apresentada a seguir.
Como o mtodo dos indicadores no inclui uma anlise exploratria dos
dados da srie histrica e como o valor de maro de 1996 uma observao outlier,
a comparao agora ser feita entre as metodologias alisamento exponencial (HWS)
e Box-Jenkins, e entre as sries {IR}, log{IR}, {IRmodif}, log{IRmodif}, {IRmodif2}
73
e log{IRmodif2}. Essa comparao utilizar o menor valor do MSE para caracterizar
o modelo com a melhor capacidade preditiva. A Tabela 5.2 resume as informaes
das Tabelas 4.3, 4.4, 4.5, 4.7, 4.8, 4.9, 4.10, 4.11 e 4.12. Os 6 modelos SARIMA
foram escolhidos pelo critrio de menor BIC.
Tabela 5.2 - Comparao de resultados para todas as sries
ndices
Srie Mtodo/Modelo
% agregada % mdia MSE
HWS 3,69 4,04 207.963
{IR}
SARIMA(0,1,1)( 0,1,1) 7,5 7,9 253.846
HWS -0,34 -0,17 221.613
log{IR}
SARIMA(0,1,1)( 0,1,1) 4,22 4,34 207.871
HWS 3,61 4,01 312.879
{IRmodif}
SARIMA(0,1,1)( 0,1,0) -0,48 -0,12 517.505
HWS 1,33 1,57 281.221
log{IRmodif}
SARIMA(0,0,1)( 0,1,0) -0,72 -0,13 518.353
HWS 2,93 3,29 260.900
{IRmodif2}
SARIMA(0,1,1)( 0,1,1) 4,06 4,45 225.266
HWS -0,27 -0,04 272.674
log{IRmodif2}
SARIMA(0,0,1)( 0,1,0) -0,71 -0,12 520.964
Em relao srie {IR}, o mtodo de alisamento exponencial forneceu
melhores previses do que o modelo SARIMA, pois os valores das diferenas
percentuais so menores para o primeiro mtodo. Ainda, a capacidade preditiva do
mtodo HWS melhor que a do mtodo Box-Jenkins em termos do valor do MSE.
Os dois mtodos superestimaram as previses da arrecadao total e a mdia da
arrecadao mensal.
Para a srie log{IR}, o mtodo de alisamento exponencial conseguiu
aproximar-se com diferenas quase nulas dos valores observados, visto que a %
agregada inexpressiva. Contudo, a modelagem SARIMA possui uma capacidade
74
preditiva superior, pois o valor do seu MSE inferior ao valor do MSE para o
mtodo HWS. A modelagem HWS subestimou tanto a arrecadao agregada quanto
a arrecadao mdia mensal. J o mtodo Box-Jenkins superestimou as receitas em
aproximadamente 4%.
A transformao da srie {IR} em logaritmos produziu efeitos diversos nas
duas modelagens. Para o alisamento exponencial, a transformao fez as diferenas
percentuais se reduzirem a quase zero, mas o valor do MSE aumentou em
aproximadamente 10%. Em relao ao mtodo Box-Jenkins, a transformao
diminui tanto as diferenas percentuais quanto o MSE. Assim, a transformao
logartmica conseguiu estabilizar a srie e apresentar previses melhores do que a
srie original.
Em relao srie {IRmodif}, nota-se que a modelagem SARIMA aproximou-
se mais dos valores reais observados, com diferenas percentuais prximas de zero,
mas o valor do MSE foi menor para a modelagem HWS. Assim, para essa srie, o
mtodo de alisamento exponencial apresenta uma melhor capacidade preditiva. A
modelagem SARIMA subestimou as receitas enquanto que HWS superestimou a
arrecadao em 4%.
Em relao srie log{IRmodif}, a capacidade preditiva do mtodo HWS
muito superior do mtodo Box-Jenkins, visto que a diferena entre os MSE maior
que 80%. As diferenas percentuais so menores para a modelagem. Tal qual na
srie {IRmodif}, a modelagem SARIMA subestimou as receitas enquanto que HWS
superestimou a arrecadao em 2%.
75
Assim, a transformao logartmica da srie {IRmodif} produziu efeitos
diversos nas duas modelagens. Para a modelagem HWS, os logaritmos diminuram
tanto o valor do MSE quanto os valores das diferenas percentuais. Por outro lado, a
metodologia Box-Jenkins no captou muito bem essa transformao, uma vez que
suas diferenas percentuais e o valor do MSE mantiveram-se constantes.
Para a srie {IRmodif2}, verifica-se que a modelagem SARIMA possui uma
capacidade de previso superior ao mtodo HWS em cerca de 20% e as diferenas
percentuais so menores para o mtodo HWS. As duas modelagens
superestimaram as receitas total e a mdia mensal entre 3 e 4%. A transformao
logartmica fez com que as duas modelagens diminussem suas capacidades
preditivas, sendo que o mtodo Box-Jenkins apresentou uma piora maior, pois a
diferena entre os MSE de mais de 100%. Nota-se que os logaritmos fizeram as
diferenas percentuais serem reduzidas para prximo de zero para os dois mtodos.
A substituio do valor outlier de maro de 1996, ou seja, a transformao da
srie {IR} em {IRmodif} e em {IRmodif2}, produziu efeitos diversos nas duas
modelagens. Para o mtodo de alisamento exponencial essas transformaes
diminuram a capacidade preditiva do mtodo. O valor do MSE aumentou em cerca
de 50% para a transformao {IRmodif} e em cerca de 30% para a transformao
{IRmodif2}. Nota-se que as diferenas percentuais se mantiveram praticamente
constantes nas duas transformaes.
Para o mtodo de Box-Jenkins a transformao da srie original {IR} em
{IRmodif} diminui sensivelmente a capacidade preditiva do mtodo. O valor do MSE
76
aumentou em mais de 100%. Porm, a transformao {IRmodif2} aumentou a
capacidade de previso do mtodo, pois o valor do MSE diminuiu 10%. Nota-se que
as diferenas percentuais para a transformao {IRmodif} so bem prximas de
zero, enquanto que para a outra transformao essas diferenas so prximas de
4%.
As transformaes logartmicas das sries, log{IR} em log{IRmodif} e em
log{IRmodif2}, produzirem efeitos iguais para as duas modelagens. Os valores do
MSE para a srie log{IR} nas duas modelagens so menores do que os mesmos
valores para as sries log{IRmodif} e log{IRmodif2}. Isso mostra que para os
logaritmos a substituio do outlier diminuiu a capacidade preditiva dos mtodos de
alisamento exponencial e Box-Jenkins.
A Tabela 5.1 mostra ainda que a modelagem HWS se adapta melhor srie
original {IR}, com o valor do MSE em 207.963. A modelagem Box-Jenkins adapta-se
melhor srie log{IR}, com o valor do MSE em 207.871. Em termos da diferena
percentual agregada, a modelagem HWS produziu as menores diferenas na srie
log{IRmodif2}, -0,27%. A modelagem Box-Jenkins produziu as menores diferenas
na srie {IRmodif}, 0,48%.
Em relao significncia estatstica dos modelos SARIMA constantes da
Tabela 4.14 e da tabela 5.2, deve-se comparar os valores absolutos calculados para
a estatstica t com o valor crtico de 1,96, que corresponde ao nvel assinttico da
distribuio normal para 5% de significncia. Assim, deve-se rejeitar a hiptese nula
que os parmetros so individualmente nulos, com 95% de confiana, para todos os
77
modelos constantes da Tabela 4.14. Porm, tais testes devem ser tomados com
cautela, devido ao fato que o nmero reduzido de observaes pode causar vis nas
estimativas das varincias [Ansley & Newbold, 1980]. Por isso, os testes de
significncia estatstica no sero considerados.
5. 2 - Escol ha do mt odo de pr ev i so
Pelo explicitado na seo anterior, os dois mtodos de previso, baseados no
algoritmo de Holt-Winters sazonal e de Box-Jenkins, apresentaram resultados muito
parecidos entre si, tanto para valores de MSE quanto para as diferenas percentuais
agregadas. Ento, a escolha do mtodo poderia ser feita em relao a
caractersticas de simplicidade, automaticidade ou praticidade no uso. Assim, a
escolha mais bvia seria o mtodo de alisamento exponencial em detrimento ao
mtodo de Box-Jenkins.
Contudo, nem sempre o mtodo de alisamento exponencial produz previses
iguais ou superiores ao mtodo de Box-Jenkins. Em um estudo realizado por Paul
Newbold e Clive Granger [Newbold & Granger, 1974] com 106 sries econmicas
(80 mensais e 26 trimestrais), incluindo sries macro e microeconmicas sazonais e
no-sazonais, a capacidade preditiva dos mtodos de Box-Jenkins e alisamento
exponencial foi comparada utilizando o critrio do MSE. A Tabela 5.3 mostra a
percentagem de ocasies que o mtodo Box-Jenkins (BJ) superou o alisamento
exponencial (HW) para previses at 8 passos a frente.
78
Tabela 5.3 - Percentagem (%) de vezes que BJ superou HW
Passos frente
1 2 3 4 5 6 7 8
BJ:HW 73 64 60 58 58 57 58 58
Nota-se pela Tabela 5.3 que a metodologia de Box-Jenkins claramente
superior ao mtodo de alisamento exponencial para previses poucos passos
frente. Quando o horizonte de previso mais longo, a vantagem comparativa do
mtodo ARIMA diminui. Mas isso devido principalmente influncia das sries
no-sazonais e, ao se considerar somente sries sazonais, a vantagem do mtodo
Box-Jenkins persiste a longo prazo [Newbold & Granger, 1974]. Ao se analisar mais
detalhadamente as previses um passo frente, nota-se que
. 8 , 0
previses de
previses de

HW MSE
ARIMA MSE
Isso mostra que os erros de previso do mtodo Box-Jenkins so 20% inferiores aos
erros do mtodo de alisamento exponencial.
Os autores sugerem ainda algumas regras que servem de base para decidir
qual mtodo de previso escolher:
(a) Para sries com at 30 observaes o mtodo de Holt-Winters deve ser
utilizado.
(b) Para sries com mais de 30 e menos de 50 observaes no h muita
certeza, e pode-se escolher entre Holt-Winters e modelos ARIMA.
(c) Para sries com mais de 50 observaes, se o custo de previso no
for importante, deve-se utilizar modelos ARIMA. Caso o custo de previso
seja importante, deve-se utilizar Holt-Winters ou modelos AR.
79
Ento, recomenda-se que a modelagem Box-Jenkins seja seguida para se
fazer as previses da srie do Imposto de Renda e, generalizando, para todas as
previses dos tributos administrados pela Secretaria da Receita Federal.
5. 3 - Escol ha de um model o SARI MA
Como na prtica no se dispe dos dados futuros para que o modelo com a
melhor capacidade preditiva (menor valor de MSE) seja escolhido, o valor do critrio
BIC deve ser utilizado. Assim, analisando a Tabela 4.6, nota-se que o modelo com o
menor valor de BIC um modelo SARIMA(0,1,1)(0,1,0) com uma diferena de 0,7
unidades para um modelo SARIMA(0,1,1)(0,1,1), para a srie {IRmodif}. Nota-se
que, para as trs sries no transformadas em logaritmo, o modelo com o menor
BIC o modelo airline.
Para as sries logartmicas, o modelo com menor BIC um
SARIMA(0,0,1)(0,1,0) com uma diferena de 0,5 unidades para um modelo
SARIMA(0,1,1)(0,1,0), para a srie log{IRmodif}. Para as sries logartmicas, o
modelo airline no obteve um valor para o BIC competitivo.
Assim, se em termos do valor do MSE as transformaes no valor outlier
tiveram pouco sucesso, conforme visto na seo 5.1, para a anlise do valor do BIC
a transformao do valor do ms de maro para o menor valor da srie mostrou-se
satisfatria. Os modelos selecionados que possuem o menor valor do BIC so os
das sries {IRmodif} e log{IRmodif}, conforme mostra a Tabela 4.6. Ainda, ao se
analisar as Tabelas 4.9 e 4.10, nota-se que esses modelos apresentam valores
80
muito baixos para as diferenas percentuais agregadas, o modelo
SARIMA(0,1,1)(0,1,0), da srie {IRmodif}, produziu uma % agregada de -0,48% e o
modelo SARIMA(0,0,1)(0,1,0), da srie log{IRmodif}, produziu uma % agregada de
-0,72%.
Desta maneira, apesar de a diferena em termos de BIC ser menor que 0,1%
para os modelos SARIMA da srie {IRmodif}, a escolha do modelo deve ser feita
respeitando-se o princpio da parcimnia, aquele em que modelos mais simples
sempre devem ser preferidos. Ento, o modelo SARIMA(0,1,1)(0,1,0) escolhido em
vez do modelo airline. A equao do modelo ajustado dada por
( )( ) ( )
[ ] 12 , 0
78 , 0 1 1 1
12
t t
B X B B
e os grficos de diagnstico sugerem a validade do modelo escolhido e ajustado.
Para a srie log{IRmodif}, o modelo escolhido um SARIMA(0,0,1)(0,1,0),
respeitando-se o princpio da parcimnia. A equao do modelo ajustado dada por
( ) ( )
[ ] 11 , 0
41 , 0 1 1
12
t t
B X B +
e os grficos de diagnstico sugerem a validade do modelo escolhido e ajustado.
5. 4 - Resul t ados da pr ev i so par a out r os i mpost os
Com o objetivo de evitar repeties, as previses para os impostos sobre a
renda de Pessoas Fsicas (IRPF), Pessoas Jurdicas (IRPJ) e o imposto de renda
retido na fonte - Rendimentos do Trabalho (IRRF- trab) no sero analisadas to
81
detidamente quanto a previso para o imposto de renda agregado. Os resultados
obtidos pelo mtodo dos indicadores, conforme mostra a Tabela 3.2, sero
comparados aos obtidos por modelos SARIMA. Tais modelos foram escolhidos
conforme os procedimentos apresentados na seo 5.3, ou seja, modelos com o
menor valor do BIC, que respeitem o princpio da parcimnia.
Alm das sries do {IRPF}, {IRPJ} e {IRRF-trab} foram investigadas tambm
as transformaes logartmicas para as mesmas. Assim, a Tabela 5.4 mostra as
previses obtidas para as sries {IRPF}, log{IRPF}, {IRPJ}, log{IRPJ} e {IRRF-trab} e
log{IRRF-trab}, de acordo com cada mtodo de previso.
Tabela 5.4 - Comparao de resultados para as outras sries
ndices
Srie Mtodo/Modelo
% agregada % mdia MSE
Indicadores -4,70 -11,28 3.602
{IRPF}
SARIMA(0,1,1)(0,1,0) -2,50 -5,84 3.171
log{IRPF} SARIMA(0,1,1)(0,1,0) 0,75 -2,64 3.631
Indicadores -24,26 -23,14 188.725
{IRPJ}
SARIMA(0,1,1)(0,1,1) -18,93 -19,23 117.418
log{IRPJ} SARIMA(0,0,0)(0,1,1) -15,94 -14,37 104.643
Indicadores -10,06 -8,8 69.494
{IRRF-trab}
SARIMA(0,1,1)(0,1,1) -9,94 -8,55 59.961
log{IRRF-trab} SARIMA(1,0,0)(0,1,0) -9,79 -8,55 60.765
Nota-se pela anlise da Tabela 5.4 que todos os modelos SARIMA possuem
capacidade preditiva superior ao mtodo dos indicadores, i.e., possuem o valor do
MSE inferior ao obtido pelo mtodo dos indicadores. A nica exceo o modelo
SARIMA(0,1,1)(0,1,0) da srie log{IRPF}. Porm, a diferena dos valores do MSE
para as duas previses desprezvel, cerca de 1%. Verifica-se tambm que os
82
valores das diferenas percentuais calculadas para os modelos SARIMA so bem
inferiores que para o mtodo dos indicadores.
Alm disso, nota-se que a utilizao da transformao logartmica trouxe
resultados benficos, em termos do MSE, somente para a srie {IRPJ}, cujo valor do
MSE foi reduzido em torno de 10%. As duas outras sries apresentaram ou
resultado pior, com diminuio da capacidade preditiva em cerca de 13% para a
srie {IRPF}, ou resultado praticamente constante, com diminuio em torno 1,5%
para a srie {IRRF-trab}.
O modelo SARIMA(0,1,1)(0,1,0) estimado para a srie {IRPF} possui equao
de acordo com
( )( ) ( )
[ ] 085 , 0
84 , 0 1 1 1
12
t t
B X B B
e os grficos de diagnstico sugerem a validade do modelo escolhido e ajustado. Os
valores entre colchetes representam os valores aproximados do erro padro para os
parmetros estimados.
O modelo SARIMA(0,1,1)(0,1,0) estimado para a srie log{IRPF} possui
equao de acordo com
( )( ) ( )
[ ] 081 , 0
81 , 0 1 1 1
12
t t
B X B B
e os grficos de diagnstico sugerem a validade do modelo escolhido e ajustado. Os
valores entre colchetes representam os valores aproximados do erro padro para os
parmetros estimados.
83
O modelo SARIMA(0,1,1)(0,1,1) estimado para a srie {IRPJ} possui equao
de acordo com
( )( ) ( )
[ ] [ ] 32 , 0 17 , 0
) 1 ( 97 , 0 1 1 1
12 12
t t
B B X B B
e os grficos de diagnstico sugerem a validade do modelo escolhido e ajustado. Os
valores entre colchetes representam os valores aproximados do erro padro para os
parmetros estimados.
O modelo SARIMA(0,0,0)(0,1,1) estimado para a srie log{IRPJ} possui
equao de acordo com
( )
[ ] 20 , 0
) 63 , 0 1 ( 1
12 12
t t
B X B
e os grficos de diagnstico sugerem a validade do modelo escolhido e ajustado. Os
valores entre colchetes representam os valores aproximados do erro padro para os
parmetros estimados.
O modelo SARIMA(0,1,1)(0,1,1) estimado para a srie {IRRF-trab} possui
equao de acordo com
( )( ) ( )
[ ] [ ] 24 , 0 11 , 0
) 45 , 0 1 ( 62 , 0 1 1 1
12 12
t t
B B X B B
e os grficos de diagnstico sugerem a validade do modelo escolhido e ajustado. Os
valores entre colchetes representam os valores aproximados do erro padro para os
parmetros estimados.
O modelo SARIMA(1,0,0)(0,1,0) estimado para a srie log{IRRF-trab} possui
84
equao de acordo com
( )( )
[ ] 11 , 0
12
1 59 , 0 1
t t
X B B
e os grficos de diagnstico sugerem a validade do modelo. Os valores entre
colchetes representam os valores aproximados do erro padro para os parmetros
estimados.
5. 5 - Pr ev i ses com hor i zont e r eduzi do
Em conformidade com o estudo realizado por Paul Newbold e Clive Granger
[Newbold & Granger, 1974], o horizonte de previso ser reduzido para que os dois
mtodos de previso, alisamento exponencial e Box-Jenkins, possam ser
comparados em relao ao grau de acurcia, que ser medido pelo MSE. As
previses sero feitas para 1 passo e 3 passos frente para a srie log{IR}, de
forma que se utilizar a srie com observaes at janeiro de 2000 para prever o
valor da arrecadao do ms de fevereiro de 2000 e com observaes at maro de
2000 para fazer previses para os meses de abril, maio e junho de 2000.
Os mtodos de previso utilizados sero alisamento exponencial e mtodo
Box-Jenkins. O modelo para o mtodo Box-Jenkins um SARIMA(0,1,1)(0,1,1), que
possui o menor valor para o critrio do BIC para a srie log{IR}, conforme mostra a
Tabela 4.7. A Tabela 5.5 mostra os resultados obtidos para a previso 1 passo
frente para cada mtodo e a Tabela 5.6 mostra os resultados para a previso 3
passos frente para cada mtodo.
85
Tabela 5.5 - Previses geradas 1 passo frente - valores em R$ milhes
Ms
Mtodo/Modelo
Fevereiro
% MSE
HWS 4.897 16,43 477.481
SARIMA(0,1,1)(0,1,1) 4.489 15,28 413.449
Valor arrecadado real 4.206
Tabela 5.6 - Previses geradas 3 passos frente - valores em R$ milhes
Ms
Mtodo/Modelo
Abril Maio Junho
% -
agregada
% -
mdia
MSE
HWS 4.673 3.860 3.856 -5,33 -5,50 76.545
SARIMA(0,1,1)(0,1,1) 4.873 4.207 4.088 0,62 0,54 21.455
Valor arrecadado real 4.713 4.113 4.621
Pela Tabela 5.5, nota-se que o modelo SARIMA forneceu melhores previses
do que o mtodo HWS, pois o valor da diferena percentual menor para o modelo
airline. Ainda, a capacidade preditiva do modelo SARIMA superior em cerca de
10% em relao ao mtodo HWS, em termos do valor do MSE. Os dois mtodos
superestimaram a previso mensal em torno de 15%.
Pela Tabela 5.6, verifica-se que o modelo SARIMA possui caractersticas
preditivas superiores ao mtodo de alisamento exponencial, pois os valores da
diferena percentual agregada e mdia so quase nulos para a modelagem Box-
Jenkins. Alm disso, a diferena dos valores do MSE para os dois mtodos
superior a 300%, indicando que, em termos de preciso segundo o MSE, o modelo
SARIMA mais de 3 vezes preciso. Ento, evidencia-se pela anlise das duas
tabelas que o mtodo de Box-Jenkins produziu previses superiores em relao ao
mtodo de alisamento exponencial para horizontes curtos de previso, o que est de
acordo com o estudo dos autores mencionados.
86
Alm de se comparar os dois mtodos de previso, a reduo do horizonte de
previso pode ser til para se revisar e ajustar as previses calculadas
anteriormente. Assim, pode-se imaginar uma estratgia de reviso a cada bimestre
ou trimestre medida que novas observaes vo sendo acrescentadas srie. Por
exemplo, suponha que ocorra uma reviso em meados do final de 1 trimestre para
ajustar as previses efetuadas para o 2 trimestre, que foram calculadas com um
modelo com horizonte de 12 passos frente.
Ao se comparar os dados de previso para os meses do 2 trimestre da
Tabela 4.9 com os dados da Tabela 5.6, nota-se uma clara melhoria em relao
tanto ao valores das diferenas agregadas e mdias quanto em relao ao valor do
MSE. A Tabela 5.7 mostra os resultados dessa comparao utilizando um modelo
SARIMA(0,1,1)(0,1,1) para a srie log{IR}. A Figura 5.1 mostra graficamente tal
comparao, na qual a reta azul representa o valor real, a reta vermelha a previso
com 3 passos frente e a reta verde a previso com 12 passos frente.
Tabela 5.7 - Comparao entre previses - valores em R$ milhes
Ms N de passos frente do
modelo Abril Maio Junho
% -
agregada
% -
mdia
MSE
3 4.873 4.207 4.088 0,62 0,54 21.455
12 5.223 4.370 4.322 6,33 6,17 109.957
Valor arrecadado real 4.713 4.113 4.621
87
Figura 5.1 - Comparao grfica da reviso da arrecadao
88
6 - Concl uso
O objetivo principal desse trabalho foi aplicar mtodos estatsticos e
economtricos na busca de previses mais confiveis e mais acuradas para a
arrecadao do tributo federal denominado como Imposto sobre a Renda. Ao
mesmo tempo, buscou-se mostrar que o mtodo atualmente utilizado pela Secretaria
da Receita Federal, conhecido como mtodo de indicadores, poderia ser aprimorada
econometricamente mediante a utilizao da metodologia proposta neste estudo.
Os mtodos estatsticos de previso utilizados ao longo do trabalho foram o
alisamento exponencial, principalmente o algoritmo de Holt-Winters sazonal aditivo,
e a metodologia de Box-Jenkins, principalmente a modelagem SARIMA. Tais
mtodos se mostraram superiores ao mtodo de indicadores, gerando previses
mais acuradas. Um fato importante relacionado ao uso dessas modelagens que
sua utilizao depende apenas dos dados histricos da srie temporal em questo,
ou seja, as modelagens trabalham com sries temporais univariadas.
Apesar de parecer paradoxal que as previses obtidas com modelos mais
simples possam gerar previses mais precisas, tal fato est bem estabelecido na
literatura [Cooper, 1972]. Existem tambm comparaes entre os vrios mtodos de
previso com modelos univariados, sendo o principal estudo realizado por [Newbold
& Granger, 1974]. Os autores mostraram a superioridade da modelagem SARIMA
em relao a mtodos de modelagem automtico. Nesse mesmo estudo, os autores
verificaram que a combinao de mtodos de previso pode gerar resultados to ou
89
mais precisos que a utilizao dos mtodos individualmente.
Assim, fica aqui a primeira recomendao para um futuro trabalho, estudar os
resultados da combinao do mtodo de Box-Jenkins com o alisamento exponencial
e verificar a preciso das previses geradas. Essa combinao pode ser pensada
como uma combinao linear entre os dois mtodos, de forma que os pesos
associados ao mtodos possam ser estimados.
A comparao entre os mtodos efetuada nesta dissertao teve como
principal funo a escolha de uma metodologia que pudesse ser aplicada para a
previso de todos os tributos federais. Assim, a escolha da metodologia Box-Jenkins
foi amplamente amparada na literatura e no estudo de caso aqui exposto. Porm,
pode surgir a dvida por que nessa comparao no foram utilizados tambm os
resultados de uma regresso.
Primeiramente, porque a modelagem de uma regresso requer um total
conhecimento da relao entre as variveis do modelo, o que no caso de
arrecadao tributria poderia gerar modelos subparametrizados ou
superparametrizados, uma vez que a arrecadao de tributos dependente de
muitas variveis econmicas. Tal fato poderia gerar modelos incorretamente
especificados, principalmente se o analista possuir pouca experincia com modelos
de regresso. Alm disso, Gourieroux & Monfort (1997), em uma comparao entre
a modelagem ARIMA e a modelagem de regresso, mostraram que o erro relativo
de previso da modelagem ARIMA foi inferior 2,5 pontos percentuais em relao a
modelos de regresso.
90
Portanto, como uma segunda sugesto para um futuro trabalho sugere-se
incluir variveis exgenas, tais como o PIB, o consumo de energia eltrica ou o
comportamento da taxa de juros, entre outras, no modelo ARIMA e estudar a classe
de modelos ARMAX.
Por fim, depreende-se do estudo que a Secretaria da Receita Federal poderia
aprimorar fortemente sua previso de arrecadao, em particular do Imposto de
Renda, com a metodologia ora proposta, que permitiu reduzir o erro de previso
mdio de 10% para 0,17% aproximadamente, para o perodo janeiro de 2000 a
dezembro de 2000. Neste sentido, este trabalho mostrou que existem metodologias
econometricamente mais apropriadas que fornecem previses muito superiores e de
uma maneira relativamente simples, apesar do trabalho de modelagem ser
artesanal que poderiam complementar o mtodo dos indicadores correntemente
utilizado pela Receita Federal.
Ainda, cabe destacar que a utilizao das tcnicas aqui consideradas pode
tornar o trabalho tanto do analista de previses quanto do administrador mais eficaz,
uma vez que o primeiro no precisar de tantas variveis em seu modelo e o
segundo poder tomar decises mais realistas e precisas quando utilizar os
resultados das previses como instrumento de planejamento econmico.
91
7 - Ref er nci as bi bl i ogr f i cas
[1] Ansley, C.F. & Newbold, P. (1980). Finite sample properties of estimators
for autoregressive moving average models. Journal of Econometrics.13, 159-
183.
[2] Bowerman, B.L. & OConnell, R.T. (1987). Time Series Forecasting, Unified
Concepts and Computer Implementation, 2 Edio. Boston: Duxbury Press.
[3] Box, G.E.P., & Jenkins, G.M. (1970). Time Series Analysis, Forecasting
and Control. San Francisco: Holden Day.
[4] Brockwell, P.J. & Davis, R.A. (1996). Introduction to Time Series and
Forecasting. NewYork: Springer-Verlag.
[5] Cooper, R.L. (1972). The predictive performance of quartely econometric
models of the United States. Em Hickman, B.G. (ed.) Econometric Models of
Cyclical Behavior. New York: Columbia University Press.
[6] Cribari-Neto, F. (2000). Mtodo de Previso de Arrecadao Tributria.
MIMEO
[7] Enders, W. (1995). Applied Econometric Time Series. New York: John
Wiley & Sons.
[8] Folha de S. Paulo. Jornal Folha de S. Paulo edio de 17/05/1996. Editoria
Dinheiro, pginas 2 a 4.
[9] Gourieroux, C. & Monfort, A. (1997). Time Series and Dinamics Models.
New York: Cambridge University Press.
[10] Granger, C.W.J. & Newbold, P. (1986). Forecasting Economic Time
Series. New York: Academic Press.
92
[11] Hill, R.C., Griffiths, W.E. & Judge, G.G. (1999). Econometria. So Paulo:
Editora Saraiva.
[12] Janacek, G. (2001). Practical Time Series. London: Arnold Publishers.
[13] Kvanli, A.H, Guynes, C.S. & Pavur, R..J. (1996). Introduction to Business
Statistics, A Computer Integrated Approach, 4 Edio. St.Paul: West
Publishing Company.
[14] Mills, T.C. (1990). Time Series Techniques for Economists. Cambridge:
Cambridge University Press.
[15] Newbold, P. & Granger, C.W.J. (1974). Experience with forecasting
univariate time series and the combination of forecasts. Journal of the Royal
Statistics Society A, 137, 131-146.
[16] Venables, W.N. & Ripley, B.D. (1999). Modern Applied Statistics with S-
PLUS 3
rd
Edition. New York: Springer-Verlag.
93
Apndi ce A
94
Este apndice apresenta a funo utilizada no R para a seleo de modelos com
base nos valores do BIC. Tal funo foi adaptada de Cribari-Neto (2000) e calcula,
para uma dada configurao inicial de P, D, Q, d, uma matriz com o valor do BIC
para diversas combinao de valores de p e q.
bic<-function(serie,d,P,D,Q)
{
M<-matrix(0,5,5)
if(P==0 && Q==0)
{
for(i in 0:4)
{
for(j in 0:4)
{
if(i==0 && j==0) M[1,1]<-NA
else
M[i+1,j+1]<-
my.arima0(serie,order=c(i,d,j),seasonal=list(order=c(P,D,Q)))$aic
}
}
}
else
{
for(i in 0:4)
{
for(j in 0:4)
{
M[i+1,j+1]<-
my.arima0(serie,order=c(i,d,j),seasonal=list(order=c(P,D,Q)))$aic
}
}
}
M.AIC<-M
return(M)
}
95
Apndi ce B
96
Este apndice apresenta os resultados do valor do critrio de seleo de modelos
BIC para cada srie. Em cada tabela esto listados os modelos com o menor BIC
para uma dada configurao inicial dos valores de P, D, Q, d e aqueles modelos que
possuem uma diferena de at dois para o BIC do modelo com menor BIC.
Tabela B.1 - Modelos e valores para o BIC da srie {IR}
Modelo Modelo Modelo Modelo
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(0,0,1) (0,1,0) 897,6 (0,0,1) (1,1,0) 894,7 (1,0,0) (2,1,0) 898,4 (0,1,1) (0,1,1) 873
(1,0,0) (0,1,0) 897,7 (0,0,0) (1,1,0) 895,6 (0,0,1) (2,1,0) 898,9 (0,1,1) (0,1,2) 877,1
(1,0,1) (0,1,1) 892 (1,0,1) (1,1,1) 896,1 (1,0,1) (2,1,1) 901,5 (0,1,1) (1,1,0) 874,9
(1,0,1) (0,1,2) 896,8 (1,0,0) (1,1,1) 898,5 (1,0,0) (2,1,1) 902,1 (0,1,1) (1,1,1) 887,1
(0,0,1) (0,1,2) 898,1 (0,0,1) (1,1,1) 898,9 (0,0,1) (2,1,1) 902,4 (0,1,1) (1,1,2) 881,3
(1,0,0) (0,1,2) 898,5 (1,0,1) (1,1,2) 900,3 (1,0,1) (2,1,2) 904,2 (0,1,1) (2,1,0) 877,3
(1,0,1) (1,1,0) 893,9 (0,0,1) (1,1,2) 902,5 (1,0,0) (2,1,2) 906 (0,1,1) (2,1,1) 881,5
(1,0,0) (1,1,0) 894,3 (1,0,1) (2,1,0) 896 (0,1,1) (0,1,0) 881,9 (0,1,1) (2,1,2) 885,4
Tabela B.2 - Modelos e valores para o BIC da srie log{IR}
Modelo Modelo Modelo Modelo
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(1,0,0) (0,1,0) -14,5 (1,0,1) (1,1,1) -12 (1,0,0) (2,1,1) -6,6
(0,1,1) (1,1,0) -16,7
(0,0,1) (0,1,0) -14,5 (1,0,0) (1,1,1) -10,4 (0,0,1) (2,1,1) -6,3 (0,1,2) (1,1,0) -15
(1,0,1) (0,1,1) -16,4 (0,0,1) (1,1,2) -6,6 (1,0,1) (2,1,2) -3,6 (1,1,1) (1,1,0) -14,5
(1,0,0) (0,1,1) -14 (1,0,0) (1,1,2) -6,4 (1,0,0) (2,1,2) -2,9 (0,1,1) (1,1,1) -14,4
(0,0,1) (0,1,2) -10,7 (1,0,1) (1,1,2) -5,1 (0,0,1) (2,1,2) -2,8 (0,1,1) (1,1,2) -10,2
(1,0,0) (0,1,2) -10,6 (1,0,1) (2,1,0) -11,2 (0,1,1) (0,1,0) -13,1 (0,1,1) (2,1,0) -14,2
(1,0,1) (1,1,0) -14,7 (1,0,0) (2,1,0) -10,4 (0,1,2) (0,1,0) -11,3 (0,1,1) (2,1,1) -10,1
(1,0,0) (1,1,0) -14,6 (0,0,1) (2,1,0) -9,7
(0,1,1) (0,1,1) -18,5 (0,1,1) (2,1,2) -6,1
(0,0,1) (1,1,0) -13,7 (1,0,1) (2,1,1) -7,9 (0,1,1) (0,1,2) -14,4
Tabela B.3 - Modelos e valores para o BIC da srie {IRmodif}
Modelo Modelo Modelo Modelo
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(1,0,0) (0,1,0) 872 (0,0,1) (1,1,0) 877,2 (0,0,1) (2,1,2) 889,7 (0,1,2) (1,1,0) 861
(0,0,1) (0,1,0) 873,4 (1,0,0) (1,1,1) 879,5 (0,0,0) (2,1,2) 890,1 (0,1,1) (1,1,1) 861
(1,0,1) (0,1,0) 874,4 (1,0,1) (1,1,1) 880,2 (0,1,1) (0,1,0) 857.2 (1,1,1) (1,1,1) 863.4
(1,0,0) (0,1,1) 875,3 (0,0,1) (1,1,1) 881,4 (1,1,1) (0,1,0) 859.3 (0,1,2) (1,1,1) 863.6
(1,0,1) (0,1,1) 876,1 (1,0,1) (1,1,2) 883 (0,1,2) (0,1,0) 859.9 (0,0,0) (1,1,2) 879.7
(0,0,1) (0,1,1) 877,2 (1,0,0) (1,1,2) 883,2 (0,1,1) (0,1,1) 857.9 (0,0,0) (2,1,0) 875.6
(1,0,1) (0,1,2) 879,1 (1,0,1) (2,1,0) 879,1 (0,1,2) (0,1,1) 859.8 (0,0,0) (2,1,1) 879.8
(1,0,0) (0,1,2) 879,4 (1,0,0) (2,1,0) 879,4 (1,1,1) (0,1,1) 860.1 (0,0,0) (2,1,2) 883.8
(0,0,1) (0,1,2) 881,4 (0,0,1) (2,1,0) 881,4 (0,0,0) (0,1,2) 875.8
(1,0,0) (1,1,0) 875,4 (0,0,1) (2,1,1) 884,6 (0,1,1) (1,1,0) 859.1
(1,0,1) (1,1,0) 877 (0,0,0) (2,1,1) 886,4 (1,1,1) (1,1,0) 860.9
97
Tabela B.4 - Modelos e valores para o BIC da srie log{IRmodif}
Modelo Modelo Modelo Modelo BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
(0,0,1) (0,1,0) -32,8 (0,0,1) (1,1,1) -27 (1,0,0) (2,1,2) -19,5 (1,1,1) (1,1,0) -28,3
(1,0,1) (0,1,0) -31,7 (1,0,1) (1,1,1) -25,2 (1,0,1) (2,1,2) -17,8 (0,1,2) (1,1,0) -28,2
(1,0,0) (0,1,1) -30,7 (1,0,0) (1,1,2) -22,8 (0,0,1) (2,1,2) -16,3 (0,1,1) (1,1,1) -27,7
(1,0,1) (0,1,1) -29,2 (1,0,1) (1,1,2) -21,9 (0,1,1) (0,1,0) -32,3 (0,1,2) (1,1,1) -25
(0,0,1) (0,1,1) -28,6 (0,0,1) (1,1,2) -21,2 (0,1,2) (0,1,0) -30,4 (0,0,1) (1,1,2) -24,1
(1,0,0) (0,1,2) -26,7 (1,0,0) (2,1,0) -26,8 (1,1,1) (0,1,0) -30 (0,1,2) (1,1,2) -22,4
(1,0,1) (0,1,2) -26,1 (1,0,1) (2,1,0) -25,1 (0,1,1) (0,1,1) -30,9 (1,1,1) (1,1,2) -22,2
(0,0,1) (0,1,2) -24,4 (0,0,1) (2,1,0) -24,4 (1,1,1) (0,1,1) -29 (0,0,1) (2,1,0) -28,1
(1,0,0) (1,1,0) -30,7 (1,0,0) (2,1,1) -22,7 (0,1,2) (0,1,1) -28,9 (0,0,1) (2,1,1) -23,9
(0,0,1) (1,1,0) -28,6 (1,0,1) (2,1,1) -21,9 (0,1,1) (0,1,2) -28,2 (0,1,2) (2,1,1) -22,6
(1,0,1) (1,1,0) -28,2 (0,0,1) (2,1,1) -20,6 (0,1,1) (1,1,0) -29,9 (0,0,1) (2,1,2) -20
Tabela B.5 - Modelos e valores para o BIC da srie {IRmodif2}
Modelo Modelo Modelo Modelo BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
(1,0,0) (0,1,0) 879,4 (2,0,1) (1,1,2) 888,6 (0,1,2) (0,1,1) 863,5 (0,1,1) (1,1,2) 869,6
(0,0,1) (0,1,0) 879,8 (1,0,0) (2,1,0) 884,8 (1,1,1) (0,1,1) 863,8 (0,1,2) (1,1,2) 871,7
(1,0,1) (0,1,1) 880,1 (1,0,1) (2,1,0) 885,1 (0,1,1) (0,1,2) 865,5 (1,1,1) (1,1,2) 871,9
(1,0,0) (0,1,1) 880,9 (1,0,1) (2,1,1) 888,2 (0,1,2) (0,1,2) 867,7 (0,1,1) (2,1,0) 865,7
(1,0,1) (0,1,2) 884 (1,0,0) (2,1,1) 888,8 (1,1,1) (0,1,2) 867,9 (0,1,2) (2,1,0) 867,6
(1,0,0) (0,1,2) 884,5 (1,0,0) (2,1,2) 892,5 (0,1,1) (1,1,0) 863,3 (1,1,1) (2,1,0) 867,9
(1,0,2) (1,1,0) 880,6 (1,0,1) (2,1,2) 893 (0,1,2) (1,1,0) 864,5 (0,1,1) (2,1,1) 869,7
(1,0,1) (1,1,0) 881,5 (0,1,1) (0,1,0) 864,4 (1,1,1) (1,1,0) 864,9 (0,1,2) (2,1,1) 871,8
(1,0,1) (1,1,1) 884,1 (0,1,2) (0,1,0) 866,4 (0,1,1) (1,1,1) 865,5 (0,1,1) (2,1,2) 873,7
(1,0,0) (1,1,1) 884,8 (1,1,1) (0,1,0) 866,6 (0,1,2) (1,1,1) 867,7 (0,1,2) (2,1,2) 875,8
(1,0,1) (1,1,2) 888,3 (0,1,1) (0,1,1) 861,6 (1,1,1) (1,1,1) 867,9
Tabela B.6 - Modelos e valores para o BIC da srie log{IRmodif2}
Modelo Modelo Modelo Modelo
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(p,d,q) (P,D,Q)
BIC
(1,0,0) (0,1,0) -27,3 (1,0,1) (1,1,2) -16,7 (0,1,2) (0,1,1) -24,7 (0,1,2) (1,1,2) -16,8
(0,0,1) (0,1,0) -26,7 (1,0,0) (2,1,0) -20,5 (1,1,1) (0,1,1) -24,4 (0,1,1) (2,1,0) -22,9
(1,0,1) (0,1,1) -24,6 (1,0,1) (2,1,0) -19,9 (0,1,1) (0,1,2) -23,1 (1,1,1) (2,1,0) -20,4
(1,0,0) (0,1,1) -23,3 (1,0,0) (2,1,1) -16,6 (0,1,2) (0,1,2) -20,6 (0,1,1) (2,1,1) -18,8
(1,0,1) (0,1,2) -20,9 (1,0,1) (2,1,1) -16,6 (1,1,1) (0,1,2) -20,3 (0,1,2) (2,1,1) -17,9
(1,0,0) (0,1,2) -20,8 (1,0,0) (2,1,2) -13 (0,1,1) (1,1,0) -25,3 (0,1,1) (2,1,2) -14,8
(1,0,0) (1,1,0) -24,7 (1,0,1) (2,1,2) -12,6 (0,1,2) (1,1,0) -24,2 (0,1,2) (2,1,2) -13
(1,0,1) (1,1,0) -23,6 (0,1,1) (0,1,0) -25,5 (1,1,1) (1,1,0) -23,7
(1,0,0) (1,1,1) -20,6 (0,1,2) (0,1,0) -24,3 (0,1,1) (1,1,1) -23
(1,0,1) (1,1,1) -20,6 (1,1,1) (0,1,0) -23,8 (0,1,2) (1,1,1) -20,5
(1,0,0) (1,1,2) -16,7 (0,1,1) (0,1,1) -26,7 (0,1,1) (1,1,2) -19

Вам также может понравиться