Вы находитесь на странице: 1из 8

XXVII Simposio Internacional de Estadstica  5th International Workshop on Applied Statistics

Cali, Valle del Cauca, Colombia, 15 de Diciembre de 2017

Aplicacin de la Metodologa Box-Jenkins. Dos series con datos


reales

XXVII Simposio Internacional de Estadstica 2017.


1, a 1, b
Johan Steven Aparicio , Diego Fernando Soto

1 Escuela de Estadstica, Facultad de Ingeniera, Universidad del Valle, Cali, Colombia

Resumen
En este documento se realizar una aplicacin de la metolodoga Box-Jenkins con dos series
de tiempo reales que son el Producto Interno Bruto (PIB) y las Exportaciones (EXP). En cada
serie, se identicarn dos modelos, los cuales sern estimados y validados, para con esto determi-
nar cul es mejor para realizar el pronstico. Finalmente, se encontr que el PIB puede ser mo-
delado mediante un modelo ARIM A(8, 1, 11) y la serie de las Exportaciones, mediante un modelo
SARIM A(0, 1, 1)(0, 1, 1)4 .
Palabras clave : Box-Jenkins, Series de tiempo, Pronstico, Estacionaridad .

1. Introduccin

De acuerdo con la denicin de el Departamento Administrativo Nacional De Estadistica (DANE),


el Producto Interno Bruto (PIB) representa el resultado nal de la actividad productiva de las unidades
de produccin residentes. Se mide desde el punto de vista del valor agregado, de la demanda nal o las
utilizaciones nales de los bienes y servicios y de los ingresos primarios distribuidos por las unidades de
produccin residentes. Adems, las Exportaciones en Colombia,es una operacin que supone la salida legal
de mercancas de un territorio aduanero hacia una Zona Franca Industrial o a otro pas, y que produce
como contrapartida un ingreso de divisas. Es decir, estos indicadores representan en gran medida el
comportamiento de la economa en Colombia, por tanto resulta bastante importante poder conocer su
comportamiento a lo largo del tiempo.

2. Serie PIB

2.1. Identicacin
Para iniciar la metodologa de Box-jenkins en la serie PIB, se realizo inicialmente la prueba Box-
Cox, en donde fue de 0.1, es decir la transformacin mas adecuada para estabilizar la varianza es el
logaritmo natural de la serie, con lo cual, se obtuvo la grca de esta para observar su comportamiento
a lo largo del tiempo.
La Figura 1, nos muestra que la serie presenta un comportamiento tendencial, casi que lineal, lo que
nos indica que si realizamos una diferenciacin podramos eliminar el comportamiento determinstico de
la serie.
a . E-mail: johan.aparicio@correounivalle.edu.co
b . E-mail: soto.diego@correounivalle.edu.co

1
2 Johan Steven Aparicio & Diego Fernando Soto

Logaritmo del Producto Interno Bruto con precios constantes

11.6
lpib

11.4
11.2

0 10 20 30 40 50

tt

Figura 1: Representacin de la serie log(PIB)

2.1.1. Prueba de raz unitaria


Como ya se vio en la gura 1 que la serie no es estacionaria, a continuacin se aplicar una prueba
formal para identicar si esta tiene o no una raz unitaria. Recordemos que, la hiptesis nula para el test
de Dickey-Fuller Aumentada, es que la serie tiene una raz unitaria (Integrada de orden 1).

Tabla 1: Resultados prueba de raz unitaria con intercepto


t-Statistic P-Valor
Prueba DFA ( serie original ) 0.8178 0.9935
Prueba DFA ( serie 1 dif ) -8.2289 0
Prueba DFA ( serie 2 dif ) -10.7023 0

Al observar la Tabla 1, vemos que la serie presenta raz unitaria, pero al realizar la primera diferencia
podemos armar que la serie ya tiene un comportamiento estacionario a lo largo del tiempo.

2.1.2. Eleccin de los coecientes p y q

Serie dif_lpib ACF ACF Parcial


1.0
0.03

0.2
0.8
0.6

0.1
0.02

0.4

Partial ACF
dif_lpib

ACF

0.0
0.01

0.2

0.1
0.0
0.00

0.2

0.2
0.01

0.4

0 10 20 30 40 50 5 10 15 20 25 5 10 15 20 25

Time Lag Lag

Figura 2: Representacin de la serie ln(PIB)

Teniendo en cuenta la Figura 2, y observando las innovaciones, es posible dar unos ordenes a la parte
autorregresiva, p, y el de las medias moviles, q, del proceso ARMA. En el que se pudo determinar dos
modelos tentativos, el primero un ARIMA(8,1,11) y el segundo, un ARIMA(1,1,2).

XXVII Simposio de Estadstica (2017)


XXVII Simposio Internacional de Estadstica 2017. Gua para autores 3

2.2. Estimacin
Una vez determinados los modelos, se proceder a estimar los parmetros, su signicancia y las races
de los polinomios caractersticos de cada uno de ellos.

Tabla 2: Resumen de los coecientes del modelo ARIMA(8,11)


Variable Coeciente Std. Error t-Statistic Prob.
C 0.01591 0.0015 10.9970 0.0000
AR(8) -0.3793 0.1186 -3.1990 0.0014
MA(11) -0.5181 0.1348 -3.8440 0.0001

Tabla 3: Resumen de los coecientes del modelo ARIMA(1,1,2)


Variable Coeciente Std. Error t-Statistic Prob.
C 0.0040 0.0030 1.3410 0.1801
AR(1) 0.6293 0.2822 2.2300 0.0258
MA(1) -0.8026 0.2960 -2.7120 0.0067
MA(2) 0.3054 0.1276 2.3930 0.0167

En la Tabla 2 y 3, vemos que todos los coecientes son signicativos a un nivel del 5 %, adems,
estos presentan las races de los polinomios caractersticos por fuera del circulo unitario, es decir, las
series son estacionarias e invertibles (Ver ANEXO).

2.3. Supuestos y comparacin de modelos


La Tabla 4, muestra la validacin de los supuestos y el Criterio de Informacin de Akaike (AIC), para
la seleccin del modelo.

Tabla 4: Comparacin de modelos


Modelo Q-LB J-B ARCH AIC
ARIMA(8,1,11) (14) 0.9142 0.956 0.5638 -372.08
ARIMA(1,1,2) (14) 0.2468 0.8041 0.504 -347.52

En la tabla anterior, se puede ver que para los dos modelos se cumplen el supuesto de no autocorre-
lacin serial (Q-LB), normalidad (J-B), y la distribucin Homoscedstica de los residuales a un nivel de
signicancia del 5 %. Finalmente por el AIC, se eligi al modelo ARIMA(8,1,11) como el ms eciente
para realizar el pronstico, adems de que tambin presenta una validez superior en trminos de los
residuales.

2.4. Pronstico
En la Tabla 5, se muestran las predicciones para 4 valores futuros de la serie Log(PIB), donde vemos
que a medida que buscamos predecir valores mas lejanos, el error estndar asociado a este es mayor.

Tabla 5: Pronstico para los siguientes 4 periodos del log(PIB)


Perodo Prediccin Desv. Tpica Intervalo de Conanza
2013:4 9.600078 0.071611 9.459723 - 9.740432
2014:1 9.588558 0.118012 9.357259 - 9.819857
2014:2 9.674802 0.150750 9.379338 - 9.970266
2014:3 9.667556 0.177550 9.319564 - 10.015548

XXVII Simposio de Estadstica (2017)


4 Johan Steven Aparicio & Diego Fernando Soto

3. Serie Exportaciones

3.1. Identicacin
Ahora, para iniciar la metodologa de Box-jenkins en la serie de las Exportaciones, realizamos la
grca del logaritmo natural de esta para observar su comportamiento a lo largo del tiempo, pues el
de Box-Cox es de 0.1.
9.5
9.0
log(EXP)

8.5
8.0

2000 2002 2004 2006 2008 2010 2012 2014

Time

Figura 3: Representacin de la serie Log(EXP)

En la Figura 3, podemos observar el comportamiento tendencial y a su vez el comportamiento esta-


cional de la serie. Esto es lo que nos lleva a pensar en realizar, tanto una diferenciacin regular como una
diferenciacin estacional a la serie Log(Exp).

3.1.1. Prueba de raz unitaria


Se realiza una prueba formal, para identicar si la serie necesita una diferenciacin regular o no. Donde
se evidencia en la Tabla 6, que s es necesario realizar una diferenciacin regular y por tanto, indica que
la serie es integrada de orden 1.

Tabla 6: Resultado prueba de raz unitaria con intercepto


t-Statistic P-valor
Prueba DFA ( serie original ) -0.2967 0.9182
Prueba DFA ( serie 1 dif ) -7.0921 0
Prueba DFA ( serie 2 dif ) -9.3544 0

3.1.2. Eleccin de los coecientes

Serie sdl(Exp) ACF ACF Parcial


1.0

0.3
0.8

0.2
0.1

0.6

0.1
Partial ACF
0.4
dif.EXP

0.0

ACF

0.0
0.2

0.1
0.1

0.0

0.2
0.2
0.2

0.3

2000 2002 2004 2006 2008 2010 2012 2014 0 1 2 3 4 5 6 1 2 3 4 5 6

Time Lag Lag

Figura 4: Representacin de la serie sdl(Exp)

XXVII Simposio de Estadstica (2017)


XXVII Simposio Internacional de Estadstica 2017. Gua para autores 5

En la Figura 4, se presenta la serie del Ln(EXP) con la diferencia estacional y estacionaria, ademas
del correlograma correspondiente. En esta se observo que dos modelos adecuados para modelar la serie
serian un SARIM A(0, 1, 1)(0, 1, 1)4 y un SARIM A(1, 1, 0)(0, 1, 1)4 , pues en el correlograma se presentan
comportamientos autoregresivos y de media mvil, ademas de un comportamiento estacional en la ACF.

3.2. Estimacin

Tabla 7: Resumen de los coecientes del modelo SARIM A(0, 1, 1)(0, 1, 1)4
Variable Coeciente Std. Error t-Statistic Prob.
MA(1) 0.31 0.16 1.975 0.048
SMA(1) -0.79 0.13 -5.891 0.000

Tabla 8: Resumen de los coecientes del modelo SARIM A(1, 1, 0)(0, 1, 1)4
Variable Coeciente Std. Error t-Statistic Prob.
AR(1) 0.2619 0.1386 1.8894 0.0643
SMA(1) -0.7763 0.1298 -5.9787 0.0000

En las tablas 7, los dos coecientes del primer modelo, son signicativos bajo un nivel de signicancia
del 5 %, mientras que en la Tabla 8, los coecientes AR(1) y SMA(1), son signicativos con un nivel de
del 10 % y 5 % respectivamente. Adems para ambos modelos las races del polinomio caracterstico
estn por fuera del circulo unitario.

3.3. Supuestos Modelo

Tabla 9: Supuestos Modelos


Modelo Q-LB J-B ARCH AIC
SARIM A(0, 1, 1)(0, 1, 1)4 (14) 0.7077 0.0522 0.2730 -111.6643
SARIM A(1, 1, 0)(0, 1, 1)4 (14),0.6877 0.01615 0.168 -111.2253

De acuerdo con la Tabla 9, ambos modelos cumplen los supuestos de los errores, bajo un nivel de
del 1 %, sin embargo el modelo SARIM A(0, 1, 1)(0, 1, 1)4 , presenta una validez superior en trminos de
los residuales, adems de tener un menor AIC , por lo que se considero como el mejor modelo.

3.4. Pronstico
En la Tabla 10, se presentan las predicciones para 4 valores futuros, en donde se puede evidenciar un
incremento en la desviacin tpica y a su vez, en los intervalos de conanza.

Tabla 10: Pronsticos


Perodo Prediccin Desv. Tpica Intervalo de Conanza
2013:4 9.600078 0.071611 9.459723 - 9.740432
2014:1 9.588558 0.118012 9.357259 - 9.819857
2014:2 9.674802 0.150750 9.379338 - 9.970266
2014:3 9.667556 0.177550 9.319564 - 10.015548

XXVII Simposio de Estadstica (2017)


6 Johan Steven Aparicio & Diego Fernando Soto

Referencias

DANE (2011), Direccion de Sintesis y Cuentas Nacionales DSCN, Metodologia cuentas nacionales,
Colombia.
*https://www.dane.gov.co/les/investigaciones/chas/CuentasDepartamentales.pdf
R Development Core Team (2007), R: A Language and Environment for Statistical Computing , R Foun-
dation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0.
*http://www.R-project.org
Stoer, D. & Stoer, M. D. (2016), `Package astsa', blood 8, 1.
Wei, W. W. et al. (2006), Time series analysis: univariate and multivariate methods , Pearson Addison
Wesley.

XXVII Simposio de Estadstica (2017)


XXVII Simposio Internacional de Estadstica 2017. Gua para autores 7

ANEXOS

Nivel de exportaciones en Colombia

1
4 2 4 2
2
14000
3 3 3
1

4
8000 10000

2 3
2
3
EXP

4 1 4 1
4 3
3 2
1
2
3 4 1
6000

2
2 3 4 1
3 4 1
4000

2
3 4 3 2 3 4 1
1 2 1 2 4 1 2 3 4 1

0 10 20 30 40 50

tt

Figura 5: Comportamiento trimestral de las Exportaciones

Races polinomios caractersticos

Tabla 11: Races polinomio caracterstico modelo ARIM A(8, 1, 11)


Real Imaginaria Modulo
AR(8) -0.37 1.34 1.39
MA(11) -0.37 -1.34 1.39

Tabla 12: Races polinomio caracterstico modelo ARIM A(1, 1, 2)


Real Imaginario Modulo
AR(1) 0.14 1.17 1.18
MA(1) 0.14 -1.17 1.18
MA(2) 2.35 -0.00 2.35

Tabla 13: Races Polinomio Caracterstico modelo SARIM A(0, 1, 1)(0, 1, 1)4
Real imginaria Modulo
MA(1) 0.20 1.10 1.12
SMA(1) 0.20 -1.10 1.12

Tabla 14: Races Polinomio Caracterstico modelo SARIM A(1, 1, 0)(0, 1, 1))4
Real imginaria Modulo
AR(1) 1 0.1687 1.1224 1.135
SMA(1) 1 0.1687 1.1224 1.135

XXVII Simposio de Estadstica (2017)


8 Johan Steven Aparicio & Diego Fernando Soto

Pronsticos
11.85
l_PIB
prediccin
11.8 Intervalo de 95 por ciento

11.75

11.7

11.65

11.6

11.55

11.5

11.45
2007 2008 2009 2010 2011 2012 2013 2014

Figura 6: Pronstico para los siguientes 4 periodos del log(PIB)

10.2
l_EXP
prediccin
10 Intervalo de 95 por ciento

9.8

9.6

9.4

9.2

8.8

8.6
2007 2008 2009 2010 2011 2012 2013 2014

Figura 7: Pronstico para los siguientes 4 periodos del log(EXP)

XXVII Simposio de Estadstica (2017)

Вам также может понравиться