NOTASDECLASEESTADISTICAIIIv 01

Notas de Clase Estad stica III
3009137
Nel Gonz alez Alvarez
Profesora Escuela de Estad stica
Universidad Nacional de Colombia Sede Medell n
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Indice general
1. Introducci on al lenguaje R 1
1.1. C omo descargar e instalar R . . . . . . . . . . . . . . . . . . . . . . 1
1.2. C omo usar R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.1. Inicio de una sesi on y edici on de programas . . . . . . . . . 4
1.2.2. Organizaci on y uso de funciones disponibles en R . . . . . 5
1.3. Resumen de algunas funciones b asicas de R . . . . . . . . . . . . 10
1.3.1. Funciones para entrada y lectura de datos y escritura y
exportaci on de resultados y objetos R . . . . . . . . . . . . . 10
1.3.2. Operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.3. Funciones relacionadas con distribuciones . . . . . . . . . 10
1.3.4. Funciones que producen escalares . . . . . . . . . . . . . . 10
1.3.5. Condicionales y loops . . . . . . . . . . . . . . . . . . . . . . 11
1.3.6. Algunos objetos R . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.7. Algunas operaciones con matrices . . . . . . . . . . . . . . . 11
1.3.8. Aplicando funciones a objetos R . . . . . . . . . . . . . . . . 11
1.3.9. Funciones que producen gr acas . . . . . . . . . . . . . . . 11
1.3.10.Funciones varias . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4. Lectura e ingreso de datos de series de tiempo . . . . . . . . . . . 12
1.4.1. Lectura de series univariadas . . . . . . . . . . . . . . . . . 12
1.4.2. Exportaci on de resultados num ericos y gr acos del R . . . 15
1.5. Gracando una serie de tiempo . . . . . . . . . . . . . . . . . . . . 16
1.6. Regresi on lineal m ultiple con R . . . . . . . . . . . . . . . . . . . . 17
1.6.1. Funci on lm . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2. El an alisis de series de tiempo 27
2.1. Introducci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2. Clases de pron osticos - pron osticos cuantitativos . . . . . . . . . . 28
2.3. Ventajas y desventajas de los m etodos cuantitativos . . . . . . . . 29
2.4. La precisi on de un pron ostico vs. el horizonte de tiempo . . . . . . 30
2.5. Las tareas en la realizaci on de un pron ostico . . . . . . . . . . . . 30
2.6. La metodologa de los datos de series de tiempo . . . . . . . . . . . 31
2.7. Estudio descriptivo de las series de tiempo . . . . . . . . . . . . . 34
III
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
IV

INDICE GENERAL
3. Modelos de regresi on para tendencia 45
3.1. Tendencia determinstica vs. estoc astica . . . . . . . . . . . . . . . 45
3.2. Estimaci on de modelos de tendencia . . . . . . . . . . . . . . . . . 49
3.2.1. Tendencia polinomial . . . . . . . . . . . . . . . . . . . . . . 49
3.2.2. Modelo general de la tendencia . . . . . . . . . . . . . . . . . 51
3.3. Pron ostico de la tendencia . . . . . . . . . . . . . . . . . . . . . . . 62
3.3.1. Pron osticos puntuales . . . . . . . . . . . . . . . . . . . . . . 62
3.3.2. Intervalos de pron ostico . . . . . . . . . . . . . . . . . . . . . 63
3.4. Diagn osticos y selecci on de modelos . . . . . . . . . . . . . . . . . 63
3.4.1. Criterios de Informaci on . . . . . . . . . . . . . . . . . . . . 63
3.4.2. Cu al criterio usar? . . . . . . . . . . . . . . . . . . . . . . . 64
3.5. Ejemplo: Datos RSALES.DAT . . . . . . . . . . . . . . . . . . . . . . 65
3.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.6.1. Problema 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.6.2. Problema 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.7. datos STYLEKP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4. Filtros lineales y suavizamientos 77
4.1. Regresi on LOESS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.1.1. LOESS en R . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.1.2. Otras funciones R relacionadas con LOESS: scatter.smooth()
y loess.smooth() . . . . . . . . . . . . . . . . . . . . . . . . 80
4.1.3. Ejemplo: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.2. Filtros lineales, medias m oviles y suavizadores . . . . . . . . . . . 85
4.2.1. Filtro Lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.2.2. Medias m oviles . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.2.3. Suavizamiento exponencial simple (EWMA) . . . . . . . . . 91
4.2.4. Suavizamiento Holt . . . . . . . . . . . . . . . . . . . . . . . 92
4.2.5. Suavizamientos exponenciales simples en R . . . . . . . . . 93
4.2.6. Suavizamiento de Holt en R . . . . . . . . . . . . . . . . . . 96
4.2.7. Filtros de Henderson . . . . . . . . . . . . . . . . . . . . . . 101
4.3. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5. Modelaci on de la componente estacional 105
5.1. Estacionalidad aditiva y multiplicativa . . . . . . . . . . . . . . . . 105
5.2. Modelado de la estacionalidad por regresi on . . . . . . . . . . . . . 106
5.2.1. Modelaci on de la estacionalidad mediante variables indi-
cadoras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
5.2.2. Modelaci on de la estacionalidad mediante funciones trigonom etri-
cas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
5.3. Evaluaci on de la estabilidad de los modelos de pron ostico . . . . . 120
5.3.1. Ejemplo 1: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
5.3.2. Ejemplo 2: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
INDICE GENERAL V
5.3.3. Ejemplo: Ajuste de una serie estacional multiplicativa . . . 129
5.4. Precisi on de los modelos de pron ostico . . . . . . . . . . . . . . . . 137
5.4.1. Comparaci on con un modelo de referencia . . . . . . . . . . 139
5.5. Ajuste por suavizamiento Holt-Winters de series estacionales . . . 140
5.5.1. Holt-Winters aditivo . . . . . . . . . . . . . . . . . . . . . . . 140
5.5.2. Holt-Winters multiplicativo . . . . . . . . . . . . . . . . . . . 142
5.5.3. Suavizamiento Holt-Winters en R . . . . . . . . . . . . . . . 144
5.5.4. Ejemplo: Suavizamiento Holt Winters de la serie del ndice
mensual de salario real . . . . . . . . . . . . . . . . . . . . . 145
5.5.5. Ejemplo: Suavizamiento Holt-Winters de la serie trimestral
de producci on de cemento portland . . . . . . . . . . . . . . 149
5.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
6. Caracterizaci on de los ciclos 157
6.1. Introducci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
6.2. Procesos estacionarios en covarianza . . . . . . . . . . . . . . . . . 158
6.2.1. Procesos de ruido . . . . . . . . . . . . . . . . . . . . . . . . 161
6.2.2. Procesos de ruido blanco . . . . . . . . . . . . . . . . . . . . 161
6.3. Procesos estacionarios en sentido fuerte o estrictamente esta-
cionarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
6.4. Funci on de autocovarianza y autocorrelaci on muestral . . . . . . 162
6.5. Uso de la FAC muestral para probar ruido blanco . . . . . . . . . 163
6.5.1. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
6.6. Test de Box-Pierce y Test Ljung-Box . . . . . . . . . . . . . . . . . 171
6.6.1. Test de Box-Pierce . . . . . . . . . . . . . . . . . . . . . . . . 171
6.6.2. Prueba de Ljung-Box . . . . . . . . . . . . . . . . . . . . . . 172
6.6.3. Pruebas Box-Pierce y Ljung-Box en R . . . . . . . . . . . . . 172
6.7. Procesos Autorregresivos de orden 1, AR(1) . . . . . . . . . . . . . 178
6.8. Test Durbin-Watson de incorrelaci on de orden 1 . . . . . . . . . . 179
6.8.1. Formulaci on del test . . . . . . . . . . . . . . . . . . . . . . . 179
6.8.2. El estadstico de prueba . . . . . . . . . . . . . . . . . . . . . 180
6.8.3. La ejecuci on de la prueba . . . . . . . . . . . . . . . . . . . . 181
6.8.4. Test Durbin-Watson en R . . . . . . . . . . . . . . . . . . . . 182
6.9. Ejercicio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
7. Introducci on a los modelos ARMA 185
7.1. El operador Rezago B
j
y polinomio de rezagos de orden j . . . . . 185
7.2. El Teorema de representaci on de Wold . . . . . . . . . . . . . . . . 186
7.3. Funci on de autocorrelaci on Parcial o PACF . . . . . . . . . . . . . 186
7.3.1. PACF para un proceso de ruido blanco . . . . . . . . . . . . 188
7.3.2. PACF muestral con R . . . . . . . . . . . . . . . . . . . . . . 189
7.3.3. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
7.4. Modelos de medias m oviles o MA . . . . . . . . . . . . . . . . . . . 192
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
VI

INDICE GENERAL
7.4.1. El proceso de media m ovil de orden 1 o MA(1) . . . . . . . . 192
7.4.2. Procesos MA(q) . . . . . . . . . . . . . . . . . . . . . . . . . . 195
7.5. Modelos autorregresivos de orden p o AR(p) . . . . . . . . . . . . . 196
7.5.1. Funci on de autocorrelaci on y autocorrelaci on parcial de
un AR(p) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
7.6. Modelos autorregresivos y de medias m oviles o ARMA(p,q) . . . . 201
7.6.1. Funci on de autocorrelaci on y autocorrelaci on parcial de
un ARMA(p,q) . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
7.6.2. Casos especiales de procesos ARMA . . . . . . . . . . . . . . 202
7.7. Identicaci on y ajuste del modelo para los ciclos . . . . . . . . . . 205
7.7.1. M etodos de identicaci on basados en minimizaci on de cri-
terios de informaci on . . . . . . . . . . . . . . . . . . . . . . 205
7.7.2. M etodo de identicaci on basado en la funci on de autocor-
relaci on extendida . . . . . . . . . . . . . . . . . . . . . . . . 207
7.7.3. Estimaci on de modelos ARMA . . . . . . . . . . . . . . . . . 208
7.8. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
7.9. Estimaci on por m axima verosimilitud en modelos ARMA . . . . . 221
7.10.Pron osticos en modelos ARMA estacionarios e invertibles . . . . . 221
8. Modelaci on de una serie con errores ARMA 225
8.1. Modelo inicial: Tendencia, estacionalidad y errores R.B . . . . . . 225
8.1.1. Ajuste y pron ostico . . . . . . . . . . . . . . . . . . . . . . . . 225
8.1.2. An alisis e identicaci on de ciclos en los errores estruc-
turales E
t
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
8.2. Modelos de tendencia, estacionalidad m as ciclos ARMA . . . . . . 235
8.2.1. Ciclos AR(6) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
8.2.2. Ciclos ARMA(2,2) . . . . . . . . . . . . . . . . . . . . . . . . . 237
8.2.3. Ciclos ARMA(1,5) . . . . . . . . . . . . . . . . . . . . . . . . . 240
8.2.4. Ciclos ARMA(2,4) . . . . . . . . . . . . . . . . . . . . . . . . . 242
8.2.5. Ciclos ARMA(6,7) . . . . . . . . . . . . . . . . . . . . . . . . . 245
8.2.6. Ciclos ARMA(7,10) . . . . . . . . . . . . . . . . . . . . . . . . 248
8.2.7. Ciclos ARMA(1, 2) (0, 1)
[4]
. . . . . . . . . . . . . . . . . . 251
8.3. Selecci on del mejor modelo . . . . . . . . . . . . . . . . . . . . . . . 254
8.4. C odigo R usado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
8.5. Modelaci on inicial: Estructura exponencial y errores R.B . . . . . 267
8.5.1. Ajuste y pron ostico . . . . . . . . . . . . . . . . . . . . . . . . 267
8.5.2. An alisis de residuales e identicaci on ciclos . . . . . . . . . 269
8.5.3. Ajuste de los ciclos . . . . . . . . . . . . . . . . . . . . . . . . 271
8.6. Ajuste y pron ostico aproximado de Y
t
. . . . . . . . . . . . . . . . . 278
8.7. Codigo R usado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
INDICE GENERAL VII

9. Modelos ARIMA 293
9.1. Introducci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
9.2. Procesos homog eneos . . . . . . . . . . . . . . . . . . . . . . . . . . 293
9.3. Raz unitaria autorregresiva . . . . . . . . . . . . . . . . . . . . . . 303
9.4. Caminata aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
9.4.1. Caminata aleatoria sin tendencia . . . . . . . . . . . . . . . 304
9.4.2. Caminata aleatoria con tendencia o deriva . . . . . . . . . . 305
9.5. Procesos integrados . . . . . . . . . . . . . . . . . . . . . . . . . . . 306
9.5.1. Procesos autorregresivos integrados de medias m oviles o
ARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306
9.6. Ajuste y pron ostico de modelos ARIMA . . . . . . . . . . . . . . . . 307
9.7. Pruebas para races unitarias . . . . . . . . . . . . . . . . . . . . . 310
9.7.1. Prueba de raz unitaria de Dickey-Fuller (DF) . . . . . . . . 311
9.7.2. Prueba de raz unitaria Dickey-Fuller aumentada (ADF) . . 312
9.7.3. Test DF y ADF en R . . . . . . . . . . . . . . . . . . . . . . . 315
9.8. Ejemplo: Modelaci on de la serie tasa de cambio Yen/D olar . . . . 316
9.8.1. An alisis preliminar . . . . . . . . . . . . . . . . . . . . . . . . 317
9.8.2. Identicaci on de modelos . . . . . . . . . . . . . . . . . . . . 317
9.8.3. Ajuste modelos identicados . . . . . . . . . . . . . . . . . . 319
9.8.4. Pruebas de raz unitaria . . . . . . . . . . . . . . . . . . . . . 331
9.8.5. Selecci on del mejor modelo para el ajuste y pron ostico del
logaritmo de la tasa de cambio yen/d olar . . . . . . . . . . 336
9.8.6. C odigo R usado . . . . . . . . . . . . . . . . . . . . . . . . . . 337
10.Modelos SARIMA 345
10.1.Introducci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
10.2.Modelos ARIMA estacionales . . . . . . . . . . . . . . . . . . . . . . 346
10.2.1.Algunos casos especiales de modelos SARIMA . . . . . . . . 347
10.2.2.Series con tendencia y estacionalidad estoc asticas . . . . . 355
10.3.ACF de procesos estacionales . . . . . . . . . . . . . . . . . . . . . 355
10.4.PACF y EACF de procesos estacionales . . . . . . . . . . . . . . . . 356
10.5.Construcci on y pron osticos en modelos estacionales . . . . . . . . 357
10.6.Races unitarias estacionales . . . . . . . . . . . . . . . . . . . . . . 359
10.6.1.Test HEGY de raz unitaria estacional . . . . . . . . . . . . . 360
10.6.2.Test Canova-Hansen (CH) . . . . . . . . . . . . . . . . . . . . 364
10.7.Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 366
10.7.1.Programaci on R usada en Ejemplo . . . . . . . . . . . . . . 378
A. Funciones R 385
A.1. Funci on decompose . . . . . . . . . . . . . . . . . . . . . . . . . . . 385
A.2. Funci on nls: Mnimos cuadrados no lineales . . . . . . . . . . . . 388
A.3. Funci on stl: Descomposici on usando LOESS . . . . . . . . . . . . 389
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
VIII

INDICE GENERAL
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Indice de guras
1.1. Sitio de descarga del R . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2. Subdirectorios de descarga R para Windows . . . . . . . . . . . . . . . 3
1.3. Link ultima versi on del R para Windows . . . . . . . . . . . . . . . . . 3
1.4. Ventana R Console . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.5. Ventana Editor R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.6. P agina de b usqueda y descarga de paquetes, seg un nombre . . . . . . 7
1.7. P agina de descarga paquete nlme . . . . . . . . . . . . . . . . . . . . . 7
1.8. Instalaci on paquete R usando archivo .zip . . . . . . . . . . . . . . . . 8
1.9. Archivo .csv con coma en posici on decimal . . . . . . . . . . . . . . . . 13
1.10.Archivo .CSV con punto en posici on decimal . . . . . . . . . . . . . . . 14
1.11.Archivo .TXT con punto en posici on decimal . . . . . . . . . . . . . . . 15
1.12.Serie ndice mensual salario real sector manufacturero colombiano, sin
trilla de caf e, enero de 1990 a mayo de 2011. . . . . . . . . . . . . . . 16
2.1. Lnea de tiempo vs. ajuste y pron ostico de una serie de tiempo (Gaynor
y Kirkpatrick [4]) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.2. Descomposici on serie de tiempo aditiva con funci on R decompose . . . 35
2.3. Descomposici on serie de tiempo aditiva con funci on R stl . . . . . . . 37
2.4. Descomposici on serie de tiempo multiplicativa con funci on R decompose 37
2.5. Descomposici on de los logaritmos de las ventas de licor . . . . . . . . . 39
2.6. Componente de tendencia serie de salarios, obtenida con decompose . . 40
2.7. Componente estacional serie de salarios, obtenida con decompose . . . 40
2.8. Componente de error serie de salarios, obtenida con decompose . . . . 40
2.9. Componente de tendencia serie de salarios, obtenida con stl . . . . . . 41
2.10.Componente estacional serie de salarios, obtenida con stl . . . . . . . 42
2.11.Componente de error serie de salarios, obtenida con stl . . . . . . . . 42
2.12.Componente de tendencia serie de salarios, obtenida con aggregate . . 43
2.13.Componente estacional serie de salarios, obtenida con cycle . . . . . . 43
3.1. Componentes claves del PIB real de Estados Unidos, registradas por
a no de 1960 a 1989, en millones de d olares de 1982. Fuente: Diebold
[3], stylekp.dat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.2. Tasa de cambio de Hungra, 620 observaciones Fuente: Diebold [3],
exchrate.dat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
IX
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
X

INDICE DE FIGURAS
3.3. Dos realizaciones de una caminata aleatoria . . . . . . . . . . . . . . . 48
3.4. Lado izquierdo: volumen mensual de operaciones de acciones negoci-
adas en la bolsa de Nueva York; lado derecho: Logaritmo de la serie.
542 observaciones. Fuente: Diebold [3], nyse vol.dat. . . . . . . . . . . 49
3.5. Volumen mensual de operaciones de acciones negociadas en la bolsa
de Nueva York y ajustes usando transformaci on logartmica y mnimos
cuadrados no lineales. Fuente: Diebold [3], nyse vol.dat. . . . . . . . . 55
3.6. Residuales del modelo Log- lineal (arriba) en escala logartmica de los
datos; residuales del modelo no lineal exponencial (abajo) en escala
original de los datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.7. Curva de tendencia tipo logstica. . . . . . . . . . . . . . . . . . . . . . 57
3.8. Datos censo decadal de poblaci on en Estados Unidos desde el a no 1790
a 2000, fuente: Data frame USPob en R. . . . . . . . . . . . . . . . . . 58
3.9. Datos censo decadal de poblaci on en Estados Unidos desde el a no 1790
a 2000 y proyecciones con modelo cuadr atico y logstico. . . . . . . . . 61
3.10.Gr acos de residuales modelos cuadr atico (modelo0) y modelo logstico
(modelo1) para datos del Censo Estados Unidos, 1790 a 2000. . . . . . 62
3.11.Serie mensual de ventas al menudeo en Estados Unidos, d olares nomi-
nales (ajustada estacionalmente), desde 01-1955 a 01-1996, fuente:Diebold
[3]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.12.Serie mensual de ventas al menudeo en Estados Unidos, d olares nom-
inales (ajustada estacionalmente), y curvas cuadr atica y exponencial
ajustadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.13.Residuales modelos ajustados a datos de RSALES.DAT . . . . . . . . . 70
3.14.Gr acos de normalidad para residuales, modelos ajustados a datos de
RSALES.DAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.15.Serie

Indice de productividad mensual en Canada: arriba Datos desde
1959, abajo: datos desde 1955. . . . . . . . . . . . . . . . . . . . . . . 74
4.1. Serie Tasa de cambio en Hungra y tres suavizamientos LOESS, (fecha
de inicio desconocida), fuente Diebold [3]. . . . . . . . . . . . . . . . . 84
4.2. Serie Tasa de cambio en Hungra y tres suavizamientos LOESS, (fecha
de inicio desconocida), fuente Diebold [3]. . . . . . . . . . . . . . . . . 84
4.3. Gr acos de residuales, ajustes LOESS para datos de la tasa de cambio
en Hungra), fuente Diebold [3]. . . . . . . . . . . . . . . . . . . . . . . 85
4.4. Gr acos series precios negociaci on de acciones de Microsoft (MSFT) . . 88
4.5. Serie volumen de acciones diarias negociadas de Microsoft (MSFT), con
medias m oviles unilaterales . . . . . . . . . . . . . . . . . . . . . . . . 90
4.6. Serie volumen de acciones diarias negociadas de Microsoft (MSFT), me-
dias m oviles unilaterales con argumento circular=T. . . . . . . . . . 90
4.7. Serie volumen de acciones diarias negociadas de Microsoft (MSFT), me-
dias m oviles bilaterales. . . . . . . . . . . . . . . . . . . . . . . . . . . 91
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
INDICE DE FIGURAS XI
4.8. Serie volumen de acciones diarias negociadas de Microsoft (MSFT), suaviza-
mientos exponeciales simples. . . . . . . . . . . . . . . . . . . . . . . 95
4.9. Serie volumen de acciones diarias negociadas de Microsoft (MSFT), suaviza-
mientos exponenciales. . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.10.Residuales de los suavizamientos exponenciales para el volumen de
acciones diarias negociadas de Microsoft (MSFT). . . . . . . . . . . . . 101
4.11.Filtros de Henderson sobre el volumen de acciones diarias negociadas
de Microsoft (MSFT). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
5.1. Gr acos de residuales de los tres modelos ajustados a la serie de salario.113
5.2. Gr acos de la serie real y ajustada seg un los tres modelos considerados
para la serie de salario. . . . . . . . . . . . . . . . . . . . . . . . . . . 113
5.3. Gr acos de residuales de los tres modelos ajustados a la serie de salario,
con funciones trigonom etricas. . . . . . . . . . . . . . . . . . . . . . . 118
5.4. Gr acos de la serie real y ajustada seg un los tres modelos considerados
para la serie de salario, con funciones trigonom etricas. . . . . . . . . . 119
5.5. Gr aco de 300 observaciones de la serie simulada Y
t
= 3500 + 200t +E
t
,
E
t
N(0, (4000)
2
). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
5.6. Gr aco de interceptos estimados recursivamente, para serie simulada
Y
t
= 3500 + 200t +E
t
, E
t
N(0, (4000)
2
). . . . . . . . . . . . . . . . . . . 124
5.7. Gr aco de pendientes estimadas recursivamente, para serie simulada
Y
t
= 3500 + 200t +E
t
, E
t
N(0, (4000)
2
). . . . . . . . . . . . . . . . . . . 125
5.8. Gr aco residuales recursivos y CUSUM
t
para la serie simulada Y
t
=
3500 + 200t +E
t
, E
t
N(0, (4000)
2
). . . . . . . . . . . . . . . . . . . . . 125
5.9. Gr aco de 300 observaciones de la serie simulada Y
t
= 18500 + 50t +E
t
,
para 1 t 150, Y
t
= 18500+200t+E
t
, para 151 t 300, E
t
N(0, (4000)
2
).126
5.10.Gr aco de interceptos estimados recursivamente, para serie simulada
Y
t
= 18500 + 50t + E
t
, para 1 t 150, Y
t
= 18500 + 200t + E
t
, para
151 t 300, E
t
N(0, (4000)
2
). . . . . . . . . . . . . . . . . . . . . . . 127
5.11.Gr aco de pendientes estimadas recursivamente, para serie simulada
Y
t
= 18500 + 50t + E
t
, para 1 t 150, Y
t
= 18500 + 200t + E
t
, para
151 t 300, E
t
N(0, (4000)
2
). . . . . . . . . . . . . . . . . . . . . . . 127
5.12.Gr aco residuales recursivos y CUSUM
t
t
=
18500+50t+E
t
, para 1 t 150, Y
t
= 18500+200t+E
t
, para 151 t 300,
E
t
N(0, (4000)
2
). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
5.13.Gr aco serie de producci on trimestral de cemento portland y de su
logaritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
5.14.Descomposici on stl de la serie de logaritmos de la producci on trimestral
cemento portland. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
5.15.Residuales ajuste de la serie de logaritmos de la producci on trimestral
cemento portland. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
5.16.Estimaci on recursiva de los par ametros de la tendencia, ajuste de la
serie de logaritmos de la producci on trimestral cemento portland. . . . 132
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
XII

INDICE DE FIGURAS
5.17.Estimaci on recursiva de los par ametros de la estacionalidad, ajuste de
la serie de logaritmos de la producci on trimestral cemento portland. . . 133
5.18.Residuales recursivos y test CUSUM, ajuste de la serie de logaritmos
de la producci on trimestral cemento portland. . . . . . . . . . . . . . . 134
5.19.Componente de tendencia serie trimestral de producci on de cemento
portland, estimada por descomposici on. . . . . . . . . . . . . . . . . . 137
5.20.Serie trimestral de producci on de cemento portland y su ajuste por
regresi on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
5.21.Suavizamientos Holt-Winters para serie ndice mensual de salario real. 150
5.22.Suavizamientos Holt-Winters para serie trimestral de producci on de ce-
mento portland. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
6.1. Realizaciones de un proceso estoc astico. Fuente: Martnez [8]. . . . . . 157
6.2. Ejemplo (k) de un procesos estacionario . . . . . . . . . . . . . . . . 159
6.3. Dos procesos estacionarios en covarianza. Fuente: Martnez [8] . . . . 160
6.4. Dos procesos no estacionarios en covarianza. Fuente: Martnez [8] . . . 160
6.5. Funci on de autocovarianza (k) de un procesos de ruido . . . . . . . . 161
6.6. Serie a
t
y su FAC muestral . . . . . . . . . . . . . . . . . . . . . . . . 165
6.7. Serie Z
1,t
y su FAC muestral . . . . . . . . . . . . . . . . . . . . . . . . 165
6.8. Serie Z
2,t
y su FAC muestral . . . . . . . . . . . . . . . . . . . . . . . . 165
6.9. Serie Z
3,t
y su FAC muestral . . . . . . . . . . . . . . . . . . . . . . . . 166
6.10.Serie Z
4,t
y su FAC muestral . . . . . . . . . . . . . . . . . . . . . . . . 166
6.11.FACs Serie ndice de salario y residuales de modelos ajustados . . . . 167
6.12.FACs Serie log producci on trimestral cemento portland y residuales de
modelo ajustado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
6.13.Serie Y
t
simulada y su FAC muestral . . . . . . . . . . . . . . . . . . . 169
6.14.Serie residuales modelo lineal ajustado a serie simulada y su FAC
muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
6.15.Primera diferencia de la serie simulada y su FAC muestral . . . . . . . 170
6.16.Regi on crtica de nivel para el test Box-Pierce y Ljung-Box . . . . . . 172
6.17.Ejemplos (k) de procesos AR(1) . . . . . . . . . . . . . . . . . . . . . 180
7.1. PACF de un proceso de ruido blanco . . . . . . . . . . . . . . . . . . . 189
7.2. PACF muestral de un ruido blanco . . . . . . . . . . . . . . . . . . . . 190
7.3. PACFs series simuladas en Secci on 6.5.1. . . . . . . . . . . . . . . . . 191
7.4. PACF residuales modelo log cuadr atico estacional serie producci on trimes-
tral de cemento portland . . . . . . . . . . . . . . . . . . . . . . . . . 192
7.5. Ejemplos (k) y
kk
de procesos MA(1) . . . . . . . . . . . . . . . . . . 194
7.6. Ejemplos (k) y
kk
de procesos MA(2) . . . . . . . . . . . . . . . . . . 197
7.7. Ejemplos (k) y
kk
de procesos AR(1) . . . . . . . . . . . . . . . . . . 199
7.8. Ejemplos (k) y
kk
de procesos AR(2) . . . . . . . . . . . . . . . . . . 200
7.9. Ejemplos (k) y
kk
de procesos ARMA(1,1) . . . . . . . . . . . . . . . . 203
7.10.M as ejemplos (k) y
kk
de procesos ARMA(1,1) . . . . . . . . . . . . . 204
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
INDICE DE FIGURAS XIII

7.11.Representaci on de la EACF te orica de procesos ARMA(1,1) . . . . . . . 209
7.12.Serie AR1.sim simulada de Z
t
= 0.67Z
t1
+a
t
, a
t
RBN(0, 1) y n = 100 . 211
7.13.Serie residuales despu es de ajustar AR1.sim y ACF, PACF correspondi-
entes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
7.14.Serie AR1.sim simulada y pron osticos para h = 5 perodos futuros . . . 213
7.15.Series Z
1t
, Z
3t
y MA1.sim, simuladas . . . . . . . . . . . . . . . . . . . 215
7.16.ACFs y PACFs muestrales de las Series Z
1t
, Z
3t
y MA1.sim, simuladas 215
7.17.Residuales del modelo ajustado para Z
1t
, y su ACF y PACF muestrales . 218
7.18.Residuales del modelo ajustado para Z
3t
, y su ACF y PACF muestrales . 218
7.19.Residuales del modelo ajustado para MA1.sim, y su ACF y PACF mues-
trales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
7.20.Series Z
1t
, Z
3t
y MA1.sim y sus pron osticos para h = 5 perodos futuros 220
8.1. Izq.: Serie de producci on trimestral de cemento portland (miles de toneladas) y Der.: su logaritmo 226
8.2. Serie real, ajustada y pron osticos para la validaci on cruzada, modelo Log-c ubico estacional . . . 227
8.3. Residuales estructurales

Et modelo log-c ubico estacional y ACF y PACF muestrales . . . . . . 228
8.4. Resultado de la funci on armasubsets sobre

Et en modelo log-c ubico estacional . . . . . . . 230
8.5. ACFs y PACFs te oricas de modelos ARMA identicados para Et . . . . . . . . . . . . . 232
8.8. Serie real, ajustada y pron osticos Modelo 2 . . . . . . . . . . . . . . . . . . . . . . 236
8.9. Residuales at Modelo 2 y su ACF y PACF muestrales . . . . . . . . . . . . . . . . . . 236
8.10.Gr aco Normalidad de at Modelo 2 . . . . . . . . . . . . . . . . . . . . . . . . . 237
8.11.Serie real, ajustada y pron osticos Modelo 3 . . . . . . . . . . . . . . . . . . . . . . 238
8.12.Residuales at Modelo 3 y su ACF y PACF muestrales . . . . . . . . . . . . . . . . . . 239
8.20.Residuales at del ajuste con errores ARMA(6,7), con
j
, j = 1, 3, 4, 5, y
i
, i = 1, 2, . . . , 6, jos en
cero, y su ACF y PACF muestrales . . . . . . . . . . . . . . . . . . . . . . . . . 246
8.22.Residuales at Modelo 6 y su ACF y PAF muestrales . . . . . . . . . . . . . . . . . . . 247
8.24.Residuales at del ajuste con errores ARMA(7,10), con
j
, j = 2, 3, 4, 5, 6, y
i
, i = 1, 2, . . . , 7, 9, jos
en cero, y su ACF y PACF muestrales . . . . . . . . . . . . . . . . . . . . . . . . 249
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
XIV

INDICE DE FIGURAS
8.31.Valores reales y pronosticados con los ocho modelos (Miles de toneladas) . . . . . . . . . . 255
8.32.Serie real, ajustada y pron osticos para la validaci on cruzada, modelo exponencial c ubico estacional 268
8.33.Residuales en ajuste exponencial c ubico estacional . . . . . . . . . . . . . . . . . . . 269
8.34.ACF y PACF para residuales estructurales . . . . . . . . . . . . . . . . . . . . . . 269
8.35.Resultado de la funci on armasubsets sobre

Et en modelo exponencial c ubico estacional . . . . 271
8.36.Residuales de ajuste del ARMA(2,2) ajustado a los residuos estructurales del modelo exponencial 272
8.37.Residuales de ajuste del AR(6) ajustado a los residuos estructurales del modelo exponencial . . 273
8.40.Residuales de ajuste del SARMA(1,2)(0,1)[4] ajustado a los residuos estructurales del modelo
exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275
8.41.Residuales de ajuste del ARMA(6,7): Et =
2
E
t2
+
6
E
t6
+at +
7
a
t7
, ajustado a los residuos
estructurales del modelo exponencial . . . . . . . . . . . . . . . . . . . . . . . . 276
8.42.Residuales de ajuste del ARMA(6,7)
a
ajustado a los residuos estructurales del modelo exponencial 276
8.43.Residuales de ajuste del ARMA(6,7): Et =
2
E
t2
+
6
E
t6
+at +
6
a
t6
+
7
a
t7
,at R.B N(0,
2
a
),
ajustado a los residuos estructurales del modelo exponencial . . . . . . . . . . . . . . . 277
8.44.Residuales de ajuste del ARMA(6,7)
b
ajustado a los residuos estructurales del modelo exponencial 277
8.45.Comparaci on de serie real y sus ajustes mediante los modelos que intengran la estimaci on estruc-
tural exponencial m as los ciclos ARMA identicados para los residuales estructurales del modelo
exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279
8.46.Comparaci on de serie real y sus ajustes mediante los modelos que intengran la estimaci on estruc-
tural exponencial m as los ciclos ARMA identicados para los residuales estructurales del modelo
exponencial (Cont.) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
8.47.Comparaci on de serie real y sus pron osticos, para el modelo exponencial sin y con los ciclos ARMA
identicados para los residuales estructurales del modelo exponencial inicial . . . . . . . . 281
9.1. Serie simulada como Y
t
= 3500+200t+E
t
, E
t
N(0, (4000)
2
) y su primera
diferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294
9.2. Gr acos para an alisis de residuales

E
t
del ajuste MA(1) sobre la serie Y
t
296
9.3. Serie simulada Y
t
= 10000 + 1.8t + 15t
2
+ E
t
, E
t
R.BN(0, (5000)
2
) y su
ACF muestral. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299
9.4. Diferencias de orden 1 y 2 de serie simulada Y
t
= 10000+1.8t +15t
2
+E
t
,
E
t
R.BN(0, (5000)
2
). . . . . . . . . . . . . . . . . . . . . . . . . . . . 300
9.5. Gr acos para an alisis de residuales

E
t
del ajuste MA(2) sobre la serie
2
Y
t
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301
9.6. ACF y PACF de una serie proveniente de un proceso ARIMA(p,1,q) . . . 304
9.7. Serie original tasa mensual de cambio yen/US, su logaritmo y sus re-
spectivas diferencias de orden 1 . . . . . . . . . . . . . . . . . . . . . 316
9.8. Arriba: ACF y PACF log tasa mensual de cambio yen/US; Abajo: ACF y
PACF primera diferencia del logaritmo . . . . . . . . . . . . . . . . . . 317
9.9. Serie log tasa yen/Us y pron osticos modelos 1 a 4 . . . . . . . . . . . . 322
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
INDICE DE FIGURAS XV
9.10.Gr acas para an alisis de residuales, modelos 1 y 2 . . . . . . . . . . . 323
9.11.Gr acas para an alisis de residuales, modelos 3 y 4 . . . . . . . . . . . 324
9.12.Gr acos residuales modelo tendencia lineal y E
t
R.BN(0,
2
) . . . . . 326
9.13.Serie log tasa yen/Us y pron osticos modelos 5b y 5c . . . . . . . . . . 328
9.14.Gr acas para an alisis de residuales, modelos 5b y 5c . . . . . . . . . . 330
10.1.ACFs y PACFs modelos AR(1)
s
. . . . . . . . . . . . . . . . . . . . . . 348
10.2.ACFs y PACFs modelos MA(1)
s
. . . . . . . . . . . . . . . . . . . . . . 349
10.3.ACFs y PACFs modelos ARMA(1,1)
s
. . . . . . . . . . . . . . . . . . . 350
10.4.ACFs y PACFs modelos MA(1) MA(1)
12
. . . . . . . . . . . . . . . . . 351
10.5.ACFs y PACFs modelos MA(1) AR(1)
12
. . . . . . . . . . . . . . . . . 352
10.6.ACFs y PACFs modelos AR(1) MA(1)
12
. . . . . . . . . . . . . . . . . 353
10.7.ACFs y PACFs modelos AR(1) AR(1)
4
. . . . . . . . . . . . . . . . . . 354
10.8.Serie de producci on trimestral de cemento portland y su logaritmo . . . 366
10.9.Diferencias ,
4
,
4
y
4
para el logaritmo de la producci on trimes-
tral de cemento portland. . . . . . . . . . . . . . . . . . . . . . . . . . 367
10.10. ACFs para el logaritmo de la producci on de cemento portland y de sus
diferencias ,
4
,
4
. . . . . . . . . . . . . . . . . . . . . . . . . . . 368
10.11. ACF, PACF y resultado de la funci on armasubsets() para
4
sobre
el logaritmo de la producci on de cemento portland. . . . . . . . . . . . 369
10.12. Ajuste y pron osticos de la producci on de cemento portland con Modelo
SARIMA 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372
10.13. Ajuste y pron osticos de la producci on de cemento portland con Modelo
SARIMA 2 a 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373
10.14. Comparaci on de los pron osticos en escala original, de los modelos SARI-
MA 1 a 5 ajustados al logaritmo de la producci on de cemento portland
con Modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374
10.15. Gr acos de residuales de ajuste de los modelos SARIMA 1 a 4 ajustados
al logaritmo de la producci on de cemento portland con Modelo. . . . . . 375
10.16. ACFs y PACFs para residuales de ajuste de los modelos SARIMA 1 a 4
ajustados al logaritmo de la producci on de cemento portland con Modelo.376
10.17. Gr acos de residuales de ajuste y su ACF y PACF, modelo SARIMA 5
para el logaritmo de la producci on de cemento portland con Modelo. . . 377
A.1. Descomposici on de una serie multiplicativa. Fuente:O.D. Anderson (1976)
and ODonovan (1983). Ventas mensuales compa na X, ene 65 - may 71. 387
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Captulo 1
Introducci on al lenguaje R
R m as que un paquete estadstico de dominio p ublico, es un lenguaje y ambi-
ente que adem as de ofrecer una amplia gama de m etodos estadsticos tambi en
puede ser considerado como un lenguage de alto nivel. Entre otras cosas, per-
mite denir funciones que pasan a ser parte del sistema las cuales pueden
ser usadas en sesiones posteriores. Entre sus ventajas tenemos su capacidad
para operar con objetos, la programaci on en lenguaje matricial, la disponi-
bilidad de una amplia base de operadores y la versatilidad que ofrece en la
realizaci on de gr acas.
El software est a disponible bajo los t erminos de licencia GNU en forma de
c odigo fuente, para sistemas operativos Windows, Mac OS, UNIX, y similares
y puede ser descargado en el website del R, donde se encuentran disponibles
referencias importantes para aprender su uso, tales como
1. An Introduction to R: Notes on R: A Programming Environment for Data
Analysis and Graphics, Version Version 2.13.1 (2011-07-08), by W. N. Ven-
ables, D. M. Smith and the R Development Core Team;
2. R: A Language and Environment for Statistical Computing. Reference In-
dex, Version 2.13.1 (2011-07-08), by The R Development Core Team.
1.1. C omo descargar e instalar R
En la direcci on http://cran.r-project.org ubicamos la p agina para descar-
gar el R (ver Figura 1.1):
Download and Install R
Precompiled binary distributions of the base system and contributed pack-
ages, Windows and Mac users most likely want one of these versions of R:
Download R for Linux
Download R for MacOS X
Download R for Windows
1
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
2 CAP
ITULO 1. INTRODUCCI
ON AL LENGUAJE R
Seleccionamos la opci on Download R for Windows.
Figura 1.1: Sitio de descarga del R
A continuaci on visualizamos la p agina R for Windows, donde tenemos las
siguientes dos opciones (ver Figura 1.2):
Subdirectories:
base
contrib
Seleccionamos base. Llegamos a la p agina R-2.13.1 for Windows (32/64
bit) (ver Figura 1.3), all seleccionamos la opci on
Download R 2.13.1 for Windows (39 megabytes, 32/64 bit)
Aparece luego la ventana de descarga, hacer click en el bot on Ejecutar y seguir
paso a paso las instrucciones o preguntas del instalador, respondiendo a todo
con el bot on siguiente. Cuando llegue a la ventana de selecci on de com-
ponentes a instalar, tenga cuidado de seleccionar primero los componentes
referentes a manuales antes de proseguir.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
1.1. C

OMO DESCARGAR E INSTALAR R 3
Figura 1.2: Subdirectorios de descarga R para Windows
Figura 1.3: Link ultima versi on del R para Windows
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
4 CAP
ITULO 1. INTRODUCCI
ON AL LENGUAJE R
1.2. C omo usar R
1.2.1. Inicio de una sesi on y edici on de programas
Al iniciar una sesi on en R el programa se abre en la ventana de comandos
denominada R-Console, ilustrada en la Figura 1.4, en la cual se pueden es-
cribir lneas de comandos que ser an ejecutados una vez se presione la tecla
enter.
Figura 1.4: Ventana R Console
Figura 1.5: Ventana Editor R
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
1.2. C

OMO USAR R 5
En la ventana R-Console encontramos en la barra men u los siguientes
men us:
Archivo
Editar
Visualizar
Misc
Paquetes
Ventanas
Ayuda
Como alternativa para la edici on de programas en lenguaje R, se puede
recurrir a la creaci on de un archivo de edici on con el men u Archivo - Nuevo
Script, donde podemos editar nuestros programas especcos que deseemos
y ejecutarlos en forma completa o parcialmente mediante selecci on previa de
las lneas deseadas, usando las opciones disponibles en el men u Editar. En la
Figura 1.5 se ilustra la ventana de edici on con parte de un programa R escrito
por el usuario. Estos archivos de edici on pueden ser guardados con extensi on
.R y ser utilizados en cualquiera otra sesi on carg andolos por el men u Archivo
- Abrir Script.
1.2.2. Organizaci on y uso de funciones disponibles en R
En R las funciones est an organizadas en libreras o paquetes. Por defecto R
inicializa en el paquete denominado base en el cual encontramos las funciones
generales para el manejo de datos y gr acas. Existen otros paquetes en los
cuales se encuentran herramientas de an alisis m as especializadas, las cuales
pueden ser utilizadas cargando previamente la librera que las contiene. Una
librera o paquete puede cargarse mediante la funci on library() o bien con
require() o a trav es del men u Paquetes - Cargar paquetes... Una lista de las
libreras disponibles puede obtenerse ejecutando:
> library()
lo que permite ver en una ventana denominada R packages available un lista-
do como el siguiente,
Packages in library C:/Program Files/R/R-2.13.1/library:
base The R Base Package
boot Bootstrap Functions (originally by Angelo Canty for S)
class Functions for Classification
cluster Cluster Analysis Extended Rousseeuw et al.
codetools Code Analysis Tools for R
compiler The R Compiler Package
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
6 CAP
ITULO 1. INTRODUCCI
ON AL LENGUAJE R
datasets The R Datasets Package
foreign Read Data Stored by Minitab, S, SAS, SPSS, Stata, Systat, dBase,
...
graphics The R Graphics Package
grDevices The R Graphics Devices and Support for Colours and Fonts
grid The Grid Graphics Package
KernSmooth Functions for kernel smoothing for Wand & Jones (1995)
lattice Lattice Graphics
MASS Support Functions and Datasets for Venables and Ripleys MASS
Matrix Sparse and Dense Matrix Classes and Methods
methods Formal Methods and Classes
mgcv GAMs with GCV/AIC/REML smoothness estimation and GAMMs by PQL
nlme Linear and Nonlinear Mixed Effects Models
nnet Feed-forward Neural Networks and Multinomial Log-Linear Models
rpart Recursive Partitioning
spatial Functions for Kriging and Point Pattern Analysis
splines Regression Spline Functions and Classes
stats The R Stats Package
stats4 Statistical Functions using S4 Classes
survival Survival analysis, including penalised likelihood.
tcltk Tcl/Tk Interface
tools Tools for Package Development
utils The R Utils Package
Existe una gran cantidad de otros paquetes disponibles en el website del R
que el usuario puede descargar simplemente siguiendo los siguientes pasos.
1. Con ectese a internet.
2. Inicialice una sesi on R. Vaya al men u Paquetes-Seleccionar Espejo CRAN.
3. En la ventana CRAN mirror seleccione Colombia (Bogota) y presione OK.
4. Vuelva al men u Paquetes y esta vez seleccione Instalar paquete(s)... y
en la ventana Packages resultante, seleccione el paquete que se desea
descargar, buscando por nombre en orden alfab etico y nalmente pre-
sione OK.
Sin embargo, lo anterior a veces puede fallar bien sea por error de congu-
raci on del R o problemas con la conexi on a Internet usando R. En este caso
puede realizarse lo siguiente:
1. Ingrese a la p agina http://cran.r-project.org ilustrada en la Figura 1.1, y
en el men u del lado izquierdo en Software seleccione la opci on Packages.
2. En la p agina Contributed Packages, secci on Available Packages en-
cuentra las siguientes dos opciones o links:
Table of available packages, sorted by date of publication
Table of available packages, sorted by name
3. Seleccione Table of available packages, sorted by name, lo cual lo lleva a
la p agina Available CRAN Packages By Name, ilustrada en la Figura 1.6.
Busque por orden alfab etico, uno a uno los paquetes que desee descargar.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
1.2. C

OMO USAR R 7
4. Una vez seleccione el paquete en la lista alfab etica, aparece la p agina
de descarga, por ejemplo, para la librera nlme, la p agina aparece titula-
da como nlme: Linear and Nonlinear Mixed Effects Models, ilustrada
en la Figura1.7, donde se visualiza una breve descripci on de la librera,
su n umero de versi on y dependencia con otras libreras o paquetes que
deber an descargarse caso que el usuario a un no las tenga disponibles
en su m aquina. En la secci on Downloads se selecciona la opci on para
Windows binary: nlme-3.1-102.zip (este archivo cambiar a de nombre de
acuerdo a sus actualizaciones). Guarde el archivo en su m aquina.
Figura 1.6: P agina de b usqueda y descarga de paquetes, seg un nombre
Figura 1.7: P agina de descarga paquete nlme
5. Para instalar en R la librera descargada mediante archivo .zip, inicie una
sesi on R, vaya al men u Paquetes - Instalar paquete(s) a partir de archivos
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
8 CAP
ITULO 1. INTRODUCCI
ON AL LENGUAJE R
zip locales... Emerge una ventana para que ud. explore en su m aquina
hasta hallar la ruta donde guard o el archivo .zip del paquete R a instalar.
Figura 1.8: Instalaci on paquete R usando archivo .zip
Para consultar la lista de funciones disponibles en una librera particular (ya
disponible en su m aquina) usamos el comando:
library(help="nombre de la libreria")
Por ejemplo, si se desea saber cu ales funciones est an disponibles en la li-
brera splines, ejecutamos el siguiente comando:
library(help="splines")
Para conocer sobre la sintaxis y uso de alguna funci on en particular pode-
mos usar el men u Ayuda o el comando ?paquete::funcion, por ejemplo,
?car::boxCox.
Si la funci on se encuentra en la librera base, usamos simplemente el co-
mando ?funcion, por ejemplo,
?lm
NOTA: R es sensible a may usculas y min usculas por lo que es importante
escribir los nombres de funciones y libreras conforme han sido denidos.
Algunas veces el usuario desconoce el nombre de la funci on deseada. Si ya
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
1.2. C

OMO USAR R 9
existe en alguna librera previamente descargada, se puede recurrir a la b usque-
da con una palabra clave con
help.search("palabra-clave") o ??palabra-clave.
Por ejemplo,
??shapiro o help.search("shapiro"),
da como resultado un listado de funciones R y su ubicaci on (paquete::funcion),
como el siguiente,
Help files with alias or concept or title matching shapiro using
fuzzy matching:
stats::shapiro.test Shapiro-Wilk Normality Test
Type ?PKG::FOO to inspect entries PKG::FOO, or TYPE?PKG::FOO for
entries like PKG::FOO-TYPE.
R adem as permite al usuario crear sus propias funciones con el comando
function(), estas son almacenadas en una forma interna especial y pueden
ser usadas en expresiones subsiguientes. Esta caracterstica proporciona una
gran potencialidad y versatilidad al lenguaje permitiendo al usuario mayor
productividad en el uso del R. Una funci on es denida mediante una asig-
naci on de la forma
nombre=function(arg.1, arg.2, ...){expresiones}
Las expresiones usadas son expresiones admisibles en R que usan los argu-
mentos arg.i, para calcular un valor o producir un objeto determinado (vec-
tor, matriz, lista, arreglo, etc.). Una invocaci on o llamada de la funci on toma
la forma nombre(expr.1,expr.2,...) donde expr.i es el valor particular
para el argumento arg.i de la funci on.
A continuaci on, un listado de las funciones b asicas utilizadas o que pueden
ser utiles para el lector. Para detalles consultar directamente la ayuda y man-
uales del R.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
10 CAP
ITULO 1. INTRODUCCI
ON AL LENGUAJE R
1.3. Resumen de algunas funciones b asicas de R
1.3.1. Funciones para entrada y lectura de datos y escritura y exportaci on
de resultados y objetos R
Comando Funci on
scan() Lectura de datos. Especial para datos no estructurados
read.table() Lectura de archivos en formato de tabla
read.fwf() Lectura de archivos en formato de tabla con ancho fijo
read.csv() Lectura de archivos en formato de tabla con datos separados por comas
read.ftable() Lectura de una tabla de contingencia guardada en archivo ASCII
sink() Envo a archivo ASCII los resultados de una sesion
write() Escribe una matriz en un archivo ASCII
write.ftable() Escribe una tabla de contingencia en un archivo ASCII
xtable() Escribe una matriz en formato Latex. Requiere la librera xtable
ftable() Permite presentar decentemente un arreglo multidimensional
1.3.2. Operadores
Aritm eticos De comparaci on L ogicos y de control
+ Suma < menor & y
- Resta > mayor | o
* Multiplicacion <= menor o igual ! no
/ Division >= mayor o igual all(...) Todos los valores logicos son ciertos?
Exponenciacion == igual any(...) Alguno de los valores logicos es cierto?
%/% Division entera != diferente && Si primer operando es cierto evalua
%% Operador modulo segundo operando
sqrt(x)

x || Si primer operando es falso evalua
exp(x) e
x
segundo operando.
1.3.3. Funciones relacionadas con distribuciones
Distribuci on Densidad Funci on Acumulada Cuantil p N umeros aleatorios
Uniforme dunif(x,...) punif(q,...) qunif(p,...) runif(n,...)
Normal dnorm(x,...) pnorm(q,...) qnorm(p,...) rnorm(n,...)
Binomial dbinom(x,...) pbinom(q,..) qbinom(p,...) rbinom(n,...)
Lognormal dlnorm(x,...) plnorm(q,...) qlnorm(p,...) rlnorm(n,...)
Beta dbeta(x,...) pbeta(q,...) qbeta(p,...) rbeta(n,...)
Geometrica dgeom(x,...) pgeom(q,...) qgeom(p,...) rgeom(n,...)
Gamma dgamma(x,...) pgamma(q,...) qgamma(p,...) rgamma(n,...)
Ji cuadrado dchisq(x,...) pchisq(q,...) qchisq(p,...) rchisq(n,...)
Exponencial dexp(x,...) pexp(q,...) qexp(p,...) rexp(n,...)
F df(x,...) pf(q,...) qf(p,...) r(n,...)
Hipergeom. dhyper(x,...) phyper(q,...) qhyper(p,...) rhyper(n,...)
t dt(x,...) pt(q,...) qt(p,...) r(n,...)
Poisson dpois(x,...) ppois(q,...) qpois(p,...) rpois(n,...)
Weibull dweibull(x,...) pweibull(q,...) qweibull(p,...) rweibull(n,...)
Binom. Neg. dnbinom(x,...) pnbinom(q, s...) qnbinom(p,...) rnbinom(n,...)
1.3.4. Funciones que producen escalares
Comando Funci on
max() Maximo del argumento
min() Mnimo del argumento
sum() Suma de todos los elementos del argumento
mean() Promedio aritmetico de todos los elementos del argumento
var() Varianza de todos los elementos del argumento, cuando este es
un vector, o matriz de covarianzas si el argumento es una matriz
median() Mediana del argumento
quantile(...,probs=c(...)) Cuantiles del argumento con las proporciones indicadas en probs
prod() Producto de todos los elementos del argumento
length() Numero de elementos del argumento si este es una lista o vector
ncol() Numero de columnas si el argumento es una matriz
nrow() Numero de filas si el argumento es una matriz
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
1.3. RESUMEN DE ALGUNAS FUNCIONES B
ASICAS DE R 11
1.3.5. Condicionales y loops
if(condicion){expresiones} else expresion
ifelse(condicion,1,0)
for(nombre in expresion){expresiones}
while(condicion){expresiones}
1.3.6. Algunos objetos R
Vectores, matrices y arreglos
Comando Funci on
c() Crea vectores
append() Combina vectores o adiciona elementos a un vector
matrix(), as.matrix(), data.matrix() Crea matrices
array(), as.array() Crea arreglos
Listas y tramas de datos
Comando Funci on
list(), as.list() Crea listas de objetos
data.frame(), as.data.frame() Crea colecciones de variables en estructura tabular
1.3.7. Algunas operaciones con matrices
Comando Funci on
%
*
% Producto matricial
t() Transposicion de una matriz
crossprod(A) Producto A
t
A
svd() Descomposicion en valores singulares de una matriz
qr() Descomposicion qr
chol() Descomposicion de Cholesky
solve() Inversa de una matriz
cbind() Combina matrices por columnas
rbind() Combina matrices por filas
eigen() Calculo de valores y vectores propios
diag() Crea una matriz diagonal si el argumento es un vector o
retorna la matriz diagonal de una matriz
1.3.8. Aplicando funciones a objetos R
Comando Funci on
apply() Aplica una funcion a filas o columnas de una matriz
tapply() Aplica una funcion a cada celda de un arreglo
lapply() Aplica una funcion a cada elemento de una lista y devuelve una lista
sapply() Como lapply pero devuelve un vector o matriz
1.3.9. Funciones que producen gr acas
Comando Funci on
hist() Grafica histogramas
boxplot() Grafica boxplots
plot() Funcion generica para graficos de dispersion,de series de tiempo, de
residuales, etc.
qqplot() Grafico cuantil-cuantil
qqnorm() Grafico de probabilidad normal
pairs() Grafico de matrices de dispersion
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
12 CAP
ITULO 1. INTRODUCCI
ON AL LENGUAJE R
1.3.10. Funciones varias
Comando Funci on
lm() Funcion para ajuste de un modelo lineal por mnimos cuadrados
summary() Funcion generica para exhibir resumen de resultados de modelos ajustados
ts() Crea objetos tipo series de tiempo
acf() Estima y grafica la autocorrelaciones o autocovarianzas para un objeto
serie de tiempo
pacf() Estima y grafica las autocorrelaciones parciales para un objeto serie
de tiempo
Box.test() Realiza test Box-Pierce o test Ljung-Box sobre un objeto serie de tiempo
lag.plot() grafica una serie vs. Versiones rezagadas de ella misma
residuals() extrae residuales de modelos ajustados con alguna funcion como lm()
fitted() extrae valores ajustados de modelos ajustados con alguna funcion de modelacion
predict() produce predicciones a partir de los resultados de varias funciones R que
ajustan modelos. los metodos que usa dependen de la clase de objeto R
producido por una funcion de modelacion especfica.
durbin.watson() Funcion de la librera car que realiza el test Durbin-Watson
Nota: Existen muchas otras funciones para el an alisis y modelaci on de
series de tiempo que ser an vistas posteriormente en el desarrollo del curso.
1.4. Lectura e ingreso de datos de series de tiempo
Para la lectura de bases de datos externas de series de tiempo usaremos
las funciones R scan(), read.table(), read.csv(), read.delim().
1.4.1. Lectura de series univariadas
En R se usa el punto como delimitador de decimales. Podemos ingresar las
observaciones de una serie univariada por teclado, usando la funci on scan(),
como se ilustra a continuaci on
C odigo R 1.1.
salario<-scan()
94.08 102.23 103.99 103.21 102.59 100.95
101.67 101.71 99.93 100.11 99.65 89.81
90.71 99.88 100.75 101.67 100.58 98.82
98.21 98.96 99.30 98.40 99.17 91.12
90.85 102.67 104.36 101.71 101.48 100.29
100.33 102.24 101.24 102.02 103.79 95.95
96.52 106.55 108.50 108.04 108.68 108.34
108.14 109.75 108.28 108.76 109.36 101.03
101.01 109.63 111.20 109.67 110.24 110.94
110.38 111.50 111.73 112.94 113.87 107.39
103.38 113.84 114.96 116.00 113.54 113.25
113.35 114.88 113.81 116.03 117.50 109.50
105.87 117.69 119.22 118.80 118.48 116.65
116.54 117.03 116.04 116.87 118.60 108.91
109.53 120.21 122.15 122.48 124.30 121.99
122.20 121.41 120.69 122.72 124.70 115.65
114.15 123.45 124.66 122.08 121.64 119.48
120.02 122.33 121.50 122.45 123.63 115.43
111.66 124.21 126.22 126.88 126.88 127.33
127.27 128.88 128.54 130.28 132.15 124.65
119.19 131.69 130.87 129.95 130.83 131.23
132.64 133.50 132.98 134.38 135.12 130.16
121.78 132.44 132.89 130.83 131.41 130.40
131.79 132.46 131.00 132.46 133.61
salario=ts(salario,frequency=12,start=c(1990,1))
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
1.4. LECTURA E INGRESO DE DATOS DE SERIES DE TIEMPO 13
con la lnea salario=ts(salario,frequency=12,start=c(1990,1)) esta-
mos redeniendo el objeto salario como una serie de valores recolectados
con frecuencia mensual, y que inicia en enero de 1990. Para datos trimes-
trales se especicara frequency=4 y para una serie anual, frequency=1.
Para leer datos univariados editados en Excel en una columna, estos se
guardan en formato .CSV (delimitado por comas). Si en este archivo se usa
coma para la posici on decimal y los datos no est an encabezados por alg un
ttulo, debemos leer los datos usando
read.csv2(file.choose(),header=F,dec=",")
Si el primer registro en el archivo es un ttulo o cualquier texto, usamos
read.csv2(file.choose(),header=T,dec=",")
El argumento file.choose() se usa para habilitar la ventana de b usque-
da del archivo dentro de las carpetas en Windows. Por ejemplo, para leer el
archivo DATOSSALARIOREALENER1990-MAYO2011.CSV en la Figura 1.9 y
crear la serie de tiempo correspondiente, usamos el siguiente c odigo:
Figura 1.9: Archivo .csv con coma en posici on decimal
C odigo R 1.2.
datos.salreal=read.csv2(file.choose(),header=F,dec=",")
datos.salreal=ts(datos.salreal,frequency=12,start=c(1990,1))
Para leer datos univariados en formato .CSV donde se us o punto para la
posici on decimal y los datos no est an encabezados por alg un ttulo, debemos
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
14 CAP
ITULO 1. INTRODUCCI
ON AL LENGUAJE R
usar
read.csv(file.choose(),header=F,dec=".")
Si el primer registro en el archivo es un ttulo o cualquier texto, usamos
read.csv(file.choose(),header=T,dec=".")
Por ejemplo, considere los datos en el archivo DATOSSALARIOREALENER1990-
MAYO2011b.CSV en la Figura 1.10. Para su lectura usamos el siguiente c odi-
go:
Figura 1.10: Archivo .CSV con punto en posici on decimal
C odigo R 1.3.
datos.salreal2=read.csv(file.choose(),header=T,dec=".")
datos.salreal2=ts(datos.salreal2,frequency=12,start=c(1990,1))
Finalmente, si los datos de la serie est an guardados en un archivo de texto
.DAT o .TXT, donde la posici on decimal es indicada con coma, usamos
read.table(file.choose(),header=F,dec=",")
read.table(file.choose(),header=T,dec=",")
Si la posici on decimal es indicada por punto basta usar el argumento dec="."
o no especicarlo:
read.table(file.choose(),header=F,dec=".")
read.table(file.choose(),header=T,dec=".")
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
1.4. LECTURA E INGRESO DE DATOS DE SERIES DE TIEMPO 15
read.table(file.choose(),header=F)
read.table(file.choose(),header=T)
Por ejemplo, considere los datos guardados sobre la serie del ndice de salario
real, en el archivo de texto DATOSSALARIOREALENER1990-MAYO2011b.TXT
y que se ilustra en la Figura 1.11.
Figura 1.11: Archivo .TXT con punto en posici on decimal
Para la lectura de este archivo usamos el siguiente c odigo:
C odigo R 1.4.
datos.salreal3=read.table(file.choose(),header=T)
datos.salreal3=ts(datos.salreal3,frequency=12,start=c(1990,1))
1.4.2. Exportaci on de resultados num ericos y gr acos del R
Los resultados num ericos de alguna funci on o comando pueden ser expor-
tados con las opciones copiar - pegar o envi andolos a archivos externos con las
funciones R sink(), write(), dump(), esta ultima guarda objetos en formato
R (matrices, vectores, arreglos, etc.). De igual manera las gr acas producidas
pueden ser guardadas en una variedad de formatos (metale, postscript, png,
pdf, bmp, tiff, jpeg), o copiadas y pegadas directamente en un editor de texto
como MS-Word. Datos y comandos guardados como objetos R (con funci on
dump()) pueden ser cargados en cualquier sesi on con la funci on source().
Para m as detalles sobre estas funciones consultar la ayuda del R usando el
comando de consulta ?nombre-funcion.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
16 CAP
ITULO 1. INTRODUCCI
ON AL LENGUAJE R
1.5. Gracando una serie de tiempo
Una vez ledo el conjunto de datos de una serie y creado el objeto de tipo
serie de tiempo con la funci on ts(), podemos hacer uso de la funci on plot(),
as,
plot(objeto-serie)
Por ejemplo, para el objeto datos.salreal3 en c odigo R 1.4, usamos
C odigo R 1.5.
win.graph(width=4,height=4,pointsize=8)
plot(datos.salreal3)
con lo cual obtenemos la Figura 1.12. El comando
permite abrir una ventana gr aca del ancho y alto especicado en pulgadas
con sus dos primeros argumentos, respectivamente, mientras que pointsize=8
indica el tama no del texto gracado.
Time
s
a
l
a
r
i
o
r
e
a
l
1990 1995 2000 2005 2010
9
0
1
0
0
1
1
0
1
2
0
1
3
0
1
4
0
1
5
0
Figura 1.12: Serie ndice mensual salario real sector manufacturero colombiano, sin trilla
de caf e, enero de 1990 a mayo de 2011.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
1.6. REGRESI

ON LINEAL M

ULTIPLE CON R 17
1.6. Regresi on lineal m ultiple con R
Recordemos el problema de regresi on lineal m ultiple:
Y =
0
+
1
X
1
+
2
X
2
+ +
k
X
k
+ E
i
donde
Y : Respuesta o variable dependiente
X
1
, X
2
, , X
k
: k variables explicatorias o independientes (no estoc asti-
cas)
0
,
1
, ,
k
: k + 1 par ametros (usualmente desconocidos)
E: Error aleatorio
1. E(E; ) = 0
2. Var (E; ) =
2
3. Adicionalmente, se asume que su distribuci on es normal, N(0,
2
)
Y N
_
0
+
1
X
1
+ +
k
X
k
,
2
_
E[Y |X
1
, X
2
, , X
k
] =
0
+
1
X
1
+ +
k
X
k
La muestra aleatoria consta de n puntos. El i- esimo punto se denota como
(X
i1
, X
i2
, , X
ik
, Y
i
) , para i = 1, 2, , n
Condici on
Cov (Y
i
, Y
j
) = 0 para todo i = j
Y
i
=
0
+
1
X
i1
+
2
X
i2
+ +
k
X
ik
+ E
i
para i = 1, 2, , n (*),
modelo (*) es aplicado al i- esimo punto.
Para las n observaciones tenemos
Y
1
=
0
+
1
X
11
+
2
X
12
+ +
k
X
1k
+ E
1
Y
2
=
0
+
1
X
21
+
2
X
22
+ +
k
X
2k
+ E
2
.
.
.
.
.
.
.
.
.
Y
n
=
0
+
1
X
n1
+
2
X
n2
+ +
k
X
nk
+ E
n
El objetivo es estimar los par ametros s a partir de este sistema de ecua-
ciones. En notaci on matricial tenemos que el sistema de ecuaciones anterior
corresponde a
Y
n1
= X
n(k+1)
(k+1)1
+E
n1
Si

denota el estimador de , se puede mostrar que

=
_
X
T
X
_
1
X
T
Y. Este
es el estimador de mnimos cuadrados y corresponde al estimador de m axima
verosimilitud bajo el supuesto de normalidad.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
18 CAP
ITULO 1. INTRODUCCI
ON AL LENGUAJE R
1.6.1. Funci on lm
Esta funci on es usada para ajustar modelos lineales. Puede usarse para
realizar regresiones, an alisis de varianza estraticada simple y an alisis de co-
varianza (aunque la funci on aov() puede dar una interface m as conveniente
para estos dos ultimos modelos). Su sintaxis general es como sigue:
lm(formula, data, subset, weights, na.action,
method = "qr", model = TRUE, x = FALSE, y = FALSE, qr = TRUE,
singular.ok = TRUE, contrasts = NULL, offset = NULL, ...)
Argumentos:
formula: Una descripci on simb olica del modelo a ser especicado.
data: Marco de datos opcional que contiene las variables en el mode-
lo. por defecto las variables son tomadas de environment(formula),
tpicamente el ambiente del cual lm es llamada, es decir, son objetos R
(vectores) de la misma dimensi on, previamente denidos.
subset: Un vector opcional para especicar un subconjunto de observa-
ciones usadas en el proceso de ajuste.
weights: Un vecto opcional con pesos a ser usados en el proceso de
ajuste. Si es especicado, mnimo cuadrados ponderados es usado con
los pesos especicados, es decir, se minimiza
n
i=1
w
i
E
2
i
; de lo contrario se
usa mnimos cuadrados ordinarios.
na.action: Una funci on que indica lo que debera hacerse cuando hay
datos faltantes o NAs. El valor por defecto es el ajustado por na.action.
method: El m etodo a ser usado para el ajuste. Actualmente s olo es so-
portado el m etodo qr; method=model.frame devuelve el marco del
modelo.
model, x, y, qr: Argumentos l ogicos. Si son iguales a TRUE los compo-
nentes correspondientes del ajuste (el marco del modelo, la matriz del
modelo, la respuesta, la descomposici on QR) son devueltos con esta op-
ci on.
singular.ok: Argumento l ogico, por defecto es TRUE. FALSE no est a im-
plementado.
contrasts: Una lista opcional. Ver contrasts.arg de
model.matrix.default.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
1.6. REGRESI

ON LINEAL M

ULTIPLE CON R 19
offset: Puede usarse para especicar un par ametro conocido en forma
apriori y que ha de ser incluido en el predictor lineal durante el ajuste.
Uno o m as t erminos offsets pueden ser incluidos en la f ormula y si
se especica m as de uno entonces su suma es usada.
...: Argumentos adicionales.
Detalles:
Los modelos para lm se especican simb olicamente. El modelo usual tiene
la forma respuesta t erminos donde respuesta es el vector de respuesta y
t erminos es una serie de predictores lineales. Estos t erminos se especican
de la forma primero+segundo indicando todos los t erminos en primero jun-
to con todos los t erminos en segundo, con duplicaciones siendo removidas.
Una especicaci on de la forma primero:segundo indica que debe incluirse
el conjunto de t erminos obtenidos al tomar las interacciones de todos los
t erminos en primero con todos los t erminos en segundo. La especicaci on
primero*segundo indica el cruce de primero y segundo. Esto es lo mismo
que primero + segundo + primero:segundo. Una f ormula tiene implcito el in-
tercepto. Para removerlo se usa y x - 1 o y 0 + x. Ver formula para
m as detalles sobre f ormulas permitidas.
Las funciones summary y anova son usadas para obtener e imprimir un re-
sumen y una tabla de an alisis de varianzas de los resultados. Las funciones
gen ericas extractoras coefficients, effects, fitted.values y residuals
extraen varias caractersticas utiles de los valores retornados por lm.
Un objeto de clase lm es una lista con los siguientes componentes, entre
otros:
coefcients: Un vector con los coecientes
residuals: Los residuales, es decir la respuesta menos valores ajustados.
tted.values: Los valores ajustados.
rank: El grado del modelo lineal ajustado.
weights: Pesos si se hizo ajuste ponderado.
df.residual: Grados de libertad de los residuales.
formula: La f ormula dada.
terms: El objeto terms usado.
contrasts: S olo donde sea relevante, los contrastes usados.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
20 CAP
ITULO 1. INTRODUCCI
ON AL LENGUAJE R
xlevels: S olo donde sea relevante, un registro de los niveles de los factores
usados en el ajuste.
y: Si es requerido o invocado, la respuesta usada.
x: Si es requerido o invocado, la matriz modelo usada.
model: El marco de modelo usado.
Ver tambi en: summary.lm, anova.lm, coefficients, effects, residuals,
fitted.values, predict.lm (para predicci on e intervalos de predicci on),
lm.influence (para diagn osticos de regresi on) y glm (para modelos lineales
generalizados).
Formulaci on de un modelo en R
Supongamos que y, x, x
1
, x
2
, son variables num ericas, X es una matriz y
A, B, C, son factores. La siguiente tabla presenta las f ormulas utilizadas en
R para especicar los modelos descritos:
F ormula
y x Ambas f ormulas denen una regresi on lineal
y 1 + x simple. El segundo tiene explcito el intercepto.
y -1 + x Regresi on simple a trav es del origen.
y x -1
log(y) x Regresi on simple con la respuesta transformada.
y x1 + x2 Regresi on m ultiple con dos variables explicativas.
Se incluye el intercepto implcitamente.
y poly(x,2) Regresi on polinomial de grado 2. Utiliza polinomios
ortogonales para la construcci on de la matriz de dise no.
y x+ I(x2) Regresi on polinomial de grado 2. Utiliza
las potencias explcitas
y X + poly(x,2) Modelo de regresi on m ultiple de y con la
matriz de dise no X y con un polinomio
en x de grado 2.
y A An alisis de varianza con un factor
y A + x An alisis de covarianza con A como factor y x
como covariable.
y A + B An alisis de varianza con dos factores
A y B sin interacci on
y A
*
B An alisis de varianza con interacci on.
y A + B + A:B
y B%in%A Modelo encajado del factor B en A.
y A/B
y (A + B + C)2 Modelo de tres factores que contiene los efectos
y A
*
B
*
C -A:B:C principales las interacciones entre pares de factores.
y A
*
x Modelos de regresi on simples separados dentro de
y A/x los diferentes niveles de A.
y A/(1+x) - 1 Modelos de regresi on simples que produce
en forma explcita diferentes pendientes e
interceptos como niveles tenga A
y A
*
B + Error(C) Un experimento con dos tratamientos, A y B,
y un error de estrato determinado por C.
Por ejemplo, un experimento split-plot.
Ejemplo 1:
Cuatro pruebas (X1, X2, X3, X4) para selecci on de personal son aplicadas a
un grupo de 20 aspirantes y se registran los respectivos puntajes. Despu es de
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
1.6. REGRESI

ON LINEAL M

ULTIPLE CON R 21
2 a nos de contrataci on estos 20 empleados son clasicados de acuerdo a la
puntuaci on de la aptitud (Y ) exhibida para el trabajo. Los datos se presentan
el la siguiente tabla:
Y X1 X2 X3 X4
94 122 121 96 89
71 108 115 98 78
82 120 115 95 90
76 118 117 93 95
111 113 112 109 109
64 112 96 90 88
109 109 129 102 108
104 112 119 106 105
80 115 101 95 88
73 111 95 95 84
127 119 118 107 110
88 112 110 100 87
99 120 89 105 97
80 117 118 99 100
99 109 125 108 95
116 116 122 116 102
100 104 83 100 102
96 110 101 103 103
126 117 120 113 108
58 120 77 80 74
A continuaci on un programa R para el an alisis por regresi on de estos datos
C odigo R 1.6.
###LECTURA DE LOS DATOS, ORDEN DE COLUMNAS: Y, X1, X2, X3, X4###
datos=data.frame(matrix(scan(),ncol=5,byrow=T))
94 122 121 96 89
71 108 115 98 78
82 120 115 95 90
76 118 117 93 95
111 113 112 109 109
64 112 96 90 88
109 109 129 102 108
104 112 119 106 105
80 115 101 95 88
73 111 95 95 84
127 119 118 107 110
88 112 110 100 87
99 120 89 105 97
80 117 118 99 100
99 109 125 108 95
116 116 122 116 102
100 104 83 100 102
96 110 101 103 103
126 117 120 113 108
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
22 CAP
ITULO 1. INTRODUCCI
ON AL LENGUAJE R
58 120 77 80 74
#ASIGNANDO NOMBRES A COLUMNAS EN CONJUNTO DE DATOS
names(datos)=c("Y","X1","X2","X3","X4")
datos
#DIBUJANDO UNA MATRIZ DE GR
AFICOS DE DISPERSI
ON
pairs(datos)
#Anclando variables guardadas en datos para disponibilizarlas
attach(datos)
###AJUSTE MRLM###
#Una manera
modelo=lm(YX1+X2+X3+X4)
#o bien, la regresion de Y vs. todas las demas variables en dataframe datos
modelo=lm(Y.,datos)
#para ver el listado de objetos guardados en modelo
names(modelo)
##IMPRIMIENDO EN PANTALLA VARIOS RESULTADOS RELATIVOS AL MODELO AJUSTADO###
#Ver la tabla de parametros estimados
summary(modelo)
#Ver tabla de intervalos de confianza para parametros estimados
confint(modelo)
#Ver tabla de pruebas secuenciales o con sumas de cuadrados SS1
anova(modelo)
#Ver tabla de pruebas parciales o con sumas de cuadrados SS2
library(car)
Anova(modelo)
#Desanclando variables guardadas en datos
detach(datos)
##GRAFICOS RESIDUALES ESTUDENTIZADOS Y DE NORMALIDAD##
#Formando un data frame con los valores ajustados, los predictores y residuos
#estudentizados
datos.modelo=data.frame(cbind(Yhat=fitted(modelo),datos[-1],res_estudent=rstudent(modelo)))
#Creando una ventana grafica de ancho 17 y alto 13 pulgadas
#Dividiendo la ventana en una matriz de 2x3 para acomodar las seis graficas de
#residuales incluyendo el grafico de normalidad
nf=layout(rbind(c(1,1,2,2,3,3),c(4,4,5,5,6,6)))
attach(datos.modelo)
plot(Yhat,res_estudent,ylab="Residuos estudentizados",xlab="Valores ajustados",cex.lab=2,cex=2)
abline(h=0,lty=2,lwd=2)
abline(h=-2,lty=2,col="red",lwd=2)
abline(h=2,lty=2,col="red",lwd=2)
plot(X1,res_estudent,ylab="Residuos estudentizados",xlab="X1",cex.lab=2,cex=2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
1.6. REGRESI

ON LINEAL M

ULTIPLE CON R 23
#Grafico de probabilidad normal sobre residuales estudentizados
qqnorm(res_estudent,ylab="Residuales estudentizados",cex.lab=2,cex=2)
qqline(res_estudent,lty=2,lwd=2)
detach(datos.modelo)
#o bien, creando cada grafico por separado
win.graph()
plot(fitted(modelo),rstudent(modelo),ylab="Residuos estudentizados",
xlab="Valores ajustados",cex.lab=2,cex=2)
win.graph()
plot(datos$X1,rstudent(modelo),ylab="Residuos estudentizados",xlab="X1",cex.lab=2,cex=2)
win.graph()
qqnorm(rstudent(modelo),ylab="Residuales estudentizados",cex.lab=2,cex=2)
qqline(rstudent(modelo),lty=2,lwd=2)
##TEST DE NORMALIDAD ##
#sobre residuales comunes
shapiro.test(residuals(modelo))
#o bien, sobre residuales estudentizados
shapiro.test(rstudent(modelo))
##INTERVALOS DE PREDICCION PARA RESPUESTA DENTRO DE LA MUESTRA##
predict(modelo,interval="prediction")
#INTERVALOS DE CONFIANZA PARA RESPUESTA MEDIA DENTRO DE LA MUESTRA##
temp4=predict(modelo,interval="confidence")
##PREDICCIONES Y SUS INTERVALOS EN DOS OBSERVACIONES NUEVAS##
nuevo=data.frame(X1=c(100,101),X2=c(121,115),X3=c(97,101),X4=c(75,98))
predict(modelo,newdata=nuevo,interval="prediction")
Nota: La librera car debe ser descargada del CRAN.
Ejemplo 2: (Regresi on con variables indicadoras)
Un gran almac en realiz o un experimento para investigar los efectos de los
gastos por publicidad sobre las ventas semanales de sus secciones de ropa
para caballeros (A), para ni nos (B) y para damas (C). Se seleccionaron al azar 5
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
24 CAP
ITULO 1. INTRODUCCI
ON AL LENGUAJE R
semanas para observaci on en cada secci on, y un presupuesto para publicidad
(X1, en cientos de d olares) se asign o a cada una de las secciones. Las ventas
semanales (en miles de d olares), los gastos de publicidad en cada uno de las
tres secciones en cada una de las cinco semanas del estudio se listan en la
siguiente tabla.
SEC X1 Y
A 5.2 9
A 5.9 10
A 7.7 12
A 7.9 12
A 9.4 14
B 8.2 13
B 9.0 13
B 9.1 12
B 10.5 13
B 10.5 14
C 10.0 18
C 10.3 19
C 12.1 20
C 12.7 21
C 13.6 22
A continuaci on un programa R para la regresi on, modelo con interacci on
entre variable X1 y SEC, y modelo sin interacci on
C odigo R 1.7.
datos2=data.frame(scan(what=list("",0,0)))
A 5.2 9
A 5.9 10
A 7.7 12
A 7.9 12
A 9.4 14
B 8.2 13
B 9.0 13
B 9.1 12
B 10.5 13
B 10.5 14
C 10.0 18
C 10.3 19
C 12.1 20
C 12.7 21
C 13.6 22
names(datos2)=c("SEC","X1","Y")
###GRAFICANDO Y VS. X1 SEG
UN SECCION###
attach(datos2)
plot(X1,Y,pch=as.numeric(SEC),col=as.numeric(SEC),xlab="X1",ylab="Y",cex=2,cex.lab=2)
legend("topleft",legend=c("A","B","C"),pch=c(1:3),col=c(1:3),cex=2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
1.6. REGRESI

ON LINEAL M

ULTIPLE CON R 25
#o bien:
plot(datos2$X1,datos2$Y,pch=as.numeric(datos2$SEC),col=as.numeric(datos2$SEC),xlab="X1",
ylab="Y",cex=2,cex.lab=2)
legend("topleft",legend=c("A","B","C"),pch=c(1:3),col=c(1:3),cex=2)
###MODELO GENERAL: RECTAS DIFERENTES TANTO EN PENDIENTE COMO EN INTERCEPTO###
modelo2=lm(YX1
*
SEC)
summary(modelo2)
confint(modelo2)
###MODELO CON RECTAS DIFERENTES S
OLO EN EL INTERCEPTO###
modelo3=lm(YX1+SEC)
summary(modelo3)
confint(modelo3)
###CAMBIANDO NIVEL DE REFERENCIA DE LA VARIABLE CUALITATIVA###
###MODELO CON RECTAS DIFERENTES S
OLO EN EL INTERCEPTO###
SEC=relevel(SEC,ref="C")
modelo4=lm(YX1+SEC,datos2)
summary(modelo4)
confint(modelo4)
detach(datos2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
26 CAP
ITULO 1. INTRODUCCI
ON AL LENGUAJE R
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Captulo 2
El an alisis de series de tiempo
2.1. Introducci on
El an alisis de series de tiempo consiste en el desarrollo de modelos estadsti-
cos para explicar el comportamiento de una variable aleatoria que vara en el
tiempo, con el n de estimar pron osticos futuros de dicha variable con nes de
planeaci on y toma de decisiones.
El pron ostico realizado se basa en la estructura o comportamiento pasa-
do de la serie, suponiendo que este se conserva en el futuro. Los m etodos de
pron ostico son una rama particular de la estadstica aplicada y por lo tan-
to re unen sus propios conceptos y m etodos especcos. Los pron osticos son
adem as una de las principales herramientas de tipo cuantitativo aplicadas en
los negocios en sus procesos de planeaci on y toma de decisiones, y tambi en
han sido utilizados en las ciencias sociales y el area militar.
Pronosticar puede denirse como el esfuerzo de prever eventos futuros ex-
aminando el pasado (Gaynor y Kirkpatrick [4]), con en n de controlar el
riesgo y la incertidumbre. Sin embargo, las t ecnicas de pron ostico pueden es-
tar basadas tambi en en la experiencia o la opini on de expertos, o en modelos
matem aticos (simulaciones din amicas) que describen los patrones pasados.
La mayora de los pron osticos se basan en el supuesto de que la variable o
evento a pronosticar es afectada o por el tiempo o por un conjunto de vari-
ables con las cuales puede tener ya sea una relaci on de causa efecto o bien,
una relaci on de tendencia.
El estudio de las series de tiempo adem as de permitir formular modelos
y pron osticos, tambi en permite evaluar los efectos de acciones o decisiones
pasadas, conocidas como intervenciones hechas sobre la serie. Estas inter-
venciones pueden tener un efecto moment aneo o bien un efecto permanente
que modica la estructura de la serie de tiempo intervenida.
Es importante reconocer el papel del pron ostico en la organizaci on al igual
que los m etodos de pron osticos a aplicar. Una organizaci on establece metas y
objetivos, trata de predecir los factores ambientales de su negocio, y selecciona
las acciones que espera le lleven a sus metas.
Las areas empresariales en las cuales los pron osticos juegan un papel im-
27
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
28 CAP
ITULO 2. EL AN
ALISIS DE SERIES DE TIEMPO

portante son (Makridakis et.al [7]):
Programaci on de los recursos existentes (Pron osticos de corto pla-
zo): Para el uso eciente de los recursos se requiere programar la pro-
ducci on, el transporte, el efectivo, el personal, etc. Para ello el pron ostico
del nivel de la demanda de los productos, materiales, mano de obra, la
nanciaci on requerida, etc., son esenciales para la buena programaci on
de los recursos existentes.
Adquisici on de recursos adicionales (pron osticos de mediano plazo):
El lead time para la adquisici on de materia prima, la contrataci on de per-
sonal, la compra de maquinaria y equipo, etc. puede variar desde das a
varios a nos. Se requiere pues el pron ostico para establecer los requerim-
ientos futuros de recursos.
Determinaci on de qu e recursos son deseados (pron osticos de largo
plazo): Todas las empresas u organizaciones requieren determinar los
recursos que desean o necesitan a largo plazo. Decisiones como estas
dependen de las oportunidades de mercado, de los factores ambientales
y de sus recursos internos.
Las empresas deben desarrollar m ultiples aproximaciones para pronosticar
eventos inciertos y construir un sistema para pronosticar. Esto a su vez exige
conocimiento y habilidad en al menos las siguientes areas:
Identicaci on y denici on de problemas a pronosticar
Aplicaci on de una variedad de m etodos de pron ostico
Procedimientos para seleccionar los m etodos apropiados para una situaci on
especca
Un soporte organizacional para aplicar y usar m etodos de pron ostico for-
malizados
2.2. Clases de pron osticos - pron osticos cuantitativos
B asicamente, la gran clasicaci on de los m etodos de pron ostico es seg un
si es cualitativo (cu ando pr acticamente no se cuentan con datos hist oricos)
- tecnol ogico o cuantitativo (se disponen de datos hist oricos). En este curso
s olo se abordar an algunos m etodos cuantitativos. Los m etodos cuantitativos
pueden aplicarse cuando se dan las siguientes tres condiciones:
1. Se dispone de informaci on hist orica
2. La informaci on disponible puede cuanticarse en forma de datos num eri-
cos
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
2.3. VENTAJAS Y DESVENTAJAS DE LOS M
ETODOS CUANTITATIVOS 29
3. Puede asumirse que algunos aspectos de los patrones dados en el pasado
continuar an en el futuro (supuesto de continuidad).
Los m etodos cuantitativos varan considerablemente, y han sido desarrollados
por diversas disciplinas para diferentes prop ositos, sus costos y precisiones
varan y deben ser consideradas al momento de seleccionarlos.
El pron ostico formal implica objetividad y emplea un m etodo estadstico para
obtener pron osticos usando una base regular con fechas especcas de inicio
y n (Campos Santill an [1]). Involucran tambi en la extrapolaci on pero de una
manera sistem atica buscando minimizar el error de pron ostico.
Los m etodos cuantitativos de pron ostico se dividen en los m etodos de Series
de tiempo (suavizamiento, descomposici on, m etodos Box - Jenkins) y m etodos
causales o econom etricos (regresi on y correlaci on). Los m etodos de series de
tiempo est an basados en el an alisis de una secuencia cronol ogica de observa-
ciones de la variable de inter es y bajo el supuesto de continuidad antes men-
cionado, realiza la predicci on del futuro basado en datos hist oricos. Por tanto,
el objetivo de estos m etodos es descubrir el patr on subyacente en la serie de
datos hist oricos y extrapolar ese patr on al futuro. Los datos pueden ser an-
uales, trimestrales, mensuales, semanales, diarios, horarios, etc., la variable
de inter es puede ser de naturaleza macroecon omica, tal como una medida de
agregaci on de la economa o la industria, o de naturaleza micro econ omica
como aquellas medidas para una empresa.
Los modelos causales por su parte asumen que el factor o variable a ser
pronosticada (variable dependiente) mantiene una relaci on de causa -efecto con
una o m as variables independientes o predictoras, por tanto, el comportamien-
to de estas ultimas permite pronosticar el comportamiento de la variable de-
pendiente. Por ejemplo, las ventas pueden ser explicadas por los gastos en
publicidad, el precio de ventas, el ingreso disponible de los consumidores, el
nivel de competencia en el mercado, etc. Por tanto, el modelo causal tiene como
prop osito descubrir la forma (funci on matem atica) de esa relaci on y usarla para
pronosticar los valores futuros de la variable dependiente.
Puede verse entonces que la diferencia fundamental entre los m etodos de
series de tiempo y los causales consiste en que los primeros tratan la informa-
ci on como una caja negra sin intentar descubrir los factores que est an afectando
la variable que se analiza, el sistema es pues un proceso no identicado.
2.3. Ventajas y desventajas de los m etodos cuantitativos de
pron ostico
En general los m etodos cuantitativos exhiben las siguientes ventajas:
1. Los pron osticos est an basados en valores predeterminados y pueden ser
por tanto objetivos
2. Es posible medir la exactitud de los pron osticos.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
30 CAP
ITULO 2. EL AN

3. Despu es de construir los modelos, se puede ahorrar tiempo en la gen-
eraci on de los pron osticos y utilizar repetitivamente dichos modelos.
4. Se pueden obtener pron osticos puntuales (un valor especco para cada
periodo) o por intervalos (rango de valores basados en un intervalo de
conanza).
Pero los m etodos cuantitativos exhiben tambi en desventajas, tales como:
1. S olo son apropiados para pron osticos de corto y mediano plazo con una
precisi on razonable.
2. No hay un m etodo para contabilizar las inuencias externas o los cam-
bios que pudieran afectar los resultados. Un pron ostico cuantitativo puede
ser muy bueno si las condiciones que han existido hasta el momento se
mantienen; sin embargo, un cambio inducido por fuerzas externas en
cierto punto del horizonte de pron ostico puede hacer bastante malo al
pron ostico.
2.4. La precisi on de un pron ostico vs. el horizonte de tiem-
po
Un aspecto fundamental a considerar en los pron osticos es la precisi on, la
cual es una funci on inversa del horizonte de tiempo (Campos Santill an [1]):
mientras m as cercano en el tiempo est a el futuro a pronosticar, mayor exacti-
tud del pron ostico. Los pron osticos de largo plazo suelen ser m as imprecisos,
debido a variaciones inacionarias y factores macroecon omicos imprevistos
que introducen incertidumbre e inexactitud. Los m etodos cuantitativos deben
ser acompa nados de los cualitativos para un mejor pron ostico del futuro le-
jano.
En los pron osticos de mediano plazo los factores macroecon omicos may-
ores tienden a ser menos inuyentes pero su impredecibilidad hace que deban
ser tenidos en cuenta. A mediano plazo los factores que m as causan inexac-
titud son las variaciones comerciales especcas del producto (la moda) y la
estacionalidad, que obligan a revisar peri odicamente los pron osticos dentro
del ciclo de mediano plazo.
El corto plazo es afectado positivamente por la inercia de muchas de las
actividades econ omicas en las cuales los modelos de series de tiempo pueden
generar pron osticos m as o menos exactos.
2.5. Las tareas en la realizaci on de un pron ostico
De acuerdo a Gaynor y Kirkpatrick [4], se deben establecer las siguientes
prioridades en la construcci on de un modelo de pron ostico:
Tarea 1: Determinar el objetivo primario del proyecto de pron ostico y especicar
claramente la variable o variables a ser pronosticadas, la periodicidad del
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
2.6. LA METODOLOG
IA DE LOS DATOS DE SERIES DE TIEMPO 31

pron ostico (semanales, mensuales, trimestrales, anuales, etc.), la longi-
tud de los pron osticos (inmediatos, corto, mediano o largo plazo) y si
relaciones causales son importantes en el pron ostico.
Tarea 2: Determinar la disponibilidad de datos chequeando todas las fuentes pri-
marias apropiadas de datos, tanto p ublicas como privadas.
Tarea 3: Recoger los datos, y asegurarse que la tabulaci on de estos es comparable
y consistente sobre el tiempo.
Tarea 4: Establecer la lnea de tiempo mediante consideraci on cuidadosa del tipo
de modelo de pron ostico, incluyendo el n umero de observaciones requeri-
das para la estimaci on del modelo y el n umero de perodos de tiempo en
el periodo de pron ostico ex ante (periodo futuro del cual no se tienen
observaciones)
Tarea 5: Gracar los datos y examinar sus patrones, para hacer una determi-
naci on nal de cu al tipo de modelo es apropiado considerar.
Tarea 6: Estimar los modelos seleccionados.
Tarea 7: Evaluar el modelo sobre el periodo de estimaci on y seleccionar el mejor
modelo comparando tanto las medidas resumen de pron ostico y los gr a-
cos de los valores actuales versus los pronosticados y los errores. Exami-
nar los gr acos para la habilidad del modelo para capturar los puntos de
cambio.
Tarea 8: Evaluar el modelo usando el pron ostico ex post (Periodo de tiempo de
observaciones conocidas despu es del n del periodo muestral usado en
el ajuste). Si es posible, usar tanto medidas de resumen de pron ostico y
gr acos.
Tarea 9: Generar el pron ostico ex ante con lmites de conanza apropiados y
preparar la presentaci on del pron ostico.
Tarea 10: Despu es de establecer el modelo, hacer seguimiento peri odico al modelo
actualiz andolo y revalu andolo.
2.6. La metodologa de los datos de series de tiempo y pron osti-
cos
En la construcci on de un modelo de pron ostico, por un m etodo cuantitati-
vo, se toma una muestra de observaciones del conjunto de datos disponibles.
El m etodo de recolecci on de los datos y los pron osticos dependen de los fac-
tores representados a continuaci on:
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
32 CAP
ITULO 2. EL AN

tiempo +
Y
tm

Y
0
Y
1

Y
n
Y
n+1

Y
N
Y
N+1

Y
N+k
Y
1
Y
n
Y
inicio
Y
nal
Y
N
Pron osticos dentro
de la muestra
Datos hist oricos
Y
t
Muestra
Y
t
Perodo de
backasting
Perodo de
pron ostico
Pron ostico ex post
Pron ostico ex ante
Figura 2.1: Lnea de tiempo vs. ajuste y pron ostico de una serie de tiempo (Gaynor y
Kirkpatrick [4])
Datos hist oricos: Corresponden desde el valor del periodo de tiempo de
inicio Y
inicio
hasta el valor del periodo de tiempo nal Y
nal
. El tiempo de inicio
es el periodo en el cual la recolecci on de datos sobre la variable comienza y
el tiempo nal, corresponde al tiempo de la observaci on m as reciente de esa
variable. Este ultimo periodo debe ser considerado como el hoy.
Periodo muestral para an alisis: Cubre los valores Y
1
, , Y
n
, es el periodo
sobre el cual ser a construido y estimado el modelo de pron ostico. Y
inicio
y Y
1
no necesariamente corresponden. En la Figura 2.1 se ilustra un caso en el
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
2.6. LA METODOLOG
IA DE LOS DATOS DE SERIES DE TIEMPO 33

cual la muestra es un subconjunto de los datos hist oricos. La raz on por la
cual Y
inicio
y Y
1
pueden diferir es que en alg un punto del tiempo pueden haber
ocurrido cambios estructurales o en las relaciones subyacentes que modican
el patr on de los datos. Los modelos de series son construidos bajo el supuesto
de continuidad, en tanto que los modelos causales son generados con base en
presunciones sobre relaciones de estructura y comportamiento permanentes
sobre un periodo de tiempo, entonces puede ser que el n umero de periodos de
tiempo desde un cambio identicado sobre la estructura o comportamiento,
no es suciente para la estimaci on de la serie y/o del modelo causal. En ese
caso debe tenerse cuidado, y mantenerse en mente los cambios ocurridos.
El periodo muestral concluye con la observaci on Y
n
, pero este periodo po-
dra extenderse hasta la observaci on Y
nal
, es decir Y
n
= Y
nal
. Aunque po-
dra procederse de tal manera cuando hay muchas observaciones entre Y
n
y
Y
nal
, en la pr actica no se procede as, primero porque muchas de las vari-
ables econ omicas son entregadas como estimaciones sujetas a una posterior
revisi on, y estos datos revisados pueden ser muy diferentes de los estimados
preliminarmente, por esto no se incluyen las estimaciones en la muestra para
el ajuste del modelo de pron ostico. En segundo lugar, el proceso de reestimar
y probar continuamente un modelo de pron ostico, consume tiempo y costos.
Por tanto la exactitud de los modelos es monitoreada constantemente y s olo
despu es que ciertos est andares de calidad subjetivos dejen de ser satisfechos,
entonces el modelo es reestimado y probado.
Periodo de estimaci on: En este perodo se generan los valores de pron osti-
co

Y
1
,

Y
2
,

Y
n
, los cuales conforman el pron ostico del modelo dentro de la
muestra. A partir de los valores actuales y pronosticados para Y
t
, es posible
calcular los errores de ajuste e
1
, , e
n
del modelo, y por tanto la exactitud de
este (dentro del periodo de estimaci on). Todos los valores m as all a de la obser-
vaci on Y
n
, deben ser pronosticados, lo que en la lnea de tiempo se denomina
periodo de pron ostico. Todos los pron osticos generados dentro de este periodo
se conocen como pron osticos fuera de la muestra.
Partes o periodos dentro del periodo de pron ostico: El periodo de pron osti-
co es dividido en dos sub periodos:
Periodo de pron ostico ex post: Periodo que va desde la primera obser-
vaci on despu es del nal del periodo muestral (
Y
n+1
) hasta la observaci on m as
reciente (
Y
N
). Se caracteriza porque el investigador dispone de valores actuales
de la variable de la serie de tiempo. Con las observaciones de este periodo es
posible determinar la exactitud del modelo fuera de la muestra usando s olo
los valores actuales y pronosticados de Y
t
dentro del periodo de pron osticos ex
post.
Si la exactitud del modelo fuera de la muestra es cuestionable, se tienen
dos caminos: buscar un modelo alternativo con mayor exactitud o reesti-
mar el modelo actual extendiendo el periodo de estimaci on hasta el periodo
ex post. En este ultimo caso se generaran los pron osticos muestrales desde
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
34 CAP
ITULO 2. EL AN
Y
1
,

Y
2
, ,

Y
N
y no se tendra un pron ostico ex post.
Periodo de pron ostico ex ante: Periodo de tiempo en el cual no se tienen
observaciones de la serie de tiempo de la variable de estudio o de cualquier otra
variable importante. En ese caso se pronostica dentro del futuro. Los pron osti-
cos de este periodo corresponden a

Y
N+1
,

Y
N+2
, ,

Y
N+k
, para las cuales no es
posible determinar a priori la exactitud de los pron osticos ex ante.
Periodo anterior a Y
inicio
: Caracterizado por la ausencia de datos sobre la
variable. Es posible realizar backasting (estimaci on de valores pasados y de-
sconocidos) de valores de la serie, lo cual es hecho en ocasiones (seg un el
modelo o metodologa aplicada) cuando el periodo muestral no contiene su-
cientes observaciones para el an alisis o ajuste.
2.7. Estudio descriptivo de las series de tiempo - compo-
nentes en una serie de tiempo
Para la selecci on apropiada de los modelos para una serie de tiempo es
preciso identicar los patrones b asicos o componentes en esta. Estas compo-
nentes son:
Componente horizontal, irregular o error (E
t
): Tambi en es llamado rui-
do blanco, caracterizado por uctuaciones err aticas sin un patr on denido
alrededor de una media constante. Muy a menudo estas uctuaciones son
debidas a eventos externos que s olo ocurren en un tiempo y de forma im-
predecible. Se dice de una serie que s olo exhibe tal comportamiento que es
estacionaria en su media. Tal serie por ejemplo, aparece o es asumida en las
situaciones de control estadstico de procesos.
Componente de tendencia (T
t
): Patr on de largo plazo caracterizado por la
persistencia a un crecimiento o a un decrecimiento de los valores de la serie,
por tanto reeja el crecimiento o declinaci on de la serie.
Componente estacional (S
t
): Patr on de cambio regular que se completa
dentro de un a no calendario y que se repite sobre una base anual. Este com-
portamiento es debido a factores tales como los consumos o las estaciones
clim aticas, es decir factores que ocurren con una periodicidad bien sea sem-
anales, mensuales, trimestrales, o semestrales. Las ventas de productos como
bebidas, helados, prendas de vestir, juguetera, etc. est an sujetos a este tipo
de patrones.
Componente cclica (C
t
): Cambios o movimientos hacia arriba y hacia aba-
jo que ocurren sobre una duraci on de 2 o m as a nos, debido a la inuencia de
uctuaciones econ omicas de largo plazo como las asociadas con los ciclos de
negocios. Por ejemplo las ventas de propiedad raz, el ciclo de negocios medido
en t erminos del PIB. Un ciclo es medido desde un pico a otro o desde una
depresi on a otra, de modo que un periodo de prosperidad es seguido por un
periodo de recesi on, lo cual hace que cambie la tendencia de los datos hacia
arriba (expansi on) a una tendencia hacia abajo (contracci on); el movimien-
to hacia abajo alcanza su punto m as mnimo luego de lo cual comienza el
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
2.7. ESTUDIO DESCRIPTIVO DE LAS SERIES DE TIEMPO 35
movimiento hacia arriba hasta un punto m aximo. Los ciclos son las compo-
nentes m as difciles de pronosticar debido a sus marcos de tiempo m as largos.
La diferencia entre ciclos y patrones estacionales es que los segundos tienen
una longitud constante que se repite sobre una base regular peri odica. Mien-
tras que los ciclos varan en longitud y magnitud. El prop osito de los m etodos
de series de tiempo es eliminar las irregularidades e inuencias estacionales y
proyectar la serie de datos m as bien con base en sus patrones de tendencia/-
ciclo (Campos Satill an [1]).
Una serie de tiempo puede ajustarse a uno de los cuatro patrones descritos
o ser una combinaci on de todos ellos, bien sea en forma aditiva (serie de com-
ponentes aditivas),
Y
t
= T
t
+ S
t
+ E
t
(2.1)
o en forma multiplicativa (serie de componentes multiplicativas),
Y
t
= T
t
S
t
E
t
. (2.2)
De acuerdo a los modelos generales plantados en las ecuaciones (2.1) y
(2.2), los ciclos y la componente de error quedan mezcladas en E
t
.
El an alisis gr aco de las series de tiempo es una buena manera de identi-
car estas componentes. La Figura 2.2 presenta una serie estacional aditiva
9
0
1
0
0
1
1
0
1
2
0
1
3
0
o
b
s
e
r
v
e
d
1
0
0
1
1
0
1
2
0
1
3
0
t
r
e
n
d
2
0
2
s
e
a
s
o
n
a
l
2
0
2
4
1990 1992 1994 1996 1998 2000 2002
r
a
n
d
o
m
Time
Decomposition of additive time series
Serie original
Componente de tendencia
Componente
estacional
Componente de error
(incluye ciclos)
Figura 2.2: Descomposici on serie de tiempo aditiva con funci on R decompose
(
Indice mensual de salario real sector industrial, enero de 1990 - noviembre

de 2001) y sus componentes obtenidas por un m etodo de descomposici on:
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
36 CAP
ITULO 2. EL AN

Tendencia
Estacionalidad
Error
En R podemos obtener la descomposici on de una serie a trav es de las fun-
ciones decompose y stl:
C odigo R 2.1.
salario<-scan()
94.08 102.23 103.99 103.21 102.59 100.95
101.67 101.71 99.93 100.11 99.65 89.81
90.71 99.88 100.75 101.67 100.58 98.82
98.21 98.96 99.30 98.40 99.17 91.12
90.85 102.67 104.36 101.71 101.48 100.29
100.33 102.24 101.24 102.02 103.79 95.95
96.52 106.55 108.50 108.04 108.68 108.34
108.14 109.75 108.28 108.76 109.36 101.03
101.01 109.63 111.20 109.67 110.24 110.94
110.38 111.50 111.73 112.94 113.87 107.39
103.38 113.84 114.96 116.00 113.54 113.25
113.35 114.88 113.81 116.03 117.50 109.50
105.87 117.69 119.22 118.80 118.48 116.65
116.54 117.03 116.04 116.87 118.60 108.91
109.53 120.21 122.15 122.48 124.30 121.99
122.20 121.41 120.69 122.72 124.70 115.65
114.15 123.45 124.66 122.08 121.64 119.48
120.02 122.33 121.50 122.45 123.63 115.43
111.66 124.21 126.22 126.88 126.88 127.33
127.27 128.88 128.54 130.28 132.15 124.65
119.19 131.69 130.87 129.95 130.83 131.23
132.64 133.50 132.98 134.38 135.12 130.16
121.78 132.44 132.89 130.83 131.41 130.40
131.79 132.46 131.00 132.46 133.61
salario<-ts(salario,frequency=12,start=c(1990,1))
#Descomposicion de la serie mediante la funcion decompose
descom<-decompose(salario,type="additive")
plot(descom)
#Descomposicion de la serie mediante la funcion stl
descom2<-stl(salario,s.window="periodic")
plot(descom2)
Las funciones decompose (ver Ap endice A.1) y stl (ver Ap endice A.3) estiman
los efectos de tendencia y estacionales usando m etodos basados en promedios
m oviles y polinomiales, respectivamente. Podemos valernos de estas funciones
como m etodos descriptivos utiles en la denici on de un modelo estadstico.
En la Figura 2.3 puede apreciarse la descomposici on de la serie de salario
real presentada anteriormente en la Figura 2.2, esta vez, usando la funci on R
stl. Una serie de componentes multiplicativas es presentada en la Figura 2.4,
esta serie corresponde a ventas de licor en Estados Unidos (miles de d olares
nominales), enero de 1967 - diciembre de 1994.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
9
0
1
0
0
1
1
0
1
2
0
1
3
0
d
a
t
a
2
0
2
s
e
a
s
o
n
a
l
1
0
0
1
1
0
1
2
0
1
3
0
t
r
e
n
d
2
0
2
4
1990 1992 1994 1996 1998 2000 2002
r
e
m
a
i
n
d
e
r
time
Serie original
Componente
estacional
Componente de error
(incluye ciclos)
Figura 2.3: Descomposici on serie de tiempo aditiva con funci on R stl
5
0
0
1
5
0
0
2
5
0
0
o
b
s
e
r
v
e
d
6
0
0
1
0
0
0
1
4
0
0
1
8
0
0
t
r
e
n
d
0
.
9
1
.
1
1
.
3
s
e
a
s
o
n
a
l
0
.
9
0
0
.
9
5
1
.
0
0
1
.
0
5
1970 1975 1980 1985 1990 1995
r
a
n
d
o
m
Time
Decomposition of multiplicative time series
Serie original
Componente
estacional
Componente de error
(incluye ciclos)
Figura 2.4: Descomposici on serie de tiempo multiplicativa con funci on R decompose
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
38 CAP
ITULO 2. EL AN

C odigo R 2.2.
licor<-scan()
480 467 514 505 534 546 539 541 551 537 584 854
522 506 558 538 605 583 607 624 570 609 675 861
605 537 575 588 656 623 661 668 603 639 669 915
643 563 616 645 703 684 731 722 678 713 725 989
687 629 687 706 754 774 825 755 751 783 804 1139
711 693 790 754 799 824 854 810 798 807 832 1142
740 713 791 768 846 884 886 878 813 840 884 1245
796 750 834 838 902 895 962 990 882 936 997 1305
866 805 905 873 1024 985 1049 1034 951 1010 1016
1378 915 854 922 965 1014 1040 1137 1026 992 1052
1056 1469 916 934 987 1018 1048 1086 1144 1077 1036
1076 1114 1595 949 930 1045 1015 1091 1142 1182 1161
1145 1119 1189 1662 1048 1019 1129 1092 1176 1297
1322 1330 1263 1250 1341 1927 1271 1238 1283 1283
1413 1371 1425 1453 1311 1387 1454 1993 1328 1250
1308 1350 1455 1442 1530 1505 1421 1485 1465 2163
1361 1284 1392 1442 1504 1488 1606 1488 1442 1495
1509 2135 1369 1320 1448 1495 1522 1575 1666 1617
1567 1551 1624 2367 1377 1294 1401 1362 1466 1559
1569 1575 1456 1487 1549 2178 1423 1312 1465 1488
1577 1591 1669 1697 1659 1597 1728 2326 1529 1395
1567 1536 1682 1675 1758 1708 1561 1643 1635 2240
1485 1376 1459 1526 1659 1623 1731 1662 1589 1683
1672 2361 1480 1385 1505 1576 1649 1684 1748 1642
1571 1567 1637 2397 1483 1390 1562 1573 1718 1752
1809 1759 1698 1643 1718 2399 1551 1497 1697 1672
1805 1903 1928 1963 1807 1843 1950 2736 1798 1700
1901 1820 1982 1957 2076 2107 1799 1854 1968 2364
1662 1681 1725 1796 1938 1871 2001 1934 1825 1930
1867 2553 1624 1533 1676 1706 1781 1772 1922 1743
1669 1713 1733 2369 1491 1445 1643 1683 1751 1774
1893 1776 1743 1728 1769 2431
licor<-ts(licor,frequency=12,start=c(1967,1))
descom3<-decompose(licor,type="multiplicative")
plot(descom3)
Si comparamos el comportamiento de las series presentadas en las Figuras
2.2 y 2.4, en ambas series existe una tendencia creciente y un patr on esta-
cional, sin embargo en la ultima podemos apreciar c omo el efecto estacional
tiende a aumentar a medida que aumenta la tendencia, por esto, la ecuaci on
(2.2) es m as apropiada para describir la serie de ventas de licor. En general el
modelo multiplicativo es m as apropiado que el aditivo cuando la varianza de
la serie original se incrementa (o disminuye) con el tiempo. La transformaci on
logartmica resulta apropiada para transformar un modelo de componentes
multiplicativos en (2.2) a uno de componentes aditivas,
log(Y
t
) = log(T
t
) + log(S
t
) + log(E
t
) (2.3a)
Y

t
= T
t
+ S
t
+ E
t
(2.3b)
en (2.3) aparece la transformaci on del modelo multiplicativo y observe que
redeniendo los logaritmos en (2.3a) por las correspondientes variables en
(2.3b) la trasformaci on nos lleva a un modelo aditivo sobre los logaritmos de
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
la serie original, como puede observarse en la Figura 2.5, que presenta la
descomposici on de la serie de los logaritmos de las ventas de licor.
C odigo R 2.3.
loglicor<-log(licor)
descom4<-decompose(loglicor,type="additive")
plot(descom4)
6
.
5
7
.
0
7
.
5
o
b
s
e
r
v
e
d
6
.
4
6
.
8
7
.
2
7
.
6
t
r
e
n
d
0
.
1
0
.
1
0
.
2
0
.
3
s
e
a
s
o
n
a
l
0
.
1
0
0
.
0
0
0
.
0
5
1970 1975 1980 1985 1990 1995
r
a
n
d
o
m
Time
Decomposition of additive time series
Log(serie original
Componente
estacional
Componente de error
(incluye ciclos)
Figura 2.5: Descomposici on de los logaritmos de las ventas de licor
Las funciones R decompose y stl generan los valores de las series de las
componentes de tendencia, estacionalidad y error, las cuales pueden ser ma-
nipuladas individualmente, en cada caso. Por ejemplo, con el siguiente c odigo
R obtenemos por separado cada componente de la serie de salarios, gener-
adas con la funci on decompose, y podemos gracar cada una en ventanas
independientes para mejor visualizaci on (ver Figuras 2.6, 2.7 y 2.8),
C odigo R 2.4.
descom<-decompose(salario,type="additive")
tendencia=descom$trend
estacionalidad=descom$seasonal
error=descom$random
plot(tendencia)
plot(estacionalidad)
plot(error)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
40 CAP
ITULO 2. EL AN

Time
t
e
n
d
e
n
c
i
a
1990 1992 1994 1996 1998 2000 2002
1
0
0
1
1
0
1
2
0
1
3
0
Figura 2.6: Componente de tendencia serie de salarios, obtenida con decompose
Time
e
s
t
a
c
i
o
n
a
l
i
d
a
d
1990 1992 1994 1996 1998 2000
2
0
2
Figura 2.7: Componente estacional serie de salarios, obtenida con decompose
Time
e
r
r
o
r
1990 1992 1994 1996 1998 2000
2
0
2
4
Figura 2.8: Componente de error serie de salarios, obtenida con decompose
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Con la funci on stl, podemos obtener las guras anteriores usando el sigu-
iente c odigo R (ver Figuras 2.9, 2.10 y 2.11)
C odigo R 2.5.
descom2<-stl(salario,s.window="periodic")
tendencia=descom2[[1]][,2]
estacionalidad=descom2[[1]][,1]
error=descom2[[1]][,3]
plot(tendencia)
plot(estacionalidad)
plot(error)
Podemos adem as visualizar la tendencia removiendo el efecto estacional
de la serie original agregando los datos al nivel anual mediante la funci on R
aggregate, en tanto que un resumen de los valores de cada estaci on puede
obtenerse mediante la funci on cycle (ver Figuras 2.12 y 2.13)
C odigo R 2.6.
plot(aggregate(salario))
boxplot(salariocycle(salario),names=month.abb)
Time
t
e
n
d
e
n
c
i
a
1990 1992 1994 1996 1998 2000 2002
1
0
0
1
1
0
1
2
0
1
3
0
Figura 2.9: Componente de tendencia serie de salarios, obtenida con stl
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
42 CAP
ITULO 2. EL AN

Time
e
s
t
a
c
i
o
n
a
l
i
d
a
d
1990 1992 1994 1996 1998 2000 2002
2
0
2
Figura 2.10: Componente estacional serie de salarios, obtenida con stl
Time
e
r
r
o
r
1990 1992 1994 1996 1998 2000 2002
2
0
2
4
Figura 2.11: Componente de error serie de salarios, obtenida con stl
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Time
a
g
g
r
e
g
a
t
e
(
s
a
l
a
r
i
o
)
1990 1992 1994 1996 1998 2000
1
2
0
0
1
3
0
0
1
4
0
0
1
5
0
0
Figura 2.12: Componente de tendencia serie de salarios, obtenida con aggregate
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
9
0
1
0
0
1
1
0
1
2
0
1
3
0
Figura 2.13: Componente estacional serie de salarios, obtenida con cycle
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
44 CAP
ITULO 2. EL AN

E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Captulo 3
Modelos de regresi on para tendencia
3.1. Tendencia determinstica vs. estoc astica
Como denimos previamente, la tendencia de una serie es un patr on de
largo plazo caracterizado por la persistencia a un crecimiento o a un decrec-
imiento de los valores de la serie, por tanto reeja el crecimiento o declinaci on
debido a la evoluci on lenta de factores tecnol ogicos, demogr acos, sociales,
entre otros. Cuando tal evoluci on ocurre de forma perfectamente predecible
decimos que la tendencia es determinstica, es decir, podemos identicar la
presencia de efectos permanentes sobre la serie temporal. Observe por ejemp-
lo las series en la Figura 3.1 (los datos son ledos del archivo STYLEKP.DAT y
est an disponibles tambi en al nal de este captulo).
C odigo R 3.1.
#La siguiente linea permite leer los datos guardados en archivo
#de texto en disco local. file.choose() abre ventana de windows para
#explorar y ubicar el archivo. header=T para indicar que los datos
#estan encabezados por nombre de la columna; si no hay encabezado, se toma header=F
datos.stylekp=read.table(file.choose(),header=T)
datos.stylekp=ts(datos.stylekp,frequency=1,start=1960)
datos.stylekp
Time Series:
Start = 1960
End = 1989
Frequency = 1
AGRICULTURE MANUFACTURING RETAIL SERVICES
1960 68.3 338.7 153.8 190.2
1961 67.5 339.4 153.2 197.7
1962 67.1 368.3 163.3 207.7
1963 67.2 397.4 169.0 217.4
1964 65.2 425.4 179.4 230.7
1965 66.7 462.5 190.0 240.4
1966 62.4 497.9 199.2 253.9
1967 65.5 496.6 201.5 265.2
1968 63.6 522.0 211.6 274.7
1969 65.3 536.7 212.7 287.8
1970 68.8 506.8 215.6 295.7
1971 70.6 515.5 224.5 302.4
1972 70.9 561.2 239.8 320.0
1973 70.3 621.3 255.6 340.2
1974 69.7 591.6 245.2 347.5
1975 73.1 547.5 247.5 352.4
45
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
46 CAP
ITULO 3. MODELOS DE REGRESI

ON PARA TENDENCIA
1976 71.5 600.6 262.8 367.7
1977 73.3 664.8 270.5 399.6
1978 73.0 694.7 284.8 421.5
1979 77.0 712.2 291.3 436.9
1980 76.4 673.9 281.7 450.9
1981 87.4 678.6 286.4 463.0
1982 89.6 634.6 287.5 463.6
1983 76.7 674.2 307.8 480.4
1984 84.2 752.4 334.0 509.7
1985 95.8 779.2 354.4 538.6
1986 103.6 803.2 377.5 565.8
1987 105.1 852.2 371.6 592.6
1988 97.0 917.4 399.2 623.3
1989 100.5 929.0 412.0 652.3
win.graph(width=4.5,height=7,pointsize=8)
plot(datos.stylekp)
7
0
8
0
9
0
1
0
0
T
t
=
0
+
1
t +
2
t
2
t
A
G
R
I
C
U
L
T
U
R
E
1960 1965 1970 1975 1980 1985 1990
4
0
0
5
0
0
6
0
0
7
0
0
8
0
0
9
0
0
T
t
=
0
+
1
t +
2
t
2
+
3
t
3
t
M
A
N
U
F
A
C
T
U
R
I
N
G
1960 1965 1970 1975 1980 1985 1990
1
5
0
2
0
0
2
5
0
3
0
0
3
5
0
4
0
0
T
t
=
0
+
1
t +
2
t
2
+
3
t
3
t
R
E
T
A
I
L
1960 1965 1970 1975 1980 1985 1990
2
0
0
3
0
0
4
0
0
5
0
0
6
0
0
T
t
=
0
+
1
t +
2
t
2
+
3
t
3
t
S
E
R
V
I
C
E
S
1960 1965 1970 1975 1980 1985 1990
Figura 3.1: Componentes claves del PIB real de Estados Unidos, registradas por a no de
1960 a 1989, en millones de d olares de 1982. Fuente: Diebold [3], stylekp.dat
En estas tres series podemos modelar la tendencia T
t
como un polinomio
en t, es decir, de la forma T
t
=
0
+
1
t +
2
t
2
+ +
p
t
p
. En contraste, existen
series en las cuales una funci on determinstica para la tendencia no resulta
intrnseca a todo el proceso de forma que ella pueda asumirse como un patr on
que persistir a en el futuro. Por ejemplo, la serie de la Figura 3.2 presenta una
tendencia estoc astica (datos ledos desde archivo EXCHRATE.DAT):
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
3.1. TENDENCIA DETERMIN
ISTICA VS. ESTOC
ASTICA 47
C odigo R 3.2.
datos.exchrate=read.table(file.choose(),header=T)
datos.exchrate=ts(datos.exchrate,frequency=1)
datos.exchrate
Time Series:
Start = 1
End = 620
Frequency = 1
exchrate
[1,] 1.0000000
[2,] 1.6268391
[3,] 1.6984192
[4,] 2.0079907
[5,] 1.4345695
[6,] 2.7828483
[7,] 2.8362358
[8,] 4.3383264
.
.
.
[615,] 12.8902860
[616,] 11.9726690
[617,] 13.4475750
[618,] 15.7608530
[619,] 17.2702810
[620,] 15.3228160
win.graph(width=4.5,height=4.5,pointsize=8);plot(datos.exchrate)
En series de este tipo la tendencia es impulsada por choques estoc asticos
y no presentan un nivel particular hacia el cual tienda a regresar; la serie se
mueve hacia donde la obliguen los choques recibidos. Veremos m as adelante
que tales series pueden modelarse de acuerdo a lo que se conoce como una
caminata aleatoria, en la que el valor de la serie en t es el valor de la serie en
t1 m as un movimiento totalmente aleatorio determinado por un ruido blanco
a
t
. La Figura 3.3 ilustra dos realizaciones de una caminata aleatoria simulada
en R:
C odigo R 3.3.
#SIMULANDO UNA CAMINATA ALEATORIA
#Una forma (se suma 400 para Y0=400)
at=rnorm(550,0,5) #at es un RB N(0,25) y se generan 550 observaciones
x=filter(at,filter=1,method="recursive")
x=ts(x[51:550]+400,frequency=1) #se toman las ultimas 500 observaciones
#Otra forma (se suma 400 para Y0=400)
at2=rnorm(550,0,5)
y=cumsum(at2)+400; y=ts(y[51:550],frequency=1)
#Graficando las dos series simuladas superpuestas
win.graph(width=4.5,height=4.5,pointsize=8)
plot(x,ylab="",ylim=c(min(x,y),max(x,y)),main=expression(paste("Caminata aleatoria",sep=" ",
Y[t]==Y[t-1]+a[t],sep=", ",Y[0]==400,sep=", ",a[t]==RBN(0,25))))
par(new=T)
plot.ts(y,ylab="",ylim=c(min(x,y),max(x,y)),col=2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
48 CAP

ON PARA TENDENCIA
Time
e
x
c
h
r
a
t
e
0 100 200 300 400 500 600
0
5
1
0
1
5
2
0
2
5
Figura 3.2: Tasa de cambio de Hungra, 620 observaciones Fuente: Diebold [3], ex-
chrate.dat
Caminata aleatoria Y
t
= Y
t1
+ a
t
, Y
0
= 400, a
t
= RBN(0, 25)
Time
0 100 200 300 400 500
3
0
0
3
5
0
4
0
0
Time
0 100 200 300 400 500
3
0
0
3
5
0
4
0
0
Figura 3.3: Dos realizaciones de una caminata aleatoria
En general, consideramos un modelo determinstico para la tendencia cuan-
do esta sea uniforme o suave. Cuando recurrimos a funciones polinomiales
casi siempre se usan polinomios de ordenes bajos para mantener suavidad en
el comportamiento, por ejemplo hasta un polinomio de orden 3, pero existen
casos d onde la tendencia queda mejor modelada por una funci on no lineal
diferente, por ejemplo una exponencial, es decir, T
t
=
0
e
1
t
. Observe por ejem-
plo en la Figura 3.4 la serie del volumen mensual de operaciones de acciones
negociadas en la bolsa de Nueva York (Diebold, [3], se desconoce fecha de ini-
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
3.2. ESTIMACI

ON DE MODELOS DE TENDENCIA 49
cio) y la serie de su logaritmo. Es claro que la tranformaci on logartmica logra
linealizar la tendencia (adem as de estabilizar en parte la varianza), es decir
log T
t
= log(
0
) +
1
t, as, podemos en este caso ajustar un modelo de regresi on
lineal simple para la serie transformada. Este ultimo modelo es conocido como
modelo de tendencia log lineal.
C odigo R 3.4.
#Leyendo datos de archivo de texto local
nyse_vol=read.table(file.choose(),header=T)
nyse_vol=ts(nyse_vol,frequency=1)
#Graficando la serie y su logaritmo
nf=layout(cbind(c(1,1),c(2,2)))
plot(nyse_vol)
plot(log(nyse_vol),ylab="log(FSVOL)")
Time
F
S
V
O
L
0 100 200 300 400 500
0
1
0
0
0
2
0
0
0
3
0
0
0
4
0
0
0
5
0
0
0
6
0
0
0
Time
l
o
g
(
F
S
V
O
L
)
0 100 200 300 400 500
3
4
5
6
7
8
Figura 3.4: Lado izquierdo: volumen mensual de operaciones de acciones negociadas en
la bolsa de Nueva York; lado derecho: Logaritmo de la serie. 542 observa-
ciones. Fuente: Diebold [3], nyse vol.dat.
3.2. Estimaci on de modelos de tendencia
3.2.1. Tendencia polinomial
Para el caso de modelos polinomiales para la tendencia, T
t
=
0
+
1
t +
2
t
2
+ , +
p
t
p
y sin presencia de componente estacional, denimos el modelo
estadstico para la serie como
Y
t
= T
t
+ E
t
=
0
+
1
t +
2
t
2
+ , +
p
t
p
+ E
t
, E
t
iid
N(0,
2
) (3.1)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
50 CAP

ON PARA TENDENCIA
que puede ser ajustado por regresi on lineal m ultiple, usando como variables
explicatorias a t
j
, j = 1, 2, , p. Por ejemplo, para las cuatro series en la Figura
3.1, para una serie de tama no n, procedemos al ajuste deniendo un sistema
de n ecuaciones en p + 1 variables (los par ametros
j
, j = 0, 1, , p):
Y
1
=
0
+
1
1 +
2
1
2
+ ,
p
1
p
+ E
1
Y
2
=
0
+
1
2 +
2
2
2
+ ,
p
2
p
+ E
2
.
.
.
Y
n
=
0
+
1
n +
2
n
2
+ ,
p
n
p
+ E
n
(3.2)
que matricialmente, tiene la representaci on y = X +e, donde
y =
_
_
Y
1
Y
2
.
.
.
Y
n
_
_
n1
X =
_
_
1 1 1 1
1 2 2
2
2
p
.
.
.
.
.
.
.
.
.
.
.
.
1 n n
2
n
p
_
_
n(p+1)
=
_
2
.
.
.
p
_
_
(p+1)1
e =
_
_
E
1
E
2
.
.
.
E
n
_
_
n1
.
Para la estimaci on por mnimos cuadrados se busca que minimice la
suma de cuadrados del error
S() = (y X)
t
(y X) = e
t
e =
n
t=1
E
2
t
(3.3)
esto es
= argmin
S() (3.4)
donde

es el vector de par ametros estimados. Existiendo (X
t
X)
1
, la soluci on
de mnimos cuadrados es
= (X
t
X)
1
X
t
y =
_
1
.
.
.
p
_
_
(3.5)
Sea H = X(X
t
X)
1
X
t
una matrix nn e I la matriz identidad nn. El vector
de valores estimados o ajustados para la serie corresponde a
y = X
= Hy =
_
Y
1
Y
2
.
.
.
Y
n
_
_
, (3.6)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
3.2. ESTIMACI

en cuanto que el vector de los residuales corresponde a
e = y y = (I H)y =
_
E
1
E
2
.
.
.
E
n
_
_
(3.7)
3.2.2. Modelo general de la tendencia
Sea T
t
= T(t, ) una funci on del tiempo t que describe la tendencia de una
serie, y denida con vector de par ametros de dimensi on k. Esta denici on
considera el caso de funciones lineales y no lineales en los par ametros como
el caso T
t
=
0
e
1
t
, donde = (
0
,
1
)
t
. Para el ajuste por mnimos cuadrados
sin recurrir a alguna transformaci on, el modelo para la serie, sin componente
estacional es dado por
Y
t
= T(t, ) + E
t
. (3.8)
Para una serie de tama no n, se desea resolver el sistema de n ecuaciones
(posiblemente no lineales)
Y
1
= T(1, ) + E
1
Y
2
= T(2, ) + E
2
.
.
.
Y
n
= T(n, ) + E
n
(3.9)
Para la estimaci on por mnimos cuadrados se busca que minimice la suma
de cuadrados del error
S() =
n
t=1
E
2
t
=
n
t=1
(Y
t
T(t, ))
2
(3.10)
esto es
= argmin
S(). (3.11)
es decir, la soluci on es hallada diferenciando a S() con respecto a e igualan-
do las derivadas parciales a cero, pero en general las ecuaciones resultantes
son no lineales por lo que debe emplearse un m etodo num erico para opti-
mizaci on, por ejemplo, utilizando m etodos num ericos para mnimos cuadra-
dos no lineales. En R se cuenta con la funci on nls (ver Ap endice A.2). Este
m etodo de ajuste requiere especicar valores iniciales para los par ametros de-
sconocidos y el exito del algoritmo depende fuertemente de la cercana de tales
valores de inicio a los valores optimos. Hay muchos algoritmos para el ajuste
de mnimos cuadrados no lineales, nls utiliza por defecto una forma de iter-
acci on tipo Gauss-Newton, que usa derivadas aproximadas num ericamente.
El riesgo con estos m etodos es que si la funci on S() tiene m ultiples mnimos,
el algoritmo puede arrojar un mnimo local y no absoluto.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
52 CAP

ON PARA TENDENCIA
Tendencia exponencial
Considere la serie en la Figura 3.4. Como se coment o previamente, la ten-
dencia para esta serie es del tipo T
t
=
0
e
1
t
. Luego, si aplicamos la transfor-
maci on logartmica y consideramos el modelo de regresi on lineal simple para
los logaritmos de la serie, log(Y
t
) = log(
0
)+
1
t +E
t
, E
t
iid
N(0,
2
), y ajustamos
por mnimos cuadrados:
C odigo R 3.5.
#Leyendo datos de archivo de texto local
nyse_vol=read.table(file.choose(),header=T)
nyse_vol=ts(nyse_vol,frequency=1)
#ajustando modelo de tendencia log lineal mediante regresion lineal
t=1:length(nyse_vol) #Define variable t segun longitud de la serie
modelo1=lm(log(nyse_vol)t)
#Extrayendo coeficientes ajustados en modelo log-lineal y transformando al
#modelo exponencial
estim=coef(modelo1)
beta00=exp(estim[[1]])
beta10=estim[[2]]
Salida R 3.1.
summary(modelo1)
Call:
lm(formula = log(nyse_vol) t)
Residuals:
Min 1Q Median 3Q Max
-0.66075 -0.19657 -0.02112 0.18871 1.03309
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.709e+00 2.490e-02 108.8 <2e-16
***
t 1.033e-02 7.946e-05 130.0 <2e-16
***
---
Signif. codes: 0
***
0.001
**
0.01
*
0.05 . 0.1 1
Residual standard error: 0.2895 on 540 degrees of freedom
Multiple R-squared: 0.969, Adjusted R-squared: 0.969
F-statistic: 1.689e+04 on 1 and 540 DF, p-value: < 2.2e-16
beta00
[1] 15.02031
beta10
[1] 0.01032658
El modelo ajustado de acuerdo a lo exhibido en el cuadro anterior, se tiene
que
log(Y
t
) = 2.709 + 0.01032658t
de donde, en t erminos del modelo sin trasformar, se tendra
Y
t
15.02031e
0.01032658t
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
3.2. ESTIMACI

Lo anterior es una estimaci on sesgada de E[Y
t
], desde que, bajo el modelo
log-lineal, se est a asumiendo que
Y
t
=
0
e
1
t
e
Et
, E
t
iid
N(0,
2
),
es decir, e
Et
iid
lognormal con media E[e
Et
] = e
1
2
2
. Luego, los valores ajustados
en el tiempo t basados en el modelo log(Y
t
) = log(
0
) +
1
t + E
t
deberan ser
obtenidos usando
Y
t
= e

log(
0
)+

1
t
e
0.5
2
e
1
2
2
es el factor de correcci on de sesgo, que ser a v alido de aplicar mientras la
normalidad de E
t
sea un supuesto razonable. En este caso, se toma
2
= MSE,
el error cuadr atico medio del modelo log-lineal. Tambi en se ha sugerido aplicar
un factor de correcci on emprico, de la forma
1
n
n
t=1
e
Et
, es decir, los valores
ajustados en escala original seran de la forma
Y
t
= e

log(
0
)+

1
t
1
n
n
t=1
e
Et
donde

E
t
son los residuos del modelo log-lineal. Continuando con el ejemplo,
en R obtenemos los valores ajustados en escala original de la siguiente forma
C odigo R 3.6.
#extrayendo estimacion de sigma en modelo1
sigma=summary(modelo1)$sigma
#Calculando factor de correcion segun distribucion lognormal
correc.lognorm=exp(0.5
*
sigma2)
correc.lognorm
[1] 1.042782
#Calculando factor de correccion emprica
correc.empir=mean(exp(residuals(modelo1)))
correc.empir
[1] 1.044208
#Obteniendo valores ajustado en escala original
#con factor de correcion lognormal
pred.mod1a=exp(fitted(modelo1))
*
correc.lognorm
#Obteniendo valores ajustado en escala original
#con factor de correcion emprica
pred.mod1b=exp(fitted(modelo1))
*
correc.empir
Del anterior cuadro vemos que el factor de correcci on lognormal es e
1
2

2
=
1.042782, mientras que el factor de correcci on emprica es
1
n
n
t=1
e

Et
= 1.044208,
pr acticamente iguales, desde que el tama no de la serie n = 542 es grande.
Luego, los valores ajustados por ambos m etodos son pr acticamente los mis-
mos:
Y
t
= e

log(
0
)+

1
t
e
0.5
2
= 1.042782 15.02031e
0.01032658t
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
54 CAP

ON PARA TENDENCIA
Y
t
= e

log(
0
)+

1
t
1
n
n
t=1
e
Et
= 1.044208 15.02031e
0.01032658t
Veamos ahora el uso del modelo de ajuste no lineal usando la funci on R nls:
C odigo R 3.7.
#ajustando modelo de tendencia exponencial mediante regresion no lineal
#se utilizan parametros estimados del modelo 1 para inicializar rutina de
#estimacion con modelo no lineal
modelo2=nls(nyse_volbeta0
*
exp(beta1
*
t),start=list(beta0=beta00,beta1=beta10))
Salida R 3.2.
summary(modelo2)
Formula: nyse_vol beta0
*
exp(beta1
*
t)
Parameters:
beta0 1.805e+01 1.886e+00 9.566 <2e-16
***
beta1 1.027e-02 2.107e-04 48.774 <2e-16
***
---
Signif. codes: 0
***
0.001
**
0.01
*
0.05 . 0.1 1
Number of iterations to convergence: 5
Achieved convergence tolerance: 5.787e-06
La ecuaci on del modelo ajustado corresponde a
Y
t
= 18.05e
0.01027t
En la Figura 3.5 observamos la serie original y las curvas ajustadas con el
modelo log-lineal destransformado y el modelo no lineal exponencial. En la
Figura 3.6 se presentan los residuales de los dos modelos ajustados a la serie
de la Figura 3.4. Observe los problemas de varianza en el ajuste del modelo
no lineal.
A continuaci on, el c odigo R usado para las Figuras 3.5 y 3.6:
C odigo R 3.8.
#Uniendo en una matriz los valores de la serie, y los ajustados de
#los modelos log-lineal y no lineal exponencial
datos_ajustes=cbind(nyse_vol,pred.mod1a,fitted(modelo2))
#Graficando las series superpuestas
matplot(t,datos_ajustes,type=l,col=c(1,2,4),lwd=c(1,2,2),lty=c(1,2,3),ylab="FSVOL")
legend(locator(1),legend=c("original",
"ajuste modelo log-lineal correcc. lognorm","ajuste modelo no lineal exponencial"),
col=c(1,2,4),lty=c(1,2,3),lwd=c(1,2,2))
#Preparando ventana grafica:dividiendo la ventana grafica en cuatro subventanas
nf=layout(rbind(c(1,1,2,2),c(3,3,4,4)))
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
3.2. ESTIMACI

#Graficando los residuales del modelo log-lineal
plot(t,residuals(modelo1),type=l,main="Residuales vs. tiempo\nModelo Log-lineal")
abline(h=0,lty=2)
plot(fitted(modelo1),residuals(modelo1),main="Residuales vs. Ajustados\nModelo Log-lineal")
abline(h=0,lty=2)
#Graficando los residuales del modelo no lineal
plot(t,residuals(modelo2),type=l,main="Residuales vs. tiempo\nModelo exponencial")
abline(h=0,lty=2)
plot(fitted(modelo2),residuals(modelo2),main="Residuales vs. Ajustados\nModelo exponencial")
abline(h=0,lty=2)
0 100 200 300 400 500
0
1
0
0
0
2
0
0
0
3
0
0
0
4
0
0
0
5
0
0
0
6
0
0
0
t
F
S
V
O
L
original
ajuste modelo loglineal correcc. lognorm
ajuste modelo no lineal exponencial
Figura 3.5: Volumen mensual de operaciones de acciones negociadas en la bolsa de Nueva
York y ajustes usando transformaci on logartmica y mnimos cuadrados no
lineales. Fuente: Diebold [3], nyse vol.dat.
Tendencia Logstica
Es un modelo com un para describir el crecimiento de una poblaci on y es
conocido tambi en como modelo de crecimiento logstico. La ecuaci on de este
modelo de tendencia es como sigue,
T
t
=

2
1 + exp{(
0
+
1
t)}
,
donde el par ametro
2
es el valor asint otico o de largo plazo para T
t
. La curva
es sim etrica alrededor de t =
0
/
1
, para el cual T
t
=
2
/2, es decir, en tal
tiempo, la curva est a a mitad de camino entre su valor en cero y su valor
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
56 CAP

ON PARA TENDENCIA
0 100 200 300 400 500
0
.
5
0
.
0
0
.
5
1
.
0
Residuales vs. tiempo
Modelo Loglineal
t
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
1
)
3 4 5 6 7 8
0
.
5
0
.
0
0
.
5
1
.
0
Residuales vs. Ajustados
Modelo Loglineal
fitted(modelo1)
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
1
)
0 100 200 300 400 500
1
0
0
0
0
1
0
0
0
2
0
0
0
3
0
0
0
Modelo exponencial
t
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
2
)
0 1000 2000 3000 4000
1
0
0
0
0
1
0
0
0
2
0
0
0
3
0
0
0
Modelo exponencial
fitted(modelo2)
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
2
)
Figura 3.6: Residuales del modelo Log- lineal (arriba) en escala logartmica de los datos;
residuales del modelo no lineal exponencial (abajo) en escala original de los
datos.
asint otico
2
. En la Figura 3.7 podemos apreciar la forma en S de esta curva,
con
2
= 300,
0
= 40,
1
= 0.02.
Para una serie de tiempo con s olo tendencia (de tipo logstico) y compo-
nente de error, podramos aplicar una transformaci on conocida como trans-
formaci on logstica, que opera de la siguiente forma:
Y
t

2
1 + exp{(
0
+
1
t)}
, entonces
Y
t
= log
_
Y
t
/
2
1 Y
t
/
2
_

0
+
1
t,
Sin embargo, los datos transformados Y

t
depender an de un par ametro de-
sconocido, por lo que se recurre a la regresi on no lineal.
En datos reales de crecimiento de poblaciones no siempre logramos visu-
alizar una logstica en forma completa. Considere los datos disponibles en el
marco de datos USPop disponible en la librera car, sobre la serie decadal del
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
3.2. ESTIMACI

1700 1800 1900 2000 2100 2200 2300
0
5
0
1
0
0
1
5
0
2
0
0
2
5
0
3
0
0
T
t
= 300

1 + e
(40+0.02t)
t
T
t
t =
0

1
T
t
=
2
2
Figura 3.7: Curva de tendencia tipo logstica.
censo poblacional de Estados Unidos desde 1790 a 2000, datos en unidades
de millones de habitantes:
C odigo R 3.9.
library(car)
data(USPop)
USPop
year population
1 1790 3.929214
2 1800 5.308483
3 1810 7.239881
4 1820 9.638453
5 1830 12.860702
6 1840 17.063353
7 1850 23.191876
8 1860 31.443321
9 1870 38.558371
10 1880 50.189209
11 1890 62.979766
12 1900 76.212168
13 1910 92.228496
14 1920 106.021537
15 1930 123.202624
16 1940 132.164569
17 1950 151.325798
18 1960 179.323175
19 1970 203.302031
20 1980 226.542199
21 1990 248.709873
22 2000 281.421906
max(USPop$population)
[1] 281.4219
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
58 CAP

ON PARA TENDENCIA
with(USPop,plot(year,population,type=b))
En la Figura 3.8 podemos apreciar esta serie. De la gr aca, podramos estar
inclinados a considerar como modelo de la tendencia una curva de tendencia
cuadr atica, con t en unidades de d ecadas con origen en 1790, esto es,
t = (a no 1790) /10 y Y
t
=
0
+
1
t +
2
t
2
+ E
t
, E
t
iid
N(0.
2
), Veamos el ajuste de
este modelo:
1800 1850 1900 1950 2000
0
5
0
1
0
0
1
5
0
2
0
0
2
5
0
year
p
o
p
u
l
a
t
i
o
n
Figura 3.8: Datos censo decadal de poblaci on en Estados Unidos desde el a no 1790 a
2000, fuente: Data frame USPob en R.
C odigo R 3.10.
library(car)
data(USPop)
#Calculando las fechas en decadas con punto
#de origen en 1790
t=I((USPop$year-1790)/10)
#Ajustando modelo de tendencia cuadratica
modelo0=lm(populationt+I(t2),USPop)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
3.2. ESTIMACI

Salida R 3.3.
summary(modelo0)
Call:
lm(formula = population t + I(t2), data = USPop)
Residuals:
-7.5557 -0.4308 0.6051 1.4230 4.6486
Coefficients:
(Intercept) 6.1128 1.7550 3.483 0.00249
**
t -1.1417 0.3872 -2.948 0.00825
**
I(t2) 0.6681 0.0178 37.525 < 2e-16
***
---
Signif. codes: 0
***
0.001
**
0.01
*
0.05 . 0.1 1
F-statistic: 8892 on 2 and 19 DF, p-value: < 2.2e-16
#Prediccion para el ano 2010
predict(modelo0,list(t=(2010-1790)/10))
1
304.3603
De los resultados vemos que la ecuaci on del modelo ajustado es

Y
t
= 6.1128
1.1417t + 0.6681t
2
y para el a no 2010, la proyecci on de la poblaci on sera de
304.36 millones.
Veamos ahora el ajuste del modelo logstico con regresi on no lineal. Primero
debemos incializar los valores de los par ametros del modelo logstico. Para
2
el
valor de la asntota superior de la curva logstica, basta usar un valor mayor
al de los datos de la serie, por ejemplo, 300. Para inicializar los otros dos
par ametros, podemos realizar la regresi on lineal de los datos de la serie con la
transformaci on logstica:
Y

t
= log
_
Y
t
/300
1 Y
t
/300
_
=
0
+
1
t + W
t
, W
t
iid
N(0,
2
)
Salida R 3.4.
##Regresion no lineal con modelo logstico
#Identificando valores iniciales para beta0 y beta1
#Se realiza regresion de datos con transformacion logstica
#con beta2=300
lm(logit(population/300) t, USPop)
Call:
lm(formula = logit(population/300) t, data = USPop)
Coefficients:
(Intercept) t
-4.3071 0.2918
Luego, para el ajuste del modelo logstico mediante regresi on no lineal usando
la funci on nls(), tomaramos como valores iniciales
2
= 300,
0
= 4.31,
1
=
0.29, como se ve a continuaci on:
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
60 CAP

ON PARA TENDENCIA
C odigo R 3.11.
modelo1=nls(population beta2/(1 + exp(-(beta0 + beta1
*
t))),
start=list(beta2 = 300, beta0 = -4.31, beta1 = 0.29),data=USPop,trace=FALSE)
Salida R 3.5.
summary(modelo1)
Formula: population beta2/(1 + exp(-(beta0 + beta1
*
t)))
Parameters:
beta2 440.83394 35.00031 12.60 1.14e-10
***
beta0 -4.03240 0.06818 -59.14 < 2e-16
***
beta1 0.21606 0.01007 21.45 8.87e-15
***
---
Signif. codes: 0
***
0.001
**
0.01
*
0.05 . 0.1 1
#Prediccion para el ano 2010
predict(modelo1,list(t=(2010-1790)/10))
[1] 296.595
La ecuaci on ajustada del modelo logstico es (con t representando d ecadas con
origen en 1790)
Y
t
=
440.83394
1 + exp{(4.03240 + 0.21606 t)}
,
con el cual se obtiene una predicci on para el a no 2010 de 296.595 millones
de habitantes.
Seg un informe de la Ocina del Censo de Estados Unidos,
http://2010.census.gov/news/releases/en-espaol/cb10-cn93sp.html,
la poblaci on al 1 de abril de 2010 era de 308,745,538 con cu al modelo fue
m as acertado el pron ostico? En la Figura 3.9 (ver C odigo R 3.12 usado en
la construcci on de esta gura) podemos observar la serie real junto con las
curvas ajustadas y el valor real en 2010.
C odigo R 3.12.
plot(t,USPop$population,type=p,xaxt=n,xlab="year",ylab="population",xlim=c(0,28),ylim=c(0,440))
#Creando etiquetas de marcas en eje X,
#con anos desde 1850 a 2050, cada 50 a nos,
#y colocando estas etiquetas de marcas
#en los valores de t=(ano-1790)/10 correspondientes
posi=(seq(1800,2050,by=50)-1790)/10
axis(1,at=posi,labels=seq(1800,2050,by=50))
#Dibujando la curva ajustada con modelo0, para t de 0 a 28 (anos 1790 a 2070)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
3.2. ESTIMACI

lines(c(0:28),predict(modelo0,list(t=c(0:28))),lwd=2,xlim=c(0,28),ylim=c(0,440))
#Dibujando la curva ajustada con modelo1, para t de 0 a 28 (anos 1790 a 2070)
lines(c(0:28),predict(modelo1,list(t=c(0:28))),lwd=2,col=2,xlim=c(0,28),ylim=c(0,440))
#Indicando observacion para ano 2010
points((2010-1790)/10, 308.7, type = "p", pch=20,cex=2,col="blue")
text((2010-1790)/10,308.7,labels="Poblacion 2010",pos=2)
abline(v=(2010-1790)/10,lty=2)
#Colocando leyenda
legend("topleft",legend=c("Ajuste Cuadratico","Ajuste logstico"),lty=1,col=c("black","red"),lwd=2)
0
1
0
0
2
0
0
3
0
0
4
0
0
year
p
o
p
u
l
a
t
i
o
n
1800 1850 1900 1950 2000 2050
Poblacin 2010
Ajuste Cuadrtico
Ajuste logstico
Figura 3.9: Datos censo decadal de poblaci on en Estados Unidos desde el a no 1790 a
2000 y proyecciones con modelo cuadr atico y logstico.
En la Figura 3.10 se presentan los gr acos de residuales para los modelos
de tendencia cuadr atica y logstica, obtenidos con el C odigo R 3.13
C odigo R 3.13.
#Dividiendo la ventana grafica en cuatro subventanas
#Graficando los residuales del modelo cuadratico
plot(t,residuals(modelo0),type=l,main="Residuales vs. tiempo\nModelo cuadratico",ylim=c(-8,8),lwd=2)
abline(h=0,lty=2)
plot(fitted(modelo0),residuals(modelo0),main="Residuales vs. Ajustados\nModelo cuadratico",ylim=c(-8,8),cex=1.5)
abline(h=0,lty=2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
62 CAP

ON PARA TENDENCIA
#Graficando los residuales del modelo logstico
plot(t,residuals(modelo1),type=l,main="Residuales vs. tiempo\nModelo logstico",ylim=c(-8,8),lwd=2)
abline(h=0,lty=2)
plot(fitted(modelo1),residuals(modelo1),main="Residuales vs. Ajustados\nModelo logstico",ylim=c(-8,8),cex=1.5)
abline(h=0,lty=2)
0 5 10 15 20
5
0
5
Modelo cuadrtico
t
r
e
s
id
u
a
ls
(
m
o
d
e
lo
0
)
0 50 100 150 200 250
5
0
5
Modelo cuadrtico
fitted(modelo0)
r
e
s
id
u
a
ls
(
m
o
d
e
lo
0
)
0 5 10 15 20
5
0
5
Modelo logstico
t
r
e
s
id
u
a
ls
(
m
o
d
e
lo
1
)
0 50 100 150 200 250
5
0
5
Modelo logstico
fitted(modelo1)
r
e
s
id
u
a
ls
(
m
o
d
e
lo
1
)
Figura 3.10: Gr acos de residuales modelos cuadr atico (modelo0) y modelo logstico (mod-
elo1) para datos del Censo Estados Unidos, 1790 a 2000.
3.3. Pron ostico de la tendencia
3.3.1. Pron osticos puntuales
Suponga que a partir del instante de tiempo t (tomado como el hoy) se
desea pronosticar para L perodos adelante, es decir, para el tiempo t + L, el
valor de una serie que s olo presenta componente de tendencia y error, es
Y
t+L
=
_
0
+
1
(t + L) +E
t+L
si la tendencia es lineal
0
+
1
(t + L) +
2
(t + L)
2
+ E
t+L
si la tendencia es cuadr atica
0
+
1
(t + L) +
2
(t + L)
2
+
3
(t + L)
3
+ E
t+L
si la tendencia es c ubica
etc.
(3.12)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
3.4. DIAGN

OSTICOS Y SELECCI
ON DE MODELOS 63
Entonces, el valor pronosticado para la serie en el tiempo t+L es simplemente,
Y
t+L
=
_
0
+

1
(t + L) si la tendencia es lineal
0
+

1
(t + L) +

2
(t + L)
2
si la tendencia es cuadr atica
0
+

1
(t + L) +

2
(t + L)
2
+

3
(t + L)
3
si la tendencia es c ubica
etc.
(3.13)
Es decir, basta utilizar la ecuaci on ajustada para producir los pron osticos de
los perodos futuros.
3.3.2. Intervalos de pron ostico
Asuma el modelo de tendencia polin omica. Bajo el modelo de regresi on
lineal m ultiple se tiene que un intervalo de predicci on de (1 )100 % para
una observaci on futura Y
t+L
en el vector de predictores x
t
t+L
= (1, (t + L), (t +
L)
2
, , (t + L)
p
) es dado por:
Y
t+L
t
/2,np1
_
MSE [1 +x
t
t+L
(X
t
X)
1
x
t+L
] (3.14)
donde X es la matriz de dise no para el sistema de ecuaciones en (3.2).
3.4. Diagn osticos y selecci on de modelos usando los crite-
rios de informaci on de Akaike y de Schwarz
3.4.1. Criterios de Informaci on
Los criterios de informaci on son medidas de bondad de ajuste de un modelo
estadstico. Suponga que el modelo estadstico considerado es
Y
t
= f(t,
p
) +E
t
, E
t
iid
N(0,
2
) (3.15)
donde f(t,
p
) es una funci on de t con un conjunto de p par ametros represen-
tados por el vector
p
.
Usar cualquier modelo para aproximar un fen omeno real conlleva cierto
grado de error y es en relaci on a este error sobre el cual se denen los crite-
rios de ajuste. Sea
q
el vector de par ametros del verdadero modelo o modelo
generador de los datos, el cual es desconocido y suponga que para p > q el
modelo con p par ametros est a anidado al modelo con q par ametros. Entonces,
el modelo considerado (el de p par ametros) es un modelo correcto pero sobre
parametrizado. Por el contrario, si p < q, entonces nuestro modelo es un mode-
lo mal especicado. En general, Entre varios modelos candidatos se debe elegir
el m as parsimonioso (con menos n umero de par ametros) tal que sea mnima
la varianza y el sesgo del modelo estimado.
Sea
L
n
() =
n
t=1
1
2
exp
_
(Y
t
f(t, ))
2
2
2
_
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
64 CAP

ON PARA TENDENCIA
la funci on de verosimilitud de un modelo basado en una muestra de n obser-
vaciones y su logaritmo o log-verosimilitud, l
n
() = log(L
n
()), y

L
n
(),

l
n
()
los m aximos de estas funciones. Los criterios de informaci on denidos para
seleccionar al modelo m as parsimonioso y correcto, toman en general la forma,
c
n
(p) = 2
l
n
()/n + p (n)/n, (3.16)
donde,
(n) =
_
2 Criterio de Akaike
log(n) Criterio de Informaci on Bayesiana o de Schwarz
(3.17)
En R est an implementadas en la funci on AIC() las versiones n c
n
(p), es decir:
nc
n
(p) =
_
2
l
n
() + 2 p, Criterio de Akaike
2
l
n
() + p log(n), Criterio de Informaci on Bayesiana o de Schwarz
(3.18)
AIC(modelo,k=2)
AIC(modelo,k=log(n))
Entre varios modelos candidatos, se selecciona aquel con el menor valor de
c
n
(p).
Nota: Los modelos a comparar deberan ser modelos anidados, es decir, con
estructura similar y que consideren los datos de la respuesta bajo la misma
escala.
3.4.2. Cu al criterio usar?
Para comparar criterios de selecci on es necesario considerar las siguientes
propiedades (Diebold [3]):
Consistencia
Un criterio es consistente si
1. Cuando el modelo verdadero (modelo generador de los datos) se encuen-
tra entre los modelos considerados, la probabilidad de seleccionarlo tiende
a 1 a medida que aumenta el tama no de muestra, y
2. Cuando el modelo verdadero no se encuentra entre los considerados y es
imposible seleccionarlo, la probabilidad de seleccionar la mejor aproxi-
maci on al modelo generador tiende a 1 cuando aumenta el tama no de la
muestra.
El criterio de Akaike no es consistente porque tiende a seleccionar modelos
sobre parametrizados. El criterio de Schwarz por el contrario s es consistente,
penaliza con m axima intensidad los grados de libertad.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
3.5. EJEMPLO: DATOS RSALES.DAT 65
Eciencia asint otica
Un criterio de selecci on de modelos es asint oticamente eciente, si a medi-
da que aumenta el tama no de muestra tiende a elegir modelos con varianza del
error de pron ostico a un paso adelante (Y
t+1
Y
t
(1), con

Y
t
(1) el pron ostico para
Y
t+1
, realizado en o con origen en t) que se aproximan a la varianza del modelo
verdadero y con una rapidez por lo menos equivalente a la del cualquier otro
criterio de selecci on de modelos.
El criterio de Akaike aunque inconsistente es asint oticamente eciente, pero
el de Schwarz no es asint oticamente eciente.
En la pr actica se calculan y eval uan modelos con ambos criterios y cuando
no hay concordancia entre tales, a pesar de la eciencia asint otica del criterio
de Akaike, se recomienda tomar el modelo indicado por el criterio de Schwarz
por ser m as parsimonioso.
3.5. Ejemplo: Datos RSALES.DAT
Considere la serie de los datos mensuales de las ventas al menudeo en
Estados Unidos, en d olares nominales, desde enero de 1955 a enero de 1996,
ilustrada en la Figura 3.11.
Time
r
s
a
l
e
s
1960 1970 1980 1990
5
0
0
0
0
1
0
0
0
0
0
1
5
0
0
0
0
2
0
0
0
0
0
Figura 3.11: Serie mensual de ventas al menudeo en Estados Unidos, d olares nominales
(ajustada estacionalmente), desde 01-1955 a 01-1996, fuente:Diebold [3].
Realice el ajuste de los siguientes modelos, considerando s olo los datos
desde 01-1955 a 01-1995, compare resultados en cuanto ajuste, y compor-
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
66 CAP

ON PARA TENDENCIA
tamiento de los residuales Cu al modelo pronostica mejor?
modelo1 (cuadr atico): Y
t
=
0
+
1
t +
2
t
2
+ E
t
modelo2 (c ubico): Y
t
=
0
+
1
t +
2
t
2
+
3
t
3
+ E
t
modelo3 (exponencial): Y
t
=
0
e
1
t
+ E
t
La programaci on R y resultados de estos ajustes son dados a continuaci on:
C odigo R 3.14.
#Leyendo datos del archivo RSALES.DAT
RSALES=read.table(file.choose(),header=T)
RSALES=ts(RSALES,freq=12,start=c(1955,1))
#Graficando la serie con todos los datos
plot(RSALES,lwd=3)
#Definiendo ndice t sin considerar las ultimas 12 observaciones de la serie
t=1:(length(RSALES)-12)
#Considerando serie solo hasta enero de 1995 inclusive
RSALESb=ts(RSALES[t],freq=12,start=c(1955,1))
C odigo R 3.15.
#Ajustando modelo de regresion cuadratica
modelo1=lm(RSALESbt+I(t2))
Salida R 3.6.
summary(modelo1)
Call:
lm(formula = RSALESb t + I(t2))
Residuals:
-7216.4 -2274.5 352.6 2179.2 8010.6
Coefficients:
(Intercept) 1.889e+04 3.839e+02 49.19 <2e-16
***
t -1.117e+02 3.678e+00 -30.37 <2e-16
***
I(t2) 9.387e-01 7.390e-03 127.02 <2e-16
***
---
Signif. codes: 0
***
0.001
**
0.01
*
0.05 . 0.1 1
Residual standard error: 2795 on 478 degrees of freedom
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
C odigo R 3.16.
#Ajuste del modelo de tendencia cubica
modelo2=lm(RSALESbt+I(t2)+I(t3))
Salida R 3.7.
summary(modelo2)
Call:
lm(formula = RSALESb t + I(t2) + I(t3))
Residuals:
-6844.6 -2285.7 166.6 2280.0 7854.0
Coefficients:
(Intercept) 1.939e+04 5.132e+02 37.779 <2e-16
***
t -1.241e+02 9.210e+00 -13.477 <2e-16
***
I(t2) 1.003e+00 4.438e-02 22.600 <2e-16
***
I(t3) -8.885e-05 6.053e-05 -1.468 0.143
---
Signif. codes: 0
***
0.001
**
0.01
*
0.05 . 0.1 1
C odigo R 3.17.
#Parametros iniciales para modelo exponencial, hallados con modelo log-lineal
modelolog=lm(log(RSALESb)t)
Salida R 3.8.
summary(modelolog)
Call:
lm(formula = log(RSALESb) t)
Residuals:
-0.193193 -0.072602 0.002657 0.070877 0.200578
Coefficients:
(Intercept) 9.338e+00 8.714e-03 1071.7 <2e-16
***
t 5.869e-03 3.133e-05 187.3 <2e-16
***
---
Signif. codes: 0
***
0.001
**
0.01
*
0.05 . 0.1 1
C odigo R 3.18.
#Ajuste modelo exponencial usando valores iniciales obtenidos
#en salida R anterior
b00=exp(coef(modelolog)[[1]]); b10=coef(modelolog)[[2]]
modelo3=nls(RSALESbbeta0
*
exp(beta1
*
t),start=list(beta0=b00,beta1=b10))
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
68 CAP

ON PARA TENDENCIA
Salida R 3.9.
summary(modelo3)
Formula: RSALESb beta0
*
exp(beta1
*
t)
Parameters:
beta0 1.197e+04 1.714e+02 69.84 <2e-16
***
beta1 5.769e-03 3.536e-05 163.13 <2e-16
***
---
Signif. codes: 0
***
0.001
**
0.01
*
0.05 . 0.1 1
C odigo R 3.19.
#Calculo de AIC y BIC para los tres modelos
AICS=c(AIC(modelo1),AIC(modelo2),AIC(modelo3))
log.n=log(length(RSALESb))
BICS=c(AIC(modelo1,k=log.n),AIC(modelo2,k=log.n),AIC(modelo3,k=log.n))
#o bien
BICs=c(BIC(modelo1),BIC(modelo2),BIC(modelo3))
criterios = rbind(AICS, BICS)
colnames(criterios) = c("cuadratico","cubico","exponencial")
rownames(criterios) = c("AIC","BIC")
Salida R 3.10.
#Tabla de valores AIC y BIC
(criterios)
cuadratico cubico exponencial
AIC 9004.057 9003.889 9589.319
BIC 9020.761 9024.769 9601.847
C odigo R 3.20.
#Calculando testes de normalidad
testes=rbind(shapiro.test(residuals(modelo1)),shapiro.test(residuals(modelo2)),
shapiro.test(residuals(modelo3)))
rownames(testes) = c("Cuadratico","Cubico","exponencial")
Salida R 3.11.
#Resultados pruebas de normalidad para los tres modelos
testes
statistic p.value method data.name
Cuadratico 0.9761218 4.418319e-07 "Shapiro-Wilk normality test" "residuals(modelo1)"
Cubico 0.9739848 1.514746e-07 "Shapiro-Wilk normality test" "residuals(modelo2)"
exponencial 0.9804841 4.672147e-06 "Shapiro-Wilk normality test" "residuals(modelo3)"
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
C odigo R 3.21.
#DEFINIENDO VALORES AJUSTADOS DE CADA MODELOS COMO SERIE DE TIEMPO
#PARA FACILITAR GR
AFICAS DE DATOS REALES Y AJUSTADOS EN MISMO GR
AFICO
Ythat1=ts(fitted(modelo1),frequency=12,start=c(1955,1))
#Dibujando curvas ajustadas cuadratica y exponencial junto a serie real
plot(RSALES,lwd=3)
lines(Ythat1,col=2,lwd=2)
lines(Ythat3,col=4,lwd=2)
legend("topleft",legend=c("Ajuste Cuadratico","Ajuste exponencial"),lty=1,col=c("red","blue"),lwd=2)
abline(v=time(RSALESb)[length(RSALESb)],lty=2) #Lnea vertical de referencia del origen de pronosticos
#Figura residuales
#Dividiendo la ventana grafica en seis subventanas organizadas en matriz 2x3
#Graficando los residuales de los modelos vs. tiempo
plot(t,residuals(modelo1),type=l,
main="Residuales vs. tiempo\nModelo cuadratico",lwd=2,ylim=c(-14000,12500))
abline(h=0,lty=2)
main="Residuales vs. tiempo\nModelo cubico",lwd=2,ylim=c(-14000,12500))
abline(h=0,lty=2)
main="Residuales vs. tiempo\nModelo exponencial",lwd=2,ylim=c(-14000,12500))
abline(h=0,lty=2)
#Graficando los residuales de los modelos vs.valores ajustados
plot(fitted(modelo1),residuals(modelo1),
main="Residuales vs. Ajustados\nModelo cuadratico",ylim=c(-14000,12500),cex=1.5)
abline(h=0,lty=2)
main="Residuales vs. Ajustados\nModelo cubico",ylim=c(-14000,12500),cex=1.5)
abline(h=0,lty=2)
main="Residuales vs. Ajustados\nModelo exponencial",ylim=c(-14000,12500),cex=1.5)
abline(h=0,lty=2)
#Graficos de probabilidad normal con residuales comunes
qqnorm(residuals(modelo1))
qqline(residuals(modelo1),col=2,lwd=2)
qqnorm(residuals(modelo2),main="Normal QQ-Plot\nModelo cubico")
qqnorm(residuals(modelo3),main="Normal QQ-Plot\nModelo exponencial")
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
70 CAP

ON PARA TENDENCIA
Time
r
s
a
l
e
s
1960 1970 1980 1990
5
0
0
0
0
1
0
0
0
0
0
1
5
0
0
0
0
2
0
0
0
0
0
1960 1970 1980 1990
5
0
0
0
0
1
0
0
0
0
0
1
5
0
0
0
0
2
0
0
0
0
0
1960 1970 1980 1990
5
0
0
0
0
1
0
0
0
0
0
1
5
0
0
0
0
2
0
0
0
0
0
Ajuste Cuadrtico
Ajuste exponencial
Figura 3.12: Serie mensual de ventas al menudeo en Estados Unidos, d olares nominales
(ajustada estacionalmente), y curvas cuadr atica y exponencial ajustadas
0 100 200 300 400 500
1
5
0
0
0
5
0
0
0
0
5
0
0
0
1
0
0
0
0
Modelo cuadrtico
t
r
e
s
id
u
a
ls
(
m
o
d
e
lo
1
)
0 100 200 300 400 500
1
5
0
0
0
5
0
0
0
0
5
0
0
0
1
0
0
0
0
Modelo cbico
t
r
e
s
id
u
a
ls
(
m
o
d
e
lo
2
)
0 100 200 300 400 500
1
5
0
0
0
5
0
0
0
0
5
0
0
0
1
0
0
0
0
Modelo exponencial
t
r
e
s
id
u
a
ls
(
m
o
d
e
lo
3
)
50000 150000
1
5
0
0
0
5
0
0
0
0
5
0
0
0
1
0
0
0
0
Modelo cuadrtico
fitted(modelo1)
r
e
s
id
u
a
ls
(
m
o
d
e
lo
1
)
50000 150000
1
5
0
0
0
5
0
0
0
0
5
0
0
0
1
0
0
0
0
Modelo cbico
fitted(modelo2)
r
e
s
id
u
a
ls
(
m
o
d
e
lo
2
)
50000 150000
1
5
0
0
0
5
0
0
0
0
5
0
0
0
1
0
0
0
0
Modelo exponencial
fitted(modelo3)
r
e
s
id
u
a
ls
(
m
o
d
e
lo
3
)
Figura 3.13: Residuales modelos ajustados a datos de RSALES.DAT
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
3 2 1 0 1 2 3
5
0
0
0
0
5
0
0
0
Normal QQ Plot
Theoretical Quantiles
S
a
m
p
le

Q
u
a
n
t
ile
s
3 2 1 0 1 2 3
5
0
0
0
0
5
0
0
0
Normal QQPlot
Modelo cbico
S
a
m
p
le

Q
u
a
n
t
ile
s
3 2 1 0 1 2 3
1
0
0
0
0
0
5
0
0
0
1
0
0
0
0
Normal QQPlot
Modelo exponencial
S
a
m
p
le

Q
u
a
n
t
ile
s
Figura 3.14: Gr acos de normalidad para residuales, modelos ajustados a datos de
RSALES.DAT
C odigo R 3.22.
#Predicciones para 02-1995 a 01-1996
t2=(length(RSALESb)+1):(length(RSALESb)+12)
predic1=cbind(RSALES[t2],predict(modelo1,newdata=list(t=t2),interval="prediction"))
colnames(predic1)[1]="Real"
predic2=cbind(RSALES[t2],predict(modelo2,newdata=list(t=t2),interval="prediction"))
colnames(predic2)[1]="Real"
#Para objetos nls, predict() Hasta el momento, solo da predicciones sin sus intervalos
predic3=cbind(RSALES[t2],predict(modelo3,newdata=list(t=t2),se.fit = TRUE,interval="prediction"))
colnames(predic3)=c("Real","fit")
Salida R 3.12.
predic1
Real fit lwr upr
1 181958 183122.1 177578.5 188665.7
2 185303 183916.2 178371.7 189460.8
3 183429 184712.3 179166.9 190257.6
4 183395 185510.2 179963.9 191056.4
5 185089 186309.9 180762.8 191857.1
6 185287 187111.6 181563.5 192659.7
7 187973 187915.1 182366.2 193464.1
8 189465 188720.5 183170.6 194270.5
9 191789 189527.8 183977.0 195078.7
10 192611 190337.0 184785.2 195888.8
11 192913 191148.0 185595.2 196700.8
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
72 CAP

ON PARA TENDENCIA
12 193218 191961.0 186407.2 197514.8
predic2
Real fit lwr upr
1 181958 182621.5 177044.2 188198.9
2 185303 183403.2 177823.0 188983.5
3 183429 184186.7 178603.4 189769.9
4 183395 184971.8 179385.6 190558.1
5 185089 185758.8 180169.4 191348.2
6 185287 186547.4 180954.8 192140.1
7 187973 187337.9 181741.9 192933.8
8 189465 188130.0 182530.7 193729.4
9 191789 188923.9 183321.1 194526.8
10 192611 189719.6 184113.2 195326.0
11 192913 190517.0 184906.9 196127.1
12 193218 191316.1 185702.3 196930.0
as.data.frame(predic3)
Real fit
1 181958 193072.0
2 185303 194189.0
3 183429 195312.4
4 183395 196442.4
5 185089 197578.8
6 185287 198721.9
7 187973 199871.6
8 189465 201027.9
9 191789 202190.9
10 192611 203360.6
11 192913 204537.1
12 193218 205720.4
3.6. Ejercicios
3.6.1. Problema 1
Considere las series en SKYLEPT.DAT, usando R, para cada una de el-
las ajuste un modelo de tendencia conveniente, realice adem as el an alisis de
residuales.
3.6.2. Problema 2
Los siguientes datos pertenecen al ndice de productividad mensual en
Canad a, desde Enero de 1950, hasta Diciembre de 1973.
De la Figura 3.15 responda:
1. Qu e tipo de tendencia tiene esta serie?
2. Proponga modelos para la serie completa y aj ustelos Usando R. Concluya
si estos modelos son apropiados a partir de los gr acos de residuales,
y sus medidas de ajuste. En cada caso, escriba la ecuaci on y el modelo
ajustado. Eval ue tambi en los gr acos de residuales en t erminos de la
validez del supuesto de independencia.
3. Considere ahora la serie sin sus primeros cinco a nos, es decir, desde
enero de 1955, y repita 2.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
3.6. EJERCICIOS 73
A no ene feb mar abr may jun jul ago sep oct nov dic
1950 77.5 77.6 78.1 78.3 78.3 78.9 79.5 80.0 80.7 82.0 82.4 82.5
1951 83.4 84.4 85.8 86.5 86.8 88.0 88.7 89.4 90.2 90.6 91.3 91.4
1952 91.5 91.0 90.5 90.4 89.7 89.8 89.9 89.8 89.9 89.8 89.9 89.6
1953 89.6 89.4 88.9 88.7 88.5 88.9 89.3 89.6 89.9 90.3 89.9 89.6
1954 89.6 89.6 89.4 89.5 89.4 89.9 89.9 90.6 90.4 90.4 90.4 90.2
1955 90.1 90.0 89.8 89.9 90.1 89.7 89.8 90.1 90.4 90.5 90.5 90.5
1956 90.4 90.1 90.1 90.2 90.2 91.2 91.7 92.2 92.1 92.7 93.1 93.2
1957 93.1 93.3 93.3 93.6 93.7 94.1 94.3 94.9 95.4 95.5 95.4 95.3
1958 95.5 95.7 96.2 96.9 96.8 96.8 96.5 96.9 97.2 97.5 97.8 97.7
1959 97.6 97.3 97.1 97.1 97.2 96.7 97.4 97.8 98.4 99.1 99.3 99.0
1960 98.7 98.5 98.2 98.7 98.6 98.8 98.7 99.0 99.4 100.2 100.3 100.3
1961 100.0 99.8 99.9 99.9 99.8 99.8 99.8 99.9 99.9 100.0 100.4 100.5
1962 100.4 100.5 100.4 100.9 100.7 101.0 101.4 101.7 101.4 101.8 102.1 102.1
1963 102.2 102.2 102.2 102.4 102.4 102.8 103.3 103.6 103.3 103.4 103.7 103.9
1964 103.9 104.1 104.2 104.5 104.5 104.7 105.4 105.3 105.0 105.0 105.2 105.9
1965 106.0 106.2 106.3 106.6 106.8 107.6 108.0 107.9 107.7 107.8 108.5 109.0
1966 109.3 110.0 110.2 110.8 111.0 111.3 111.7 112.2 112.3 112.5 112.6 112.9
1967 113.0 113.1 113.4 114.4 114.6 115.2 116.3 116.8 116.6 116.5 116.9 117.5
1968 118.1 118.2 118.6 119.3 119.3 119.7 120.4 120.7 121.1 121.4 121.9 122.3
1969 122.6 122.6 123.2 124.6 124.9 125.9 126.4 126.9 126.6 126.8 127.4 127.9
1970 128.2 128.7 128.9 129.7 129.6 129.9 130.5 130.5 130.2 130.3 130.3 129.8
1971 130.3 130.9 131.3 132.2 132.7 133.0 134.1 135.0 134.7 134.9 135.4 136.3
1972 136.7 137.3 137.4 138.2 138.3 138.5 140.2 141.3 141.8 142.0 142.3 143.3
1973 144.5 145.3 145.7 147.3 148.4 149.7 151.0 153.0 153.9 154.3 155.5 156.4
4. Qu e se concluye de 2) y 3) en t erminos del ajuste de los modelos y
comportamiento de la serie?, las observaciones de los primeros cinco
a nos afectan signicativamente la modelaci on de la serie? por qu e?
C odigo R 3.23.
library(TSA)
zt=scan()
77.5 77.6 78.1 78.3 78.3 78.9 79.5 80.0 80.7 82.0 82.4 82.5
83.4 84.4 85.8 86.5 86.8 88.0 88.7 89.4 90.2 90.6 91.3 91.4
91.5 91.0 90.5 90.4 89.7 89.8 89.9 89.8 89.9 89.8 89.9 89.6
89.6 89.4 88.9 88.7 88.5 88.9 89.3 89.6 89.9 90.3 89.9 89.6
89.6 89.6 89.4 89.5 89.4 89.9 89.9 90.6 90.4 90.4 90.4 90.2
90.1 90.0 89.8 89.9 90.1 89.7 89.8 90.1 90.4 90.5 90.5 90.5
90.4 90.1 90.1 90.2 90.2 91.2 91.7 92.2 92.1 92.7 93.1 93.2
93.1 93.3 93.3 93.6 93.7 94.1 94.3 94.9 95.4 95.5 95.4 95.3
95.5 95.7 96.2 96.9 96.8 96.8 96.5 96.9 97.2 97.5 97.8 97.7
97.6 97.3 97.1 97.1 97.2 96.7 97.4 97.8 98.4 99.1 99.3 99.0
98.7 98.5 98.2 98.7 98.6 98.8 98.7 99.0 99.4 100.2 100.3 100.3
100.0 99.8 99.9 99.9 99.8 99.8 99.8 99.9 99.9 100.0 100.4 100.5
100.4 100.5 100.4 100.9 100.7 101.0 101.4 101.7 101.4 101.8 102.1 102.1
102.2 102.2 102.2 102.4 102.4 102.8 103.3 103.6 103.3 103.4 103.7 103.9
103.9 104.1 104.2 104.5 104.5 104.7 105.4 105.3 105.0 105.0 105.2 105.9
106.0 106.2 106.3 106.6 106.8 107.6 108.0 107.9 107.7 107.8 108.5 109.0
109.3 110.0 110.2 110.8 111.0 111.3 111.7 112.2 112.3 112.5 112.6 112.9
113.0 113.1 113.4 114.4 114.6 115.2 116.3 116.8 116.6 116.5 116.9 117.5
118.1 118.2 118.6 119.3 119.3 119.7 120.4 120.7 121.1 121.4 121.9 122.3
122.6 122.6 123.2 124.6 124.9 125.9 126.4 126.9 126.6 126.8 127.4 127.9
128.2 128.7 128.9 129.7 129.6 129.9 130.5 130.5 130.2 130.3 130.3 129.8
130.3 130.9 131.3 132.2 132.7 133.0 134.1 135.0 134.7 134.9 135.4 136.3
136.7 137.3 137.4 138.2 138.3 138.5 140.2 141.3 141.8 142.0 142.3 143.3
144.5 145.3 145.7 147.3 148.4 149.7 151.0 153.0 153.9 154.3 155.5 156.4
zt=ts(zt,frequency=12, start=c(1950,1))
#Redefino los datos de la serie, eliminando los primeros 5 anos
n2=length(zt)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
74 CAP

ON PARA TENDENCIA
zt2=ts(zt[61:n2], frequency=12, start=c(1955,1))
zt2=ts(zt2,frequency=12, start=c(1955,1))
plot(zt,main="Indice de productividad mensual en Canada\ndesde enero de 1950",lwd=2)
plot(zt2, main="Indice de productividad mensual en Canada\ndesde enero desde 1955",lwd=2)
Indice de productividad mensual en Canada
desde enero de 1950
Time
z
t
1950 1955 1960 1965 1970
8
0
1
0
0
1
2
0
1
4
0
Indice de productividad mensual en Canada
desde enero desde 1955
Time
z
t
2
1955 1960 1965 1970
9
0
1
0
0
1
1
0
1
2
0
1
3
0
1
4
0
1
5
0
Figura 3.15: Serie

Indice de productividad mensual en Canada: arriba Datos desde 1959,
abajo: datos desde 1955.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
3.7. DATOS STYLEKP 75
3.7. datos STYLEKP
AGRICULTURE MANUFACTURING RETAIL SERVICES
68.3000030518 338.700012207 153.800003052 190.199996948
67.5 339.399993896 153.199996948 197.699996948
67.0999984741 368.299987793 163.300003052 207.699996948
67.1999969482 397.399993896 169 217.399993896
65.1999969482 425.399993896 179.399993896 230.699996948
66.6999969482 462.5 190 240.399993896
62.4000015259 497.899993896 199.199996948 253.899993896
65.5 496.600006104 201.5 265.200012207
63.5999984741 522 211.600006104 274.700012207
65.3000030518 536.700012207 212.699996948 287.799987793
68.8000030518 506.799987793 215.600006104 295.700012207
70.5999984741 515.5 224.5 302.399993896
70.9000015259 561.200012207 239.800003052 320
70.3000030518 621.299987793 255.600006104 340.200012207
69.6999969482 591.599975586 245.199996948 347.5
73.0999984741 547.5 247.5 352.399993896
71.5 600.599975586 262.799987793 367.700012207
73.3000030518 664.799987793 270.5 399.600006104
73 694.700012207 284.799987793 421.5
77 712.200012207 291.299987793 436.899993896
76.4000015259 673.900024414 281.700012207 450.899993896
87.4000015259 678.599975586 286.399993896 463
89.5999984741 634.599975586 287.5 463.600006104
76.6999969482 674.200012207 307.799987793 480.399993896
84.1999969482 752.400024414 334 509.700012207
95.8000030518 779.200012207 354.399993896 538.599975586
103.599998474 803.200012207 377.5 565.799987793
105.099998474 852.200012207 371.600006104 592.599975586
97 917.400024414 399.200012207 623.299987793
100.5 929 412 652.299987793
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
76 CAP

ON PARA TENDENCIA
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Captulo 4
Filtros lineales y suavizamientos
En este captulo se introducen algunas t ecnicas utilizadas en la identi-
caci on y estimaci on de las componentes de una serie de tiempo, con las
cuales es posible modelar localmente. Esta estrategia admite cambios en los
par ametros que denen las componentes estructurales, tales como la pendi-
ente de una recta de tendencia, a diferencia de los modelos de regresi on hasta
ahora vistos en los cuales se asume y estima un unico modelo con par ametros
constantes para toda la serie.
4.1. Regresi on LOESS
LOESS es un m etodo de ajuste de polinomios locales propuesto por Cleve-
land (1988) y que permite exibilizar el m etodo de mnimos cuadrados medi-
ante el ajuste de modelos sencillos sobre subconjuntos locales de datos para
crear una funci on que describe la parte determinstica de los datos.
El procedimiento asume que para i = 1, 2, , n, la i- esima observaci on y
i
de una variable respuesta Y y la correspondiente observaci on x
i
de un vector
de predictores x est an relacionadas seg un el modelo
y
i
= g(x
i
) + e
i
donde g es la funci on de regresi on (para la cual no se asume una forma
param etrica) y e
i
es un error aleatorio. La idea de la regresi on local es que cer-
ca de x = x
i
la funci on de regresi on g(x) puede ser aproximada localmente por
un polinomio de un orden dado. Tal aproximaci on local es obtenida ajustan-
do una supercie de regresi on a los datos que est an dentro de una vecindad
escogida alrededor del punto x
i
.
En el m etodo LOESS, se usa mnimos cuadrados ponderados para ajustar
funciones lineales o cuadr aticas de los predictores en el centro de las vecin-
dades. El radio de cada vecindad se escoge de manera que esta contenga un
porcentaje especicado de las observaciones. esta fracci on, llamada par ametro
de suavizamiento, controla el grado de suavizamiento de la supercie estima-
da. las observaciones en una vecindad local dada son ponderadas mediante
una funci on decreciente de su distancia al centro de la vecindad.
77
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
78 CAP
ITULO 4. FILTROS LINEALES Y SUAVIZAMIENTOS

Para el caso de un predictor univariado (una s ola variable explicatoria), la
regresi on localmente ponderada se puede denir en los siguientes pasos:
1. Para cada i, i = 1, 2, , n, se calculan las estimaciones

j
(x
i
), j = 0, , d
de los par ametros de una regresi on polinomial de y
k
en x
k
, cuyo ajuste se
hace por mnimos cuadrados ponderados con ponderaci on w
k
(x
i
) para la
observaci on (x
k
, y
k
). Entonces, los

j
(x
i
) son los valores
j
que minimizan
a
n
k=1
w
k
(x
i
)
_
y
k
1
x
k

d
x
d
k
_
2
la observaci on suavizada en x
i
, utilizando el polinomio local de grado d es
(x
i
, y
i
), donde y
i
es el valor ajustado en el punto x
i
.
y
i
=
d
j=0
j
(x
i
)x
j
i
La ponderaci on w
k
(x
i
) se calcula a partir de la consideraci on del concepto
de vecindad:
w
k
(x
i
) = W
_
x
k
x
i
h
i
_
donde h
i
es la r- esima distancia m as peque na de los vecinos de x
i
. Esto
es, h
i
es el r- esimo n umero m as peque no entre los |x
i
x
j
|, para j =
1, 2, , n, j = i. W es una funci on de ponderaci on que tiene las siguientes
propiedades:
a) W(x) > 0 para |x| < 1;
b) W(x) = W(x);
c) W(x) es una funci on no creciente de x 0;
d) W(x) = 0 para |x| 1.
Por ejemplo, la funci on de ponderaci on bicuadrada es denida como
W(x) =
_
(1 x
2
)
2
, para |x| < 1
0, para |x| 1
Otra funci on de peso que se puede utilizar es la tric ubica (esta es la usada
por la funci on loess() de R):
W(x) =
_
(1 |x|
3
)
3
, para |x| < 1
0, para |x| 1
2. Los y
i
son los valores ajustados por la regresi on localmente ponderada,
es decir, y
i
= g(x
i
).
Nota: Las observaciones deben estar en orden creciente de los valores x
i
.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
4.1. REGRESI

ON LOESS 79
4.1.1. LOESS en R
loess(formula, data, weights, subset, na.action, model = FALSE,
span = 0.75, enp.target, degree = 2,
parametric = FALSE, drop.square = FALSE, normalize = TRUE,
family = c("gaussian", "symmetric"),
method = c("loess", "model.frame"),
control = loess.control(...), ...)
Argumentos:
formula: Una f ormula que especica lae respuesta y uno o m as predic-
tores num ericos.
data: Un marco de datos opcional dentro del cual se busca primero las
variables del modelo.
weights: argumento opcional especicando los pesos o ponderaciones.
subset: Un subconjunto opcional de datos a usar.
na.action: La acci on a realizar con datos faltantes en la respuesta o en
los predictores. La acci on por defecto es parar el algoritmo.
model: Argumento l ogico para indicar si debe retornarse el marco del
modelo.
span: el par ametro que controla el grado de suavizamiento.
enp.target: una forma alternativa de especicar span, como el n umero
aproximado equivalente al n umero de par ametros a utilizar.
degree: el grado q de los polinomios a utilizar, hasta 2.
parametric: Para indicar si cualquiera de los t erminos debe ser ajustado
globalmente en lugar de localmente. Los t erminos pueden ser especica-
dos por nombre, n umero o como un vector l ogico del mismo tama no que
el n umero de predictores.
drop.square: Para ajustes con m as de un predictor y degree=2, para
indicar si debe excluirse el t ermino cuadr atico (y los t erminos cruzados)
para ciertos predictores. Los t erminos son especicados de igual manera
que en parametric.
normalize: Para indicar si los predictores deben ser normalizados a una
escala com un cuando hay m as de uno.
family: Si se usa gaussian el ajuste se hace por mnimos cuadrados,
y si se usa symmetric se usa un estimador robusto.
method: Ajusta el modelo o s olo extrae el marco del modelo.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
80 CAP

control: Par ametros de control: ver loess.control..
...: otros par ametros de control que pueden ser proporcionados direc-
tamente.
Observaciones:
El tama no de la vecindad est a controlado por (establecido por span o
enp.target). Para < 1, la vecindad incluye la proporci on de los puntos, y
estos tiene una ponderaci on tric ubica. Para > 1, todos los puntos son usa-
dos, con la distancia m axima asumida igual a
1
/p veces la distancia m axima
real para p variables explicativas.
4.1.2. Otras funciones R relacionadas con LOESS: scatter.smooth() y
loess.smooth()
Estas funciones son unas de las m as utiles cuando se realizan an alisis
iniciales de datos, ya que permiten realizar un gr aco de dispersi on y dibuja
la curva ajustada por LOESS.
scatter.smooth(x, y, span = 2/3, degree = 1,
family = c("symmetric", "gaussian"),
xlab = deparse(substitute(x)), ylab = deparse(substitute(y)),
ylim = range(y, prediction$y), evaluation = 50, ...)
loess.smooth(x, y, span = 2/3, degree = 1,
family = c("symmetric", "gaussian"), evaluation=50, ...)
Argumentos:
x: coordenadas x para el gr aco de dispersi on.
y: coordenadas y para el gr aco de dispersi on.
span: par ametro de suavizaci on para loess.
degree: grado del polinomio local utilizado.
family: si se usa la opci on gaussian el ajuste se realiza por mnimos
cuadrados, y si family=symmetric un estimador robusto es usado.
xlab: marquilla para el eje x.
ylab: marquilla para el eje y.
ylim: establece los lmites de y en el gr aco.
evaluation: n umero de puntos en los cuales se evalua la curva suaviza-
da.
...: par ametros gr acos.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
4.1. REGRESI

ON LOESS 81
4.1.3. Ejemplo:
Considere los datos de la tasa de cambio de Hungra, 620 observaciones
Fuente: Diebold [3], (exchrate.dat),
C odigo R 4.1.
#Lectura datos
datos.exchrate=read.table(file.choose(),header=T)
datos.exchrate=ts(datos.exchrate,frequency=1)
#Aplicando LOESS
t=time(datos.exchrate)
suavizam.loess0.10=loess(datos.exchratet,span=0.10) #alpha=0.1
Con la funci on summary() obtenemos un resumen del algoritmo indicando el
modelo considerado para la serie y los valores de ajuste de los argumentos de
la funci on con los cuales fue aplicada, por ejemplo para el caso con = 0.1:
Salida R 4.1.
summary(suavizam.loess0.10)
Call:
loess(formula = datos.exchrate t, span = 0.1)
Number of Observations: 620
Equivalent Number of Parameters: 28.62
Residual Standard Error: 1.286
Trace of smoother matrix: 31.65
Control settings:
normalize: TRUE
span : 0.1
degree : 2
family : gaussian
surface : interpolate cell = 0.2
Con Loess tambi en podemos calcular valores ajustados, evaluar los residuales
y hacer pron osticos, veamos:
C odigo R 4.2.
#Prediccion para t=621 a 625
#con alpha=0.1
suavizam.loess0.10b=loess(datos.exchratet,span=0.10,control=loess.control(surface="direct"))
predict.loess0.10b=predict(suavizam.loess0.10b,data.frame(t=c(621:625)),se=TRUE)
#con alpha=0.3
suavizam.loess0.30b=loess(datos.exchratet,span=0.30,control=loess.control(surface="direct"))
predict.loess0.30b=predict(suavizam.loess0.30b,data.frame(t=c(621:625)),se=TRUE)
En la siguiente salida R se observan los valores de predicciones, los errores
est andar de las predicciones, estimaci on de la desviaci on est andar del modelo
y su grados de libertad correspondientes, para ajuste Loess con = 0.1
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
82 CAP

Salida R 4.2.
predict.loess0.10b
$fit
1 2 3 4 5
11.69602 11.45307 11.21345 10.97754 10.74570
$se.fit
1 2 3 4 5
0.5652833 0.6122641 0.6620730 0.7146670 0.7700123
$residual.scale
[1] 1.278659
$df
[1] 585.9919
En el Cuadro 4.1, se resumen lo resultados de las predicciones para =
0.1, 0.3, 0.75.
Tabla 4.1: Pron osticos Loess, t=621 a 625, n = 620, datos exchrate.dat
= 0.1
t = n + L

Y
n+L
s.e(L)
E
df
621 11.70 0.57 1.28 585.99
622 11.45 0.61 1.28 585.99
623 11.21 0.66 1.28 585.99
624 10.98 0.71 1.28 585.99
625 10.75 0.77 1.28 585.99
= 0.3
t = n + L

Y
n+L
s.e(L)
E
df
621 14.27 0.44 1.78 608.43
622 14.21 0.45 1.78 608.43
623 14.16 0.46 1.78 608.43
624 14.10 0.48 1.78 608.43
625 14.04 0.49 1.78 608.43
= 0.75
t = n + L

Y
n+L
s.e(L)
E
df
621 12.77 0.45 2.87 615.21
622 12.66 0.45 2.87 615.21
623 12.55 0.46 2.87 615.21
624 12.44 0.46 2.87 615.21
625 12.32 0.46 2.87 615.21
Nota: Con los resultados anteriores es posible construir intervalos de predic-
ci on de nivel (1 )100 %, de la forma
Y
n+L
t
/2,[df]
s.e(L)
En el siguiente c odigo R se ilustran dos maneras de presentar gr acamente
los ajustes LOESS:
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
4.1. REGRESI

ON LOESS 83
C odigo R 4.3.
#Ajustar argumentos de scatter.smooth y de loess.smooth segun informacion observada con summary()
scatter.smooth(time(datos.exchrate),datos.exchrate,type=l,family="gaussian",span=0.10,degree=2)
legend("topleft",legend=expression(alpha==0.1))
#Tambien podemos realizar el grafico de la siguiente manera
#y superponer varias curvas Loess
plot(datos.exchrate,lwd=2)
lines(loess.smooth(t,datos.exchrate,family="gaussian",span=0.10,degree=2),lty=1,lwd=2,col="red")
lines(loess.smooth(t,datos.exchrate,family="gaussian",span=0.30,degree=2),lty=1,lwd=2,col="blue")
lines(loess.smooth(t,datos.exchrate,family="gaussian",span=0.75,degree=2),lty=1,lwd=2,col="black")
legend("topleft",legend=c(expression(alpha==0.1),expression(alpha==0.3),expression(alpha==0.75)),
col=c("red","blue","black"),lty=1,lwd=2)
Las Figuras 4.1 y 4.2 ilustran el resultado del anterior c odigo.
Tambi en es posible analizar los residuales de los ajustes LOESS, el sigu-
iente c odigo, ilustra la obtenci on de las gr acas de residuales:
C odigo R 4.4.
#Graficos de residuales
plot(t,residuals(suavizam.loess0.10),type=l,lwd=2)
abline(h=0,lty=2)
abline(h=0,lty=2)
abline(h=0,lty=2)
plot(fitted(suavizam.loess0.10),residuals(suavizam.loess0.10))
abline(h=0,lty=2)
abline(h=0,lty=2)
abline(h=0,lty=2)
La Figura 4.3 muestra el resultado gr aco del anterior c odigo.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
84 CAP

0 100 200 300 400 500 600
0
5
1
0
1
5
2
0
2
5
time(datos.exchrate)
d
a
t
o
s
.
e
x
c
h
r
a
t
e
= 0.1
0 100 200 300 400 500 600
0
5
1
0
1
5
2
0
2
5
d
a
t
o
s
.
e
x
c
h
r
a
t
e
= 0.3
0 100 200 300 400 500 600
0
5
1
0
1
5
2
0
2
5
d
a
t
o
s
.
e
x
c
h
r
a
t
e
= 0.75
Figura 4.1: Serie Tasa de cambio en Hungra y tres suavizamientos LOESS, (fecha de
inicio desconocida), fuente Diebold [3].
Time
e
x
c
h
r
a
t
e
0 100 200 300 400 500 600
0
5
1
0
1
5
2
0
2
5
= 0.1
= 0.3
= 0.75
Figura 4.2: Serie Tasa de cambio en Hungra y tres suavizamientos LOESS, (fecha de
inicio desconocida), fuente Diebold [3].
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
4.2. FILTROS LINEALES, MEDIAS M

OVILES Y SUAVIZADORES 85
0 100 300 500
2
0
2
4
t
r
e
s
i
d
u
a
l
s
(
s
u
a
v
i
z
a
m
.
l
o
e
s
s
0
.
1
0
)
0 100 300 500
2
0
2
4
6
t
r
e
s
i
d
u
a
l
s
(
s
u
a
v
i
z
a
m
.
l
o
e
s
s
0
.
3
0
)
0 100 300 500
5
0
5
t
r
e
s
i
d
u
a
l
s
(
s
u
a
v
i
z
a
m
.
l
o
e
s
s
0
.
7
5
)
5 10 15 20
2
0
2
4
fitted(suavizam.loess0.10)
r
e
s
i
d
u
a
l
s
(
s
u
a
v
i
z
a
m
.
l
o
e
s
s
0
.
1
0
)
5 10 15 20
2
0
2
4
6
r
e
s
i
d
u
a
l
s
(
s
u
a
v
i
z
a
m
.
l
o
e
s
s
0
.
3
0
)
5 10 15 20
5
0
5
r
e
s
i
d
u
a
l
s
(
s
u
a
v
i
z
a
m
.
l
o
e
s
s
0
.
7
5
)
Figura 4.3: Gr acos de residuales, ajustes LOESS para datos de la tasa de cambio en
Hungra), fuente Diebold [3].
4.2. Filtros lineales, medias m oviles y suavizadores
4.2.1. Filtro Lineal
En el an alisis de series de tiempo mediante descomposici on suelen usarse
ltros lineales para obtener la componente de tendencia. Un ltro lineal sobre
una serie de tiempo es una transformaci on de la siguiente forma
Y
t
=
i=
w
i
Y
ti
(4.1)
donde los coecientes w
t
son un conjunto de pesos tales que
t=
|w
t
| < . La
ecuaci on (4.1) tambi en es llamada convoluci on. Los ltros ayudan a determinar
la tendencia reduciendo las uctuaciones locales y tambi en se pueden usar
como estimadores de la tendencia cuando no es posible describirla mediante
ecuaciones param etricas simples, es decir, en tales casos podemos tomar

T
t
=
Y
t
.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
86 CAP

4.2.2. Medias m oviles
Un tipo de ltros lineales simples son las medias m oviles. En este tipo, los
pesos w
i
son restringidos de tal forma que
m
i=m
w
i
= 1, y generalmente se toman
sim etricos, esto es, w
i
= w
i
. El entero m 1 es llamado el ancho de ventana de
la media m ovil o par ametro de suavizamiento, el cual, el usuario debe denir
teniendo en cuenta que mientras mayor sea, mayor es el suavizamiento. Las
medias m oviles pueden clasicarse en los siguientes tipos (Diebold [3]):
Media m ovil unilateral
Una media m ovil unilateral utiliza pesos w
i
=
1
m+ 1
, i = 0, , m, es decir,
Y
t
=
1
m + 1
m
i=0
Y
ti
(4.2)
Media m ovil bilateral
En este tipo, los pesos usado son w
i
=
1
2m+ 1
, i = m, , m, es decir,
Y
t
=
1
2m+ 1
m
i=m
Y
ti
(4.3)
Media m ovil unilateral general
Esta corresponde a
Y
t
=
m
i=0
w
i
Y
ti
(4.4)
esta es una versi on m as general de la media movil unilateral.
Media m ovil bilateral general
Esta corresponde a
Y
t
=
m
i=m
w
i
Y
ti
(4.5)
Es una versi on m as general de la media movil bilateral, con w
i
= w
i
.
En R podemos calcular ltros y medias m oviles mediante la funci on filter():
Funci on filter()
Esta funci on arroja un objeto R tipo serie de tiempo, que corresponde a la
serie ltrada.
filter(x, filter, method = c("convolution", "recursive"),sides = 2, circular = FALSE, init)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z

Argumentos:
x: Una serie de tiempo.
filter: El vector de pesos w
i
del ltro en orden iverso del tiempo, es
decir, en el orden retrospectivo de la serie rezagada Y
ti
, seg un el m etodo
de ltraci on: filter = c(w0, w1, , wm) si se trata de una convoluci on, o
filter = c(w1, w2, , wm) si se trata de un ltro recursivo (ver method).
method: puede ser convolution para ltro de convoluci on

Y
t
=
m
i=0
w
i
Y
ti
(caso unilateral) o

Y
t
=
m
i=m
w
i
Y
ti
, w
i
= w
i
(caso bilateral); recursive
para un ltro recursivo, es decir, de la forma

Y
t
= Y
t
+
m
j=1
w
j

Y
tj
. Cuando
se usa method=convolution, se calculan medias m oviles de ancho de
ventana m; si se usa method=recursive, se usa una autoregresi on.
sides: S olo se usa este argumento para el caso de una convoluci on.
sides=1 calcula medias m oviles unilaterales; sides=2 calcula medias
m oviles bilaterales. En este ultimo caso, la longitud del vector de pesos
especicado en filter debe ser de 2m + 1.
circular: Este argumento s olo se usa cuando el ltro es una convolu-
ci on. circular=F es el valor por defecto. Si se usa circular=T, para los
t erminos Y
tj
con t j 0 se utlizan los valores de la serie Y
nj+t
, respec-
tivamente, donde n es la longitud de la serie; si circular=F, los t erminos
fuera de la serie se asumen como NA (datos faltantes), y por tanto la serie
ltrada

Y
t
no tendr a valores para los primeros m y /o ultimos m perodos
(en las medias m oviles bilaterales).
ini: Para el caso recursivo, un vector especicando los valores iniciales
de la serie de tiempo antes del primer tiempo, especicados en orden
inverso del tiempo. Por defecto es ajustado a un vector de ceros.
Ejemplo:
Considere la serie MSFT disponible en R en la librera fTrading, sobre 249
registros de precios y volumen negociados diariamente, de acciones de Mi-
crosoft entre 2000-09-27 y 2001-09-27. MSFT es una matriz cuyas columnas
son Open, High, Low, Close, Volume, que representan, respectivamente,
precio de apertura, precio m as alto, precio m as bajo, precio de cierre, y volu-
men negociado. la Figura 4.4 ilustra estas series. Considere la serie Volume.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
88 CAP

C odigo R 4.5.
library(fTrading)
#Base de datos MSFT de MIcrosift OHLC en librera fTrading: precios acciones
#tiene estructura matricial. Las fechas son los nombres de las filas
head(MSFT) #al ejecutar esta lnea observa los primeros seis registros, como se ve a continuacion
GMT
Open High Low Close Volume
2000-09-27 63.4375 63.5625 59.8125 60.6250 53077800
2000-09-28 60.8125 61.8750 60.6250 61.3125 26180200
2000-09-29 61.0000 61.3125 58.6250 60.3125 37026800
2000-10-02 60.5000 60.8125 58.2500 59.1250 29281200
2000-10-03 59.5625 59.8125 56.5000 56.5625 42687000
2000-10-04 56.3750 56.5625 54.5000 55.4375 68226700
plot(MSFT,col=1)
#Volumen diario de acciones negociadas
datos=MSFT[,"Volume"]
rownames(datos)=rownames(MSFT)
t=1:length(datos)
4
0
4
5
5
0
5
5
6
0
6
5
7
0
7
5
O
p
e
n
4
5
5
0
5
5
6
0
6
5
7
0
7
5
H
i
g
h
4
0
4
5
5
0
5
5
6
0
6
5
7
0
20000927 20010220 20010716
L
o
w
Time
4
5
5
0
5
5
6
0
6
5
7
0
C
l
o
s
e
2
.
0
e
+
0
7
6
.
0
e
+
0
7
1
.
0
e
+
0
8
20000927 20010220 20010716
V
o
l
u
m
e
Time
x
Figura 4.4: Gr acos series precios negociaci on de acciones de Microsoft (MSFT)
Vamos a calcular medias m oviles unilaterales con m = 24, 48. Para ello,
podemos usar la funci on filter() con el m etodo de convoluci on, y pesos w
i
=
1/(m + 1), o tambi en la funci on SMA() de la librera fTrading con argumento
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z

n=m+1. La siguiente programaci on R produce los mismos resultados con estas
dos funciones R:
C odigo R 4.6.
#Medias moviles unilaterales con m=24
#con funcion SMA de la librera fTrading
m=24
medmovil.SMAm24=c(rep(NA,m),SMA(datos,n=(m+1)))
#Con funcion filter
medmovil.filterm24=filter(datos,rep(1/(m+1),m+1),sides=1,circular=F)
#Medias moviles unilaterales con m=48
m=48
medmovil.SMAm48=c(rep(NA,m),SMA(datos,n=(m+1)))
medmovil.filterm48=filter(datos,rep(1/(m+1),m+1),sides=1,circular=F)
#Graficando la serie original con curvas de medias moviles superpuestas
nf=layout(c(1,1,2,2))
plot(t,datos,type=l,xaxt=n,xlab="Time",main="MA unilateral con funcion SMA")
axis(1,at=seq(1,length(datos),by=50),labels=time(datos)[seq(1,length(datos),by=50)])
lines(t,medmovil.SMAm24,col="red",lwd=2)
lines(t,medmovil.SMAm48,col="blue",lwd=2)
legend("topright",legend=c(expression(m==24),expression(m==48)),col=c("red","blue"),lty=1,lwd=2)
plot(datos,main="MA unilateral con funcion filter")
lines(medmovil.filterm24,col="red",lwd=2)
lines(medmovil.filterm48,col="blue",lwd=2)
Las medias m oviles calculadas con el anterior c odigo se ilustran en la Figura
4.5.
Observe que las series de las medias m oviles no inician en el mismo punto
que la serie original, esto debido a que no existen valores para la serie antes
del primer perodo (es decir, para t < 1). Sin embargo, en la funci on filter()
se puede usar la opci on circular=T, que como ya se indic o, reemplaza los
t erminos Y
tj
con t j 0 con los valores de la serie T
nj+t
, respectivamente,
donde n es la longitud de la serie:
C odigo R 4.7.
#media movil unilateral usando funcion filter con argumento circular=T
m=24
medmovil.filterm24b=filter(datos,rep(1/(m+1),m+1),sides=1,circular=T)
m=48
medmovil.filterm48b=filter(datos,rep(1/(m+1),m+1),sides=1,circular=T)
win.graph(width=9.5,height=4.5)
plot(datos,main="MA unilateral usando funcion filter con argumento circular=T")
lines(medmovil.filterm24b,col="red",lwd=2)
lines(medmovil.filterm48b,col="blue",lwd=2)
legend("topright",legend=c(expression(m==24),expression(m==48)),col=c("red","blue"),
lty=1,lwd=2,cex=0.8)
Las medias m oviles calculadas con el anterior c odigo se ilustran en la Figura
4.6.
Para el c alculo de medias m oviles bilaterales, con m = 12, 24, usamos la
funci on filter():
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
90 CAP

2
.
0
e
+
0
7
6
.
0
e
+
0
7
1
.
0
e
+
0
8
MA unilateral con funcin SMA
Time
d
a
t
o
s
20000927 20001207 20010221 20010503 20010716
m = 24
m = 48
MA unilateral con funcin filter
Time
V
o
lu
m
e
20000927 20001209 20010220 20010504 20010716 20010927
2
.
0
e
+
0
7
6
.
0
e
+
0
7
1
.
0
e
+
0
8
m = 24
m = 48
Figura 4.5: Serie volumen de acciones diarias negociadas de Microsoft (MSFT), con me-
dias m oviles unilaterales
MA unilateral usando funcin filter con argumento circular=T
Time
V
o
l
u
m
e
20000927 20001209 20010220 20010504 20010716 20010927
2
.
0
e
+
0
7
6
.
0
e
+
0
7
1
.
0
e
+
0
8
m = 24
m = 48
Figura 4.6: Serie volumen de acciones diarias negociadas de Microsoft (MSFT), medias
m oviles unilaterales con argumento circular=T.
C odigo R 4.8.
#Medias moviles bilaterales con m=12, 24
#Usando la opcion circular=F
m=12
medmovil.bil.filterm12=filter(datos,rep(1/(2
*
m+1),2
*
m+1),sides=2,circular=F)
m=24
medmovil.bil.filterm24=filter(datos,rep(1/(2
*
m+1),2
*
m+1),sides=2,circular=F)
#Usando la opcion circular=T
m=12
medmovil.bil.filterm12b=filter(datos,rep(1/(2
*
m+1),2
*
m+1),sides=2,circular=T)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z

m=24
medmovil.bil.filterm24b=filter(datos,rep(1/(2
*
m+1),2
*
m+1),sides=2,circular=T)
#Graficando la serie y las medias moviles
nf=layout(c(1,1,2,2))
plot(datos,main="MA bilateral con funcion filter, circular=F")
lines(medmovil.bil.filterm12,col="red",lwd=2)
lines(medmovil.bil.filterm24,col="blue",lwd=2)
plot(datos,main="MA bilateral con funcion filter,circular=T")
lines(medmovil.bil.filterm12b,col="red",lwd=2)
lines(medmovil.bil.filterm24b,col="blue",lwd=2)
MA bilateral con funcin filter, circular=F
Time
V
o
lu
m
e
20000927 20001209 20010220 20010504 20010716 20010927
2
.
0
e
+
0
7
6
.
0
e
+
0
7
1
.
0
e
+
0
8
m = 12
m = 24
MA bilateral con funcin filter,circular=T
Time
V
o
lu
m
e
20000927 20001209 20010220 20010504 20010716 20010927
2
.
0
e
+
0
7
6
.
0
e
+
0
7
1
.
0
e
+
0
8
m = 12
m = 24
Figura 4.7: Serie volumen de acciones diarias negociadas de Microsoft (MSFT), medias
m oviles bilaterales.
4.2.3. Suavizamiento exponencial simple (EWMA)
Este ltro es una media m ovil ponderada exponencialmente, es decir, los
factores de ponderaci on decaen exponencialmente, donde se tiene la siguiente
ecuaci on recursiva de suavizamiento:
Y
t
= Y
t
+ (1 )
Y
t1
, (0, 1). (4.6)
Puede mostrarse que
Y
t
= (1 )
t
Y
0
+
t1
i=0
w
i
Y
ti

t1
i=0
w
i
Y
ti
, con w
i
= (1 )
i
(4.7)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
92 CAP

Este tipo de suavizamiento asume un modelo de tendencia local donde s olo
hay evoluci on lenta del nivel de la serie:
Y
t
=
0,t
+
t
, donde
0,t
=
0,t1
+
t
(4.8)
con
t
N(0,
2
) y
t
N(0,
2
) independientes. Para la implementaci on se

siguen los siguientes pasos:
1. Inicializar en t = 1: Cuando la serie es muy larga,

Y
1
= Y
1
y cuando la
serie es corta,

Y
1
=

Y =
1
n
n
t=1
Y
t
.
2. Actualizar

Y
t
= Y
t
+ (1 )
Y
t1
, t = 2, , n
3. Hallar valores ajustados,

Y
t+1
=

Y
t
,
4. Pronosticar

Y
n+L
=

Y
n
.
Note que los pron osticos para L = 1, 2, todos corresponden a un valor con-
stante dado por el ultimo valor suavizado en t = n, es decir, se asume que la
tendencia es de pendiente cero!!. Tambi en observe que si 0, el ltro reduce
la serie a un cosntante (el valor de

Y
0
), mientras que si 1, entonces

Y
t
= Y
t
,
es decir, no hay suavizamiento.
Un intervalo de predicci on aproximado de (1)100 % puede ser construido
como
Y
n+L
t
/2,n1

_
1 + (L 1)
2
con =
_
1
n 1
n
t=1
(Y
t

Y
t
)
2
(4.9)
4.2.4. Suavizamiento Holt
Cuando la tendencia de la serie cambia no solo en su nivel local sino tam-
bi en en su pendiente, el m etodo ewma no da buenos resultados. En su lugar,
existe otra alternativa, adecuada cuando la tendencia local es lineal, veamos:
El modelo de tendencia con un nivel y pendiente locales de evoluci on lenta
es dado por
Y
t
=
0,t
+
1,t
t +
t
(4.10)
donde
0,t
=
0,t1
+
t
1,t
=
1,t1
+
t
con las perturbaciones
t
N(0,
2
),
t
N(0,
2
),
t
N(0,
2
) independientes
para todo t. En este caso, el m etodo de suavizamiento optimo considera el
suavizamiento a trav es de las dos siguientes ecuaciones de actualizaci on:
nivel:

0,t
= Y
t
+ (1 )(
0,t1
+

1,t1
), (0, 1) (4.11)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z

pendiente:

1,t
= (
0,t
0,t1
) + (1 )
1,t1
, (0, 1) (4.12)
El algoritmo de suavizamiento comprende los siguientes pasos:
1. Inicializar en t=2:

0,2
= Y
2
,

1,2
= Y
2
Y
1
2. Actualizar el nivel y la pendiente usando las ecuaciones de suavizamiento
correspondientes.
3. Hallar valores ajustados
Y
t+1
=

0,t
+

1,t
, (4.13)
4. Pronosticar fuera de la muestra:
Y
n+L
=

0,n
+

1,n
L (4.14)
Un intervalo de predicci on aproximado de (1 )100 % puede ser construido
como
Y
n+L
t
/2,n2

_
1 +
L1
i=1
2
(1 +i)
2
con =
_
1
n 2
n
t=1
(Y
t

Y
t
)
2
(4.15)
4.2.5. Suavizamientos exponenciales simples en R
En R disponemos de varias funciones que realizan EWMA, por ejemplo la
funci on ewmaSmooth() en la librera qcc y las funciones emaTA(), EWMA() en
la librera fTrading:
ewmaSmooth(x, y, lambda = 0.2, start, ...)
Argumentos:
x: Un vector de valores x conteniendo el ndice de tiempo t.
y: Un vector conteniendo los valores de la serie a suavizar.
lambda: El par ametro de suavizamiento . Por defecto es 0.2.
start: Valor de inicio para el suavizamiento. Por defecto es Y
1
.
Esta funci on devuelve un objeto tipo lista con los siguientes elementos:
x los valores del vector x,
y los valores suavizados
lambda el par ametro de suavizamiento
start el valor de inicio
Las funciones emaTA() y EWMA() tienen la siguiente sintaxis:
emaTA(x, lambda, startup = 0)
EWMA(x, lambda, startup = 0)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
94 CAP

Argumentos:
x: Un vector num erico con los valores de la serie a suavizar.
lambda: El par ametro de suavizamiento .
startup: El valor de inicilalizaci on, por defecto es cero.
Estas funciones devuelven un vector con los valores suavizados exponenciales.
Ejemplo:
De nuevo, considere la serie del volumen diario de acciones negociadas de
Microsoft, disponible en matriz MSFT de la librera R fTrading, vamos a aplicar
un suavizamiento exponencial simple con = 0.01, 0.1.
C odigo R 4.9.
#Suavizamiento exponencial simple
library(qcc); library(fTrading)
#Volumen diario de acciones negociadas
t=1:length(datos)
#ewma con funcion ewmaSmooth librera qcc, con alpha=0.01
suaviz.ewmaqcc0.01=ewmaSmooth(t,datos,lambda=0.01)
suaviz.ewmaqcc0.01
#ewma con funcion ewmaSmooth librera qcc, con alpha=0.1
suaviz.ewmaqcc0.1=ewmaSmooth(t,datos,lambda=0.1)
suaviz.ewmaqcc0.1
#ewma con funcion emaTA librera fTrading, con alpha=0.01
suaviz.ewmafTrading0.01=emaTA(datos,lambda=0.01)
suaviz.ewmafTrading0.01
#ewma con funcion emaTA librera fTrading, con alpha=0.1
suaviz.ewmafTrading0.1=emaTA(datos,lambda=0.1)
suaviz.ewmafTrading0.1
#Resultados en forma grafica
nf=layout(c(1,1,2,2)) #preparando ventana grafica
#Graficando serie junto con lneas EWMA obtenidas con funcion ewmaSmooth de la librera qcc
plot(t,datos,type=l,xaxt=n,xlab="Time",main="EWMA con funcion ewmaSmooth")
lines(suaviz.ewmaqcc0.1,col="red",lwd=2)
lines(suaviz.ewmaqcc0.01,col="blue",lwd=2)
legend("topright",legend=c(expression(alpha==0.1),expression(alpha==0.01)),col=c("red","blue"),
lty=1,lwd=2)
#Graficando serie junto con lneas EWMA obtenidas con funcion emaTA de la librera fTrading
plot(datos,main="EWMA con funcion emaTA")
lines(suaviz.ewmafTrading0.1,col="red",lwd=2)
lines(suaviz.ewmafTrading0.01,col="blue",lwd=2)
legend("topright",legend=c(expression(alpha==0.1),expression(alpha==0.01)),col=c("red","blue"),
lty=1,lwd=2)
En la Tabla 4.2 se exhiben los seis valores iniciales y nales de los suaviza-
mientos producidos por las funciones R ewmaSmooth() y emaTA(), con =
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z

0.01. Existen diferencias entre los resultados, sin embargo, en los ultimos
perdos, las dos funciones se aproximan, desde que el efecto de los valores
de inicializaci on en cada caso, se disipa cuando la serie es larga.
Tabla 4.2: Comparaci on de suavizamientos exponenciales, = 0.01
Primeros seis perodos
t ewmaSmooth emaTA
1 53077800.00 45234039.00
2 52808824.00 45043500.61
3 52651003.76 44963333.60
4 52417305.72 44806512.27
5 52320002.67 44785317.15
6 52479069.64 45019730.97
Ultimos seis perodos

t ewmaSmooth emaTA
244 40203989.16 39521844.26
245 40726832.27 40051508.82
246 40747464.95 40078894.73
247 40764693.30 40102808.78
248 40649668.37 39994402.69
249 40649127.68 40000414.67
La Figura 4.8 ilustra los suavizamientos ewmas.
2
.
0
e
+
0
7
6
.
0
e
+
0
7
1
.
0
e
+
0
8
EWMA con funcin ewmaSmooth
Time
d
a
t
o
s
20000927 20001207 20010221 20010503 20010716
= 0.1
= 0.01
EWMA con funcin emaTA
Time
V
o
lu
m
e
20000927 20001209 20010220 20010504 20010716 20010927
2
.
0
e
+
0
7
6
.
0
e
+
0
7
1
.
0
e
+
0
8
= 0.1
= 0.01
Figura 4.8: Serie volumen de acciones diarias negociadas de Microsoft (MSFT), suaviza-
mientos exponeciales simples.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
96 CAP

4.2.6. Suavizamiento de Holt en R
En R se dispone de la funci on HoltWinters().
HoltWinters(x, alpha = NULL, beta = NULL, gamma = NULL,...)
Para un suavizamiento de Holt la funci on se usa con el argumento gamma=FALSE
y los otros dos argumentos ajustados en los valores de y deseados, o bi-
en sin especicarlos. En este caso, la funci on busca valores optimos para
ambos par ametros, que minimicen el error cuadr atico de predicci on un paso
adelante. Los valores iniciales para los suavizadores de nivel y tendencia son
respectivamente, Y
2
y Y
2
Y
1
. Con los argumentos beta=FALSE y gamma=FALSE,
la funci on tambi en realiza un EWMA, con valor de inicio del suavizador igual
a Y
1
.
La ventaja de esta funci on es que permite la obtenci on de pron osticos y sus
intervalos de predicci on del 95%:
predict(objeto, n.ahead=1, prediction.interval = TRUE, level = 0.95)
donde objeto es un objeto creado con la funci on HoltWinters, n.ahead=1
indica la realizaci on de una predicci on para el primer perodo despu es del
ultimo valor en la serie, por tanto, para m as predicciones basta ajustar el
valor de este argumento en el n umero de predicciones deseadas.
Ejemplo:
De nuevo, considere la serie del volumen diario de acciones negociadas de
Microsoft. Vamos a realizar dos suavizamientos ewma con = 0.01 y el otro
con el ajuste optimo de la funci on HoltWinters. Tambi en se le aplicar a dos
suavizamientos de Holt, el primero con par ametros = 0.2, = 0.1 y el segun-
do con el ajuste autom atico de la funci on. Observe en el siguiente c odigo R la
forma de especicar cada caso.
C odigo R 4.10.
##Suavizamiento exponencial simple con alfa=0.01
ewma0.01=HoltWinters(datos,alpha=0.01,beta=FALSE,gamma=FALSE)
##Suavizamiento exponencial simple con alfa automatico
ewma.optim=HoltWinters(datos,beta=FALSE,gamma=FALSE)
##Suavizamiento exponencial de Holt, alfa=0.2, beta=0.1
Holt=HoltWinters(datos,alpha=0.2,beta=0.1,gamma=FALSE)
##Suavizamiento exponencial de Holt, alfa y beta automaticos
Holt.optim=HoltWinters(datos,gamma=FALSE)
#Graficas de serie original con curvas suavizadas
plot(Holt,lwd=2,col.predicted="red",main=expression(paste("Holt",sep=" ",alpha==0.2,sep=" ",beta==0.1)))
legend("topright",legend=c("Original","Suavizada"),col=c("black","red"),lty=1,lwd=2)
plot(Holt.optim,lwd=2,col.predicted="red",mai="Holt automatico")
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z

plot(ewma0.01,lwd=2,col.predicted="red",main=expression(paste("EWMA con Holt",SEP=" ",alpha==0.01)))
plot(ewma.optim,lwd=2,col.predicted="red",main="EWMA con Holt automatico")
En la Figura 4.9 observamos los resultados de estos suavizamientos.
Holt = 0.2 = 0.1
Time
O
b
s
e
r
v
e
d

/

F
i
t
t
e
d
0 50 100 150 200 250
5
e
+
0
7
0
e
+
0
0
5
e
+
0
7
1
e
+
0
8
Original
Suavizada
Holt automtico
Time
O
b
s
e
r
v
e
d

/

F
i
t
t
e
d
0 50 100 150 200 250
0
.
0
e
+
0
0
4
.
0
e
+
0
7
8
.
0
e
+
0
7
1
.
2
e
+
0
8
Original
Suavizada
EWMA con Holt = 0.01
Time
O
b
s
e
r
v
e
d

/

F
i
t
t
e
d
0 50 100 150 200 250
2
.
0
e
+
0
7
6
.
0
e
+
0
7
1
.
0
e
+
0
8
Original
Suavizada
EWMA con Holt automtico
Time
O
b
s
e
r
v
e
d

/

F
i
t
t
e
d
0 50 100 150 200 250
2
.
0
e
+
0
7
6
.
0
e
+
0
7
1
.
0
e
+
0
8
Original
Suavizada
Figura 4.9: Serie volumen de acciones diarias negociadas de Microsoft (MSFT), suaviza-
mientos exponenciales.
Tambi en es posible obtener gr acos de residuales, si lo que se quiere eva-
luar es el ajuste:
C odigo R 4.11.
#Graficas de residuales para suavizamientos con HolWinters
win.graph(width=14,height=17)
nf=layout(rbind(c(1,1,2,2),c(3,3,4,4),c(5,5,6,6),c(7,7,8,8)))
plot(residuals(Holt),lwd=2,
main=expression(paste("Holt",sep=" ",alpha==0.2,sep=" ",beta==0.1)))
abline(h=0,lty=2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
98 CAP

plot(fitted(Holt)[,"xhat"],residuals(Holt),lwd=2,
main=expression(paste("Holt",sep=" ",alpha==0.2,sep=" ",beta==0.1)))
abline(h=0,lty=2)
plot(residuals(Holt.optim),lwd=2,mai="Holt automatico")
abline(h=0,lty=2)
plot(fitted(Holt.optim)[,"xhat"],residuals(Holt.optim),lwd=2,main="Holt automatico")
abline(h=0,lty=2)
plot(residuals(ewma0.01),lwd=2,main=expression(paste("EWMA con Holt",SEP=" ",alpha==0.01)))
abline(h=0,lty=2)
plot(fitted(ewma0.01)[,"xhat"],residuals(ewma0.01),lwd=2,
main=expression(paste("EWMA con Holt",SEP=" ",alpha==0.01)))
abline(h=0,lty=2)
plot(residuals(ewma.optim),lwd=2,main="EWMA con Holt automatico")
abline(h=0,lty=2)
plot(fitted(ewma.optim)[,"xhat"],residuals(ewma.optim),lwd=2,main="EWMA con Holt automatico")
abline(h=0,lty=2)
La gr aca resultante de este c odigo, corresponde a la Figura 4.10. Los coe-
cientes ajustados, con los cuales se construyen las ecuaciones de pron ostico
en cada caso, se exhiben en la siguiente salida R. En cuanto ajuste, cu al
suavizamiento resulta mejor?
Salida R 4.3.
ewma0.01
Holt-Winters exponential smoothing without trend and without seasonal component.
Call:
HoltWinters(x = datos, alpha = 0.01, beta = FALSE, gamma = FALSE)
Smoothing parameters:
alpha: 0.01
beta : FALSE
gamma: FALSE
Coefficients:
[,1]
a 40649128
ewma.optim
Holt-Winters exponential smoothing without trend and without seasonal component.
Call:
HoltWinters(x = datos, beta = FALSE, gamma = FALSE)
alpha: 0.2420161
beta : FALSE
gamma: FALSE
Coefficients:
[,1]
a 46023427
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z

Holt
Holt-Winters exponential smoothing with trend and without seasonal component.
Call:
HoltWinters(x = datos, alpha = 0.2, beta = 0.1, gamma = FALSE)
alpha: 0.2
beta : 0.1
gamma: FALSE
Coefficients:
[,1]
a 53067583.0
b 773934.6
Holt.optim
Holt-Winters exponential smoothing with trend and without seasonal component.
Call:
HoltWinters(x = datos, gamma = FALSE)
alpha: 0.6344256
beta : 0.1368952
gamma: FALSE
Coefficients:
[,1]
a 38266887
b -1488188
Los pron osticos para los siguientes cinco perodos desp ues de t = 249 (el ultimo
perodo en la serie), pueden ser obtenidos en cada caso, usando la siguiente
programaci on R:
C odigo R 4.12.
#Cinco predicciones e intervalos de prediccion
#con ewma de alfa=0.01
predict1=predict(ewma0.01, n.ahead=5, prediction.interval = TRUE, level = 0.95)
predict1
#con ewma automatico
predict2=predict(ewma.optim, n.ahead=5, prediction.interval = TRUE, level = 0.95)
predict2
#con Holt, alfa=0.2, beta=0.1
predict3=predict(Holt, n.ahead=5, prediction.interval = TRUE, level = 0.95)
predict3
#con Holt automatico
predict4=predict(Holt.optim, n.ahead=5, prediction.interval = TRUE, level = 0.95)
predict4
En las Tablas 4.3 y 4.4, se ilustran lso resultados obtenidos con la anterior
programaci on. Se observa gran diferencia entre los pron osticos de los cua-
tro suavizamientos. Tambi en observe que para los suavizamientos EWMA el
pron ostico es un valor constante.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
100 CAP

Tabla 4.3: Pron osticos para cinco perodos adelante, m etodos EWMA, funci on
HoltWinters
Pron osticos EWMA con = 0.01
t t upr lwr
250 40649127.68 71778309.81 9519945.56
251 40649127.68 71779866.23 9518389.14
252 40649127.68 71781422.57 9516832.80
253 40649127.68 71782978.84 9515276.53
254 40649127.68 71784535.02 9513720.35
Pron osticos EWMA con Holt autom atico
t t upr lwr
250 46023427.30 75798358.33 16248496.27
251 46023427.30 76657936.51 15388918.09
252 46023427.30 77494045.21 14552809.40
253 46023427.30 78308507.88 13738346.73
254 46023427.30 79102923.44 12943931.17
Tabla 4.4: Pron osticos para cinco perodos adelante, m etodos Holt, funci on HoltWinters
Pron osticos Holt con = 0.2, = 0.1
t t upr lwr
250 53841517.67 103089271.35 4593763.99
251 54615452.31 105040919.67 4189984.94
252 55389386.95 107181542.86 3597231.03
253 56163321.58 109514802.19 2811840.98
254 56937256.22 112041949.63 1832562.81
Pron osticos Holt autom atico
t t upr lwr
250 36778698.07 71039781.28 2517614.85
251 35290509.61 77533719.06 -6952699.85
252 33802321.14 84310461.34 -16705819.05
253 32314132.68 91401189.46 -26772924.09
254 30825944.22 98817273.92 -37165385.48
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z

Holt = 0.2 = 0.1
Time
r
e
s
i
d
u
a
l
s
(
H
o
l
t
)
0 50 100 150 200 250
0
e
+
0
0
1
e
+
0
8
4e+07 0e+00 2e+07 4e+07 6e+07
0
e
+
0
0
1
e
+
0
8
Holt = 0.2 = 0.1
fitted(Holt)[, "xhat"]
r
e
s
i
d
u
a
l
s
(
H
o
l
t
)
Holt automtico
Time
r
e
s
i
d
u
a
l
s
(
H
o
l
t
.
o
p
t
i
m
)
0 50 100 150 200 250
4
e
+
0
7
4
e
+
0
7
0e+00 2e+07 4e+07 6e+07 8e+07 1e+08
4
e
+
0
7
4
e
+
0
7
Holt automtico
fitted(Holt.optim)[, "xhat"]
r
e
s
i
d
u
a
l
s
(
H
o
l
t
.
o
p
t
i
m
)
Time
r
e
s
i
d
u
a
l
s
(
e
w
m
a
0
.
0
1
)
0 50 100 150 200 250
2
e
+
0
7
4
e
+
0
7
4.0e+07 4.4e+07 4.8e+07 5.2e+07
2
e
+
0
7
4
e
+
0
7
fitted(ewma0.01)[, "xhat"]
r
e
s
i
d
u
a
l
s
(
e
w
m
a
0
.
0
1
)
Time
r
e
s
i
d
u
a
l
s
(
e
w
m
a
.
o
p
t
i
m
)
0 50 100 150 200 250
2
e
+
0
7
4
e
+
0
7
2e+07 3e+07 4e+07 5e+07 6e+07 7e+07
2
e
+
0
7
4
e
+
0
7
fitted(ewma.optim)[, "xhat"]
r
e
s
i
d
u
a
l
s
(
e
w
m
a
.
o
p
t
i
m
)
Figura 4.10: Residuales de los suavizamientos exponenciales para el volumen de acciones
diarias negociadas de Microsoft (MSFT).
4.2.7. Filtros de Henderson
Un tipo de ltros bastante usados en la estimaci on de tendencias de se-
ries de tiempo son los llamados ltros de Henderson, en los cuales los pesos
son dise nados intentando satisfacer dos caractersticas esperadas en las ten-
dencias: que la tendencia ltrada sea capaz de reproducir una variedad de
curvaturas diferentes y que a la vez sean lo m as suave posible. la primera
condici on es satisfecha dise nando el ltro de forma que la tendencia resul-
tante siga un polinomio local c ubico sin distorsi on. la segunda condici on se
logra a trav es de la suavidez del patr on de pesos usados. Estas dos condi-
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
102 CAP

ciones especican un patr on de ponderaci on unico y por tanto, una unica
media m ovil para cada longitud posible de ltro considerado. En la Tabla 4.5
se observan los pesos de ltros Henderson sim etricos para 2m+1 = 5, 7, 9, 13, 23.
Tabla 4.5: Vectores de pesos, Filtros sim etricos de Henderson
w5 w7 w9 w13 w23
1 -0.07 -0.06 -0.04 -0.02 -0.00
2 0.29 0.06 -0.01 -0.03 -0.01
3 0.56 0.29 0.12 0.00 -0.02
4 0.29 0.41 0.27 0.07 -0.01
5 -0.07 0.29 0.33 0.15 -0.00
6 0.06 0.27 0.21 0.01
7 -0.06 0.12 0.24 0.04
8 -0.01 0.21 0.07
9 -0.04 0.15 0.10
10 0.07 0.12
11 0.00 0.14
12 -0.03 0.15
13 -0.02 0.14
14 0.12
15 0.10
16 0.07
17 0.04
18 0.01
19 -0.00
20 -0.01
21 -0.02
22 -0.01
23 -0.00
En el siguiente c odigo R, se aplican los ltros de Henderson a la serie del
volumen diario de acciones negociadas de Microsoft, usando los vectores de
pesos ilustrados en la Tabla 4.5:
C odigo R 4.13.
library(fTrading)
t=1:length(datos)
#Definiendo los vectores de pesos
w5=c(-0.073,0.294,0.558,0.294,-0.073)
w7=c(-0.059,0.059,0.294,0.412,0.294,0.059,-0.059)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
4.3. EJERCICIOS 103
w9=c(-0.041,-0.010,0.119,0.267,0.330,0.267,0.119,-0.010,-0.041)
w13=c(-0.019,-0.028,0.0,0.066,0.147,0.214,0.240,0.214,0.147,0.066,0.0,-0.028,-0.019)
w23=c(-0.004,-0.011,-0.016,-0.015,-0.005,0.013,0.039,0.068,0.097,0.122,0.138,0.148,
0.138,0.122,0.097,0.068,0.039,0.013,-0.005,-0.015,-0.016,-0.011,-0.004)
#Aplicando filtros y graficando resultados
plot(t,datos,type=l,xaxt=n,xlab="Time",main="Henderson 5 terminos")
lines(t,filter(datos,w5,"convolution",2,F,NULL),col="red",lwd=2)
lines(t,filter(datos,w9,"convolution",2,F,NULL),col="darkgreen",lwd=2)
lines(t,filter(datos,w13,"convolution",2,F,NULL),col="blue",lwd=2)
lines(t,filter(datos,w23,"convolution",2,F,NULL),col="brown",lwd=2)
4.3. Ejercicios
Problema 1:
Usando la funci on HoltWinters() ajuste la tendencia para la serie EX-
CHRATE.DAT y realice pron osticos para t = 621 a 625. Compare resultados
obtenidos con la regresion LOESS en este captulo.
Problema 2:
Considere de nuevo la serie EXCHRATE.DAT. Utilice ltros de Henderson
para identicar la tendencia y posibles cambios estructurales.
Problema 3:
Para la serie del volumen diario de acciones negociadas de Microsoft, en
objeto MSFT de la librera R fTrading, ajuste la tendencia usando LOESS y
realice los pron osticos para t = 250 a 254. Compare con los resultados de los
suavizamientos exponenciales realizados en este captulo usando la funci on
HoltWinters.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
104 CAP

2
.
0
e
+
0
7
6
.
0
e
+
0
7
1
.
0
e
+
0
8
Henderson 5 trminos
Time
d
a
t
o
s
20000927 20010221 20010716
2
.
0
e
+
0
7
6
.
0
e
+
0
7
1
.
0
e
+
0
8
Henderson 9 trminos
Time
d
a
t
o
s
20000927 20010221 20010716
2
.
0
e
+
0
7
6
.
0
e
+
0
7
1
.
0
e
+
0
8
Henderson 13 trminos
Time
d
a
t
o
s
20000927 20010221 20010716
2
.
0
e
+
0
7
6
.
0
e
+
0
7
1
.
0
e
+
0
8
Henderson 23 trminos
Time
d
a
t
o
s
20000927 20010221 20010716
Figura 4.11: Filtros de Henderson sobre el volumen de acciones diarias negociadas de
Microsoft (MSFT).
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Captulo 5
Modelaci on de la componente estacional
En el Captulo 2 denimos la componente estacional S
t
de una serie de
tiempo como aquel patr on de cambio regular que se completa dentro de un
a no calendario y que se repite sobre una base anual. Diebold [3] establece que
la estacionalidad surge cuando las tecnologas, preferencias e instituciones se
ligan al calendario. Este patr on es motivado a factores de consumo, clim aticos
o cualquier otro que ocurra con una periodicidad regular. Para observar este
patr on es necesario una frecuencia de observaci on inferior al a no, pues como
vemos, es un patr on de mediano plazo.
Al igual que con la tendencia, es posible clasicar la estacionalidad en de-
terminstica y estoc astica. En este captulo consideraremos el primer caso.
5.1. Estacionalidad aditiva y multiplicativa
En la Secci on 2.7, vimos que una serie de componentes aditivas es de la
forma dada en la ecuaci on (2.1), donde las componentes de tendencia, esta-
cionalidad y error se agregan aditivamente para conformar la serie. Por el
contrario, una serie de componentes multiplicativas es de la forma dada en la
ecuaci on (2.2), lo cual implica que la variabilidad de la serie cambia (aumenta
o disminuye) con el tiempo.
Las funciones R decompose() y stl() permiten realizar la descomposi-
ci on de series aditivas y multiplicativas. Estas dos funciones se diferencian en
que la primera usa medias m oviles bilaterales para ltrar la tendencia, mien-
tras que la segunda recurre a LOESS. Ver Ap endice para m as detalles sobre
decompose() y stl() y la Secci on 2.7 del Captulo 2 para aplicaci on y otras
funciones para el an alisis de la tendencia y estacionalidad. Ambas descom-
posiciones son utiles para una identicaci on m as clara del tipo de modelo
que puede ajustarse a la tendencia, al tiempo que se eval ua la presencia de
patrones perodicos.
Nota: Es com un aplicar m etodos de eliminaci on o atenuaci on de la compo-
nente estacional de una serie con el n de modelar las uctuaciones no esta-
cionales. Este procedimiento se denomina ajuste por estacionalidad de una
serie de tiempo y a la serie resultante se le llama serie ajustada estacional-
mente. Sin embargo, en el enfoque que se trabajar a, el inter es est a en modelar
105
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
106 CAP
ITULO 5. MODELACI
ON DE LA COMPONENTE ESTACIONAL
la serie con todas sus componentes.
5.2. Modelado de la estacionalidad por regresi on
Para el ajuste por regresi on lineal m ultiple, es necesario que el modelo sea
lineal en sus par ametros, por tanto, s olo se puede considerar un modelo de
series de tiempo de componentes aditivas, Y
t
= T
t
+ S
t
+ E
t
, as, para ajus-
tar series multiplicativas mediante regresi on lineal, debemos trabajar sobre la
serie transformada en aditiva usando la transformaci on logartmica, es decir,
consideraremos el ajuste por regresi on de log(Y
t
) = T
t
+ S
t
+ E
t
, y luego, me-
diante la transformaci on inversa se hallan los ajustes y pron osticos para la
serie en la escala original, como ya fue visto en el caso de series de tendencia
exponencial.
5.2.1. Modelaci on de la estacionalidad mediante variables indicadoras
Recuerde que una variable indicadora es una variable que toma valor de
1 o 0 seg un si cierto evento o caracterstica se cumple en una observaci on
muestral dada. Sea una componente estacional S
t
de perodo s, es decir, cada
s perodos se repite el patr on estacional. Consideramos los siguientes casos
s = 6 Serie estacional bimestral;
s = 4 Serie estacional trimestral;
s = 12 Serie estacional mensual.
Sean las variables I
i,t
, i = 1, 2, , s, tales que
I
i,t
=
_
1 si en t la serie est a en la estaci on i
0 si en t la serie no est a en la estaci on i.
(5.1)
Es decir, I
i,t
es la variable indicadora de la estaci on i. Por ejemplo, si n = 13 y
s = 4, entonces
I
1,t
= {1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1}
I
2,t
= {0, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0}
I
3,t
= {0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0}
I
4,t
= {0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0}
Para determinar la estaci on que corresponde a un tiempo t basta calcular la
funci on m odulo de t en s, es decir MOD(t, s) que corresponde al residuo de
la divisi on de t entre s. Por ejemplo MOD(33, 12) = 9. En R esta operaci on se
realiza mediante el operador %%: 33%%12. Entonces, podemos redenir las
variables indicadoras de la siguiente forma:
I
i,t
=
_
1 si MOD(t, s) = i
0 si MOD(t, s) = i,
para i = 1, 2, , s 1 (5.2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
5.2. MODELADO DE LA ESTACIONALIDAD POR REGRESI

ON 107
I
i,t
=
_
1 si MOD(t, s) = 0
0 si MOD(t, s) = 0,
para i = s (5.3)
Observe que S
t
= S
t+ms
, t 1, m 1, por la periodicidad del patr on estacional,
por lo tanto, s olo se requiere denir s funciones del tiempo para representar
el patr on estacional. Tambi en observe que para un tiempo t dado, s olo una
de las s variables indicadoras puede tomar el valor de 1, de modo que
s
i=1
I
i,t
=
1, t 1.
Sea
i
, i = 1, 2, , s el efecto de la estaci on i, entonces podemos escribir
S
t
=
1
I
1,t
+
2
I
2,t
+ +
s
I
s,t
=
s
i=1
i
I
i,t
. (5.4)
Para una serie con s olo estacionalidad y componente aleatoria (componentes
aditivas), el modelo a ajustar ser a:
Y
t
= S
t
+ E
t
=
s
i=1
i
I
i,t
+ E
t
, (5.5)
donde las variables explicatorias son dadas por las s variables indicadoras.
Entonces, para una serie de longitud n = 20, y s = 4, tendramos, matricial-
mente, el siguiente sistema de ecuaciones a resolver por mnimos cuadrados
(los par ametros a estimar corresponden a los
i
):
_
_
Y
1
Y
2
Y
3
Y
4
Y
5
.
.
.
Y
15
Y
16
Y
17
Y
18
Y
19
Y
20
_
_
=
_
_
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
1 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 1 0
0 0 0 1
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
_
_
_
4
_
_
+
_
_
E
1
E
2
E
3
E
4
E
5
.
.
.
E
15
E
16
E
17
E
18
E
19
E
20
_
_
= Y
t
= X
t
+E
t
, (5.6)
donde el vector de par ametros desconocidos es
=
_
4
_
_
,
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
108 CAP
ITULO 5. MODELACI
y la soluci on por mnimos cuadrados sera

= (X
T
X)
1
X
T
Y
t
.
Ahora, suponga que adem as de la estacionalidad la serie presenta un pa-
tr on de tendencia (componentes aditivas). Por ejemplo, una tendencia lineal
(T
t
=
0
+
1
t) y estacionalidad trimestral (S
t
=
s
i=1
i
I
i,t
). En principio supodri-
amos que el modelo completo para la serie sera:
Y
t
= T
t
+ S
t
+ E
t
=
0
+
1
t +
s
i=1
i
I
i,t
+ E
t
, (5.7)
entonces para una serie de longitud n = 20 tendramos como sistema de ecua-
ciones, en forma matricial:
_
_
Y
1
Y
2
Y
3
Y
4
Y
5
.
.
.
Y
15
Y
16
Y
17
Y
18
Y
19
Y
20
_
_
=
_
_
1 1 1 0 0 0
1 2 0 1 0 0
1 3 0 0 1 0
1 4 0 0 0 1
1 5 1 0 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1 15 0 0 1 0
1 16 0 0 0 1
1 17 1 0 0 0
1 18 0 1 0 0
1 19 0 0 1 0
1 20 0 0 0 1
_
_
_
4
_
_
+
_
_
E
1
E
2
E
3
E
4
E
5
.
.
.
E
15
E
16
E
17
E
18
E
19
E
20
_
_
= Y
t
= X
t
+E
t
, (5.8)
donde el vector de par ametros desconocidos es
=
_
4
_
_
.
Pero, en el sistema de ecuaciones tendriamos una dependencia lineal perfecta
entre la primera columna de la matriz X y las columnas 3 a 6, lo cual hara que
(X
T
X)
1
no exista y por tanto, no podriamos estimar el vector de coecientes.
Para solucionar este inconveniente, se tienen tres posibles alternativas:
1. Eliminar el intercepto
0
de la ecuaci on del modelo:
Y
t
=
1
t +
s
i=1
i
I
i,t
+ E
t
(5.9)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z

ON 109
En este caso, los
i
representan el intercepto para la estaci on i, respecti-
vamente, obtenidos bajo el supuesto que la ecuaci on en t de la tendencia
es la misma en todas las estaciones, as la ecuaci on de la serie representa
s curvas paralelas con diferentes interceptos. Para el ejemplo, tendramos
que para la estaci on i, Y
t
=
i
+
1
t + E
t
, i = 1, 2, , s.
2. Eliminar una de las variables indicadoras, por ejemplo, la de la ultima
estaci on. en este caso el coeciente
i
i = s, representa el efecto o difer-
encia promedio de la serie en la estaci on i con relaci on a la estaci on s.
Entonces, siguiendo el ejemplo, tendramos como modelo para la serie:
Y
t
=
0
+
1
t +
s1
i=1
i
I
i,t
+ E
t
(5.10)
3. Introducir la restriccion
s
i=1
i
= 0. Aqui, cada coeciente
i
representa el
efecto de la estaci on i con respecto a la tendencia promedio de la serie:
Y
t
=
0
+
1
t +
s
i=1
i
I
i,t
+ E
t
con
s
i=1
i
= 0. (5.11)
De estas tres alternativas usaremos la segunda.
Ejemplo:
Considere la serie del ndice mensual de salario sector real industrial (sin
trilla de caf e), de enero de 1990 a noviembre de 2001, previamente ilustrada en
la Figura 2.2 del Captulo 2. Claramente la serie presenta un patr on estacional
mensual y es de componentes aditivas. Para la tendencia vamos a suponer tres
posibilidades: lineal, cuadr atica, c ubica:
Modelo 1: Y
t
=
0
+
1
t +
11
i=1
i
I
i,t
+ E
t
Modelo 2: Y
t
=
0
+
1
t +
2
t
2
+
11
i=1
i
I
i,t
+ E
t
Modelo 3: Y
t
=
0
+
1
t +
2
t
2
+
3
t
3
+
11
i=1
i
I
i,t
+ E
t
En todos los casos, suponemos que los errores son normales de media cero y
varianza constante.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
110 CAP
ITULO 5. MODELACI
C odigo R 5.1.
salario<-scan()
94.08 102.23 103.99 103.21 102.59 100.95
101.67 101.71 99.93 100.11 99.65 89.81
90.71 99.88 100.75 101.67 100.58 98.82
98.21 98.96 99.30 98.40 99.17 91.12
90.85 102.67 104.36 101.71 101.48 100.29
100.33 102.24 101.24 102.02 103.79 95.95
96.52 106.55 108.50 108.04 108.68 108.34
108.14 109.75 108.28 108.76 109.36 101.03
101.01 109.63 111.20 109.67 110.24 110.94
110.38 111.50 111.73 112.94 113.87 107.39
103.38 113.84 114.96 116.00 113.54 113.25
113.35 114.88 113.81 116.03 117.50 109.50
105.87 117.69 119.22 118.80 118.48 116.65
116.54 117.03 116.04 116.87 118.60 108.91
109.53 120.21 122.15 122.48 124.30 121.99
122.20 121.41 120.69 122.72 124.70 115.65
114.15 123.45 124.66 122.08 121.64 119.48
120.02 122.33 121.50 122.45 123.63 115.43
111.66 124.21 126.22 126.88 126.88 127.33
127.27 128.88 128.54 130.28 132.15 124.65
119.19 131.69 130.87 129.95 130.83 131.23
132.64 133.50 132.98 134.38 135.12 130.16
121.78 132.44 132.89 130.83 131.41 130.40
131.79 132.46 131.00 132.46 133.61
salario<-ts(salario,frequency=12,start=c(1990,1))
plot(salario)
t=1:length(salario)
#Definimos una variable categorica identificando los meses de enero a diciembre
#al introducir esta variable en la funcion lm(), el programa internamente definira
#las variables indicadoras de los meses
library(TSA)
mes=season(salario)
#Designamos el mes de diciembre como el mes de referencia
#esto eliminara la indicadora de diciembre en el ajuste
mes=relevel(mes,ref="December")
#Ajustamos los modelos
modelo1=lm(salariot+mes)
modelo2=lm(salariot+I(t2)+mes)
modelo3=lm(salariot+I(t2)+I(t3)+mes)
Los resultados de los modelos ajustados son dados a continuaci on
Salida R 5.1.
summary(modelo1)
Call:
lm(formula = salario t + mes)
Residuals:
-4.4751 -1.6531 -0.1166 1.2784 6.8502
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z

ON 111
Coefficients:
(Intercept) 88.875205 0.766239 115.989 < 2e-16
***
t 0.267642 0.004645 57.624 < 2e-16
***
mesJanuary -1.913076 0.954731 -2.004 0.0472
*
mesFebruary 8.299282 0.954629 8.694 1.31e-14
***
mesMarch 9.304973 0.954550 9.748 < 2e-16
***
mesApril 8.333163 0.954494 8.730 1.07e-14
***
mesMay 8.009688 0.954460 8.392 7.00e-14
***
mesJune 6.827045 0.954448 7.153 5.53e-11
***
mesJuly 6.798570 0.954460 7.123 6.46e-11
***
mesAugust 7.540094 0.954494 7.900 1.03e-12
***
mesSeptember 6.471618 0.954550 6.780 3.81e-10
***
mesOctober 7.235643 0.954629 7.580 5.79e-12
***
mesNovember 8.112167 0.954731 8.497 3.92e-14
***
---
Signif. codes: 0
***
0.001
**
0.01
*
0.05 . 0.1 1
F-statistic: 306.7 on 12 and 130 DF, p-value: < 2.2e-16
summary(modelo2)
Call:
lm(formula = salario t + I(t2) + mes)
Residuals:
-4.4024 -1.8045 0.0749 1.4833 6.2052
Coefficients:
(Intercept) 89.6070580 0.8941117 100.219 < 2e-16
***
t 0.2394942 0.0185735 12.894 < 2e-16
***
I(t2) 0.0001955 0.0001249 1.565 0.1201
mesJanuary -1.9719136 0.9502016 -2.075 0.0399
*
mesFebruary 8.2422033 0.9500567 8.675 1.52e-14
***
mesMarch 9.2492626 0.9499449 9.737 < 2e-16
***
mesApril 8.2784309 0.9498655 8.715 1.22e-14
***
mesMay 7.9555416 0.9498181 8.376 7.97e-14
***
mesJune 6.7730948 0.9498023 7.131 6.35e-11
***
mesJuly 6.7444236 0.9498181 7.101 7.44e-11
***
mesAugust 7.4853615 0.9498655 7.880 1.19e-12
***
mesSeptember 6.4159084 0.9499449 6.754 4.44e-10
***
mesOctober 7.1785644 0.9500567 7.556 6.77e-12
***
mesNovember 8.0533295 0.9502016 8.475 4.61e-14
***
---
Signif. codes: 0
***
0.001
**
0.01
*
0.05 . 0.1 1
summary(modelo3)
Call:
lm(formula = salario t + I(t2) + I(t3) + mes)
Residuals:
-5.2024 -1.4414 0.1069 1.4619 6.0381
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
112 CAP
ITULO 5. MODELACI
Coefficients:
(Intercept) 9.197e+01 9.603e-01 95.775 < 2e-16
***
t 4.655e-02 4.351e-02 1.070 0.2867
I(t2) 3.530e-03 7.008e-04 5.038 1.57e-06
***
I(t3) -1.544e-05 3.200e-06 -4.825 3.92e-06
***
mesJanuary -2.135e+00 8.781e-01 -2.432 0.0164
*
mesFebruary 8.112e+00 8.777e-01 9.242 6.80e-16
***
mesMarch 9.152e+00 8.774e-01 10.430 < 2e-16
***
mesApril 8.214e+00 8.772e-01 9.363 3.45e-16
***
mesMay 7.923e+00 8.771e-01 9.033 2.19e-15
***
mesJune 6.773e+00 8.771e-01 7.722 2.88e-12
***
mesJuly 6.777e+00 8.771e-01 7.726 2.82e-12
***
mesAugust 7.550e+00 8.772e-01 8.607 2.34e-14
***
mesSeptember 6.513e+00 8.774e-01 7.423 1.41e-11
***
mesOctober 7.309e+00 8.777e-01 8.327 1.09e-13
***
mesNovember 8.217e+00 8.781e-01 9.357 3.56e-16
***
---
Signif. codes: 0
***
0.001
**
0.01
*
0.05 . 0.1 1
Los gr acos de residuales de los tres modelos son obtenidos mediante el sigu-
iente c odigo R y en la Figura 5.1 se ilustra el resultado.
C odigo R 5.2.
nf=layout(rbind(c(1,1,2,2),c(3,3,4,4),c(5,5,6,6)))
plot.ts(residuals(modelo1),lwd=2)
abline(h=0,lty=2)
plot(fitted(modelo1),residuals(modelo1))
abline(h=0,lty=2)
abline(h=0,lty=2)
abline(h=0,lty=2)
abline(h=0,lty=2)
abline(h=0,lty=2)
La serie original y las series ajustadas son presentadas en la Figura 5.2,
obtenida con el c odigo R siguiente:
C odigo R 5.3.
plot(t,salario,type=l,lwd=1.5)
lines(t,fitted(modelo1),lwd=2,col="red")
legend("topleft",legend=c("Original","modelo1"),col=c(1,2),lwd=2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z

ON 113
Time
r
e
s
id
u
a
ls
(
m
o
d
e
lo
1
)
0 20 40 60 80 100 120 140
4
0
2
4
6
90 100 110 120 130
4
0
2
4
6
fitted(modelo1)
r
e
s
id
u
a
ls
(
m
o
d
e
lo
1
)
Time
r
e
s
id
u
a
ls
(
m
o
d
e
lo
2
)
0 20 40 60 80 100 120 140
4
0
2
4
6
90 100 110 120 130
4
0
2
4
6
fitted(modelo2)
r
e
s
id
u
a
ls
(
m
o
d
e
lo
2
)
Time
r
e
s
id
u
a
ls
(
m
o
d
e
lo
3
)
0 20 40 60 80 100 120 140
4
0
2
4
6
90 100 110 120 130
4
0
2
4
6
fitted(modelo3)
r
e
s
id
u
a
ls
(
m
o
d
e
lo
3
)
Figura 5.1: Gr acos de residuales de los tres modelos ajustados a la serie de salario.
0 20 40 60 80 100 120 140
9
0
1
0
0
1
1
0
1
2
0
1
3
0
t
s
a
la
r
io
Original
modelo1
0 20 40 60 80 100 120 140
9
0
1
0
0
1
1
0
1
2
0
1
3
0
t
s
a
la
r
io
Original
modelo2
0 20 40 60 80 100 120 140
9
0
1
0
0
1
1
0
1
2
0
1
3
0
t
s
a
la
r
io
Original
modelo3
Figura 5.2: Gr acos de la serie real y ajustada seg un los tres modelos considerados para
la serie de salario.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
114 CAP
ITULO 5. MODELACI
Compare el ajuste de los tres modelos mediante el AIC y BIC:
C odigo R 5.4.
#Calculo de AIC y BIC para los tres modelos
AICS=c(AIC(modelo1),AIC(modelo2),AIC(modelo3))
log.n=log(length(salario))
BICS=c(AIC(modelo1,k=log.n),AIC(modelo2,k=log.n),AIC(modelo3,k=log.n))
criterios = rbind(AICS, BICS)
colnames(criterios) = c("lineal","cuadratico","cubico")
rownames(criterios) = c("AIC","BIC")
Salida R 5.2.
(criterios)
lineal cuadratico cubico
AIC 656.7182 656.0298 634.1352
BIC 698.1981 700.4725 681.5407
Parece que el mejor ajuste es logrado por el modelo de tendencia c ubica.
5.2.2. Modelaci on de la estacionalidad mediante funciones trigonom etri-
cas
Con las variables indicadoras, un par ametros es usado para representar
cada estaci on a no tras a no. Sin embargo, los efectos estacionales pueden vari-
ar levemente de a no a a no, de modo que resulta m as conveniente usar una
fuci on suave en lugar de ndices separados para cada estaci on. Las funciones
seno y coseno son utiles para representar las variaciones suaves en un modelo
estacional.
Recordemos que una onda arm onica sinusoidal de frecuencia F (o perodo
T = 1/F), amplitud A y fase , describe un ciclo repetitivo de la forma
Asin(2Ft + ) = sin(2Ft) + cos(2Ft) (5.12)
con = Acos y = Asin . La expresi on del lado derecho de la ecuaci on an-
terior es la que se utiliza en un modelo de regresi on para representar la esta-
cionalidad mediante funciones trigonom etricas, con t variando en los enteros.
En general, las funciones seno y coseno sirven para generar series estacionales
puras.
Sea Y
t
una serie con componente de tendencia T
t
(incluyendo el t ermino
constante
0
) y componente estacional aditiva S
t
de perodo s. Entonces existen
k = [s/2] ciclos posibles, donde [s/2] representa la parte entera de s/2. Un
modelo estacional para Y
t
es
Y
t
= T
t
+
k
j=1
_
j
sin
_
2jt
s
_
+
j
cos
_
2jt
s
__
+ E
t
(5.13)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z

ON 115
Para s par, en el valor j = s/2 la funci on seno ser a igual a cero para todo t Z,
luego, podemo eliminar tal t ermino del modelo. Por ejemplo, considere una
serie de tendencia lineal y estacionalidad trimestral (s = 4) aditiva, entonces,
k = s/2 = 2 y tenemos de la ecuaci on (5.13):
Y
t
=
0
+
1
t +
1
sin
_
t
2
_
+
1
cos
_
t
2
_
+
2
cos (t) + E
t
, (5.14)
desde que sin (t) = 0 t Z. Si la estacionalidad es mensual, tendriamos que:
Y
t
=
0
+
1
t +
1
sin
_
t
6
_
+
1
cos
_
t
6
_
+
2
sin
_
t
3
_
+
2
cos
_
t
3
_
+
3
sin
_
t
2
_
+
3
cos
_
t
2
_
+
4
sin
_
2t
3
_
+
4
cos
_
2t
3
_
+
5
sin
_
5t
6
_
+
5
cos
_
5t
6
_
+
6
cos(t) + E
t
. (5.15)
Observe que al igual al modelo con variables indicadoras, se usan aqu s 1
funciones para representar la componente estacional, cada una deniendo
una variable explicatoria en el modelo de regresi on.
Ejemplo:
Considere de nuevo la serie del ndice de salario real. Vamos a ajustar
los tres modelos (con tendencia lineal, cuadr atica y c ubica) antes considera-
dos pero usando para la estacionalidad, funciones trigonom etricas. El modelo
de tendencia lineal corresponde a la ecuaci on en (5.15), los dem as adicio-
nan el t ermino cuadr atico y c ubico. Para las 11 funciones trigonom etricas
en (5.15), denimos respectivamente en R, las variables sen1, cos1, sen2,
cos2, sen3, cos3, sen4, cos4, sen5, cos5, cos6:
C odigo R 5.5.
#Definiendo variables trigonometricas
sen1=sin(pi
*
t/6)
cos1=cos(pi
*
t/6)
sen2=sin(pi
*
t/3)
cos2=cos(pi
*
t/3)
sen3=sin(pi
*
t/2)
cos3=cos(pi
*
t/2)
sen4=sin(2
*
pi
*
t/3)
cos4=cos(2
*
pi
*
t/3)
sen5=sin(5
*
pi
*
t/6)
cos5=cos(5
*
pi
*
t/6)
cos6=cos(pi
*
t)
#Ajuste con variables trigonometricas
modelo1b=lm(salariot+sen1+cos1+sen2+cos2+sen3+cos3+sen4+cos4+sen5+cos5+cos6)
modelo2b=lm(salariot+I(t2)+sen1+cos1+sen2+cos2+sen3+cos3+sen4+cos4+sen5+cos5+cos6)
modelo3b=lm(salariot+I(t2)+I(t3)+sen1+cos1+sen2+cos2+sen3+cos3+sen4+cos4+sen5+cos5+cos6)
summary(modelo1b)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
116 CAP
ITULO 5. MODELACI
summary(modelo2b)
summary(modelo3b)
#Graficos de residuales
nf=layout(rbind(c(1,1,2,2),c(3,3,4,4),c(5,5,6,6)))
plot.ts(residuals(modelo1b),lwd=2)
abline(h=0,lty=2)
plot(fitted(modelo1b),residuals(modelo1b))
abline(h=0,lty=2)
abline(h=0,lty=2)
abline(h=0,lty=2)
abline(h=0,lty=2)
abline(h=0,lty=2)
#Graficos series ajustadas
lines(t,fitted(modelo1b),lwd=2,col="red")
legend("topleft",legend=c("Original","modelo1b"),col=c(1,2),lwd=2)
#Calculo de AIC y BIC para los tres modelos con variables trigonometricas
AICSb=c(AIC(modelo1b),AIC(modelo2b),AIC(modelo3b))
log.n=log(length(salario))
BICSb=c(AIC(modelo1b,k=log.n),AIC(modelo2b,k=log.n),AIC(modelo3b,k=log.n))
criteriosb = rbind(AICSb, BICSb)
colnames(criteriosb) = c("lineal","cuadratico","cubico")
rownames(criteriosb) = c("AIC","BIC")
#Tabla de valores AIC y BIC
(criteriosb)
Los resultados num ericos y gr acos se presentan a continuaci on. Compare
con los obtenidos usando indicadoras para la estacionalidad. B asicamente
ambas metodologas dan los mismos resultados con cada modelo, excepto que
los coecientes del intercepto y los asociados a la estacionalidad no tienen el
mismo signicado, pero al detallar la ecuaci on de la serie en cada estaci on,
se llega al mismo resultado, en los modelos de tendencia lineal, cuadr atica y
c ubica, respectivamente.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z

ON 117
modelo1b: Tendencia lineal
(Intercept) 95.1268 0.3852 246.92 0.0000
t 0.2676 0.0046 57.62 0.0000
sen1 0.0057 0.2700 0.02 0.9832
cos1 -2.4087 0.2715 -8.87 0.0000
sen2 -1.5828 0.2696 -5.87 0.0000
cos2 -2.3583 0.2715 -8.69 0.0000
sen3 -1.9412 0.2695 -7.20 0.0000
cos3 -1.0815 0.2715 -3.98 0.0001
sen4 -1.6609 0.2695 -6.16 0.0000
cos4 -0.6007 0.2715 -2.21 0.0287
sen5 -0.5303 0.2695 -1.97 0.0512
cos5 0.0766 0.2715 0.28 0.7783
cos6 0.1209 0.1913 0.63 0.5283
modelo2b: Tendencia cuadr atica
(Intercept) 95.8074 0.5797 165.28 0.0000
t 0.2395 0.0186 12.89 0.0000
I(t2) 0.0002 0.0001 1.56 0.1201
sen1 0.0057 0.2685 0.02 0.9831
cos1 -2.4014 0.2700 -8.89 0.0000
sen2 -1.5828 0.2681 -5.90 0.0000
cos2 -2.3489 0.2701 -8.70 0.0000
sen3 -1.9412 0.2680 -7.24 0.0000
cos3 -1.0717 0.2701 -3.97 0.0001
sen4 -1.6609 0.2680 -6.20 0.0000
cos4 -0.5908 0.2701 -2.19 0.0305
sen5 -0.5303 0.2680 -1.98 0.0500
cos5 0.0865 0.2701 0.32 0.7491
cos6 0.1259 0.1902 0.66 0.5092
modelo3b: Tendencia c ubica
(Intercept) 98.1735 0.7259 135.23 0.0000
t 0.0466 0.0435 1.07 0.2867
I(t2) 0.0035 0.0007 5.04 0.0000
I(t3) -0.0000 0.0000 -4.82 0.0000
sen1 -0.1156 0.2492 -0.46 0.6435
cos1 -2.4014 0.2494 -9.63 0.0000
sen2 -1.6395 0.2479 -6.61 0.0000
cos2 -2.3489 0.2494 -9.42 0.0000
sen3 -1.9741 0.2476 -7.97 0.0000
cos3 -1.0717 0.2494 -4.30 0.0000
sen4 -1.6798 0.2475 -6.79 0.0000
cos4 -0.5908 0.2494 -2.37 0.0193
sen5 -0.5391 0.2475 -2.18 0.0312
cos5 0.0865 0.2494 0.35 0.7291
cos6 0.1259 0.1757 0.72 0.4748
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
118 CAP
ITULO 5. MODELACI
AICs y BICs modelos con
funciones trigonom etricas
lineal cuadr atico c ubico
AIC 656.72 656.03 634.14
BIC 698.20 700.47 681.54
Time
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
1
b
)
0 20 40 60 80 100 120 140
4
0
2
4
6
90 100 110 120 130
4
0
2
4
6
fitted(modelo1b)
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
1
b
)
Time
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
2
b
)
0 20 40 60 80 100 120 140
4
0
2
4
6
90 100 110 120 130
4
0
2
4
6
fitted(modelo2b)
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
2
b
)
Time
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
3
b
)
0 20 40 60 80 100 120 140
4
0
2
4
6
90 100 110 120 130
4
0
2
4
6
fitted(modelo3b)
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
3
b
)
Figura 5.3: Gr acos de residuales de los tres modelos ajustados a la serie de salario, con
funciones trigonom etricas.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z

ON 119
0 20 40 60 80 100 120 140
9
0
1
0
0
1
1
0
1
2
0
1
3
0
t
s
a
l
a
r
i
o
Original
modelo1b
0 20 40 60 80 100 120 140
9
0
1
0
0
1
1
0
1
2
0
1
3
0
t
s
a
l
a
r
i
o
Original
modelo2b
0 20 40 60 80 100 120 140
9
0
1
0
0
1
1
0
1
2
0
1
3
0
t
s
a
l
a
r
i
o
Original
modelo3b
Figura 5.4: Gr acos de la serie real y ajustada seg un los tres modelos considerados para
la serie de salario, con funciones trigonom etricas.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
120 CAP
ITULO 5. MODELACI
5.3. Evaluaci on de la estabilidad de los modelos de pron osti-
co
Cuando utilizamos un modelo de regresi on para el ajuste de una serie de
tiempo, asumimos que las relaciones establecidas por tal modelo son estables
a lo largo del tiempo, esto es, que los par ametros del modelo no cambian.
Sin embargo, como lo establece Diebold [3], las relaciones comerciales, indus-
triales y econ omicas pueden variar por lo que es necesario evaluar e identi-
car los par ametros del modelo que son variables en el tiempo, en particular,
cuando este contiene una componente estacional, ya que esta puede no ser
constante debido a que evoluciona con el paso del tiempo.
Para evaluar la estabilidad de un modelo, existe la metodologa denomina-
da estimaci on recursiva y la evaluaci on de residuales recursivos. Considere el
siguiente modelo de regresi on
Y
t
= x
t
t
t
+ E
t
, t = 1, , n, (5.16)
donde, para el tiempo t, Y
t
es la observaci on de la variable dependiente, x
t
es el vector de observaciones en p + 1 regresores no aleatorios (p variables
explicatorias y la columna de unos de la matriz de dise no), con x
1t
= 1 t (aso-
ciado al t ermino constante o intercepto del modelo), y el vector de par ametros
t
= {
0,t
,
1,t
, ,
p,t
} escrito con el subndice t para indicar que puede variar
con el tiempo. Asumimos que los t erminos de error E
t
son independientes,
distribudos normales con media cero y varianza constante. Queremos probar
que
H
0
:
t
= , t = 1, , n, (5.17)
esto es, que el vector de par ametros no cambia con t (por lo menos dentro de
la muestra de tama no n). Para probar esta hip otesis se procede a estimar en
forma recursiva el modelo de regresi on est andar: Y
t
= x
t
t
+ E
t
, t = 1, , m,
con k m n, y k > p + 1, es decir, en lugar de usar toda la muestra, se
utiliza un subconjunto menor de las observaciones, respetando la secuencia
temporal de los datos. Entonces,
1. iniciamos haciendo la regresi on con las m = k primeras observaciones,
k > p + 1, de lo cual obtenemos el vector de par ametros estimados

k
.
2. A continuaci on repetimos la estimaci on con las m = k +1 primeras obser-
vaciones, obteniendo el vector de par ametros estimados

k+1
.
3. Continuamos con la estimaci on con los dem as valores de m = k +2, , n.
4. Con los anterior obtenemos para cada uno de los par ametros del modelo
una sucesi on de valores estimados, {
i,k
,

i,k+1
, ,

i,n
}, i = 0, , p que
constituyen los estimadores recursivos de los par ametros.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
5.3. EVALUACI

ON DE LA ESTABILIDADDE LOS MODELOS DE PRON

OSTICO121
En cada m = k, k + 1, , n 1 podemos calcular un error de pron ostico a
un paso adelante, es decir, con los par ametros ajustados con los m primeros
datos, construimos el pron ostico para Y
m+1
,

Y
m+1
= x
t
m+1
m
, de donde el error
de pron ostico es
e
m+1,m
= Y
m+1

Y
m+1
= Y
m+1
x
t
m+1
m
, (5.18)
estos son denominados los residuales recursivos. Se preere trabajar con la
versi on estandarizada de estos residuales: Sea
m
= (X
m
t
X
m
)
1
X
t
m
Y
m
el estimador de mnimos cuadrados del vector de par ametros basado en las
primeras m observaciones, con Y
t
m
= [Y
1
, , Y
m
] (el vector respuesta con las
m primeras observaciones), X
t
m
= [x
1
, , x
m
] (la matrix de dise no con las m
primeras observaciones); asumimos que (X
m
t
X
m
)
1
existe y que la varianza
del modelo es constante. Entonces, la varianza de e
m+1,m
es
VAR( e
m+1,m
) =
2
[1 +x
t
m+1
(X
m
t
X
m
)
1
x
m+1
] (5.19)
Entonces, los residuales recursivo estandarizados corresponden a
w
m+1,m
=
e
m+1,m
_
VAR( e
m+1,m
)
. (5.20)
Se ha mostrado que bajo H
0
, y el supuesto de normalidad, w
m+1,m
son variables
aleatorias normales independientes e id enticamente distribuidos, con media
cero y varianza unitaria.
Nota: Desde que
2
es desconocido, se estima como la varianza del modelo
de regresi on ajustado con todos los datos, entonces consideramos a
w
m+1,m
=
e
m+1,m
_
VAR( e
m+1,m
)
. (5.21)
La suma acumulada de los residuales recursivos estandarizados tiene utilidad
especial para evaluar la estabilidad de los par ametros del modelo de regresi on
usando el siguiente estadstico:
CUSUM
t
=
t
m=k
w
m+1,m
, para t = k, , n 1 (5.22)
para este estadstico se tiene que bajo los supuestos de normalidad, indepen-
dencia y estabilidad del vector de par ametros a lo largo del tiempo, E[CUSUM
t
] =
0, VAR(CUSUM
t
) = t p 1.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
122 CAP
ITULO 5. MODELACI
Los valores crticos para el estadstico CUSUM
t
son
a
_
_
n p 1 + 2
t p 1
n p 1
_
(5.23)
donde a = 1.143 para un nivel de signicancia = 0.01; a = 0.948 para = 0.05 y
a = 0.850 para = 0.1. En la pr actica, se graca la serie del estadstico CUSUM
t
versus t, junto con las rectas denidas por los dos lmites crticos en (5.23).
Si
t
es constante hasta un tiempo t = t
0
, entonces los estadsticos CUSUM
t
tendr an media cero hasta ese tiempo y en general tendr an medias no nula
subsecuentemente, luego la hip otesis de estabilidad es rechazada cuando se
observe un corte de los lmites crticos para la serie de CUSUM
t
.
Nota: Con el test CUSUM se prueba la hip otesis nula H
0
:
t
= , t = 1, , n,
probando que E[CUSUM
t
] = 0, t = 1, , n,.
5.3.1. Ejemplo 1:
Considere la serie mensual representada en la Figura 5.5, la cual fue sim-
ulada bajo el modelo Y
t
= 3500 + 200t + E
t
, E
t
N(0, (4000)
2
), con n = 300
observaciones.
Serie simulada Y
t
= 3500 + 200t + E
t
Time
y
t
1980 1985 1990 1995 2000 2005
0
1
0
0
0
0
2
0
0
0
0
3
0
0
0
0
4
0
0
0
0
5
0
0
0
0
6
0
0
0
0
7
0
0
0
0
Figura 5.5: Gr aco de 300 observaciones de la serie simulada Y
t
= 3500 + 200t + E
t
, E
t

N(0, (4000)
2
).
Es claro que el mejor modelo para esta serie es el de tendencia lineal sin
estacionalidad, La siguiente tabla resume los resultados del ajuste:
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
5.3. EVALUACI


OSTICO123
Par ametros estimados (con todos los datos)
(Intercept) 3029.4512 460.5818 6.58 0.0000
t 201.6341 2.6525 76.02 0.0000
Para el an alisis de la estabilidad de los par ametros (intercepto y pendiente
en este caso), aplicamos el siguiente c odigo R:
C odigo R 5.6.
yt=scan(file.choose()) #leer archivo datossimuleje1recursivos.txt
yt=ts(yt,freq=12,start=c(1980,1))
t=1:length(yt)
regresion=lm(ytt)
#Funcion para realizar las regresiones recursivas
#esta funcion debe ser personalizada segun el modelo de la serie
estim=function(n){
modelo=lm(yt[1:n]t[1:n])
resul=cbind(coef(modelo),confint(modelo))
resul
}
#Definiendo los tamanos de muestras para las regresiones recursivas
#desde n=p+1=3, hasta la longitud de la serie
n=matrix(3:length(yt),ncol=1)
#Realizando las regresiones recursivas;
#el primer numero en el argumento dim=c(2,3,nrow(n)) corresponde a p+1=2
b=array(apply(n,1,estim),dim=c(2,3,nrow(n)))
#Extrayendo informacion de los interceptos: fila1: estimacion, fila2:LI, fila3:LS
betas0=b[1,,]
#Extrayendo informacion de la pendiente: fila1: estimacion, fila2:LI, fila3:LS
betas1=b[2,,]
#Graficando los beta0 y sus I.C del 95%
matplot(n,t(betas0),type=l,lty=c(1,2,2),col=1,lwd=1.5,ylab=expression(hat(beta)[0]))
abline(h=3500,lty=1,col=2,lwd=2)
legend("topright",legend=expression(beta[0]==3500),lwd=2,col=2)
matplot(n,t(betas1),ylim=c(-500,500),type=l,lty=c(1,2,2),col=1,lwd=1.5,
ylab=expression(hat(beta)[1]))
abline(h=200,lty=1,col=2,lwd=2)
legend("topright",legend=expression(beta[1]==200),lwd=2,col=2)
#Obtencion de residuales recursivos y graficos CUSUMt
library(strucchange)
rr=recresid(regresion)
nf=layout(rbind(c(1,1),c(2,2)))
plot(rr, type = "l",ylab="Residuales recursivos",xlab="t")
abline(h=0,col=2,lwd=2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
124 CAP
ITULO 5. MODELACI
plot(efp(ytt, type = "Rec-CUSUM"),lwd=2)
#Test CUSUM recursivo para cambio estructural
sctest(ytt)
La ultima lnea del c odigo anterior produce un test para probar la estabili-
dad del modelo, sus resultados son:
Test CUSUM recursivo
Estadstico ValorP M etodo
S 0.35 0.92 Recursive CUSUM test
Esta prueba nos dice que no hay cambios estructurales en el modelo, lo
cual tambi en es visto a trav es de las siguientes gr acas, obtenidas con el
c odigo R dado:
0 50 100 150 200 250 300
1
0
0
0
0
0
1
0
0
0
0
2
0
0
0
0
n
^
0
0
= 3500
Figura 5.6: Gr aco de interceptos estimados recursivamente, para serie simulada Y
t
=
3500 + 200t +E
t
, E
t
N(0, (4000)
2
).
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
5.3. EVALUACI


OSTICO125
0 50 100 150 200 250 300
4
0
0
2
0
0
0
2
0
0
4
0
0
n
^
1
1
= 200
Figura 5.7: Gr aco de pendientes estimadas recursivamente, para serie simulada Y
t
=
3500 + 200t +E
t
, E
t
N(0, (4000)
2
).
0 50 100 150 200 250 300
1
0
0
0
0
0
5
0
0
0
t
R
e
s
i
d
u
a
l
e
s

r
e
c
u
r
s
i
v
o
s
Recursive CUSUM test
Time
E
m
p
i
r
i
c
a
l

f
l
u
c
t
u
a
t
i
o
n

p
r
o
c
e
s
s
1980 1985 1990 1995 2000 2005
1
0
1
2
3
Figura 5.8: Gr aco residuales recursivos y CUSUM
t
t
= 3500 +
200t +E
t
, E
t
N(0, (4000)
2
).
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
126 CAP
ITULO 5. MODELACI
5.3.2. Ejemplo 2:
Considere ahora la serie mensual representada en la Figura 5.9, la cual
fue simulada bajo el modelo Y
t
= 18500 + 50t + E
t
, para 1 t 150, Y
t
=
18500 + 200t + E
t
, para 151 t 300, E
t
N(0, (4000)
2
).
Serie simulada Y
t
= 18500 + 50t + E
t
t 150, Y
t
= 18500 + 200t + E
t
t > 150
Time
y
t
2
1980 1985 1990 1995 2000 2005
2
0
0
0
0
4
0
0
0
0
6
0
0
0
0
8
0
0
0
0
Figura 5.9: Gr aco de 300 observaciones de la serie simulada Y
t
= 18500 + 50t + E
t
, para
1 t 150, Y
t
= 18500 + 200t +E
t
, para 151 t 300, E
t
N(0, (4000)
2
).
Es claro que en este caso existe un punto de ruptura o cambio del modelo,
en t = 150. Esta situaci on se ve reejada claramente tanto en el test CUSUMre-
cursivo para estabilidad, como en las gr acas del procedimiento de estimaci on
recursiva (la programaci on R usada es muy similar a la dada en el C odigo R
5.6).
(Intercept) 6754.3006 889.6451 7.59 0.0000
t 238.8314 5.1236 46.61 0.0000
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
5.3. EVALUACI


OSTICO127
0 50 100 150 200 250 300
2
0
0
0
0
0
2
0
0
0
0
4
0
0
0
0
6
0
0
0
0
n
^
0
0
= 18500
Figura 5.10: Gr aco de interceptos estimados recursivamente, para serie simulada Y
t
=
18500 + 50t + E
t
, para 1 t 150, Y
t
= 18500 + 200t + E
t
, para 151 t 300,
E
t
N(0, (4000)
2
).
0 50 100 150 200 250 300
4
0
0
2
0
0
0
2
0
0
n
^
1
1
= 50
Figura 5.11: Gr aco de pendientes estimadas recursivamente, para serie simulada Y
t
=
18500 + 50t + E
t
, para 1 t 150, Y
t
= 18500 + 200t + E
t
, para 151 t 300,
E
t
N(0, (4000)
2
).
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
128 CAP
ITULO 5. MODELACI
0 50 100 150 200 250 300
1
0
0
0
0
0
1
0
0
0
0
2
0
0
0
0
t
R
e
s
i
d
u
a
l
e
s

r
e
c
u
r
s
i
v
o
s
Time
E
m
p
i
r
i
c
a
l

f
l
u
c
t
u
a
t
i
o
n

p
r
o
c
e
s
s
1980 1985 1990 1995 2000 2005
2
0
2
4
6
8
Figura 5.12: Gr aco residuales recursivos y CUSUM
t
t
= 18500 +
50t + E
t
, para 1 t 150, Y
t
= 18500 + 200t + E
t
, para 151 t 300, E
t

N(0, (4000)
2
).
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
5.3. EVALUACI


OSTICO129
5.3.3. Ejemplo: Ajuste de una serie estacional multiplicativa
Considere la serie de la produccion trimestral de cemento portland, en
miles de toneladas, periodo: Q1:56-Q3:94 (los datos aparecen en la progr-
maci on R) que se ilustra en la Figura 5.13. Claramente, la serie es estacional
(la frecuencia es s = 4) de componentes multiplicativas ya que su variabilidad
incrementa con la tendencia creciente. Para la serie del logaritmo observa-
mos una mejora en cuanto a la varianza, sin embargo parece que a un hay
problemas.
Produccin trimestral cemento portland
Miles de ton. Q11956Q31994
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Log de produccin trimestral cemento portland
Q11956Q31994
Time
l
n
y
t
1960 1970 1980 1990
6
.
5
7
.
0
7
.
5
Figura 5.13: Gr aco serie de producci on trimestral de cemento portland y de su logaritmo
Modelaremos la serie de los logartimos. Para una mejor identicaci on de
su tendencia procedemos con la descomposici on stl, presentada en la Figura
5.14. Aparentemente, la tendencia puede ser modelada por un polinomio de
grado 2 en t. Ajustamos entonces un modelo de tendencia cuadr atica y esta-
cionalidad trimestral usando variables indicadoras: log(Y
t
) =
0
+
1
t +
2
t
2
+
3
i=1
i
I
i,t
+E
t
, E
t
N(0,
2
). Los resultados de este ajuste se presentan a contin-
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
130 CAP
ITULO 5. MODELACI
uaci on:
(Intercept) 6.3180 0.0209 302.32 0.0000
t 0.0150 0.0005 28.14 0.0000
I(t2) -0.0001 0.0000 -15.91 0.0000
trimestre1Q -0.1343 0.0168 -8.01 0.0000
trimestre2Q -0.0191 0.0168 -1.14 0.2554
trimestre3Q 0.0168 0.0168 1.00 0.3168
Log de Produccin trimestral cemento portland
Q11956Q31994
6
.
5
7
.
0
7
.
5
d
a
t
a
0
.
1
0
0
.
0
5
0
.
0
0
0
.
0
5
s
e
a
s
o
n
a
l
6
.
2
6
.
6
7
.
0
7
.
4
t
r
e
n
d
0
.
0
6
0
.
0
2
0
.
0
2
1960 1970 1980 1990
r
e
m
a
i
n
d
e
r
time
Figura 5.14: Descomposici on stl de la serie de logaritmos de la producci on trimestral ce-
mento portland.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
5.3. EVALUACI


OSTICO131
Los gr acos de los residuales del modelo ajustado son presentados en la
Figura 5.15 Qu e podemos concluir de las dos gr acas de residuales?
0 50 100 150
0
.
2
0
.
1
0
.
0
0
.
1
0
.
2
t
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
1
)
6.2 6.4 6.6 6.8 7.0 7.2 7.4
0
.
2
0
.
1
0
.
0
0
.
1
0
.
2
fitted(modelo1)
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
1
)
Figura 5.15: Residuales ajuste de la serie de logaritmos de la producci on trimestral ce-
mento portland.
Para el an alisis de la estabilidad del modelo, considere las Figuras 5.16,
5.17, y 5.18 y los resultados del test CUSUM recursivo:
Qu e conclusiones extraemos de estos resultados?
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
132 CAP
ITULO 5. MODELACI
50 100 150
6
.
0
5
6
.
1
0
6
.
1
5
6
.
2
0
6
.
2
5
6
.
3
0
6
.
3
5
n
^
0
con todos los datos
^
0
= 6.318034
50 100 150
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
n
^
1
con todos los datos,
^
1
= 0.01495135
50 100 150
1
e
0
3
5
e
0
4
0
e
+
0
0
5
e
0
4
n
^
2
^
2
= 5.248589e05
Figura 5.16: Estimaci on recursiva de los par ametros de la tendencia, ajuste de la serie de
logaritmos de la producci on trimestral cemento portland.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
5.3. EVALUACI


OSTICO133
50 100 150
0
.
1
5
0
.
1
0
0
.
0
5
n
^
1
^
1
= 0.134269
50 100 150
0
.
0
4
0
.
0
0
0
.
0
4
0
.
0
8
n
^
2
^
2
= 0.01913897
50 100 150
0
.
0
4
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
n
^
3
^
3
= 0.01683978
Figura 5.17: Estimaci on recursiva de los par ametros de la estacionalidad, ajuste de la
serie de logaritmos de la producci on trimestral cemento portland.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
134 CAP
ITULO 5. MODELACI
0 50 100 150
0
.
2
0
.
1
0
.
0
0
.
1
0
.
2
t
R
e
s
i
d
u
a
l
e
s

r
e
c
u
r
s
i
v
o
s
Time
E
m
p
i
r
i
c
a
l

f
l
u
c
t
u
a
t
i
o
n

p
r
o
c
e
s
s
1960 1970 1980 1990
1
0
1
2
3
Figura 5.18: Residuales recursivos y test CUSUM, ajuste de la serie de logaritmos de la
producci on trimestral cemento portland.
A continuaci on el c odigo R usado para este ejemplo:
C odigo R 5.7.
#LECTURA Y GRAFICACI
ON DE LA SERIE
yt=scan()
465 532 561 570 529 604 603 582 554 620 646
637 573 673 690 681 621 698 753 728 688 737
782 692 637 757 783 757 674 734 835 838 797
904 949 975 902 974 969 967 849 961 966 922
836 998 1025 971 892 973 1047 1017 948 1032
1190 1136 1049 1134 1229 1188 1058 1209 1199
1253 1070 1282 1303 1281 1148 1305 1342 1452
1184 1352 1316 1353 1121 1297 1318 1281 1109
1299 1341 1290 1101 1284 1321 1317 1122 1261
1312 1298 1202 1302 1377 1359 1232 1386 1440
1439 1282 1573 1533 1651 1347 1575 1475 1357
1086 1158 1279 1313 1166 1373 1456 1496 1251
1456 1631 1554 1347 1516 1546 1564 1333 1458
1499 1613 1416 1625 1770 1791 1622 1719 1972
1893 1575 1644 1658 1668 1343 1441 1444 1497
1267 1501 1538 1569 1450 1569 1648 1777 1468
1732 1962
yt=ts(yt,frequency=4,start=c(1956,1))
#TRANSFORMACI
ON LOGAR
ITMICA Y DESCOMPOSICI
ON DE LA SERIE TRANSFORMADA
lnyt=log(yt)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
5.3. EVALUACI


OSTICO135
plot(yt, lwd=2,main="Produccion trimestral cemento portland\n Miles de ton. Q11956-Q31994")
plot(lnyt,lwd=2,main="Log de produccion trimestral cemento portland\nQ11956-Q31994")
#DESCOMPOSICI
ON DE LA SERIE DE LOGARITMOS
componlnyt=stl(lnyt,s.window="periodic")
plot(componlnyt,lwd=2,main="Log de Produccion trimestral cemento portland\nQ11956-Q31994")
#DEFINIENDO VARIABLE ASOCIADA A LA ESTACIONALIDAD Y
#TOMANDO EL CUARTO TRIMESTRE COMO ESTACI
ON DE REFERENCIA
library(TSA)
trimestre=season(lnyt)
trimestre=relevel(trimestre,ref="4Q")
#DEFINIENDO

INDICE DE TIEMPO
t=1:length(lnyt)
#AJUSTANDO MODELO AL LOG(Yt) CON TENDENCIA CUADR
ATICA Y ESTACIONALIDAD TRIMESTRAL

modelo1=lm(lnytt+I(t2)+trimestre)
summary(modelo1)
plot(t,residuals(modelo1),type="o",lwd=2); abline(h=0,lty=2)
plot(fitted(modelo1),residuals(modelo1),type="p",lwd=2); abline(h=0,lty=2)
#ESTIMACI
ON RECURSIVA PARA AN
ALISIS DE ESTABILIDAD DEL MODELO

estim=function(n){
modelo=lm(lnyt[1:n]t[1:n]+I(t2)[1:n]+trimestre[1:n])
resul=cbind(coef(modelo),confint(modelo))
resul
}
#tomar mnimo n=max(2
*
s,p+1), s=No. perodos estacionales y p=No. de regresoras
n=matrix(8:length(lnyt),ncol=1)
#En argumento dim=c(6,3,nrow(n)), laprimera cifra (6) es el numero de parametros del modelo
b=array(apply(n,1,estim),dim=c(6,3,nrow(n)))
#informacion de los interceptos: fila1: estimacion, fila2:LI, fila3:LS
betas0=b[1,,]
#informacion de beta1: fila1: estimaci on, fila2:LI, fila3:LS
betas1=b[2,,]
#informacion de beta2: fila1: estimaci on, fila2:LI, fila3:LS
betas2=b[3,,]
#informacion de delta1: fila1: estimacion, fila2:LI, fila3:LS
deltas1=b[4,,]
deltas2=b[5,,]
deltas3=b[6,,]
abline(h=coef(modelo1)[[1]],lty=1,col=2,lwd=2)
text(80,coef(modelo1)[[1]],expression(paste("con todos los datos",sep=" ",hat(beta)[0]==6.318034)),pos=3)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
136 CAP
ITULO 5. MODELACI
text(80,0.0005,expression(paste("con todos los datos,",sep=" ",hat(beta)[1]==0.01495135)),pos=3)
matplot(n,t(betas2),type=l,lty=c(1,2,2),ylim=c(-0.001,max(betas2)),col=1,lwd=1.5,
ylab=expression(hat(beta)[2]))
text(100,0.0000002,expression(paste("con todos los datos,",sep=" ",hat(beta)[2]==-5.248589e-05)),pos=3)
#Graficando los delta1 y sus I.C del 95%
matplot(n,t(deltas1),type=l,lty=c(1,2,2),col=1,lwd=1.5,ylab=expression(hat(delta)[1]))
text(70,-0.13,expression(paste("con todos los datos,",sep=" ",hat(delta)[1]== -0.1342690)),pos=3)
text(70,-0.02,expression(paste("con todos los datos,",sep=" ",hat(delta)[2]==-0.01913897)),pos=3)
text(70,0.001,expression(paste("con todos los datos,",sep=" ",hat(delta)[3]==0.01683978)),pos=3)
#Obtencion de residuales recursivos y graficos CUSUMt
library(strucchange)
rr=recresid(modelo1)
plot(rr, type = "l",ylab="Residuales recursivos",xlab="t")
abline(h=0,col=2,lwd=2)
plot(efp(lnytt+I(t2)+trimestre, type = "Rec-CUSUM"),lwd=2)
#Test CUSUM recursivo para cambio estructural
test=sctest(lnyt1+t+I(t2)+trimestre)
test
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
5.4. PRECISI

ON DE LOS MODELOS DE PRON

OSTICO 137
Observe m as en detalle la componente de tendencia de la serie de produc-
ci on trimestral de cemento, obtenida con la funci on R decompose() y exhibida
en la Figura 5.19, y la serie original y ajustada (valores ajustados destransfor-
mados con exponenciaci on, ver en c odigo R siguiente) en la Figura 5.20. Es
clara la existencia de ciclos? Cree ud. que hay un buen ajuste con el modelo
log-lineal? es apropiado un modelo global para esta serie?
C odigo R 5.8.
#GR
AFICA DE LA COMPONENTE DE TENDENCIA

plot(decompose(yt,type="multiplicative")$trend,
main="Componente Tendencia serie trimestral de cemento portland",ylab=expression(hat(T)[t]),lwd=2)
#GR
AFICA SERIE ORIGINAL Y AJUSTADA POR REGRESI
ON CON TODAS LAS OBSERVACIONES

plot(yt)
lines(time(yt)[1:length(yt)],exp(fitted(modelo1)),col=2,lwd=2)
legend("topleft",legend=c("Original","ajustado"),lty=c(1,1),lwd=c(1,2),col=c(1,2))
Componente Tendencia serie trimestral de cemento portland
Time
T ^
t
1960 1970 1980 1990
6
0
0
8
0
0
1
0
0
0
1
2
0
0
1
4
0
0
1
6
0
0
1
8
0
0
Figura 5.19: Componente de tendencia serie trimestral de producci on de cemento port-
land, estimada por descomposici on.
5.4. Precisi on de los modelos de pron ostico
Cuando pronosticamos incurrimos en un error de pron ostico. La exactitud
de un modelo depende de cu an cercano est an los pron osticos a los verdaderos
valores. Si pronosticamos un periodo adelante de t = n+j, el error de pron osti-
co correspondiente ser a:
e
n+j
(1) = Y
n+j+1

Y
n+j
(1), j = 0, 1, (5.24)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
138 CAP
ITULO 5. MODELACI
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
ajustado
Figura 5.20: Serie trimestral de producci on de cemento portland y su ajuste por regresi on
donde

Y
n+j
(1) es el pron ostico para Y
n+j+1
con origen de pron ostico en t = n+j.
Suponga que una serie de longitud N es ajustada con las primeras n obser-
vaciones (n < N) y que se pronostican las ultimas m = N n observaciones
con el modelo ajustado en la primera muestra. Denimos el error relativo de
pron ostico para la observaci on Y
n+j+1
, con origen de pron ostico en t = n + j,
j = 0, 1, 2, , m1, como
ER
j
=
e
n+j
(1)
Y
n+j+1
(5.25)
A continuaci on, se denen algunas medidas globales de la precisi on de los
pron osticos para las ultimas m observaciones de la serie, con origen de pron osti-
co en t = n
Se preeren MAE, RMSE, y MAPE porque los errores positivos y negativos
no se compensan. Como criterios para seleccionar entre dos o m as mode-
los, se elige el de menor valor en la medida considerada. No son permitidas
comparaciones entre m etodos de pron ostico alternativos que usen diferentes
transformaciones de los datos. Tampoco es apropiado hacer comparaciones
para variables expresadas en diferentes escalas. Sin embargo las medidas de
precisi on en t erminos relativos son libres de unidades y pueden usarse para
tales comparaciones.
En R podemos calcular las medidas de precisi on de los pron osticos medi-
ante la funci on accuracy() de la librera forecast:
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
5.4. PRECISI

ON DE LOS MODELOS DE PRON

OSTICO 139
Precisi on en los pron osticos de m = perodos despu es de t = n.
Descripci on F ormula
Error promedio de pron ostico ME =
1
m
m1
j=0
e
n+j
(1)
Error promedio absoluto de pron ostico MAE =
1
m
m1
j=0
|e
n+j
(1)|
Raz del error cuadr atico medio (error est andar) RMSE =
1
m
m1
j=0
e
2
n+j
(1)
de pron ostico
Porcentaje medio de error MPE = 100 %
1
m
m1
j=0
ER
j
Porcentaje medio absoluto de error MAPE = 100 %
1
m
m1
j=0
|ER
j
|
accuracy(f, x, test=1:length(x))
Donde
f: Es el vector con los valores pronosticados
x: Es el vector con los valores reales correspondientes a los perodos
pronosticados.
5.4.1. Comparaci on con un modelo de referencia
La comparaci on con un pron ostico de referencia es hecha con el n de
evaluar el incremento en la precisi on de los pron osticos obtenidos con un
modelo dado. Por ejemplo, podemos considerar como referencia el pron ostico
simple, en el cual cada valor es pronosticado con el valor anterior en la serie,
es decir,
Pron ostico simple:

Y
n+j
(1) = Y
n+j
, j = 0, 1, , m1 (5.26)
Luego, el error de pron ostico es
Error pron ostico simple: e
n+j
(1) = Y
n+j+1
Y
n+j
, j = 0, 1, , m1 (5.27)
Para este m etodo el MAPE se denotar a MSIMP.
MSIMP = 100 %
1
m
m1
j=0
Y
n+j+1
Y
n+j
Y
n+j+1
(5.28)
Observe que para calcular MSIMP no se requiere ning un modelo para la serie.
Para calcular esta medida algunos recomiendan considerar la serie sin la com-
ponente estacional, por ejemplo, si la serie es de la forma Y
t
= T
t
+S
t
+E
t
, usar
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
140 CAP
ITULO 5. MODELACI
en lugar de Y
n+j+1
y Y
n+j
a las correspondientes versiones desestacionalizadas,
(Y
n+j+1

S
n+j+1
) y (Y
n+j

S
n+j
).
NOTA: Si el MAPE de un modelo ajustado para una serie con n observa-
ciones muestrales es menor que el MSIMP (MAPE < MSIMP) se justica el
modelo ajustado; si no, no mejora la precisi on del m etodo simple y no se jus-
tica el modelo que se ajust o.
Tenga en cuenta adem as para selecci on entre dos o m as modelos seg un
estadsticos de capacidad de pron ostico lo siguiente:
1. Los modelos a considerar deben cumplir con sus respectivos supuestos
(modelos v alidos).
2. Entre los modelos v alidos, considerar los que son utiles para pronosticar.
Un modelo es util para pron ostico si su MAPE < MSIMP.
3. Entre dos o m as modelos v alidos y utiles, se selecciona el de mayor pre-
cisi on en el ajuste (mejores estadsticos de bondad de ajuste) y que a
su vez tenga mayor precisi on de pron ostico (mejores estadsticos de pre-
cisi on de pron osticos).
5.5. Ajuste por suavizamiento Holt-Winters de series esta-
cionales
El suavizamiento Holt-Winters aplica a series con componente estacional,
con tendencia lineal o cuadr atica, aunque en R s olo est a implementado con
tendencia lineal. Se distinguen dos casos:
Holt-Winters para series estacionales de componentes aditivas;
Holt-Winters para series estacionales de componentes multiplicativas.
5.5.1. Holt-Winters aditivo
Sea L 1. Considere el valor de la serie en t + L,
Y
t+L
=
0
+
1
(t + L) + S
t+L
+ E
t+L
= (
0
+
1
t) +
1
L + S
t+L
+ E
t+L
=
0,t
+
1
L + S
t+L
+ E
t+L
donde
0,t
= (
0
+
1
t) es llamado el nivel de la serie en t. Adicionalmente asuma
que hay una evoluci on lenta en los par ametros del modelo (es decir, pueden
variar con t), entonces escribimos:
Y
t+L
=
0,t
+
1,t
L + S
t+L
+ E
t+L
(5.29)
tenemos,
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
5.5. AJUSTE POR SUAVIZAMIENTOHOLT-WINTERS DE SERIES ESTACIONALES141
0,t
, nivel de la serie en t
1,t
, pendiente o tasa de crecimiento en t
S
t+L
, valor de la estacionalidad en t + L.
Suavizamiento
El m etodo de suavizamiento act ua sobre estas tres componentes suavizan-
do exponencialmente, con par ametro de suavizamiento , , , respectiva-
mente. Estos tres par ametros son escogidos en el intervalo (0, 1), de forma tal
que sea mnimo el MSE del ajuste en la muestra de datos de la serie. Las
ecuaciones de suavizamiento son:
nivel en t :

0,t
= (Y
t

S
ts
) + (1 )(
0,t1
+

1,t1
) (5.30)
pendiente en t :

0,t
= (
0,t
0,t1
) + (1 )
1,t1
(5.31)
Estas dos componentes son actualizadas dentro de cada perodo estacional
completo k, es decir, en t [(k 1)s + 1, k s], k = 1, 2, , [n/s]. Para suavizar la
componente estacional S
t
, dentro de cada perodo estacional completo, calcu-
lamos
S
t
= (Y
t
0,t
) + (1 )
S
ts
(5.32)
De modo que en cada t [(k 1)s + 1, k s], k = 1, 2, , [n/s] s olo se actualiza
una de las s estaciones, aquella que corresponda a dicho tiempo. Concludo
un perodo estacional completo, antes de continuar suavizando, es necesario
estandarizar los ultimos s valores calculados con la ecuaci on anterior, esto es,
reemplazar los resultados dados por (5.32), por
S
t

S
t

S
k
, donde

S
k
=
1
s
ks
j=(k1)s+1
S
j
(5.33)
esto garantiza que en cada perodo estacional completo
ks
j=(k1)s+1
S
j
= 0. Los
valores estandarizados de la estacionalidad son los que se deben usar en las
ecuaciones de suavizamiento del nivel, la pendiente y de la misma estacional-
idad.
Nota: En t = 1 es necesario determinar los valores iniciales

0,0
,

1,0
y los s
valores S
0
, S
1
, , S
1s+1
, S
1s
, que corresponden, respectivamente, al valor de
inicio de la estacionalidad, en la estaci on, s, (s1), , 2, 1. Para ello, con los 2s
primeros datos de la serie (los dos primeros perodos estacionales completos,
desde que t = 1 corresponda a la estaci on 1), podemos:
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
142 CAP
ITULO 5. MODELACI
Realizar una regresi on lineal con variables indicadoras, para el ajuste del
modelo:
Y
t
=
0,0
+
1,0
t +
s1
i=1
i
(I
i,t
I
s,t
) + E
t
y obtenemos

0,0
,

1,0
, y

S
is
=

i
, i = 1, 2, , s 1, y

S
0
=
s1
i=1
i
. O bien,
Realizar una descomposici on usando por ejemplo la funci on decompose().
Adicionalmente, para la componente de tendencia obtenida se aplica re-
gresi on lineal simple para estimar los valores iniciales del nivel y de la
pendiente:

T
t
=
0,0
+
1,0
t + a
t
, a
t
N(0,
2
a
).
C alculos de valores ajustados

Y
t
Para t = 0, 1, , n 1 se calcula
Y
t
(1) =

Y
t+1
=

0,t
+

1,t
1 +

S
t+1s
(5.34)
Pron osticos L perodos adelante de t = n
Los pron osticos fuera de la muestra se construyen como
Y
n
(L) =

Y
n+L
=

0,n
+

1,n
L +

S
n+Ls
, (5.35)
es decir, usamos los ultimos valores suavizados del nivel, la pendiente y la
estacionalidad para pronosticar despu es de t = n. Un intervalo de pron ostico
de (1 )100 % puede construirse como
Y
n
(L) t
/2,n3

_
1 +
L1
j=1
2
(1 +j)
2
, con
2
=
1
n 3
n
t=1
(Y
t

Y
t
)
2
. (5.36)
5.5.2. Holt-Winters multiplicativo
En este caso el modelo global de pron ostico que se considera es:
Y
t+L
= [
0
+
1
(t + L)] S
t+L
+ E
t+L
= [
0,t
+
1
L] S
t+L
+ E
t+L
(5.37)
Con
0,t
=
0
+
1
t. Pero, asumiendo que en general hay una evoluci on lenta de
los par ametros, tenemos
Y
t+L
= [
0,t
+
1,t
L] S
t+L
+ E
t+L
(5.38)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Suavizamiento
Igual al caso aditivo, se suaviza el nivel, la pendiente y la estacionalidad en
cada tiempo t = 1, , n, con p ar ametros de suavizamiento , , , respecti-
vamente, escogidos en el intervalo (0, 1), de forma tal que sea mnimo el MSE
del ajuste en la muestra de datos de la serie. Las ecuaciones de suavizamiento
son:
nivel en t :

0,t
= (Y
t
/
S
ts
) + (1 )(
0,t1
+

1,t1
) (5.39)
pendiente en t :

0,t
= (
0,t
0,t1
) + (1 )
1,t1
(5.40)
Estas dos componentes son actualizadas dentro de cada perodo estacional
completo k, es decir, en t [(k 1)s + 1, k s], k = 1, 2, , [n/s]. Para suavizar la
componente estacional S
t
, dentro de cada perodo estacional completo, calcu-
lamos
S
t
= (Y
t
/
0,t
) + (1 )
S
ts
(5.41)
De modo que en cada t [(k1)s+1, k s], k = 1, 2, , [n/s] s olo se actualiza una
de las s estaciones (la que corresponda a dicho tiempo). Concludo un perodo
estacional completo, antes de continuar suavizando, es necesario normalizar
los ultimos s valores calculados con la ecuaci on anterior, esto es, reemplazar
los resultados dados por (5.41), con
S
t

S
t
s
ks
j=(k1)s+1
S
j
(5.42)
esto garantiza que en cada perodo estacional completo se cumpla la siguiente
igualdad:
ks
j=(k1)s+1
S
j
= s. Los valores normalizados de la estacionalidad son los
que se deben usar en las ecuaciones de suavizamiento del nivel, la pendiente
y de la misma estacionalidad. Tambi en se requiere inicializaci on de

0,0
,

1,0
y los s valores de la componente estacional, para ello se puede recurrir a la
descomposici on cl asica usando los 2s primeros valores de la serie mediante
medias m oviles (usando la funci on R decompose() con tipo multiplicativo).
C alculo de valores ajustados

Y
t
Dentro de la muesta tenemos que Para t = 0, 1, , n se calcula
Y
t
(1) =

Y
t+1
= (
0,t
+

1,t
1)
S
t+1s
(5.43)
Pron osticos L perodos adelante de t = n
Los pron osticos fuera de la muestra se construyen como
Y
n
(L) =

Y
n+L
= (
0,n
+

1,n
L)
S
n+Ls
, (5.44)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
144 CAP
ITULO 5. MODELACI
es decir, usamos los ultimos valores suavizados del nivel, la pendiente y la
estacionalidad para pronosticar despu es de t = n. Un intervalo de pron ostico
de (1 )100 % puede construirse como
Y
n
(L) t
/2,n3

_
C
L

S
2
n+Ls
, (5.45)
con
2
=
1
n 3
n
t=1
_
Y
t

Y
t
Y
t
_
2
y C
L
= (
0,n
+
1,n
L)
2
+
L1
j=1
2
[1+(Lj)]
2
(
0,n
+j
1,n
)
2
.
5.5.3. Suavizamiento Holt-Winters en R
Para el caso aditivo:
HoltWinters(serie,alpha,beta,gamma,seasonal=additive)
Para el caso multiplicativo:
HoltWinters(serie,alpha,beta,gamma,seasonal=multiplicative)
serie debe ser un objeto R tipo serie de tiempo, es decir, denido mediante la
funci on ts(), con la frecuencia correspondiente a la longitud de la estacional-
idad. Si no se especican los valores de los par ametros de suavizamiento, la
funci on realiza internamente un proceso de optimizaci on para obtener los val-
ores de estos par ametros que minimicen el MSE de ajuste.
Cuando se crea un objeto R con esta funci on, en este queda guardada la
siguiente informaci on (con los nombres que el paquete da a cada elemento)
fitted: Una matriz (cada columna es una serie) con columnas para
la serie ltrada, las componentes de nivel, tendencia y estacionalidad,
estimadas contempor aneamente, es decir en el tiempo t y no al nal de
la serie
x: La serie original
alpha: El valor de usado para ltrar el nivel
beta: El valor de usado para ltrar la pendiente
gamma: El valor de usado para ltrar la estacionalidad
coefficients: Un vector con componentes denominadas a (nivel), b
(pendiente), s1, s2,..., ss (valores de las componentes estacionales
para el pron ostico de L = 1, 2, , s perodos siguientes a t = n, respecti-
vamente).
seasonal: Tipo de modelo estacional especicado (aditivo o multiplicati-
vo)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
SSE: Suma de cuadrados del error alcanzada en la optimizaci on usada.
Para la obtenci on de pron osticos y sus intervalos de predicci on del 95%:
predict(objeto, n.ahead=1, prediction.interval = TRUE, level = 0.95)
donde objeto es un objeto creado con la funci on HoltWinters, n.ahead=1
indica la realizaci on de una predicci on para el primer perodo despu es del
ultimo valor considerado en la serie, por tanto, para m as predicciones basta
ajustar el valor de este argumento en el n umero de predicciones deseadas.
5.5.4. Ejemplo: Suavizamiento Holt Winters de la serie del ndice men-
sual de salario real
A continuaci on se realizan dos suavizamientos Holt-Winters, s olo con los
primeros n 6 = 114 observaciones de la serie (de enero de 1990 a junio
de 1999) . Se pronostican las seis ultimas observaciones (de julio de 1999
a diciembre de 1999). El primer suavizamiento es realizado con par ametros
= 0.5, = 0.06 y = 0.6. El segundo suavizamiento se deja que el R suavice
con valores optimos de estos par ametros.
C odigo R 5.9.
#LECTURA DE LOS DATOS
yt=scan()
94.15 102.28 104.01 103.22 102.58 100.97 101.65 101.67
99.89 100.08 99.63 89.82 90.76 99.86 100.71 101.66 100.57
98.80 98.18 98.94 99.26 98.40 99.15 91.19 90.90 102.71 104.33
101.68 101.48 100.30 100.32 102.23 101.24 102.01 103.78 96.00
96.58 106.56 108.47 108.01 108.65 108.30 108.07 109.72 108.24
108.74 109.33 101.13 101.00 109.65 111.21 109.67 110.23 110.92
110.33 111.46 111.70 112.90 113.84 107.40 103.41 113.85 114.97
116.01 113.56 113.22 113.28 114.86 113.78 116.01 117.49 109.63
105.95 117.68 119.21 118.77 118.48 116.62 116.56 117.05 116.07
116.91 118.65 109.12 109.66 120.26 122.14 122.52 124.35 122.03
122.23 121.37 120.63 122.69 124.67 115.74 114.33 123.51 124.66
122.10 121.70 119.52 120.05 122.31 121.47 122.46 123.64 115.47
111.71 124.20 126.19 126.87 126.89 127.34 127.28 128.87 128.51
130.24 132.14 124.66
#USAREMOS S
OLO LAS PRIMERAS n-6 OBSERVACIONES DE LA SERIE: Enero de 1990 a junio de 1999
yt2=ts(yt[1:114],frequency=12,start=c(1990,1)) #INICIO EN ENERO DE 1990, DATOS MENSUALES
#REALIZANDO SUAVIZAMIENTO WINTERS ADITIVO CON alpha=0.5, beta=0.06 y gamma=0.6
suaviza1=HoltWinters(yt2,alpha=0.5,beta=0.06,gamma=0.6,seasonal="additive")
#CALCULANDO PREDICCIONES PARA JULIO A DICIEMBRE DE 1999
predicciones1=predict(suaviza1,n.ahead=6,prediction.interval=TRUE)
#SUAVIZAMIENTO CON VALORES

OPTIMOS DE LAS PAR
AMETROS
suaviza2=HoltWinters(yt2,seasonal="additive")
#GRAFICAS DE LA SERIE ORIGINAL JUNTO CON LAS SUAVIZADAS,
#LAS PREDICCIONES DE LOS SEIS PER
IODOS SGTES Y SUS INTERVALOS

E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
146 CAP
ITULO 5. MODELACI
plot(suaviza1,xlim=c(1990.0,2000.1),ylim=c(min(yt),max(yt)+10),
main=expression(paste("Holt-Winters",sep=" ",alpha==0.5,sep=", ",beta==0.06,sep=", ",gamma==0.6)),lwd=2)
lines(predicciones1[,1],lty=2)
abline(v=(1999+6/12)) #lnea de referencia al final de junio de 1999
legend("topleft",legend=c("Original","ajustado","pronosticado"),lty=c(1,1,2),lwd=c(1,2,1),col=c(1,2,1))
main="Holt-Winters parametros optimos",lwd=2)
abline(v=(1999+6/12)) #lnea de referencia al final de junio de 1999
Salida R 5.3.
#RESULTADOS FINALES DEL PRIMER SUAVIZAMIENTO
suaviza1
Holt-Winters exponential smoothing with trend and additive seasonal component.
Call:
HoltWinters(x = yt2, alpha = 0.5, beta = 0.06, gamma = 0.6, seasonal = "additive")
alpha: 0.5
beta : 0.06
gamma: 0.6
Coefficients:
[,1]
a 125.8778975
b 0.3583725
s1 0.6832618
s2 1.6890767
s3 0.7883875
s4 1.9602604
s5 3.0464856
s6 -5.9301495
s7 -8.4949985
s8 2.2765857
s9 3.4087116
s10 2.6079811
s11 2.2751274
s12 1.0116456
#VALORES SUAVIZADOS PRIMER SUAVIZAMIENTO
fitted(suaviza1)
xhat level trend season
Jan 1991 91.89147 99.90377 -0.173865093 -7.8384375
Feb 1991 100.47626 99.16417 -0.207809084 1.5198958
Mar 1991 100.93183 98.64823 -0.226296806 2.5098958
.
.
.
Jan 1999 113.35984 121.21198 0.147910908 -8.0000453
Feb 1999 122.35710 120.53497 0.098415585 1.7237151
Mar 1999 124.65750 121.55483 0.153702644 2.9489609
Apr 1999 124.60207 122.47479 0.199677721 1.9276012
May 1999 126.12039 123.80843 0.267715719 2.0442454
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Jun 1999 125.08772 124.46095 0.290803919 0.3359603
#SSE DEL PRIMER SUAVIZAMIENTO
suaviza1$SSE
[1] 178.2478
#VALORES AJUSTADOS PRIMER SUAVIZAMIENTO
predicciones1
fit upr lwr
Jul 1999 126.9195 129.5006 124.3384
Aug 1999 128.2837 131.2049 125.3625
Sep 1999 127.7414 131.0007 124.4821
Oct 1999 129.2716 132.8691 125.6742
Nov 1999 130.7162 134.6536 126.7789
Dec 1999 122.0980 126.3779 117.8181
#RESULTADOS FINALES SEGUNDO SUAVIZAMIENTO
suaviza2
Holt-Winters exponential smoothing with trend and additive seasonal component.
Call:
HoltWinters(x = yt2, seasonal = "additive")
alpha: 0.7256559
beta : 0.03969379
gamma: 1
Coefficients:
[,1]
a 126.2661284
b 0.3213943
s1 1.0537426
s2 2.0313071
s3 1.1074885
s4 2.2173567
s5 3.0537184
s6 -6.2580633
s7 -8.9715922
s8 1.8813412
s9 3.0087498
s10 2.3359601
s11 2.1832192
s12 1.0738716
#VALORES SUAVIZADOS SEGUNDO SUAVIZAMIENTO
fitted(suaviza2)
Jan 1991 91.89147 99.90377 -0.17386509 -7.8384375
Feb 1991 100.22229 98.90885 -0.20645589 1.5198958
Mar 1991 100.73250 98.43950 -0.21689126 2.5098958
.
.
.
Jan 1999 113.41872 121.72806 0.19347414 -8.5028139
Feb 1999 122.14281 120.68159 0.14425601 1.3169637
Mar 1999 125.28175 122.31866 0.20351133 2.7595756
Apr 1999 125.32227 123.18125 0.22967271 1.9113503
May 1999 127.02989 124.53404 0.27425349 2.2215974
Jun 1999 125.56351 124.70678 0.27022407 0.5865007
#SSE DEL SEGUNDO SUAVIZAMIENTO
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
148 CAP
ITULO 5. MODELACI
suaviza2$SSE
[1] 163.4065
#PREDICCIONES SEGUNDO SUAVIZAMIENTO
predicciones2
fit upr lwr
Jul 1999 127.6413 130.1121 125.1705
Aug 1999 128.9402 132.0353 125.8451
Sep 1999 128.3378 131.9881 124.6875
Oct 1999 129.7691 133.9345 125.6036
Nov 1999 130.9268 135.5816 126.2720
Dec 1999 121.9364 127.0633 116.8096
De los resultados anteriores se tiene que las ecuaciones de pron osticos Holt-
Winters aditivo pronostican para t = 114 +L, L 1, con base en las ecuaciones
(tenga en cuenta que en t = 115 el mes es julio), respectivamente:
suaviza1: 125.8778975 + 0.3583525L+

S
114+L
, con = 0.5, = 0.06 y = 0.6,
suaviza2: 126.2661284+0.3213943L+
S
114+L
, con = 0.7256559, = 0.03969379 y = 1,
donde (ver valores s1,..., s12 de cada suavizamiento):
S
114+L
= s
1
, si MOD(114 +L, 12) = 7;
S
114+L
= s
2
, si MOD(114 +L, 12) = 8;
S
114+L
= s
3
, si MOD(114 +L, 12) = 9;
S
114+L
= s
4
, si MOD(114 +L, 12) = 10;
S
114+L
= s
5
, si MOD(114 +L, 12) = 11;
S
114+L
= s
6
, si MOD(114 +L, 12) = 0;
S
114+L
= s
7
, si MOD(114 +L, 12) = 1;
S
114+L
= s
8
, si MOD(114 +L, 12) = 2;
S
114+L
= s
9
, si MOD(114 +L, 12) = 3;
S
114+L
= s
10
, si MOD(114 +L, 12) = 4;
S
114+L
= s
11
, si MOD(114 +L, 12) = 5;
S
114+L
= s
12
, si MOD(114 +L, 12) = 6.
El segundo suavizamiento (suaviza2) es el que utiliz o valores optimos de los
par ametros del suavizamiento. Los pron osticos correspondientes y sus inter-
valos de predicci on del 95%han sido guardados en los objetos R predicciones1
y predicciones2. Los SSE de ajuste obtenidos son, respectivamente,
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
suaviza1: SSE = 178.2478
En la Figura 5.21, puede observarse la serie original, la serie suavizada y
los pron osticos con sus intervalos de predicci on, con los dos suavizamientos
realizados, respectivamente. Para comparar la precisi on de los pron osticos se
calculan las medidas correspondientes:
C odigo R 5.10.
library(forecast)
accuracy(predicciones1[,1],yt[(length(yt2)+1):length(yt)])
accuracy(predicciones2[,1],yt[(length(yt2)+1):length(yt)])
con lo cual se obtiene
Precisi on en los pron osticos con m = 6
Holts-Winters serie ndice de salario
ME RMSE MAE MPE MAPE
suaviza1 1.11 1.33 1.11 0.87 0.87
suaviza2 0.69 1.24 0.84 0.54 0.66
Con cu al suavizamiento se ajust o mejor la serie? con cu al se predice
mejor los ultimos 6 meses de la serie?
5.5.5. Ejemplo: Suavizamiento Holt-Winters de la serie trimestral de
producci on de cemento portland
Esta serie, como vimos previamente es de componentes multiplicativas, con
estacioalidad de longitud s = 4. Tambi en tomaremos s olo una parte de la serie
para el suavizamiento, los n 4 = 151 primeros perodos para luego pronos-
ticar los ultimos cuatro. No necesitamos trabajar sobre la serie de los loga-
ritmos sino aplicar a la serie original el modelo de suavizamiento estacional
multiplicativo. Como en el ejemplo anterior, se har an dos suavizamientos, el
primero es realizado con par ametros = 0.5, = 0.06 y = 0.6. El segundo
suavizamiento se deja que el R suavice con valores optimos de estos par amet-
ros. La programaci on es presentada en el C odigo R 5.11.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
150 CAP
ITULO 5. MODELACI
HoltWinters = 0.5, = 0.06, = 0.6
Time
O
b
s
e
r
v
e
d

/

F
i
t
t
e
d
1990 1992 1994 1996 1998 2000
9
0
1
0
0
1
1
0
1
2
0
1
3
0
1
4
0
Original
ajustado
pronosticado
HoltWinters parmetros ptimos
Time
O
b
s
e
r
v
e
d

/

F
i
t
t
e
d
1990 1992 1994 1996 1998 2000
9
0
1
0
0
1
1
0
1
2
0
1
3
0
1
4
0
Original
ajustado
pronosticado
Figura 5.21: Suavizamientos Holt-Winters para serie ndice mensual de salario real.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
C odigo R 5.11.
ON DE LA SERIE
yt=scan()
465 532 561 570 529 604 603 582 554 620 646
637 573 673 690 681 621 698 753 728 688 737
782 692 637 757 783 757 674 734 835 838 797
904 949 975 902 974 969 967 849 961 966 922
836 998 1025 971 892 973 1047 1017 948 1032
1190 1136 1049 1134 1229 1188 1058 1209 1199
1253 1070 1282 1303 1281 1148 1305 1342 1452
1184 1352 1316 1353 1121 1297 1318 1281 1109
1299 1341 1290 1101 1284 1321 1317 1122 1261
1312 1298 1202 1302 1377 1359 1232 1386 1440
1439 1282 1573 1533 1651 1347 1575 1475 1357
1086 1158 1279 1313 1166 1373 1456 1496 1251
1456 1631 1554 1347 1516 1546 1564 1333 1458
1499 1613 1416 1625 1770 1791 1622 1719 1972
1893 1575 1644 1658 1668 1343 1441 1444 1497
1267 1501 1538 1569 1450 1569 1648 1777 1468
1732 1962
#USAREMOS S
OLO LOS n-4=151 PRIMERAS OBSERVACIONES DE LA SERIE

yt2=ts(yt[1:151],frequency=4,start=c(1956,1))
#REALIZANDO SUAVIZAMIENTO WINTERS ADITIVOS CON alpha=0.5, beta=0.06 y gamma=0.6
suaviza1=HoltWinters(yt2,alpha=0.5,beta=0.06,gamma=0.6,seasonal="multiplicative")
#CALCULANDO PREDICCIONES PARA TRIMESTRES 4 DE 1993 A TRIMESTRE 3 DE 1994
#SUAVIZAMIENTO CON VALORES

OPTIMOS DE LAS PAR
AMETROS
suaviza2=HoltWinters(yt2,seasonal="multiplicative")
#GRAFICAS DE LA SERIE ORIGINAL JUNTO CON LAS SUAVIZADAS, LAS PREDICCIONES DE
#LOS CUATRO PER
IODOS SGTES Y SUS INTERVALOS

main=expression(paste("Holt-Winters",sep=" ",alpha==0.5,sep=", ",beta==0.06,sep=", ",gamma==0.6)),lwd=2)
abline(v=(1993+3/4)) #lnea de referencia al final de trimestre 3 de 1993
main="Holt-Winters parametros optimos",lwd=2)
Los resultados del R corresponden a los siguientes:
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
152 CAP
ITULO 5. MODELACI
Salida R 5.4.
suaviza1
Holt-Winters exponential smoothing with trend and multiplicative seasonal component.
Call:
HoltWinters(x = yt2, alpha = 0.5, beta = 0.06, gamma = 0.6, seasonal = "multiplicative")
alpha: 0.5
beta : 0.06
gamma: 0.6
Coefficients:
[,1]
a 1628.4889365
b 3.9387709
s1 1.0260078
s2 0.8910341
s3 0.9730372
s4 1.0080182
#VALORES SUAVIZADOS CON PRIMER SUAVIZAMIENTO
fitted(suaviza1)
1957 Q1 498.0740 529.5000 12.8250000 0.9184051
1957 Q2 593.8356 559.1618 13.8352067 1.0363678
1957 Q3 609.9831 577.9008 14.1294372 1.0303242
.
.
.
1993 Q1 1324.8371 1528.9093 -1.8158606 0.8675547
1993 Q2 1554.1072 1599.2288 2.5122653 0.9702612
1993 Q3 1615.7323 1609.4157 2.9727439 1.0020738
#SSE DEL PRIMER SUAVIZAMIENTO
suaviza1$SSE
[1] 572028.7
#PREDICCIONES DEL PRIMER SUAVIZAMIENTO
predicciones1
fit upr lwr
1993 Q4 1674.884 1772.955 1576.812
1994 Q1 1458.058 1571.203 1344.913
1994 Q2 1596.078 1733.523 1458.634
1994 Q3 1657.428 1784.870 1529.986
#RESULTADOS DEL SEGUNDO SUAVIZAMIENTO
suaviza2
Holt-Winters exponential smoothing with trend and multiplicative seasonal component.
Call:
HoltWinters(x = yt2, seasonal = "multiplicative")
alpha: 0.7734918
beta : 0.006597877
gamma: 0.5651145
Coefficients:
[,1]
a 1612.7974463
b 8.9203870
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
s1 1.0334102
s2 0.8811954
s3 0.9736879
s4 1.0227150
#VALORES SUAVIZADOS CON SEGUNDO SUAVIZAMIENTO
fitted(suaviza2)
1957 Q1 498.0740 529.5000 12.825000 0.9184051
1957 Q2 602.5112 568.3712 12.996850 1.0363678
1957 Q3 613.5410 582.4793 13.004181 1.0303242
.
.
.
1993 Q1 1330.7154 1517.8594 8.469702 0.8718404
1993 Q2 1602.4971 1632.1577 9.167946 0.9763432
1993 Q3 1662.5389 1614.7881 8.992855 1.0238689
#SSE DEL SEGUNDO SUAVIZAMIENTO
suaviza2$SSE
[1] 473949.2
#PREDICCIONES CON SEGUNDO SUAVIZAMIENTO
predicciones2
fit upr lwr
1993 Q4 1675.900 1776.161 1575.639
1994 Q1 1436.911 1561.427 1312.395
1994 Q2 1596.418 1757.513 1435.324
1994 Q3 1685.924 1847.711 1524.137
De los resultados anteriores se tiene que las ecuaciones de pron osticos
Holt-Winters multiplicativo pronostican para t = 151 + L, L 1, con base en
las ecuaciones (tenga en cuenta que en t = 152 el trimestres es el cuatro),
respectivamente:
suaviza1: (1628.4889365 + 3.9387709L)
S
151+L
, con = 0.5, = 0.06 y = 0.6,
suaviza2: (1612.7974463 + 8.9203870L)
S
151+L
,
con = 0.7734918, = 0.006597877 y = 0.5651145, donde (ver valores s1, s2,
s3, s4 de cada suavizamiento):
S
151+L
= s
1
, si MOD(151 +L, 4) = 0;
S
151+L
= s
2
, si MOD(151 +L, 4) = 1;
S
151+L
= s
3
, si MOD(151 +L, 4) = 2;
S
151+L
= s
4
, si MOD(151 +L, 4) = 3;
El segundo suavizamiento (suaviza2) es el que utiliz o valores optimos de los
par ametros del suavizamiento. Los pron osticos correspondientes y sus inter-
valos de predicci on del 95%han sido guardados en los objetos R predicciones1
y predicciones2. Los SSE de ajuste obtenidos son, respectivamente,
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
154 CAP
ITULO 5. MODELACI
En la Figura 5.22, puede observarse la serie, original, la serie suavizada y
los pron osticos con sus intervalos de predicci on, con los dos suavizamientos
realizados, respectivamente. Para comparar la precisi on de los pron osticos se
calculan las medidas correspondientes, usando un c odigo similar al C odigo R
5.10.
HoltWinters = 0.5, = 0.06, = 0.6
Time
O
b
s
e
r
v
e
d

/

F
i
t
t
e
d
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
ajustado
pronosticado
HoltWinters parmetros ptimos
Time
O
b
s
e
r
v
e
d

/

F
i
t
t
e
d
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
ajustado
pronosticado
Figura 5.22: Suavizamientos Holt-Winters para serie trimestral de producci on de cemento
portland.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
5.6. EJERCICIOS 155
Con cu al suavizamiento se ajust o mejor la serie? con cu al se predice
mejor los ultimos 4 trimestres de la serie?
Precisi on en los pron osticos con m = 4
Holts-Winters serie producci on de cemento
suaviza1 138.14 174.47 138.14 7.45 7.45
suaviza2 135.96 162.63 135.96 7.43 7.43
5.6. Ejercicios
1. Para la serie de producci on trimestral de cemento, realice ajuste por re-
gresi on lineal usando variables indicadoras pero esta vez con las primeras
151 observaciones y pronostique las ultimas m = 4. Calcule los respec-
tivos intervalos de pron ostico usando la funci on predict(). Para ello
ajuste primero la serie de los logaritmos, obtenga sus pron osticos e inter-
valos de predicci on y luego destransforme exponenciado tales resultados
para obtener predicciones en la escala original, luego calcule las medidas
de precisi on de pron osticos con la funci on accuracy().
2. Calcule usando R el MSIMP para los pron osticos de los ultimos cuatro
trimestres de la serie. Para ello genere la serie de pron osticos simples y
considere los ultimos cuatro valores.
3. Determine para los modelos ajustados a la serie de cemento con regresi on
m ultiple (regresi on y suavizamientos) cu ales son utiles y cu al pronostica
mejor (la muestra nal de m = 4 observaciones).
C odigo R sugerido
ON DE LA SERIE
yt=scan()
465 532 561 570 529 604 603 582 554 620 646
637 573 673 690 681 621 698 753 728 688 737
782 692 637 757 783 757 674 734 835 838 797
904 949 975 902 974 969 967 849 961 966 922
836 998 1025 971 892 973 1047 1017 948 1032
1190 1136 1049 1134 1229 1188 1058 1209 1199
1253 1070 1282 1303 1281 1148 1305 1342 1452
1184 1352 1316 1353 1121 1297 1318 1281 1109
1299 1341 1290 1101 1284 1321 1317 1122 1261
1312 1298 1202 1302 1377 1359 1232 1386 1440
1439 1282 1573 1533 1651 1347 1575 1475 1357
1086 1158 1279 1313 1166 1373 1456 1496 1251
1456 1631 1554 1347 1516 1546 1564 1333 1458
1499 1613 1416 1625 1770 1791 1622 1719 1972
1893 1575 1644 1658 1668 1343 1441 1444 1497
1267 1501 1538 1569 1450 1569 1648 1777 1468
1732 1962
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
156 CAP
ITULO 5. MODELACI
#SE DEFINEN LOS PRIMEROS n=151 VALORES DE LA SERIE A USAR
m=4
n=length(yt)-m
n
#AJUSTE DE LA SERIE DE LOS LOGARITMOS CON LAS PRIMERAS n=151 OBSERVACIONES
yt2=ts(yt[1:n],frequency=4,start=c(1956,1))
lnyt2=log(yt2)
library(TSA)
trimestre=season(lnyt2)
trimestre=relevel(trimestre,ref="4Q")
#DEFINIENDO

INDICE DE TIEMPO PARA LAS PRIMERAS n=151 OBSERVACIONES
t=1:length(lnyt2)
#AJUSTANDO MODELO AL LOG(Yt2) CON TENDENCIA CUADR
ATICA Y ESTACIONALIDAD TRIMESTRAL

modelo1=lm(lnyt2t+I(t2)+trimestre)
#DEFINIENDO VALORES DE LAS VARIABLES t y trimestre PARA LOS PER
IODOS A SER PRONOSTICADOS

t.nuevo=(length(yt2)+1):length(yt)
trimestre.nuevo=season(yt)[(length(yt2)+1):length(yt)]
#PRONOSTICANDO PER
IODOS t=152 a 155 EN ESCALA ORIGINAL

#OBSERVE QUE SE EXPONENCIA LAS PREDICCIONES DEL MODELO EN
#ESCALA LOGARITMICA
predicciones1=exp(predict(modelo1,data.frame(t=t.nuevo,trimestre=trimestre.nuevo),interval="prediction"))
predicciones1
#OBTENIENDO LAS MEDIDAS DE PRECISI
ON DE PRON
OSTICO
#CON LOS PER
IODOS DE t=152 a 155

library(forecast)
accuracy(predicciones1,yt[t.nuevo])
#C
ALCULO DEL MSIMP (MAPE PRON
OSTICOS SIMPLE)
#PRON
OSTICO SIMPLE PARA t=152 a 155

pred.simple=yt[n:(length(yt)-1)]
#VALORES REALES DE LA SERIE PARA t=152 a 155
reales=yt[(n+1):length(yt)]
MSIMP=accuracy(pred.simple,reales)[5]
#GRAFICANDO LA SERIE VALORES AJUSTADOS Y PRONOSTICADOS
win.graph(height=12,width=15,pointsize=12)
plot(yt)
lines(time(yt)[1:n],exp(fitted(modelo1)),col=2,lwd=2)
lines(time(yt)[(n+1):length(yt)],predicciones1[,1],lty=2,col="blue",lwd=2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Captulo 6
Caracterizaci on de los ciclos
6.1. Introducci on
El modelo probabilstico para una serie temporal es el concepto de proceso
estoc astico el cual corresponde a una sucesi on de variables aleatorias {Z
t
}
tZ
+,
es decir, un conjunto de variables aleatorias indexadas por un ndice t Z
+
(para el caso de las series de tiempo). As, el proceso estoc astico asociado a
una serie de tiempo es una sucesi on de variables aleatorias que evolucionan
en funci on del tiempo. Cada una de las variables aleatorias del proceso tiene
su propia funci on de distribuci on de probabilidad y puede existir entre ellas
correlaci on.
Supondremos que el valor observado de la serie en el instante t es una
extracci on de una variable aleatoria denida en dicho instante. Una serie de
tiempo es una sucesi on generada al tomar s olo una observaci on de cada una
de las variables aleatorias Z
t
que denen el proceso estoc astico indexado en el
tiempo, por tanto, una serie de tiempo (una trayectoria) es una realizaci on de
un proceso estoc astico.
Figura 6.1: Realizaciones de un proceso estoc astico. Fuente: Martnez [8].
En la Figura 6.1 se ilustran cuatro realizaciones de un proceso estoc asti-
co, siendo que el conjunto de todas las trayectorias posibles es el proceso
157
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
158 CAP
ITULO 6. CARACTERIZACI
ON DE LOS CICLOS
estoc astico, en tanto que la serie de tiempo de la cual se dispone (la suce-
si on o conjunto de datos hist oricos), es s olo una de todas estas trayectorias
aleatorias posibles.
Para realizar la modelaci on estadstica (hacer estimaciones y pron osticos)
de una serie de tiempo es necesario conocer la estructura probabilstica del
proceso estoc astico al que corresponde la serie. Esto es, es necesario conocer
la distribuci on conjunta de las n variables de la serie {Z
t
}
1tn
y por tanto la
distribuci on de cada una de tales variables. Para poder estimar la distribuci on
conjunta se necesitara un gran n umero de realizaciones del proceso estoc asti-
co, pero esto es imposible porque s olo se cuenta con una unica realizaci on del
proceso, es decir s olo se tiene la serie hist orica de valores!!!. Como soluci on a
este problema se hacen los siguientes supuestos:
1. La distribuci on conjunta de las n variables es normal multivariada. En
ese sentido, basta entonces conocer las medias, varianzas y covarianzas
para determinar tal distribuci on. En este punto se denen las siguientes
funciones:
a) Funci on de medias del proceso:
t
= E[Z
t
], t = 1, 2, . . .
b) Funci on de varianzas del proceso:
2
t
= Var[Z
t
], t = 1, 2, . . .
c) Funci on de autocovarianzas del proceso: medida de la dependencia
lineal entre variables aleatorias del mismo proceso estoc astico, o co-
varianza en dos instantes de tiempo, Cov[Z
t
, Z
t+k
], t = 1, 2, . . .
d) Funci on de autocorrelaci on: Correlaci on entre variables aleatorias
del mismo proceso estoc astico, Corr[Z
t
, Z
t+k
] =
Cov[Zt,Z
t+k
]
2
t
2
t+k
, t = 1, 2, . . .
2. Las caractersticas o propiedades transversales del proceso (medias, va-
rianzas y la funci on de distribuci on) son estables en el tiempo, es decir
el proceso estoc astico es estacionario.
6.2. Procesos estacionarios en sentido d ebil, o estacionarie-
dad de segundo orden o estacionariedad en covarianza
Un proceso es estacionario en covarianza cuando cumple todas y cada una
de las siguientes tres condiciones:
1. El proceso es estacionario en media (la media es constante):
t
= ,
2. El proceso es estacionario en varianza (la varianza es constante):
2
t
=
2
,
3. La autocovarianza s olo depende de la distancia en el tiempo de las va-
riables del proceso: (k) = Cov[Z
t
, Z
t+k
] = Cov[Z
tk
, Z
t
] = (k), de donde
para k Z, (k) es una funci on sim etrica alrededor de cero con (0) =
Var[Z
t
].
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
6.2. PROCESOS ESTACIONARIOS EN COVARIANZA 159
0 1 2 3 4 1 2 3 4
(k)
k
Figura 6.2: Ejemplo (k) de un procesos estacionario
En consecuencia, (k) = Corr[Z
t
, Z
t+k
] = Corr[Z
tk
, Z
t
] = (k) tambi en es
una funci on sim etrica alredededor de cero con (0) = 1. La gr aca de (k)
es llamada correlograma o Funci on de autocorrelaci on.
La Figura 6.3 ilustra dos procesos estacionarios en covarianza y sus res-
pectivos correlogramas para k Z
+
. En la Figura 6.4 se ilustran dos
procesos no estacionarios en covarianza. En el caso (a) el proceso es esta-
cionario en media pues la serie tiende a variar alrededor de una constante
pero no es estacionaria en varianza ya que la dispersi on alrededor de la
media est a aumentando con el tiempo, mientras que en (b) el proceso
es estacionario en varianza pero no en media pues la serie oscila con
variabilidad constante alrededor de una tendencia no lineal.
4. Los procesos estacionarios en covarianza deben cumplir adem as con
propiedades erg odicas, es decir, que a partir de una unica realizaci on
del proceso se puedan estimar las caractersticas de este y que tales esti-
maciones sean mejores a medida que se aumente el tama no muestral o
longitud de tal realizaci on o serie. En este sentido, nuevos datos deben
aportar informaci on adicional. Para que el proceso estacionario en co-
varianza sea erg odico basta con que se cumpla que lm
k
(k) = 0 con una
velocidad de convergencia r apida. La ergodicidad implica que con la
serie que se tiene a mano se pueden obtener estimadores consistentes
de los par ametros del proceso, es decir la ergodicidad permite equiva-
lencias entre valores esperados y estimaciones muestrales obtenidas de
una realizaci on sucientemente larga del proceso: Sean ,
2
y (k) los
estimadores basados en una serie de tama no n, para ,
2
y (k), respec-
tivamente. Entonces, si el proceso es erg odico tenemos que,
a) lm
n
= , donde =
1
n
n
t=1
Z
t
.
b) lm
n

2
=
2
, donde
2
=
1
n
n
t=1
(Z
t
)
2
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
160 CAP
ON DE LOS CICLOS
Figura 6.3: Dos procesos estacionarios en covarianza. Fuente: Martnez [8]
Figura 6.4: Dos procesos no estacionarios en covarianza. Fuente: Martnez [8]
c) lm
n

Z
(k) =
Z
(k), donde (k) =
1
n
n
t=k+1
(Z
tk
)(Z
t
), o bien, (k) =
1
n
nk
t=1
(Z
t
)(Z
t+k
),
es decir, los estimadores son consistentes. Note que lm
k
(k) = 0 implica
que a medida que aumenta la distancia en el tiempo entre las obser-
vaciones de la serie, disminuye la autocorrelaci on. En general, supon-
dremos que todo proceso estacionario en covarianza es erg odico.
Note que: seg un la denici on de procesos estacionarios en covarianza una
serie de tiempo que presente tendencia no constante y/o componente esta-
cional no es estacionaria en covarianza, puesto que la media es funci on del
tiempo a trav es de las componentes de tendencia y estacionalidad. Tampoco
puede ser estacionaria en covarianza cualquier serie heteroced astica (de vari-
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
6.2. PROCESOS ESTACIONARIOS EN COVARIANZA 161
anza no constante).
6.2.1. Procesos de ruido
Un proceso de ruido es un proceso estacionario en covarianza con las si-
guientes caractersticas:
1. La media es constante e igual a cero:
t
= 0, t;
2. La varianza es constante:
2
t
=
2
, t;
3. La autocovarianza es cero y por tanto tambi en la autocorrelaci on: (k) =
0, k = 0.
Observe que la tercera condici on no implica independencia entre las variables
del proceso de ruido, s olo implica que no hay asociaci on de tipo lineal. En
los procesos de ruido los datos pasados no proporcionan informaci on sobre el
futuro, es decir el proceso es sin memoria!!! y por tanto el mejor pron ostico es
la media del proceso. En la Figura 6.5 se ilustra la funci on de autocovarianza
de un proceso de ruido.
0 1 2 3 4 1 2 3 4
(k)
k
Figura 6.5: Funci on de autocovarianza (k) de un procesos de ruido
6.2.2. Procesos de ruido blanco
Cuando las variables de un proceso de ruido son independientes este es
denominado ruido blanco, un caso particular es cuando el proceso de ruido
es normal multivariado, entonces en ese caso (k) = 0 para k = 0, implica
independencia.
Nota: Cuando comenzamos ajustando un modelo de regresi on lineal o
no lineal a una serie de tiempo, con errores aditivos, suponemos en prin-
cipio que los errores de ese modelo son un ruido blanco normal, es decir
E
t
iid
R.B N(0,
2
). En general, esperamos que E
t
sea al menos estacionario en
covarianza.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
162 CAP
ON DE LOS CICLOS
6.3. Procesos estacionarios en sentido fuerte o estrictamente
estacionarios
La estacionariedad d ebil o en covarianza no garantiza la estabilidad com-
pleta del proceso, es necesario adem as de la estacionariedad d ebil o en co-
varianza, que la funci on de distribuci on conjunta de cualquier subconjunto
(Z
t
1
, Z
t
2
, , Z
tm
) de las variables aleatorias del proceso estoc astico no cambie
ante desplazamientos en el tiempo, es decir, si F
Z
() representa la funci on de
distribuci on conjunta del proceso {Z
t
}
tZ
+, entonces
F
Z
(Z
t
1
, Z
t
2
, , Z
tm
) = F
Z
(Z
t
1
+
, Z
t
2
+
, , Z
tm+
), m, , t
1
, t
2
, , t
m
.
As, si los primeros momentos de F
Z
existen, se sigue que E[Z
t
] = E[Z
t+
] = ,
de donde E[(Z
t
)
2
] = E[(Z
t+
)
2
] =
2
y si suponemos que la distribuci on
conjunta es normal multivariada y el proceso es estacionario en covarianza,
entonces el proceso es tambi en estacionario en sentido fuerte!!!.
6.4. Funci on de autocovarianza y autocorrelaci on muestral
Previamente en la Secci on 6.1 se denieron las funciones de autocovarian-
za y de autocorrelaci on poblacionales. Suponga que se tiene una realizaci on
de longitud n de un proceso estacionario en covarianza, {Z
t
}
1tn
, es decir,
tenemos la serie Z
1
, Z
2
, , Z
n
. De la Secci on 6.2 tenemos que la funci on de
autocovarianza muestral es (considere s olo k > 0).
(k) =
1
n
n
t=k+1
(Z
tk

Z)(Z
t

Z), o bien, (k) =
1
n
nk
t=1
(Z
t

Z)(Z
t+k

Z) (6.1)
de donde tambi en resulta que la funci on de autocorrelaci on muestral es
(k) =
(k)
(0)
=
n
t=k+1
(Z
tk

Z)(Z
t

Z)
n
t=1
(Z
t

Z)
2
=
nk
t=1
(Z
t

Z)(Z
t+k

Z)
n
t=1
(Z
t

Z)
2
(6.2)
Nota: Para las estimaciones de las funciones de autocovarianza y autocor-
relaci on para la serie de errores de un modelo estadstico de una serie de
tiempo Y
t
, con errores aditivos E
1
, E
2
, , E
n
los cuales son variables no ob-
servables, usamos en su lugar los residuales respectivos

E
1
,

E
2
, ,

E
n
, para
los cuales siempre se cumple que

E =
1
n
n
t=1
E
t
= 0.
De las dos ecuaciones anteriores debera notarse que no es posible obtener
las estimaciones para cualquier valor de rezago o retardo k, desde que es
necesario que k + 1 n, o equivalentemente, k n 1. Tambi en, note que los
c alculos de estas estimaciones s olo involucran n k de las observaciones, por
tanto, a medida que aumenta k disminuye n k y por tanto se hacen menos
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
6.5. USO DE LA FAC MUESTRAL PARA PROBAR RUIDO BLANCO 163
precisas las estimaciones en los rezagos de mayor valor al involucrar menos
t erminos de la serie. En general se aconseja s olo estimar los valores de estas
funciones para k = 1, 2, , m, con m = [n/4] donde [ ] denota la parte entera.
Por ejemplo, para una serie de longitud n = 42 estimaramos la autocovarianza
y la autocorrelaci on para k = 1, 2, , 10.
Lo usual es presentar las estimaciones gr acamente, es decir, gracar la
funci on de autocovarianza muestral y la funci on de autocorrelaci on muestral
vs. el valor de k. A la segunda gr aca se le llama la ACF o FAC muestral. En R
contamos con la funci on acf().
acf(x, lag.max = NULL,
type = c("correlation", "covariance", "partial"),
plot = TRUE, na.action = na.fail, demean = TRUE, ...)
donde x es un objeto serie de tiempo, o un vector num erico, type=correlation
construye la ACF, y con type=covariance se obtiene la gr aca de la funci on
de autocovarianza muestral. Para especicar el n umero m aximo de rezagos
usamos el argumento lag.max=m con m correspondiendo al valor en n umeros
de [n/4].
6.5. Uso de la FAC muestral para probar que los errores de
un modelo de serie de tiempo son R.B
Bartlett (1946), estableci o lo siguiente: Suponga que E
1
, E
2
, , E
n
es una
serie de tiempo proveniente de un proceso estacionario en covarianza de media
cero, con funci on de autocorrelaci on (k) y su estimador (k). Si (k) = 0 para
k > q, entonces
VAR[ (k)]
1
n
_
1 + 2
q
j=1
[(j)]
2
_
. (6.3)
En particular, si la serie fuese una realizaci on sucientemente larga de un pro-
ceso de ruido blanco entonces q = 0 y por tanto
VAR[ (k)]
1
n
y adem as, (k)
aprox.
N
_
0,
1
n
_
. (6.4)
Con base en este resultado, hacemos uso de la FAC muestral para probar
que la serie de errores E
t
del modelo considerado para una serie dada es un
proceso de ruido blanco, realizando m = [n/4] pruebas del tipo
H
0
: (k) = 0 versus H
1
: (k) = 0 (6.5)
k = 1, 2, , m. En cada caso, si la prueba correspondiente es realizada a un
nivel de signicancia de aproximadamente 5%, se rechaza H
0
en favor de H
1
si
| (k)| > 2/
n. La FAC muestral permite chequear r apidamente estas m prue-

bas trazando en la gr aca los lmites 2/
n. Se rechaza que los errores son

E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
164 CAP
ON DE LOS CICLOS
un ruido blanco si para alg un k se observa que | (k)| > 2/
n, es decir, cuando
en al menos una de las m pruebas descritas por (6.5) se rechaza la correspon-
diente hip otesis nula.
6.5.1. Ejemplos
Considere las siguientes series a
t
, Z
1,t
, Z
2,t
, Z
3,t
y Z
4,t
, t = 1, 2, , 100
t at Z
1,t
Z
2,t
Z
3,t
Z
4,t
t at Z
1,t
Z
2,t
Z
3,t
Z
4,t
1 -0.47 -1.76 0.00 0.10 -0.53 51 -1.81 -0.36 1.10 0.56 -1.09
2 -0.88 -1.14 2.35 -0.43 -0.70 52 0.19 -1.12 2.16 -1.37 0.86
3 -1.22 -0.45 1.51 1.42 0.03 53 -0.21 -0.61 -0.58 3.77 -1.33
4 1.75 1.71 4.27 -0.58 0.51 54 -0.31 0.37 0.79 -1.38 0.83
5 -0.35 1.10 3.52 -0.80 -0.06 55 0.42 -0.85 -1.05 0.50 -0.07
6 0.30 -0.40 3.91 0.51 1.76 56 0.16 -0.56 -0.86 0.03 -3.30
7 -1.91 0.02 4.11 -0.00 -0.64 57 -0.25 0.39 -1.14 1.26 2.01
8 -0.43 1.75 5.62 0.36 0.40 58 2.41 -2.19 0.86 -3.55 -1.25
9 0.11 1.24 3.84 -1.15 -0.81 59 0.73 -0.75 -1.47 3.04 1.55
10 -0.80 0.95 6.06 1.56 -1.08 60 0.08 -2.64 -0.04 -0.83 -0.32
11 1.68 1.55 4.34 -1.65 -0.08 61 -0.02 -1.85 -0.72 0.09 1.15
12 0.15 2.77 5.68 2.40 0.68 62 0.40 -1.58 0.01 0.05 -0.74
13 -1.55 1.79 4.80 -2.22 0.14 63 -0.89 1.72 0.45 0.01 -0.92
14 -0.19 1.47 6.36 0.12 -1.15 64 1.06 2.70 -1.97 -0.66 0.18
15 0.61 1.42 5.96 2.53 -0.30 65 1.12 2.87 -0.68 0.75 0.71
16 1.10 1.15 6.64 -3.15 0.35 66 -0.24 1.82 -3.55 -1.17 0.38
17 -1.34 2.05 5.74 0.89 0.42 67 0.01 0.78 -2.25 0.74 -0.17
18 -0.74 0.78 7.12 -0.84 0.25 68 -2.13 -0.74 -1.91 -1.59 -1.60
19 0.08 -0.46 6.07 2.34 0.86 69 0.10 -1.50 -2.37 1.21 1.31
20 -0.49 -0.76 6.72 -0.27 -0.73 70 0.75 -2.54 -1.38 -0.76 -0.14
21 0.25 -1.95 5.91 -0.06 0.30 71 1.06 -0.60 -2.91 0.62 -0.06
22 -0.16 -1.50 4.31 -1.76 0.85 72 -1.38 -0.61 -1.48 -0.19 0.64
23 -0.49 -2.60 3.98 -0.38 0.44 73 0.95 -1.20 -2.01 -1.23 -0.81
24 0.22 -1.33 3.70 1.53 -0.24 74 0.48 -0.01 -2.50 0.47 -1.34
25 0.31 -1.48 4.35 -0.13 -0.65 75 1.33 1.01 -3.06 -1.59 -0.20
26 1.98 -1.31 4.19 1.24 -0.09 76 -0.30 1.27 -3.38 2.60 0.31
27 -1.52 -1.52 2.83 -2.30 0.21 77 1.44 3.62 -4.59 0.20 -1.03
28 0.31 -2.22 4.62 1.70 -0.89 78 -1.10 3.53 -5.05 -0.86 0.57
29 0.16 0.36 5.90 -1.31 1.13 79 -0.38 3.10 -3.81 -0.86 -1.38
30 0.43 0.13 6.57 0.05 -2.01 80 -1.28 1.88 -3.44 1.59 -1.55
31 -0.69 -0.36 5.66 1.86 1.82 81 0.20 1.10 -3.12 -2.16 0.87
32 0.97 -1.89 5.12 -2.46 -0.00 82 -0.50 2.21 -3.40 -0.23 -1.00
33 1.72 -2.43 5.13 -1.97 -0.74 83 0.51 0.87 -0.92 -0.53 0.09
34 -0.04 -2.06 5.07 2.98 -0.18 84 0.74 0.17 -1.77 1.71 -0.79
35 -0.75 -0.17 2.56 -1.97 1.19 85 1.53 2.29 -2.03 -1.00 -0.57
36 0.56 -1.09 3.12 0.65 -0.07 86 -2.44 2.77 -0.71 -0.90 -0.59
37 1.88 -2.67 3.97 -2.24 0.69 87 -1.00 1.61 -1.32 2.00 -0.97
38 -0.41 -1.15 2.59 3.15 -1.71 88 -0.14 1.16 -2.23 -2.91 -1.01
39 -1.73 0.05 3.14 -2.42 1.85 89 -0.31 0.04 -1.97 1.61 0.83
40 -1.41 -0.30 3.57 1.32 0.22 90 1.35 0.12 -1.25 -1.02 -1.00
41 -0.02 0.39 3.27 -0.59 -2.37 91 1.04 -0.22 -0.62 0.10 -1.16
42 0.61 1.65 3.11 -1.21 0.70 92 -0.65 0.33 -2.53 0.34 -0.28
43 -0.30 1.32 3.80 2.56 1.48 93 -0.77 0.27 -0.33 -0.45 -0.30
44 -1.15 1.17 3.33 -0.30 -0.79 94 1.93 0.88 -2.10 0.00 -0.96
45 0.28 0.74 2.88 -0.50 -0.15 95 -0.35 1.63 1.13 -1.17 1.22
46 0.28 1.90 3.40 -0.61 -0.45 96 0.34 3.43 -1.24 1.63 -1.65
47 -1.42 0.54 1.41 0.55 -0.57 97 1.20 2.60 -0.89 -0.95 1.24
48 0.51 0.96 1.07 0.36 1.16 98 0.35 0.59 -1.29 2.36 -0.28
49 -0.18 1.11 1.20 0.04 -0.61 99 -1.22 -0.30 -0.72 -1.69 1.03
50 -1.04 -0.71 2.61 -0.62 -1.09 100 0.87 -1.01 1.83 0.42 -1.31
A continuaci on se presentan las gr acas de estas series y sus respectivas
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
ACFs (ver C odigo R 6.1).
Time
a
t
0 20 40 60 80 100
1
0
1
2
0 5 10 15 20 25
0
.2
0
.0
0
.2
0
.4
0
.6
0
.8
1
.0
Lag
A
C
F
ACF de la serie at
Figura 6.6: Serie a
t
y su FAC muestral
Time
Z
1
t
0 20 40 60 80 100
1
0
1
2
3
0 5 10 15 20 25
0
.2
0
.0
0
.2
0
.4
0
.6
0
.8
1
.0
Lag
A
C
F
ACF de la serie Z1t
Figura 6.7: Serie Z
1,t
y su FAC muestral
Time
Z
2
t
0 20 40 60 80 100
2
0
2
4
6
0 5 10 15 20 25
0
.5
0
.0
0
.5
1
.0
Lag
A
C
F
ACF de la serie Z2t
Figura 6.8: Serie Z
2,t
y su FAC muestral
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
166 CAP
ON DE LOS CICLOS
Time
Z
3
t
0 20 40 60 80 100
2
0
2
4
0 5 10 15 20 25
0
.5
0
.0
0
.5
1
.0
Lag
A
C
F
ACF de la serie Z3t
Figura 6.9: Serie Z
3,t
y su FAC muestral
Time
Z
4
t
0 20 40 60 80 100
1
0
1
2
0 5 10 15 20 25
0
.4
0
.2
0
.0
0
.2
0
.4
0
.6
0
.8
1
.0
Lag
A
C
F
ACF de la serie Z4t
Figura 6.10: Serie Z
4,t
y su FAC muestral
Para cada una de las anteriores series determine si es una realizaci on de
un proceso que es:
Estacionario en covarianza por qu e? Hay patrones en la FAC respecti-
va?
Ruido blanco por qu e?
C odigo R 6.1.
#LECTURA DE ARCHIVO DE DATOS datosejemFACS.txt
#EL ARCHIVO TIENE EL NOMBRE DE LAS SERIES EN LA PRIMERA FILA
#LAS COLUMNAS SON EN SU ORDEN at, z1t, z2t, z3t y z4t
datos=read.table(file.choose(),header=T)
#TODAS LAS CINCO SERIES TIENEN MISMO INDICE t=1 a 100
#PODEMOS CREAR MATRIZ DE SERIES datos
datos=ts(datos,freq=1)
#GRAFICANDO CADA SERIE Y SU ACF MUESTRAL
plot(datos[,1],lwd=2,ylab=expression(a[t]))
abline(h=0,lty=2)
acf(datos[,1],lag.max=25,ci.type="ma",ci.col="red",
main=expression(paste("ACF de la serie ",sep=" ",a[t])),lwd=2)
plot(datos[,2],lwd=2,ylab=expression(Z[1
*
t]))
abline(h=0,lty=2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
main=expression(paste("ACF de la serie ",sep=" ",Z[1
*
t])),lwd=2)
*
t]))
abline(h=0,lty=2)
*
t])),lwd=2)
*
t]))
abline(h=0,lty=2)
*
t])),lwd=2)
*
t]))
abline(h=0,lty=2)
*
t])),lwd=2)
Considere ahora las ACFs de la serie del ndice mensual de salario real y de
los residuales de sus tres modelos ajustados en el ejemplo presentado en la
Secci on 5.2.1, p agina 109:
0 5 10 15 20 25 30 35
0
.
5
0
.
0
0
.
5
Lag
A
C
F
ACF serie ndice salario real, ener.1990 nov. 2001
0 5 10 15 20 25 30 35
0
.
4
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
Lag
A
C
F
ACF residuales modelo 1
para serie del ndice mensual salario real
0 5 10 15 20 25 30 35
0
.
4
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.
4
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
Lag
A
C
F
Figura 6.11: FACs Serie ndice de salario y residuales de modelos ajustados
Basados en las ACFs qu e podemos decir sobre la estacionariedad de la
serie y de los errores de los modelos ajustados? Para cada modelo podemos
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
168 CAP
ON DE LOS CICLOS
decir que sus errores son ruido blanco? por qu e?, Qu e patr on particular se
destaca en la ACF de la serie de datos del ndice de salario?
El c odigo R utilizado en la obtenci on de la gr aca anterior es el siguiente:
Continuaci on C odigo R 5.1
#ACF SOBRE LA SERIE DE DATOS Y RESIDUALES MODELOS AJUSTADOS
m=length(salario)/4
acf(as.numeric(salario),lag.max=m,ci.type="ma",ci.col="red",
main="ACF serie ndice salario real, ener.1990 - nov. 2001")
acf(residuals(modelo1),lag.max=m,ci.type="ma",ci.col="red",
main="ACF residuales modelo 1\npara serie del ndice mensual salario real")
A continuaci on, la ACF para la serie del logaritmo natura de la serie de
producci on trimestral de cemento y de los residuales del modelo ajustado en
la Secci on 5.3.3:
0 10 20 30
0
.
5
0
.
0
0
.
5
Lag
A
C
F
ACF serie log produccin cemento, Q1.1990 Q3.1994
0 10 20 30
0
.
2
0
.
2
0
.
6
Lag
A
C
F
para serie log produccin de cemento
Figura 6.12: FACs Serie log producci on trimestral cemento portland y residuales de mod-
elo ajustado
Qu e podemos decir sobre la estacionariedad de la serie y de los errores
del modelo ajustado en la Secci on 5.3.3? podemos decir que sus errores son
ruido blanco? por qu e?, Hay alg un patr on particular en la ACF de la serie
de datos del log de producci on de cemento?
La anterior gura fue obtenida con el siguiente c odigo R:
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
m=length(lnyt)/4
nf=layout(c(1,2))
acf(as.numeric(lnyt),lag.max=m,ci.type="ma",ci.col="red",
main="ACF serie log produccion cemento, Q1.1990 - Q3.1994")
main="ACF residuales modelo 1\npara serie log produccion de cemento")
Finalmente, considere la serie simulada presentada en la Secci on 5.3.1.
Para esta serie se ajusta un modelo de tendencia lineal sin estacionalidad. Las
gr acas de la serie de datos y su ACF y de la serie de residuales y su ACF se
presentan a continuaci on. Concluya sobre la estacionariedad de la serie y de
los errores del modelo ajustado son estos ultimos un ruido blanco?
serie simulada
Time
y
t
1980 1985 1990 1995 2000 2005
0
1
0
0
0
0
3
0
0
0
0
5
0
0
0
0
7
0
0
0
0
0 20 40 60
0
.5
0
.0
0
.5
1
.0
Lag
A
C
F
ACF Serie simulada
Figura 6.13: Serie Y
t
simulada y su FAC muestral
Serie residuales modelo ajustado a serie simulada
Time
r
e
s
id
u
a
ls
(
r
e
g
r
e
s
io
n
)
0 50 100 150 200 250 300
1
0
0
0
0
5
0
0
0
0
5
0
0
0
1
0
0
0
0
0 20 40 60
0
.0
0
.2
0
.4
0
.6
0
.8
1
.0
Lag
A
C
F
ACF Residuales modelo ajustado a serie simulada
Figura 6.14: Serie residuales modelo lineal ajustado a serie simulada y su FAC muestral
Si la serie Y
t
es ltrada a trav es de su primera diferencia, es decir,

Y
t
=
Y
t
Y
t1
(estamos utilizando un ltro lineal
1
i=0
w
i
Y
ti
, con w
0
= 1 y w
1
= 1), la
serie resultante en este caso es de tendencia constante. En la siguiente gura
se ilustra la serie de la primera diferencia y su ACF Qu e se concluye acerca
de la estacionariedad de la primera diferencia?
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
170 CAP
ON DE LOS CICLOS
Serie primera diferencia para serie simulada
Time
d
ife
r
1980 1985 1990 1995 2000 2005
1
5
0
0
0
5
0
0
0
0
5
0
0
0
1
0
0
0
0
1
5
0
0
0
0 20 40 60
0
.5
0
.0
0
.5
1
.0
Lag
A
C
F
ACF Primera diferencia para serie simulada
Figura 6.15: Primera diferencia de la serie simulada y su FAC muestral
El c odigo R usado en este ultimo ejemplo fue el siguiente
C odigo R 6.2.
t=1:length(yt)
regresion=lm(ytt) #MODELO DE TENDENCIA LINEAL
#ACF SERIE DE DATOS SIMULADA Y PARA LOS RESIDUALES MODELO AJUSTADO
m=length(yt)/4
plot(yt,main="serie simulada")
acf(as.numeric(yt),lag.max=m,ci.type="ma",ci.col="red",main="ACF Serie simulada")
plot.ts(residuals(regresion),main="Serie residuales modelo ajustado a serie simulada")
abline(h=0,lty=2)
acf(residuals(regresion),lag.max=m,ci.type="ma",ci.col="red",
main="ACF Residuales modelo ajustado a serie simulada")
#CREANDO SERIE DE LA PRIMERA DIFERENCIA DE LA SERIE SIMULADA Y(t)-Y(t-1)
difer=diff(yt)
#GRAFICA SERIE DE LA PRIMERA DIFERENCIA Y SU ACF
m=length(difer)/4
plot(difer,main="Serie primera diferencia para serie simulada")
abline(h=0,lty=2)
acf(as.numeric(difer),lag.max=m,ci.type="ma",ci.col="red",
main="ACF Primera diferencia para serie simulada")
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
6.6. TEST DE BOX-PIERCE Y TEST LJUNG-BOX 171
6.6. Test de Box-Pierce y Test Ljung-Box
En la secci on previa vimos que la funci on de autocorrelaci on muestral (ACF
o FAC) puede ser usada para probar que un proceso estoc astico estacionario
en covarianza de media cero, es un proceso de ruido blanco, mediante m =
[n/4] pruebas de hip otesis separadas, del tipo
H
0
: (k) = 0 versus H
1
: (k) = 0,
para k = 1, , m cada una de estas pruebas realizadas a un nivel de sig-
nicancia de aproximadamente el 5%. Sin embargo con esta metodologa
la probabilidad de cometer un error tipo I en al menos una de las m prue-
bas es (suponiendo que las m pruebas son independientes) aproximadamente
1 (1 0.05)
m
, es decir, mucho m as grande que 0.05.
Una prueba alternativa a la FAC es aquella que supone en la hip otesis nula
que todas las autocorrelaciones para k = 1, , m son nulas conjuntamente,
es decir:
H
0
: (1) = (2) = = (m) = 0 vs. H
1
: (k) = 0 para alg un k, k = 1, 2, , m.
(6.6)
La hip otesis nula implica que el proceso es un ruido blanco mientras que
la hip otesis alternativa rechaza el ruido blanco. Con esta prueba podemos
garantizar que el nivel de signicancia es del 5% u otro que se quiera usar.
Hay dos m etodos para hacer esta prueba, veamos:
6.6.1. Test de Box-Pierce
Sea {E
t
}
t1
un proceso de ruido blanco. Entonces para una realizaci on su-
cientemente grande (E
1
, E
2
, , E
n
con n grande), (k)
aprox.
N
_
0,
1
n
_
para to-
do k y (1), , (m) son aproximadamente independientes. Por consiguiente,
n (k)
aprox.
N (0, 1) n
2
(k)
aprox.
2
1
, y por tanto,
Q
BP
= n
m
k=1

2
(k)
aprox.
2
m
(6.7)
donde la distribuci on asint otica chi cuadrado es v alida bajo H
0
. De la Figura
6.16, se tiene que a un nivel de signicancia se rechaza H
0
si Q
BP

2
,m
,
o bien, si para el valor P de la prueba se cumple que VP = P(
2
m
Q
BP
)
(menor que el nivel de signicancia usado). Note que cuando H
0
es cierta,
todos los (k) deberan ser pr oximos a cero y por tanto el valor del estadstico
Q
BP
debera ser tambi en muy peque no (estadsticamente hablando), pero si
H
0
es falsa, entonces alg un (o algunos) (k) es estadsticamente signicativo o
distinto de cero, por tanto el estadstico de prueba Q
BP
resultara grande en
t erminos estadsticos, luego, para evaluar si Q
BP
es grande, la regi on crtica
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
172 CAP
ON DE LOS CICLOS
Regin crtica de nivel en la distribucin
m
2
2
,m
Figura 6.16: Regi on crtica de nivel para el test Box-Pierce y Ljung-Box
bajo la distribuci on chi cuadrado es de cola derecha, y comparamos el valor
observado contra aquella cantidad que en la distribuci on chi cuadrado corres-
pondiente constituye el lmite que separa las cantidades signicativamente
grandes de las que no lo son.
6.6.2. Prueba de Ljung-Box
Con el n de mejorar la aproximaci on de la distribuci on del estadstico de
prueba Box-Pierce en muestras peque nas, Ljung y Box hicieron una modi-
caci on del estadstico Q
BP
, en la cual en vez de sumar directamente los (k)
con peso igual a 1, ponderaron cada uno con un peso igual a (n + 2)/(n k),
respectivamente, es decir, el estadstico de prueba es
Q
LB
= n(n + 2)
m
k=1

2
(k)
n k
aprox.
2
m
(6.8)
donde la distribuci on asint otica chi cuadrado es v alida bajo H
0
. De nuevo, la
regi on crtica o de rechazo a un nivel de signicancia es como la indicada en
la Figura 6.16 y rechazamos H
0
si Q
LB

2
,m
, o bien, si para el valor P de la
prueba se cumple que VP = P(
2
m
Q
LB
) .
6.6.3. Pruebas Box-Pierce y Ljung-Box en R
En R es posible realizar los testes Box-Pierce y Ljung-Box mediante la fun-
ci on
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Box.test(x, lag = 1, type = c("Box-Pierce", "Ljung-Box"), fitdf = 0)
donde
x: Un vector num erico o una serie univariada.
lag: el n umero m aximo de rezagos m a ser considerados.
type: para especicar el test deseado. type=Box-Pierce para el test
de Box-Pierce y type=Ljung-Box para el test Ljung-Box.
Por ejemplo, considere las series a
t
, Z
1,t
, Z
2,t
, Z
3,t
y Z
4,t
, t = 1, 2, , 100 presen-
tadas en la Sesi on 6.5.1. Para estas series tenemos:
C odigo R 6.3.
#Separando las series
at=datos[,1]
Z1t=datos[,2]
Z2t=datos[,3]
Z3t=datos[,4]
Z4t=datos[,5]
#Calculando m=[n/4]. Todas las series aqu tienen longitud
#igual al numero de filas de la matriz de datos
m=floor(nrow(datos)/4)
#La siguiente funcion BP.LB.test es creada para calcular
#El teste Box-Pierce y Ljung-Box con rezagos maximos de 6, 12,...,[m/6]
*
6
BP.LB.test=function(serie,maxlag,type="Box"){
aux=floor(maxlag/6);
X.squared=c(rep(NA,aux))
df=c(rep(NA,aux))
p.value=c(rep(NA,aux))
for(i in 1:aux){
test=Box.test(serie,lag=(6
*
i),type=type)
X.squared[i]=test[[1]]
df[i]=test[[2]]
p.value[i]=test[[3]]
}
lag=6
*
c(1:aux)
teste=as.data.frame(cbind(X.squared,df,p.value))
rownames(teste)=lag
teste
}
#Calculando test Box-Pierce para cada serie
Box.at=BP.LB.test(at,maxlag=m,type="Box")
Box.Z1t=BP.LB.test(Z1t,maxlag=m,type="Box")
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
174 CAP
ON DE LOS CICLOS
#Calculando Test de Ljung-Box a cada serie
Ljung.at=BP.LB.test(at,maxlag=m,type="Ljung")
Ljung.Z1t=BP.LB.test(Z1t,maxlag=m,type="Ljung")
En la siguiente Salida R ilustramos los resultados de los testes Box-Pierce y
Lung-Box para la serie a
t
:
Salida R 6.1.
> Box.at
X.squared df p.value
6 8.492486 6 0.2041956
12 12.086374 12 0.4387680
18 16.641272 18 0.5478847
24 18.986230 24 0.7527236
> Ljung.at
X.squared df p.value
6 8.975562 6 0.1749571
12 13.034928 12 0.3665071
18 18.515194 18 0.4222296
24 21.589075 24 0.6037787
Los resultados obtenidos con el C odigo R 6.3 son organizados en la Tabla 6.1.
Como puede verse, en todos los casos se ha realizado el test en la ecuaci on
(6.6), con m = 6, 12, 18, 24. Seg un Box-Pierce, cu ales de las series son un ruido
blanco y cu ales no? y seg un Ljung-Box?
Para la serie de los residuales de los tres modelos ajustados por regresi on
a la serie del ndice mensual de salario real sector manufacturero (sin trilla de
caf e), se tiene lo siguiente:
#BOX-PIERCE Y LJUNG-BOX SOBRE LA SERIE DE RESIDUALES MODELOS AJUSTADOS
m=length(salario)/4
df=c(rep(NA,aux))
for(i in 1:aux){
*
i),type=type)
df[i]=test[[2]]
}
lag=6
*
c(1:aux)
rownames(teste)=lag
teste
}
Box.resmodelo1=BP.LB.test(residuals(modelo1),maxlag=m,type="Box")
Ljung.resmodelo1=BP.LB.test(residuals(modelo1),maxlag=m,type="Ljung")
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
La Tabla 6.2 presenta los resultados obtenidos con el anterior c odigo R. Qu e pode-
mos concluir acerca de los errores de cada modelo, seg un los testes de Box-
Pierce y Ljung-Box?
Tabla 6.1: Resultados Testes Box-Pierce y Ljung-Box para series simuladas, a
t
, Z
1,t
, Z
2,t
,
Z
3,t
y Z
4,t
, t = 1, 2, , 100
Resultados para serie at
Test Box-Pierce Test Ljung-Box
m Q
BP
df VP Q
LB
df VP
6 8.49 6.00 0.20 8.98 6.00 0.17
12 12.09 12.00 0.44 13.03 12.00 0.37
18 16.64 18.00 0.55 18.52 18.00 0.42
24 18.99 24.00 0.75 21.59 24.00 0.60
Resultados para serie Z
1,t
m Q
BP
df VP Q
LB
df VP
6 88.31 6.00 0.00 91.52 6.00 0.00
12 88.70 12.00 0.00 91.96 12.00 0.00
18 90.49 18.00 0.00 94.14 18.00 0.00
24 94.25 24.00 0.00 99.12 24.00 0.00
2,t
m Q
BP
df VP Q
LB
df VP
6 456.90 6.00 0.00 482.31 6.00 0.00
12 789.35 12.00 0.00 856.54 12.00 0.00
18 977.56 18.00 0.00 1082.78 18.00 0.00
24 1050.84 24.00 0.00 1177.32 24.00 0.00
3,t
m Q
BP
df VP Q
LB
df VP
6 50.95 6.00 0.00 52.63 6.00 0.00
12 55.78 12.00 0.00 58.00 12.00 0.00
18 58.84 18.00 0.00 61.80 18.00 0.00
24 69.98 24.00 0.00 76.06 24.00 0.00
4,t
m Q
BP
df VP Q
LB
df VP
6 16.83 6.00 0.01 17.44 6.00 0.01
12 20.73 12.00 0.05 21.91 12.00 0.04
18 23.33 18.00 0.18 25.06 18.00 0.12
24 25.78 24.00 0.36 28.24 24.00 0.25
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
176 CAP
ON DE LOS CICLOS
Tabla 6.2: Resultados Testes Box-Pierce y Ljung-Box para residuales de los tres modelos
ajustados a serie de ndice mensual de salario real
Resultados para serie de residuales modelo 1
m Q
BP
df VP Q
LB
df VP
6 264.71 6.00 0.00 272.96 6.00 0.00
12 270.27 12.00 0.00 278.96 12.00 0.00
18 302.86 18.00 0.00 316.25 18.00 0.00
24 368.68 24.00 0.00 394.76 24.00 0.00
30 394.45 30.00 0.00 426.91 30.00 0.00
m Q
BP
df VP Q
LB
df VP
6 266.68 6.00 0.00 275.01 6.00 0.00
12 272.30 12.00 0.00 281.06 12.00 0.00
18 299.64 18.00 0.00 312.34 18.00 0.00
24 358.13 24.00 0.00 382.12 24.00 0.00
30 378.81 30.00 0.00 407.91 30.00 0.00
m Q
BP
df VP Q
LB
df VP
6 266.85 6.00 0.00 275.27 6.00 0.00
12 274.91 12.00 0.00 283.90 12.00 0.00
18 292.14 18.00 0.00 303.68 18.00 0.00
24 345.31 24.00 0.00 367.20 24.00 0.00
30 382.26 30.00 0.00 413.44 30.00 0.00
Para los residuales del modelo ajustado al logaritmo de la serie de produc-
ci on trimestral de cemento, en C odigo R 5.7, tenemos que:
m=length(lnyt)/4
df=c(rep(NA,aux))
for(i in 1:aux){
*
i),type=type)
df[i]=test[[2]]
}
lag=6
*
c(1:aux)
rownames(teste)=lag
teste
}
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Tabla 6.3: Resultados Testes Box-Pierce y Ljung-Box para residuales del modelo ajustado
a serie de logaritmo de producci on trimestral de cemento portland
Resultados para serie de residuales
modelo log cuadr atico estacional
m Q
BP
df VP Q
LB
df VP
6 243.65 6.00 0.00 250.18 6.00 0.00
12 259.03 12.00 0.00 266.82 12.00 0.00
18 265.53 18.00 0.00 274.18 18.00 0.00
24 270.39 24.00 0.00 279.93 24.00 0.00
30 276.54 30.00 0.00 287.48 30.00 0.00
36 288.28 36.00 0.00 302.51 36.00 0.00
A partir de estos resultados Qu e se concluye para los errores del modelo
ajustado en el c odigo R 5.7?
Finalmente, considere los residuales del modelo de tendencia lineal ajusta-
do a la serie ilustrada en la Figura 6.13 usando el c odigo R 6.2:
m=length(yt)/4
df=c(rep(NA,aux))
for(i in 1:aux){
*
i),type=type)
df[i]=test[[2]]
}
lag=6
*
c(1:aux)
rownames(teste)=lag
teste
}
Box.resregresion=BP.LB.test(residuals(regresion),maxlag=m,type="Box")
Ljung.resregresion=BP.LB.test(residuals(regresion),maxlag=m,type="Ljung")
Los resultados se presentan a continuaci on. Compare con lo que se con-
cluye a partir de la ACF o FAC muestral ilustrada en la Figura 6.14:
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
178 CAP
ON DE LOS CICLOS
Tabla 6.4: Test Box-Pierce y Ljung-Box para los residuales del modelo ajustado a la serie
en la Figura 6.13
Resultados para serie de residuales modelo lineal
m Q
BP
df VP Q
LB
df VP
6 3.70 6.00 0.72 3.78 6.00 0.71
12 6.61 12.00 0.88 6.81 12.00 0.87
18 13.28 18.00 0.77 13.86 18.00 0.74
24 15.35 24.00 0.91 16.12 24.00 0.88
30 17.89 30.00 0.96 18.93 30.00 0.94
36 26.18 36.00 0.89 28.26 36.00 0.82
42 28.58 42.00 0.94 31.06 42.00 0.89
48 34.35 48.00 0.93 37.89 48.00 0.85
54 41.61 54.00 0.89 46.76 54.00 0.75
60 42.91 60.00 0.95 48.37 60.00 0.86
66 48.91 66.00 0.94 56.01 66.00 0.80
72 53.32 72.00 0.95 61.81 72.00 0.80
Podemos concluir que los errores del modelo lineal para la serie son un
ruido blanco?
6.7. Procesos Autorregresivos de orden 1, AR(1)
Un proceso {Z
t
}
t1
es un proceso AR(1) si satisface
Z
t
= +
1
(Z
t1
) + a
t
, con a
t
R.B (6.9)
donde a
t
es independiente de Z
t1
, Z
t2
, . Note que la ecuaci on (6.9) implica
un modelo de regresi on lineal entre la serie Z
t
y sus valores rezagados un
lugar en el tiempo, de ah el nombre autorregresivo de orden 1. Para que Z
t
sea estacionario en covarianza, es necesario que satisfaga las tres condiciones
enunciadas en la Secci on 6.2. Si Z
t
es estacionario en covarianza con E[Z
t
] = ,
entonces de la ecuaci on (6.9) obtenemos
= +
1
( ) (1
1
) = (1
1
)
la ultima igualdad se satisface si = o bien si
1
= 1, sin embargo, en este
ultimo caso la serie no ser a estacionaria en covarianza. S olo si |
1
| < 1 la serie
ser a estacionaria en covarianza. Si llamamos

Z
t
= Z
t
, podemos escribir
Z
t
=
1

Z
t1
+ a
t
(6.10)
Tambi en de (6.9) y si el proceso es estacionario en covarianza, VAR[Z
t
] =
(0) entonces
(0) =
2
1
(0) +
2
a
(0) =

2
a
1
2
1
, con |
1
| < 1
Bajo el supuesto de estacionariedad en covarianza, si en la ecuaci on (6.10)
multiplicamos ambos lados por

Z
tk
y tomamos valor esperado, obtenemos
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
6.8. TEST DURBIN-WATSON DE INCORRELACI
ON DE ORDEN 1 179
la funci on de autocovarianza (k) del proceso Z
t
(tenga en cuenta que a
t
es
independiente de

Z
tk
),
(k) =
1
(k 1) + E[a
t

Z
tk
] =
1
(k 1)
y haciendo iterativamente, k = 1, 2, vemos que
(k) =
k
1
_

2
a
1
2
1
_
, con |
1
| < 1
de donde la FAC o ACF te orica corresponde a
(k) =
(k)
(0)
=
k
1
con |
1
| < 1. (6.11)
M as adelante veremos que para la estacionariedad en covarianza del proceso
AR(1), es necesario que este pueda escribirse como un ltro lineal de la serie
de ruido blanco a
t
(Teorema de representaci on de Wold), especcamente, se
debe cumplir que

Z
t
=
j=0
j
1
a
tj
con
j=0
2j
1
< , lo cual es v alido s olo si |
1
| < 1.
En la Figura 6.17 se muestran las funciones de autocorrelaci on te oricas para
varios procesos AR(1). Los procesos representados en la Figura 6.3, tambi en
son procesos AR(1) estacionarios en covarianza.
Note que la ACF o FAC de un proceso AR(1) tiene un comportamiento de
decaimiento exponencial o amortiguado sobre valores positivos si 0 <
1
< 1 o
alternando entre valores positivos y negativos si 1 <
1
< 0. Tambi en note de la
ecuaci on en (6.11), que para que se cumpla la ergodicidad, es decir, lm
k
(k) = 0,
esto s olo es posible si |
1
| < 1.
6.8. Test Durbin-Watson de incorrelaci on de orden 1
A continuaci on vamos a enunciar este teste en relaci on a los errores de un
modelo de regresi on para una serie Y
t
:
Y
t
= f(t, ) + E
t
(6.12)
donde f(t, ) es una funci on determinstica del tiempo con vector de par ame-
tros y E
t
es la componente aleatoria de media cero.
6.8.1. Formulaci on del test
Sea E
t
un proceso estacionario en covarianza de media cero representando
los errores del modelo en (6.12). El teste Durbin Watson supone inicialmente
que E
t
constituye un proceso AR(1) gaussiano estacionario en covarianza, es
decir
E
t
=
1
E
t1
+ a
t
con a
t
R.B N(0,
2
a
) y |
1
| < 1. (6.13)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
180 CAP
ON DE LOS CICLOS
0 2 4 6 8 10 12
k
(
k
)
1

1
= 0.9
0 2 4 6 8 10 12
k
(
k
)
1

1
= 0.4
0 2 4 6 8 10 12
k
(
k
)
1
1
1
= 0.8
0 2 4 6 8 10 12
k
(
k
)
1
1
1
= 0.5
Figura 6.17: Ejemplos (k) de procesos AR(1)
De (6.11) se tiene que
1
= (1). Luego, el teste plantea lo siguiente:
H
0
:
1
= 0, o en forma equivalente H
0
: (1) = 0 (6.14)
versus
_
_
a) H
1
:
1
> 0 o en forma equivalente H
1
: (1) > 0
b) H
1
:
1
< 0 o en forma equivalente H
1
: (1) < 0
c) H
1
:
1
= 0 o en forma equivalente H
1
: (1) = 0
La elecci on de la hip otesis alternativa generalmente se da entre las dos primeras
opciones: a) que prueba autocorrelaci on positiva de orden 1, y b) que prueba
autocorrelaci on negativa de orden 1. Esta elecci on se hace con base en el valor
del estadstico de prueba.
6.8.2. El estadstico de prueba
A partir de la hip otesis nula vemos que es necesario calcular el estimador
del coeciente
1
o equivalentemente, la autocorrelaci on de orden 1 (1). Sean
E
1
,

E
2
, ,

E
n
los valores estimados (los residuales del modelo de regresi on)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
ON DE ORDEN 1 181
para la serie de E
1
, E
2
, , E
n
. De la ecuaci on (6.2), con

E
t
= 0, para k = 1
tenemos

1
= (1) donde
(1) =
n
t=2
E
t1

E
t
n
t=1
E
2
t
o bien, (1) =
n1
t=1
E
t

E
t+1
n
t=1
E
2
t
(6.15)
Ahora bien, el estadstico de la prueba Durbin-Watson es
d
1
=
n
t=2
(

E
t

E
t1
)
2
n
t=1
E
2
t
(6.16)
Para n grande se tienen las siguientes aproximaciones
n
t=2
E
2
t

n
t=2
E
2
t1

n
t=1
E
2
t
de donde
n
t=2
(

E
t

E
t1
)
2
2
_
n
t=1
E
2
t

n
t=2
E
t1

E
t
_
Luego, de (6.15) y (6.16) obtenemos
d
1
2 (1 (1)) . (6.17)
6.8.3. La ejecuci on de la prueba
Desde que 1 < (1) < 1 entonces 0 < d
1
< 4. Note que
1. Si la verdadera autocorrelaci on de orden 1, (1), es igual a cero entonces
se espera que (1) 0 y as d
1
2 y la hip otesis H
0
no es rechazada.
2. Si (1) > 0 entonces (1) > 0 y por tanto 0 < d
1
< 2 y si este estadstico
es muy peque no (bastante inferior a 2) entonces la hip otesis H
0
debe ser
rechazada.
3. Si (1) < 0 entonces (1) < 0 y por tanto 2 < d
1
< 4 y si este estadstico
es muy grande (bastante superior a 2) entonces la hip otesis H
0
tambi en
debe ser rechazada.
Con base en lo anterior se tiene que los pasos a seguir para la realizaci on del
teste Durbin-Watson son: calcular primero el estadstico d
1
y luego elegir entre
las hip otesis alternativas a) y b) en (6.14) con base en la siguiente regla:
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
182 CAP
ON DE LOS CICLOS
1. si d
1
< 2 probamos que
H
0
:
1
= 0 vs. H
1
:
1
> 0 (Hay autocorrelaci on positiva de orden 1 en E
t
)
(6.18)
o equivalentemente
H
0
: (1) = 0 vs. H
1
: (1) > 0 (Hay autocorrelaci on positiva de orden 1 en E
t
)
(6.19)
Para la decisi on consideramos el valor P del test. Sea DW
1
la variable
aleatoria que corresponde al estadstico del test Durbin-Watson de orden
1 y el nivel de signicancia de la prueba. Para probar autocorrelaci on
de orden 1 positiva, el valor P es
VP = P(DW
1
< d
1
) (6.20)
Rechazamos H
0
en favor de la hip otesis de autocorrelaci on positiva de
orden 1 si VP .
2. si d
1
> 2 probamos que
H
0
:
1
= 0 vs. H
1
:
1
< 0 (Hay autocorrelaci on negativa de orden 1 en E
t
)
(6.21)
o equivalentemente
H
0
: (1) = 0 vs. H
1
: (1) < 0 (Hay autocorrelaci on negativa de orden 1 en E
t
)
(6.22)
De nuevo, usamos el valor P para la decisi on. En este caso, para probar
autocorrelaci on negativa de orden 1, el valor P es dado por
VP = P(DW
1
> d
1
) (6.23)
y Rechazamos H
0
en favor de la hip otesis de autocorrelaci on negativa de
orden 1 si VP .
CUIDADO: En ning un caso, no rechazar la hip otesis nula del test Durbin-
Watson conduce a concluir que la serie E
t
sea incorrelacionada y menos a un
un ruido blanco. H
0
: (1) = 0 no implica que la funci on de autocorrelaci on
(k) = 0 para todo k 1, solamente dice que para k = 1 es cero y esto no
garantiza que lo mismo sea v alido para los dem as valores de k.
6.8.4. Test Durbin-Watson en R
En la librera car versi on 2.0-10 de R se dispone de la funci on durbinWatsonTest()
(en versiones anteriores a la versi on 2.0-0 de la librera car la funci on es
durbin.watson()). Su sintaxis es como sigue:
durbinWatsonTest(model, max.lag=1, simulate=TRUE, reps=1000,
method=c("resample","normal"),
alternative=c("two.sided", "positive", "negative"), ...)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
ON DE ORDEN 1 183
donde
model es un objeto de regresi on tipo lm o un vector de residuales de un
modelo lineal
max.lag especica el orden autorregresivo a probar. Por defecto consi-
dera k = 1.
simulate por defecto establece el c alculo de los valores P mediante el
m etodo de simulaci on bootstrap
method especica el m etodo bootstrap a aplicar. resample remuestrea
de la muestra de residuales observados del modelo; normal muestrea
de la distribuci on N(0,
2
), donde
2
es la varianza estimada en el modelo
ajustado.
alternative para max.lag=1 permite especicar el signo de la auto-
correlaci on en la hip otesis alternativa como two.sided para probar
(1) = 0, positive para probar (1) > 0 y negative para probar
(1) < 0. Si se especica max.lag=k con k > 1, entonces la funci on s olo
considera la hip otesis alternativa two.sided.
Veamos la aplicaci on de este test a los residuales de algunos de los mode-
los ajustados a las series consideradas en este captulo, para ello usamos la
siguiente funci on de usuario pruebaDW1(), con la cual se puede obtener los
valores P para las pruebas con autocorrelaci on positiva y negativa, en cada
caso:
C odigo R 6.4.
###TEST DURBIN WATSON DE ORDEN 1######
library(car)
pruebaDW1=function(modelo){
dwneg=durbinWatsonTest(modelo,max.lag=1,method="normal",alternative="negative")
dwpos=durbinWatsonTest(modelo,max.lag=1,method="normal",alternative="positive")
res=data.frame(1,dwneg$r,dwneg$dw,dwpos$p,dwneg$p)
names(res)=c("lag","rho estimado","Estadstico D-W","VP rho>0","VP rho<0")
res
}
Tenga en cuenta que para usar la funci on usuario anterior debe correr el
c odigo completo antes de invocarla.
pruebaDW1(modelo1)
pruebaDW1(modelo2)
pruebaDW1(modelo3)
Con lo anterior obtenemos,
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
184 CAP
ON DE LOS CICLOS
Salida R 6.2.
> pruebaDW1(modelo1)
lag rho estimado Estadstico D-W VP rho>0 VP rho<0
1 1 0.8005603 0.3258302 0 1
1 1 0.8017732 0.3308284 0 1
1 1 0.7929206 0.3828777 0 1
de donde,
Tabla 6.5: Resultados Test Durbin-Watson de orden 1 para residuales de los tres modelos
ajustados a la serie de ndice mensual de salario real
H
1
: (1) > 0 H
1
: (1) < 0
Modelo k (1) Estadstico d
1
P(DW
1
< d
1
) P(DW
1
> d
1
)
modelo1 1 0.8005603 0.3258302 0 1
modelo2 1 0.8017732 0.3308284 0 1
modelo3 1 0.7929206 0.3828777 0 1
Qu e test debe realizarse y que se concluye en cada caso?
Aplicando de manera similar la funci on usuario pruebaDW1() al modelo
ajustado en el c odigo R 6.2, obtenemos:
H
1
: (1) > 0 H
1
: (1) < 0
Modelo k (1) Estadstico d
1
P(DW
1
< d
1
) P(DW
1
> d
1
)
regresion 1 0.0474274 1.9041074 0.1750000 0.8150000
Cu al test debe realizarse y qu e se concluye?
6.9. Ejercicio
Considere la serie asignada en el trabajo 1 y los modelos ajustados. Aplique
con cada modelo los testes de ruido blanco con la FAC muestral, Box-Pierce y
Ljung-Box. As mismo realice el teste de incorrelaci on Durbin-Watson. Analice
el comportamiento de la FAC muestral de los residuales Hay ergodicidad?
Hay estacionariedad? Son ruido blanco los errores del modelo?
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Captulo 7
Introducci on a los modelos ARMA
En el captulo anterior fue vista la denici on general de procesos esta-
cionarios en covarianza as como el tipo particular de procesos de ruidos blan-
co (R.B) y fueron introducidos brevemente los procesos autorregresivos de or-
den 1, AR(1). A continuaci on se dene al operador rezago B
j
y el Teorema de
Wold, con el cual caracterizamos de forma m as especca a los procesos esta-
cionarios en covarianza. Luego se ver an los tipos de procesos estacionarios en
covarianza: de medias m oviles de orden q o MA(q), los autorregresivos de orden
p o AR(p) y los procesos lineales autorregresivos de medias m oviles de orden p,
q o ARMA(p,q). Los tres modelos mencionados son aproximaciones de la repre-
sentaci on de Wold y en ocasiones dos o m as de estos modelos pueden producir
aproximaciones igualmente buenas a la representaci on de Wold (Diebold [3]),
as, la idea es buscar la aproximaci on m as parsimoniosa que capture lo mejor
posible el patr on de autocorrelaci on presente.
7.1. El operador Rezago B
j
y polinomio de rezagos de orden
j
El operador rezago B
j
es tal que aplicado a la serie {Z
t
} produce la serie de
t erminos rezagados o retardados j lugares en el tiempo, es decir
B
j
Z
t
= Z
tj
(7.1)
Ahora bien, un polinomio de rezagos de orden j es el que corresponde a la
siguiente expresi on
j
(B) = 1 +
1
B +
2
B
2
+
3
B
3
+ +
j
B
j
(7.2)
Observe que la ecuaci on anterior dene un polinomio de orden j en B.
De (7.1) y (7.2) se tiene que al aplicar
j
(B) sobre la serie {Z
t
} obtenemos,
j
(B)Z
t
= Z
t
+
1
Z
t1
+
2
Z
t2
+
3
Z
t3
+ +
j
Z
tj
(7.3)
Cuando j = tenemos un polinomio de rezagos innitos el cual simplemente
denotamos como
(B) =
i=0
i
B
i
, con
0
= 1 (7.4)
185
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
186 CAP
ITULO 7. INTRODUCCI
ON A LOS MODELOS ARMA

Este polinomio se conoce como ltro lineal (ver Secci on 4.2.1).
7.2. El Teorema de representaci on de Wold
Sea {Z
t
} cualquier proceso estacionario en covarianza de media cero (se
est a requiriendo que el proceso no contenga componentes deterministas), en-
tonces este proceso se puede representar como un ltro lineal de un proceso
de ruido blanco, es decir:
Z
t
= (B)a
t
=
i=0
i
a
ti
, con a
t
R.B(0,
2
a
),
0
= 1 y
i=1
2
i
< (7.5)
Los a
t
se denominan innovaciones y a la ecuaci on (7.5) proceso lineal gene-
ral.
NOTA: Supondremos que el ruido blanco es gaussiano, es decir que los t ermi-
nos que lo conforman son variables aleatorias normales de media cero, vari-
anza constante e incorrelacionados (independientes bajo la normalidad).
El Teorema de representaci on de Wold nos dice que cuando se formulan
modelos de pron ostico para series estacionarias en covarianza de media cero,
s olo se necesitan considerar modelos de un proceso lineal general o de ltro
lineal de un ruido blanco. Puede demostrarse que bajo las condiciones del
Teorema de Wold se cumple que:
E[Z
t
] = 0, la media del proceso (7.6)
VAR =
2
a
i=0
2
i
< , la varianza del proceso y es nita (7.7)
E[Z
t
|a
t1
, a
t2
, ] =
i=1
i
a
ti
, la media dado las innovaciones pasadas (7.8)
VAR[Z
t
|a
t1
, a
t2
, ] =
2
a
, la varianza dado las innovaciones pasadas (7.9)
(k) =
2
a
i=0
i+k
, la autocovarianza del proceso (7.10)
Mientras que la media incondicional es constante en el tiempo, la media condi-
cional se mueve en el tiempo en respuesta al conjunto de informaci on que
evoluciona, capturando la din amica del proceso, lo cual es importante para la
realizaci on de pron osticos.
7.3. Funci on de autocorrelaci on Parcial o PACF
Considere un proceso estacionario en covarianza {Z
t
}
t1
de media cero. La
funci on de autocorrelaci on parcial o PACF (Partial Autocorrelation Function)
corresponde a la autocorrelaci on entre Z
t
y Z
t+k
despu es de remover las de-
pendencias lineales mutuas con las variables Z
t+1
, Z
t+2
, , Z
t+k1
. Es decir, la
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.3. FUNCI

ON DE AUTOCORRELACI
ON PARCIAL O PACF 187

PACF es la correlaci on condicional Corr(Z
t
, Z
t+k
|Z
t+1
, Z
t+2
, , Z
t+k1
), la cual
denotaremos por
kk
.
Te oricamente, Para hallar la PACF es necesario realizar la regresi on lineal
poblacional (es decir, con base en una muestra innita de datos) de Z
t+k
(la
variable respuesta) versus Z
t+k1
, Z
t+k2
, Z
t+k3
, , Z
t
(las variables explicato-
rias) donde el coeciente en tal regresi on que corresponde a Z
t
es
kk
, siendo
el modelo de regresi on
Z
t+k
=
k1
Z
t+k1
+
k2
Z
t+k2
+
k3
Z
t+k3
+ +
kk
Z
t
+ u
t+k
(7.11)
donde u
t+k
R.B tal que COV(u
t+k
, Z
t+kj
) = 0 j 1. Si multiplicamos a
ambos lados de (7.11) por Z
t+kj
, tomamos valor esperado y luego dividimos
por (0) (la varianza de Z
t
), obtenemos la ACF en j, esto es
(j) =
k1
(j1)+
k2
(j2)+
k3
(j3)+ +
kk
(jk), para j = 1, 2, , k (7.12)
Para hallar el valor del coeciente
kk
se conforma el siguiente sistema de ecua-
ciones de orden k k donde usamos la ecuaci on en (7.12) con j = 1, 2, 3, , k:
(1) =
k1
(0) +
k2
(1) +
k3
(2) + +
kk
(k 1),
(2) =
k1
(1) +
k2
(0) +
k3
(1) + +
kk
(k 2),
.
.
. =
.
.
.
(k) =
k1
(k 1) +
k2
(k 2) +
k3
(k 3) + +
kk
(0),
con (0) = 1 y (j k) = (k j) (porque la autocorrelaci on es una funci on
sim etrica alrededor de cero). En este sistema de ecuaciones, las inc ognitas
son los coecientes
kj
, pero en particular nos interesa hallar a
kk
. El ante-
rior sistema de ecuaciones es conocido como el sistema de ecuaciones Yule
Walker. Matricialmente, tenemos = R, entonces = R
1
, donde
=
_
_
(1)
(2)
.
.
.
(k)
_
_
k1
R =
_
_
1 (1) (2) (k 1)
(1) 1 (1) (k 2)
.
.
.
.
.
.
.
.
.
.
.
.
(k 1) (k 2) (k 3) 1
_
_
kk
=
_
k1
k2
k3
.
.
.
kk
_
_
k1
La soluci on de este sistema de ecuaciones puede ser hallada por la Regla de
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
188 CAP
ITULO 7. INTRODUCCI

Cramer, que para k = 1, 2, . . ., establece que
kk
=
1 (1) (2) (k 2) (1)

(1) 1 (1) (k 3) (2)
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
(k 1) (k 2) (k 3) (1) (k)
1 (1) (2) (k 2) (k 1)
(1) 1 (1) (k 3) (k 2)
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
(k 1) (k 2) (k 3) (1) 1
(7.13)
LA PACF muestral, es decir,

kk
puede ser calculada mediante el sistema de
ecuaciones de Yule Walker, pero usando en este sistema los valores estimados
(j) de la funci on de autocorrelaci on. Otra posibilidad es utilizar un m etodo
recursivo de estimaci on, que consiste de los pasos siguientes:
1. Inicializar con

11
= (1)
2. Para k > 1 calcular
k+1,k+1
=
(k + 1)
k
j=1
kj
(k + 1 j)
1
k
j=1
kj
(j)
, y
k+1,j
=

kj
k+1,k+1
k,k+1j
, j = 1, , k.
Por ejemplo, para hallar

22
hacemos k + 1 = 2, es decir, k = 1, por tanto
el ndice en las sumatorias s olo llega hasta 1:
22
=
(2)
1
j=1
1j
(2 j)
1
1
j=1
1j
(j)
=
(2)

11
(1)
1

11
(1)
, y

21
=

11
22
11
.
NOTA: La PACF tambi en es una funci on sim etrica alrededor de cero, luego,
basta considerar valores de k no negativos para su estudio.
7.3.1. PACF para un proceso de ruido blanco
Sea {E
t
}
t1
un proceso de ruido blanco, entonces para una serie E
1
, E
2
, , E
n
con n grande, se cumple que
E[
kk
] = 0, VAR[
kk
]
1
n
y

kk
aprox.
N
_
0,
1
n
_
(7.14)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.3. FUNCI

ON DE AUTOCORRELACI

y desde que para un ruido blanco (0) = 1 y (k) = 0 para todo k = 0, entonces
tambi en
00
= 1 y
kk
= 0 para k = 0:
0 1 2 3 4 1 2 3 4
kk
1
k
Figura 7.1: PACF de un proceso de ruido blanco
Sin embargo en una muestra de tama no n, para establecer si un proceso es
un ruido blanco a trav es de su PACF muestral, es necesario probar que para
todo k > 0 la PACF es cero, y de la misma manera que cuando consideramos
la ACF, tenemos que establecer esto realizando para cada k = 1, 2, , m, m =
[n/4] la siguiente prueba de hip otesis:
H
0
:
kk
= 0 versus H
1
:
kk
= 0 (7.15)
Si en ninguna de las m pruebas se rechaza H
0
, entonces el proceso puede
considerarse un ruido blanco, pero si para alg un k se rechaza H
0
, entonces
el proceso no es ruido blanco. La regi on de rechazo, con una signicancia
aproximada del 5% est a dada por |
kk
| > 2/
n.
Al igual que en la ACF o FAC, las pruebas para la PACF se realizan gr aca-
mente, trazando sobre la PACF muestral las bandas de los lmites de aceptaci on-
rechazo. Una gr aca tpica de la PACF muestral de un ruido blanco es como
la de la Figura 7.3.1.
Observe que excepto para k = 0, en los dem as rezagos la funci on toma
valores dentro de la regi on de aceptaci on.
7.3.2. PACF muestral con R
En R se obtiene la funci on de autocorrelaci on muestral mediante la funci on
pacf():
pacf(x, lag.max, plot, na.action, ...)
donde
x es un objeto serie de tiempo o un vector num ericos
lag.max el n umero m aximo de rezagos para los cuales se desea calcular
la funci on
plot argumento l ogico para indicar si se desea gracar o no la PACF.
na.action Funci on a ser llamada para manejar datos faltantes.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
190 CAP
ITULO 7. INTRODUCCI

0 5 10 15 20 25
k
^
k
k
2 n
0
2 n
Figura 7.2: PACF muestral de un ruido blanco
7.3.3. Ejemplos
Considere las series a
t
, Z
1,t
, Z
2,t
, Z
3,t
y Z
4,t
, t = 1, 2, , 100 presentadas en la
Secci on 6.5.1. Las PACF muestrales correspondientes son presentadas en la
Figura 7.3.
Determine en cada caso, usando la prueba de la PACF, cu ales de las series
son ruido blanco y cu ales no lo son. Las PACFs fueron obtenidas con el C odi-
go R 7.1.
C odigo R 7.1.
#Separando las series
at=datos[,1];Z1t=datos[,2];Z2t=datos[,3];Z3t=datos[,4];Z4t=datos[,5]
#Calculando m=[n/4]. Todas las series aqu tienen longitud
#igual al numero de filas de la matriz de datos
m=floor(nrow(datos)/4)
#Graficando las PACF muestrales
nf=layout(rbind(c(1,2),c(3,4),c(5,6)))
pacf(at,lag.max=m,ci.col=2);pacf(Z1t,lag.max=m,ci.col=2);pacf(Z2t,lag.max=m,ci.col=2)
pacf(Z3t,lag.max=m,ci.col=2);pacf(Z4t,lag.max=m,ci.col=2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.3. FUNCI

ON DE AUTOCORRELACI

5 10 15 20 25
0
.
2
0
.
0
0
.
1
0
.
2
Lag
P
a
r
t
i
a
l

A
C
F
Series at
5 10 15 20 25
0
.
2
0
.
2
0
.
6
Lag
P
a
r
t
i
a
l

A
C
F
Series Z1t
5 10 15 20 25
0
.
2
0
.
2
0
.
6
Lag
P
a
r
t
i
a
l

A
C
F
Series Z2t
5 10 15 20 25
0
.
6
0
.
2
0
.
2
Lag
P
a
r
t
i
a
l

A
C
F
Series Z3t
5 10 15 20 25
0
.
4
0
.
2
0
.
0
0
.
2
Lag
P
a
r
t
i
a
l

A
C
F
Series Z4t
Figura 7.3: PACFs series simuladas en Secci on 6.5.1.
Considere adem as la PACF de los residuales del modelo log cuadr atico esta-
cional ajustado a la serie de producci on de cemento en la Secci on 5.3.3 y
realice el test de ruido blanco usando la PACF qu e se concluye?
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
192 CAP
ITULO 7. INTRODUCCI

0 10 20 30
0
.
2
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
Lag
P
a
r
t
i
a
l

A
C
F
PACF residuales modelo log cuadrtico estacional
Serie produccin trimestral de cemento portland
Figura 7.4: PACF residuales modelo log cuadr atico estacional serie producci on trimestral
de cemento portland
m=length(lnyt)/4
win.graph(width=4.875,height=3.5,pointsize=8)
pacf(residuals(modelo1),lag.max=m,ci.col=2,
main="PACF residuales modelo log cuadratico estacional\nSerie produccion trimestral de cemento portland")
7.4. Modelos de medias m oviles o MA
7.4.1. El proceso de media m ovil de orden 1 o MA(1)
Llamaremos a un proceso {Z
t
}
t1
de media m ovil de orden 1 al proceso
estacionario en covarianza de media cero tal que
Z
t
= (1 +
1
B)a
t
= a
t
+
1
a
t1
, donde a
t
R.B(0,
2
a
) (7.16)
Es decir, un MA(1) es un ltro lineal de un ruido blanco con
1
=
1
, mientras
que
j
= 0, j 2. Por tanto, un proceso MA(1) es estacionario en covarianza,
de acuerdo al Teorema de representaci on de Wold. Claramente, La media del
proceso es cero: E[Z
t
] = 0 y su varianza es VAR[Z
t
] =
2
a
(1 +
2
1
).
Funci on de autocorrelaci on y autocorrelaci on parcial
Por la denici on de covarianza y sus propiedades, tenemos que la funci on
de autocovarianza es,
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.4. MODELOS DE MEDIAS M

OVILES O MA 193
(1) = COV(Z
t
, Z
t1
) = COV(a
t
+
1
a
t1
, a
t1
+
1
a
t2
)
= COV(
1
a
t1
, a
t1
) =
1
2
a
(7.17)
mientras que para todo k 2
(k) = COV(Z
t
, Z
tk
) = COV(a
t
+
1
a
t1
, a
tk
+
1
a
tk1
) = 0 (7.18)
De donde, la funci on de autocorrelaci on del proceso es
(k) =
_
_
1 si k = 0;
1
1 +
2
1
si k = 1;
0 si k 2
(7.19)
Teniendo en cuenta la anterior ecuaci on y aplicando iterativamente el sistema
de ecuaciones de Yule-Walker antes denido, es posible mostrar que la funci on
de autocorrelaci on parcial para un MA(1) es
kk
=
(1)
k+1
k
1
(1
2
1
)
1
2(k+1)
1
, para k 1 (7.20)
De la Figura 7.5 observe que al contrario de la ACF, la PACF de un MA(1)
tiene un comportamiento de cola decreciente exponencialmente en una de dos
formas, dependiendo del signo de
1
. Tambi en puede mostrarse que |
kk
| < 1/2.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
194 CAP
ITULO 7. INTRODUCCI

0 2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.5
2 4 6 8 10 12
k
k
k
0.5
0
0.5
1
= 0.5
0 2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.5
2 4 6 8 10 12
k
k
k
0.5
0
0.5
1
= 0.5
0 2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.9
2 4 6 8 10 12
k
k
k
0.5
0
0.5
1
= 0.9
0 2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.9
2 4 6 8 10 12
k
k
k
0.5
0
0.5
1
= 0.9
Figura 7.5: Ejemplos (k) y
kk
de procesos MA(1)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.4. MODELOS DE MEDIAS M

OVILES O MA 195
7.4.2. Procesos MA(q)
Un proceso estacionario en covarianza de media cero tal que
Z
t
=
q
(B)a
t
, con
q
(B) = 1 +
1
B +
2
B
2
+ +
q
B
q
y a
t
R.B(0,
2
a
) (7.21)
es un proceso de medias m oviles de orden q. Este proceso es una general-
izaci on de un MA(1). Observe que todo proceso MA es estacionario en covari-
anza (Teorema de representaci on de Wold).
De acuerdo a Guerrero [5] un proceso MA puede interpretarse de la si-
guiente manera: dado un proceso en equilibrio, las uctuaciones alrededor del
punto de equilibrio, {Z
t
}
t1
, son causadas por choques asociados a eventos ines-
perados. Tales choques no necesariamente se asimilan de manera instant anea,
sino que pueden seguir causando efectos a un despu es de transcurrido cierto
n umero de perodos y adem as la intensidad del choque se reeja en el valor de
su ponderaci on
i
.
Para el proceso MA(q) tenemos que E[Z
t
] = 0, VAR[Z
t
] = (1+
2
1
+
2
2
+ +
2
q
)
2
a
y su autocovarianza de orden k es dada por
(k) =
_
(
k
+
1
k+1
+ +
qk
q
)
2
a
si k = 1, 2, , q
0 si k > q,
(7.22)
de donde, la funci on de autocorrelaci on de orden k satisface
(k) =
_
_
1 si k = 0
k
+
1
k+1
+ +
qk
q
1 +
2
1
+
2
2
+ +
2
q
si k = 1, 2, , q
0 si k > q
(7.23)
lo cual implica que el proceso MA(q) tiene una memoria limitada a q periodos.
La PACF puede ser calculada usando el sistema de ecuaciones de Yule-
Walker. En esta funci on, un proceso MA(q) tendr a todas sus autocorrela-
ciones parciales distintas de cero aunque mostrando convergencia a cero, con
decaimiento amortiguado exponencial y/o sinusoidal. Por ejemplo, para un
MA(2) tenemos que
(k) =
_
1
(1 +
2
)
2
a
si k = 1
2
a
si k = 2
0 si k > 2,
(7.24)
luego, la funci on de autocorrelaci on de orden k satisface
(k) =
_
_
1 si k = 0
1
(1 +
2
)
1 +
2
1
+
2
2
si k = 1
2
1 +
2
1
+
2
2
si k = 2
0 si k > 2
(7.25)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
196 CAP
ITULO 7. INTRODUCCI

Su PACF corresponde a
11
= (1)
22
=
(2)
2
(1)
1
2
(1)
33
=

3
(1) (1)(2) [2 (2)]
1
2
(2) 2
2
(1) [1 (2)]
(7.26)
.
.
.
La PACF decae en forma exponencial o sinusoidal dependiendo del signo y
magnitud de las races del polinomio
2
(B) = 1 +
1
B +
2
B
2
= 0. La PAFC
oscilar a sinusoidalmente si las races son complejas. En la Figura 7.6 se re-
presentan las ACFs y PACFs de algunos procesos MA(2). Note que mientras
la ACF se hace cero abruptamente, la PACF decae amortiguada.
7.5. Modelos autorregresivos de orden p o AR(p)
Los procesos autorregresivos son un tipo de proceso estoc astico en el cual
el valor actual de una serie est a linealmente relacionado con sus valores pasa-
dos m as una perturbaci on o choque aleatorio aditivo. En el Captulo 6, Sec-
ci on 6.7 fue introducido el proceso autorregresivo de orden 1 o AR(1), as que
a continuaci on trataremos el caso m as general, es decir, los procesos AR(p).
Un proceso estoc astico de media cero tal que
Z
t
=
1
Z
t1
+
2
Z
t2
+ . . . +
p
Z
tp
+ a
t
y a
t
R.B(0,
2
a
) (7.27)
con a
t
independiente de Z
tk
para todo k > 0, es un proceso autorregresivo de
orden p. En t erminos del operador de rezagos, B
j
, podemos tambi en represen-
tar el proceso por
p
(B)Z
t
= a
t
, con
p
(B) = 1
1
B
2
B
2
. . .
p
B
p
(7.28)
Un proceso AR(p) es estacionario en covarianza si y s olo s todas las races
del polinomio
p
(B) (es decir, las soluciones de la ecuaci on
p
(B) = 0) tienen
m odulo mayor a uno (yacen por fuera del crculo unitario) y de acuerdo al
Teorema de representaci on de Wold (Secci on 7.2), el proceso podr a escribirse
como un ltro lineal del ruido blanco a
t
, es decir, Z
t
=
j=0
j
a
tj
= (B)a
t
con
0
= 1 y
i=1
2
i
< .
Recuerde que si una raz r
j
de un polinomio es compleja, r
j
= a
j
+ ib
j
, i =
1, su m odulo es |r
j
| =
_
a
2
j
+ b
2
j
y que a lo sumo, un polinomio de grado p
tiene p races distintas, es decir,
p
(B) =
p
j=1
(1 r
1
j
B) (7.29)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.5. MODELOS AUTORREGRESIVOS DE ORDEN P O AR(P) 197
0 2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.5
2
= 0.7
2 4 6 8 10 12
k
k
k
0.5
0
0.5
1
= 0.5
2
= 0.7
0 2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.5
2
= 0.7
2 4 6 8 10 12
k
k
k
0.5
0
0.5
1
= 0.5
2
= 0.7
0 2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.5
2
= 0.7
2 4 6 8 10 12
k
k
k
0.5
0
0.5
1
= 0.5
2
= 0.7
0 2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.5
2
= 0.7
2 4 6 8 10 12
k
k
k
0.5
0
0.5
1
= 0.5
2
= 0.7
kk
de procesos MA(2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
198 CAP
ITULO 7. INTRODUCCI

Para el proceso AR(p) como ha sido denido en (7.27), la media es cero,
mientras que su varianza es dada por VAR[Z
t
] =
p
k=1
k
(k) +
2
a
, con (k) =
E[Z
t
Z
tk
]. Recuerde que (0) = VAR[Z
t
].
7.5.1. Funci on de autocorrelaci on y autocorrelaci on parcial de un AR(p)
Para hallar la funci on de autocorrelaci on (k), multiplicamos ambos lados
de (7.27) por Z
tk
, tomamos valor esperado y dividimos por (0) = VAR(Z
t
)
(teniendo en cuenta adem as que E(a
t
Z
tk
= 0, k > 0), obteniendo la siguiente
ecuaci on recursiva
(k) =
1
(k 1) +
2
(k 2) + +
p
(k p) k > 0, (7.30)
y hacemos uso de esta ecuaci on para hallar la funci on de autocorrelaci on en
cada k, recursivamente. Por ejemplo, Para un AR(2), tenemos
(1) =
1
+
2
(1) de donde (1) =

1
1
2
(2) =
1
(1) +
2
, de donde (2) =

2
1
+
2
(1
2
)
1
2
etc.
Cuando el proceso es estacionario en covarianza, es posible mostrar a par-
tir de (7.30) que la ACF presenta un amortiguamiento gradual. El patr on de
amortiguamiento puede ser uno de tipo mon otono como en el caso de un AR(1)
con coeciente
1
> 0, o siguiendo patrones de oscilaci on cclica que pueden
ser una mezcla de decaimientos exponenciales y sinusoidales, cuando algunas
races del polinomio
p
(B) son complejas.
Para obtener la funci on de autocorrelaci on parcial
kk
, simplemente se hace
uso del sistema de ecuaciones Yule-Walker con soluci on dada en la ecuaci on
(7.13), en donde para k > p, la ultima columna de la matriz en el numerador
puede escribirse como una combinaci on lineal de las columnas previas, seg un
la ecuaci on (7.30), y por tanto,
kk
= 0 para k > p. Tambi en puede usarse
para el c alculo de la PACF el m etodo recursivo explicado en la p agina 188.
No confunda aqu los coecientes
j
de la ecuaci on del modelo AR(p) con los
kj
, j = 1, 2, . . . , k en la ecuaci on (7.11) usada para denir la PACF.
La Figura 7.7 presenta la ACF y PACF de algunos procesos AR(1). La Figura
7.8 presenta la ACF y PACF para algunos procesos AR(2). Observe los patrones
de decaimiento amortiguado (cola decreciente) en las ACFs mientras que en
las PACFs se observa que para todo k > p la PACF es cero (patr on de corte).
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.5. MODELOS AUTORREGRESIVOS DE ORDEN P O AR(P) 199
0 2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.9
2 4 6 8 10 12
k
k
k
1
0
1
1
= 0.9
0 2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.4
2 4 6 8 10 12
k
k
k
1
0
1
1
= 0.4
0 2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.9
2 4 6 8 10 12
k
k
k
1
0
1
1
= 0.9
0 2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.4
2 4 6 8 10 12
k
k
k
1
0
1
1
= 0.4
kk
de procesos AR(1)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
200 CAP
ITULO 7. INTRODUCCI

0 2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.5
2
= 0.7
2 4 6 8 10 12
k
k
k
1
0
1
1
= 0.5
2
= 0.7
0 2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.5
2
= 0.3
2 4 6 8 10 12
k
k
k
1
0
1
1
= 0.5
2
= 0.3
0 2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.3
2
= 0.3
2 4 6 8 10 12
k
k
k
1
0
1
1
= 0.3
2
= 0.3
0 2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.8
2
= 0.6
2 4 6 8 10 12
k
k
k
1
0
1
1
= 0.8
2
= 0.6
kk
de procesos AR(2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.6. MODELOS AUTORREGRESIVOS Y DE MEDIAS M

OVILES O ARMA(P,Q)201
NOTAS:
En general, cuando un proceso puede expresarse apropiadamente me-
diante un modelo AR, se dice que es invertible. Todo proceso AR(p) es por
tanto invertible.
Cuando un proceso puede expresarse como un MA es estacionario, por
tanto todo MA(q) es estacionario.
Cuando un proceso AR(p) es estacionario entonces este es equivalente
a un MA(), lo cual implica que las races del polinomio
p
(B) tienen
m odulo mayor a uno.
Cuando un proceso MA(q) es invertible este es equivalente a un AR(),
lo cual implica que las races del polinomio
q
(B) tienen m odulo mayor a
uno.
7.6. Modelos autorregresivos y de medias m oviles o ARMA(p,q)
Los procesos ARMA son una generalizaci on de los procesos AR y MA, y
consisten en una combinaci on de ambos modelos. Por denici on, un proceso
{Z
t
}
t1
de media cero es un proceso ARMA(p,q) si
p
(B)Z
t
=
q
(B)a
t
, a
t
R.B(0,
2
a
) (7.31)
con
p
(B) = 1
1
B
2
B
2

p
B
p
y
q
(B) = 1 +
1
B +
2
B
2
+ +
q
B
q
.
NOTA: En muchos textos de series de tiempo se dene el polinomio
q
(B) =
1
1
B
2
B
2

q
B
q
. En R, funciones como arima() y auto.arima() tra-
bajan con el modelo ARMA (y los modelos MA) usando
q
(B) = 1 +
1
B +
2
B
2
+
+
q
B
q
.
Cuando las races del polinomio
p
(B) yacen fuera del crculo unitario (es
decir, tienen m odulo mayor a uno), el proceso ARMA(p,q) es estacionario en
covarianza y admite la siguiente representaci on
Z
t
=

q
(B)
p
(B)
a
t
= (B)a
t
(7.32)
Si las races del polinomio
q
(B) yacen fuera del crculo unitario, el proceso
ARMA(p,q) es invertible y puede escribirse como
p
(B)
q
(B)
Z
t
= (B)Z
t
= a
t
(7.33)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
202 CAP
ITULO 7. INTRODUCCI

7.6.1. Funci on de autocorrelaci on y autocorrelaci on parcial de un AR-
MA(p,q)
Desde que para k > i se cumple que E[Z
tk
a
ti
] = 0, puede mostrarse que la
funci on de autocovarianza (k) satisface
(k) =
1
(k 1) +
2
(k 2) + +
p
(k p), para k > q (7.34)
y por tanto la funci on de autocorrelaci on satisface,
(k) =
1
(k 1) +
2
(k 2) + +
p
(k p), para k > q, (7.35)
pero las primeras q autocorrelaciones dependen tanto de los par ametros au-
torregresivos como de los de medias m oviles del modelo. De (7.34) puede es-
tablecerse que la ACF decae o amortigua despu es del q- esimo rezago como lo
hace un proceso AR, esto es, hay patr on de cola en esta funci on.
Respecto a la funci on de autocorrelaci on parcial, debido a que el proceso AR-
MA(p,q) contiene al proceso MA como un caso especial, su PACF tambi en pre-
sentar a decaimientos de tipo exponencial y/o sinusoidal, dependiendo de las
races de los polinomios
p
(B) y
q
(B). La forma general de la PACF es com-
plicada y no necesaria, s olo es suciente notar que tendr a patr on de cola.
NOTA: Note que lo procesos AR y MA son caso particulares del modelo AR-
MA, as un AR(p) es un ARMA(p,0), mientras que un MA(q) es un ARMA(0,q).
7.6.2. Casos especiales de procesos ARMA
Guerrero [5] establece que algunos casos de procesos ARMA surgen cuando
se consideran
1. Series obtenidas por agregaci on de componentes, por ejemplo, la serie de
producto interno bruto obtenida al agregar las series correspondientes a
los diversos sectores de la economa, y
2. Series en donde los datos contienen errores de observaci on lo cual es un
caso muy com un en las series econ omicas.
Seg un lo anterior podra demostrarse que si Z
t
satisface la relaci on
Z
t
= Z
1t
+ Z
2t
(7.36)
donde Z
1t
y Z
2t
son dos procesos estacionarios, independientes y de media
cero, entonces el proceso Z
t
estar a determinado como se indica en la Tabla
7.1. La Tabla 7.2 resume la caracterizaci on de la ACF y la PACF de procesos
ARMA. En las Figuras 7.9 y 7.10 se representan las ACFs y PACFs de algunos
procesos ARMA(1,1).
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.6. MODELOS AUTORREGRESIVOS Y DE MEDIAS M

OVILES O ARMA(P,Q)203
Tabla 7.1: Modelos resultantes de agregar procesos Z
1t
y Z
2t
estacionarios e independi-
entes
Procesos individuales Procesos combinados
Z
1t
Z
2t
Zt
AR(p) Ruido blanco ARMA(p,p)
AR(p
1
) AR(p
2
) ARMA(p
1
+p
2
, max(p
1
, p
2
))
AR(p) MA(q) ARMA(p,p+q)
MA(q) Ruido blanco ARMA(0,q)
MA(q
1
) MA(q
2
) ARMA(0,max(q
1
, q
2
))
ARMA(p,q) Ruido blanco ARMA(p,max(p, q))
Tabla 7.2: Comportamiento de la ACF y PACF para procesos ARMA
Proceso ACF PACF
AR(p) Muchos valores no nulos que decrecen a cero con k Solamente las primeras p autocorrelaciones
como mezcla de patrones exponenciales y sinusoidales. parciales son distintas de cero.
MA(q) S olo las primeras k autocorrelaciones son distintas Muchos valores no nulos que decrecen a cero
de cero. con k como mezcla de patrones exponenciales
y sinusoidales.
ARMA(p,q) Comportamiento irregular de las primeras q autocor- Sucesi on innita que converge a cero.
relaciones y despu es convergencia a cero para k > q.
2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.9
1
= 0.5
2 4 6 8 10 12
k
k
k
1
0
1
1
= 0.9
1
= 0.5
2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.9
1
= 0.5
2 4 6 8 10 12
k
k
k
1
0
1
1
= 0.9
1
= 0.5
kk
de procesos ARMA(1,1)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
204 CAP
ITULO 7. INTRODUCCI

2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.9
1
= 0.5
2 4 6 8 10 12
k
k
k
1
0
1
1
= 0.9
1
= 0.5
2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.9
1
= 0.5
2 4 6 8 10 12
k
k
k
1
0
1
1
= 0.9
1
= 0.5
2 4 6 8 10 12
k
(
k
)
1
0
1
1
= 0.6
1
= 0.4
2 4 6 8 10 12
k
k
k
0.5
0
1
1
= 0.6
1
= 0.4
2 4 6 8 10 12
k
(
k
)
0.25
0
0.25
1
= 0.5
1
= 0.8
2 4 6 8 10 12
k
k
k
0.25
0
0.25
1
= 0.5
1
= 0.8
Figura 7.10: M as ejemplos (k) y
kk
de procesos ARMA(1,1)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.7. IDENTIFICACI
ON Y AJUSTE DEL MODELO PARA LOS CICLOS 205

7.7. Identicaci on y ajuste del modelo para los ciclos
El an alisis de las funciones de autocorrelaci on y autocorrelaci on parcial
muestrales nos ayuda a identicar el tipo de proceso estoc astico relativo a los
ciclos. Al comparar las gr acas de estas funciones con los patrones estable-
cidos en la Tabla 7.2, es posible identicar si el proceso es un AR, un MA o
un ARMA. Recuerde que el orden p de un proceso AR(p) es determinado en
la PACF, mientras que el orden q de un MA(q) es determinado en la ACF. Sin
embargo, en el caso de un proceso ARMA(p,q) m as general no es posible iden-
ticar los valores p y q por inspecci on directa de las gr acas de la ACF y PACF
muestrales, debido a que el patr on esperado en ambas gr acas es de colas
decrecientes.
En la primera etapa del proceso de identicaci on basado en el an alisis de
la ACF y PACF muestrales, no se pretende identicar a la primera el modelo
correcto, m as bien el objetivo es restringir el conjunto de todos los posibles
modelos ARMA a un subconjunto de modelos que en principio pueden rep-
resentar los rasgos principales de la serie. Por tanto es conveniente tener en
cuenta lo siguiente:
Cuando el proceso sigue un modelo AR(p), la ACF muestral presenta pa-
tr on de cola decreciente, con decaimiento exponencial y/o sinusoidal,
mientras que la PACF muestral no presenta ning un patr on particular de
decaimiento pero s de corte: ultimo valor signicativo cortando alguna
de las bandas de rechazo, indica el orden autorregresivo p.
Cuando el proceso sigue un modelo MA(q), la PACF muestral presenta
patr on de cola decreciente con decaimiento exponencial y/o sinusoidal,
mientras que la ACF muestral no presenta ning un patr on particular de
decaimiento pero s de corte: ultimo valor signicativo cortando alguna
de las bandas de rechazo, indica el orden de media m ovil q.
Se deben postular modelos simples que expliquen los rasgos obvios del
proceso en su ACF y PACF. Evitar la identicaci on inicial de modelos
mixtos ARMA y comenzar con modelos AR o MA preferiblemente de orden
bajo.
En relaci on a la identicaci on de modelos ARMA existen diferentes her-
ramientas computacionales basadas en algoritmos de selecci on de vari-
ables con base en la evaluaci on de alg un criterio de informaci on (AIC,
BIC, AICC) o mediante la funci on de autocorrelaci on extendida (EACF).
7.7.1. M etodos de identicaci on basados en minimizaci on de criterios
de informaci on
Lo m etodos para identicaci on de modelos ARMA(p,q) basados en crite-
rios de informaci on, b asicamente intentan determinar el verdadero modelo
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
206 CAP
ITULO 7. INTRODUCCI

minimizando el criterio de informaci on correspondiente. Cuando el verdadero
modelo es un ARMA de orden nito, Los ordenes p y q hallados usando el cri-
terio BIC son consistentes, es decir, a medida que aumenta el tama no de la
serie estos se aproximan a los verdaderos, pero si el verdadero modelo no es
un ARMA de orden nitos, entonces el AIC ser a el criterio que conducir a a un
modelo que es m as pr oximo al verdadero proceso dentro de todos los modelos
bajo estudio.
En R se cuenta con la funci on auto.arima() de la librera forecast. Esta
funci on identica autom aticamente y ajusta el modelo ARMA (o ARIMA inclu-
so, para el caso de series no estacionarias) utilizando por defecto el criterio de
informaci on de Akaike (AIC), pero tambi en es posible usar el criterio de infor-
maci on Bayesiana (BIC) y el criterio de informaci on de Akaike corregido por
sesgo (AICC). Su sintaxis es como sigue
auto.arima(x, d = NA, D = NA, max.p = 5, max.q = 5,
max.P = 2, max.Q = 2, max.order = 5,
start.p=2, start.q=2, start.P=1, start.Q=1,
stationary = FALSE, ic = c("aic","aicc", "bic"),
stepwise=TRUE, trace=FALSE,
approximation=length(x)>100 | frequency(x)>12, xreg=NULL,
test=c("kpss","adf","pp"), allowdrift=TRUE)
donde:
x es la serie de tiempo univariada
d es el orden de primera diferencia sobre la serie, para el caso de series
no estacionarias que veremos luego. Si se omite, la funci on eligir a este
valor mediante el test KPSS (test de raz unitaria; veremos esto en series
no estacionarias).
D es el orden de diferenciaci on estacional, si se omite tambi en ser a elegido
seg un un test CH (el test Canova-Hansen).
max.p es el valor m aximo a considerar para p, el orden AR
max.q es el valor m aximo a considerar para q, el orden MA
max.P, max.Q es el valor m aximo para los ordenes P y Q en modelos no
estacionarios con estacionalidad
max.order es el valor m aximo para la suma p + q + P + Q si la selecci on
del modelo no va a ser stepwise (paso a paso)
start.p, start.q, start.P , start.Q valores iniciales para p, q, P,
y Q respectivamente, en el procedimiento stepwise.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.7. IDENTIFICACI

stationary argumento que se especica como igual a TRUE o FALSE,
para restringir o no la b usqueda a modelos estacionarios.
ic argumento en el cual se especica el criterio de informaci on en la
selecci on de modelos: aic, aicc o bic. Por defecto se ajusta a aic,
es decir usa AIC.
stepwise para indicar si se usa (TRUE) o no se usa (FALSE) el proced-
imiento stepwise, en este ultimo caso hace una b usqueda sobre todos los
modelos lo cual puede hacer lento el algoritmo.
trace si es TRUE se reportar a la lista de los modelos ARIMA considerados.
approximation si es TRUE, la estimaci on es realizada mediante sumas
de cuadrados condicionales y los criterios de informaci on usados en la
selecci on ser an aproximados. El modelo nal es estimado mediante esti-
maci on de m axima verosimilitud. Esta opci on deber a usarse para series
de tiempo muy largas o con perodo estacional (estoc astico) alto para re-
ducir tiempo de c omputo.
xreg es un argumento opcional para especicar un vector o matriz de
variables regresoras o explicatorias, que deben tener el mismo n umero
de las que x.
test para especicar el tipo de test de raz unitaria a usar, esto es para
series no estacionarias, como luego veremos. Por defecto usa el test de
raz unitaria kpss.
allowdrift si se especica como TRUE, considera modelos con derivas
(t erminos constantes).
7.7.2. M etodo de identicaci on basado en la funci on de autocorrelaci on
extendida
La funci on de autocorrelaci on extendida o EACF para la identicaci on de
modelos ARMA, es un m etodo con buen desempe no en muestras moderada-
mente grandes. Esta funci on usa el hecho de que si la parte AR de un ARMA
fuese conocida, entonces al ltrar de la serie esta componente mediante re-
gresi on, se obtendra un proceso MA puro con la propiedad de patr on de corte
en su ACF. Los coecientes AR son estimados mediante una sucesi on nita
de regresiones. Para un valor p dado, se inicia realizando una regresi on de Z
t
vs. sus primeros p rezagos, Z
t1
, . . . , Z
tp
. Si los residuales de esta regresi on no
son un ruido blanco, se ajusta un segundo modelo de regresi on de Z
t
vs. sus
primeros p rezagos, y vs. el rezago de orden uno de los residuales del modelo
en el paso 1. Si de nuevo los residuales de este segundo modelo no son un
ruido blanco, se ajusta un tercer modelo de regresi on de Z
t
vs. sus primeros p
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
208 CAP
ITULO 7. INTRODUCCI

rezagos, y vs. el rezago uno de los residuales del segundo modelo y los rezagos
de orden dos de los residuales del primer modelo. Este procedimiento contin ua
hasta que no se halle m as informaci on en los residuales de los modelos en la
regresi on. Si el modelo ARMA es de orden (p,q), entonces ser an necesarias q
regresiones.
Sean
W
t,j,k
= Z
t
1
Z
t1

k
Z
tk
los residuales autorregresivos denidos con los coecientes AR

l
, l = 1, . . . , k,
estimados iterativamente, asumiendo un orden AR igual a k y un orden MA
igual a j. La ACF muestral de estos residuales es lo que se denomina la auto-
correlaci on muestral extendida, es decir, EACF =
W
(l). Se tiene que cuando el
modelo verdadero es un ARMA(p,q), para k = p y j q, {W
t,j,k
} es aproximada-
mente un MA(q), y por tanto su autocorrelaci on te orica en rezagos superiores
a q es cero. Con k > p hay un problema de sobre ajuste del modelo y esto a su
vez incrementa el orden MA del proceso de residuales W. Como soluci on fue
propuesto un m etodo resumiendo la informaci on en la EACF, mediante una
tabla donde el elemento en la la k y columna j toma el valor del smbolo si
la autocorrelaci on muestral de W de orden j+1,
W
(j+1), es signicativamente
distinta de cero, y toma el valor de 0 en el caso contrario. As, en esta tabla
un ARMA(p,q) tendr a un patr on te orico de un tri angulo de ceros, con v ertice
superior izquierdo indicando los correspondientes ordenes del proceso ARMA.
En la Figura 7.11 el tri angulo de ceros es resaltado con las lneas rojas y su
v ertice superior izquierdo est a marcado con el smbolo 0
, indicando que p = 1
y q = 1, luego el proceso es un ARMA(1,1).
En la librera R TSA se dispone de la funci on eacf(). En una EACF mues-
tral la primera la superior est a asociada a la ACF muestral de la serie a la
cual se aplica. La sintaxis de la funci on R es como sigue:
eacf(z, ar.max = 7, ma.max = 13)
donde,
z es la serie
ar.max el m aximo valor del orden autorregresivo p
ma.max el m aximo valor del orden Ma, q.
7.7.3. Estimaci on de modelos ARMA
Para modelos AR(p) puros la estimaci on puede realizarse mediante el m eto-
do conocido como estimaci on de Yule-Walker, basado en el sistema de ecua-
ciones Yule-Walker previamente introducido en la Secci on 7.3, pero en lugar
de los coecientes
ik
se tendran los coecientes
i
, i = 1, . . . , p, sin embar-
go este m etodo est a sujeto a errores substanciales de redondeo. Tambi en se
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.7. IDENTIFICACI

0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0
0 0 0 0 0 0
0
*
0 1 2 3 4 5 6 7 8 9 10 11 12
7
6
5
4
3
2
1
0
Orden MA
O
r
d
e
n

A
R
EACF terica de un ARMA(1,1)
Figura 7.11: Representaci on de la EACF te orica de procesos ARMA(1,1)
dispone de m etodos de mnimos cuadrados condicionales donde se denen o
jan valores iniciales para Z
0
, Z
1
, . . . , Z
p
y el de mnimos cuadrados incondi-
cionales, donde Z
0
, Z
1
, . . . , Z
p
no son jados. Otro m etodo posible de aplicar
bajo el supuesto de normalidad para el ruido blanco, es el m etodo de m axima
verosimilitud.
Pero en general, para estimar un modelo ARMA(p,q) no es posible utilizar
m etodos de estimaci on de regresi on lineal m ultiple ordinarios, debido a que
las ecuaciones de minimizaci on resultantes no son lineales en los par ametros
desconocidos. Los m etodos basados en m axima verosimilitud son m as adecua-
dos que los de mnimos cuadrados, puesto que utilizan toda la informaci on en
los datos en vez de algunos momentos muestrales como lo hacen los primeros,
adem as, para los estimadores de m axima verosimilitud se tienen resultados
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
210 CAP
ITULO 7. INTRODUCCI

asint oticos (aproximaciones en distribuci on cuando el tama no de la serie es
grande) conocidos.
En R, existen diferentes libreras que facilitan funciones para estimar mod-
elos AR, y modelos ARMA en general. En la librera stats se cuenta con las
funciones ar(), ar.ols() para el ajuste de modelos AR; la funci on arima()
permite estimar cualquier modelo ARMA, incluyendo AR y MA, y modelos ARI-
MA; en la librera FitAR hay una serie de herramientas para modelos AR;
la librera FitARMA tambi en suministra funciones para el ajuste por m axima
verosimilitud de modelos ARIMA, y en la librera forecast se tiene la funci on
Arima().
7.8. Ejemplos
En el c odigo R siguiente se simula una serie con modelo AR(1), para Z
t
=
0.67Z
t1
+ a
t
, a
t
RBN(0, 1) y n = 100. Tambi en se obtienen las gr acas de la
serie, su ACF, PACF y EACF y se identica y ajusta el mejor modelo ARMA con
la funci on auto.arima().
C odigo R 7.2.
library(forecast)
library(TSA)
#Simulando un AR(1) estacionario, identificacion y ajuste automatico
AR1.sim=arima.sim(list(order=c(1,0,0),ar=0.67),n=100)
#Graficando la serie y sus funciones ACF y PACF muestrales
plot(AR1.sim)
acf(AR1.sim,ci.type="ma",lag.max=25)
pacf(AR1.sim,lag.max=25)
#Obteniendo la EACF muestral para identificacion del proceso
eacf(AR1.sim)
#Identificacion y ajuste automatico, usando criterio AIC para la identificacion del mejor modelo
ajuste1=auto.arima(AR1.sim,ic="aic")
summary(ajuste1)
#Obteniendo grafica de la serie y proosticos para h=5 periodos futuros
plot(forecast(ajuste1,h=5))
#Graficos de residuales y su ACF y PACF,
plot(residuals(ajuste1))
abline(h=0,col=2)
acf(residuals(ajuste1),ci.type="ma",lag.max=25)
pacf(residuals(ajuste1),lag.max=25)
En la Figura 7.12 se muestran la serie simulada y su ACF y PACF mues-
trales. De estas ultimas podemos concluir que la serie sigue un proceso AR
estacionario en covarianza de orden 1 por qu e?
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.8. EJEMPLOS 211
Time
A
R
1
.
s
im
0 20 40 60 80 100
1
0
1
2
3
4
0 5 10 15 20 25
0
.
4
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
Lag
A
C
F
Series AR1.sim
5 10 15 20 25
0
.
2
0
.
0
0
.
2
0
.
4
0
.
6
Lag
P
a
r
t
ia
l
A
C
F
Series AR1.sim
Figura 7.12: Serie AR1.sim simulada de Z
t
= 0.67Z
t1
+a
t
, a
t
RBN(0, 1) y n = 100
La siguiente salida R presenta el mejor modelo ajustado por auto.arima()
y la EACF:
Salida R 7.1.
summary(ajuste1)
Series: AR1.sim
ARIMA(1,0,0) with zero mean
Coefficients:
ar1
0.6685
s.e. 0.0741
sigma2 estimated as 1.234: log likelihood = -152.7
AIC = 309.4 AICc = 309.52 BIC = 314.61
In-sample error measures:
ME RMSE MAE MPE MAPE MASE
0.04513091 1.11079700 0.84457644 33.32919295 84.68595900 0.89193308
eacf(AR1.sim)
AR/MA
0 1 2 3 4 5 6 7 8 9 10 11 12 13
0 x x x o o o o o o o o o x x
1 o o o o o o o o o o o o o o
2 x o o o o o o o o o o o o o
4 x o x o o o o o o o o o o o
5 x x o o o o o o o o o o o o
6 x o x o x o o o o o o o o o
7 x x x o x o o o o o o o o o
En la Tabla siguiente presentamos tambi en la EACF:
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
212 CAP
ITULO 7. INTRODUCCI

Tabla 7.3: EACF muestral, AR(1) simulado (AR1.sim)
AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
0 x x x o o o o o o o o o x x
6 x o x o x o o o o o o o o o
De acuerdo a la Tabla 7.3 el proceso para la serie simulada es un AR(1).
Observe que el v ertice superior derecho del tri angulo de ceros se nala p = 1
y q = 0. De la salida R podemos ver que el mejor modelo ajustado es

Z
t
=
0.6685

Z
t1
. El coeciente
1
ha sido estimado con un error est andar de 0.071;
el AIC de este modelo ajustado es de 309.4 y el BIC es de 314.61. Las medidas
de pron ostico ME, RMSE, etc. son calculados dentro de la muestra, luego no
son utiles para evaluar capacidad de pron ostico fuera de la muestra. La Figura
7.13 muestra los residuales del modelo AR(1) ajustado y sus funciones de
autocorrelaci on y autocorrelaci on muestrales. Podemos ver que los residuales
evidencian un ruido blanco (teste de ruido blanco en ACF y PACF) y que la
serie vara de forma aproximadamente homog enea alrededor de la lnea cero.
Time
r
e
s
id
u
a
ls
(
a
ju
s
t
e
1
)
0 20 40 60 80 100
1
0
1
2
3
0 5 10 15 20 25
0
.
2
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
Lag
A
C
F
Series residuals(ajuste1)
5 10 15 20 25
0
.
2
0
.
1
0
.
0
0
.
1
0
.
2
Lag
P
a
r
t
ia
l
A
C
F
Series residuals(ajuste1)
Figura 7.13: Serie residuales despu es de ajustar AR1.sim y ACF, PACF correspondientes
La Figura 7.14 muestra la serie AR1.sim y sus pron osticos con base en el
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.8. EJEMPLOS 213
modelo AR(1) ajustado, para h = 5 perodos futuros. Luego veremos c omo son
construidos estos pron osticos.
Forecasts from ARIMA(1,0,0) with zero mean
0 20 40 60 80 100
1
0
1
2
3
4
Figura 7.14: Serie AR1.sim simulada y pron osticos para h = 5 perodos futuros
Considere ahora, las series Z
1t
, Z
3t
presentadas en la Secci on 6.5.1 y la
serie MA1.sim simulada con el modelo Z
t
= a
t
+ 0.67a
t1
, a
t
RBN(0, 1) en el
siguiente c odigo
C odigo R 7.3.
library(forecast)
library(TSA)
#CREAR MATRIZ DE SERIES datos
#Extrayendo series Z1t y Z3t
Z1t=datos[,2] #es un AR(1)
Z3t=datos[,4] #es un ARMA(1,1)
#Simulando un MA(1)
MA1.sim=arima.sim(list(order=c(0,0,1),ma=0.67),n=100)
#Graficando las tres series
plot(Z1t);plot(Z3t);plot(MA1.sim)
#Graficando las ACF y PACF de las tres series
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
214 CAP
ITULO 7. INTRODUCCI

acf(Z1t,ci.type="ma",lag.max=25)
pacf(Z1t,lag.max=25)
acf(Z3t,ci.type="ma",lag.max=25)
pacf(Z3t,lag.max=25)
acf(MA1.sim,ci.type="ma",lag.max=25)
pacf(MA1.sim,lag.max=25)
#Obtencion de EACFs muestrales
eacf(Z1t)
eacf(Z3t)
eacf(MA1.sim)
#Identificacion y ajuste automatico para serie Z1t
ajusteZ1t=auto.arima(Z1t,ic="bic")
summary(ajusteZ1t)
#Grafico de residuales y ACF, PACF modelo ajustado a serie Z1t
plot(residuals(ajusteZ1t))
abline(h=0,col=2)
acf(residuals(ajusteZ1t),ci.type="ma",lag.max=25)
pacf(residuals(ajusteZ1t),lag.max=25)
#Identificacion y ajuste automatico para serie Z3t
ajusteZ3t=auto.arima(Z3t,ic="bic")
summary(ajusteZ3t)
#Grafico de residuales y ACF, PACF modelo ajustado a serie Z3t
plot(residuals(ajusteZ3t))
abline(h=0,col=2)
acf(residuals(ajusteZ3t),ci.type="ma",lag.max=25)
pacf(residuals(ajusteZ3t),lag.max=25)
#Identificacion y ajuste automatico para serie MA1.sim
ajusteMA1.sim=auto.arima(MA1.sim,ic="bic")
summary(ajusteMA1.sim)
#Grafico de residuales y ACF, PACF modelo ajustado a serie MA1.sim
plot(residuals(ajusteMA1.sim))
abline(h=0,col=2)
acf(residuals(ajusteMA1.sim),ci.type="ma",lag.max=25)
pacf(residuals(ajusteMA1.sim),lag.max=25)
#Graficando las tres series y sus pron osticos
plot(forecast(ajusteZ1t,h=5))
plot(forecast(ajusteZ3t,h=5))
plot(forecast(ajusteMA1.sim,h=5))
Las Figuras 7.15 y 7.16 ilustran las series Z
1t
, Z
3t
y MA1.sim y sus funciones
de autocorrelaci on y autocorrelaci on parcial muestrales Qu e tipo de proceso
podemos especicar para cada una?
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.8. EJEMPLOS 215
Time
Z
1
t
0 20 40 60 80 100
1
0
1
2
3
Time
Z
3
t
0 20 40 60 80 100
2
0
2
4
Time
M
A
1
.
s
im
0 20 40 60 80 100
1
0
1
2
3
Figura 7.15: Series Z
1t
, Z
3t
y MA1.sim, simuladas
5 10 15 20 25
0
.
2
0
.
2
0
.
6
Lag
A
C
F
Series Z1t
5 10 15 20 25
0
.
2
0
.
2
0
.
6
Lag
P
a
r
t
ia
l
A
C
F
Series Z1t
5 10 15 20 25
0
.
6
0
.
2
0
.
2
Lag
A
C
F
Series Z3t
5 10 15 20 25
0
.
6
0
.
2
0
.
2
Lag
P
a
r
t
ia
l
A
C
F
Series Z3t
5 10 15 20 25
0
.
2
0
.
0
0
.
2
0
.
4
Lag
A
C
F
Series MA1.sim
5 10 15 20 25
0
.
2
0
.
2
0
.
4
Lag
P
a
r
t
ia
l
A
C
F
Series MA1.sim
Figura 7.16: ACFs y PACFs muestrales de las Series Z
1t
, Z
3t
y MA1.sim, simuladas
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
216 CAP
ITULO 7. INTRODUCCI

Considere ahora las EACF muestrales. De acuerdo a estas, qu e tipo de
proceso se identica para cada serie? coinciden con los modelos identicados
en la ACF y PACF?
Tabla 7.4: EACF muestral, Serie Z
1t
AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
0 x x x o o o o o o o o o o o
6 o x o o o o o o o o o o o o
7 x x o o x o o o o o o o o o
Tabla 7.5: EACF muestral, Serie Z
3t
AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
5 x o o o o x o o o o o o o o
6 x x x x o x o o o o o o o o
7 o o x o o o o o o o o o o o
Tabla 7.6: EACF muestral, Serie MA1.sim
AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
A continuaci on se exhiben los resultados R de los ajustes autom aticos para
las series Z
1t
, Z
3t
y MA1.sim. Las Figuras 7.17, 7.18 y 7.19 muestran los resid-
uales respectivos y sus ACF y PACF muestrales. La Figura 7.20 presenta las
series m as sus pron osticos. Qu e modelos son identicados y ajustados por
el m etodo autom atico y c omo resultan los ajustes (evaluaci on de residuales)?
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.8. EJEMPLOS 217
Salida R 7.2.
summary(ajusteZ1t)
Series: Z1t
Coefficients:
ar1
0.7420
s.e. 0.0663
AIC = 297.95 AICc = 298.08 BIC = 303.16
0.06086727 1.04793888 0.82549189 -36.84375141 219.34814508 0.89982692
summary(ajusteZ3t)
Series: Z3t
Coefficients:
ar1 ma1
-0.3537 -0.5875
s.e. 0.1130 0.0905
AIC = 301.04 AICc = 301.29 BIC = 308.85
-0.1050398 1.0529324 0.8312345 -55.6478947 308.2121756 0.3713694
summary(ajusteMA1.sim)
Series: MA1.sim
Coefficients:
ma1
0.7474
s.e. 0.0831
AIC = 299.56 AICc = 299.69 BIC = 304.77
0.06831956 1.05631518 0.85781607 85.68407876 146.18878431 0.82785503
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
218 CAP
ITULO 7. INTRODUCCI

Time
r
e
s
id
u
a
ls
(
a
ju
s
t
e
Z
1
t
)
0 20 40 60 80 100
1
0
1
2
3
5 10 15 20 25
0
.
2
0
.
1
0
.
0
0
.
1
0
.
2
Lag
A
C
F
Series residuals(ajusteZ1t)
5 10 15 20 25
0
.
2
0
.
1
0
.
0
0
.
1
0
.
2
Lag
P
a
r
t
ia
l
A
C
F
Figura 7.17: Residuales del modelo ajustado para Z
1t
, y su ACF y PACF muestrales
Time
r
e
s
id
u
a
ls
(
a
ju
s
t
e
Z
3
t
)
0 20 40 60 80 100
1
0
1
2
5 10 15 20 25
0
.
2
0
.
1
0
.
0
0
.
1
0
.
2
Lag
A
C
F
5 10 15 20 25
0
.
2
0
.
1
0
.
0
0
.
1
0
.
2
Lag
P
a
r
t
ia
l
A
C
F
Figura 7.18: Residuales del modelo ajustado para Z
3t
, y su ACF y PACF muestrales
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.8. EJEMPLOS 219
Time
r
e
s
id
u
a
ls
(
a
ju
s
t
e
M
A
1
.
s
im
)
0 20 40 60 80 100
1
0
1
2
5 10 15 20 25
0
.
2
0
.
1
0
.
0
0
.
1
0
.
2
Lag
A
C
F
Series residuals(ajusteMA1.sim)
5 10 15 20 25
0
.
2
0
.
1
0
.
0
0
.
1
0
.
2
Lag
P
a
r
t
ia
l
A
C
F
Series residuals(ajusteMA1.sim)
Figura 7.19: Residuales del modelo ajustado para MA1.sim, y su ACF y PACF muestrales
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
220 CAP
ITULO 7. INTRODUCCI

0 20 40 60 80 100
1
0
1
2
3
0 20 40 60 80 100
2
0
2
4
0 20 40 60 80 100
1
0
1
2
3
Figura 7.20: Series Z
1t
, Z
3t
y MA1.sim y sus pron osticos para h = 5 perodos futuros E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.9. ESTIMACI

ON POR M
AXIMA VEROSIMILITUD EN MODELOS ARMA 221

7.9. Estimaci on por m axima verosimilitud en modelos AR-
MA
Ya fue mencionado previamente que la estimaci on en modelos ARMA re-
quiere de m etodos de estimaci on no lineal, en particular, bajo el supuesto
a
t
RBN(0,
2
a
), podemos recurrir a la estimaci on por m axima verosimilitud:
Sean = E[Z
t
],
2
a
, = (
1
, . . . ,
p
) y = (
1
, . . . ,
q
), el conjunto de par ametros
desconocidos del modelo. Bajo el supuesto de normalidad para a
t
, tenemos
que la funci on de densidad conjunta de a
1
, a
2
, . . . , a
n
es
f(a
1
, . . . , a
n
) =
1
(2)
n/2
n
a
exp
_
1
2
2
a
n
t=1
a
2
t
_
(7.37)
donde a
t
=

Z
t

1

Z
t1

p

Z
tp

1
a
t1

q
a
tq
, y

Z
t
= Z
t
. La
verosimilitud de los par ametros dado las observaciones es
L = L(,
2
a
, , ) f(a
1
, . . . , a
n
)
L(,
2
a
, , ) =
1
n
a
exp
_
1
2
2
a
S(,
2
a
, , )
_
(7.38)
donde S(,
2
a
, , ) =
n
t=1
a
2
t
. Los estimadores de m axima verosimilitud son tales
que L es m axima o bien, l(,
2
a
, , ) = log(L) es m axima, lo cual resulta
cuando S(,
2
a
, , ) es mnimo. Al substituir t = 1, . . . , n en la expresi on de
S(,
2
a
, , ), usando a
t
= Z
t

1
Z
t1

p
Z
tp

1
a
t1

q
a
tq
, ten-
dremos la necesidad de conocer los valores a
0
, a
1
, . . . , a
1q
y Z
0
, Z
1
, . . . , Z
1p
, es
decir, valores antes del primer tiempo. Tenemos tres alternativas
1. Inicializar a
j
= 0 para j 0 y Z
j
=

Z =
1
n
n
t=1
Z
t
, para j 0
2. Denir S(,
2
a
, , ) s olo para t d onde todos los valores a
t
y Z
t
son cono-
cidos.
3. Utilizar toda la informaci on desde t = M a t = n, donde a
j
y Z
j
, j =
M, . . . , 0 son obtenidos mediante backasting (pron ostico hacia atr as),
con M tal que |E [Z
M
|Z
1
, . . . , Z
n
] E [Z
M1
|Z
1
, . . . , Z
n
] | < .
Las dos primeras alternativas conducen a estimadores de m axima verosimil-
itud o de mnimos cuadrados condicionales, mientras que la tercera conduce
a estimadores de m axima verosimilitud o mnimos cuadrados incondicionales.
7.10. Pron osticos en modelos ARMA estacionarios e inverti-
bles
Considere un proceso ARMA(p,q) estacionario e invertible, y de media cero
(si la media no es cero, considere en lugar de Z
t
a

Z
t
= Z
t
). Entonces
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
222 CAP
ITULO 7. INTRODUCCI

podemos escribir
Z
t
=

q
(B)
p
(B)
a
t
= (B)a
t
=
j=0
j
a
tj
con
0
= 1,
j=1
2
j
< (7.39)
Suponga que se conoce los valores de la serie para t = 1, . . . , n, luego, Z
j
, j =
n +1, n+2, . . . , n +l, . . . son valores futuros desconocidos. Queremos conocer el
pron ostico para t = n + l, es decir, queremos pronosticar la variable aleatoria
Z
n+l
,
Z
n+l
=
j=0
j
a
n+lj
(7.40)
Sea

Z
n
(l) =

Z
n+l
el pron ostico para t = n + l con origen en t = n, tal que
Z
n
(l) =
j=0
l+j
a
nj
=
l
a
n
+
l+1
a
n1
+
l+2
a
n2
+ (7.41)
El objetivo es hallar los
l+j
tales que el error cuadr atico medio de pron ostico
sea mnimo, es decir, que minimicen a
ECMP = E
_
e
2
n
(l)
, donde e
n
(l) = Z
n+l

Z
n
(l) (7.42)
e
n
(l) es el error de pron ostico l perodos adelante de t = n. Con algo de ar-
itm etica, podemos escribir
e
n
(l) =
j=0
j
a
n+lj
j=0
l+j
a
nj
=
l1
j=0
j
a
n+lj
+
j=0
(
l+j
l+j
)a
nj
(7.43)
y de la ultima igualdad puede mostrarse que ECMP es mnimo cuando
l+j
=
l+j
, por tanto, el pron ostico optimo es
Z
n
(l) =
j=0
l+j
a
nj
=
l
a
n
+
l+1
a
n1
+
l+2
a
n2
+ (7.44)
Por otra parte, podemos mostrar que
E[Z
n+l
|Z
n
, Z
n1
, . . .] =
j=0
l+j
a
nj
=

Z
n
(l) (7.45)
es decir, el pron ostico optimo es igual al valor esperado condicional del valor
futuro Z
n+l
dada la historia de la serie.
NOTA: Tener en cuenta que
a
n
(lj) = E[a
n+lj
|Z
n
, Z
n1
, . . .] =
_
0 si l j + 1 (aqu n + l j > n)
a
n+lj
si l j (aqu n + l j n)
(7.46)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
7.10. PRON

OSTICOS EN MODELOS ARMA ESTACIONARIOS E INVERTIBLES223
donde a
n
(l j) es el pron ostico optimo para a
n+lj
con origen en t = n, y
Z
n
(l j) = E[Z
n+lj
|Z
n
, Z
n1
, . . .] =
_
Z
n
(l j) si l j + 1 (aqu n + l j > n)
Z
n+lj
si l j (aqu n + l j n)
(7.47)
Observe que para periodos posteriores a n el pron ostico optimo para a
t
es cero.
El valor esperado del error de pron ostico es cero:
E[e
n
(l)] = E
_
Z
n+l

Z
n
(l)
_
= E
_
l1
j=0
j
a
n+lj
_
= 0 (7.48)
por tanto,

Z
n
(l) =
j=0
l+j
a
nj
es un estimador insesgado del valor futuro Z
n+l
,
lo cual es una caracterstica deseable. Respecto a la varianza del error de
pron ostico, se tiene que
VAR[e
n
(l)] = VAR
_
l1
j=0
j
a
n+lj
_
=
2
a
l1
j=0
2
j
(7.49)
Por tanto bajo el supuesto de normalidad se tiene que un intervalo de predic-
ci on del (1 )100 % para el valor futuro Z
n+l
es
Z
n
(l) z
/2
_
l1
j=0
2
j
(7.50)
donde z
/2
es el cuantil (1 /2) de la distribuci on normal est andar. Sin em-
bargo, los par ametros del modelo son desconocidos, incluyendo a
a
y como
los
j
son funci on de los vectores de par ametros y , entonces tambi en son
desconocidos y deben ser estimados a trav es de las estimaciones de estos dos
vectores de par ametros, luego, en la pr actica, para n grande se tiene que un
intervalo de predicci on aproximado es
Z
n
(l) z
/2

a
_
l1
j=0
2
j
(7.51)
C omo pronosticar en la pr actica: Considere
Z
n+l
=
1
Z
n+l1
+
2
Z
n+l2
+ +
p
Z
n+lp
+a
n+l
+
1
a
n+l1
+
2
a
n+l2
+ +
q
a
n+lq
(7.52)
usando esta expresi on y deniendo los pron osticos optimos como
Z
n
(l) = E[Z
n+l
|Z
1
, . . . , Z
n
], a
n
(l) = E[a
n+l
|Z
1
, . . . , Z
n
] y utilizando los valores esti-
mados para los par ametros, tenemos que
Z
n
(l) =

1

Z
n
(l 1) +

2

Z
n
(l 2) + +

p

Z
n
(l p)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
224 CAP
ITULO 7. INTRODUCCI

+ a
n
(l) +

1
a
n
(l 1) +

2
a
n
(l 2) + +

q
a
n
(l q) (7.53)
donde debemos tener en cuenta lo establecido en las ecuaciones (7.46) y
(7.47) para a
n
(l j), j = 1, . . . , q y

Z
n
(l k), k = 1, . . . , p, respectivamente. Por
ejemplo, sea Z
t
un ARMA(1,1), es decir
Z
t
=
1
Z
t1
+ a
t
+
1
a
t1
y suponga que se tiene una serie de tama no n = 200 de este proceso con la
cual se obtiene las siguiente estimaciones,

1
= 0.777 y

1
= 0.377, entonces
para pronosticar el valor futuro dos perodos adelante de t = 200, tenemos que
calcular
Z
200
(2) = 0.777

Z
200
(1) + a
200
(2) + 0.377 a
200
(1) = 0.777

Z
200
(1)
pues a
200
(1) = a
200
(2) = 0, de acuerdo a la ecuaci on (7.46), y
Z
200
(1) = 0.777

Z
200
(0) + a
200
(1) + 0.377 a
200
(0) = 0.777Z
200
+ 0.3777a
200
la ultima igualdad se deriva de las ecuaciones (7.46) y (7.47). Pero como a
t
realmente es una variable no observable, en su lugar usamos los residuales a
t
.
Suponga que Z
200
= 2.586 y a
200
= 1.666 entonces, reemplazando en la ultima
ecuaci on, se obtiene

Z
200
(1) = 2.637404 y nalmente, reemplazamos este valor
en la ecuaci on para

Z
200
(2) obtenemos

Z
200
(2) = 0.777 (2.637404) = 2.049263.
NOTAS:
1. En general para un ARMA(p,q), a partir de l > q los pron osticos

Z
n
(l) s olo
dependen de los ultimos p pron osticos

Z
n
(j), y en particular, cuando el
proceso es un MA(q) este no es pronosticable m as de q pasos adelante de
t = n, pues toda la din amica del proceso que se aprovecha para pronos-
ticar se desvanece cuando se llega al horizonte de longitud q, lo cual es
un reejo del comportamiento de la ACF del MA(q): esta se hace cero para
k > q.
2. En modelos AR(p) y ARMA(p,q), para l > p los nuevos pron osticos usan
pron osticos previos de Z
t
, esto implica que se cometer a m as error en
pron osticos con horizonte m as all a de p.
3. Lo anterior implica que no es recomendable en general, pron osticos de
largo plazo en los modelos ARMA.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Captulo 8
Modelaci on de una serie con errores ARMA
En este Captulo veremos, mediante dos ejemplos, c omo se integra en la
modelaci on por regresi on lineal y no lineal, las componentes de tendencia,
estacionalidad determinsticas y los ciclos ARMA identicados para los errores
estructurales del modelo. Para el modelo lineal la estructura general en este
caso es como se indica a seguir,
Y
t
= T
t
+ S
t
+ E
t
, con
p
(B)E
t
=
q
(B)a
t
, a
t
RB N(0,
2
a
), (8.1)
donde
p
(B) = 1
1
B
2
B
2

p
B
p
y
q
(B) = 1 +
1
B +
2
B
2
+ +
q
B
q
son los polinomios autorregresivos y de medias m oviles, respectivamente, tales
que sus races son de m odulo mayor a 1, es decir, el proceso ARMA(p,q) para
E
t
es un proceso estacionario, invertible y de media cero, adem as tales poli-
nomios se asumen sin factores en com un.
Respecto a modelos no lineales, consideraremos especcamente el caso
con estructura exponencial, es decir
Y
t
= exp(T
t
+ S
t
) +E
t
, con
p
(B)E
t
=
q
(B)a
t
, a
t
RB N(0,
2
a
), (8.2)
Este es un modelo parcialmente multiplicativo. Si se considera que en su
lugar debera ajustarse un modelo completamente multiplicativo, entonces la
ecuaci on (8.1) sera aplicada a log(Y
t
) en vez de Y
t
.
Considere la serie de producci on trimestral de cemento portland una serie
estacional multiplicativa que va desde trimestre 1 de 1956 a trimestre 3 de
1994, presentada en la Figura 8.1.
8.1. Modelo inicial: Tendencia, estacionalidad y errores R.B
8.1.1. Ajuste y pron ostico
Inicialmente vamos a considerar un modelo de regresi on global con tenden-
cia c ubica y estacionalidad trimestral determinstica con indicadoras, para el
logaritmo de la serie para ser ajustado con los primeros n = 151 observaciones
225
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
226 CAP
ITULO 8. MODELACI

ON DE UNA SERIE CON ERRORES ARMA
Produccin trimestral cemento portland
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Log de produccin trimestral cemento portland
Time
l
o
g
(
y
t
)
1960 1970 1980 1990
6
.
5
7
.
0
7
.
5
Figura 8.1: Izq.: Serie de producci on trimestral de cemento portland (miles de toneladas) y Der.: su logaritmo
(en total son N = 155 observaciones), Modelo 1: Modelo Log-c ubico estacional:
Modelo 1: log(Y
t
) =
0
+
1
t +
2
t
2
+
3
t
3
+
3
i=1
i
I
i,t
+ E
t
, E
t
iid
N(0,
2
) (8.3)
El ajuste con R produce la siguiente tabla de par ametros ajustados:
Tabla 8.1: Par ametros ajustados en modelo Log-c ubico estacional
Par ametro Estimaci on Error Est andar T
0
P(|t
144
| > |T
0
|)
0
6.2508 0.0249 251.3447 0.0000
1
0.0199 0.0013 15.3924 0.0000
2
-1.289710
4
0.0000 -6.5427 0.0000
3
3.168410
7
0.0000 3.7161 0.0003
1
-0.1317 0.0157 -8.3657 0.0000
2
-0.0185 0.0157 -1.1772 0.2410
3
0.0145 0.0157 0.9188 0.3597
MSE = 0.06813, *Crit. de inf.: AIC = 373.9363, BIC = 349.7981

*Medidas de AIC y BIC en escala logartmica
Con estos resultados se pronostican los siguientes m = 4 periodos (t =152
a 155)
Y
151
(L) exp
_
6.2508 + 0.0199(151 +L) 1.2897 10
4
(151 +L)
2
+ 3.1684 10
7
(151 +L)
3
0.1317I
1,151+L
0.0185I
2,151+L
+ 0.0145I
3,151+L
] exp
_
(0.06813)
2
2
_
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
8.1. MODELO INICIAL: TENDENCIA, ESTACIONALIDAD Y ERRORES R.B227
L = 1, , m. Los pron osticos que se obtienen y sus intervalos de predicci on
del 95% son presentados en la Tabla 8.2 y la precisi on de los pron osticos en
la Tabla 8.3. En la Figura 8.3 se aprecia la serie real, ajustada y pronosticada
seg un el modelo Log-c ubico estacional.
Tabla 8.2: Pron osticos Modelo Log-c ubico estacional - Miles de ton.
Perodo L real pron ostico Lim. Inf Lim. Sup
1993 Q4 1 1777 1649.702 1429.387 1903.976
1994 Q1 2 1468 1450.015 1255.496 1674.671
1994 Q2 3 1732 1628.089 1408.739 1881.594
1994 Q3 4 1962 1687.280 1458.900 1951.411
Tabla 8.3: Precisi on pron osticos Modelo Log-c ubico
estacional
130.98 160.31 130.98 7.10 7.10
Serie real, ajustes y pronsticos
Modelo Log cbico estacional
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
Ajustada
Pronsticos
Figura 8.2: Serie real, ajustada y pron osticos para la validaci on cruzada, modelo Log-c ubico estacional
En la Figura 8.3 se aprecian los gr acos de residuales obtenidos del ajuste
en escala logartmica, es decir

E
t
vs. t y

E
t
vs.

log(Y
t
), donde
E
t
= log(Y
t
)
_
6.2508 + 0.0199t 1.2897 10
4
t
2
+ 3.1684 10
7
t
3
0.1317I
1,t
0.0185I
2,t
+ 0.0145I
3,t
]
Es clara la presencia de ciclos as como problemas de varianza hacia el nal
de la serie de residuales (o posiblemente presencia de observaciones extremas
en ese intervalo causen la apariencia de varianza no constante).
8.1.2. An alisis e identicaci on de ciclos en los errores estructurales E
t
El an alisis de los residuales del modelo ajustado nos llevan a concluir que
los errores no son ruido blanco (por qu e?), sin embargo, son estacionarios en
covarianza (por qu e?). Los posibles modelos que se identican son
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
228 CAP
ITULO 8. MODELACI

Del an alisis de ACF - PACF: Un AR(6) por qu e?;
Del an alisis de la EACF: ARMA(1,5), ARMA (2,4) por qu e?;
Con la funci on auto.arima() de la librera forecast aplicada sobre el
vector de valores de los residuales (sin convertirlos en objeto ts()) se
identica un ARMA(2,2) y sobre la serie de tiempo de los residuales (resi-
duales convertidos en objeto ts()) se obtiene un arma estacional esta-
cionario ARMA(1,2)(0, 1)
[4]
;
Con la funci on armasubsets() de la librera TSA se identica un AR-
MA(6,7) (con par ametros
j
, j = 1, 3, 4, 5, y
i
, i = 1, 2, . . . , 6, jos en cero),
ARMA(7,10) (con par ametros
j
, j = 2, 3, 4, 5, 6, y
i
, i = 1, 2, . . . , 7, 9, -
jos en cero). Sin embargo, en las secciones siguientes se trabajar a sobre
versiones modicadas de estos dos modelos, modicaciones que fueron
establecidas luego de ajustar la serie de logaritmo con las componentes
estructurales y los ciclos arma respectivos y vericar que no se obtenan
errores de ajuste a
t
satisfaciendo el supuesto de ruido blanco.
0 50 100 150
0
.
2
0
.
1
0
.
0
0
.
1
0
.
2
t
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
1
)
6.2 6.4 6.6 6.8 7.0 7.2 7.4
0
.
2
0
.
1
0
.
0
0
.
1
0
.
2
fitted(modelo1)
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
1
)
0 5 10 15 20 25 30 35
0
.
4
0
.
2
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
ACF modelo1
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.
2
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
Lag
P
a
r
t
i
a
l

A
C
F
PACF modelo1
Figura 8.3: Residuales estructurales

Et modelo log-c ubico estacional y ACF y PACF muestrales
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Tabla 8.4: EACF para

Et, modelo 1
AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
0 x x x x o o o x x x x x x o o o o o o
1 x x o x x o o o o o o o o o o o o o o
2 x x o x o o o o o o o o o o o o o o o
3 o x o x o o o o o o o o o o o o o o o
4 o x x x o o o o o o o o o o o o o o o
5 x x x x o o o o o o o o o o o o o o o
6 x x o o o o o o o o o o o o o o o o o
7 x o o o o o o o o o o o o o o o o o o
11 x x x o x o o o o o o o o o o o o o o
12 x x x x o o o o o o o o o o o o o o o
13 o o x x o o o o o o o o o o o o o o o
17 x o o o o o x o o o o o o o o o o o o
18 o o x o o x o o o o o o o o o o o o o
Tabla 8.5: Test Ljung-Box para Et, modelo 1
m Q
LB
gl P(
2
m
> Q
LB
)
6 231.11 6.00 0.00
12 282.84 12.00 0.00
18 292.75 18.00 0.00
24 330.85 24.00 0.00
30 349.64 30.00 0.00
36 393.11 36.00 0.00
Tabla 8.6: Test Durbin-Watson de orden 1 para Et, modelo 1
H
1
: (1) > 0 H
1
: (1) < 0
k (1) Estadstico d
1
P(DW
1
< d
1
) P(DW
1
> d
1
)
1 0.7892629 0.4212927 0.00 1
Tabla 8.7: Identicaci on con auto.arima() sobre

Et en el
modelo 1
ARMA(2,2)
1

2

1

2
Estimaci on 0.1043 0.5094 0.6338 0.2569
s.e 0.1316 0.1228 0.1399 0.1109
AIC = 544.72, BIC 529.63
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
230 CAP
ITULO 8. MODELACI

Tabla 8.8: Identicaci on con auto.arima() sobre

Et en el
modelo 1, convertido a serie de tiempo
ARMA(1,2)(0, 1)
[4]

1

1

2

1
Estimaci on 0.5935 0.1047 0.3875 0.3713
s.e 0.1163 0.1259 0.1074 0.0841
AIC = 552.75, BIC = 537.66
El modelo en la Tabla anterior es un modelo ARMA estacional en el cual
las observaciones sucesivas tienen una estructura ARMA(1,2), mientras que
las observaciones separadas 4 perodos en el tiempo, tienen una estructura
ARMA(0, 1)
[4]
y cuya representaci on te orica es
(1
1
B)E
t
= (1 +
1
B +
2
B
2
)(1 +
1
B
4
)a
t
, a
t
R.BN(0,
2
a
).
Este tipo de modelos ser a visto al nal del curso. Observe que la anterior
ecuaci on es equivalente a
(1
1
B)E
t
= (1 +
1
B +
2
B
2
+
1
B
4
+
1
1
B
5
+
2
1
B
6
)a
t
es decir, a un ARMA(1,6): (1
1
B)E
t
= (1+
1
B+
2
B
2
+
3
B
3
+
4
B
4
+
5
B
5
+
6
B
6
)a
t
,
con

1
=
1
,

2
=
2
,

3
= 0,

4
=
1
,

5
=
1
1
y

6
=
2
1
.
B
I
C
(
I
n
t
e
r
c
e
p
t
)
A
R
l
a
g
1
A
R
l
a
g
2
A
R
l
a
g
3
A
R
l
a
g
4
A
R
l
a
g
5
A
R
l
a
g
6
A
R
l
a
g
7
A
R
l
a
g
8
A
R
l
a
g
9
A
R
l
a
g
1
0
A
R
l
a
g
1
1
A
R
l
a
g
1
2
e
r
r
o
r
l
a
g
7
e
r
r
o
r
l
a
g
8
e
r
r
o
r
l
a
g
9
e
r
r
o
r
l
a
g
1
0
e
r
r
o
r
l
a
g
1
1
e
r
r
o
r
l
a
g
1
2
e
r
r
o
r
l
a
g
1
e
r
r
o
r
l
a
g
2
e
r
r
o
r
l
a
g
3
e
r
r
o
r
l
a
g
4
e
r
r
o
r
l
a
g
5
e
r
r
o
r
l
a
g
6
120
120
120
130
130
130
140
140
140
Figura 8.4: Resultado de la funci on armasubsets sobre

Et en modelo log-c ubico estacional
A continuaci on se presentan las gr acas de las ACFs y PACFs esperadas
para E
t
obtenidas con la funci on R ARMAacf(), bajo cada uno de los modelos
anteriores (excepto para el SARMA en Tabla 8.8), usando en su construcci on
los valores estimados de los par ametros
j
y
i
, cuando estos modelos son
ajustados usando s olo la serie de los

E
t
resultantes del ajuste del modelo 1.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Los valores de tales par ametros estimados se observan en las tablas 8.7, 8.9
a 8.13. Para los modelos ARMA(6,7) y ARMA(7,10), las gr acas en la Figura 7
no corresponden a los modelos inicialmente identicados en el armasubsets,
sino a la versi on modicada de estos, buscando el cumplimiento de ruido blan-
co en los modelos sobre log(Y
t
), como se especican, respectivamente, en las
tablas 8.12 y 8.13 Cu al caso es m as pr oximo al comportamiento observado
en la ACF y PACF muestrales exhibidas en la Figura 8.3?
Tabla 8.9: Ajuste AR(6) sobre

Et en el modelo 1
1

2

3

4

5

6
Estimaci on 0.6555 0.3246 -0.2722 0.2468 -0.0573 -0.2301
s.e 0.0785 0.0947 0.0975 0.0967 0.0953 0.0788
Tabla 8.10: Ajuste ARMA(1,5) sobre

Et en el modelo 1
1

1

2

3

4

5
Estimaci on 0.5522 0.1215 0.4349 0.0860 0.3881 0.1622
s.e 0.1503 0.1556 0.1094 0.1250 0.0825 0.1066

Et en el modelo 1
1

2

1

2

3

4
Estimaci on 1.0111 -0.3287 -0.3303 0.4541 -0.0760 0.4087
s.e 0.2087 0.1758 0.1938 0.1047 0.1013 0.0817

Et en el modelo 1. Este es la modi-
caci on del ARMA(6,7) identicado con armasubsets()
1

2

3

6

7
Estimaci on 0.6131 0.4073 -0.1655 -0.1573 -0.1101
s.e 0.0790 0.0893 0.0836 0.0554 0.0900

Et en el modelo 1. Este es la modi-
caci on del ARMA(7,10) identicado con armasubsets()
1

7

1

2

4

8

10
Estimaci on 0.3716 -0.1414 0.7969 0.8755 0.9065 -0.2450 -0.1328
s.e 0.0901 0.0922 0.1476 0.1690 0.1272 0.1145 0.1523
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
232 CAP
ITULO 8. MODELACI

0 5 10 15 20 25 30 35
k
(
k
)
0
1
ARMA(2,2)terico
0 5 10 15 20 25 30 35
k
k
k
0
1
ARMA(2,2)terico
0 5 10 15 20 25 30 35
k
(
k
)
0
1
AR(6)terico
0 5 10 15 20 25 30 35
k
k
k
0
1
AR(6)terico
Figura 8.5: ACFs y PACFs te oricas de modelos ARMA identicados para Et
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
0 5 10 15 20 25 30 35
k
(
k
)
0
1
ARMA(2,4)terico
0 5 10 15 20 25 30 35
k
k
k
0
1
ARMA(2,4)terico
0 5 10 15 20 25 30 35
k
(
k
)
0
1
ARMA(1,5)terico
0 5 10 15 20 25 30 35
k
k
k
0
1
ARMA(1,5)terico
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
234 CAP
ITULO 8. MODELACI

0 5 10 15 20 25 30 35
k
(
k
)
0
1
ARMA(6,7)terico
0 5 10 15 20 25 30 35
k
k
k
0
1
ARMA(6,7)terico
0 5 10 15 20 25 30 35
k
(
k
)
0
1
ARMA(7,10)terico
0 5 10 15 20 25 30 35
k
k
k
0
1
ARMA(7,10)terico
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
8.2. MODELOS DE TENDENCIA, ESTACIONALIDAD M
AS CICLOS ARMA235
8.2. Modelos de tendencia, estacionalidad m as ciclos ARMA
8.2.1. Ciclos AR(6)
Modelo 2: log(Y
t
) =
0
+
1
t +
2
t
2
+
3
t
3
+
3
i=1
i
I
i,t
+ E
t
,
E
t
=
6
j=1
j
E
tj
+ a
t
, a
t
RBN(0,
2
a
) (8.4)
Ajuste y pron osticos
Tabla 8.14: Tabla par ametros estimados Modelo 2
Par ametros Estimaci on s.e Valor T
0
* P(|t
138
| > |T
0
|)**
1
0.6546 0.0784 8.3540 0.0000
2
0.3243 0.0938 3.4584 0.0007
3
-0.2713 0.0950 -2.8550 0.0050
4
0.2492 0.0908 2.7431 0.0069
5
-0.0580 0.0935 -0.6200 0.5363
6
-0.2338 0.0635 -3.6808 0.0003
0
6.2367 0.0376 166.0218 0.0000
1
0.0207 0.0021 9.7253 0.0000
2
-1.413610
4
0.0001 -1.5743 0.1177
3
3.706210
7
0.0000 0.7249 0.4698
1
-0.1307 0.0078 -16.8537 0.0000
2
-0.0180 0.0069 -2.6036 0.0102
3
0.0146 0.0077 1.9102 0.0582
AIC = 541.94, BIC = 499.7,
2
a
= 0.001327, df = 138
*Calculado manualmente, T
0
= Estimacion/s.e
**Calculado manualmente, P(|t
138
| > |T
0
|) = P(t
138
> |T
0
|) +P(t
138
< |T
0
|)
La ecuaci on de los pron osticos en escala original es
Y
151
(L) exp
_
6.2367 + 0.0207(151 +L) 1.4136 10
4
(151 +L)
2
+ 3.7062 10
7
(151 +L)
3
0.1307I
1,151+L
0.0180I
2,151+L
+ 0.0146I
3,151+L
+

E
151
(L)
_
exp (0.001327/2)
donde
E
151
(L) = 0.6546

E
151
(L 1) + 0.3243

E
151
(L 2) 0.2713

E
151
(L 3)
+ 0.2492

E
151
(L 4) 0.0580

E
151
(L 5) 0.2338

E
151
(L 6)
Tabla 8.15: Predicciones Modelo 2, IP 95%
Perodo Predicci on Lim.Inf Lim.Sup
1993 Q4 1637.388 1524.544 1758.584
1994 Q1 1485.637 1364.104 1617.997
1994 Q2 1665.394 1505.609 1842.136
1994 Q3 1729.147 1555.993 1921.569
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
236 CAP
ITULO 8. MODELACI

Tabla 8.16: Precisi on pron osticos Modelo 2
105.36 140.05 114.18 5.59 6.19
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
ajustado
pronosticado
Figura 8.8: Serie real, ajustada y pron osticos Modelo 2
6.2 6.4 6.6 6.8 7.0 7.2 7.4
0
.
1
0
0
.
0
0
0
.
0
5
0
.
1
0
Residuales vs. ajustados modelo2
fitted(modelo2)
r
e
s
i
d
.
a
j
u
s
t
2
Residuales vs. tiempo modelo2
Time
r
e
s
i
d
.
a
j
u
s
t
2
1960 1970 1980 1990
0
.
1
0
0
.
0
0
0
.
0
5
0
.
1
0
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
0
.
1
5
ACF modelo2
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
0
.
1
5
Lag
P
a
r
t
i
a
l

A
C
F
PACF modelo2
Figura 8.9: Residuales at Modelo 2 y su ACF y PACF muestrales
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
AS CICLOS ARMA237
2 1 0 1 2
0
.
1
0
0
.
0
5
0
.
0
0
0
.
0
5
0
.
1
0
Grfico Normal Residuales Modelo 2
S
a
m
p
l
e

Q
u
a
n
t
i
l
e
s
Figura 8.10: Gr aco Normalidad de at Modelo 2
Tabla 8.17: Test de normalidad para at en Modelo 2
Estadstico W 0.9862
Valor P 0.1378
Test Shapiro-Wilk normality test
8.2.2. Ciclos ARMA(2,2)
Modelo 3: log(Y
t
) =
0
+
1
t +
2
t
2
+
3
t
3
+
3
i=1
i
I
i,t
+ E
t
,
E
t
=
2
j=1
j
E
tj
+ a
t
+
2
k=1
k
a
tk
, a
t
RBN(0,
2
a
) (8.5)
0
* P(|t
140
| > |T
0
|)**
1
0.1045 0.1312 0.7962 0.4273
2
0.5093 0.1226 4.1533 0.0001
1
0.6336 0.1397 4.5346 0.0000
2
0.2572 0.1108 2.3204 0.0218
0
6.2526 0.0479 130.4447 0.0000
1
0.0197 0.0017 11.3715 0.0000
2
-1.248910
4
0.0001 -1.4794 0.1413
3
2.963810
7
0.0000 0.4999 0.6180
1
-0.1312 0.0077 -17.0662 0.0000
2
-0.0181 0.0057 -3.1631 0.0019
3
0.0152 0.0077 1.9811 0.0495
AIC = 530.75, BIC = 494.54,
2
a
= 0.001473, df = 140
0
= Estimacion/s.e
140
| > |T
0
|) = P(t
140
> |T
0
|) +P(t
140
< |T
0
|)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
238 CAP
ITULO 8. MODELACI

Y
151
(L) exp
_
6.2526 + 0.0197(151 +L) 1.2489 10
4
(151 +L)
2
+ 2.9638 10
7
(151 +L)
3
0.1312I
1,151+L
0.0181I
2,151+L
+ 0.0152I
3,151+L
+

E
151
(L)
_
exp (0.001473/2)
donde
E
151
(L) = 0.1045

E
151
(L 1) + 0.5093

E
151
(L 2) + 0.6336 a
151
(L 1) + 0.2572 a
151
(L 2)
1993 Q4 1601.677 1485.618 1726.803
1994 Q1 1430.268 1302.612 1570.435
1994 Q2 1594.970 1424.557 1785.767
1994 Q3 1664.929 1479.227 1873.944
161.79 186.54 161.79 8.87 8.87
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
ajustado
pronosticado
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
AS CICLOS ARMA239
6.2 6.4 6.6 6.8 7.0 7.2 7.4
0
.
1
0
0
.
0
0
0
.
0
5
0
.
1
0
fitted(modelo3)
r
e
s
i
d
.
a
j
u
s
t
3
Time
r
e
s
i
d
.
a
j
u
s
t
3
1960 1970 1980 1990
0
.
1
0
0
.
0
0
0
.
0
5
0
.
1
0
0 5 10 15 20 25 30 35
0
.
2
0
.
1
0
.
0
0
.
1
0
.
2
ACF modelo3
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
0
.
1
5
Lag
P
a
r
t
i
a
l

A
C
F
PACF modelo3
2 1 0 1 2
0
.
1
0
0
.
0
5
0
.
0
0
0
.
0
5
0
.
1
0
S
a
m
p
l
e

Q
u
a
n
t
i
l
e
s
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
240 CAP
ITULO 8. MODELACI

Estadstico W 0.9907
Valor P 0.4258
Modelo 4: log(Y
t
) =
0
+
1
t +
2
t
2
+
3
t
3
+
3
i=1
i
I
i,t
+ E
t
,
E
t
=
1
E
t1
+ a
t
+
5
k=1
k
a
tk
, a
t
RBN(0,
2
a
) (8.6)
0
* P(|t
138
| > |T
0
|)**
1
0.5509 0.1502 3.6666 0.0003
1
0.1228 0.1557 0.7888 0.4316
2
0.4361 0.1086 4.0143 0.0001
3
0.0869 0.1250 0.6950 0.4882
4
0.3890 0.0818 4.7556 0.0000
5
0.1633 0.1065 1.5333 0.1275
0
6.2444 0.0471 132.6452 0.0000
1
0.0201 0.0017 11.4934 0.0000
2
-1.299710
4
0.0001 -1.5477 0.1240
3
3.152110
7
0.0000 0.5334 0.5946
1
-0.1307 0.0076 -17.1882 0.0000
2
-0.0178 0.0072 -2.4684 0.0148
3
0.0150 0.0076 1.9780 0.0499
AIC = 538.65, BIC = 496.41,
2
a
= 0.001357, df = 138
0
= Estimacion/s.e
138
| > |T
0
|) = P(t
138
> |T
0
|) +P(t
138
< |T
0
|)
Y
151
(L) exp
_
6.2444 + 0.0201(151 +L) 1.2997 10
4
(151 +L)
2
+ 3.1521 10
7
(151 +L)
3
0.1307I
1,151+L
0.0178I
2,151+L
+ 0.0150I
3,151+L
+

E
151
(L)
_
exp (0.001357/2)
donde
E
151
(L) = 0.5509

E
151
(L 1) + 0.1228 a
151
(L 1) + 0.4361 a
151
(L 2)
+ 0.0869 a
151
(L 3) + 0.3890 a
151
(L 4) + 0.1633 a
151
(L 5)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
AS CICLOS ARMA241
1993 Q4 1604.400 1492.640 1724.529
1994 Q1 1434.798 1315.165 1565.315
1994 Q2 1599.942 1440.794 1776.668
1994 Q3 1645.541 1471.802 1839.789
163.58 192.66 163.58 8.93 8.93
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
ajustado
pronosticado
6.2 6.4 6.6 6.8 7.0 7.2 7.4
0
.
1
0
0
.
0
0
0
.
0
5
0
.
1
0
fitted(modelo4)
r
e
s
i
d
.
a
j
u
s
t
4
Time
r
e
s
i
d
.
a
j
u
s
t
4
1960 1970 1980 1990
0
.
1
0
0
.
0
0
0
.
0
5
0
.
1
0
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
0
.
1
5
ACF modelo4
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
0
.
1
5
Lag
P
a
r
t
i
a
l

A
C
F
PACF modelo4
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
242 CAP
ITULO 8. MODELACI

2 1 0 1 2
0
.
1
0
0
.
0
5
0
.
0
0
0
.
0
5
0
.
1
0
S
a
m
p
l
e

Q
u
a
n
t
i
l
e
s
Estadstico W 0.9842
Valor P 0.08086
modelo 5: log(Y
t
) =
0
+
1
t +
2
t
2
+
3
t
3
+
3
i=1
i
I
i,t
+ E
t
,
E
t
=
2
j=1
j
E
tj
+ a
t
+
4
k=1
k
a
tk
, a
t
RBN(0,
2
a
) (8.7)
0
* P(|t
138
| > |T
0
|)**
1
1.0112 0.2084 4.8526 0.0000
2
-0.3289 0.1754 -1.8751 0.0629
1
-0.3304 0.1934 -1.7086 0.0898
2
0.4546 0.1037 4.3820 0.0000
3
-0.0764 0.1008 -0.7575 0.4501
4
0.4094 0.0808 5.0643 0.0000
0
6.2447 0.0449 139.1408 0.0000
1
0.0201 0.0017 11.7441 0.0000
2
-1.299510
4
0.0001 -1.5474 0.1241
3
3.154010
7
0.0000 0.5384 0.5912
1
-0.1308 0.0076 -17.2161 0.0000
2
-0.0179 0.0069 -2.6013 0.0103
3
0.0150 0.0075 1.9853 0.0491
AIC = 539.19, BIC = 496.95,
2
a
= 0.001353, df = 138
0
= Estimacion/s.e
138
| > |T
0
|) = P(t
138
> |T
0
|) +P(t
138
< |T
0
|)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
AS CICLOS ARMA243
Y
151
(L) exp
_
6.2447 + 0.0201(151 +L) 1.2995 10
4
(151 +L)
2
+ 3.1540 10
7
(151 +L)
3
0.1308I
1,151+L
0.0179I
2,151+L
+ 0.0150I
3,151+L
+

E
151
(L)
_
exp (0.001353/2)
donde
E
151
(L) = 1.0112

E
151
(L 1) 0.3289

E
151
(L 2) 0.3304 a
151
(L 1)
+ 0.4546 a
151
(L 2) 0.0764 a
151
(L 3) + 0.4094 a
151
(L 4)
1993 Q4 1604.766 1493.163 1724.710
1994 Q1 1436.462 1316.513 1567.340
1994 Q2 1598.198 1438.752 1775.314
1994 Q3 1647.789 1473.705 1842.437
162.95 191.89 162.95 8.90 8.90
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
ajustado
pronosticado
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
244 CAP
ITULO 8. MODELACI

6.2 6.4 6.6 6.8 7.0 7.2 7.4
0
.
1
0
0
.
0
0
0
.
0
5
0
.
1
0
fitted(modelo5)
r
e
s
i
d
.
a
j
u
s
t
5
Time
r
e
s
i
d
.
a
j
u
s
t
5
1960 1970 1980 1990
0
.
1
0
0
.
0
0
0
.
0
5
0
.
1
0
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
0
.
1
5
ACF modelo5
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
0
.
1
5
Lag
P
a
r
t
i
a
l

A
C
F
PACF modelo5
2 1 0 1 2
0
.
1
0
0
.
0
5
0
.
0
0
0
.
0
5
0
.
1
0
S
a
m
p
l
e

Q
u
a
n
t
i
l
e
s
Estadstico W 0.984
Valor P 0.0774
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
AS CICLOS ARMA245
Modelo 6i: Primero se ajust o con los ciclos indicados en el primer modelo
identicado en la Figura 8.4, es decir, log(Y
t
) =
0
+
1
t +
2
t
2
+
3
t
3
+
3
i=1
i
I
i,t
+E
t
,
E
t
=
2
E
t2
+
6
E
t6
+a
t
+
7
a
t7
, a
t
RBN(0,
2
a
). Los residuales a
t
, ACF y PACF
muestrales de estos residuales se muestran en la Figura 8.20, donde es claro
que el supuesto de ruido blanco para a
t
no es v alido. As que se procedi o a
modicar los ciclos en este modelo como se especica a continuaci on.
Modelo 6: log(Y
t
) =
0
+
1
t +
2
t
2
+
3
t
3
+
3
i=1
i
I
i,t
+ E
t
,
E
t
=
1
E
t1
+
2
E
t2
+
3
E
t3
+
6
E
t6
+ a
t
+
7
a
t7
, a
t
RBN(0,
2
a
). (8.8)
0
* P(|t
139
| > |T
0
|)**
1
0.6118 0.0789 7.7550 0.0000
2
0.4077 0.0892 4.5701 0.0000
3
-0.1635 0.0802 -2.0376 0.0435
6
-0.1606 0.0347 -4.6225 0.0000
7
-0.1137 0.0839 -1.3564 0.1772
0
6.2373 0.0377 165.5413 0.0000
1
0.0207 0.0021 9.7483 0.0000
2
-1.411610
4
0.0001 -1.5702 0.1186
3
3.696410
7
0.0000 0.7164 0.4750
1
-0.1312 0.0070 -18.8185 0.0000
2
-0.0183 0.0059 -3.1196 0.0022
3
0.0144 0.0069 2.0894 0.0385
AIC = 538.96, BIC = 475.6,
2
a
= 0.001373, df = 139
0
= Estimacion/s.e
139
| > |T
0
|) = P(t
139
> |T
0
|) +P(t
139
< |T
0
|)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
246 CAP
ITULO 8. MODELACI

6.2 6.4 6.6 6.8 7.0 7.2 7.4
0
.
1
5
0
.
0
5
0
.
0
5
Residuales vs. ajustados modelo6i
fitted(modelo6i)
r
e
s
i
d
.
a
j
u
s
t
6
i
Residuales vs. tiempo modelo6i
Time
r
e
s
i
d
.
a
j
u
s
t
6
i
1960 1970 1980 1990
0
.
1
5
0
.
0
5
0
.
0
5
0 5 10 15 20 25 30 35
0
.
2
0
.
0
0
.
2
0
.
4
ACF modelo6i
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.
2
0
.
0
0
.
2
0
.
4
Lag
P
a
r
t
i
a
l

A
C
F
PACF modelo6i
Figura 8.20: Residuales at del ajuste con errores ARMA(6,7), con
j
, j = 1, 3, 4, 5, y
i
, i = 1, 2, . . . , 6, jos en cero, y su
ACF y PACF muestrales
La ecuaci on de los pron osticos del modelo 6 en escala original es
Y
151
(L) exp
_
6.2373 + 0.0207(151 +L) 1.4116 10
4
(151 +L)
2
+ 3.6964 10
7
(151 +L)
3
0.1312I
1,151+L
0.0183I
2,151+L
+ 0.0144I
3,151+L
+

E
151
(L)
_
exp (0.001373/2)
donde
E
151
(L) = 0.6118

E
151
(L 1) + 0.4077

E
151
(L 2) 0.1635

E
151
(L 3)
0.1606

E
151
(L 6) 0.1137 a
151
(L 7)
1993 Q4 1644.559 1529.368 1768.426
1994 Q1 1464.141 1344.657 1594.241
1994 Q2 1655.941 1494.869 1834.368
1994 Q3 1717.747 1538.461 1917.925
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
AS CICLOS ARMA247
114.15 144.05 114.15 6.14 6.14
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
ajustado
pronosticado
6.2 6.4 6.6 6.8 7.0 7.2 7.4
0
.
1
0
0
.
0
0
0
.
0
5
0
.
1
0
fitted(modelo6)
r
e
s
i
d
.
a
j
u
s
t
6
Time
r
e
s
i
d
.
a
j
u
s
t
6
1960 1970 1980 1990
0
.
1
0
0
.
0
0
0
.
0
5
0
.
1
0
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
0
.
1
5
ACF modelo6
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
0
.
1
5
Lag
P
a
r
t
i
a
l

A
C
F
PACF modelo6
Figura 8.22: Residuales at Modelo 6 y su ACF y PAF muestrales
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
248 CAP
ITULO 8. MODELACI

2 1 0 1 2
0
.
1
0
0
.
0
5
0
.
0
0
0
.
0
5
0
.
1
0
S
a
m
p
l
e

Q
u
a
n
t
i
l
e
s
Estadstico W 0.9903
Valor P 0.3862
Modelo 7i: Primero se ajust o con los ciclos indicados en el segundo modelo
de la Figura 8.4, es decir, log(Y
t
) =
0
+
1
t +
2
t
2
+
3
t
3
+
3
i=1
i
I
i,t
+ E
t
, E
t
=
1
E
t1
+
7
E
t7
+ a
t
+
8
a
t8
+
10
a
t10
, a
t
RBN(0,
2
a
). Los residuales a
t
, ACF y
PACF muestrales de estos residuales se muestran en la Figura 8.24, donde es
claro que el supuesto de ruido blanco para a
t
no es v alido. As que se procedi o a
modicar los ciclos de este modelo como se especica a continuaci on.
Modelo 7: log(Y
t
) =
0
+
1
t +
2
t
2
+
3
t
3
+
3
i=1
i
I
i,t
+ E
t
,
E
t
=
1
E
t1
+
7
E
t7
+a
t
+
1
a
t1
+
2
a
t2
+
4
a
t4
+
8
a
t8
+
10
a
t10
, a
t
RBN(0,
2
a
).
(8.9)
Y
151
(L) exp
_
6.2444 + 0.0202(151 +L) 1.32999 10
4
(151 +L)
2
+ 3.3228 10
7
(151 +L)
3
0.1309I
1,151+L
0.0182I
2,151+L
+ 0.0149I
3,151+L
+

E
151
(L)
_
exp (0.0006892/2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
AS CICLOS ARMA249
6.2 6.4 6.6 6.8 7.0 7.2 7.4
0
.
1
0
0
.
0
0
0
.
1
0
Residuales vs. ajustados modelo7i
fitted(modelo7i)
r
e
s
i
d
.
a
j
u
s
t
7
i
Residuales vs. tiempo modelo7i
Time
r
e
s
i
d
.
a
j
u
s
t
7
i
1960 1970 1980 1990
0
.
1
0
0
.
0
0
0
.
1
0
0 5 10 15 20 25 30 35
0
.
2
0
.
0
0
.
1
0
.
2
ACF modelo7i
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.
2
0
.
1
0
.
0
0
.
1
0
.
2
Lag
P
a
r
t
i
a
l

A
C
F
PACF modelo7i
Figura 8.24: Residuales at del ajuste con errores ARMA(7,10), con
j
, j = 2, 3, 4, 5, 6, y
i
, i = 1, 2, . . . , 7, 9, jos en cero,
y su ACF y PACF muestrales
0
* P(|t
137
| > |T
0
|)**
1
0.3712 0.0876 4.2400 0.0000
7
-0.1427 0.0647 -2.2062 0.0290
1
0.7968 0.1398 5.7012 0.0000
2
0.8750 0.1686 5.1888 0.0000
4
0.9068 0.1273 7.1249 0.0000
8
-0.2446 0.1140 -2.1456 0.0337
10
-0.1352 0.1209 -1.1180 0.2655
0
6.2444 0.0368 169.7221 0.0000
1
0.0202 0.0021 9.6756 0.0000
2
-1.3299910
4
0.0001 -1.4904 0.1384
3
3.322810
7
0.0000 0.6385 0.5242
1
-0.1309 0.0073 -17.9633 0.0000
2
-0.0182 0.0066 -2.7795 0.0062
3
0.0149 0.0072 2.0671 0.0406
AIC = 534.05, BIC = 458.62,
2
a
= 0.0006892, df = 137
0
= Estimacion/s.e
137
| > |T
0
|) = P(t
137
> |T
0
|) +P(t
137
< |T
0
|)
donde
E
151
(L) = 0.3712

E
151
(L 1) 0.1427

E
151
(L 7) + 0.7968 a
151
(L 1)
+ 0.8750 a
151
(L 2) + 0.9068 a
151
(L 4) 0.2446 a
151
(L 8) 0.1352 a
151
(L 10)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
250 CAP
ITULO 8. MODELACI

1993 Q4 1612.564 1499.348 1734.329
1994 Q1 1452.297 1328.975 1587.062
1994 Q2 1606.601 1444.398 1787.019
1994 Q3 1676.599 1497.718 1876.845
147.73 176.40 147.73 8.03 8.03
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
ajustado
pronosticado
6.2 6.4 6.6 6.8 7.0 7.2 7.4
0
.
0
5
0
.
0
0
0
.
0
5
fitted(modelo7)
r
e
s
i
d
.
a
j
u
s
t
7
Time
r
e
s
i
d
.
a
j
u
s
t
7
1960 1970 1980 1990
0
.
0
5
0
.
0
0
0
.
0
5
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
0
.
1
5
ACF modelo7
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
0
.
1
5
Lag
P
a
r
t
i
a
l

A
C
F
PACF modelo7
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
AS CICLOS ARMA251
2 1 0 1 2
0
.
0
5
0
.
0
0
0
.
0
5
S
a
m
p
l
e

Q
u
a
n
t
i
l
e
s
Estadstico W 0.9851
Valor P 0.1050
8.2.7. Ciclos ARMA(1, 2) (0, 1)
[4]
Modelo 8: log(Y
t
) =
0
+
1
t +
2
t
2
+
3
t
3
+
3
i=1
i
I
i,t
+ E
t
,
(1
1
B)E
t
= (1 +
1
B +
2
B
2
)(1 +
1
B
4
)a
t
, a
t
RBN(0,
2
a
). (8.10)
0
* P(|t
140
| > |T
0
|)**
1
0.5933 0.1163 5.1014 0.0000
1
0.1050 0.1260 0.8334 0.4060
2
0.3879 0.1065 3.6410 0.0004
1
0.3716 0.0838 4.4346 0.0000
0
6.2484 0.0485 128.8175 0.0000
1
0.0199 0.0017 11.3867 0.0000
2
-1.282810
4
0.0001 -1.5338 0.1273
3
3.104110
7
0.0000 0.5227 0.6020
1
-0.1309 0.0081 -16.2576 0.0000
2
-0.0183 0.0063 -2.8894 0.0045
3
0.0151 0.0080 1.8867 0.0613
AIC = 538.77, BIC = 502.56,
2
a
= 0.001394, df = 140
0
= Estimacion/s.e
140
| > |T
0
|) = P(t
140
> |T
0
|) +P(t
140
< |T
0
|)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
252 CAP
ITULO 8. MODELACI

Y
151
(L) exp
_
6.2484 + 0.0199(151 +L) 1.2828 10
4
(151 +L)
2
+ 3.1041 10
7
(151 +L)
3
0.1309I
1,151+L
0.0183I
2,151+L
+ 0.0151I
3,151+L
+

E
151
(L)
_
exp (0.001394/2)
donde
E
151
(L) = 0.5933

E
151
(L 1) + 0.1050 a
151
(L 1)
+0.3879 a
151
(L2)+0.3716 a
151
(L4)+(0.1050 0.3716) a
151
(L5)+(0.3879 0.3716) a
151
(L6)
1993 Q4 1607.602 1494.156 1729.662
1994 Q1 1449.555 1325.774 1584.892
1994 Q2 1597.950 1436.036 1778.121
1994 Q3 1670.786 1493.204 1869.488
153.28 181.53 153.28 8.34 8.34
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
ajustado
pronosticado
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
AS CICLOS ARMA253
6.2 6.4 6.6 6.8 7.0 7.2 7.4
0
.
1
0
0
.
0
0
0
.
0
5
0
.
1
0
fitted(modelo8)
r
e
s
i
d
.
a
j
u
s
t
8
Time
r
e
s
i
d
.
a
j
u
s
t
8
1960 1970 1980 1990
0
.
1
0
0
.
0
0
0
.
0
5
0
.
1
0
0 5 10 15 20 25 30 35
0
.
1
0
.
0
0
.
1
ACF modelo8
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
0
.
1
5
Lag
P
a
r
t
i
a
l

A
C
F
PACF modelo8
2 1 0 1 2
0
.
1
0
0
.
0
5
0
.
0
0
0
.
0
5
0
.
1
0
S
a
m
p
l
e

Q
u
a
n
t
i
l
e
s
Estadstico W 0.9902
Valor P 0.378
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
254 CAP
ITULO 8. MODELACI

8.3. Selecci on del mejor modelo
La escogencia del mejor modelo debe realizarse entre modelos v alidos, es
decir, donde se verican los supuestos sobre los cuales se construye el mode-
lo, y considerando la calidad del ajuste y de los pron osticos en la validaci on
cruzada. Es necesario tambi en que los modelos sean utiles, es decir, que su
pron osticos sean mejores que los del pron ostico simple: MAPE
modelo
< MSIMP.
Para el caso, los pron osticos con el m etodo simple de pron ostico son
Y
151
(L) = Y
151+L
, L = 1, , 4, o bien,

Y
151+j
(1) = Y
151+j+1
, j = 0, 1, , 3
Tabla 8.42: Pron osticos m etodo simple
Perodo L j valor real pron ostico simple
1993 Q4 1 0 1777.00 1648.00
1994 Q1 2 1 1468.00 1777.00
1994 Q2 3 2 1732.00 1468.00
1994 Q3 4 3 1962.00 1732.00
para lo cual se obtiene el MSIMP = 13.81842 (este es el MAPE de m etodo
simple de pron ostico).
Los pron osticos para L perodos adelante de t = n en los modelos de com-
ponentes aditivas y con ciclos ARMA se calculan como
(Pron ostico)
n+L
= (Pron ostico estructura)
n+L
+ (Pron ostico errores ARMA)
n+L
donde el pron ostico de la estructura es
(Pron ostico estructura)
n+L
=

T
n+L
+

S
n+L
es decir, tendencia m as estacionalidad estimadas para t = n +L. Los pron osti-
cos para los errores ARMA(p,q) son de acuerdo a lo visto en la Secci on 7.10 de
las notas de clase:
E
n
(L) =

1

E
n
(L 1) +

2

E
n
(L 2) + +

p

E
n
(L p)
+

1
a
n
(L 1) +

2
a
n
(L 2) + +

q
a
n
(L q)
NOTA: Si la serie es de componentes multiplicativas y se ajustada el logaritmo
de la serie por regresi on con errores ARMA, producimos primero los valores
ajustados y los pron osticos en la escala logartmica y luego llevamos a la escala
original exponenciando estos valores y multiplicando por factor de correcci on
calculado como exp(
2
a
/2). Respecto al ajuste, los residuales de ajuste a
t
son
calculados y examinados en la escala logartmica, pues es en esa escala en la
cual se ajustan los modelos.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
8.4. C

ODIGO R USADO 255
Tabla 8.43: Comparaci on de los 8 modelos
MODELO DF AIC BIC MAPE V
ALIDO
1 144 -373.94 -349.80 7.10 No
2 138 -541.94 -499.70 6.19 S
3 140 -530.75 -494.54 8.87 No
4 138 -538.65 -496.41 8.93 No (no normalidad)
5 138 -539.19 -496.95 8.90 No (no normalidad)
6 139 -538.96 -475.6 6.14 S
7 137 -534.05 -458.62 8.03 S
8 140 -538.77 -502.56 8.34 S
Time
P
r
o
d
u
c
c
i
n
1
5
0
0
1
6
0
0
1
7
0
0
1
8
0
0
1
9
0
0
1993.Q4 1994.Q1 1994.Q2 1994.Q3
Serie Original
Pronstico Modelo 1
Pronstico Modelo 2
Pronstico Modelo 3
Pronstico Modelo 4
Pronstico Modelo 5
Pronstico Modelo 6
Pronstico Modelo 7
Pronstico Modelo 8
Figura 8.31: Valores reales y pronosticados con los ocho modelos (Miles de toneladas)
Cu al modelo seleccionar para ajuste y pron ostico? Por qu e?.
8.4. C odigo R usado
A continuaci on se da el c odigo R usado para obtener los resultados presen-
tados. Tenga en cuenta que los valores de grados de libertad usados en cada
caso corresponde al n umero de datos usados en los ajustes menos el total de
par ametros estimados incluyendo intercepto y par ametros del modelo ARMA
ajustado a los errores.
C odigo R 8.1. Cargando libreras y deniendo funciones de usuario
library(forecast)
library(TSA)
library(car)
#Definiendo funcion para evaluar test Ljung-Box
BP.LB.test=function(serie,maxlag,type="Ljung"){
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
256 CAP
ITULO 8. MODELACI

df=c(rep(NA,aux))
for(i in 1:aux){
*
i),type=type)
df[i]=test[[2]]
}
lag=6
*
c(1:aux)
rownames(teste)=lag
teste
}
#Definiendo funcion para evaluar test Durbin-Watson
pruebaDW1=function(modelo){
dwneg=durbinWatsonTest(modelo,max.lag=1,method="normal",alternative="negative")
dwpos=durbinWatsonTest(modelo,max.lag=1,method="normal",alternative="positive")
res=data.frame(1,dwneg$r,dwneg$dw,dwpos$p,dwneg$p)
names(res)=c("lag","rho estimado","Estadstico D-W","VP rho>0","VP rho<0")
res
}
C odigo R 8.2. Lectura de los datos, gr acas descriptivas, denici on de vari-
ables para ajuste y pron osticos
#LECTURA DE LOS DATOS
yt=scan()
465 532 561 570 529 604 603 582 554 620 646
637 573 673 690 681 621 698 753 728 688 737
782 692 637 757 783 757 674 734 835 838 797
904 949 975 902 974 969 967 849 961 966 922
836 998 1025 971 892 973 1047 1017 948 1032
1190 1136 1049 1134 1229 1188 1058 1209 1199
1253 1070 1282 1303 1281 1148 1305 1342 1452
1184 1352 1316 1353 1121 1297 1318 1281 1109
1299 1341 1290 1101 1284 1321 1317 1122 1261
1312 1298 1202 1302 1377 1359 1232 1386 1440
1439 1282 1573 1533 1651 1347 1575 1475 1357
1086 1158 1279 1313 1166 1373 1456 1496 1251
1456 1631 1554 1347 1516 1546 1564 1333 1458
1499 1613 1416 1625 1770 1791 1622 1719 1972
1893 1575 1644 1658 1668 1343 1441 1444 1497
1267 1501 1538 1569 1450 1569 1648 1777 1468
1732 1962
lnyt=log(yt)
#GRAFICANDO SERIE ORIGINAL Y SU LOGARITMO NATURAL
plot(yt,main="Produccion trimestral cemento portland\nMiles de ton. Q11956-Q31994")
plot(lnyt,main="Log de produccion trimestral cemento portland\nMiles de ton. Q11956-Q31994")
#Valores de la serie y predictores para los ajustes
m=4 #No. Obs para validacion cruzada
n=length(yt)-m
lnyt2=log(yt2)
#DEFINIENDO INDICE DE TIEMPO Y SU CUADRADO, E INDICADORAS, PARA LAS PRIMERAS n=151 OBSERVACIONES
t=1:length(lnyt2)
t2=t2
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
8.4. C

ODIGO R USADO 257
t3=t3
trimestre=seasonaldummy(lnyt2)
Q1=trimestre[,1];Q2=trimestre[,2];Q3=trimestre[,3]
X=cbind(t,t2,t3,trimestre) #Esta matriz de los predictores sera usada con funcion Arima() o arima()
#Estos son los valores de los predictores para las predicciones
tnuevo=152:155
t2nuevo=tnuevo2
t3nuevo=tnuevo3
trimestrenuevo=seasonaldummyf(lnyt2,h=4)
Xnuevo=cbind(t=tnuevo,t2=t2nuevo,t3=t3nuevo,trimestre=trimestrenuevo) #se usa en funcion forecast
ytf=ts(yt[tnuevo],frequency=4,start=c(1993,4)) #Tomando de la serie completa los ultimos m valores
#que son pronosticados
C odigo R 8.3. Ajuste del modelo 1, pron osticos y evaluaci on de supuesto de
R.B sobre el error estructural E
t
#AJUSTANDO MODELO AL log(yt2) CON TENDENCIA C
UBICA Y ESTACIONALIDAD TRIMESTRAL

modelo1=lm(lnyt2t+t2+t3+Q1+Q2+Q3)
summary(modelo1) #Despliega resultados del modelo ajustado. Note que se ha
#eliminado la indicadora de la estacion 4
AIC(modelo1)
BIC(modelo1)
#Las predicciones se exponencian para obtener valores en escala original
predic.modelo1=exp(predict(modelo1,newdata=data.frame(t=tnuevo,t2=t2nuevo,t3=t3nuevo,
Q1=trimestrenuevo[,1],Q2=trimestrenuevo[,2],Q3=trimestrenuevo[,3]),
level=0.95,interval="prediction"))
*
exp(summary(modelo1)$sigma2/2)
predic.modelo1=ts(predic.modelo1,freq=4,start=c(1993,4)) #coviertiendo a serie de tiempo predicciones
#y sus I.P
predic.modelo1
ytpron1=predic.modelo1[,1]
#Calidad de los pronosticos
accuracy(ytpron1,ytf)
#Graficando la serie original, ajustada y sus pronosticos, en escala original
#la exponenciacion de los valores ajustados es necesaria para pasar de escala log a la original.
#Serie de tiempo de valores ajustados en escala original. Se usa factor de correccion
ythat1=ts(exp(fitted(modelo1))
*
exp(summary(modelo1)$sigma2/2),frequency=4,start=c(1956,1))
plot(yt,main="Serie real, ajustes y pronosticos\nModelo Log cubico estacional")
lines(ythat1,col=2)
lines(ytpron1,col=4)
legend("topleft",legend=c("Original","Ajustada","Pronosticos"),lty=1,lwd=c(1,2,2),col=c(1,2,4))
#Evaluando testes Ljung-Box y Durbin Watson en residuales modelo 1
BP.LB.test(residuals(modelo1),maxlag=n/4,type="Ljung")
pruebaDW1(modelo1)
#Graficas de residuales modelo 1, ACF, PACF y EACF
plot(t,residuals(modelo1),type="o"); abline(h=0,lty=2)
plot(fitted(modelo1),residuals(modelo1),type="p"); abline(h=0,lty=2)
acf(residuals(modelo1),ci.type="ma",main="ACF modelo1",lag.max=36)
pacf(residuals(modelo1),main="PACF modelo1",lag.max=36)
eacf(residuals(modelo1),ar.max = 18, ma.max = 18) #EACF residuales estructurales
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
258 CAP
ITULO 8. MODELACI

C odigo R 8.4. Identicaci on autom atica de modelos ARMA con funciones au-
to.arima( ) y armasubsets( ). Ajuste sobre los residuales estructurales del modelo
1, de los ciclos identicados, incluyendo los resultantes del an alisis de la ACF
y PACF, y de la EACF de los residuales estructurales.
Para los ciclos considerados en los modelos 6 y 7 tenga en cuenta el uso
del argumento fixed en la funci on Arima(), donde para cada uno de los
par ametros AR y MA, en ese orden, se indica en un vector c(), cu ales deben
estimarse colocando un NA, y cu ales deben jarse en 0, colocando tal n umero
en la posici on correspondiente dentro del vector especicado. Este vector debe
tener p + q entradas en total.
#GENERANDO GR
AFICO del armasubsets()

plot(armasubsets(residuals(modelo1),nar=12,nma=12,y.name=AR,ar.method=ml))
#IDENTIFICACI
ON AUTOM
ATICA Y AJUSTE DE LOS CICLOS IDENTIFICADOS

pruebaresAutom=auto.arima(residuals(modelo1))
pruebaresAutom
#Lo siguiente puede arrojar un modelo ARMA estacional
serie.et=ts(residuals(modelo1),freq=4,start=c(1956,1))
pruebaresAutom2=auto.arima(serie.et,ic="aic")
pruebaresAutom2
pruebaresAR6=Arima(residuals(modelo1),order=c(6,0,0),include.mean=FALSE,method="ML")
pruebaresAR6
pruebaresARMA15=Arima(residuals(modelo1),order=c(1,0,5),include.mean=FALSE,method="ML")
pruebaresARMA15
pruebaresARMA24=Arima(residuals(modelo1),order=c(2,0,4),include.mean=FALSE,method="ML")
pruebaresARMA24
#Ajustando sobre residuales estructurales, modificacion del primer modelo arrojado por armasubsets()
pruebaresARMA67=Arima(residuals(modelo1),order=c(6,0,7),fixed=c(NA,NA,NA,0,0,NA,rep(0,6),NA),
include.mean=FALSE,method="ML")
pruebaresARMA67
#Ajustando sobre residuales estructurales, modificacion del segundo modelo arrojado por armasubsets()
pruebaresARMA710=Arima(residuals(modelo1),order=c(7,0,10),
fixed=c(c(NA,rep(0,5),NA),c(NA,NA,0,NA,rep(0,3),NA,0,NA)),include.mean=FALSE,method="ML")
pruebaresARMA710
C odigo R 8.5. Construcci on de las gr acas de las ACF y PACF esperadas para
los errores estructurales del modelo 1, con base en las estimaciones de los ciclos
hechas en el c odigo anterior.
#ACFS Y PACFS TE
ORICAS MODELOS CICLOS IDENTIFICADOS, EXCEPTO EL SARMA

#PAR
AMETROS AJUSTADOS
parma2.2=coef(pruebaresAutom)
par6=coef(pruebaresAR6)
parma1.5=coef(pruebaresARMA15)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
8.4. C

ODIGO R USADO 259
#ARMA(2,2) AJUSTADO A RESIDUALES MODELO1
FAC=ARMAacf(ar = parma2.2[1:2], ma=parma2.2[3:4],lag.max = 36, pacf =FALSE)
FACP=ARMAacf(ar = parma2.2[1:2], ma=parma2.2[3:4],lag.max = 36, pacf = TRUE)
plot(1:36,FAC[-1],type=h,col=2,yaxt="n",bty="l",ylab=expression(rho(k)),xlab="k",lwd=2,ylim=c(-0.2,1))
points(1:36,FAC[-1],cex=1.2,pch=19,col=2)
axis(2,c(-1,0,1),label=c(-1,0,1),las=2)
abline(h=0)
legend("topright",legend=c("ARMA(2,2)-teorico"),bty="n")
plot(1:36,FACP,type=h,col=2,yaxt="n",bty="l",ylab=expression(phi[kk]),xlab="k",lwd=2,ylim=c(-0.3,1))
points(1:36,FACP,cex=1.2,pch=19,col=2)
axis(2,c(-1,0,1),label=c(-1,0,1),las=2)
abline(h=0)
#AR(6) AJUSTADOS A RESIDUALES MODELO1
FAC=ARMAacf(ar=par6, lag.max = 36, pacf =FALSE)
FACP=ARMAacf(ar =par6,lag.max = 36, pacf = TRUE)
axis(2,c(-1,0,1),label=c(-1,0,1),las=2)
abline(h=0)
legend("topright",legend=c("AR(6)-teorico"),bty="n")
axis(2,c(-1,0,1),label=c(-1,0,1),las=2)
abline(h=0)
legend("topright",legend=c("AR(6)-teorico"),bty="n")
FAC=ARMAacf(ar = parma2.4[1:2],ma=parma2.4[3:6], lag.max = 36, pacf =FALSE)
FACP=ARMAacf(ar = parma2.4[1:2],ma=parma2.4[3:6],lag.max = 36, pacf = TRUE)
axis(2,c(-1,0,1),label=c(-1,0,1),las=2)
abline(h=0)
axis(2,c(-1,0,1),label=c(-1,0,1),las=2)
abline(h=0)
FAC=ARMAacf(ar = parma1.5[1],ma=parma1.5[2:6], lag.max = 36, pacf =FALSE)
FACP=ARMAacf(ar = parma1.5[1],ma=parma1.5[2:6],lag.max = 36, pacf = TRUE)
axis(2,c(-1,0,1),label=c(-1,0,1),las=2)
abline(h=0)
axis(2,c(-1,0,1),label=c(-1,0,1),las=2)
abline(h=0)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
260 CAP
ITULO 8. MODELACI

#ARMA(6,7) MODIFICADO SEG
UN MODELO 6, AJUSTADO A RESIDUALES MODELO1

axis(2,c(-1,0,1),label=c(-1,0,1),las=2)
abline(h=0)
axis(2,c(-1,0,1),label=c(-1,0,1),las=2)
abline(h=0)
#ARMA(7,10) MODIFICADO SEG
UN MODELO 7 AJUSTADO A RESIDUALES MODELO1

axis(2,c(-1,0,1),label=c(-1,0,1),las=2)
abline(h=0)
axis(2,c(-1,0,1),label=c(-1,0,1),las=2)
abline(h=0)
En los siguientes c odigos se presenta el ajuste y pron osticos de los modelos 2
a 8. Para la obtenci on del AIC y BIC no es necesario invocar las funciones R
correspondientes, ya que estas medidas pueden leerse en la salida producida
con la funci on summary() aplicada sobre los objetos que guardan los mod-
elos ajustados. Observe que con summary() no se obtienen estadsticos ni
valores P para las pruebas de la signicancia individual de los par ametros, y
por esta raz on es necesario realizar los c alculos correspondientes para com-
pletar la informaci on sobre las estimaciones del modelo. Vea en cada caso la
construcci on del objeto denominado tabla. Los grados de libertad df se cal-
culan como la diferencia n k, siendo n el tama no de la muestra usada en
los ajustes y k el total de par ametros de los modelos, que incluye tanto los
par ametros estructurales de tendencia y estacionalidad como los de los ciclos
ARMA considerados para los errores estructurales E
t
.
C odigo R 8.6. Ajuste y pron osticos del modelo 2, con df=138 grados de libertad
#Ajuste con errores AR(6)
modelo2=Arima(lnyt2,order=c(6,0,0),xreg=X,method="ML")
summary(modelo2)
resid.ajust2=residuals(modelo2)
#Completando informacion sobre valores T0 y valores P
est=cbind(Estimacion=modelo2$coef,s.e=sqrt(diag(modelo2$var.coef)))
t0=est[,1]/est[,2]
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
8.4. C

ODIGO R USADO 261
vp=pt(abs(t0),df=138,lower.tail=FALSE)+pt(-abs(t0),df=138)
tabla=cbind(est,t0,vp) #tabla completa de parametros ajustados
tabla
#Graficos para residuales
plot(fitted(modelo2),resid.ajust2,main="Residuales vs. ajustados modelo2")
abline(h=0,lty=2)
plot(resid.ajust2,main="Residuales vs. tiempo modelo2")
abline(h=0,lty=2)
acf(as.numeric(resid.ajust2),ci.type="ma",main="ACF modelo2",lag.max=36)
pacf(as.numeric(resid.ajust2),main="PACF modelo2",lag.max=36)
#Examen normalidad residuales
shapiro.test(resid.ajust2)
qqnorm(resid.ajust2,main="Grafico Normal Residuales Modelo 2")
qqline(resid.ajust2,col=2,lwd=2)
#Para las predicciones se exponencia para llevar a escala original
#predicciones en escala log
predmod2=forecast(modelo2,xreg =Xnuevo,level=95)
#Prediccion en escala original
predic.modelo2=exp(cbind(Predic=predmod2$mean,LIP95=predmod2$lower,
LSP95=predmod2$upper))
*
exp(modelo2$sigma2/2)
predic.modelo2
#Calidad de pronosticos
#graficando la serie original, ajustada y sus pronosticos, en escala original
#la exponenciacion de los valores ajustados es necesaria para pasar de escala log a la original
#se aplica factor de correccion
ythat2=exp(fitted(modelo2))
*
plot(yt)
lines(ythat2,col=2,lwd=2)
lines(ytpron2,col="blue",lwd=2)
legend("topleft",legend=c("Original","ajustado","pronosticado"),lty=1,lwd=c(1,2,2),col=c(1,2,4))
C odigo R 8.7. Ajuste y pron osticos del modelo 3, df=140 grados de libertad
###Modelo con errores ARMA(2,2)
summary(modelo3)
t0=est[,1]/est[,2]
tabla
#Graficos para residuales
abline(h=0,lty=2)
abline(h=0,lty=2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
262 CAP
ITULO 8. MODELACI

#Examen normalidad residuales
#Para las predicciones se exponencia para llevar a escala original
*
predic.modelo3
#se usa factor de correccion
*
plot(yt)
lines(ytpron3,lty=1,col="blue",lwd=2)
C odigo R 8.8. Ajuste y pron osticos del modelo 4, df=138 grados de libertad
summary(modelo4)
t0=est[,1]/est[,2]
tabla
#Graficas para residuales
abline(h=0,lty=2)
abline(h=0,lty=2)
#Normalidad residuales
*
predic.modelo4
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
8.4. C

ODIGO R USADO 263
*
plot(yt)
C odigo R 8.9. Ajuste y pron osticos del modelo 5, df=138 grados de libertad.
summary(modelo5)
t0=est[,1]/est[,2]
tabla
abline(h=0,lty=2)
abline(h=0,lty=2)
*
predic.modelo5
*
plot(yt)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
264 CAP
ITULO 8. MODELACI

Para los modelos 6i, 6, 7i y 7 tenga en cuenta el uso del argumento fixed
en la funci on Arima(), donde para cada uno de los par ametros AR, MA, los
par ametros betas y deltas, en ese orden, se indica en un vector c(), cu ales
deben estimarse colocando un NA, y cu ales de ellos deben jarse en 0, colo-
cando tal n umero en la posici on correspondiente dentro del vector especi-
cado. Este vector debe tener p + q + r entradas en total, con r el n umero de
par ametros en la parte estructural determinstica de tendencia y estacionali-
dad; para estos ultimos, la entrada correspondiente en el vector debe ser un
NA. Mire tambi en con cuidado c omo se construye en estos casos el objeto est
donde hay una variante en la programaci on en relaci on a la forma en que se
deni o en los modelos 2 a 5.
C odigo R 8.10. Ajuste del modelo 6i. Ajuste y pron osticos del modelo 6, df=139
grados de libertad para este ultimo modelo.
##Modelo 6i (sus errores de ajuste no cumplen R.B)
####Modelo con errores ARMA(6,7) con phij=0 para j=1,3,4,5 y thetai=0 para i=1,2,...,6
modelo6i=Arima(lnyt2,order=c(6,0,7),fixed=c(c(0,NA,rep(0,3),NA),c(rep(0,6),NA),rep(NA,7)),
xreg=X,method="ML")
resid.ajust6i=residuals(modelo6i)
plot(fitted(modelo6i),resid.ajust6i,main="Residuales vs. ajustados modelo6i")
abline(h=0,lty=2)
plot(resid.ajust6i,main="Residuales vs. tiempo modelo6i")
abline(h=0,lty=2)
acf(as.numeric(resid.ajust6i),ci.type="ma",main="ACF modelo6i",lag.max=36)
pacf(as.numeric(resid.ajust6i),main="PACF modelo6i",lag.max=36)
##Modelo6 finalmente usado
modelo6=Arima(lnyt2,order=c(6,0,7),fixed=c(c(NA,NA,NA,0,0,NA),c(rep(0,6),NA),rep(NA,7)),
xreg=X,method="ML")
summary(modelo6)
#Calculo estadstico T0 y valores P del ajuste anterior
est=cbind(Estimacion=modelo6$coef[modelo6$coef!=0],s.e=sqrt(diag(modelo6$var.coef)))
t0=est[,1]/est[,2]
tabla
abline(h=0,lty=2)
abline(h=0,lty=2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
8.4. C

ODIGO R USADO 265
*
predic.modelo6
*
plot(yt)
C odigo R 8.11. Ajuste modelo 7i. Ajuste y pron osticos modelo 7, df=137 grados
de libertad para este ultimo.
##Modelo 7i (sus errores de ajuste no cumplen R.B)
####Modelo con errores ARMA(7,10) con phij=0 para j=2,3,4,5,6 y thetai=0 para i=1,2,...,7,9
modelo7i=Arima(lnyt2,order=c(7,0,10),fixed=c(c(NA,rep(0,5),NA),c(rep(0,7),NA,0,NA),rep(NA,7)),
xreg=X,method="ML")
resid.ajust7i=residuals(modelo7i)
plot(fitted(modelo7i),resid.ajust7i,main="Residuales vs. ajustados modelo7i")
abline(h=0,lty=2)
plot(resid.ajust7i,main="Residuales vs. tiempo modelo7i")
abline(h=0,lty=2)
acf(as.numeric(resid.ajust7i),ci.type="ma",main="ACF modelo7i",lag.max=36)
pacf(as.numeric(resid.ajust7i),main="PACF modelo7i",lag.max=36)
modelo7=Arima(lnyt2,order=c(7,0,10),fixed=c(c(NA,rep(0,5),NA),c(NA,NA,0,NA,rep(0,3),NA,0,NA),rep(NA,7)),
xreg=X,method="ML")
summary(modelo7)
#Calculo estadstico T0 y valores P del ajuste anterior
est=cbind(Estimacion=modelo7$coef[modelo7$coef!=0],s.e=sqrt(diag(modelo7$var.coef)))
t0=est[,1]/est[,2]
tabla
abline(h=0,lty=2)
abline(h=0,lty=2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
266 CAP
ITULO 8. MODELACI

*
predic.modelo7
*
plot(yt)
C odigo R 8.12. Ajuste y pron ostico con modelo 8, df=140 grados de libertad.
Note el uso del argumento seasonal para especicar en la funci on Arima() la
estructura ARMA en la parte estacional.
###Modelo con errores ARMA(1,2)x(0,1)[4]
modelo8=Arima(lnyt2,order=c(1,0,2),seasonal=list(order=c(0,0,1)),xreg=X,method="ML")
summary(modelo8)
t0=est[,1]/est[,2]
tabla
abline(h=0,lty=2)
abline(h=0,lty=2)
#Prediccion en la escala original
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
8.5. MODELACI
ON INICIAL: ESTRUCTURA EXPONENCIAL Y ERRORES R.B267

*
predic.modelo8
*
plot(yt)
C odigo R 8.13. Comparaci on gr aca de los 8 pron osticos. Tenga en cuenta
que se gracan en total 9 series incluyendo a los valores reales en los perodos
pronosticados, por esto los argumentos pch (para el smbolo de los puntos a
gracar) y col (para el color de la lneas) usados en las funciones plot() y
legend() se especican iguales a un vector con 9 entradas, una para cada
una de las columnas de la matriz guardada en el objeto de nombre p, respecti-
vamente.
#Comparando todos los pronosticos con valores reales
#Juntando en una matriz los valores reales y pronosticados
#(colocados en columnas) obteniendo un objeto de serie de tiempo multivariado
p=cbind(ytf,ytpron1,ytpron2,ytpron3,ytpron4,ytpron5,ytpron6,ytpron7,ytpron8)
p
plot(p,plot.type="single",type="b",pch=c(19,1:8),col=c(1:9),lty=1,lwd=2,ylab="Produccion",xaxt="n")
axis(1,at=time(p),labels=c("1993.Q4","1994.Q1","1994.Q2","1994.Q3"))
legend("topleft",legend=c("Serie Original","Pronostico Modelo 1","Pronostico Modelo 2",
"Pronostico Modelo 3","Pronostico Modelo 4","Pronostico Modelo 5","Pronostico Modelo 6",
"Pronostico Modelo 7","Pronostico Modelo 8"),pch=c(19,1:8),lty=1,col=c(1:9),lwd=2,bty="n")
A continuaci on se presenta la modelaci on de la misma serie de producci on
trimestral de cemento portland utilizando una estructura exponencial m as
errores ARMA
8.5. Modelaci on inicial: Estructura exponencial y errores R.B
8.5.1. Ajuste y pron ostico
El modelo exponencial con los primeros n = 151 datos de la serie (en total
son N = 155 observaciones), asumiendo que los errores son ruido blanco,
corresponde a:
Y
t
= exp(
0
+
1
t +
2
t
2
+
3
t
3
+
3
i=1
i
I
i,t
) + E
t
, E
t
RBN(0,
2
) (8.11)
La Tabla 8.44 exhibe los par ametros estimados.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
268 CAP
ITULO 8. MODELACI

Tabla 8.44: Par ametros ajustados en modelo exponencial c ubico estacional
Par ametro Estimaci on Error Est andar T
0
P(|t
144
| > |T
0
|)
0
6.2547 0.0475 131.6348 0.0000
1
0.0201 0.0021 9.6295 0.0000
2
-1.322910
4
0.0000 -4.7567 0.0000
3
3.301210
7
0.0000 2.9983 0.0032
1
-0.1431 0.0183 -7.8079 0.0000
2
-0.0296 0.0172 -1.7195 0.0877
3
0.0051 0.0169 0.3039 0.7616
Crit. de inf. con C
n
(p): AIC = 9.100153, BIC = 9.240027, df = 144
Los pron osticos para los siguientes m = 4 perodos (t = 152 a 155) se obtienen
seg un la siguiente ecuaci on:
Y
151
(L) = exp
_
6.2547 + 0.0201(151 +L) 1.3229 10
4
(151 +L)
2
+ 3.3012 10
7
(151 +L)
3
0.1431I
1,151+L
0.0296I
2,151+L
+ 0.0051I
3,151+L
]
Serie real, ajustes y pronsticos
Modelo exponencial cbico estacional
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
Ajustada
Pronsticos
Figura 8.32: Serie real, ajustada y pron osticos para la validaci on cruzada, modelo exponencial c ubico estacional
La Tabla 8.45 muestra los pron osticos puntuales y en la Tabla 8.46 se
presentan las medidas de precisi on de pron osticos (actualmente, la funci on
predict() no proporciona lmites de predicci on para un objeto nls).
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
8.5. MODELACI

Tabla 8.45: Pron osticos con Modelo exponencial c ubico estacional
Perodo
A no Q1 Q2 Q3 Q4
1993 - - - 1668.857
1994 1450.493 1629.504 1691.936 -
En la Figura 8.32 se presenta los ajustes y pron osticos con el modelo ex-
ponencial; en la Figura 8.33 se presentan los residuales estructurales y en la
Figura 8.34 su ACF y PACF y la EACF es presentada en la Tabla 8.47.
Tabla 8.46: Precisi on pron osticos Modelo exponen-
cial c ubico estacional
Medida Resultado
ME 124.55
RMSE 154.47
MAE 124.55
MPE 6.74
MAPE 6.74
8.5.2. An alisis de residuales e identicaci on ciclos
Residuos vs. t
Time
r
e
s
id
u
a
ls
(
m
o
d
e
lo
2
b
)
0 50 100 150
3
0
0
2
0
0
1
0
0
0
1
0
0
2
0
0
3
0
0
600 800 1000 1200 1400 1600
3
0
0
2
0
0
1
0
0
0
1
0
0
2
0
0
3
0
0
Residuos vs. ajustados
fitted(modelo2b)
r
e
s
id
u
a
ls
(
m
o
d
e
lo
2
b
)
Figura 8.33: Residuales en ajuste exponencial c ubico estacional
0 5 10 15 20 25 30 35
0
.
4
0
.
2
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
ACF residuales estructurales
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.
2
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
Lag
P
a
r
t
ia
l
A
C
F
PACF residuales estructurales
Figura 8.34: ACF y PACF para residuales estructurales
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
270 CAP
ITULO 8. MODELACI

Tabla 8.47: EACF con residuales estructurales,

Et
AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
0 x x x x x o o x x x x x x o o o o o o
1 x x o x x o o x o o o o o o o o o o o
2 x x o x o o o o o o o o o o o o o o o
3 o x o x o x o o o o o o o o o o o o o
4 x x o x o x o o o o o o o o o o o o o
5 x x x x o x o x o o o o o o o o o o o
6 x x x o o o o x o o o o o o o o o o o
9 o x o x o o o o o o o o o o o o o o o
10 o x x o o o o o o o o o o o o o o o o
11 x o x x x o o o o o o o o o o o o o o
12 x o x x o o o o o o o o o o o o o o o
13 x x x o o o o o o o o o o o o o o o o
14 x x x o o o o o o o o x o o o o o o o
15 x o x o o o o o o o o x o o o o o o o
16 x o o o o o o o o o o x x o o o o o o
17 x x x o o o o o o o o x o o o o o o o
18 o o x o o x o x o o o o x x o o o o o
Del an alisis de residuales es claro que los errores estructurales E
t
no son
un ruido blanco por qu e? pero seg un ACF pudieran considerarse estacionar-
ios. Los modelos ARMA identicados son los siguientes:
1. De la ACF y PACF se identica que los errores del modelo exponencial
pueden ser un AR(6) o un AR(18); sin embargo, consideraremos primero
al AR(6).
2. De la EACF se identican los siguientes modelos: ARMA(1,8) y ARMA(2,5).
3. Con la funci on auto.arima() sobre el vector de residuales estructurales
sin convertirlos en serie de tiempo, y el criterio del AIC, se identica un
ARMA(2,2) como muestra la Tabla 8.48.
4. Con la funci on auto.arima() sobre el vector de residuales estructurales
convertidos en serie de tiempo, y el criterio del AIC, se identica un SAR-
MA(1,2)(0,1)[4] como muestra la Tabla 8.52.
5. Con la funci on armasubsets(), (ver Figura 8.35) se identican inicial-
mente en la primera la superior un ARMA(6,7) con
j
= 0 para j = 2, 6
y
i
= 0, para i = 7 y en la segunda la superior tambi en un ARMA(6,7)
pero con
j
= 0 para j = 2, 6 y
i
= 0, para i = 6, 7. Estos dos modelos son
modicados como se indica en las Tablas 8.53 y 8.54 de forma tal que
fuese satisfecho el supuesto de ruido blanco sobre los errores de ajuste
a
t
.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
8.5. MODELACI

B
I
C
(
I
n
t
e
r
c
e
p
t
)
A
R
l
a
g
1
A
R
l
a
g
2
A
R
l
a
g
3
A
R
l
a
g
4
A
R
l
a
g
5
A
R
l
a
g
6
A
R
l
a
g
7
A
R
l
a
g
8
A
R
l
a
g
9
A
R
l
a
g
1
0
A
R
l
a
g
1
1
A
R
l
a
g
1
2
e
r
r
o
r
l
a
g
7
e
r
r
o
r
l
a
g
8
e
r
r
o
r
l
a
g
9
e
r
r
o
r
l
a
g
1
0
e
r
r
o
r
l
a
g
1
1
e
r
r
o
r
l
a
g
1
2
e
r
r
o
r
l
a
g
1
e
r
r
o
r
l
a
g
2
e
r
r
o
r
l
a
g
3
e
r
r
o
r
l
a
g
4
e
r
r
o
r
l
a
g
5
e
r
r
o
r
l
a
g
6
140
140
140
140
140
150
150
150
160
Figura 8.35: Resultado de la funci on armasubsets sobre

Et en modelo exponencial c ubico estacional
8.5.3. Ajuste de los ciclos
A diferencia de los modelos de estructuras lineales donde es posible ajustar
simult aneamente la estructura y los ciclos ARMA con la funci on Arima() de la
librera forecast, en el caso exponencial procederemos ajustando separada-
mente los ciclos que luego ser an sumados a la estructura exponencial estima-
da
1
. De igual manera se proceder a para obtener los pron osticos de la serie. En
la Tabla 8.48 observamos el modelo ajustado ARMA(2,2) sobre los residuales
estructurales

E
t
= Y
t
exp [6.2547 + 0.0201t 1.3229 10
4
t
2
+ 3.3012 10
7
t
3
0.1431I
1,t
0.0296I
2,t
+ 0.0051I
3,t
]. En la Figura 8.36, se muestran los gr acos
de los residuales del ajuste resultante a
t
y su gr aco de probabilidad normal.
Tabla 8.48: Resultados de auto.arima() sobre

E sin convertirlos en serie de tiempo
Par ametro Estimaci on s.e Z
0
* P(|Z| > |Z
0
|)**
1
0.1885 0.1444 1.3052 0.1918
2
0.4789 0.1269 3.7742 0.0002
1
0.5615 0.1538 3.6505 0.0003
2
0.2594 0.1007 2.5763 0.0100
*Calculado manualmente, Z
0
= Estimacion/s.e
**Calculado manualmente, P(|Z| > |Z
0
|) = P(Z > |Z
0
|) + P(Z < |Z
0
|)
1
Si bien en R se dispone de la funci on gnls() de la librera nlme, con la cual se pueden
ajustar modelos de regresi on no lineal con errores ARMA, esta funci on es num ericamente
inestable, es decir, presenta com unmente problemas de convergencia.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
272 CAP
ITULO 8. MODELACI

Time
r
e
s
id
u
a
ls
(
m
c
ic
lo
s
1
)
0 50 100 150
1
0
0
0
1
0
0
2
0
0
200 100 0 100 200 300
1
0
0
0
1
0
0
2
0
0
as.numeric(hatciclos1)
r
e
s
id
u
a
ls
(
m
c
ic
lo
s
1
)
0 5 10 15 20 25 30 35
0
.2
0
.1
0
.0
0
.1
0
.2
Series residuals(mciclos1)
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.2
0
.1
0
.0
0
.1
Lag
P
a
r
tia
l A
C
F
2 1 0 1 2
1
0
0
0
1
0
0
2
0
0
Normal QQ Plot
S
a
m
p
l
e

Q
u
a
n
t
i
l
e
s
Estadstico W
0.9567
Valor P
1e04
Figura 8.36: Residuales de ajuste del ARMA(2,2) ajustado a los residuos estructurales del modelo exponencial
En la Tabla 8.49 se presentan los par ametros ajustados del modelo AR(6)
ajustado a los residuos estructurales del modelo exponencial estacional. En
la Figura 8.37 pueden observarse los gr acos de residuales y de normalidad,
para los residuos de ajuste resultantes.
Tabla 8.49: Resultados AR(6)
0
* P(|Z| > |Z
0
|)**
1
0.6494 0.0784 8.2876 0.0000
2
0.3558 0.0944 3.7675 0.0002
3
-0.2366 0.0998 -2.3711 0.0177
4
0.1802 0.0989 1.8217 0.0685
5
-0.0365 0.0957 -0.3815 0.7028
6
-0.2401 0.0791 -3.0355 0.0024
0
= Estimacion/s.e
0
|) = P(Z > |Z
0
|) + P(Z < |Z
0
|)
En la Tabla 8.50 se exhiben los par ametros estimados del modelo AR-
MA(1,8) ajustado a los residuos estructurales. En la Figura 8.38 los respec-
tivos residuales de ajuste.
Tabla 8.50: Resultados ARMA(1,8)
0
* P(|Z| > |Z
0
|)**
1
0.4453 0.9173 0.4854 0.6274
1
0.2410 0.9198 0.2620 0.7933
2
0.5511 0.6297 0.8752 0.3815
3
0.2236 0.7810 0.2863 0.7746
4
0.5007 0.5503 0.9099 0.3629
5
0.2526 0.6890 0.3667 0.7139
6
0.0679 0.5328 0.1274 0.8987
7
0.0272 0.2922 0.0931 0.9258
8
-0.0428 0.1709 -0.2504 0.8023
0
= Estimacion/s.e
0
|) = P(Z > |Z
0
|) + P(Z < |Z
0
|)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
8.5. MODELACI

Time
r
e
s
id
u
a
ls
(
m
c
ic
lo
s
2
)
0 50 100 150
1
5
0
5
0
0
5
0
1
0
0
1
5
0
2
0
0
200 100 0 100 200
1
5
0
5
0
0
5
0
1
0
0
1
5
0
2
0
0
fitted(mciclos2)
r
e
s
id
u
a
ls
(
m
c
ic
lo
s
2
)
0 5 10 15 20 25 30 35
0
.1
5
0
.0
5
0
.0
5
0
.1
5
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.1
5
0
.0
5
0
.0
5
0
.1
0
0
.1
5
Lag
P
a
r
tia
l A
C
F
2 1 0 1 2
1
5
0
1
0
0
5
0
0
5
0
1
0
0
1
5
0
2
0
0
Normal QQ Plot
S
a
m
p
l
e

Q
u
a
n
t
i
l
e
s
Estadstico W
0.9583
Valor P
2e04
Figura 8.37: Residuales de ajuste del AR(6) ajustado a los residuos estructurales del modelo exponencial
Time
r
e
s
id
u
a
ls
(
m
c
ic
lo
s
3
)
0 50 100 150
1
5
0
5
0
0
5
0
1
0
0
1
5
0
2
0
0
200 100 0 100 200 300
1
5
0
5
0
0
5
0
1
0
0
1
5
0
2
0
0
fitted(mciclos3)
r
e
s
id
u
a
ls
(
m
c
ic
lo
s
3
)
0 5 10 15 20 25 30 35
0
.1
0
.0
0
.1
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.1
5
0
.0
5
0
.0
5
0
.1
0
0
.1
5
Lag
P
a
r
tia
l A
C
F
2 1 0 1 2
1
5
0
1
0
0
5
0
0
5
0
1
0
0
1
5
0
2
0
0
Normal QQ Plot
S
a
m
p
l
e

Q
u
a
n
t
i
l
e
s
Estadstico W
0.9515
Valor P
0
En la Tabla 8.51 se exhiben los par ametros estimados del modelo AR-
MA(2,5) ajustado a los residuales estructurales del modelo exponencial. La
Figura 8.39 presenta los correspondientes residuales de ajuste.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
274 CAP
ITULO 8. MODELACI

0
* P(|Z| > |Z
0
|)
1
1.7150 0.0738 23.2498 0.0000
2
-0.7579 0.0724 -10.4639 0.0000
1
-1.1234 0.0907 -12.3921 0.0000
2
0.4845 0.1174 4.1281 0.0000
3
-0.3981 0.1262 -3.1557 0.0016
4
0.4417 0.1183 3.7326 0.0002
5
-0.4046 0.0864 -4.6822 0.0000
0
= Estimacion/s.e
0
|) = P(Z > |Z
0
|) + P(Z < |Z
0
|)
Time
r
e
s
id
u
a
ls
(
m
c
ic
lo
s
4
)
0 50 100 150
1
5
0
5
0
0
5
0
1
0
0
1
5
0
200 100 0 100 200
1
5
0
5
0
0
5
0
1
0
0
1
5
0
fitted(mciclos4)
r
e
s
id
u
a
ls
(
m
c
ic
lo
s
4
)
0 5 10 15 20 25 30 35
0
.1
5
0
.0
5
0
.0
5
0
.1
5
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.1
5
0
.0
5
0
.0
5
0
.1
0
0
.1
5
Lag
P
a
r
tia
l A
C
F
2 1 0 1 2
1
5
0
1
0
0
5
0
0
5
0
1
0
0
1
5
0
Normal QQ Plot
S
a
m
p
l
e

Q
u
a
n
t
i
l
e
s
Estadstico W
0.9583
Valor P
0.00016
En la Tabla 8.52 se exhiben los par ametros estimados del modelo SAR-
MA(1,2)(0,1)[4] , ajustado a los residuales estructurales del modelo exponen-
cial. La Figura 8.40 presenta los correspondientes residuales de ajuste.
Tabla 8.52: Resultados SARMA(1,2)(0,1)[4], identicado con auto.arima() sobre
los residuos estructurales convertidos en serie de tiempo
0
* P(|Z| > |Z
0
|)
1
0.6588 0.0977 6.7446 0.0000
1
0.0361 0.1135 0.3182 0.7503
2
0.3819 0.0946 4.0359 0.0001
1
0.3715 0.0841 4.4153 0.0000
0
= Estimacion/s.e
0
|) = P(Z > |Z
0
|) + P(Z < |Z
0
|)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
8.5. MODELACI

Time
r
e
s
id
u
a
ls
(
m
c
ic
lo
s
5
)
1960 1970 1980 1990
1
0
0
0
1
0
0
2
0
0
200 100 0 100 200 300
1
0
0
0
1
0
0
2
0
0
r
e
s
id
u
a
ls
(
m
c
ic
lo
s
5
)
0 5 10 15 20 25 30 35
0
.2
0
.1
0
.0
0
.1
0
.2
Series as.numeric(residuals(mciclos5))
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.2
0
0
.1
0
0
.0
0
0
.1
0
Lag
P
a
r
tia
l A
C
F
Series as.numeric(residuals(mciclos5))
2 1 0 1 2
1
0
0
0
1
0
0
2
0
0
Normal QQ Plot
S
a
m
p
l
e

Q
u
a
n
t
i
l
e
s
Estadstico W
0.9584
Valor P
2e04
Figura 8.40: Residuales de ajuste del SARMA(1,2)(0,1)[4] ajustado a los residuos estructurales del modelo exponencial
En la Figura 8.41 se muestran los residuales del modelo ARMA(6,7) ini-
cialmente identicado en la primera la de la Figura 8.35, es decir, E
t
=
2
E
t2
+
6
E
t6
+ a
t
+
7
a
t7
,a
t
R.B N(0,
2
a
), como puede verse, no se cumple
el supuesto de ruido blanco sobre a
t
, por lo que se modic o este modelo de la
siguiente manera, E
t
=
2
E
t2
+
6
E
t6
+ a
t
+
1
a
t1
+
7
a
t7
, a
t
R.B N(0,
2
a
).
En la Tabla 8.53 se exhiben los par ametros estimados del modelo ARMA(6,7)
a
que corresponde a la versi on modicada del primer modelo identicado en la
Figura 8.35, ajustado a los residuales estructurales del modelo exponencial.
La Figura 8.42 presenta los correspondientes residuales de ajuste.
a
0
* P(|Z| > |Z
0
|)
2
0.8222 0.0640 12.8393 0.0000
6
-0.3131 0.0603 -5.1919 0.0000
1
0.6797 0.0713 9.5310 0.0000
7
-0.0897 0.0675 -1.3289 0.1839
0
= Estimacion/s.e
0
|) = P(Z > |Z
0
|) + P(Z < |Z
0
|)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
276 CAP
ITULO 8. MODELACI

Time
r
e
s
id
u
a
ls
(
m
c
ic
lo
s
6
i)
0 50 100 150
2
0
0
1
0
0
0
1
0
0
2
0
0
300 200 100 0 100 200
2
0
0
1
0
0
0
1
0
0
2
0
0
as.numeric(fitted(mciclos6i))
r
e
s
id
u
a
ls
(
m
c
ic
lo
s
6
i)
0 5 10 15 20 25 30 35
0
.2
0
.1
0
.0
0
.1
0
.2
0
.3
0
.4
Series residuals(mciclos6i)
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.2
0
.0
0
.1
0
.2
0
.3
0
.4
Lag
P
a
r
tia
l A
C
F
Figura 8.41: Residuales de ajuste del ARMA(6,7): Et =
2
E
t2
+
6
E
t6
+at +
7
a
t7
, ajustado a los residuos estruc-
turales del modelo exponencial
Time
r
e
s
id
u
a
ls
(
m
c
ic
lo
s
6
)
0 50 100 150
1
5
0
5
0
0
5
0
1
0
0
1
5
0
2
0
0
200 100 0 100 200
1
5
0
5
0
0
5
0
1
0
0
1
5
0
2
0
0
r
e
s
id
u
a
ls
(
m
c
ic
lo
s
6
)
0 5 10 15 20 25 30 35
0
.1
5
0
.0
5
0
.0
5
0
.1
5
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.1
5
0
.0
5
0
.0
5
0
.1
0
0
.1
5
Lag
P
a
r
tia
l A
C
F
2 1 0 1 2
1
5
0
1
0
0
5
0
0
5
0
1
0
0
1
5
0
2
0
0
Normal QQ Plot
S
a
m
p
l
e

Q
u
a
n
t
i
l
e
s
Estadstico W
0.9578
Valor P
1e04
Figura 8.42: Residuales de ajuste del ARMA(6,7)
a
ajustado a los residuos estructurales del modelo exponencial
En la Figura 8.43 se presentan los residuos de ajuste del segundo modelo
ARMA(6,7) identicado en la la 2 de la Figura 8.35, es decir, el modelo E
t
=
2
E
t2
+
6
E
t6
+ a
t
+
6
a
t6
+
7
a
t7
, a
t
R.B N(0,
2
a
). Como puede observarse,
para este modelo no es v alido el supuesto de ruido blanco sobre sus errores
de ajuste a
t
. Por esta raz on, se modic o tal modelo de la siguiente manera:
E
t
=
2
E
t2
+
6
E
t6
+a
t
+
1
a
t1
+
6
a
t6
+
7
a
t7
, a
t
R.B N(0,
2
a
). En la Tabla 8.54
se presentan los par ametros estimados de este ultimo modelo ARMA(6,7)
b
. La
Figura 8.44 presenta los residuales de ajuste correspondientes.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
8.5. MODELACI

b
0
* P(|Z| > |Z
0
|)
2
0.8401 0.0693 12.1283 0.0000
6
-0.2775 0.0797 -3.4817 0.0005
1
0.6836 0.0706 9.6764 0.0000
6
-0.0933 0.1318 -0.7077 0.4791
7
-0.1399 0.0979 -1.4296 0.1528
0
= Estimacion/s.e
0
|) = P(Z > |Z
0
|) + P(Z < |Z
0
|)
Time
r
e
s
id
u
a
ls
(
m
c
ic
lo
s
7
i)
0 50 100 150
2
0
0
1
0
0
0
1
0
0
2
0
0
300 200 100 0 100 200
2
0
0
1
0
0
0
1
0
0
2
0
0
as.numeric(fitted(mciclos7i))
r
e
s
id
u
a
ls
(
m
c
ic
lo
s
7
i)
0 5 10 15 20 25 30 35
0
.2
0
.1
0
.0
0
.1
0
.2
0
.3
0
.4
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.2
0
.0
0
.1
0
.2
0
.3
0
.4
Lag
P
a
r
tia
l A
C
F
Figura 8.43: Residuales de ajuste del ARMA(6,7): Et =
2
E
t2
+
6
E
t6
+ at +
6
a
t6
+
7
a
t7
,at R.B N(0,
2
a
),
Time
r
e
s
id
u
a
ls
(
m
c
ic
lo
s
7
)
0 50 100 150
1
5
0
5
0
0
5
0
1
0
0
1
5
0
2
0
0
200 100 0 100 200
1
5
0
5
0
0
5
0
1
0
0
1
5
0
2
0
0
r
e
s
id
u
a
ls
(
m
c
ic
lo
s
7
)
0 5 10 15 20 25 30 35
0
.1
5
0
.0
5
0
.0
5
0
.1
5
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.1
5
0
.0
5
0
.0
5
0
.1
0
0
.1
5
Lag
P
a
r
tia
l A
C
F
2 1 0 1 2
1
5
0
1
0
0
5
0
0
5
0
1
0
0
1
5
0
2
0
0
Normal QQ Plot
S
a
m
p
l
e

Q
u
a
n
t
i
l
e
s
Estadstico W
0.9567
Valor P
1e04
Figura 8.44: Residuales de ajuste del ARMA(6,7)
b
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
278 CAP
ITULO 8. MODELACI

8.6. Ajuste y pron ostico aproximado de Y
t
Los ajustes para la serie, se hallan como
Y
t
= (Ajuste estructura)
t
+ (Ajuste ciclos ARMA)
t
donde el ajuste de la estructura es
(Ajuste estructura)
t
= exp
_
6.2547 + 0.0201t 1.3229 10
4
t
2
+ 3.3012 10
7
t
3
0.1431I
1,t
0.0296I
2,t
+ 0.0051I
3,t
]
es decir, el ajuste del modelo exponencial. Los ajustes para los ciclos AR-
MA(p,q) son de acuerdo al modelo ARMA(p,q) ajustado sobre el residuo es-
tructural

E
t
:
E
t
=

1

E
t1
+

2

E
t2
+ +

p

E
tp
+

1
a
t1
+

2
a
t2
+ +

q
a
tq
de modo que se cumple que los residuos de ajuste son a
t
= Y
t

Y
t
=

E
t
E
t
.
En las Figuras 8.45 y 8.46 se presentan la serie real y sus ajustes de los
modelos con parte estructural exponencial m as los ciclos ARMA correspondi-
entes a los casos ajustados a los residuales estructurales. Para estos ajustes
no tenemos c omo medir globalmente los errores est andar de los estimadores
ya que no se realiza una estimaci on conjunta de la estructura y los ciclos.
Pero podemos calcular de manera aproximada el AIC y el BIC, usando las
ecuaciones
AIC log
_
1
n
n
t=1
a
2
t
_
+ 2k/n
BIC log
_
1
n
n
t=1
a
2
t
_
+ k log(n)/n
donde k es el n umero total de par ametros estimados entre estructura y ci-
clos y a
t
son los residuales del ajuste en cada modelo de los ciclos ARMA
ajustados sobre los residuales estructurales

E
t
del modelo exponencial inicial.
Estas mismas f ormulas pueden utilizarse tambi en usando los residuales es-
tructurales del modelo exponencial estacional inicial (es decir, usando

E
t
en
lugar de a
t
), para obtener para este ultimo el AIC y BIC aproximados, siendo k
igual n umero de par ametros del modelo exponencial. La Tabla 8.55 presenta
los resultados de estas medidas.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
8.6. AJUSTE Y PRON

OSTICO APROXIMADO DE Y
T
279
Serie real, ajustes
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
Estructura + ciclos ARMA(2,2)
pronosticado
Serie real, ajustes
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
Estructura + ciclos AR(6)
Pronosticado
Serie real, ajustes
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
AEstructura + ciclos ARMA(1,8)
Pronosticado
Serie real, ajustes
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
Estructura + ciclos ARMA(2,5)
Pronosticado
Figura 8.45: Comparaci on de serie real y sus ajustes mediante los modelos que intengran la estimaci on estructural
exponencial m as los ciclos ARMA identicados para los residuales estructurales del modelo exponencial
Tabla 8.55: Criterios de informaci on calculados, aproximados por C
n
(k)
Criterio Estructura Estructura Estructura Estructura Estructura Estructura Estructura Estructura
+ARMA(2,2) +AR(6) +ARMA(1,8) +ARMA(2,5) +SARMA(1,2)(0,1)[4] +ARMA(6,7)a +ARMA(6,7)b
AIC 9.10 7.95 7.86 7.90 7.81 7.89 7.83 7.84
BIC 9.24 8.17 8.12 8.22 8.09 8.11 8.05 8.08
Los pron osticos L perodos adelante de n = 151 se calculan como
Y
151
(L) = (Pron ostico estructura)
151
(L) + (Pron ostico ciclos ARMA)
151
(L)
donde el pron ostico de la estructura es
(Pron ostico estructura)
151
(L) = exp
_
6.2547 + 0.0201(151 +L) 1.3229 10
4
(151 +L)
2
+3.3012 10
7
(151 +L)
3
0.1431I
1,151+L
0.0296I
2,151+L
+ 0.0051I
3,151+L
es decir, los pron osticos del modelo exponencial.

E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
280 CAP
ITULO 8. MODELACI

Serie real, ajustes
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
Estructura + ciclos SARMA(1,2)(0,1)[4]
Pronosticado
Serie real, ajustes
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
Estructura + ciclos ARMA(6,7)a
Pronosticado
Serie real, ajustes
Time
y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Original
Estructura + ciclos ARMA(6,7)b
Pronosticado
Figura 8.46: Comparaci on de serie real y sus ajustes mediante los modelos que intengran la estimaci on estructural
exponencial m as los ciclos ARMA identicados para los residuales estructurales del modelo exponencial
(Cont.)
Los pron ostico para los ciclos ARMA(p,q) se realizan con los modelos ajus-
tados a los residuos estructurales:
E
151
(L) =

1

E
151
(L 1) +

2

E
151
(L 2) + +

p

E
151
(L p)
+

1
a
151
(L 1) +

2
a
151
(L 2) + +

q
a
151
(L q)
Los pron osticos para los trimestre 1993-Q4 a 1994Q3, se presentan en la
Tabla 8.56 y las medidas de precisi on de los pron osticos en la Tabla 8.57. Note
que los pron osticos estructura m as ciclos AR(6) son los m as pr oximos a los
valores reales seguidos de los pron osticos estructura m as ciclos ARMA(6,7)a,
aunque todos los pron osticos subestiman los valores reales. En la Figura 8.47
puede observarse con m as claridad lo que ocurre en cuanto a los pron osticos
puntuales.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
8.6. AJUSTE Y PRON

OSTICO APROXIMADO DE Y
T
281
Tabla 8.56: Predicciones en miles de toneladas
1993.Q4 1994.Q1 1994.Q2 1994.Q3
Real 1777 1468 1732 1962
Estructura 1668.857 1450.493 1629.504 1691.936
Estructura+ARMA(2,2) 1619.683 1425.202 1601.187 1674.486
Estructura+AR(6) 1645.965 1470.623 1651.707 1712.287
Estructura+ARMA(1,8) 1621.304 1435.367 1602.182 1654.960
Estructura+ARMA(2,5) 1623.773 1444.994 1606.944 1667.228
Estructura+SARMA(1,2)(0,1)[4] 1626.864 1446.181 1601.858 1679.003
Estructura+ARMA(6,7)a 1637.283 1463.777 1631.607 1700.717
Estructura+ARMA(6,7)b 1632.509 1459.207 1628.023 1692.970
Tabla 8.57: Precisi on de los pron osticos estructurales+ciclos ARMA
Modelo ME RMSE MAE MPE MAPE
Estructura 124.55 154.47 124.55 6.74 6.74
Estructura+ARMA(2,2) 154.61 177.73 154.61 8.49 8.49
Estructura+AR(8) 114.60 146.61 115.92 6.14 6.23
Estructura+ARMA(1,8) 156.30 184.68 156.30 8.53 8.53
Estructura+ARMA(2,5) 149.02 177.86 149.02 8.11 8.11
Estructura+SARMA(1,2)(0,1)[4] 146.27 173.23 146.27 7.97 7.97
Estructura+ARMA(6,7)a 126.40 156.43 126.40 6.82 6.82
Estructura+ARMA(6,7)b 131.57 161.36 131.57 7.11 7.11
Time
P
r
o
d
u
c
c
i
n
1
4
0
0
1
5
0
0
1
6
0
0
1
7
0
0
1
8
0
0
1
9
0
0
2
0
0
0
1993.Q4 1994.Q1 1994.Q2 1994.Q3
Serie Original
Pron. sin ciclos
Estructura+ARMA(2,2)
Estructura+AR(6)
Estructura+SARMA(1,2)(0,1)[4]
Estructura+ARMA(6,7)a
Estructura+ARMA(6,7)b
Figura 8.47: Comparaci on de serie real y sus pron osticos, para el modelo exponencial sin y con los ciclos ARMA
identicados para los residuales estructurales del modelo exponencial inicial
Cu al modelo con estructura exponencial se elige para el ajuste y pron osti-
co de la serie? Por qu e?
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
282 CAP
ITULO 8. MODELACI

8.7. Codigo R usado
A continuaci on se presenta la programaci on R empleada. Tenga en cuenta
que con la funci on Arima() no es posible estimar conjuntamente la estruc-
tura exponencial y los ciclos, por ello, se recurre a la estimaci on separada
de la estructura con la funci on nls() y de los ciclos con funci on Arima()
aplicada sobre los residuales estructurales del modelo exponencial, que en la
programaci on han sido guardados bajo el nombre et1 (sin formato de serie de
tiempo) y como Et1 (con formato de serie de tiempo). Los ajuste de los ciclos
deben sumarse a los de la estructura y de igual forma, los pron osticos de los
ciclos (obtenidos con la funci on forecast()) se suman a los pron osticos de la
estructura (obtenidos con la funci on predict()).
Nota 1: Adem as de las funciones R usadas en este ejemplo para identicar
los modelos ARMA tambi en puede usarse cualquier otra funci on de identi-
caci on autom atica disponible en diferentes libreras.
NOTA 2: Tambi en se pueden construir las ACF y PACF esperadas bajo los
distintos modelos de ciclos identicados sobre los residuos estructurales, us-
ando en la funci on ARMAacf() de la librera TSA los valores estimados de los
par ametros de los respectivos modelos ARMA identicados.
Vea Taller Modelaci on de una serie multiplicativa con errores ARMA: Serie Pro-
ducci on trimestral Cemento Portland.
C odigo R 8.14. Cargando libreras y deniendo funciones de usuario.
library(TSA)
library(forecast)
#Funcion para el calculo de AIC y BIC aproximados para modelo exponencial sin ciclos
crit.inf=function(modelo,AIC="TRUE"){
n.par=length(coef(modelo))
residuales=residuals(modelo)
if(AIC=="TRUE"){
#Calcula AIC
CI=log(mean(residuales2))+2
*
n.par/length(residuales)
}
if(AIC=="FALSE"){
#Calcula BIC
CI=log(mean(residuales2))+n.par
*
log(length(residuales))/length(residuales)
}
CI
}
#Funcion para el calculo de AIC y BIC aproximados para modelos combinados
AIC.aprox=function(modeloarma,n1=n,npar.estruct=pestruct){
k=length(coef(modeloarma))+npar.estruct
aic=log(mean(residuals(modeloarma)2))+2
*
k/n1
aic
}
BIC.aprox=function(modeloarma,n1=n,npar.estruct=pestruct){
k=length(coef(modeloarma))+npar.estruct
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
8.7. CODIGO R USADO 283
bic=log(mean(residuals(modeloarma)2))+k
*
log(n1)/n1
bic
}
C odigo R 8.15. Lectura de los datos, gr acas descriptivas y denici on de vari-
ables para el ajuste y los pron osticos
yt=scan()
465 532 561 570 529 604 603 582 554 620 646
637 573 673 690 681 621 698 753 728 688 737
782 692 637 757 783 757 674 734 835 838 797
904 949 975 902 974 969 967 849 961 966 922
836 998 1025 971 892 973 1047 1017 948 1032
1190 1136 1049 1134 1229 1188 1058 1209 1199
1253 1070 1282 1303 1281 1148 1305 1342 1452
1184 1352 1316 1353 1121 1297 1318 1281 1109
1299 1341 1290 1101 1284 1321 1317 1122 1261
1312 1298 1202 1302 1377 1359 1232 1386 1440
1439 1282 1573 1533 1651 1347 1575 1475 1357
1086 1158 1279 1313 1166 1373 1456 1496 1251
1456 1631 1554 1347 1516 1546 1564 1333 1458
1499 1613 1416 1625 1770 1791 1622 1719 1972
1893 1575 1644 1658 1668 1343 1441 1444 1497
1267 1501 1538 1569 1450 1569 1648 1777 1468
1732 1962
yt=ts(yt,frequency=4,start=c(1956,1)) #serie con todas las observaciones
s=4 #longitud estacionalidad
m=4 #Numero de perodos a pronosticar dentro de la muestra
n=length(yt)-m #tamano de la muestra para el ajuste
yt2=ts(yt[1:n],frequency=4,start=c(1956,1)) #serie con las primeras n observaciones
lnyt2=log(yt2)
t=1:n #ndice de tiempo
t2=t2
t3=t3
#DEFINIENDO INDICADORAS PARA ESTACIONALIDAD
trimestre=seasonaldummy(yt2) #observe que se usa funcion seasonaldummy()
Q1=trimestre[,1]
Q2=trimestre[,2]
Q3=trimestre[,3]
#valores variables para los pronosticos
tnuevo=c((n+1):(n+m)) #definiendo valor de t para las m observaciones a pronosticas
t2nuevo=tnuevo2
t3nuevo=tnuevo3
ytf=ts(yt[tnuevo],frequency=4,start=c(1993,4)) #Tomando de la serie completa los ultimos m valores
#que son pronosticados
trimestrenuevo=seasonaldummyf(yt2,h=m)
Q1nuevo=trimestrenuevo[,1]
C odigo R 8.16. Ajuste y pron osticos del modelo 1: Modelo exponencial suponien-
do errores estructurales R.B.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
284 CAP
ITULO 8. MODELACI

#AJUSTANDO MODELO LOG C
UBICO ESTACIONAL CON LOS n PRIMEROS DATOS

modelo.aux=lm(lnyt2t+t2+t3+Q1+Q2+Q3)
#AJUSTANDO MODELO EXPONENCIAL USANDO COMO VALORES INICIALES
#PAR
AMETROS AJUSTADOS DEL MODELO ANTERIOR, SON SIETE EN TOTAL CON beta0
coef0=coef(modelo.aux) #extrae coeficientes ajustados del modelo auxiliar
modelo1=nls(yt2exp(beta0+beta1
*
t+beta2
*
t2+beta3
*
t3+delta1
*
Q1+delta2
*
Q2+delta3
*
Q3),
start=list(beta0=coef0[[1]],beta1=coef0[[2]],beta2=coef0[[3]],beta3=coef0[[4]],delta1=coef0[[5]],
delta2=coef0[[6]],delta3=coef0[[7]]))
summary(modelo1)
#Valores ajustados estructura
ythat.estruct=ts(fitted(modelo1),frequency=4,start=c(1956,1))
#Residuos estructurales
et1=residuals(modelo1)
#Residuales estructurales convertidos en serie de tiempo
Et1=ts(et1,frequency=4,start=c(1956,1))
#GR
AFICOS DE RESIDUALES
plot.ts(et1,main="Residuos vs. t\nModelo exponencial cubico estacional")
abline(h=0,col=2)
plot(ythat.estruct,et1,main="Residuos vs. ajustados\nModelo exponencial cubico estacional")
abline(h=0,col=2)
#PRON
OSTICOS
#Pronostico estructura sola
pred.estruct=predict(modelo1,newdata=data.frame(t=tnuevo,t2=t2nuevo,t3=t3nuevo,Q1=Q1nuevo,
Q2=Q2nuevo,Q3=Q3nuevo),interval="prediction")
pred.estruct=ts(pred.estruct,frequency=4,start=c(1993,4))
#Precision de pronostico con solo la estructura
accuracy(pred.estruct,ytf)
plot(yt,main="Serie real, ajustes\nModelo exponencial cubico estacional")
lines(ythat.estruct,col=2)
lines(pred.estruct,col=4)
legend("topleft",legend=c("Original","Ajustada","Pronosticos"),col=c(1,2,4),lty=1)
C odigo R 8.17. An alisis de supuesto de R.B e identicaci on de posibles mode-
los para los ciclos, mediante funciones ACF, PACF y EACF muestrales aplicadas
a los residuales estructurales

E
t
y uso de la funci on R armasubsets().
acf(et1,ci.type="ma",lag.max=36,main="ACF residuales estructurales")
pacf(et1,lag.max=36,main="PACF residuales estructurales")
eacf(et1,ar.max=18,ma.max=18) #identifica ARMA(1,8), ARMA(2,5)
plot(armasubsets(et1,nar=12,nma=12,y.name=AR,ar.method=ml)) #Identifica dos ARMA(6,7) con algunos
#coeficientes fijos en cero
A continuaci on se presentan los modelos ajustados para los ciclos que
quedan en los residuales estructurales del modelo exponencial. Observe que
para la validaci on de supuestos se consideran ahora a los errores de ajuste a
t
y por tanto se analizan los residuales a
t
resultantes en los ajustes de los ciclos
ARMA.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
C odigo R 8.18. Identicaci on autom atica con funci on auto.arima() usando
criterio del AIC sobre los residuos estructurales sin convertirlos en serie de tiem-
po. Ajustes para los ciclos con el modelo resultante guardado en mciclos1.
#Identificacion y ajuste automatico con auto.arima
mciclos1=auto.arima(et1,ic="aic") #identifica un ARMA(2,2)
summary(mciclos1)
#Completacion tabla parametros estimados para mciclos1
est=cbind(Estimacion=mciclos1$coef,s.e=sqrt(diag(mciclos1$var.coef)))
z0=est[,1]/est[,2]
vp=pnorm(abs(z0),lower.tail=FALSE)+pnorm(-abs(z0))
tabla=cbind(est,z0,vp)
tabla
hatciclos1=ts(fitted(mciclos1),freq=4,start=c(1956,1))
layout(rbind(c(1,1,2,2),c(3,3,4,4)))
plot.ts(residuals(mciclos1))
abline(h=0,col=2)
plot(as.numeric(hatciclos1),residuals(mciclos1))
abline(h=0,col=2)
acf(residuals(mciclos1),ci.type="ma",lag.max=36)
pacf(residuals(mciclos1),lag.max=36)
test=shapiro.test(residuals(mciclos1)) #Test de normalidad sobre residuales de ajuste
#Grafico de normalidad con informacion del test Shapiro
qqnorm(residuals(mciclos1),cex=1.5)
qqline(residuals(mciclos1),lty=2,lwd=2,col=2)
legend("topleft",legend=c("Estadstico W",round(test$statistic,digits=4),"Valor P",
round(test$p.value,digits=4)),cex=0.8,ncol=2)
C odigo R 8.19. Ajuste de ciclos AR(6) sobre residuos estructurales

E
t
. Objeto R
que guarda el modelo ajustado es mciclos2.
#Ajuste ciclos AR(6)
mciclos2=Arima(et1,order=c(6,0,0),include.mean=F)
summary(mciclos2)
#Completacion tabla parametros estimados
z0=est[,1]/est[,2]
tabla
layout(rbind(c(1,1,2,2),c(3,3,4,4)))
abline(h=0,col=2)
plot(fitted(mciclos2),residuals(mciclos2))
abline(h=0,col=2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
286 CAP
ITULO 8. MODELACI

C odigo R 8.20. Ajuste de ciclos ARMA(1,8) sobre residuos estructurales

E
t
.
Objeto R que guarda el modelo ajustado es mciclos3.
#Ajuste ciclos ARMA(1,8)
summary(mciclos3)
z0=est[,1]/est[,2]
tabla
layout(rbind(c(1,1,2,2),c(3,3,4,4)))
abline(h=0,col=2)
abline(h=0,col=2)
C odigo R 8.21. Ajuste de ciclos ARMA(2,5) sobre residuos estructurales

E
t
.
#Ajuste ciclos ARMA(2,5)
summary(mciclos4)
z0=est[,1]/est[,2]
tabla=cbind(est,z0,vp);tabla
layout(rbind(c(1,1,2,2),c(3,3,4,4)))
abline(h=0,col=2)
abline(h=0,col=2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
C odigo R 8.22. Ajuste de ciclos SARMA(1,2)(0,1)[4] sobre residuos estructurales
E
t
. Objeto R que guarda el modelo ajustado es mciclos5.
mciclos5=auto.arima(Et1,ic="aic")
summary(mciclos5)
z0=est[,1]/est[,2]
tabla
layout(rbind(c(1,1,2,2),c(3,3,4,4)))
abline(h=0,col=2)
abline(h=0,col=2)
acf(as.numeric(residuals(mciclos5)),ci.type="ma",lag.max=36)
pacf(as.numeric(residuals(mciclos5)),lag.max=36)
C odigo R 8.23. Ajuste de ciclos ARMA(6,7)a sobre residuos estructurales

E
t
.
#Ajuste primer modelo identificado con armasubsets. Este modelos es modificado en mciclos6
mciclos6i=Arima(et1,order=c(6,0,7),fixed=c(c(0,NA,rep(0,3),NA),c(rep(0,6),NA)),
include.mean=F,method="ML")
layout(rbind(c(1,1,2,2),c(3,3,4,4)))
plot.ts(residuals(mciclos6i))
abline(h=0,col=2)
plot(as.numeric(fitted(mciclos6i)),residuals(mciclos6i))
abline(h=0,col=2)
acf(residuals(mciclos6i),ci.type="ma",lag.max=36)
pacf(residuals(mciclos6i),lag.max=36)
#Ajuste modelo ARMA(6,7)a
mciclos6=Arima(et1,order=c(6,0,7),fixed=c(c(0,NA,rep(0,3),NA),c(NA,rep(0,5),NA)),
summary(mciclos6)
est=cbind(Estimacion=mciclos6$coef[mciclos6$coef!=0],s.e=sqrt(diag(mciclos6$var.coef)))
z0=est[,1]/est[,2]
tabla
layout(rbind(c(1,1,2,2),c(3,3,4,4)))
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
288 CAP
ITULO 8. MODELACI

abline(h=0,col=2)
abline(h=0,col=2)
eacf(residuals(mciclos6))
C odigo R 8.24. Ajuste de ciclos ARMA(6,7)b sobre residuos estructurales

E
t
.
#Ajuste segundo modelo identificado con armasubsets. Este modelos es modificado en mciclos7
mciclos7i=Arima(et1,order=c(6,0,7),fixed=c(c(0,NA,rep(0,3),NA),c(rep(0,5),NA,NA)),
layout(rbind(c(1,1,2,2),c(3,3,4,4)))
plot.ts(residuals(mciclos7i))
abline(h=0,col=2)
plot(as.numeric(fitted(mciclos7i)),residuals(mciclos7i))
abline(h=0,col=2)
acf(residuals(mciclos7i),ci.type="ma",lag.max=36)
pacf(residuals(mciclos7i),lag.max=36)
#Ajuste modelo ARMA(6,7)b
mciclos7=Arima(et1,order=c(6,0,7),fixed=c(c(0,NA,rep(0,3),NA),c(NA,rep(0,4),NA,NA)),
summary(mciclos7)
est=cbind(Estimacion=mciclos7$coef[mciclos7$coef!=0],s.e=sqrt(diag(mciclos7$var.coef)))
z0=est[,1]/est[,2]
tabla
layout(rbind(c(1,1,2,2),c(3,3,4,4)))
abline(h=0,col=2)
abline(h=0,col=2)
C odigo R 8.25. Aproximaci on del ajuste total de la serie como la suma del
ajuste del modelo exponencial m as el ajuste de los ciclos ARMA. C alculo del AIC
y BIC aproximados de cada ajuste total.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
ythat1=ythat.estruct+hatciclos1
#Calculo de AICs y BICs de todos los ajustes incluyendo los del modelo exponencial
pestruct=length(coef(modelo1)) #Numero de parametros en modelo inicial
AICstodos=cbind(crit.inf(modelo1),AIC.aprox(mciclos1),AIC.aprox(mciclos2),AIC.aprox(mciclos3),
AIC.aprox(mciclos4),AIC.aprox(mciclos5),AIC.aprox(mciclos6),AIC.aprox(mciclos7))
AICstodos
BICstodos=cbind(crit.inf(modelo1,AIC="FALSE"),BIC.aprox(mciclos1),BIC.aprox(mciclos2),BIC.aprox(mciclos3),
BIC.aprox(mciclos4),BIC.aprox(mciclos5),BIC.aprox(mciclos6),BIC.aprox(mciclos7))
BICstodos
medidas=rbind(AICstodos,BICstodos)
dimnames(medidas)=list(c("AIC","BIC"),c("Estructura","Estructura+ARMA(2,2)","Estructura+AR(6)",
"Estructura+ARMA(1,8)","Estructura+ARMA(2,5)","Estructura+SARMA(1,2)(0,1)[4]",
"Estructura+ARMA(6,7)a","Estructura+ARMA(6,7)b"))
medidas
C odigo R 8.26. Aproximaci on del pron ostico total de la serie como la suma del
pron ostico del modelo exponencial m as el pron ostico de los ciclos ARMA. C alculo
de precisi on de los pron osticos totales.
pred.ciclos1=ts(forecast(mciclos1,h=m)$mean,freq=4,start=c(1993,4))
ytpron1=pred.estruct+pred.ciclos1
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
290 CAP
ITULO 8. MODELACI

C odigo R 8.27. Gr acas de la serie real y ajustada mediante la suma de la es-
timaci on de la estructura exponencial m as los ciclos ARMA. Tambi en se gracan
los respectivos pron osticos en cada caso.
layout(rbind(c(1,1,2,2),c(3,3,4,4)))
lines(ythat1,col=2)
legend("topleft",legend=c("Original","Estructura + ciclos ARMA(2,2)","pronosticado"),
col=c(1,2,4),lty=1)
lines(ythat2,col=2)
legend("topleft",legend=c("Original","Estructura + ciclos AR(6)","Pronosticado"),
col=c(1,2,4),lty=1)
lines(ythat3,col=2)
legend("topleft",legend=c("Original","AEstructura + ciclos ARMA(1,8)","Pronosticado"),
col=c(1,2,4),lty=1)
lines(ythat4,col=2)
legend("topleft",legend=c("Original","Estructura + ciclos ARMA(2,5)","Pronosticado"),
col=c(1,2,4),lty=1)
layout(rbind(c(1,1,2,2),c(0,3,3,0)))
lines(ythat5,col=2)
legend("topleft",legend=c("Original","Estructura + ciclos SARMA(1,2)(0,1)[4]","Pronosticado"),
col=c(1,2,4),lty=1)
lines(ythat6,col=2)
legend("topleft",legend=c("Original","Estructura + ciclos ARMA(6,7)a","Pronosticado"),
col=c(1,2,4),lty=1)
lines(ythat7,col=2)
legend("topleft",legend=c("Original","Estructura + ciclos ARMA(6,7)b","Pronosticado"),
col=c(1,2,4),lty=1)
C odigo R 8.28. Comparaci on gr aca de los pron osticos. Tenga en cuenta que se
gracan en total 9 series incluyendo a los valores reales en los perodos pronos-
ticados, por esto los argumentos pch (para el smbolo de los puntos a gracar)
y col (para el color de la lneas) usados en las funciones plot() y legend()
se especican iguales a un vector con 9 entradas, una para cada una de las
columnas de la matriz guardada en el objeto de nombre p, respectivamente.
#Comparando todos los pronosticos con valores reales
win.graph(height=16,width=16)
#Juntando en una matriz los valores reales y pronosticados (colocados en columnas)
#obteniendo un objeto de serie de tiempo multivariado
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
p=cbind(ytf,pred.estruct,ytpron1,ytpron2,ytpron3,ytpron4,ytpron5,ytpron6,ytpron7)
colnames(p)=c("Real","Estructura","Estructura+ARMA(2,2)","Estructura+AR(6)","Estructura+ARMA(1,8)",
"Estructura+ARMA(2,5)","Estructura+SARMA(1,2)(0,1)[4]","Estructura+ARMA(6,7)a","Estructura+ARMA(6,7)b")
p
plot(p,plot.type="single",type="b",pch=c(19,1:8),col=c(1:9),lty=1,lwd=2,ylim=c(1400,2000),
ylab="Produccion",xaxt="n")
axis(1,at=time(p),labels=c("1993.Q4","1994.Q1","1994.Q2","1994.Q3"))
legend("topleft",legend=c("Serie Original","Pron. sin ciclos","Estructura+ARMA(2,2)","Estructura+AR(6)",
"Estructura+ARMA(1,8)","Estructura+ARMA(2,5)","Estructura+SARMA(1,2)(0,1)[4]","Estructura+ARMA(6,7)a",
"Estructura+ARMA(6,7)b"),pch=c(19,1:8),lty=1,col=c(1:9),lwd=2,bty="n")
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
292 CAP
ITULO 8. MODELACI

E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Captulo 9
Modelos ARIMA
9.1. Introducci on
Todas las series que hemos tratado de modelar a trav es de la identicaci on
y ajuste de una estructura de tendencia y estacionalidad, no son estaciona-
rias, puesto que la media de tales series es funci on del tiempo (no es constante)
y en el caso de series con componentes multiplicativas, tenemos adem as va-
rianza no constante. Los ciclos no identicados y que permanecen en la com-
ponente de error en esta estrategia de modelaci on, han sido ajustados me-
diante modelos ARMA estacionarios.
En este captulo abordaremos otra estrategia de modelaci on para series no
estacionarias con tendencia y sin estacionalidad, es decir, series de la forma
Y
t
= T
t
+ E
t
, modelo conocido como ARIMA. En el Captulo siguiente se con-
siderar a el caso de series con tendencia y estacionalidad, Y
t
= T
t
+ S
t
+ E
t
, y
el modelo en este caso es denominado SARIMA. Los modelos ARIMA-SARIMA
tambi en son conocidos como modelos de Box-Jenkins.
9.2. Procesos homog eneos
La gran mayora de los procesos econ omicos, ambientales, etc., no son
estacionarios y su nivel medio vara con el tiempo (Martnez [8]). Considere
la serie mensual presentada en la Secci on 5.3.1, la cual fue simulada bajo el
modelo Y
t
= 3500 + 200t + E
t
, E
t
R.BN(0, (4000)
2
), con n = 300 observaciones,
ilustrada en la Figura 9.1, junto con su primera diferencia, Y
t
= Y
t
Y
t1
.
De la gr aca de la serie Y
t
y de su ACF muestral, es claro que la serie no es
estacionaria en covarianza; sin embargo, la serie Y
t
de la primera diferencia
(la cual es un ltro lineal de la serie original) s es estacionaria en covarianza,
pues es estable en media y varianza y la ACF presenta un comportamiento
erg odico. Observe adem as que seg un el patr on en la ACF y PACF de la serie
diferencia, esta puede ser modelada como un MA(1) (ignorando el corte que se
observa en k = 31 en la ACF, el orden MA puede tomarse igual a 1).
293
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
294 CAP
ITULO 9. MODELOS ARIMA

Serie Y
t
Time
y
t
1980 1985 1990 1995 2000 2005
0
2
0
0
0
0
5
0
0
0
0
0 5 10 15 20 25 30 35
0
.
5
0
.
0
0
.
5
1
.
0
Lag
A
C
F
ACF Y
t
Serie Y
t
= Y
t
Y
t1
Time
d
i
f
e
r
1980 1985 1990 1995 2000 2005
1
5
0
0
0
0
1
0
0
0
0
0 5 10 15 20 25 30 35
0
.
4
0
.
2
0
.
0
Lag
A
C
F
ACF Y
t
0 5 10 15 20 25 30 35
0
.
4
0
.
2
0
.
0
Lag
P
a
r
t
i
a
l

A
C
F
PACF Y
t
Figura 9.1: Serie simulada como Y
t
= 3500 + 200t + E
t
, E
t
N(0, (4000)
2
) y su primera
diferencia
En este ejemplo vemos que al diferenciar la serie, es decir, al obtener a Y
t
,
se obtiene un proceso estacionario.
Llamamos a Y
t
proceso diferencia de orden 1 de Y
t
. Observe que Y
t
=
(1 B)Y
t
. Llamaremos proceso diferencia de orden 2 de una serie Y
t
al proceso
2
Y
t
= Y
t
Y
t1
= Y
t
2Y
t1
+Y
t2
= (1B)
2
Y
t
, y en general, llamamos proceso
diferencia de orden d al proceso
d
Y
t
= (1 B)
d
Y
t
.
Cuando al diferenciar un proceso d veces, d Z
+
, se obtiene un proceso
estacionario, entonces decimos que el proceso original es homog eneo de or-
den d. Por ejemplo, el proceso Y
t
=
0
+
1
t + E
t
, donde E
t
es estacionario, es
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
9.2. PROCESOS HOMOG
ENEOS 295
un proceso homog eneo de orden 1. En efecto al diferenciarlo una vez tenemos
Y
t
= Y
t
Y
t1
=
0
+
1
t + E
t
[
0
+
1
(t 1) + E
t1
]
=
1
+ E
t
E
t1
=
1
+ U
t
(9.1)
donde U
t
= E
t
E
t1
, es estacionario. Observe que si E
t
es un ruido blanco
entonces Y
t
es un MA(1) de media
1
, con par ametro
1
= 1.
En general, procesos generados como una tendencia polin omica de orden
d m as un proceso estacionario cualquiera E
t
, ser a homog eneo de orden d:
Y
t
=
0
+
1
t +
2
t
2
+ +
d
t
d
+ E
t
, E
t
estacionario. (9.2)
Luego, la serie simulada como Y
t
= 3500+200t+E
t
, E
t
N(0, (4000)
2
) es denida
por un proceso homog eneo de orden d = 1 y por tanto Y
t
= 200 + E
t
E
t1
es un proceso MA(1) estacionario con media 200. Esto ultimo es vericado, de
la ACF y PACF muestrales para Y
t
, y tambi en de la correspondiente EACF
muestral que se muestra a continuaci on: esta EACF nos indica claramente que
EACF muestral para Yt
AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
3 x o o x o o o o o o o o o o
4 x x x x o o o o o o o o o o
6 x o x x x o x o o o o o o o
7 x o x o o o x x o o o o o o
el modelo ARMA apropiado es p = 0 y q = 1, es decir un MA(1). Ajustamos este
modelo a la serie Y
t
usando la funci on R Arima() de la librera forecast, y
obtenemos lo siguiente:
Tabla par ametros estimados Modelo MA(1) para Yt
0
P(|Z| > |Z
0
|)
1
-1.0000 0.0090 -110.9714 0.0000
Intercepto (
1
) 201.6340 2.6545 75.9605 0.0000
AIC = 5815.89, BIC = 5826.99,
2
= 15777871
Observe que el intercepto en los resultados del ajuste corresponde a la
pendiente
1
y no a
0
, de acuerdo a la ecuaci on (9.1), luego,

1
= 201.6340.
Tambi en tenemos que

1
= 1 y
2
=

VAR(E
t
) = 15777871 (el verdadero valor
era 16000000). En la Figura 9.2 se presenta los gr acos de los residuales

E
t
y su ACF y PACF muestrales. Obviando el corte en k = 31 en la ACF y PACF, y
teniendo en cuenta los resultados de la EACF, del test de Ljung-Box, y el test
de normalidad, podemos concluir que los errores E
t
provienen de un ruido
blanco normal.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
296 CAP

Residuos ajuste MA(1) para Y
t
Time
r
e
s
i
d
u
a
l
s
(
a
j
u
s
t
e
d
i
f
e
r
e
n
c
i
a
)
1980 1985 1990 1995 2000 2005
1
0
0
0
0
0
5
0
0
0
10000 0 5000 10000
1
0
0
0
0
0
5
0
0
0
Residuos ajuste MA(1) para Y
t
fitted(ajustediferencia)
r
e
s
i
d
u
a
l
s
(
a
j
u
s
t
e
d
i
f
e
r
e
n
c
i
a
)
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
Lag
A
C
F
ACF residuos ajuste MA(1) para Y
t
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
Lag
P
a
r
t
i
a
l

A
C
F
PACF residuos ajuste MA(1) para Y
t
Figura 9.2: Gr acos para an alisis de residuales

E
t
del ajuste MA(1) sobre la serie Y
t
Test Ljung-Box para

Et
Modelo MA(1) ajustado a Yt
m Q
LB
g.l P(
2
m
> Q
LB
)
6 3.82 6.00 0.70
12 6.82 12.00 0.87
18 13.76 18.00 0.74
24 16.00 24.00 0.89
30 18.76 30.00 0.94
36 27.97 36.00 0.83
Test Shapiro Wilk para residuos

Et
Estadstico W 0.997042818926275
Valor P 0.862417555947899
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
9.2. PROCESOS HOMOG
ENEOS 297
EACF muestral para residuos

Et
AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
5 o x o x x o o o o o o o o o
7 x o x x x o x o o o o o o o
El c odigo R usado para el c alculo de la diferencia de la serie y su ajuste fue
el siguiente:
C odigo R 9.1.
library(TSA)
library(forecast)
#Creando serie primera diferencia Y(t)-Y(t-1)
difer=diff(yt)
#Graficando la serie Yt, su ACF, y la serie primera diferencia con sus ACF y PACF
plot(yt,main=expression(paste("Serie",sep=" ",Y[t])))
acf(as.numeric(yt),lag.max=36,ci.type="ma",ci.col="red",
main=expression(paste("ACF",sep=" ",Y[t])))
plot(difer,main=expression(paste("Serie",sep=" ",nabla,sep="",Y[t]==Y[t]-Y[t-1])))
abline(h=0,lty=2)
acf(as.numeric(difer),lag.max=36,ci.type="ma",ci.col="red",
main=expression(paste("ACF",sep=" ",nabla,sep="",Y[t])))
pacf(as.numeric(difer),lag.max=36,ci.col="red",main=expression(paste("PACF",sep=" ",nabla,sep="",Y[t])))
#Calculando la EACF muestral para la serie primera diferencia
eacf(difer)
#Ajustando modelo MA(1) identificado segun EACF para la primera diferencia,
ajustediferencia=Arima(difer,order=c(0,0,1))
summary(ajustediferencia)
#para completar informacion de tabla de parametros ajustados
est=cbind(Estimacion=ajustediferencia$coef,s.e=sqrt(diag(ajustediferencia$var.coef)))
z0=est[,1]/est[,2]
#Chequeo sobre residuales ajuste MA(1) para primera diferencia de la serie simulada
plot(residuals(ajustediferencia),
main=expression(paste("Residuos ajuste MA(1) para ",sep=" ",nabla,sep="",Y[t])))
abline(h=0,lty=2)
plot(fitted(ajustediferencia),residuals(ajustediferencia),
main=expression(paste("Residuos ajuste MA(1) para ",sep=" ",nabla,sep="",Y[t])))
abline(h=0,lty=2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
298 CAP

acf(as.numeric(residuals(ajustediferencia)),lag.max=36,ci.type="ma",ci.col="red",
main=expression(paste("ACF residuos ajuste MA(1) para",sep=" ",nabla,sep="",Y[t])))
pacf(as.numeric(residuals(ajustediferencia)),lag.max=36,ci.col="red",
main=expression(paste("PACF residuos ajuste MA(1) para",sep=" ",nabla,sep="",Y[t])))
#Creando funcion para resultados Ljung-Box
df=c(rep(NA,aux))
for(i in 1:aux){
*
i),type=type)
df[i]=test[[2]]
}
lag=6
*
c(1:aux)
rownames(teste)=lag
teste
}
BP.LB.test(residuals(ajustediferencia),maxlag=36,type="Ljung")
xtable::xtable(BP.LB.test(residuals(ajustediferencia),maxlag=36,type="Ljung"))
#Calculando EACF para residuos del ajuste MA(1) de la primera diferencia
eacf(residuals(ajustediferencia))
#Teste de normalidad para residuos del ajuste MA(1) de la primera diferencia
shapiro.test(residuals(ajustediferencia))
Para un proceso de la forma Y
t
=
0
+
1
t +
2
t
2
+ E
t
, con E
t
estacionario y
de media cero, se tiene que
Y
t
= (
1
2
) + 2
2
t + U
t
, con U
t
= E
t
E
t1
(9.3)
2
Y
t
= 2
2
+ W
t
, con W
t
= E
t
2E
t1
+ E
t2
(9.4)
Claramente, Y
t
no es estacionario y su media es E[Y
t
] = (
1

2
) + 2
2
t,
mientras que
2
Y
t
es estacionario y su media es E[
2
Y
t
] = 2
2
, y si E
t
es un
ruido blanco, entonces
2
Y
t
es una proceso MA(2) de media dada y par ametros
1
= 2,
2
= 1.
Por ejemplo, sea el proceso denido por Y
t
= 10000 + 1.8t + 15t
2
+ E
t
, con
E
t
R.BN(0, (5000)
2
). Una realizaci on de n = 300 observaciones de este proceso
fue obtenido por simulaci on y la serie junto con su ACF es presentada en
la Figura 9.3. Es evidente que la serie presenta tendencia cuadr atica y que
no es estacionaria en covarianza. Al calcular la diferencias de orden 1 y 2
obtenemos las series Y
t
y
2
Y
t
que se muestran en la Figura 9.4, junto con
sus respectivas ACF; en la misma gura tambi en se observa la PACF de la
diferencia de orden 2. Puede observarse que la serie de la diferencia de orden
1 es una serie con tendencia lineal y por tanto no es estacionaria, pero la serie
2
Y
t
oscila alrededor de una tendencia constante y es estacionaria seg un su
ACF; m as a un, de acuerdo a los patrones en su ACF y PACF, esta diferencia
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
9.2. PROCESOS HOMOG
ENEOS 299
Serie simulada Y
t
= 10000 + 1.8t + 15t
2
+ E
t
Time
y
t
1980 1985 1990 1995 2000 2005
0
2
0
0
0
0
0
6
0
0
0
0
0
1
0
0
0
0
0
0
1
4
0
0
0
0
0
0 5 10 15 20 25 30 35
0
.
5
0
.
0
0
.
5
1
.
0
Lag
A
C
F
ACF Y
t
Figura 9.3: Serie simulada Y
t
= 10000 + 1.8t + 15t
2
+ E
t
, E
t
R.BN(0, (5000)
2
) y su ACF
muestral.
sigue un proceso MA(2) (obviando los cortes despu es de k = 15, en la ACF),
lo cual tambi en es evidenciado a partir de la EACF muestral que se ilustra a
continuaci on:
EACF para
2
Yt = (1 B)
2
Yt
AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12
0 x x o o o o o o o o o o o
1 x o o o o o o o o o o o o
2 x o o o o o o o o o o o o
3 x o o x o o o o o o o o o
4 x x x o o x o o o o o o o
5 x x x x x x x o o o o o o
6 x x x o o x x x o o o o o
7 x x x o o o x o o o o o o
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
300 CAP

Serie Y
t
Time
d
i
f
e
r
1
1980 1985 1990 1995 2000 2005
2
0
0
0
0
0
2
0
0
0
0
0 5 10 15 20 25 30 35
0
.
3
0
.
1
0
.
1
Lag
A
C
F
ACF Y
t
Serie
2
Y
t
Time
d
i
f
e
r
2
1980 1985 1990 1995 2000 2005
3
0
0
0
0
0
2
0
0
0
0
0 5 10 15 20 25 30 35
0
.
6
0
.
2
0
.
2
Lag
A
C
F
ACF
2
Y
t
0 5 10 15 20 25 30 35
0
.
6
0
.
2
Lag
P
a
r
t
i
a
l

A
C
F
PACF
2
Y
t
Figura 9.4: Diferencias de orden 1 y 2 de serie simulada Y
t
= 10000 + 1.8t + 15t
2
+ E
t
,
E
t
R.BN(0, (5000)
2
).
Al realizar el ajuste del modelo MA(2) a la serie
2
Y
t
, se obtuvieron los
siguientes resultados
Tabla par ametros estimados Modelo MA(2) para
2
Yt
0
P(|Z| > |Z
0
|)
1
-1.9634 0.0242 -81.1580 0.0000
2
0.9636 0.0237 40.7018 0.0000
Intercepto (2
2
) 29.9791 0.4325 69.3094 0.0000
AIC = 5937.71, BIC = 5952.49,
2
= 24492346
Observamos que

1
= 1.9634,

2
= 0.9636,

2
= 29.9791/2 = 14.98955, todos
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
9.2. PROCESOS HOMOG
ENEOS 301
muy pr oximos de los verdaderos valores, -2, 1, 15, respectivamente. As mis-
mo, la varianza estimada es pr oxima de la verdadera, 25000000. El an alisis
de los residuales del ajuste

E
t
, basados en los siguientes resultados, indican
que E
t
es aproximadamente un ruido blanco normal.
Residuos ajuste MA(2) para
2
Y
t
Time
r
e
s
i
d
u
a
l
s
(
a
j
u
s
t
e
d
i
f
e
r
2
)
1980 1985 1990 1995 2000 2005
1
5
0
0
0
5
0
0
0
5
0
0
0
1
5
0
0
0
20000 0 10000 30000
1
5
0
0
0
5
0
0
0
5
0
0
0
1
5
0
0
0
Residuos ajuste MA(2) para
2
Y
t
fitted(ajustedifer2)
r
e
s
i
d
u
a
l
s
(
a
j
u
s
t
e
d
i
f
e
r
2
)
0 5 10 15 20 25 30 35
0
.
1
0
0
.
0
0
0
.
1
0
Lag
A
C
F
ACF residuos ajuste MA(2) para
2
Y
t
0 5 10 15 20 25 30 35
0
.
1
0
0
.
0
0
0
.
1
0
Lag
P
a
r
t
i
a
l

A
C
F
PACF residuos ajuste MA(2) para
2
Y
t
Figura 9.5: Gr acos para an alisis de residuales

E
t
del ajuste MA(2) sobre la serie
2
Y
t
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
302 CAP

EACF muestral para residuos

Et
Modelo MA(2) ajustado a
2
Yt
AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
4 x x o x o o o o o o o o o o
5 x o o x x o o o o o o o o o
6 x x x x o x o o o o o o o o
7 x x x x o o x o o o o o o o
Test Ljung-Box para

Et
2
Yt
m Q
LB
g.l P(
2
m
> Q
LB
)
6 1.27 6.00 0.97
12 5.03 12.00 0.96
18 10.48 18.00 0.92
24 25.85 24.00 0.36
30 29.92 30.00 0.47
36 37.94 36.00 0.38
Test Shapiro Wilk para residuos

Et
2
Yt
Estadstico W 0.996274024248123
Valor P 0.710811636435501
A continuaci on se exhibe el c odigo R usado en este segundo ejemplo.
C odigo R 9.2.
library(TSA)
library(forecast)
#Creando Funcion usuario para Test Ljung-Box
df=c(rep(NA,aux))
for(i in 1:aux){
*
i),type=type)
df[i]=test[[2]]
}
lag=6
*
c(1:aux)
rownames(teste)=lag
teste
}
yt=scan(file.choose()) #leer archivo datossimulejem2ARIMA.txt
#Calcular los procesos diferencia de primer y segundo orden
difer1=diff(yt)
difer2=diff(yt,1,2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
9.3. RA
IZ UNITARIA AUTORREGRESIVA 303

#Obtencion EACF del proceso diferencia de orden 2
eacf(difer2)
#Grafica de la serie Yt y de su ACF muestral
plot(yt, main=expression(paste("Serie simulada",sep=" ",Y[t]==10000+1.8
*
t+15
*
t2+E[t])))
acf(as.numeric(yt),lag.max=36,ci.type="ma",ci.col="red",main=expression(paste("ACF",sep=" ",Y[t])))
#Graficas de las series diferencias de orden 1 y 2 y sus ACF,
#ademas se grafica la PACF de la serie diferencia de orden 2
plot(difer1,main=expression(paste("Serie ",sep=" ",nabla,sep="",Y[t])))
acf(as.numeric(difer1),lag.max=36,ci.type="ma",ci.col="red",
main=expression(paste("ACF",sep=" ",nabla,sep="",Y[t])))
plot(difer2,main=expression(paste("Serie ",sep=" ",nabla2,sep="",Y[t])))
acf(as.numeric(difer2),lag.max=36,ci.type="ma",ci.col="red",
main=expression(paste("ACF",sep=" ",nabla2,sep="",Y[t])))
pacf(as.numeric(difer2),lag.max=36,ci.col="red",
main=expression(paste("PACF",sep=" ",nabla2,sep="",Y[t])))
#Ajustando modelo MA(2) a serie diferencia de orden 2
ajustedifer2=Arima(difer2,order=c(0,0,2))
summary(ajustedifer2)
#Completando informacion de tabla de parametros estimados del modlo ajustado
est=cbind(Estimacion=ajustedifer2$coef,s.e=sqrt(diag(ajustedifer2$var.coef)))
z0=est[,1]/est[,2]
#Chequeo sobre residuales del ajuste MA(2) para segunda diferencia de la serie simulada
plot(residuals(ajustedifer2),
main=expression(paste("Residuos ajuste MA(2) para ",sep=" ",nabla2,sep="",Y[t])))
abline(h=0,lty=2)
plot(fitted(ajustedifer2),residuals(ajustedifer2),
main=expression(paste("Residuos ajuste MA(2) para ",sep=" ",nabla2,sep="",Y[t])))
abline(h=0,lty=2)
acf(as.numeric(residuals(ajustedifer2)),lag.max=36,ci.type="ma",ci.col="red",
main=expression(paste("ACF residuos ajuste MA(2) para",sep=" ",nabla2,sep="",Y[t])))
pacf(as.numeric(residuals(ajustedifer2)),lag.max=36,ci.col="red",
main=expression(paste("PACF residuos ajuste MA(2) para",sep=" ",nabla2,sep="",Y[t])))
eacf(residuals(ajustedifer2))
BP.LB.test(residuals(ajustedifer2),maxlag=36,type="Ljung")
shapiro.test(residuals(ajustedifer2))
9.3. Raz unitaria autorregresiva
Considere un modelo ARMA(p,q)
p
(B)Y
t
=
q
(B)E
t
, E
t
R.BN(0,
2
)
tal que una de las p races del polinomio autorregresivo
p
(B) es igual a 1.
Decimos que Y
t
tiene una raz unitaria autorregresiva o simplemente una raz
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
304 CAP

unitaria y as, tenemos que
p
(B) = (1 B)
p1
(B), donde
p1
(B) tiene races
con m odulo fuera del crculo unitario. En este caso,
(1 B)
p1
(B)Y
t
=
q
(B)E
t
=
p1
(B)Y
t
=
q
(B)E
t
(9.5)
es decir, Y
t
es un ARMA(p1,q).
Para una serie de tiempo proveniente de un proceso con raz unitaria, su
ACF y PACF presentan el patr on de cola decreciente - corte, respectivamente,
tpico de un AR, pero la ACF decrece lentamente mientras que la PACF pre-
senta un corte con valor muy pr oximo de 1 en k = 1 y para el resto de rezagos
los valores son casi cero. Ver ejemplo la Figura 9.6.
0 5 10 15 20 25 30 35
0
.
5
0
.
0
0
.
5
1
.
0
Lag
A
C
F
ACF Y
t
0 5 10 15 20 25 30 35
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
Lag
P
a
r
t
i
a
l

A
C
F
PACF Y
t
Figura 9.6: ACF y PACF de una serie proveniente de un proceso ARIMA(p,1,q)
Tambi en puede presentarse el caso de m as de una raz unitaria. Cuan-
do existen d races unitarias, se requiere diferenciar d veces para obtener
una serie estacionaria, es decir,
pd
(B)(1 B)
d
Y
t
=
q
(B)E
t
, entonces
d
Y
t

ARMA(pd, q) (en esta notaci on asumimos p d). En la pr actica son comunes
los valores d = 1, 2.
9.4. Caminata aleatoria
9.4.1. Caminata aleatoria sin tendencia
Sea un proceso AR(1), esto es, Y
t
=
1
Y
t1
+ E
t
, donde E
t
R.BN(0,
2
). Si
1
= 1, tenemos un proceso no estacionario conocido como caminata aleatoria
sin tendencia:
Y
t
= Y
t1
+ E
t
, E
t
R.BN(0,
2
) (9.6)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
9.4. CAMINATA ALEATORIA 305
Asumiendo que el proceso inicia en t = 0, con un valor y
0
, puede mostrarse
que
Y
t
= y
0
+
t
i=1
E
i
(9.7)
E[Y
t
] = y
0
(9.8)
VAR[Y
t
] = t
2
(9.9)
COV[Y
t
, Y
t+k
] = COV
_
t
i=1
E
i
,
t+k
i=1
E
i
_
= t
2
(9.10)
Corr[Y
t
, Y
t+k
] =
t
_
t(t + k)
(9.11)
Observe que lm
t
VAR[Y
t
] = , es decir, la varianza crece y no converge a un
valor nito, mientras que para t grande la ACF tomar a valores pr oximos a 1 y
decrecer a muy lentamente con k.
9.4.2. Caminata aleatoria con tendencia o deriva
Considere ahora un proceso de la forma
Y
t
= + Y
t1
+ E
t
, E
t
R.BN(0,
2
) (9.12)
este proceso es conocido como caminata aleatoria con tendencia o deriva.
Suponiendo que el proceso inicia en t = 0 con un valor y
0
, se tiene que
Y
t
= y
0
+ t +
t
i=1
E
i
(9.13)
E[Y
t
] = y
0
+ t (9.14)
VAR[Y
t
] = t
2
(9.15)
COV[Y
t
, Y
t+k
] = COV
_
t
i=1
E
i
,
t+k
i=1
E
i
_
= t
2
(9.16)
Corr[Y
t
, Y
t+k
] =
t
_
t(t + k)
(9.17)
de nuevo, lm
t
VAR[Y
t
] = y la ACF no es erg odica.
La caminata aleatoria con tendencia tambi en es conocida como modelo de
tendencia estoc astica.
Nota:
1. Observe que al reescribir las ecuaciones (9.6) y (9.12) en t erminos de
Y
t
= Y
t
Y
t1
, obtenemos que el proceso diferencia de orden 1 es esta-
cionario y por tanto, una caminata aleatoria es un proceso homog eneo
de orden d = 1.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
306 CAP

2. Una caminata aleatoria no presenta reversi on a la media, es decir, va
hacia arriba y abajo en forma aleatoria sin una tendencia a regresar a
determinado nivel.
3. A pesar del comportamiento incierto de la caminata aleatoria, su primera
diferencia es una serie bien comportada: se comporta como un ruido
blanco (aunque su media puede ser distinta de cero, dependiendo de ).
9.5. Procesos integrados
Se dice que una serie no estacionaria es integrada si su no estacionar-
iedad puede deshacerse diferenci andola (Diebold [3]). Por tanto, los procesos
homog eneos son procesos integrados. Cuando s olo se requiere una diferencia,
la serie es denominada integrada de orden 1 y se denota por I(1). En general,
si se requieren d (d Z
+
) diferencias para obtener la estacionariedad, el pro-
ceso es integrado de orden d y es denotado por I(d). As, un ruido blanco es
un proceso I(0), mientras que una caminata aleatoria es un proceso I(1), estos
son los proceso integrados m as simples.
Note que el orden de integraci on d es igual a la cantidad de races unitarias
autorregresivas.
9.5.1. Procesos autorregresivos integrados de medias m oviles o ARIMA
Se dice que una serie de tiempo Y
t
sigue un proceso autorregresivo inte-
grado de media m ovil si su d- esima diferencia,
d
Y
t
, es un proceso ARMA
estacionario, es decir,
p
(B)
d
Y
t
=
q
(B)E
t
, E
t
R.BN(0,
2
) (9.18)
o equivalentemente,
p
(B)(1 B)
d
Y
t
=
q
(B)E
t
, E
t
R.BN(0,
2
) (9.19)
donde las races del polinomio autorregresivo
p
(B) tienen m odulo mayor a 1, y
denotamos el proceso por ARIMA(p,d,q). De acuerdo a lo anterior, podemos de-
cir que I(1)=ARIMA(0,1,0) (o sea, una caminata aleatoria), y I(0)=ARIMA(0,0,0)
(o sea, un ruido blanco). Tambi en, cuando p = 0, el proceso es denotado por
IMA(d,q), y si q = 0, el proceso es simplemente denotado por ARI(p,d).
Si denotamos

p+d
(B) =
p
(B)(1 B)
d
, podemos tambi en escribir el modelo
ARIMA de la siguiente forma
p+d
(B)Y
t
=
q
(B)E
t
, E
t
R.BN(0,
2
) (9.20)
donde el polinomio autorregresivo

p+d
(B) tiene d races unitarias, de ah que el
proceso seguido por Y
t
no es estacionario.
p
(B) y
q
(B) son, respectivamente
los polinomios autorregresivos y de medias m oviles del proceso estacionario
d
Y
t
.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
9.6. AJUSTE Y PRON

OSTICO DE MODELOS ARIMA 307
9.6. Ajuste y pron ostico de modelos ARIMA
Una vez determinado el orden apropiado de diferenciaci on, d, de la serie, se
identican los ordenes p y q para la serie diferenciada
d
Y
t
de la misma forma
que en el caso estacionario; luego, se ajusta el proceso completo ARIMA(p,d,q)
lo cual podemos hacer usando la funci on R Arima() de la librera forecast,
indicando en el argumento order=c(p,d,q) los ordenes p, d, q del modelo
ARIMA.
En cuanto a los pron osticos, de acuerdo a lo visto en la Secci on 7.10, el
pron ostico optimo para l perodos adelante de t = n, que minimiza el error
cuadr atico medio de pron ostico, es dado por

Y
n
(l), que corresponde a la esper-
anza condicional del valor de la serie en t = n + l, l 1, dada la informaci on o
historia conocida de la serie, es decir,
Y
n
(l) = E[Y
n+l
|Y
n
, Y
n1
, . . .], (9.21)
y el error de pron ostico es
e
n
(l) = Y
n+l

Y
n
(l) (9.22)
Para obtener f acilmente los pron osticos expresamos el modelo ARIMA en su
forma de ecuaci on en diferencia, para ello usamos el polinomio

p+d
(B). Sea
p+d
(B) =
p
(B)(1 B)
d
= 1

1
B

p+d
B
p+d
(9.23)
entonces el modelo ARIMA(p,d,q) general en (9.20) puede escribirse como la
siguiente ecuaci on en diferencia (es decir, como un ARMA(p+d,q)),
(1

1
B

p+d
B
p+d
)Y
t
= (1 +
1
B + +
q
B
q
)E
t
(9.24)
as, para t = n + l, tenemos
Y
n+l
=

1
Y
n+l1
+

2
Y
n+l2
+ +

p+d
Y
n+lpd
+E
n+l
+
1
E
n+l1
+ +
q
E
n+lq
(9.25)
y tomando la esperanza condicional con origen de tiempo en t = n, obtenemos
que la ecuaci on de pron ostico es dada por
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
308 CAP
Y
n
(l) =
Y
n
(l 1) +

Y
n
(l 2) + +

p+d
Y
n
(l p d)
+

E
n
(l) +
1

E
n
(l 1) + +
q

E
n
(l q) (9.26)
donde
Y
n
(j) =
_
E[Y
n+j
|Y
n
, Y
n1
, . . .] si j 1
Y
n+j
si j 0,
(9.27)
E
n
(j) =
_
0 si j 1
E
n+j
si j 0,
(9.28)
y desde que los errores E
t
no son observables, entonces tomamos en su lugar
a los residuales

E
t
.
Para estudiar las propiedades del error de pron ostico e
n
(l), l perodos ade-
lante de t = n, para una serie modelada seg un un ARIMA(p,d,q), consideramos
una nueva representaci on para el proceso ARIMA, en la cual el modelo es
escrito en la forma de un proceso lineal truncado (Cryer y Chan [2], Wei [9]),
Y
n+l
= C
n
(l) + I
n
(l) (9.29)
donde,
I
n
(l) = E
n+l
+
1
E
n+l1
+
2
E
n+l2
+ +
l1
E
n+1
para l 1 (9.30)
y si el proceso es invertible, C
n
(l) es una cierta funci on de la historia nita
denida por Y
1
, . . . , Y
n
. Para ello, escribimos el proceso en su forma autorre-
gresiva,
(B)Y
t
= E
t
, con (B) = 1
j=1
j
B
j
=

p
(B)(1 B)
d
q
(B)
(9.31)
o equivalentemente,
Y
t
=
j=1
j
Y
tj
+ E
t
(9.32)
y as, para t = n + l tenemos Y
n+l
=
j=1
j
Y
n+lj
+ E
n+l
. Se dene adem as el
polinomio
l1
(B),
l1
(B) = 1 +
1
B + +
l1
B
l1
(9.33)
tal que
m
i=0
mi
i
= 0, para m = 1, 2, . . . , l 1, con
0
= 1,
0
= 1. (9.34)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
9.6. AJUSTE Y PRON

OSTICO DE MODELOS ARIMA 309
As, aplicando el operador
l1
(B) a la ecuaci on (9.32), con t = n+l, obtenemos
Y
n+l
=
j=1
(l)
j
Y
nj+1
+
l1
i=0
i
E
n+li
= C
n
(l) + I
n
(l), con
(l)
j
=
l1
i=0
l1+ji
i
(9.35)
Luego, para el pron ostico optimo l perodos adelante de t = n, es decir

Y
n
(l) =
E[Y
n+l
|Y
n
, Y
n1
, . . .], tenemos que
Y
n
(l) = E[C
n
(l)|Y
n
, Y
n1
, . . .] +E[I
n
(l)|Y
n
, Y
n1
, . . .] = C
n
(l) =
j=1
(l)
j
Y
nj+1
, l 1,
(9.36)
Por tanto, para el error de pron ostico e
t
(l) = Y
t+l

Y
t
(l) tenemos que
e
n
(l) = C
n
(l) + I
n
(l) C
n
(l) = E
n+l
+
1
E
n+l1
+
2
E
n+l2
+ +
l1
E
n+1
(9.37)
De lo anterior, se obtiene que para un proceso ARIMA general invertible, se
cumple que
E[e
n
(l)] = 0 (9.38)
VAR[e
n
(l)] =
2
l1
j=0
2
j
para l 1, (9.39)
por tanto, para una realizaci on sucientemente grande (n grande), un intervalo
de pron ostico de (1 )100 % puede calcularse como
Y
n
(l) Z
/2

_
1 +
l1
j=1
2
j
(9.40)
donde y

j
son estimados.
Nota:
1. Observe que los pron osticos optimos

Y
n
(l) pueden ser obtenidos tanto con
(9.26) como por (9.36), aunque la primera es la m as pr actica ya que en la
segunda expresi on es necesario hallar los pesos
(l)
j
, j = 1, 2, . . ..
2. De (9.26) es claro que los pron osticos con un horizonte mayor a p + d
estar an basados en pron osticos, por tanto, s olo es recomendable realizar
pron osticos de corto plazo.
3. Para series no estacionarias, los pesos
j
no decaen a cero a medida que
aumenta j (como s ocurre en el caso estacionario). Por ejemplo, para
una caminata aleatoria se puede mostrar que
j
= 1 para todo j, de
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
310 CAP

donde VAR[e
t
(l)] =
2
l; para un modelo IMA(1,1),
j
= 1 +
1
, j 1, luego
VAR[e
t
(l)] =
2
[1 + (l 1)(1 +
1
)
2
]; para un ARI(1,1)
j
=
1
j+1
1
1
1
, j 1 y por
tanto, VAR[e
t
(l)] =
2
_
1 +
l1
j=1
_
1
j+1
1
1
1
_
2
_
.
9.7. Pruebas para races unitarias
En la Secci on 9.3 vinos que una raz unitaria aparece cuando el polinomio
autorregresivo de un ARMA presenta una raz sobre el crculo unitario, lo cual
implica que es necesario diferenciar la serie para poder obtener estacionar-
iedad.
Los testes de races unitarias son una herramienta adicional a los an alisis
gr acos de la serie y su ACF para denir el grado de diferencia necesario a n
de obtener una serie estacionaria. De acuerdo a Guerrero [5], diferenciar de
m as conduce a un modelo m as complejo de lo necesario y causa p erdida de
eciencia en la estimaci on de par ametros, adem as de la sobreestimaci on de la
varianza del error de pron ostico, aunque no se afectar a el insesgamiento ni la
consistencia de los estimadores; pero subdiferenciar tiene consecuencias m as
graves pues conduce a la invalidez de los supuestos te oricos para los modelos
estacionarios asumidos para la serie subdiferenciada, ya que no se logra la
estacionariedad, y por tanto se invalida la interpretaci on de los resultados
de los ajustes y pron osticos, adem as, se subestima la varianza del error de
pron ostico y el modelo que se ajusta carece de capacidad adaptativa a efectos
no estacionarios sobre el nivel de la serie.
Para poder introducir los testes de raz unitaria, considere inicialmente el
proceso AR(1) de media cero,Y
t
=
1
Y
t1
+E
t
E
t
, R.BN(0,
2
). Queremos probar
H
0
:
1
= 1 versus H
1
:
1
< 1 (9.41)
Suponga que |
1
| < 1 y que estimamos
1
mediante la regresi on de Y
t
en Y
t1
.
Sea

1,MC
el estimador por mnimos cuadrados. Tenemos que el estimador de
mnimos cuadrados es asint oticamente equivalentes al estimador de m axima
verosimilitud, y
1,MC
=
n
t=1
Y
t
Y
t1
n
t=1
Y
2
t1
(9.42)
1,MC
1
=
n
t=1
E
t
Y
t1
n
t=1
Y
2
t1
(9.43)
entonces
(
1,MC
1
)
s.e(
1,MC
)
a
N(0, 1) (9.44)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
9.7. PRUEBAS PARA RA
ICES UNITARIAS 311

donde
s.e(
1,MC
) =
S
_
n
t=1
Y
2
t1
, con S
2
=
1
n 2
n
t=2
(Y
t
1,MC
Y
t1
)
2
(9.45)
Sin embargo, si
1
= 1 la aproximaci on normal ya no es aplicable. Para probar
(9.41) es necesario estudiar el comportamiento del estadstico

1,MC
1.
9.7.1. Prueba de raz unitaria de Dickey-Fuller (DF)
Caso 1:
Y
t
AR(1) con media cero, es decir, Y
t
=
1
Y
t1
+ E
t
, modelo que podemos
reescribir de la forma
Y
t
=
1
Y
t1
+ E
t
, con
1
=
1
1, E
t
R.BN(0,
2
) (9.46)
Luego, probar (9.41) es equivalente a probar
H
0
:
1
= 0 versus H
1
:
1
< 0 (9.47)
1
puede ser estimado mediante mnimos cuadrados en la regresi on de Y
t
en
Y
t1
. Sea

1,MC
tal estimador. Denimos como estadstico de la prueba a
=
1,MC
S/
_
n
t=1
Y
2
t1
=
1,MC
1
S/
_
n
t=1
Y
2
t1
, con S
2
=
1
n 2
n
t=2
(Y
t
1,MC
Y
t1
)
2
(9.48)
Suponga que Y
0
= 0; entonces puede mostrarse que bajo el supuesto E
t

R.BN(0,
2
)

a
1
2

([W(1)]
2
1)
1
_
0
[W(s)]
2
ds
(9.49)
donde W(s) es un proceso estoc astico conocido como movimiento Browniano
est andar y [W(1)]
2

2
1
. Los valores crticos para el estadstico , con niveles
de signicancia 0.01, 0.05,, son, respectivamente, -2.60, -1.95, para n = 100.
Rechazamos H
0
si <
crtico
.
Caso 2:
Y
t
sigue un proceso AR(1) con media distinta de cero. En este caso el modelo
es Y
t
=
0
+
1
Y
t1
+ E
t
, el cual reescribimos como
Y
t
=
0
+
1
Y
t1
+ E
t
, con
1
=
1
1, E
t
R.BN(0,
2
) (9.50)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
312 CAP

Aqu el par ametro
0
= (1
1
), con = E[Y
t
]. De nuevo, se usa mnimos
cuadrados para estimar
1
en la regresi on de Y
t
en Y
t1
, pero esta vez el
modelo tiene intercepto. El estadstico de la prueba es

1,MC
S/
_
n
t=1
(Y
t1

Y )
2
=
1,MC
1
S/
_
n
t=1
(Y
t1

Y )
2
, con S
2
=
1
n 3
n
t=2
(Y
t
0,MC
1,MC
Y
t1
)
2
(9.51)
Suponiendo Y
0
= 0 y bajo el supuesto E
t
R.BN(0,
2
), tenemos que

1
2
([W(1)]
2
1) W(1)
1
_
0
W(s)ds
1
_
0
[W(s)]
2
ds
_
1
_
0
W(s)ds
_
2
(9.52)
La distribuci on de
es a un m as distante de la normal que en el caso de media

cero. Los valores crticos con muestras grandes, para niveles de signicancia
de 0.01 y 0.05, son respectivamente, -3.42, -2.86 y rechazamos H
0
si
<

,crtico
.
Caso 3:
Y
t
AR(1) con tendencia lineal, es decir, Y
t
=
0
+
1
t +
1
Y
t1
+ E
t
, modelo
que reescribimos como
Y
t
=
0
+
1
t +
1
Y
t1
+ E
t
, con
1
=
1
1, E
t
R.BN(0,
2
) (9.53)

1,MC
s.e(
1,MC
)
(9.54)
donde s.e(
1,MC
) es el error est andar del estimador

1,MC
en la estimaci on por
mnimos cuadrados de la regresi on de Y
t
versus (t, Y
t1
). La distribuci on
lmite de
tambi en es bastante alejada de la normal y es funci on de los

procesos W(1) y W(t) y de t. El criterio de rechazo sigue siendo si
<
,crtico
.
9.7.2. Prueba de raz unitaria Dickey-Fuller aumentada (ADF)
En el test DF se supone un proceso AR(1) para la serie Y
t
. A continuaci on
consideraremos el caso en que Y
t
AR(p), siendo el modelo general dado por
(Y
t
) =
1
(Y
t1
) + +
p
(Y
tp
) + E
t
, E
t
R.BN(0,
2
) (9.55)
donde = E[Y
t
], o equivalentemente,
Y
t
=
0
+
p
j=1
j
Y
tj
+ E
t
, E
t
R.BN(0,
2
) (9.56)
con
0
= (1
p
j=1
j
).
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
ICES UNITARIAS 313

Caso 1:
Y
t
AR(p) con media cero. En este caso el modelo en (9.55) se reduce a
Y
t
=
j=1
j
Y
tj
+ E
t
=
1
Y
t1
+
j=2
j
Y
tj
+ E
t
. Este modelo puede ser reescrito de
la siguiente forma:
Y
t
=
1
Y
t1
+
2
Y
t1
+ +
p
Y
tp+1
+ E
t
, E
t
R.BN(0,
2
) (9.57)
con
1
=
p
i=1
i
1, y
j
=
p
i=j
i
, j = 2, . . . , p. Deseamos probar si el polinomio
autorregresivo
p
(B) tiene una raz unitaria, es decir que
p
(1) = 0, lo cual
implica
p
i=1
i
= 1, luego,
1
= 0, esto es, probamos que
H
0
:
1
= 0 versus H
1
:
1
< 0, con
1
=
p
i=1
i
1. (9.58)
Observe que bajo H
0
, se tiene que Y
t
AR(p-1).
Para la prueba,
1
puede ser estimado como el coeciente de Y
t1
, ajustan-
do por mnimos cuadrados la regresi on de Y
t
versus (Y
t1
, Y
t1
, . . . , Y
tp+1
),
seg un el modelo sin intercepto dado en (9.57). Para n grande, bajo la hip otesis
nula, el estadstico de prueba tiene la misma distribuci on asint otica que en
el caso 1 del test DF.
Caso 2:
Y
t
AR(p) con media diferente de cero. En este caso el modelo de la serie
es dado por (9.56), y podemos reescribirlo como,
Y
t
=
0
+
1
Y
t1
+
2
Y
t1
+ +
p
Y
tp+1
+ E
t
, E
t
R.BN(0,
2
) (9.59)
con los
j
denidos de la misma forma que en el caso 1. La hip otesis nula y
alternativa es igual a (9.58), y bajo H
0
, el t ermino
0
= 0 ya que se cumple que
p
i=1
i
= 1.
De nuevo, estimamos
1
mediante el m etodo de mnimos cuadrados en la
regresi on de Y
t
versus (Y
t1
, Y
t1
, . . . , Y
tp+1
), seg un el modelo con inter-
cepto dado en (9.59) y para n grande, bajo la hip otesis nula, el estadstico de
prueba
tiene la misma distribuci on asint otica que en el caso 2 del test DF.
Caso 3:
Y
t
AR(p) con tendencia lineal. En este caso, el modelo es
(Y
t
a bt) =
p
j=1
j
[Y
tj
a b(t j)] +E
t
, E
t
R.BN(0,
2
) (9.60)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
314 CAP

o equivalentemente,
Y
t
=
0
+
1
t +
p
j=1
j
Y
tj
+ E
t
, E
t
R.BN(0,
2
) (9.61)
con
0
= a(1
p
j=1
j
) + b
p
j=1
j
j
y
1
= b(1
p
j=1
j
). Este modelo a su vez puede
ser reescrito de la siguiente forma,
Y
t
=
0
+
1
t +
1
Y
t1
+
2
Y
t1
+ +
p
Y
tp+1
+ E
t
, E
t
R.BN(0,
2
) (9.62)
con los
j
denidos de la misma forma que en el caso 1. El test a realizar igual
a (9.58) y bajo H
0
,
0
= b
p
j=1
j
j
y
1
= 0, desde que
p
i=1
i
= 1 y el estadstico
de prueba
tiene la misma distribuci on asint otica que la correspondiente al

caso 3 del test DF.
Nota: Observe que rechazar H
0
en cualquiera de los pruebas DF y ADF dice
que no hay raz unitaria; sin embargo no rechazar tal hip otesis no implica
que se deba asumir que existe una raz unitaria, pues estas pruebas adolecen
de problemas tales como baja potencia para distinguir procesos estacionarios
persistentes (con |
1
| cercano a 1) de aquellos no estacionarios, adem as la po-
tencia disminuye con la introducci on de t erminos determinsticos al modelo
AR(1) b asico sin constante. Diebold [3] establece que los problemas de poten-
cia surgen porque en general las hip otesis alternativas relevantes son muy
cercanas a la hip otesis nula, y tambi en estas pruebas presentan problemas
relacionadas al tama no de la muestra ya que en el test debera incluirse inni-
tos rezagos lo cual es imposible en la pr actica. En conclusi on, seg un Diebold
[3]: aunque a veces son utiles las pruebas de raz unitaria, no son denitivas y
por tanto son el nal de la historia respecto a la decisi on de si especicar o no
modelos en niveles o en diferencias; ... necesitamos usar introspecci on y teora,
adem as de pruebas formales, para guiar la difcil decisi on de imponer races
unitarias y comparar la eciencia del pron ostico con distintos modelos con y sin
races unitarias.
Guerrero [5] tambi en establece que en ocasiones las series de tiempo son
afectadas por la ocurrencia de fen omenos que tienen efectos de car acter per-
manente y que vuelven inecaces las pruebas de races unitarias, a menos que
se haga explcita su presencia en el modelo que representa a dicha serie. Per-
ron (1989) estudi o el problema de las races unitarias en presencia de cambios
en la estructura de comportamiento de la serie. En particular, encontr o que si
una serie de tiempo estacionaria se ve afectada por un cambio de nivel, en-
tonces, al aplicar las pruebas Dickey-Fuller, la conclusi on a la que seguramente
se llegar a es que la serie es integrada de orden 1. Por otro lado, una serie no
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
ICES UNITARIAS 315

estacionaria tambi en puede verse afectada por cambios en nivel, en pendiente,
o en ambos. Este tema en particular no ser a explorado en este curso, para
informaci on ver Guerrero [5], Secci on 4.4.2 pp. 165-170.
La aplicaci on de la prueba ADF requiere determinar cu al de los tres casos
se aproxima mejor a la serie original Y
t
, donde es inuyente el orden p del poli-
nomio autorregresivo que se considere. La sobreespecicaci on puede generar
p erdida de potencia y la sub-especicaci on puede sesgar los resultados hacia
el no rechazo de la hip otesis nula. De acuerdo a Diebold [3] es mejor esti-
mar modelos que incluyan intercepto o intercepto y tendencia, porque as se
obtiene una mejor aproximaci on a la din amica de los datos, con o sin raz
unitaria. Por otra parte, se debe diferenciar s olo cuando exista raz unitaria; si
la diferenciaci on no es adecuada esto puede ser peligroso incluso asint otica-
mente.
Se puede recurrir a la selecci on de modelos basados en alg un criterio de
informaci on para distinguir cu al de los tres casos del test ADF con modelos
AR(p) es el m as apropiado. En cuanto al orden autorregresivo, algunos autores
sugieren comenzar con p = [n
1/4
] + 1, con [] la funci on parte entera de su
argumento, por ejemplo, si n = 100 entonces considerar p = 4. En general,
elegir un valor p mayor al que se supone a priori que debera ser (Guerrero
[5]).
9.7.3. Test DF y ADF en R
En R, en la librera urca se dispone de la funci on ur.df() que permite
realizar tanto el test Dickey-Fuller como el Dickey-Fuller aumentado,
ur.df(y, type = c("none", "drift", "trend"), lags = 1,
selectlags = c("Fixed", "AIC", "BIC"))
donde,
y: Vector de datos o serie a ser probada para raz unitaria;
type: El tipo de caso none para el caso 1, drift para el caso 2 y
trend para el caso 3.
lags: el n umero de rezagos de variables end ogenas a incluir. Para el test
DF se especica lags=0 y para el test ADF se especica lags=p, donde p
es el orden autorregresivo;
selectlags: Una selecci on del orden autorregresivo puede ser hecha de
acuerdo al criterio de informaci on de Akaike AIC o el de Bayes BIC. El
n umero m aximo de rezagos a considerar es el denido en el argumento
lags. Por defecto (selectlags =Fixed) se usa el polinomio autorregre-
sivo del orden jado en lags.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
316 CAP

9.8. Ejemplo: Modelaci on de la serie tasa de cambio Yen/D olar
Esta serie es presentada en Diebold [3] y consta de N = 283 observaciones
que corresponden a la tasa de cambio (promedio mes) yen/d olar desde en-
ero de 1973 a julio de 1996. Para nes de validaci on cruzada, se usar an las
primeras n = 264 observaciones (de 1973.01 a 1994.12) y se pronosticar an las
ultimas m = 19 observaciones. La serie original y su logaritmo, junto con sus
primeras diferencias, son ilustradas en la Figura 9.7.
Time
Y
t
1975 1980 1985 1990 1995
1
0
0
1
5
0
2
0
0
2
5
0
3
0
0
Time
Y
t
1975 1980 1985 1990 1995
2
0
1
0
0
1
0
Time
l
o
g
(
Y
t
)
1975 1980 1985 1990 1995
4
.
6
4
.
8
5
.
0
5
.
2
5
.
4
5
.
6
Time
l
o
g
(
Y
t
)
1975 1980 1985 1990 1995
0
.
1
0
0
.
0
5
0
.
0
0
0
.
0
5
Figura 9.7: Serie original tasa mensual de cambio yen/US, su logaritmo y sus respectivas
diferencias de orden 1
De la gura anterior es claro que para la serie original la diferenciaci on
estabiliza el nivel de la serie pero hay problemas con la varianza, por eso se
decide considerar la transformaci on logaritmo. Para esta ultima, la diferen-
ciaci on estabiliza el nivel, y la varianza mejora sustancialmente en cuanto a
estabilidad. Por lo anterior, se decide trabajar de aqu en adelante con la serie
en escala logartmica.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
9.8. EJEMPLO: MODELACI

ON DE LA SERIE TASA DE CAMBIOYEN/D

OLAR317
9.8.1. An alisis preliminar
La serie del logaritmo no presenta patrones estacionales y parece de ten-
dencia estoc astica; a un m as, su ACF y PACF exhibidas en la Figura 9.8, nos
indica presencia de raz unitaria.
0 5 10 15 20 25 30 35
0
.
5
0
.
0
0
.
5
1
.
0
Lag
A
C
F
ACF de log(Y
t
)
0 5 10 15 20 25 30 35
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
Lag
P
a
r
t
i
a
l

A
C
F
PACF de log(Y
t
)
0 5 10 15 20 25 30 35
0
.
2
0
.
0
0
.
1
0
.
2
0
.
3
Lag
A
C
F
ACF de log(Y
t
)
0 5 10 15 20 25 30 35
0
.
1
0
.
0
0
.
1
0
.
2
0
.
3
Lag
P
a
r
t
i
a
l

A
C
F
PACF de log(Y
t
)
Figura 9.8: Arriba: ACF y PACF log tasa mensual de cambio yen/US; Abajo: ACF y PACF
primera diferencia del logaritmo
Por otro lado, el an alisis de la ACF y PACF para la primera diferencia del
logaritmo de la serie nos revela un proceso estacionario en covarianza, aunque
a primera vista no es claro si es un AR o un MA, as que asumiremos un
ARMA(p,q) y usaremos la EACF y la identicaci on autom atica para denir los
posibles ordenes p y q.
9.8.2. Identicaci on de modelos
Considere la EACF de log(Y
t
) que se muestra a continuaci on. Siendo es-
trictos con la regla del tri angulo de ceros, el modelo que se identica es un
ARMA(3,2); sin embargo, si se obvia la x en la casilla (2,12), puede consid-
erarse tambi en un MA(1) o incluso un ARMA(1,1), luego, esto implicara que
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
318 CAP

los modelos posibles para la serie log(Y
t
) seran ARIMA(3,1,2), ARIMA(0,1,1) y
ARIMA(1,1,1) (pero este ultimo no es presentado).
EACF log(Yt)
AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
2 x x o o o o o o o o o o x o
Por otra parte, tambi en se realiz o la identicaci on autom atica usando las
funciones R autoarmafit() de la librera timsac sobre la serie log(Y
t
) y
auto.arima() de la librera forecast sobre la serie log(Y
t
), en el primer ca-
so, seg un el AIC y en el segundo caso, seg un el BIC. En la Salida R 9.1,
vemos parte de los resultados con la funci on autoarmafit(), en la que se ex-
hiben los dos mejores modelos; nos interesa s olo los ordenes p y q. Luego, los
dos mejores modelos identicados para log(Y
t
) son ARMA (3,2) y ARMA(2,3);
esto implica que para la serie log(Y
t
) los modelos seran ARIMA(3,1,2) y ARI-
MA(2,1,3).
Salida R 9.1.
Best ARMA model
AR coefficient (order =3) 0.025498 -0.858122 0.278330
MA coefficient (order =2) -0.336749 -0.905025
Case No. 1
I AR(I) STANDARD DEVIATION
1 0.025498 0.085561
2 -0.858122 0.044802
3 0.278330 0.067767
I MA(I) STANDARD DEVIATION
1 -0.336749 0.061650
2 -0.905025 0.055826
AIC -1920.565606
Innovation variance 0.000649
Final gradient 2.720034e-09 1.026303e-08 1.593054e-08 1.191777e-08 -1.788662e-08
Case No. 2
I AR(I) STANDARD DEVIATION
1 -0.323346 0.047000
2 -0.934306 0.044688
I MA(I) STANDARD DEVIATION
1 -0.692615 0.077615
2 -1.059193 0.059946
3 -0.281288 0.067470
AIC -1920.455432
Innovation variance 0.000649
Final gradient -5.622938e-08 -5.308665e-08 8.198043e-08 -3.253739e-09 2.652625e-09
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z


OLAR319
Nota: La funci on autoarmafit() estima modelos ARMA de la forma
Z
t
=
p
j=1
j
Z
tj
+ a
t
k=1
k
a
tk
, a
t
R.BN(0,
2
a
)
En la Salida R 9.2 se observan los resultados de la funci on auto.arima();
vemos que el mejor modelo para log(Y
t
) seg un el BIC, es un ARIMA(1,1,0).
Salida R 9.2.
Series: lny
ARIMA(1,1,0)
Coefficients:
ar1
0.3463
s.e. 0.0589
sigma2 estimated as 0.0006871: log likelihood = 584.48
AIC = -1164.97 AICc = -1164.92 BIC = -1157.82
-0.002660729 0.026164337 0.019707790 -0.052387889 0.378215878 0.941893880
9.8.3. Ajuste modelos identicados
Se ajustan los siguientes modelos a log(Y
t
);
Modelo 1: ARIMA(1,1,0)
(1
1
B)(1 B) log(Y
t
) = E
t
, E
t
R.BN(0,
2
)
(1 B) log(Y
t
) = E
t
+
1
E
t1
, E
t
R.BN(0,
2
)
(1
1
B
2
B
2
)(1B) log(Y
t
) = E
t
+
1
E
t1
+
2
E
t2
+
3
E
t3
, E
t
R.BN(0,
2
)
(1
1
B
2
B
2
3
B
3
)(1 B) log(Y
t
) = E
t
+
1
E
t1
+
2
E
t2
, E
t
R.BN(0,
2
)
Modelos con tendencia determinstica lineal y errores ARMA(p,q)
log(Y
t
) =
0
+
1
t + E
t
,
p
(B)E
t
=
q
(B)a
t
, a
t
R.BN(0,
2
a
)
Este ultimo tipo de modelos se considera desde que un proceso homog eneo
de orden 1 tambi en conduce a que la primera diferencia sea estacionaria. A
continuaci on se presentan los resultados de los modelos 1 a 4. Los modelos
con tendencia determinstica ser an tratados posteriormente.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
320 CAP

En la siguiente tabla se presentan los resultados del ajuste para los mode-
los 1 a 4. valores omitidos en la tabla se deben a que la funci on Arima()produjo
valores faltantes en el c alculo del error est andar y por tanto no es posible
obtener el estadstico Z
0
y el correspondiente valor P para la prueba de signif-
icancia individual de los par ametros.
Estimaciones para modelos 1 a 4 con funci on Arima()
Ajuste Modelo 1
Par ametros Estimaci on s.e Valor Z
0
P(|Z| > |Z
0
|)
1
0.3463 0.0589 5.8812 0.0000
Ajuste Modelo 2
0
P(|Z| > |Z
0
|)
1
0.3806 0.0567 6.7150 0.0000
Ajuste Modelo 3
0
P(|Z| > |Z
0
|)
1
-0.0092
2
0.7379
1
0.3978
2
-0.6897 0.1429 -4.8269 0.0000
3
-0.2394
Ajuste Modelo 4
0
P(|Z| > |Z
0
|)
1
0.1699 0.0592 2.8693 0.0041
2
-0.9307 0.0110 -84.2780 0.0000
3
0.3611 0.0588 6.1400 0.0000
1
0.1973 0.0139 14.1525 0.0000
2
0.9983
0
= Estimacion/s.e
0
|) = P(Z > |Z
0
|) + P(Z < |Z
0
|)
Usando la funci on R forecast() de la librera forecast, se obtienen los
pron osticos y los intervalos de predicci on del 95% para log(Y
t
), para los meses
comprendidos entre 1995.01 a 1996.07; con la funci on accuracy() se obtu-
vieron las medidas de precisi on de pron osticos. En las dos tablas siguientes
se exhiben los resultados para los pron osticos de los modelos 1 a 4.
Precisi on pron osticos modelos 1 a 4, con funci on accuracy()
Modelo 1
ME RMSE MAE MPE MAPE MASE ACF1 Theils U
-0.03 0.09 0.07 -0.65 1.53 3.32 0.65 2.47
Modelo 2
-0.03 0.09 0.07 -0.60 1.54 3.33 0.65 2.45
Modelo 3
-0.02 0.09 0.07 -0.58 1.54 3.33 0.65 2.45
Modelo 4
-0.03 0.09 0.07 -0.70 1.55 3.35 0.65 2.49
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z


OLAR321
Pron osticos modelos 1 a 4, con funci on forecast()
Modelo 1 Modelo 2
Mes Point Forecast Lo 95 Hi 95 Point Forecast Lo 95 Hi 95
Jan 1995 4.6144 4.5631 4.6658 4.6159 4.5648 4.6669
Feb 1995 4.6170 4.5309 4.7032 4.6159 4.5289 4.7029
Mar 1995 4.6179 4.5035 4.7324 4.6159 4.5039 4.7278
Apr 1995 4.6182 4.4800 4.7564 4.6159 4.4836 4.7482
May 1995 4.6184 4.4596 4.7771 4.6159 4.4660 4.7658
Jun 1995 4.6184 4.4413 4.7955 4.6159 4.4502 4.7815
Jul 1995 4.6184 4.4247 4.8122 4.6159 4.4359 4.7959
Aug 1995 4.6184 4.4093 4.8275 4.6159 4.4226 4.8092
Sep 1995 4.6184 4.3950 4.8418 4.6159 4.4101 4.8216
Oct 1995 4.6184 4.3816 4.8552 4.6159 4.3984 4.8334
Nov 1995 4.6184 4.3689 4.8679 4.6159 4.3873 4.8445
Dec 1995 4.6184 4.3568 4.8800 4.6159 4.3767 4.8551
Jan 1996 4.6184 4.3453 4.8915 4.6159 4.3665 4.8653
Feb 1996 4.6184 4.3342 4.9026 4.6159 4.3567 4.8750
Mar 1996 4.6184 4.3235 4.9133 4.6159 4.3473 4.8844
Apr 1996 4.6184 4.3132 4.9236 4.6159 4.3382 4.8935
May 1996 4.6184 4.3033 4.9335 4.6159 4.3294 4.9023
Jun 1996 4.6184 4.2936 4.9432 4.6159 4.3209 4.9109
Jul 1996 4.6184 4.2843 4.9526 4.6159 4.3126 4.9192
Modelo 3 Modelo 4
Jan 1995 4.6150 4.5641 4.6659 4.6224 4.5729 4.6720
Feb 1995 4.6148 4.5277 4.7020 4.6211 4.5371 4.7050
Mar 1995 4.6150 4.5013 4.7286 4.6142 4.5024 4.7261
Apr 1995 4.6148 4.4785 4.7512 4.6199 4.4847 4.7551
May 1995 4.6149 4.4583 4.7715 4.6268 4.4711 4.7824
Jun 1995 4.6148 4.4395 4.7901 4.6201 4.4462 4.7941
Jul 1995 4.6149 4.4222 4.8076 4.6147 4.4244 4.8051
Aug 1995 4.6148 4.4057 4.8239 4.6224 4.4170 4.8279
Sep 1995 4.6149 4.3902 4.8395 4.6264 4.4067 4.8460
Oct 1995 4.6148 4.3753 4.8543 4.6179 4.3849 4.8509
Nov 1995 4.6149 4.3612 4.8686 4.6156 4.3701 4.8611
Dec 1995 4.6148 4.3475 4.8822 4.6245 4.3671 4.8819
Jan 1996 4.6149 4.3344 4.8954 4.6251 4.3562 4.8940
Feb 1996 4.6148 4.3216 4.9080 4.6161 4.3362 4.8960
Mar 1996 4.6149 4.3094 4.9203 4.6172 4.3268 4.9076
Apr 1996 4.6148 4.2975 4.9322 4.6260 4.3255 4.9265
May 1996 4.6149 4.2860 4.9437 4.6232 4.3128 4.9337
Jun 1996 4.6148 4.2748 4.9549 4.6150 4.2950 4.9350
Jul 1996 4.6149 4.2639 4.9658 4.6193 4.2901 4.9485
En la Figura 9.9 se muestra la serie de log(Y
t
) y sus pron osticos junto con
los lmites de predicci on representados por la zona coloreada, para los modelos
1 a 4. Considerando los resultados gr acos y los num ericos, podemos decir
que los primeros cuatro modelos alcanzan la misma calidad de pron ostico, en
la escala logartmica.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
322 CAP

Log tasa yen/$US
Pronsticos modelo 1
1975 1980 1985 1990 1995
4
.
4
4
.
6
4
.
8
5
.
0
5
.
2
5
.
4
5
.
6
Realizacin
pronosticado zona amarilla
Log tasa yen/$US
Pronsticos modelo 2
1975 1980 1985 1990 1995
4
.
4
4
.
6
4
.
8
5
.
0
5
.
2
5
.
4
5
.
6
Realizacin
Log tasa yen/$US
Pronsticos modelo 3
1975 1980 1985 1990 1995
4
.
5
5
.
0
5
.
5
Realizacin
Log tasa yen/$US
Pronsticos modelo 4
1975 1980 1985 1990 1995
4
.
4
4
.
6
4
.
8
5
.
0
5
.
2
5
.
4
5
.
6
Realizacin
Figura 9.9: Serie log tasa yen/Us y pron osticos modelos 1 a 4
Para el an alisis de los residuales de los modelos 1 a 4 considere los sigu-
ientes resultados. En cada caso podemos decir que los errores satisfacen el
supuesto de ruido blanco normal? por qu e?
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z


OLAR323
Residuos ARIMA(1,1,0) para log(Y
t
)
Time
r
e
s
i
d
u
a
l
s
(
m
o
d
1
)
1975 1980 1985 1990 1995
0
.
1
0
0
.
0
5
0
.
0
0
0
.
0
5
4.6 4.8 5.0 5.2 5.4 5.6
0
.
1
0
0
.
0
5
0
.
0
0
0
.
0
5
t
)
fitted(mod1)
r
e
s
i
d
u
a
l
s
(
m
o
d
1
)
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
0
.
1
5
Lag
A
C
F
ACF residuos ARIMA(1,1,0) para log(Y
t
)
0 5 10 15 20 25 30 35
0
.
1
0
0
.
0
0
0
.
1
0
Lag
P
a
r
t
i
a
l

A
C
F
PACF residuos ARIMA(1,1,0) para log(Y
t
)
t
)
Time
r
e
s
i
d
u
a
l
s
(
m
o
d
2
)
1975 1980 1985 1990 1995
0
.
1
0
0
.
0
5
0
.
0
0
0
.
0
5
4.6 4.8 5.0 5.2 5.4 5.6
0
.
1
0
0
.
0
5
0
.
0
0
0
.
0
5
t
)
fitted(mod2)
r
e
s
i
d
u
a
l
s
(
m
o
d
2
)
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
Lag
A
C
F
t
)
0 5 10 15 20 25 30 35
0
.
1
0
0
.
0
0
0
.
1
0
Lag
P
a
r
t
i
a
l

A
C
F
t
)
Figura 9.10: Gr acas para an alisis de residuales, modelos 1 y 2
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
324 CAP

t
)
Time
r
e
s
i
d
u
a
l
s
(
m
o
d
3
)
1975 1980 1985 1990 1995
0
.
1
0
0
.
0
5
0
.
0
0
0
.
0
5
4.6 4.8 5.0 5.2 5.4 5.6
0
.
1
0
0
.
0
5
0
.
0
0
0
.
0
5
t
)
fitted(mod3)
r
e
s
i
d
u
a
l
s
(
m
o
d
3
)
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
Lag
A
C
F
t
)
0 5 10 15 20 25 30 35
0
.
1
0
0
.
0
0
0
.
1
0
Lag
P
a
r
t
i
a
l

A
C
F
t
)
t
)
Time
r
e
s
i
d
u
a
l
s
(
m
o
d
4
)
1975 1980 1985 1990 1995
0
.
0
5
0
.
0
0
0
.
0
5
4.6 4.8 5.0 5.2 5.4 5.6
0
.
0
5
0
.
0
0
0
.
0
5
t
)
fitted(mod4)
r
e
s
i
d
u
a
l
s
(
m
o
d
4
)
0 5 10 15 20 25 30 35
0
.
1
0
0
.
0
0
0
.
1
0
Lag
A
C
F
t
)
0 5 10 15 20 25 30 35
0
.
1
0
0
.
0
0
0
.
1
0
Lag
P
a
r
t
i
a
l

A
C
F
t
)
Figura 9.11: Gr acas para an alisis de residuales, modelos 3 y 4
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z


OLAR325
EACFs residuales modelos 1 a 4
Modelo 1
AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
6 o x x x o o o o o o o o o o
Modelo 2
AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
7 x x x o o o x o o o o o o o
Modelo 3
AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
3 o x x o o o o o o o o o o o
5 o x o x x o o o o o o o o o
6 x x o x x o o o o o o o o o
7 x x o o x x o o o o o o o o
Modelo 4
AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
Test Ljung-Box, modelos 1 a 4
Modelo 1 Modelo 2
m Q
LB
g.l P(
2
m
> Q
LB
) Q
LB
g.l P(
2
m
> Q
LB
)
6 10.14 6.00 0.12 4.04 6.00 0.67
12 16.55 12.00 0.17 9.09 12.00 0.69
18 29.96 18.00 0.04 21.07 18.00 0.28
24 38.91 24.00 0.03 27.97 24.00 0.26
30 43.80 30.00 0.05 31.11 30.00 0.41
36 50.40 36.00 0.06 36.14 36.00 0.46
Modelo 3 Modelo 4
m Q
LB
g.l P(
2
m
> Q
LB
) Q
LB
g.l P(
2
m
> Q
LB
)
6 4.32 6.00 0.63 2.71 6.00 0.84
12 9.43 12.00 0.67 6.50 12.00 0.89
18 21.95 18.00 0.23 12.54 18.00 0.82
24 29.41 24.00 0.21 15.06 24.00 0.92
30 33.05 30.00 0.32 17.53 30.00 0.97
36 38.58 36.00 0.35 19.67 36.00 0.99
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
326 CAP

Test Shapiro Wilk, modelos 1 a 4
Modelo 1 Modelo 2 Modelo 3 Modelo 4
Estadstico W
0
0.980998 0.979536 0.980136 0.980302
Valor P 0.001357445 0.000758748 0.000961386 0.001027001
A continuaci on, se presentar an los resultados relativos a la identicaci on,
ajuste y pron osticos para modelos con tendencia determinstica lineal y er-
rores ARMA. Primero es necesario ajustar el modelo
Modelo 5a: log(Y
t
) =
0
+
1
t + E
t
, E
t
R.BN(0,
2
),
y a partir del an alisis de los residuales de este modelo, se identicar a el modelo
ARMA para los errores estructurales E
t
. Veamos.
Ajuste modelo tendencia lineal y Et R.BN(0,
2
)
Par ametros Estimaci on s.e T
0
P(|t
262
| > |T
0
|)
0
5.8011 0.0170 342.09 0.0000
1
-0.0041 0.0001 -37.01 0.0000
0 50 100 150 200 250
0
.
3
0
.
1
0
.
1
0
.
3
Residuos modelo 5a para log(Y
t
)
t
r
e
s
i
d
u
a
l
s
(
m
o
d
5
a
)
4.8 5.0 5.2 5.4 5.6 5.8
0
.
3
0
.
1
0
.
1
0
.
3
Residuos modelo 5a para log(Y
t
)
fitted(mod5a)
r
e
s
i
d
u
a
l
s
(
m
o
d
5
a
)
0 5 10 15 20 25 30 35
0
.
5
0
.
0
0
.
5
1
.
0
Lag
A
C
F
ACF residuos modelo 5a para log(Y
t
)
0 5 10 15 20 25 30 35
0
.
4
0
.
0
0
.
4
0
.
8
Lag
P
a
r
t
i
a
l

A
C
F
PACF residuos modelo 5a para log(Y
t
)
Figura 9.12: Gr acos residuales modelo tendencia lineal y E
t
R.BN(0,
2
)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z


OLAR327
EACF residuales Ajuste Modelo tendencia lineal y Et R.BN(0,
2
)
AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
0 x x x x x x x x x x x x x x
1 x o o x o o o o o o x x o o
2 x x o o o o o o o o o x o o
3 x x o o o o o o o o o o x o
5 o x o x o o o o o o o o o o
7 x x x x x o o o o o o o o o
De la ACF y PACF en la Figura 9.12 se identica un AR(2) para los errores
estructurales del modelo de tendencia lineal. Por otro lado, de la EACF, si
ignoramos la x en la casilla (3,12), parece que el modelo apropiado para E
t
es una ARMA(3,2), aunque aplicando en forma estricta la regla del tri angulo,
el modelo sera un ARMA(4,3) pero este ultimo no ser a considerado. Observe
adem as que el decaimiento en la ACF no es r apido, ser a que estos residuos
no provienen de un proceso estacionario?. De todas formas, se denen los
siguientes dos modelos
Modelo 5b: Tendencia lineal y errores AR(2),
log(Y
t
) =
0
+
1
t + E
t
, con E
t
=
1
E
t1
+
2
E
t2
+ a
t
, a
t
R.BN(0,
2
a
)
Modelo 5c: Tendencia lineal y errores ARMA(3,2),
log(Y
t
) =
0
+
1
t + E
t
, con
E
t
=
1
E
t1
+
2
E
t2
+
3
E
t3
+ a
t
+
1
a
t1
+
2
a
t2
, a
t
R.BN(0,
2
a
)
Estimaciones para modelos 5b y 5c con funci on Arima()
Ajuste Modelo 5b
0
P(|Z| > |Z
0
|)
1
1.3172 0.0586 22.4760 0.0000
2
-0.3462 0.0589 -5.8831 0.0000
0
5.8026 0.0913 63.5832 0.0000
1
-0.0042 0.0006 -7.2713 0.0000
Ajuste Modelo 5c
0
P(|Z| > |Z
0
|)
1
0.2777 1.2965 0.2142 0.8304
2
0.7285 1.1913 0.6115 0.5409
3
-0.0673 0.1741 -0.3863 0.6993
1
1.0766 1.2970 0.8301 0.4065
2
0.2245 0.5629 0.3987 0.6901
0
5.7961 0.0961 60.3095 0.0000
1
-0.0042 0.0006 -6.9445 0.0000
0
= Estimacion/s.e
0
|) = P(Z > |Z
0
|) + P(Z < |Z
0
|)
Para el modelo 5b, las races del polinomio autorregresivo ajustado, 11.3172B+
0.3462B
2
, son 1.047674 y 2.757063, es decir, casi tiene una raz unitaria!!!.
Para el modelo 5c las races del polinomio autorregresivo ajustado, 10.2777B
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
328 CAP

0.7285B
2
+ 0.0673B
3
, son 1.039333, -1.290755 y 11.076088, en este caso tam-
bi en vemos una raz casi unitaria; observe tambi en que aparentemente ninguno
de los coecientes del modelo ARMA(3,2) son signicativos. Lo anterior implica
que modelos asumiendo oscilaciones estacionarias alrededor de una tenden-
cia lineal posiblemente no sean adecuados y que sera mejor tener en cuenta
modelos que consideren la existencia de raz unitaria en la serie log(Y
t
).
Los pron osticos de los modelos 5b y 5c son presentados en la Figura 9.13
y en la tabla siguiente.
Log tasa yen/$US
Pronsticos modelo 5b
1975 1980 1985 1990 1995
4
.
4
4
.
6
4
.
8
5
.
0
5
.
2
5
.
4
5
.
6
Realizacin
Log tasa yen/$US
Pronsticos modelo 5c
1975 1980 1985 1990 1995
4
.
4
4
.
6
4
.
8
5
.
0
5
.
2
5
.
4
5
.
6
Realizacin
Figura 9.13: Serie log tasa yen/Us y pron osticos modelos 5b y 5c
Pron osticos modelos 5b y 5c, con funci on forecast()
Modelo 5b Modelo 5c
Jan 1995 4.6143 4.5639 4.6648 4.6154 4.5652 4.6655
Feb 1995 4.6164 4.5330 4.6999 4.6145 4.5300 4.6990
Mar 1995 4.6165 4.5075 4.7256 4.6134 4.5058 4.7211
Apr 1995 4.6158 4.4866 4.7450 4.6117 4.4861 4.7372
May 1995 4.6147 4.4692 4.7603 4.6102 4.4702 4.7502
Jun 1995 4.6134 4.4543 4.7725 4.6084 4.4561 4.7606
Jul 1995 4.6119 4.4413 4.7825 4.6067 4.4439 4.7694
Aug 1995 4.6103 4.4299 4.7907 4.6047 4.4328 4.7766
Sep 1995 4.6086 4.4196 4.7975 4.6027 4.4228 4.7827
Oct 1995 4.6067 4.4104 4.8031 4.6006 4.4136 4.7877
Nov 1995 4.6048 4.4019 4.8077 4.5985 4.4051 4.7919
Dec 1995 4.6027 4.3940 4.8114 4.5963 4.3971 4.7954
Jan 1996 4.6006 4.3867 4.8144 4.5940 4.3897 4.7983
Feb 1996 4.5983 4.3799 4.8167 4.5916 4.3826 4.8005
Mar 1996 4.5960 4.3735 4.8184 4.5892 4.3760 4.8023
Apr 1996 4.5936 4.3674 4.8197 4.5866 4.3696 4.8037
May 1996 4.5911 4.3616 4.8205 4.5841 4.3636 4.8046
Jun 1996 4.5885 4.3561 4.8208 4.5814 4.3578 4.8051
Jul 1996 4.5858 4.3508 4.8208 4.5788 4.3522 4.8054
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z


OLAR329
Precisi on pron osticos modelos 5b y 5c, con funci on accuracy()
Modelo 5b
-0.01 0.10 0.08 -0.36 1.73 3.76 0.68 2.59
Modelo 5c
-0.01 0.10 0.08 -0.25 1.78 3.87 0.68 2.60
Para el an alisis de los residuales de los modelos 5b y 5c tenga en cuenta
los siguientes resultados gr acos y num ericos Qu e puede decirse sobre los
errores de ajuste a
t
de estos dos modelos? cumplen supuestos?
EACFs residuales modelos 5b y 5c
Modelo 5b
AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
7 x x o x o x o o o o o o o o
Modelo 5c
AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
7 o x o x o o x o o o o o o o
Test Ljung-Box, modelos 5b y 5c
Modelo 5b Modelo 5c
m Q
LB
g.l P(
2
m
> Q
LB
) Q
LB
g.l P(
2
m
> Q
LB
)
6 9.49 6.00 0.15 4.65 6.00 0.59
12 17.08 12.00 0.15 10.78 12.00 0.55
18 28.42 18.00 0.06 21.11 18.00 0.27
24 37.03 24.00 0.04 27.96 24.00 0.26
30 41.39 30.00 0.08 30.92 30.00 0.42
36 47.88 36.00 0.09 36.13 36.00 0.46
Test Shapiro Wilk, modelos 5b y 5c
Modelo 5b Modelo 5c
Estadstico W
0
0.981524 0.979888
Valor P 0.001679138 0.000871606
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
330 CAP

Residuos modelo 5b para log(Y
t
)
Time
r
e
s
i
d
u
a
l
s
(
m
o
d
5
b
)
1975 1980 1985 1990 1995
0
.
0
5
0
.
0
0
0
.
0
5
4.6 4.8 5.0 5.2 5.4 5.6
0
.
0
5
0
.
0
0
0
.
0
5
Residuos modelo 5b para log(Y
t
)
fitted(mod5b)
r
e
s
i
d
u
a
l
s
(
m
o
d
5
b
)
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
0
.
1
5
Lag
A
C
F
ACF residuos modelo 5b para log(Y
t
)
0 5 10 15 20 25 30 35
0
.
1
0
0
.
0
0
0
.
1
0
Lag
P
a
r
t
i
a
l

A
C
F
PACF residuos modelo 5b para log(Y
t
)
Residuos modelo 5c para log(Y
t
)
Time
r
e
s
i
d
u
a
l
s
(
m
o
d
5
c
)
1975 1980 1985 1990 1995
0
.
0
5
0
.
0
0
0
.
0
5
4.6 4.8 5.0 5.2 5.4 5.6
0
.
0
5
0
.
0
0
0
.
0
5
Residuos modelo 5c para log(Y
t
)
fitted(mod5c)
r
e
s
i
d
u
a
l
s
(
m
o
d
5
c
)
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
0
.
0
5
Lag
A
C
F
ACF residuos modelo 5c para log(Y
t
)
0 5 10 15 20 25 30 35
0
.
1
0
0
.
0
0
0
.
1
0
Lag
P
a
r
t
i
a
l

A
C
F
PACF residuos modelo 5c para log(Y
t
)
Figura 9.14: Gr acas para an alisis de residuales, modelos 5b y 5c
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z


OLAR331
9.8.4. Pruebas de raz unitaria
A continuaci on se exhibe parte de los resultados de los testes DF para la
serie log(Y
t
).
Salida R 9.3 (DF casos 1, 2 y 3).
summary(df.mediacero)
###############################################
# Augmented Dickey-Fuller Test Unit Root Test #
###############################################
Test regression none
Call:
lm(formula = z.diff z.lag.1 - 1)
Value of test-statistic is: -2.4525
Critical values for test statistics:
1pct 5pct 10pct
tau1 -2.58 -1.95 -1.62
summary(df.drift)
###############################################
###############################################
Test regression drift
Call:
lm(formula = z.diff z.lag.1 + 1)
Value of test-statistic is: 0.0616 3.0207
1pct 5pct 10pct
tau2 -3.44 -2.87 -2.57
phi1 6.47 4.61 3.79
summary(df.tend)
###############################################
###############################################
Test regression trend
Call:
lm(formula = z.diff z.lag.1 + 1 + tt)
Value of test-statistic is: -1.5916 3.07 1.5618
1pct 5pct 10pct
tau3 -3.98 -3.42 -3.13
phi2 6.15 4.71 4.05
phi3 8.34 6.30 5.36
En la Salida R 9.3 se muestran parte de los resultados R obtenidos con
la funci on ur.df() de la librera urca, para los tres testes Dickey-Fuller, que
tambi en resumimos a continuaci on, para = 0.05.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
332 CAP

Resultados Testes DF para log(Yt)
Caso 1 Caso 2 Caso 3

0.05

,0.05

,0.05
-2.4525 -1.95 0.0616 -2.87 -1.5916 -3.42
De acuerdo a lo anterior, a un nivel de signicancia del 5%, en el test DF
casos 2 y 3 no se rechaza la hip otesis nula de raz unitaria; en el caso 1 hay
rechazo al 5%, aunque al 1% no hay rechazo. Estos resultados apoyan la
necesidad de diferenciar la serie del logaritmo de la tasa de cambio yen/US.
Pero cu al de estas tres pruebas es la m as apropiada? Para resolver esta
cuesti on se puede recurrir al ajuste de los modelos implicados por las ecua-
ciones de regresi on asociadas a estas pruebas, es decir, dadas por las ecua-
ciones (9.46), (9.50) y (9.53) y su comparaci on mediante el AIC. Para el ajuste
se puede usar la funci on R dynlm() de la librera dynlm. Dentro de esta fun-
ci on Z
t
se representa por d(Zt), Z
tk
por L(Zt,k) y Z
tj
por L(d(Zt),j) o
bien por L(difZt,j) donde difZt ha sido denido previamente como la difer-
encia de orden 1 de Zt. Si adem as se necesita incluir una tendencia lineal es
decir, a
0
+
1
t, esta se especica como trend(Zt,scale=F), donde Zt es un
objeto R denido como la serie de tiempo de inter es. Por ejemplo, para correr
el modelo en (9.53) para log(Y
t
), escribimos
dynlm(d(lny)L(lny,1)+trend(lny,scale=F))
donde lny es denido previamente en la programaci on como el logaritmo de
la serie. Si se quiere correr un modelo sin intercepto, como en el caso de la
ecuaci on (9.46), escribimos
dynlm(d(lny)L(lny,1)-1)
donde el -1 indica que no se incluye el intercepto en la regresi on.
Los modelos como los anteriores, donde las variables explicatorias son vari-
ables end ogenas, son conocidos como modelos din amicos.
Los AIC de los tres modelos correspondientes a los casos 1 a 3 de la prueba
DF se muestran en la siguiente tabla. Observe que no hay mucha diferencia
entre los tres casos, sin embargo el de menor AIC es para el caso 1, esto
indicara que sera mejor usar el test DF sin deriva.
AICs modelos DF sobre log(Yt)
Caso 1 caso 2 Caso 3
-1138.50 -1136.55 -1137.69
Considere el test ADF. Recuerde que en este test se asume un modelo AR(p)
donde p debe ser determinado, as como el caso ADF m as apropiado. Para
esto, la funci on ur.df() cuenta con los argumentos lags y selectlags con
los cuales es posible especicar, respectivamente, un valor m aximo para p y
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z


OLAR333
un criterio de selecci on, en cada uno de los casos del test ADF. Se ha denido
el valor m aximo de p igual a [n
0.25
] + 1 = [264
0.25
] + 1 = 5. Recuerde que en el
ejemplo se ajusta con las primeras 264 observaciones de la serie. Utilizando
en cada caso del test ADF los criterios de selecci on de modelos AIC y BIC, se
obtuvieron los siguientes resultados:
Salida R 9.4 (ADF caso 1).
summary(ADF.drift0AIC)
###############################################
###############################################
Call:
lm(formula = z.diff z.lag.1 - 1 + z.diff.lag)
Residuals:
-0.091680 -0.014278 0.001978 0.016301 0.070659
Coefficients:
z.lag.1 -0.0004754 0.0003093 -1.537 0.1256
z.diff.lag1 0.3603906 0.0624916 5.767 2.34e-08
***
z.diff.lag2 -0.1292056 0.0659723 -1.958 0.0513 .
z.diff.lag3 0.1024456 0.0624253 1.641 0.1020
---
1pct 5pct 10pct
tau1 -2.58 -1.95 -1.62
summary(ADF.drift0BIC)
###############################################
###############################################
Call:
lm(formula = z.diff z.lag.1 - 1 + z.diff.lag)
Residuals:
-0.093027 -0.014829 0.002271 0.015562 0.070540
Coefficients:
z.lag.1 -0.0004830 0.0003082 -1.567 0.118
z.diff.lag 0.3209434 0.0592524 5.417 1.4e-07
***
---
1pct 5pct 10pct
tau1 -2.58 -1.95 -1.62
Seg un estos resultados, los mejores modelos para el test ADF caso 1 son
p = 4 (seg un AIC) y p = 2 (seg un BIC).
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
334 CAP

summary(ADF.driftAIC)
###############################################
###############################################
Call:
lm(formula = z.diff z.lag.1 + 1 + z.diff.lag)
Residuals:
-0.091549 -0.014369 0.001935 0.016303 0.070747
Coefficients:
(Intercept) 0.002829 0.025372 0.111 0.9113
z.lag.1 -0.001010 0.004808 -0.210 0.8337
z.diff.lag1 0.361020 0.062868 5.743 2.67e-08
***
z.diff.lag2 -0.128689 0.066263 -1.942 0.0532 .
z.diff.lag3 0.103275 0.062988 1.640 0.1023
---
Value of test-statistic is: -0.2101 1.1827
1pct 5pct 10pct
tau2 -3.44 -2.87 -2.57
phi1 6.47 4.61 3.79
summary(ADF.driftBIC)
###############################################
###############################################
Call:
lm(formula = z.diff z.lag.1 + 1 + z.diff.lag)
Residuals:
-0.092946 -0.014875 0.002287 0.015635 0.070638
Coefficients:
(Intercept) 0.0022346 0.0251709 0.089 0.929
z.lag.1 -0.0009062 0.0047770 -0.190 0.850
z.diff.lag 0.3215859 0.0598071 5.377 1.71e-07
***
---
Value of test-statistic is: -0.1897 1.2268
1pct 5pct 10pct
tau2 -3.44 -2.87 -2.57
phi1 6.47 4.61 3.79
De acuerdo a estos resultados los mejores modelos para el test ADF caso 2
son p = 4 (seg un AIC) y p = 2 (seg un BIC).
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z


OLAR335
summary(ADF.tendAIC)
###############################################
###############################################
Call:
lm(formula = z.diff z.lag.1 + 1 + tt + z.diff.lag)
Residuals:
-0.090184 -0.013679 0.001223 0.016159 0.073434
Coefficients:
(Intercept) 1.723e-01 6.916e-02 2.491 0.01338
*
z.lag.1 -2.964e-02 1.188e-02 -2.495 0.01324
*
tt -1.409e-04 5.359e-05 -2.629 0.00908
**
z.diff.lag1 3.643e-01 6.216e-02 5.861 1.44e-08
***
z.diff.lag2 -1.174e-01 6.564e-02 -1.789 0.07485 .
z.diff.lag3 1.155e-01 6.244e-02 1.850 0.06545 .
---
1pct 5pct 10pct
tau3 -3.98 -3.42 -3.13
phi2 6.15 4.71 4.05
phi3 8.34 6.30 5.36
summary(ADF.tendBIC)
###############################################
###############################################
Call:
lm(formula = z.diff z.lag.1 + 1 + tt + z.diff.lag)
Residuals:
-0.088827 -0.012777 0.001856 0.017450 0.073870
Coefficients:
(Intercept) 1.692e-01 6.855e-02 2.468 0.0143
*
z.lag.1 -2.910e-02 1.178e-02 -2.471 0.0141
*
tt -1.399e-04 5.352e-05 -2.613 0.0095
**
z.diff.lag 3.283e-01 5.919e-02 5.547 7.3e-08
***
---
1pct 5pct 10pct
tau3 -3.98 -3.42 -3.13
phi2 6.15 4.71 4.05
phi3 8.34 6.30 5.36
Estos resultados indican que los mejores modelos para el test ADF caso 3 son
p = 4 (seg un AIC) y p = 2 (seg un BIC).
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
336 CAP

Un resumen de los resultados de los seis testes ADF se exhibe en la sigu-
iente tabla,
Resultados Testes ADF para log(Yt)
Criterio
0.05

,0.05

,0.05
AIC -1.5369 -1.95 -0.2101 -2.87 -2.4948 -3.42
BIC -1.5669 -1.95 -0.1897 -2.87 -2.4710 -3.42
De acuerdo a estos resultados, en todos los casos no se rechaza la hip otesis
de raz unitaria para el logaritmo de la tasa de cambio yen/US.
Ajustamos todos los seis modelos ADF anteriores usando la funci on dynlm()
y luego calculamos los AIC, que se muestran a continuaci on
AIC mejores modelos teste ADF para log(Yt)
Seg un AIC Seg un BIC Seg un AIC Seg un BIC Seg un AIC Seg un BIC
AIC -1162.26 -1169.31 -1160.27 -1167.32 -1165.31 -1172.06
De esta tabla vemos que el mejor modelo para la prueba ADF es el obtenido
como mejor modelo seg un BIC en el caso 3, es decir,
log(Y
t
) =
0
+
1
t +
1
log(Y
t1
) +
2
log(Y
t1
) + E
t
, E
t
R.BN(0,
2
)
donde
1
=
1
+
2
1, y
2
=
2
, es decir que log(Y
t
) AR(2) con tendencia
lineal.
Ahora bien, comparando los modelos asociados a los test DF y ADF, seg un
AIC, de nuevo el mejor modelo es log(Y
t
) AR(2) con tendencia lineal, esto
indica que debemos usar este modelo para probar la existencia de raz unitaria
en la serie de logaritmo de la tasa de cambio yen/US.
9.8.5. Selecci on del mejor modelo para el ajuste y pron ostico del logar-
itmo de la tasa de cambio yen/d olar
Considere todos los resultados num ericos y gr acos relativos al ajuste co-
mo a los pron osticos presentados previamente para el logaritmo de la serie,
adem as de la siguiente tabla que muestra los AIC de los modelos 1 a 4 y 5b,
5c (en escala logartmica), y determine
cu al modelo ajusta mejor al conjunto de datos 1973.01 a 1994.12?
Cu al modelo pronostica mejor los datos 1995.01 a 1996.07?
Cu al modelo recomendara? Escriba sus ecuaciones ajustada y de pron osti-
co.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z


OLAR337
AICs de los seis modelos ajustados
Modelo 1 Modelo 2 Modelo 3 Modelo 4 Modelo 5b Modelo 5c
-1164.97 -1168.34 -1161.63 -1172.77 -1169.45 -1166.50
9.8.6. C odigo R usado
A continuaci on se exhibe el c odigo R usado en la obtenci on de resultados
gr acos y num ericos presentados en este ejemplo. Tenga en cuenta que los
modelos din amicos ajustados con la funci on dynlm() fueron aquellos que la
funci on ur.df() arroj o en los testes DF y ADF, por ello, se debe primero correr
los testes de raz unitaria con esta ultima funci on y ver con un summary() los
respectivos modelos asociados antes de ajustarlos con la funci on dynlm(),
esto con el n de obtener luego los AICs respectivos para determinar cu al test
de raz unitaria debera aplicarse a la serie.
C odigo R 9.3.
library(urca)
library(forecast)
library(TSA)
library(timsac)
library(dynlm)
#Funcion usuario para obtener resultados Ljung-Box
#como se presentan en estas notas de clase
df=c(rep(NA,aux))
for(i in 1:aux){
*
i),type=type)
df[i]=test[[2]]
}
lag=6
*
c(1:aux)
rownames(teste)=lag
teste
}
################################################################################
###Lectura de los datos y analisis preliminar
################################################################################
datos=read.table(file.choose(),header=F) #Leer EXCHYENDOLAR.txt
datos=ts(datos,freq=12,start=c(1973,1))
#definicion del tamano de la muestra a usar para ajuste
#variable de tiempo en el ajuste y en pronostico con modelos lineales
n=length(datos)-19
t=1:n
tnuevo=(n+1):length(datos)
pmax=floor(n0.25)+1 #define numero maximo de p en testes ADF
#definiendo el log de los datos a ajustar y su primera diferencia
lny=ts(log(datos[1:n]),freq=12,start=c(1973,1))
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
338 CAP

dif1lny=diff(lny)
#Graficas de la serie, su diferencia y de log y su diferencia
plot(datos,ylab=expression(Y[t]))
plot(diff(datos),ylab=expression(paste(nabla,sep="",Y[t])))
abline(h=0)
plot(lny,ylab=expression(log(Y[t])))
plot(dif1lny,ylab=expression(paste(nabla,sep="",log(Y[t]))))
abline(h=0)
#Graficas de ACFs y PACs del log y de su diferencia
acf(as.numeric(lny),lag.max=36,ci.type="ma",ci.col="red",
main=expression(paste("ACF",sep=" ","de",sep=" ",log(Y[t]))))
pacf(as.numeric(lny),lag.max=36,ci.col="red",
main=expression(paste("PACF",sep=" ","de",sep=" ",log(Y[t]))))
acf(as.numeric(dif1lny),lag.max=36,ci.type="ma",ci.col="red",
main=expression(paste("ACF",sep=" ","de",sep=" ",nabla,sep="",log(Y[t]))))
pacf(as.numeric(dif1lny),lag.max=36,ci.col="red",
main=expression(paste("PACF",sep=" ","de",sep=" ",nabla,sep="",log(Y[t]))))
###############################################################################
###Identificacion de modelos
###############################################################################
#Identificacion modelos ARMA para la primera diferencia del log de la serie
eacf(dif1lny)
identif1=autoarmafit(dif1lny)
identif1
#Identificacion modelo ARIMA para log de la serie usando criterio BIC
identif2=auto.arima(lny,ic="bic")
summary(identif2)
###############################################################################
###Realizando pruebas de raz unitaria para log de la serie
###############################################################################
#Test de raz unitaria DF con media cero
df.mediacero=ur.df(lny,lags=0,type=none)
summary(df.mediacero)
#Ajuste modelo DF con media cero
reg.DFdrift0=dynlm(d(lny)L(lny,1)-1)
#Test raz unitaria DF con drift
df.drift=ur.df(lny,lags=0,type=drift)
summary(df.drift)
#Ajuste modelo DF con drift
reg.DFdrift=dynlm(d(lny)L(lny,1))
#Test raz unitaria DF con tendencia
df.tend=ur.df(lny,lags=0,type=trend)
summary(df.tend)
#Ajuste modelo DF con tendencia
reg.DFtend=dynlm(d(lny)L(lny,1)+trend(lny,scale=F))
#AICs mejores modelos DF
cbind(AICDrift0=AIC(reg.DFdrift0),AICDrift=AIC(reg.DFdrift),AICtend=AIC(reg.DFtend))
#Test raz unitaria ADF media cero, con seleccion de p segun AIC
ADF.drift0AIC=ur.df(lny,lags=pmax,type=none,selectlags =AIC)
summary(ADF.drift0AIC)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z


OLAR339
#El modelo que se ajusta es el arrojado por ADF.drift0AIC
reg.ADFdrift0aic=dynlm(d(lny)L(lny,1)+L(dif1lny,1)+L(dif1lny,2)+L(dif1lny,3)-1)
#Test raz unitaria ADF media cero, con seleccion de p segun BIC
ADF.drift0BIC=ur.df(lny,lags=pmax,type=none,selectlags =BIC)
summary(ADF.drift0BIC)
#El modelo que se ajusta es el arrojado por ADF.drift0BIC
reg.ADFdrift0bic=dynlm(d(lny)L(lny,1)+L(dif1lny,1)-1)
#Test raz unitaria ADF con drift, con seleccion de p segun AIC
ADF.driftAIC=ur.df(lny,lags=pmax,type=drift,selectlags =AIC)
summary(ADF.driftAIC)
#El modelo que se ajusta es el arrojado por ADF.driftAIC
reg.ADFdriftaic=dynlm(d(lny)L(lny,1)+L(dif1lny,1)+L(dif1lny,2)+L(dif1lny,3))
#Test raz unitaria ADF con drift, con seleccion de p segun BIC
ADF.driftBIC=ur.df(lny,lags=pmax,type=drift,selectlags =BIC)
summary(ADF.driftBIC)
#El modelo que se ajusta es el arrojado por ADF.driftBIC
reg.ADFdriftbic=dynlm(d(lny)L(lny,1)+L(dif1lny,1))
#Test raz unitaria ADF con tendencia, con seleccion de p segun AIC
ADF.tendAIC=ur.df(lny,lags=pmax,type=trend,selectlags =AIC)
summary(ADF.tendAIC)
#El modelo que se ajusta es el arrojado por ADF.tendAIC
reg.ADFtendaic=dynlm(d(lny)L(lny,1)+trend(lny,scale=F)+L(dif1lny,1)+L(dif1lny,2)+L(dif1lny,3))
#Test raz unitaria ADF con tendencia, con seleccion de p segun BIC
ADF.tendBIC=ur.df(lny,lags=pmax,type=trend,selectlags =BIC)
summary(ADF.tendBIC)
#El modelo que se ajusta es el arrojado por ADF.tendBIC
reg.ADFtendbic=dynlm(d(lny)L(lny,1)+trend(lny,scale=F)+L(dif1lny,1))
#AICs mejores modelos ADF
cbind(AICDrift0a=AIC(reg.ADFdrift0aic),AICDrift0b=AIC(reg.ADFdrift0bic),
AICDrifta=AIC(reg.ADFdriftaic),AICDriftb=AIC(reg.ADFdriftbic),
AICtenda=AIC(reg.ADFtendaic),AICtendb=AIC(reg.ADFtendbic))
###############################################################################
###Ajustes modelos ARIMA identificados para log de la serie
###############################################################################
#Modelo 1: ARIMA(1,1,0)
mod1=Arima(lny,order=c(1,1,0))
summary(mod1)
#Calculando valores de estadsticos Z0 y sus valores P en modelo 1
est=cbind(Estimacion=mod1$coef,s.e=sqrt(diag(mod1$var.coef)))
z0=est[,1]/est[,2]
#predicciones en escala log modelo 1
predmod1=forecast(mod1,h=(length(datos)-n),level=95)
predmod1
#Graficando la serie de logaritmos y predicciones modelo 1
plot(predmod1,main="Log tasa yen/$US\nPronosticos modelo 1")
lines(time(datos)[(n+1):length(datos)],log(datos)[(n+1):length(datos)],type=l,col=2,lwd=2)
legend("topright",legend=c("Realizacion","pronosticado zona amarilla"),lwd=c(2,2),col=c(2,1))
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
340 CAP

#Calculando precision de pronosticos en escala log modelo 1
accuracy(predmod1,log(datos)[(n+1):length(datos)])
#Analisis residuales del modelo 1
plot(residuals(mod1),
main=expression(paste("Residuos ARIMA(1,1,0) para ",sep=" ",log(Y[t]))))
abline(h=0,lty=2)
plot(fitted(mod1),residuals(mod1),
abline(h=0,lty=2)
acf(as.numeric(residuals(mod1)),lag.max=36,ci.type="ma",ci.col="red",
main=expression(paste("ACF residuos ARIMA(1,1,0) para",sep=" ",log(Y[t]))))
pacf(as.numeric(residuals(mod1)),lag.max=36,ci.col="red",
main=expression(paste("PACF residuos ARIMA(1,1,0) para",sep=" ",log(Y[t]))))
eacf(residuals(mod1))
BP.LB.test(residuals(mod1),maxlag=36,type="Ljung")
shapiro.test(residuals(mod1))
###############################################################################
summary(mod2)
#Calculando estadsticos Z0 y sus valores P en modelo 2
z0=est[,1]/est[,2]
#Pronosticos en escala log modelo 2
predmod2
#Calculando precision de los pronosticos en escala log modelo 2
#Analisis de residuales modelo 2
plot(residuals(mod2),main=expression(paste("Residuos ARIMA(0,1,1) para ",sep=" ",log(Y[t]))))
abline(h=0,lty=2)
abline(h=0,lty=2)
################################################################################
summary(mod3)
z0=est[,1]/est[,2]
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z


OLAR341
predmod3
#graficando la serie de logaritmos y predicciones modelo 3
abline(h=0,lty=2)
abline(h=0,lty=2)
################################################################################
summary(mod4)
z0=est[,1]/est[,2]
predmod4
abline(h=0,lty=2)
abline(h=0,lty=2)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
342 CAP

################################################################################
###Ajuste modelos de tendencia determinstica
################################################################################
#Modelo 5a: tendencia determinstica y errores R.B
mod5a=lm(lnyt)
summary(mod5a)
#Analisis de residuales modelo 5a
plot(t,residuals(mod5a),type=l,
main=expression(paste("Residuos modelo 5a para ",sep=" ",log(Y[t]))))
abline(h=0,lty=2)
plot(fitted(mod5a),residuals(mod5a),
main=expression(paste("Residuos modelo 5a para ",sep=" ",log(Y[t]))))
abline(h=0,lty=2)
acf(as.numeric(residuals(mod5a)),lag.max=36,ci.type="ma",ci.col="red",
main=expression(paste("ACF residuos modelo 5a para",sep=" ",log(Y[t]))))
pacf(as.numeric(residuals(mod5a)),lag.max=36,ci.col="red",
main=expression(paste("PACF residuos modelo 5a para",sep=" ",log(Y[t]))))
eacf(residuals(mod5a))
################################################################################
#Tendencia deterministica y errores AR(2)
mod5b=Arima(lny,order=c(2,0,0),xreg=t,method=ML)
summary(mod5b)
#Calculando estadsticos Z0 y sus valores P en modelo 5b
est=cbind(Estimacion=mod5b$coef,s.e=sqrt(diag(mod5b$var.coef)))
z0=est[,1]/est[,2]
#predicciones en escala log modelo 5b
predmod5b=forecast(mod5b,xreg =tnuevo,level=95)
predmod5b
#Graficando la serie de logaritmos y predicciones modelo 5b
plot(predmod5b,main="Log tasa yen/$US\nPronosticos modelo 5b")
#Calculando precision de los pronosticos en escala log modelo 5b
accuracy(predmod5b,log(datos)[(n+1):length(datos)])
#Analisis de residuales modelo 5b
plot(residuals(mod5b),main=expression(paste("Residuos modelo 5b para ",sep=" ",log(Y[t]))))
abline(h=0,lty=2)
plot(fitted(mod5b),residuals(mod5b),
main=expression(paste("Residuos modelo 5b para ",sep=" ",log(Y[t]))))
abline(h=0,lty=2)
acf(as.numeric(residuals(mod5b)),lag.max=36,ci.type="ma",ci.col="red",
main=expression(paste("ACF residuos modelo 5b para",sep=" ",log(Y[t]))))
pacf(as.numeric(residuals(mod5b)),lag.max=36,ci.col="red",
main=expression(paste("PACF residuos modelo 5b para",sep=" ",log(Y[t]))))
eacf(residuals(mod5b))
BP.LB.test(residuals(mod5b),maxlag=36,type="Ljung")
shapiro.test(residuals(mod5b))
################################################################################
#Tendencia determinstica y errores ARMA(3,2)
mod5c=Arima(lny,order=c(3,0,2),xreg=t,method=ML)
summary(mod5c)
#Calculando estadsticos Z0 y sus valores P en modelo 5c
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z


OLAR343
est=cbind(Estimacion=mod5c$coef,s.e=sqrt(diag(mod5c$var.coef)))
z0=est[,1]/est[,2]
#predicciones en escala log modelo 5c
predmod5c=forecast(mod5c,xreg =tnuevo,level=95)
predmod5c
#Graficando la serie de logaritmos y pronosticos modelo 5c
plot(predmod5c,main="Log tasa yen/$US\nPronosticos modelo 5c")
#Calculando precision de los pronosticos en escala log modelo 5c
accuracy(predmod5c,log(datos)[(n+1):length(datos)])
#Analisis de residuales modelo 5c
plot(residuals(mod5c),main=expression(paste("Residuos modelo 5c para ",sep=" ",log(Y[t]))))
abline(h=0,lty=2)
plot(fitted(mod5c),residuals(mod5c),
main=expression(paste("Residuos modelo 5c para ",sep=" ",log(Y[t]))))
abline(h=0,lty=2)
acf(as.numeric(residuals(mod5c)),lag.max=36,ci.type="ma",ci.col="red",
main=expression(paste("ACF residuos modelo 5c para",sep=" ",log(Y[t]))))
pacf(as.numeric(residuals(mod5c)),lag.max=36,ci.col="red",
main=expression(paste("PACF residuos modelo 5c para",sep=" ",log(Y[t]))))
eacf(residuals(mod5c))
BP.LB.test(residuals(mod5c),maxlag=36,type="Ljung")
shapiro.test(residuals(mod5c))
################################################################################
#Calculo AICs modelos ajustados a log de la serie
################################################################################
cbind(AICmod1=AIC(mod1),AICmod2=AIC(mod2),AICmod3=AIC(mod3),AICmod4=AIC(mod4),AICmod5b=AIC(mod5b),
AICmod5c=AIC(mod5c))
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
344 CAP

E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Captulo 10
Modelos SARIMA
10.1. Introducci on
La estacionalidad es un tipo particular de no estacionariedad que se pre-
senta en muchas series de tiempo, en particular, series afectadas por fen omenos
de consumo, ambientales, entre otros. La estacionalidad ha sido denida como
uctuaciones que se repiten anualmente, posiblemente con cambios graduales
a lo largo de los a nos; sin embargo, aunque en general se considere como un
fen omeno repetitivo anual esto no implica que no pueda existir modelos de
comportamiento peri odicos con duraci on menor al a no.
De acuerdo a Martnez [8], si la estacionalidad fuese exactamente peri odica,
entonces podra ser ltrada de la serie mediante una componente determinsti-
ca, pero en general, la estacionalidad es s olo aproximadamente constante.
Sea s la longitud del perodo estacional. Casi siempre la estacionalidad
puede ser eliminada de una serie tomando diferencias entre las observaciones
separadas s lugares en el tiempo y esto es denominado como diferencia esta-
cional y denotado por
s
Y
t
= Y
t
Y
ts
, con
s
= 1 B
s
.
Note que
s
=
s
, donde
s
= (1 B)
s
. En general, el operador de diferencias
estacionales de perodo s se dene como
D
s
= (1 B
s
)
D
, de modo que aplicado
a la serie Y
t
obtenemos,
D
s
Y
t
= (1 B
s
)
D
Y
t
=
D
j=0
D!
j!(D j)!
(1)
j
Y
tjs
, (10.1)
com unmente con D = 1, 2. Por ejemplo, si D = 2 y s = 12, tenemos que
2
12
Y
t
= (1 B
12
)
2
Y
t
= Y
t
2Y
t12
+ Y
t24
Note que al aplicar el operador
D
s
se pierden las primeras sD observaciones.
Considere ahora el caso D = 1 y suponga una serie con la siguiente estruc-
tura,
Y
t
= S
t
+ E
t
345
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
346 CAP
ITULO 10. MODELOS SARIMA

donde S
t
es una componente estacional determinstica de perodo s satisfa-
ciendo
S
t
= S
tks
para k = 1, 2, . . . ,
y E
t
un proceso estacionario. Entonces
s
Y
t
= Y
t
Y
ts
= (S
t
S
ts
) + (E
t
E
ts
)
=
s
E
t
es decir, la serie W
t
=
s
Y
t
es un proceso estacionario. Ahora suponga que la
estacionalidad es tal que (una estacionalidad estoc astica)
S
t
= S
ts
+ U
t
donde {E
t
} y {U
t
} son procesos estacionarios independientes. Entonces,
s
Y
t
= Y
t
Y
ts
= (S
t
S
ts
) + (E
t
E
ts
)
= U
t
+
s
E
t
entonces, en este caso tambi en obtenemos que la serie W
t
=
s
Y
t
es un proceso
estacionario.
Con los dos casos anteriores se quiere mostrar que el operador
s
puede
convertir un proceso estacional en un proceso estacionario.
Nota:
1. Si el proceso {U
t
} es un ruido blanco entonces S
t
= S
ts
+ U
t
dene una
caminata aleatoria estacional.
2. Si VAR[U
t
] VAR[E
t
], entonces {S
t
} modelara una componente esta-
cional que cambia lentamente.
3. Bajo la condici on de que {E
t
} y {U
t
} son ruidos blancos independientes,
la ACF de
s
Y
t
= U
t
+
s
E
t
tendr a un patr on similar al correspondiente a
la ACF de un modelo MA(1)
s
, que se ver a m as adelante.
10.2. Modelos ARIMA estacionales
En muchos casos, es posible que la estacionalidad de una serie en lugar
de ser una componente determinstica e independiente de otras componentes
de la serie, sea una componente estoc astica y correlacionada con compo-
nentes no estacionales. De acuerdo a Wei [9], un proceso {Y
t
} puede contener
relaciones intra periodos y entre perodos estacionales. Las relaciones intra
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
10.2. MODELOS ARIMA ESTACIONALES 347
perodos representan la correlaci on entre . . . , Y
t2
, Y
t1
, Y
t
, Y
t+1
, Y
t+2
, . . ., mien-
tras que las relaciones entre perodos estacionales representan la correlaci on
entre . . . , Y
t2s
, Y
ts
, Y
t
, Y
t+s
, Y
t+2s
, . . . Las relaciones intra perodos pueden mod-
elarse por un modelo ARIMA(p,d,q), es decir, de la forma
p
(B)
d
Y
t
=
q
(B)b
t
(10.2)
donde b
t
es un ruido blanco,
p
(B) = 1
1
B
2
B
2

p
B
p
y
q
(B) = 1 +
1
B+
2
B
2
+ +
q
B
q
, ambos polinomios sin races comunes y de m odulo mayor
a 1. Sin embargo, si b
t
contiene correlaciones no explicadas entre perodos
estacionales, es decir, si sigue un proceso ARIMA(P,D,Q)
s
, dado por
P
(B
s
)
D
s
b
t
=
Q
(B
s
)E
t
, con E
t
R.B (10.3)
donde
P
(B
s
) = 1
1
B
s
2
B
2s

P
B
Ps
y
Q
(B
s
) = 1+
1
B
s
+
2
B
2s
+ +
Q
B
Qs
, ambos polinomios de B
s
sin races comunes y con m odulo mayor a 1,
entonces, combinando (10.2) y (10.3), obtenemos el modelo Arima estacional
multiplicativo o SARIMA, dado por
p
(B)
P
(B
s
)
d
D
s
Y
t
=
q
(B)
Q
(B
s
)E
t
, E
t
R.BN(0,
2
) (10.4)
donde
p
(B) y
q
(B) son llamados los polinomios autorregresivo y de medias
m oviles, regulares, respectivamente, en tanto que
P
(B
s
) y
Q
(B
s
) son llama-
dos los polinomios autorregresivo y de medias m oviles, estacionales, respecti-
vamente. El modelo en (10.4) es denotado por ARIMA(p,d,q) (P,D,Q)
s
donde s
se reere al perodo estacional.
Nota:
1. Si d = D = 0, el modelo es conocido como Arma estacional o estacionario
estacional y denotado por ARMA(p,q) (P,Q)
s
, es decir,
p
(B)
P
(B
s
)Y
t
=
q
(B)
Q
(B
s
)E
t
, E
t
R.BN(0,
2
) (10.5)
con
p
(B) y
P
(B
s
) sin races unitarias en B y B
s
, respectivamente.
2. Decimos que un proceso {Y
t
} sigue un modelo Arima estacional multi-
plicativo de perodo s, con parte regular con ordenes p, d, q y parte esta-
cional con ordenes P, D, Q, si la serie diferenciada W
t
=
d
D
s
Y
t
satisface
un modelo Arma estacional, ARMA(p,q) (P,Q)
s
.
10.2.1. Algunos casos especiales de modelos SARIMA
Modelos ARIMA puramente estacionales
Estos corresponden a los casos ARIMA(0,0,0) (P,D,Q)
s
y tambi en denota-
dos por ARIMA(P,D,Q)
s
, con ecuaci on,
P
(B
s
)
D
s
Y
t
=
Q
(B
s
)E
t
, E
t
R.BN(0,
2
) (10.6)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
348 CAP

Si D = 0, Q = 0 y P = 1 tenemos el modelo AR(1)
s
, donde Y
t
=
1
Y
ts
+ E
t
. Para
este proceso se tiene que
k
=
_
_
_
j
1
1
2
1
para k = js, j = 0, 1, 2, . . .
0 k = js
Luego, la ACF y PACF son dadas por
k
=

k
0
=
_
j
1
para k = js, j = 0, 1, 2, . . .
0 k = js
,
kk
=
_
_
1 para k = 0;
1
para k = s;
0 k = 0, s
Observe por ejemplo, la siguiente gura.
k
(
k
)
1
0
1
0 s 2s 3s 4s 5s 6s
1
> 0
k
k
k
1
0
1
s
1
> 0
k
(
k
)
1
0
1
0 s 2s 3s 4s 5s 6s
1
< 0
k
k
k
1
0
1
s
1
< 0
Figura 10.1: ACFs y PACFs modelos AR(1)
s
Si P = 0, D = 0 y Q = 1, el proceso sigue un modelo MA(1)
s
, dado por
Y
t
= E
t
+
1
E
ts
, para el cual
(k) =
_
2
(1 +
2
1
) si k = 0
2
si k = s
0 si k = 0, s
;
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
y la ACF y PACF son dadas por
(k) =
_
_
1 si k = 0
1
1 +
2
1
si k = s
0 si k = 0, s
;
kk
=
_
_
1 si k = 0,
(1)
k+1
k
1
(1
2
1
)
1
2(k+1)
1
si k = js, j = 1, 2, . . .
;
Observe las ACFs y PACFs que se ilustran a continuaci on.
k
(
k
)
1
0
1
0 s 2s 3s 4s 5s 6s
1
> 0
k
k
k
0.5
0
0.5
s 2s 3s 4s 5s 6s
1
> 0
k
(
k
)
1
0
1
0 s 2s 3s 4s 5s 6s
1
< 0
k
k
k
0.5
0
0.5
s 2s 3s 4s 5s 6s
1
< 0
Figura 10.2: ACFs y PACFs modelos MA(1)
s
En el caso de un ARMA(P,Q)
s
, es decir,
P
(B
s
)Y
t
=
Q
(B
s
)E
t
, E
t
R.B,
observaremos que la ACF y PACF se comportan como en el caso de un AR-
MA(p,q), es decir, patr on de cola en ambas gr acas, s olo que tomando valores
no nulos en k = js, j = 1, 2, . . .. Por ejemplo, vea las ACF y PACF ilustradas en
la Figura 10.3.
Modelos ARMA(p,q) (P,Q)
s
En estos casos, d = D = 0. Estos modelos son como un ARMA(p+Ps,q+Qs)
pero s olo p+P +q +Q+pP +qQ coecientes son diferentes de cero. Por ejemplo,
MA(1) MA(1)
s
, MA(1) AR(1)
s
, AR(1) MA(1)
s
, AR(1) AR(1)
s
. En las Figuras
10.4, 10.5, 10.6 y 10.7 se ilustran la ACF y PACF de algunos de estos casos.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
350 CAP

k
(
k
)
1
0
1
0 s 2s 3s 4s 5s 6s
1
> 0,
1
> 0
k
k
k
1
0
1
s 2s 3s 4s 5s 6s
1
> 0,
1
> 0
k
(
k
)
1
0
1
0 s 2s 3s 4s 5s 6s
1
< 0,
1
< 0
k
k
k
1
0
1
s 2s 3s 4s 5s 6s
1
< 0,
1
< 0
k
(
k
)
1
0
1
0 s 2s 3s 4s 5s 6s
1
> 0,
1
< 0,
1
>
1
k
k
k
0.5
0
0.5
s 2s 3s 4s 5s 6s
1
> 0,
1
< 0,
1
>
1
k
(
k
)
1
0
1
0 s 2s 3s 4s 5s 6s
1
> 0,
1
< 0,
1
<
1
k
k
k
0.5
0
0.5
s 2s 3s 4s 5s 6s
1
> 0,
1
< 0,
1
<
1
Figura 10.3: ACFs y PACFs modelos ARMA(1,1)
s
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
k
(
k
)
1
0
1
0 12 24 36
1
= 0.5,
1
= 0.8
k
k
k
1
0
1
12 24 36
1
= 0.5,
1
= 0.8
k
(
k
)
1
0
1
0 12 24 36
1
= 0.5,
1
= 0.8
k
k
k
1
0
1
12 24 36
1
= 0.5,
1
= 0.8
k
(
k
)
1
0
1
0 12 24 36
1
= 0.5,
1
= 0.8
k
k
k
1
0
1
12 24 36
1
= 0.5,
1
= 0.8
Figura 10.4: ACFs y PACFs modelos MA(1) MA(1)
12
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
352 CAP

k
(
k
)
1
0
1
0 12 24 36
1
= 0.75,
1
= 0.4
k
k
k
1
0
1
12 24 36
1
= 0.75,
1
= 0.4
k
(
k
)
1
0
1
0 12 24 36
1
= 0.75,
1
= 0.4
k
k
k
1
0
1
12 24 36
1
= 0.75,
1
= 0.4
k
(
k
)
1
0
1
0 12 24 36
1
= 0.75,
1
= 0.4
k
k
k
1
0
1
12 24 36
1
= 0.75,
1
= 0.4
Figura 10.5: ACFs y PACFs modelos MA(1) AR(1)
12
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
k
(
k
)
1
0
1
0 12 24 36
1
= 0.8,
1
= 0.7
k
k
k
0.5
0
0.71
12 24 36
1
= 0.8,
1
= 0.7
k
(
k
)
1
0
1
0 12 24 36
1
= 0.8,
1
= 0.7
k
k
k
0.71
0
0.5
12 24 36
1
= 0.8,
1
= 0.7
k
(
k
)
1
0
1
0 12 24 36
1
= 0.8,
1
= 0.7
k
k
k
1
0
1
12 24 36
1
= 0.8,
1
= 0.7
Figura 10.6: ACFs y PACFs modelos AR(1) MA(1)
12
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
354 CAP

k
(
k
)
1
0
1
0 4 8 12 16 20 24
1
= 0.5,
1
= 0.8
k
k
k
1
0
1
4 8 12 16 20 24
1
= 0.5,
1
= 0.8
k
(
k
)
1
0
1
0 4 8 12 16 20 24
1
= 0.5,
1
= 0.8
k
k
k
1
0
1
4 8 12 16 20 24
1
= 0.5,
1
= 0.8
k
(
k
)
1
0
1
0 4 8 12 16 20 24
1
= 0.5,
1
= 0.8
k
k
k
1
0
1
4 8 12 16 20 24
1
= 0.5,
1
= 0.8
k
(
k
)
1
0
1
0 4 8 12 16 20 24
1
= 0.5,
1
= 0.8
k
k
k
1
0
1
4 8 12 16 20 24
1
= 0.5,
1
= 0.8
Figura 10.7: ACFs y PACFs modelos AR(1) AR(1)
4
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
10.3. ACF DE PROCESOS ESTACIONALES 355
Modelos Air Passengers
Corresponde al modelo ARIMA(0, 1, 1) (0, 1, 1)
s
, es decir
(1 B)(1 B
s
)Y
t
= (1 +
1
B)(1 +
1
B
s
)E
t
, E
t
R.BN(0,
2
)
Este modelo ha sido muy util para representar series de tiempo estacionales
tales como datos de aerolneas, de ah su nombre. Observe que considerando
el proceso denido por W
t
=
s
Y
t
, este sigue un MA(1) MA(1)
s
, para el cual
se tiene que su ACF es dada por
(k) =
_
_
1 si k = 0
1
1 +
2
1
si k = 1
1
(1 +
2
1
)(1 +
2
1
)
si k = s 1, s + 1
1
1 +
2
1
si k = s
0 en otro caso
.
10.2.2. Series con tendencia y estacionalidad estoc asticas
Considere un proceso {Y
t
}, tal que
Y
t
= T
t
+ S
t
+ E
t
donde
T
t
= T
t1
+ U
t
, S
t
= S
ts
+ V
t
con {E
t
}, {U
t
} y {V
t
} son ruidos blancos mutuamente independientes y la com-
ponente estacional es de perodo s. Bajo estas condiciones observe que {T
t
}
describe una caminata aleatoria y {S
t
} una caminata aleatoria estacional. En
este caso es necesario tomar tanto una diferencia regular como una diferencia
estacional para obtener un proceso estacionario,
s
Y
t
= (E
t
+ U
t
+ V
t
) (E
t1
+ V
t1
) (E
ts
+ U
ts
) + E
ts1
este proceso tiene una ACF distinta de cero en k = 0, 1, s 1, s, s + 1 como en el
caso de un proceso MA(1) MA(1)
s
As, el proceso {Y
t
} se comporta de man-
era similar a un proceso ARIMA(0,1,1) (0,1,1)
s
, aunque a diferencia de este
ultimo, involucra tres tipos de innovaciones denidas por los ruidos blancos.
10.3. ACF de procesos estacionales
Sea W
t
=
d
D
s
Y
t
= (1 B)
d
(1 B
s
)
D
Y
t
el proceso estacionario resultante
de diferenciar d veces de forma regular y D veces de forma estacional a Y
t
.
Entonces W
t
ARMA(p + Ps, q + Qs), tal que
p
(B)
P
(B
s
)W
t
=
q
(B)
Q
(B
s
)E
t
, E
t
R.BN(0,
2
)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
356 CAP

La ACF de W
t
es una mezcla de sus componentes regulares y estacionales. De
acuerdo a Martinez [8], puede mostrarse que si r
j
son las autocorrelaciones
del proceso ARMA(p,q) regular
p
(B)x
t
=
q
(B)u
t
y si R
js
son las autocorrelaciones en los rezagos s, 2s, 3s, . . . del proceso ARMA(P,Q)
s
estacional
P
(B
s
)z
t
=
Q
(B
s
)v
t
entonces la ACF (k) del proceso W
t
satisface
(k) =
r
k
+
j=1
R
js
(r
js+k
+ r
jsk
)
1 + 2
j=1
r
js
R
js
(10.7)
Si suponemos que r
k
0 en rezagos k altos, entonces
1. En rezagos k bajos (k < s) se observar a unicamente la ACF de la parte
regular, es decir, (k) r
k
.
2. En valores de rezagos estacionales (k = js, j = 1, 2, . . .), se observar a b asica-
mente la ACF de la parte estacional y suponiendo que r
js
0 para
j = 1, 2, . . ., entonces (js) R
js
, j = 1, 2, . . ..
3. Alrededor de los rezagos estacionales, k = js, j = 1, 2, . . ., donde (k) no
sea nulo, se observar a la interacci on entre la parte regular y la estacional,
que se manifestar a como la repetici on de la ACF de la parte regular a
ambos lados de cada rezago estacional.
Guerrero [5], Secci on 5.2.1 (pp. 185 - 205) presenta las ACFs te oricas de
algunos modelos SARIMA.
10.4. PACF y EACF de procesos estacionales
Seg un Wei [9], las componentes autorregresivas regular y estacional del
proceso producen patrones de corte en la PACF, en los rezagos no estacionales
y estacionales, respectivamente; por otro lado, las componentes de medias
m oviles estacionales y no estacionales producen patrones de decaimiento ex-
ponenciales y/o sinusoidales amortiguados, en los respectivos rezagos esta-
cionales y no estacionales. Martnez [8] tambi en enuncia lo siguiente:
1. En los primeros rezagos aparece la PACF de la parte regular y en los
rezagos estacionales aparece la PACF de la parte estacional.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
10.5. CONSTRUCCI
ON Y PRON

OSTICOS EN MODELOS ESTACIONALES357
2. A la derecha de cada coeciente de autocorrelaci on parcial estacional no
nulo, es decir, en los rezagos k = js + 1, js + 2, . . . aparece la PACF de la
parte regular, en forma invertida si
js,js
es positivo y con su signo si
js,js
es negativo.
3. A la izquierda de
js,js
, es decir, en los rezagos k = js 1, js 2, . . . se
observar a la ACF de la parte regular.
4. En modelos estacionales la PACF en k = js, j = 1, 2, . . . suele ser de mag-
nitud mucho menor que en el caso de una estructura estacional pura.
De acuerdo a Wei [9], en modelos estacionales la construcci on de la EACF es
bastante dispendiosa y en general muy complicada y su uso en la identi-
caci on de series estacionales es muy limitada.
10.5. Construcci on y pron osticos en modelos estacionales
Desde que los modelos Arima estacionales son un caso especial de los mod-
elos Arima, la identicaci on del modelo, la estimaci on de los par ametros, el
chequeo de supuestos y diagn osticos y la obtenci on de pron osticos para estos
modelos estacionales utilizan los mismos m etodos generales vistos para los
modelos Arima, aunque la identicaci on es un poco m as complicada ya que
el n umero de modelos que podran postularse para una serie dada aumenta
considerablemente. Tenga en cuenta que la identicaci on de la estructura no
estacionaria consiste en (Martnez [8]):
1. Determinar si es necesario realizar alguna transformaci on de los datos
para estabilizar la varianza.
2. Determinar el n umero de diferencias regulares d para que la media sea
constante, generalmente d = 1, 2. Si la serie tiene tendencia o muestra
cambio de nivel en la media, debe diferenciarse y esta situaci on se deduce
generalmente del gr aco de la serie; sin embargo, si la decisi on no resulta
clara a trav es del gr aco de la serie, se debe estudiar la ACF y PACF donde
una serie no estacionaria presenta una estructura AR con decrecimiento
lento en la ACF. En procesos con estructura estacional sinusoidal la ACF
ser a una mezcla de las componentes regulares y estacionales, y puede
mostrarse que esta funci on seguir a un patr on sinusoidal; en este caso
la no estacionaridad se manifestar a tambi en por un decrecimiento muy
lento de la ACF y ser a necesario diferenciar la serie.
Debido a que al diferenciar una serie no estacionaria hasta convertirla en
una serie estacionaria se espera tambi en una disminuci on de la varian-
za, algunos autores recomiendan diferenciar en forma regular hasta que
la varianza aumente al diferenciar; sin embargo, hay que ser cautos con
esta recomendaci on pues es posible que para una serie estacionaria su
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
358 CAP

varianza tambi en disminuya al diferenciarla. Otra forma de determinar
la necesidad de diferenciar es mediante la aplicaci on de un test de raz
unitaria, sin embargo recuerde que estos testes adolecen de baja poten-
cia, es decir, tienden a rechazar poco la hip otesis nula de raz unitaria
cuando en realidad hay estacionariedad.
3. Si la serie puede ser a priori estacional con un perodo s, aplicar la difer-
encia estacional
s
= 1 B
s
, y siempre que exista componente estacional
hay que aplicar una diferencia estacional. Recuerde que la estacionalidad
se maniesta cuando
a) en el gr aco de la serie aparece un patr on repetido en todos los a nos;
b) en la ACF se presentan coecientes de autocorrelaci on altos que de-
crecen lentamente, en los rezagos k = s, 2s, 3s, etc.
c) Cuando tanto una diferencia regular y una estacional son necesaria,
observamos que al aplicar s olo la diferencia regular que elimina la
tendencia, las pautas estacionales aparecen m as claramente.
4. Para la identicaci on de la estructura ARMA, una vez obtenida la serie
estacionaria W
t
=
d
D
s
Y
t
, para d y D apropiados, se calcula la ACF y
PACF muestrales del proceso W
t
. Si este proceso es estacional debe es-
tudiarse la ACF y PACF en los rezagos k = s, 2s, . . . para identicar la
estructura ARMA estacional. Recuerde que la estructura ARMA regular
en la ACF y PACF aparecen en los rezagos bajos y que alrededor de los
rezagos estacionales se observa la interacci on entre la parte regular y
la estacional. Tenga en cuenta lo descrito previamente sobre las carac-
tersticas de la ACF y PACF de Arimas estacionales.
En esta etapa tambi en se recomienda iniciar primero con modelos AR o
MA de orden bajo, pero tambi en tratando de explicar los rasgos obvios
observados en la ACF y PACF, adem as, utilizar las interacciones alrede-
dor de los rezagos estacionales para conrmar la concordancia entre la
parte regular y la estacional.
5. Respecto a la b usqueda de componentes determinsticas, Martnez [8]
muestra que en general el modelo
(1 B)
d
Y
t
= (1 B)
d
E
t
, E
t
R.B
es equivalente al modelo de tendencia polin omica
Y
t
=
0
+
1
t + +
d
t
d
+ E
t
La anterior situaci on tambi en se da con los operadores estacionales. Por
ejemplo, la soluci on de
(1 B
12
)Y
t
= (1 B
12
)E
t
, E
t
R.B
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
10.6. RA
ICES UNITARIAS ESTACIONALES 359

es Y
t
= S
t
+ E
t
con S
t
funci on peri odica de perodo s tal que S
t
= S
t12
para todo t. As, por ejemplo, cuando aparece una componente MA(1)
estacional con par ametro
1
1, esto puede ser un indicio de que hay
componente estacional determinstica. Pero hay que tener cuidado con
esta conclusi on puesto que una raz unitaria en la parte MA (regular o
estacional) tambi en puede originarse por una sobre diferenciaci on. Por
ejemplo, si se toma una diferencia estacional en el modelo Y
t
= S
t
+ E
t
cuando S
t
= 0, o una diferencia regular en el modelo Y
t
=
0
+ E
t
.
10.6. Races unitarias estacionales
Cuando hay estacionalidad lo m as conveniente es incluir esta componente
en el modelo, y al hacerlo, es necesario contar con una metodologa que per-
mita probar la existencia de races unitarias estacionales (Guerrero [5]).
Al igual que en el caso de races unitarias regulares visto en el Captu-
lo anterior, las races unitarias estacionales est an asociadas con el grado de
diferenciaci on necesaria para estacionarizar la serie. Pero en este caso, de
acuerdo a Guerrero [5], el hecho de que una serie requiera de diferencias esta-
cionales debe verse como se nal de que los efectos estacionales de la serie no
son estables en el tiempo. Por otra parte, debemos considerar los testes de
races unitarias estacionales como herramientas que complementan el an ali-
sis exploratorio de la serie que se realiza con base en la gr aca de la serie, la
ACF muestral y la evaluaci on de la varianza con distintos ordenes de diferen-
ciaci on.
Recuerde que la diferenciaci on estacional se realiza con el ltro
D
s
=
(1 B
s
)
D
. Si se requieren d diferencias regulares y D diferencias estacionales
para estacionarizar una serie Y
t
, decimos que Y
t
es integrada de orden d, D y
escribimos Y
t
I(d,D)
s
. Tambi en tenga en cuenta que cuando hay estacionali-
dad, existen tres posibles modelos para la serie,
1. Modelos de componentes determinsticas y modelos de descomposici on;
2. Modelos no estacionarios integrados estacionalmente (SARIMA), es decir
ARIMA(p,d,q) (P,D,Q)
s
, con d = 0 y D = 0;
3. Modelo estacionario estacional, es decir, ARIMA(p,0,q)(P,0,Q)
s
o ARMA(p,q)
(P,Q)
s
, que es equivalente a un ARMA(p+Ps,q+Qs) estacionario, es decir,
sus polinomios autorregresivos regular y estacional son de races con
m odulo mayor a 1, y es invertible si los polinomios de medias m oviles
regular y estacional son tambi en de races con m odulo mayor a 1. Este
modelo tambi en es llamado SARMA.
Cada uno de estos tres diferentes tratamientos de las series ser a correcto si
se le aplica a un determinado comportamiento del proceso generador de los
datos. As, por ejemplo, si empleamos variables indicadoras para tratar la esta-
cionalidad cuando lo correcto era diferenciar, entonces tendremos un modelo
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
360 CAP

mal especicado que puede conducir a conclusiones erradas. Si el proceso
que genera los datos implica que el comportamiento estacional es puramente
determinstico, entonces la mejor aproximaci on ser a emplear variables indi-
cadoras. Si por el contrario, el proceso generador de los datos corresponde
a un proceso estacionario estacional, entonces la mejor opci on ser a estimar
un modelo SARMA. Pero, si por el contrario el proceso generado de los datos
implica la presencia de un proceso no estacionario estacional (races unitarias
estacionales) entonces la aproximaci on correcta es emplear la integraci on (o
diferenciaci on) estacional.
La diferencia entre estas tres posibles formas de estacionalidad es que en
el caso de la estacionalidad determinstica y la estacionaria los choques en
el modelo desaparecen en el largo plazo (se regresa a la media o a la ten-
dencia seg un sea el caso). Por el contrario, en los modelos no-estacionarios
estacionales los choques tienen efecto permanente y se incorporan a la serie y
estos procesos tienen propiedades similares a las series integradas ordinarias,
tales como memoria larga, varianzas que crecen linealmente y asint oticamente
no est a correlacionados con otras races de otras frecuencias.
Hylleberg, Engle, Granger y Yoo [6] establece adem as, que una serie con
una estacionalidad clara puede incluso tener una combinaci on de algunos de
los tres tipos de modelos de estacionalidad citados.
Para poder introducir las pruebas de races unitarias estacionales, con-
sidere la siguiente denici on:
Denici on: Un proceso ARMA(p,q) se dice es integrado estacional o de raz
unitaria estacional, de perodo s (con s par), si alguna o todas las races de
1 x
s
son races del polinomio que dene la parte autorregresiva del proceso.
Por ejemplo, si s = 4, tenemos que las races de 1 x
4
son 1, 1, i, i, con i =
1. Si s = 12 entonces las races de 1x

12
son 1, 1, i, (1i
3)/2, (1i
3)/2,
(
3 i)/2 y (
3 i)/2.
Las races unitarias se pueden identicar con los angulos que forma |x|
(m odulo de x) con el eje X, denidos por = 2j/s, j = 0, 1, 2, . . . , s 1. Estos
angulos se denominan las frecuencias estacionales.
10.6.1. Test HEGY de raz unitaria estacional
Este test fue propuesto por Hylleberg, et. al. [6]. El objetivo de esta prueba
es determinar si se necesitar a diferenciar o no la serie y el tipo de diferen-
ciaci on, para obtener estacionaridad. La prueba parte de un modelo AR (in-
nito) (B)Y
t
= E
t
y construye una ecuaci on de regresi on del tipo visto en el
test de Dickey-Fuller para probar las hip otesis de inter es, y para ello se hace
uso del siguiente resultado llamado Representaci on de Lagrange:
Cualquier polinomio (x), posiblemente innito o racional, que toma un valor
nito sobre los puntos c
1
, c
2
, . . . , c
r
, distintos de cero y posiblemente complejos
(c
k
C, k = 1, 2, . . . , r) puede expresarse en t erminos de polinomios elementales
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
10.6. RA

m as un residuo, de la siguiente manera
(x) =
r
k=1
k
(x)[1
k
(x)]
k
(x)
+ (x)
(x) (10.8)
donde
(x) es un polinomio que corresponde a un proceso estacionario,
k
=
(c
k
)
j=k
j
(c
k
)
; (x) =
r
k=1
k
(x);
k
(x) = 1
x
c
k
. (10.9)
De la denici on de
k
y de
k
(x), se deduce que el polinomio (x) tendr a una
raz unitaria en c
k
si y s olo s el correspondiente
k
es igual a cero, es decir,
(c
k
) = 0
k
= 0
Por tanto, el polinomio (B) tendr a una raz c
k
si y s olo s
k
= 0.
La prueba de raz unitaria estacional es para determinar si c
k
es una raz
estacional. Los
k
aparecen involucrados en los coecientes de una regresi on
lineal m ultiple que se dene usando (10.8) en la ecuaci on (B)Y
t
= E
t
.
Para entender c omo opera esta prueba considere el caso s = 4, es decir, esta-
cionalidad trimestral. Las races a evaluar son c
1
= 1, c
2
= 1, c
3
= i y c
4
= i.
En este caso se quiere determinar si en la representaci on autorregresiva del
proceso de la serie observada, alguno o todos los c
k
son races del polinomio
(B), donde la raz c
1
= 1 implica que Y
t
Y
t1
y por tanto est a asociada a
un proceso no estacional (de frecuencia cero por a no); la raz c
2
= 1 impli-
ca que Y
t
Y
t1
Y
t2
, por tanto est a asociada a un proceso de frecuencia
estacional de dos veces por a no; por su parte, las races i implican conjun-
tamente que Y
t
Y
t2
Y
t4
y por tanto, est an asociadas a procesos de
frecuencia estacional de 1 vez por a no.
Note que si
4
Y
t
= (1 B
4
)Y
t
es estacionario, debe cumplirse al menos una
de las siguientes condiciones
C1. (1B) = 0 y por lo tanto tendremos que Y
t
Y
t1
ser a estacionario y existe
una raz unitaria no estacional.
C2. (1 + B) = 0, esto implica que Y
t
+ Y
t1
ser a estacionario y existe una raz
semestral (bianual).
C3. 1 + B
2
= 0 y por lo tanto Y
t
+ Y
t2
ser a estacionario, y existe una raz
unitaria anual.
Usando los valores c
k
identicados, tenemos que
1
(B) = 1 B;
2
(B) = 1 +B;
3
(B) = 1 +iB;
4
(B) = 1 iB (10.10)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
362 CAP

luego (B) =
4
k=1
k
(B) = 1B
4
, y reemplazando en (10.8), con x = B, obtenemos
(B) =
1
B(1 +B + B
2
+ B
3
) +
2
(B)(1 B + B
2
B
3
)
+
3
(iB)(1 B
2
)(1 iB) +
4
(iB)(1 B
2
)(1 + iB) + (1 B
4
)
(B)
(10.11)
y como(B) es real,
3
y
4
deben ser complejos conjugados.
La prueba de HEGY emplea estadsticos que permiten comprobar las 3
condiciones C1, C2, C3 conjuntamente y de manera individual. Para ello, de-
ne las siguientes variables
X
1,t
= (1 +B)(1 +B
2
)Y
t
= (1 +B + B
2
+ B
3
)Y
t
X
2,t
= (1 B)(1 +B
2
)Y
t
= (1 B + B
2
B
3
)Y
t
=
X
3,t
= (1 B)(1 +B)Y
t
= (1 B
2
)Y
t
(10.12)
tambi en se denen los par ametros,
1
=
1
,
2
=
2
, 2
3
=
3
+
4
i, 2
4
=
3
4
i
y utilizando estas nuevas variables y los par ametros
j
, reescribimos la ecuaci on
(B)Y
t
= E
t
como
(B)Y
t
=
1
X
1,t1
2
X
2,t1
(
4
+
3
B)X
3,t1
+
(B)
4
Y
t
= E
t
de donde
(B)
4
Y
t
=
1
X
1,t1
+
2
X
2,t1
+
4
X
3,t1
+
3
X
3,t2
+ E
t
(10.13)
Note que X
1,t
tiene asociada a la raz c
1
= 1 y por tanto corresponde a un
proceso no estacional (de frecuencia cero veces por a no); X
2,t
est a asociada a
la raz c
2
= 1 y por tanto corresponde a un proceso estacional de frecuencia
dos veces por a no, mientras que X
3,t
tiene asociadas las races c
3
= i y c
4
= i
y su frecuencia estacional es de una vez por a no. Por otro lado, se asume que
el polinomio
(B) tiene un orden sucientemente grande para que se cumpla

el supuesto de que E
t
es ruido blanco, por tanto, p 1 1. Luego, escribimos,
4
Y
t
=
1
X
1,t1
+
2
X
2,t1
+
4
X
3,t1
+
3
X
3,t2
+
p1
i=1
b
i
4
Y
ti
+ E
t
(10.14)
Esta ultima ecuaci on dene un modelo de regresi on con variable respuesta
4
Y
t
y variables explicatorias X
1,t1
, X
2,t1
, X
3,t1
, X
3,t2
y rezagos
4
Y
ti
. Basa-
dos en el ajuste de este modelo por mnimos cuadrados, se estiman los
j
y
se prueba luego las siguientes hip otesis para determinar si (B) tiene como
races todos o algunos de los valores c
k
= 1, 1, i, i:
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
10.6. RA

Test 1. H
1
: (1) = 0
1
= 0 (raz unitaria no estacional) vs. H
1
: (1) > 0
1
< 0;
Test 2. H
0
: (1) = 0
2
= 0 (raz unitaria semestral) vs. H
1
: (1) > 0
2
< 0;
Test 3. H
0
: |(i)| = 0
3
=
4
= 0 (raz unitaria anual) vs. H
1
: |(i)| > 0
3
< 0 o
4
= 0.
En los test 1 y 2 el estadstico de la prueba se construye como un estadstico
tipo t-student, aunque no es exactamente la distribuci on de tales estadsticos.
En el test 3, el estadstico de la prueba se construye como un estadstico tipo
F, pero aqu tampoco la distribuci on resulta ser exactamente una F. Por otra
parte, de acuerdo a Guerrero [5], es importante que la selecci on del n umero
de rezagos p en la ecuaci on de regresi on en (10.14) haga explcita la longitud
estacional, es decir, conviene comenzar con p 1 = 4 (el caso de estacionalidad
trimestral) y probar la signicancia estadstica conjunta de los cuatro rezagos.
Las conclusiones posibles en las pruebas HEGY son las siguientes:
No habr an races unitarias estacionales cuando se rechace en los testes
2 y 3;
No habr a ning un tipo de raz unitaria presente si se rechaza en los testes
1 a 3 y la serie se clasica como una serie estacionaria estacional, es
decir, puede modelarse como cierto ARMA de ordenes altos.
En el test 1 no rechazar H
0
signica que existe una raz unitaria no esta-
cional;
No rechazar H
0
en el test 2 signica que existe una raz unitaria esta-
cional con frecuencia semianual;
En el test 3 el no rechazo de H
0
implica que existe una raz unitaria
estacional de frecuencia anual.
Para el caso s = 12, la prueba HEGY se construye de una forma similar al
caso anterior, pero esta vez es necesario considerar la factorizaci on del oper-
ador
12
, en la cual se obtiene que exceptuando al factor (1 B), todos los
dem as factores corresponden a races estacionales, que son 1 (6 ciclos por
a no), i (3 ciclos por a no), (1 i
3)/2 (4 ciclos por a no), (1 i
3)/2 (2 ciclos
por a no), (
3 i)/2 ( dos races en la frecuencias 5/6 o 5 ciclos por a no) y

(
3 i)/2 (un ciclo por a no). Se denen 12 par ametros

j
y nuevas variables
X
i,t
, relacionadas con las races anteriores y se construye un modelo de regre-
si on como el dado en (10.14), pero en lugar de
4
Y
t
se tiene a
12
Y
t
. Los testes
que se realizan son los siguientes
Test 1. H
0
:
1
= 0 (raz unitaria no estacional) vs. H
1
:
1
< 0;
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
364 CAP

Test 2. H
0
:
2
= 0 (raz unitaria bimensual) vs. H
1
:
2
< 0;
Test 3.
3
=
4
= 0 (raz unitaria para perodos de 4 meses) vs.
3
< 0 o
4
= 0.
Test 4.
5
=
6
= 0 (raz unitaria trimestral) vs.
5
< 0 o
6
= 0.
Test 5.
7
=
8
= 0 (raz unitaria semestral) vs.
7
< 0 o
8
= 0.
Test 6.
9
=
10
= 0 (raz unitaria en la frecuencia 5/6) vs.
9
< 0 o
10
= 0.
Test 7.
11
=
12
= 0 (raz unitaria anual) vs.
11
< 0 o
12
= 0.
Test HEGY en R
En la librera uroot (disponible en https://r-forge.r-project.org/R/?group id=525;
en Download hacer click en Windows multi-arch binary (.zip)) est a implemen-
tada la prueba HEGY en la funci on HEGY.test():
HEGY.test(wts,itsd,regvar=0,selectlags=list(mode="signf",Pmax=NULL))
wts la serie de tiempo sobre la cual se har a la prueba.
itsd para indicar la inclusi on de componentes determinsticas en el
modelo de la prueba: componentes regulares (tendencia lineal), compo-
nentes estacionales (variables indicadoras). Por ejemplo, itsd=c(0,0,c(0))
indica que ning un intercepto, ni tendencia ni variables indicadoras ser an
incluidas, en cambio itsd=c(1,0,c(1,2,3)) indica que el intercepto y
las tres primeras indicadoras de la estacionalidad determinstica ser an
incluidas.
regvar para especicar en una matriz otras variables regresoras a ser
incluidas en el modelo. Si no hay regresoras se especica regvar=0.
selectlags para especicar mediante una lista el m etodo de selecci on
del n umero de rezagos p y el m aximo de este par ametro a considerar en
tal proceso de selecci on. Por ejemplo selectlags=list(mode="bic",Pmax=12)
especica que se use el criterio del BIC y un valor m aximo para p de 12.
Los m etodos de selecci on disponibles son aic", "bic", "signf".
10.6.2. Test Canova-Hansen (CH)
Este test trata de determinar si los patrones estacionales presentes en una
serie son determinsticos y por tanto estables en el tiempo o por el contrario,
siguen un proceso estoc astico y por tanto no son estables a lo largo del tiempo,
especcamente, un proceso con raz unitaria estacional. As la hip otesis nula
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
10.6. RA

de este test establece la estabilidad estructural de la componente estacional.
El procedimiento considera el siguiente modelo de regresi on,
Y
t
=
0
+
1
t +
k
j=1
_
j
sin
_
2jt
s
_
+
j
cos
_
2jt
s
__
+ E
t
(10.15)
con k = s/2 con s par, donde el j esimo par (sin (2jt/s) , cos (2jt/s)) corre-
sponde a la j esima frecuencia estacional arm onica
j
= 2j/s. Recuerde que
para j = s/2, sin (2jt/s) = sin(t) = 0, y por tanto s olo se requieren s 1 coe-
cientes en la parte estacional representada con las funciones trigonom etricas.
Se requiere adem as que Y
t
no tenga races unitarias en la frecuencia cero con
el n de distinguir la no estacionariedad en las frecuencias estacionales y en
la frecuencia cero. Si existe raz unitaria en la frecuencia cero, entonces se
considera a Y
t
= Y
t
Y
t1
como la variable dependiente. Considere los vec-
tores = (
1
, . . . ,
s/21
)
y = (
1
, . . . ,
s/21
)
. Bajo la hip otesis alterna, un

patr on estacional cambiante puede conducir a la variaci on en los vectores de
coecientes y a lo largo del tiempo seg un una caminata aleatoria, es de-
cir,
t
=
t1
+ u
t
y
t
=
t1
+ v
t
, donde u
t
y v
t
son vectores aleatorios iid
de media cero y tambi en son independientes de E
t
. Para probar la estabilidad
de los par ametros estacionales se prueba que las autocovarianzas de u
t
y v
t
,
respectivamente es cero mientras que bajo la hip otesis alterna, en cada caso,
es mayor que cero, o equivalentemente
H
0
:
t
= ,
t
= versus H
1
:
t
=
t1
+u
t
,
t
=
t1
+v
t
(10.16)
El estadstico de la prueba denominado L sugerido por Canova y Hansen no
tiene una distribuci on est andar (como la t-Student, la normal est andar, la F,
por ejemplo) pero tiene p grados de libertad, donde p se deriva del n umero
posible de races unitarias. Por ejemplo, si la estacionalidad determinstica es
probada, s olo se permiten p 1 races unitarias estacionales bajo la hip otesis
alternativa. El modelo en (10.15) tambi en admite variables explicatorias que
podran incluir a Y
t1
.
Test CH en R
El test CH est a disponible en la librera uroot, en la funci on CH.test():
CH.test (wts,frec=NULL,f0=1,DetTr=FALSE,ltrunc=NULL)
donde
wts un objeto serie de tiempo el cual ser a chequeado con este test.
frec un vector para especicar los ciclos estacionales a analizar. Por
defecto se incluyen todos. Para especicar se usa un vector de ceros y 1s
donde 0 indica que tal frecuencia no ser a considerada y 1 lo contrario.
La posici on de cada frecuencia en el vector es como sigue: c(/2, ) para
series trimestrales y c(/6, /3, /2, 2/3, 5/6, ) para series mensuales.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
366 CAP

f0 con valor igual a 0 o 1, para indicar si se incluye (1) o no (0) el rezago
de orden 1 de la variable dependiente en la regresi on auxiliar.
DetTr Toma valor de TRUE o FALSE para indicar si se incluye o no una
tendencia lineal determinstica en la regresi on auxiliar.
ltrunc par ametro de truncamiento del rezago para calcular la matriz de
covarianza de los residuales. Por defecto toma el valor de parte entera de
(n/100)
0.25
s, donde n es la longitud de la serie y s la periodicidad de los
datos.
Se recomienda que para aplicar este test se elimine la tendencia de la serie en
caso de existir, lo cual puede hacerse eliminando la componente T
t
estimada
mediante el ltro stl() visto en los primeros captulos y aplicamos el test
sobre W
t
= Y
t

T
t
, con los argumentos f0=0 y DetTr=FALSE.
10.7. Ejemplo
A continuaci on vamos a modelar la serie de producci on trimestral de ce-
mento portland, introducida en captulos previos. Desde que la serie presenta
varianza no constante, trabajaremos el proceso de modelaci on sobre el loga-
ritmo. Se tiene un total de N = 155 observaciones pero se ajusta con n = 151
para realizar validaci on cruzada con las ultimas observaciones. En el Captulo
8 se encontr o como mejor modelo uno de tendencia cuadr atica, estacionali-
dad trimestral con variables indicadoras y errores con estructura AR(6). Este
modelo asume que la estacionalidad es determinstica. Ahora, someteremos
entonces esta serie a la modelaci on con modelos ARIMA(p,d,q) (P,D,Q)
4
.
Time
Y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Time
lo
g
(
Y
t )
1960 1970 1980 1990
6
.
5
7
.
0
7
.
5
Figura 10.8: Serie de producci on trimestral de cemento portland y su logaritmo
A continuaci on examinamos las gr acas de las diferencias regular y esta-
cional ilustradas en la Figura 10.9. Como puede observarse existen todava
algunos cambios en la varianza y particularmente valores bastante distantes
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
10.7. EJEMPLO 367
del resto al nal de esta series. Sin embargo, las series
4
log(Y
t
) y
4
log(Y
t
)
tienen una varianza m as estable y adem as estas dos series son las mismas, lo
cual es de esperarse. Note tambi en que aplicar s olo la diferencia no elimina
el patr on estacional, mientras que aplicar s olo una diferencia estacional, deja
una fuerte autocorrelaci on entre valores consecutivos, lo que se reeja en el
patr on cclico.
Time
l
o
g
(
Y
t
)
1960 1970 1980 1990
0
.
2
0
.
1
0
.
0
0
.
1
0
.
2
Time
4
l
o
g
(
Y
t
)
1960 1970 1980 1990
0
.
3
0
.
1
0
.
0
0
.
1
0
.
2
Time
4
l
o
g
(
Y
t
)
1960 1970 1980 1990
0
.
1
5
0
.
0
5
0
.
0
5
0
.
1
5
Time
l
o
g
(
Y
t
)
1960 1970 1980 1990
0
.
1
5
0
.
0
5
0
.
0
5
0
.
1
5
Figura 10.9: Diferencias ,
4
,
4
y
4
para el logaritmo de la producci on trimestral
de cemento portland.
En la Figura 10.10 se ilustran las ACFs de las serie del logaritmo, su
primera diferencia regular, su diferencia estacional y de la diferencia
4
.
La ACF del logaritmo muestra un patr on en el cual la autocorrelaci on tanto
en los rezagos no estacionales y estacionales decae lentamente. En la ACF
de la primera diferencia se ve m as claramente que existe una fuerte autocor-
relaci on entre las observaciones separadas k = 4j, lo que evidencia la existen-
cia de estacionalidad. En la ACF de la serie con la diferencia estacional vemos
que este ltro no elimina la autocorrelaci on intra perodos mientras que en
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
368 CAP

la ACF de la serie ltrada estacional y regularmente se observa un patr on
estacionario.
0 5 10 15 20 25 30 35
0
.
5
0
.
0
0
.
5
Lag
A
C
F
ACF de log(Y
t
)
0 5 10 15 20 25 30 35
0
.
6
0
.
2
0
.
2
0
.
6
Lag
A
C
F
ACF de log(Y
t
)
0 5 10 15 20 25 30 35
0
.
4
0
.
0
0
.
2
0
.
4
0
.
6
Lag
A
C
F
ACF de
4
log(Y
t
)
0 5 10 15 20 25 30 35
0
.
3
0
.
1
0
.
1
0
.
2
Lag
A
C
F
ACF de
4
log(Y
t
)
Figura 10.10: ACFs para el logaritmo de la producci on de cemento portland y de sus
diferencias ,
4
,
4
.
A continuaci on tratamos de identicar qu e posible proceso ARMA esta-
cionario estacional sigue la serie
4
log(Y
t
). Para ello, examinamos su ACF
y PACF y adicionalmente usamos la funci on R armasubsets() disponible en
la librera TSA, esta funci on selecciona modelos ARMA con base en el criterio
BIC y resulta util porque permite identicar rezagos autorregresivos y de me-
dias m oviles especcos que son signicativos en los modelos. Los resultados
se presentan gr acamente en la Figura 10.11. Evaluemos inicialmente lo que
sucede en los rezagos estacionales. Seg un la PACF aparentemente existe un
patr on de cola decreciente en rezagos estacionales y en la ACF puede ser un
patr on de corte con cortes signicativos en k = 4, 8; esto nos estara indicando
que para la parte estacional el modelo podra ser un MA de orden 2.
Para la parte regular nos concentramos en el comportamiento de los primeros
rezagos, pero al ser tan pocos para el caso s = 4, no es f acil distinguir patrones.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
1
0
.
7
.
E
J
E
M
P
L
O
3
6
9
0
5
1
0
1
5
2
0
2
5
3
0
3
5
0.3 0.1 0.0 0.1 0.2
L
a
g
ACF
A
C
F

d
e

4
l
o
g
(
Y
t
)
0
5
1
0
1
5
2
0
2
5
3
0
3
5
0.4 0.2 0.0 0.1 0.2
L
a
g
Partial ACF
P
A
C
F

d
e

4
l
o
g
(
Y
t
)
BIC
(Intercept)
testlag1
testlag2
testlag3
testlag4
testlag5
testlag6
testlag7
testlag8
testlag9
testlag10
testlag11
testlag12
errorlag1
errorlag2
errorlag3
errorlag4
errorlag5
errorlag6
errorlag7
errorlag8
errorlag9
errorlag10
errorlag11
errorlag12
2
0
3
3
3
4
3
6
3
7
3
7
3
8
3
9
F
i
g
u
r
a
1
0
.
1
1
:
A
C
F
,
P
A
C
F
y
r
e
s
u
l
t
a
d
o
d
e
l
a
f
u
n
c
i
o
n
a
r
m
a
s
u
b
s
e
t
s
(
)
p
a
r
a
4
s
o
b
r
e
e
l
l
o
g
a
r
i
t
m
o
d
e
l
a
p
r
o
d
u
c
c
i
o
n
d
e
c
e
m
e
n
t
o
p
o
r
t
l
a
n
d
.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
370 CAP

Sin embargo, observe que si fuese un AR en la parte regular la PACF nos es-
tara mostrando un orden p = 2, y si fuese un MA, la ACF tambi en estara
mostrando que q = 2. Por otro lado no podemos descartar una ARMA as que
podramos iniciar con un ARMA(2,2) en la parte regular.
Si examinamos la tabla arrojada por la funci on armasubsets(), vemos que
en todos los modelos, menos el ultimo, aparece signicativo el rezago autorre-
gresivo de orden 2; el rezago 1 en la parte de medias m oviles tambi en aparece
en los mejores modelos exceptuando el segundo, tambi en resalta el rezago
en medias m oviles de orden 4. Considerando s olo los resultados para los dos
primeros modelos, parece que en la parte regular hay polinomio autorregresi-
vo de orden 2 y puede que haya un polinomio de media m ovil de orden 1; en
la parte estacional, como no aparecen en estos dos modelos rezagos autorre-
gesivos en m ultiplos de cuatro o en 4j + k, k = 1, 2, 3, j = 1, 2, descartamos por
este medio un polinomio autorregresivo estacional. En cuanto al polinomio
de medias m oviles estacional puede ser de orden 1 o 2 ya que el rezago 4 de
medias m oviles parece signicativo en la mayora de los modelos y el rezago 8
s olo en los dos primeros y el pen ultimo modelo.
Resumiendo, de los an alisis anteriores, se pueden postular los siguientes
modelos para la serie log(Y
t
),
Modelo 1: log(Y
t
) ARIMA(2,1,0) (0,1,2)
4
.
Modelo 2: log(Y
t
) ARIMA(0,1,2) (0,1,2)
4
.
Modelo 3: log(Y
t
) ARIMA(2,1,2) (0,1,2)
4
.
Modelo 4: log(Y
t
) ARIMA(2,1,1) (0,1,2)
4
.
Adicionalmente, se us o la funci on auto.arima() sobre
4
log(Y
t
), con
el criterio del AIC. No se aplica esta funci on directamente sobre la serie
sin diferenciar ya que internamente realiza el test CH de raz unitaria
estacional y la presencia de raz unitaria regular puede hacer ineciente
el procedimiento. El modelo arrojado es
4
log(Y
t
) ARMA(0,3) (2,1)
4
,
luego tenemos que,
Modelo 5: log(Y
t
) ARIMA(0,1,3) (2,1,1)
4
.
A seguir, se presentan las tablas de los ajustes de estos cinco modelos, sus
AICs (en escala log), sus medidas de precisi on de pron osticos para los ultimos
cuatro valores de la serie (en escala real), los resultados de los testes Ljung-
Box sobre los residuales de ajuste. Qu e se concluye de estos resultados?
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
10.7. EJEMPLO 371
Par ametros estimados
Modelo 1
0
P(|Z| > |Z
0
|)
1
-0.1615 0.0807 -2.0001 0.0455
2
0.2382 0.0824 2.8892 0.0039
1
-0.7369 0.0972 -7.5773 0.0000
2
-0.1363 0.0974 -1.3997 0.1616
Modelo 2
0
P(|Z| > |Z
0
|)
1
-0.1137 0.0849 -1.3399 0.1803
2
0.2476 0.0847 2.9249 0.0034
1
-0.6581 0.0959 -6.8594 0.0000
2
-0.2036 0.0914 -2.2285 0.0259
Modelo 3
0
P(|Z| > |Z
0
|)
1
-0.6921 0.4204 -1.6464 0.0997
2
-0.3340 0.3177 -1.0511 0.2932
1
0.5472 0.3972 1.3778 0.1683
2
0.5135 0.2416 2.1252 0.0336
1
-0.6545 0.1349 -4.8533 0.0000
2
-0.2133 0.1260 -1.6929 0.0905
Modelo 4
0
P(|Z| > |Z
0
|)
1
-0.2935 0.2698 -1.0876 0.2768
2
0.2132 0.1018 2.0953 0.0361
1
0.1388 0.2678 0.5181 0.6044
1
-0.7513 0.1052 -7.1450 0.0000
2
-0.1241 0.1037 -1.1972 0.2312
Modelo 5
0
P(|Z| > |Z
0
|)
1
-0.1890 0.0859 -2.2010 0.0277
2
0.2562 0.0878 2.9163 0.0035
3
-0.2239 0.1016 -2.2042 0.0275
1
0.1298 0.0968 1.3413 0.1798
2
-0.2573 0.0914 -2.8156 0.0049
1
-0.8206 0.0582 -14.1002 0.0000
AICs Modelos 1 a 5 (escala log)
Modelo 1 Modelo 2 Modelo 3 Modelo 4 Modelo 5
-499.9882 -498.3687 -498.3162 -498.2444 -503.7367
Medidas de precisi on de pron osticos (escala original)
Modelo ME RMSE MAE MPE MAPE
1 149.4414 177.5695 149.4414 8.1460 8.1460
2 146.2509 175.5318 146.2509 7.9567 7.9567
3 157.4289 184.6768 157.4289 8.6080 8.6080
4 151.4899 179.1132 151.4899 8.2657 8.2657
5 182.5585 209.3829 182.5585 10.0441 10.0441
Test de Normalidad Shapiro Wilks
Modelos
1 2 3 4 5
Estadstico 0.9774 0.9794 0.9731 0.9770 0.9846
Valor P 0.0137 0.0228 0.0046 0.0125 0.0920
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
372 CAP

Test Ljung-Box
Modelo 1 Modelo 2
m Q
LB
g.l P(
2
m
> Q
LB
) Q
LB
g.l P(
2
m
> Q
LB
)
6 4.7462 6.0000 0.5767 5.9699 6.0000 0.4266
12 13.3704 12.0000 0.3427 12.4091 12.0000 0.4134
18 20.2747 18.0000 0.3176 18.5562 18.0000 0.4196
24 24.9259 24.0000 0.4098 22.4213 24.0000 0.5541
30 28.5152 30.0000 0.5432 25.1747 30.0000 0.7165
36 35.9964 36.0000 0.4688 31.0833 36.0000 0.7014
Modelo 3 Modelo 4
m Q
LB
g.l P(
2
m
> Q
LB
) Q
LB
g.l P(
2
m
> Q
LB
)
6 3.0932 6.0000 0.7971 4.7633 6.0000 0.5745
12 10.6008 12.0000 0.5634 13.7165 12.0000 0.3192
18 18.1481 18.0000 0.4459 20.7533 18.0000 0.2920
24 23.1214 24.0000 0.5126 25.5099 24.0000 0.3785
30 27.5799 30.0000 0.5927 29.3338 30.0000 0.5001
36 35.4124 36.0000 0.4964 37.0788 36.0000 0.4190
Modelo 5
m Q
LB
g.l P(
2
m
> Q
LB
)
6 3.2693 6.0000 0.7744
12 9.0008 12.0000 0.7029
18 14.2987 18.0000 0.7094
24 17.8387 24.0000 0.8108
30 20.2943 30.0000 0.9087
36 27.7392 36.0000 0.8364
A continuaci on se presentan resultados gr acos para valoraci on de ajustes,
pron osticos, y validaci on de supuestos. Qu e se concluye de estas gr acas?
Produccin trimestral de Cemento
Pronsticos modelo 1
Time
Y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Realizacin
pronosticado zona naranja
Figura 10.12: Ajuste y pron osticos de la producci on de cemento portland con Modelo SARI-
MA 1.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
10.7. EJEMPLO 373
Pronsticos modelo 2
Time
Y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Realizacin
Pronsticos modelo 3
Time
Y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Realizacin
Pronsticos modelo 4
Time
Y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Realizacin
Pronsticos modelo 5
Time
Y
t
1960 1970 1980 1990
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
Realizacin
Figura 10.13: Ajuste y pron osticos de la producci on de cemento portland con Modelo SARI-
MA 2 a 5.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
374 CAP

1
4
0
0
1
5
0
0
1
6
0
0
1
7
0
0
1
8
0
0
1
9
0
0
Time
P
r
o
d
u
c
c
i
n
1993.Q4 1994.Q1 1994.Q2 1994.Q3
Serie Original
Pronstico Modelo 1
Pronstico Modelo 2
Pronstico Modelo 3
Pronstico Modelo 4
Pronstico Modelo 5
Figura 10.14: Comparaci on de los pron osticos en escala original, de los modelos SARIMA 1
a 5 ajustados al logaritmo de la producci on de cemento portland con Modelo.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
10.7. EJEMPLO 375
Time
r
e
s
i
d
u
a
l
s
(
m
o
d
s
a
r
i
m
a
1
)
1960 1970 1980 1990
0
.
1
0
0
.
0
0
0
.
1
0
6.2 6.4 6.6 6.8 7.0 7.2 7.4 7.6
0
.
1
0
0
.
0
0
0
.
1
0
fitted(modsarima1)
r
e
s
i
d
u
a
l
s
(
m
o
d
s
a
r
i
m
a
1
)
Time
r
e
s
i
d
u
a
l
s
(
m
o
d
s
a
r
i
m
a
2
)
1960 1970 1980 1990
0
.
1
0
0
.
0
0
0
.
1
0
6.2 6.4 6.6 6.8 7.0 7.2 7.4 7.6
0
.
1
0
0
.
0
0
0
.
1
0
fitted(modsarima2)
r
e
s
i
d
u
a
l
s
(
m
o
d
s
a
r
i
m
a
2
)
Time
r
e
s
i
d
u
a
l
s
(
m
o
d
s
a
r
i
m
a
3
)
1960 1970 1980 1990
0
.
1
0
0
.
0
0
0
.
1
0
6.2 6.4 6.6 6.8 7.0 7.2 7.4 7.6
0
.
1
0
0
.
0
0
0
.
1
0
fitted(modsarima3)
r
e
s
i
d
u
a
l
s
(
m
o
d
s
a
r
i
m
a
3
)
Time
r
e
s
i
d
u
a
l
s
(
m
o
d
s
a
r
i
m
a
4
)
1960 1970 1980 1990
0
.
1
0
0
.
0
0
0
.
1
0
6.2 6.4 6.6 6.8 7.0 7.2 7.4 7.6
0
.
1
0
0
.
0
0
0
.
1
0
fitted(modsarima4)
r
e
s
i
d
u
a
l
s
(
m
o
d
s
a
r
i
m
a
4
)
Figura 10.15: Gr acos de residuales de ajuste de los modelos SARIMA 1 a 4 ajustados al
logaritmo de la producci on de cemento portland con Modelo.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
376 CAP

0 5 10 15 20 25 30 35
0
.
2
0
.
0
0
.
2
Lag
A
C
F
ACF residuos Modelo 1
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
0
0
.
1
5
Lag
P
a
r
t
i
a
l

A
C
F
PACF residuos Modelo 1
0 5 10 15 20 25 30 35
0
.
2
0
.
0
0
.
2
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
0
0
.
1
5
Lag
P
a
r
t
i
a
l

A
C
F
0 5 10 15 20 25 30 35
0
.
2
0
.
0
0
.
2
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
0
0
.
1
5
Lag
P
a
r
t
i
a
l

A
C
F
0 5 10 15 20 25 30 35
0
.
2
0
.
0
0
.
2
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
0
0
.
1
5
Lag
P
a
r
t
i
a
l

A
C
F
Figura 10.16: ACFs y PACFs para residuales de ajuste de los modelos SARIMA 1 a 4
ajustados al logaritmo de la producci on de cemento portland con Modelo.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
10.7. EJEMPLO 377
Time
r
e
s
i
d
u
a
l
s
(
m
o
d
s
a
r
i
m
a
5
)
1960 1970 1980 1990
0
.
1
0
0
.
0
5
6.2 6.4 6.6 6.8 7.0 7.2 7.4
0
.
1
0
0
.
0
5
fitted(modsarima5)
r
e
s
i
d
u
a
l
s
(
m
o
d
s
a
r
i
m
a
5
)
0 5 10 15 20 25 30 35
0
.
1
0
.
1
Lag
A
C
F
0 5 10 15 20 25 30 35
0
.
1
5
0
.
0
5
Lag
P
a
r
t
i
a
l

A
C
F
Figura 10.17: Gr acos de residuales de ajuste y su ACF y PACF, modelo SARIMA 5 para el
logaritmo de la producci on de cemento portland con Modelo.
Finalmente, se presentan los resultados de las pruebas HEGY y CH para
races unitarias estacionales.
Salida R 10.1.
---- ----
HEGY test
---- ----
Null hypothesis: Unit root.
Alternative hypothesis: Stationarity.
----
HEGY statistics:
Stat. p-value
tpi_1 2.017 0.1
tpi_2 -0.773 0.1
Fpi_3:4 0.678 0.1
Fpi_2:4 0.650 NA
Fpi_1:4 1.491 NA
El anterior test no rechaza ninguna de las hip otesis nula, es decir, que para
la serie de log(Y
t
), hay raz unitaria no estacional o en la frecuencia 0 (ver re-
sultados para tpi 1), hay raz unitaria estacional semestral o en la frecuencia
(resultados en tpi 2) y hay raz unitaria estacional en las frecuencias /2 y
3/2 (resultados en tpi 3:4). En resumen la serie log(Y
t
) tiene tanto raz uni-
taria en la tendencia como estacional, luego es apropiado ajustar un modelo
SARIMA a esta serie.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
378 CAP

Vea a continuaci on los resultados del test CH aplicado sobre la serie W
t
=
log(Y
t
)

T
t
, donde

T
t
es la componente de tendencia de la serie log(Y
t
) ltra-
da con stl(). De estos resultados podemos concluir que para un valor del
estadstico de la prueba L = 1.734 y un nivel de signicancia de 0.05 es re-
chazada la hip otesis nula de componente estacional determinstica en favor
de una componente estacional con raz unitaria que corresponde a la inesta-
bilidad de tal componente.
Salida R 10.2.
------ - ------ ----
Canova & Hansen test
------ - ------ ----
Null hypothesis: Stationarity.
Alternative hypothesis: Unit root.
Frequency of the tested cycles: pi/2 , pi ,
L-statistic: 1.734
Lag truncation parameter: 4
Critical values:
0.10 0.05 0.025 0.01
0.846 1.01 1.16 1.35
10.7.1. Programaci on R usada en Ejemplo
C odigo R 10.1.
library(TSA)
library(forecast)
library(uroot)
df=c(rep(NA,aux))
for(i in 1:aux){
*
i),type=type)
df[i]=test[[2]]
}
lag=6
*
c(1:aux)
rownames(teste)=lag
teste
}
################################################################################
#LECTURA DE LOS DATOS, DEFINICI
ON DE VARIABLES Y GRAFICACI
ON DE LA SERIE
################################################################################
yt=scan()
465 532 561 570 529 604 603 582 554 620 646
637 573 673 690 681 621 698 753 728 688 737
782 692 637 757 783 757 674 734 835 838 797
904 949 975 902 974 969 967 849 961 966 922
836 998 1025 971 892 973 1047 1017 948 1032
1190 1136 1049 1134 1229 1188 1058 1209 1199
1253 1070 1282 1303 1281 1148 1305 1342 1452
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
10.7. EJEMPLO 379
1184 1352 1316 1353 1121 1297 1318 1281 1109
1299 1341 1290 1101 1284 1321 1317 1122 1261
1312 1298 1202 1302 1377 1359 1232 1386 1440
1439 1282 1573 1533 1651 1347 1575 1475 1357
1086 1158 1279 1313 1166 1373 1456 1496 1251
1456 1631 1554 1347 1516 1546 1564 1333 1458
1499 1613 1416 1625 1770 1791 1622 1719 1972
1893 1575 1644 1658 1668 1343 1441 1444 1497
1267 1501 1538 1569 1450 1569 1648 1777 1468
1732 1962
lnyt=log(yt)
nf=layout(cbind(c(1,1),c(2,2)))
plot(yt,ylab=expression(Y[t]))
plot(lnyt,ylab=expression(log(Y[t])))
#Valores de la serie log para los ajustes
m=4
n=length(yt)-m
lnyt2=log(yt2)
dif1dif4lnyt2=diff(diff(lnyt2,4),1) #serie log con diferencia y diferencia estacional
################################################################################
#GR
AFICAS PARA LA DISTINTAS DIFERENCIAS PRESENTADAS PARA EL LOG DE LA SERIE

################################################################################
#Grafica de la primera diferencia
plot(diff(lnyt2),ylab=expression(paste(nabla,sep="",log(Y[t]))))
abline(h=mean(diff(lnyt2)))
#Grafica de la primera diferencia estacional trimestral
plot(diff(lnyt2,4),ylab=expression(paste(nabla[4],sep="",log(Y[t]))))
abline(h=mean(diff(lnyt2,4)))
#Graficas de las diferencias regular y estacional combinadas
plot(diff(diff(lnyt2,4),1),ylab=expression(paste(nabla,sep="",nabla[4],sep="",log(Y[t]))))
abline(h=mean(diff(diff(lnyt2,4),1)))
plot(diff(diff(lnyt2,1),4),ylab=expression(paste(nabla[4],sep="",nabla,sep="",log(Y[t]))))
abline(h=mean(diff(diff(lnyt2,1),4)))
#ACFs y PACFs para la diferencias
acf(as.numeric(lnyt2),ci.type="ma",lag.max=36,main=expression(paste("ACF de",sep=" ",log(Y[t]))))
acf(as.numeric(diff(lnyt2)),ci.type="ma",lag.max=36,
main=expression(paste("ACF de",sep=" ",nabla,sep="",log(Y[t]))))
acf(as.numeric(diff(lnyt2,4)),ci.type="ma",lag.max=36,
main=expression(paste("ACF de",sep=" ",nabla[4],sep="",log(Y[t]))))
acf(as.numeric(dif1dif4lnyt2),ci.type="ma",lag.max=36,
main=expression(paste("ACF de",sep=" ",nabla,sep="",nabla[4],sep="",log(Y[t]))))
#Graficas de ACF y PACF de la diferencia combinada mas resultados de
#la funcion armasubsets
acf(as.numeric(dif1dif4lnyt2),ci.type="ma",lag.max=36,
main=expression(paste("ACF de",sep=" ",nabla,sep="",nabla[4],sep="",log(Y[t]))))
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
380 CAP

pacf(as.numeric(dif1dif4lnyt2),lag.max=36,
main=expression(paste("PACF de",sep=" ",nabla,sep="",nabla[4],sep="",log(Y[t]))))
res=armasubsets(y=dif1dif4lnyt2,nar=12,nma=12,y.name=test,ar.method=ml)
plot(res)
################################################################################
#AJUSTE DE MODELOS IDENTIFICADOS
################################################################################
#Modelo1
modsarima1=Arima(lnyt2,order=c(2,1,0),seasonal=list(order=c(0,1,2)))
modsarima1
#Calculo estadstico Z0 y valores P
est=cbind(Estimacion=modsarima1$coef,s.e=sqrt(diag(modsarima1$var.coef)))
z0=est[,1]/est[,2]
################################################################################
#Modelo 2
modsarima2
z0=est[,1]/est[,2]
################################################################################
#Modelo 3
modsarima3
z0=est[,1]/est[,2]
################################################################################
#Modelo 4
modsarima4
z0=est[,1]/est[,2]
################################################################################
#Modelo 5
auto.arima(dif1dif4lnyt2) #arroja un ARMA(0,3)
*
(2,1)_4 estacionario
#Se ajusta ARIMA(0,1,3)
*
(2,1,1)_4 a la serie del log
modsarima5
z0=est[,1]/est[,2]
################################################################################
#PRON
OSTICOS EN ESCALA ORIGINAL, SUS GR
AFICAS Y PRECISI
ON
################################################################################
#Modelo 1
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
10.7. EJEMPLO 381
predmodsarima1=exp(as.data.frame(forecast(modsarima1,h=m,level=95)))
#Precision pronosticos
accuracy(predmodsarima1[,1],yt[(n+1):length(yt)])
plot(yt,ylab=expression(Y[t]),,main="Produccion trimestral de Cemento\nPronosticos modelo 1")
lines(exp(fitted(modsarima1)),col=2)
#Para graficar bandas de prediccion sombreada
xx1=c(time(yt)[(n+1):length(yt)],rev(time(yt)[(n+1):length(yt)]))
yy1=c(predmodsarima1[,2],rev(predmodsarima1[,3]))
polygon(xx1, yy1, col="orange", border = "orange")
lines(time(yt)[(n+1):length(yt)],predmodsarima1[,1],lty=1,col=2,lwd=1)
lines(time(yt)[(n+1):length(yt)],log(yt)[(n+1):length(yt)],lty=1,col=2,lwd=2)
legend("topleft",legend=c("Realizacion","pronosticado zona naranja"),lwd=c(2,2),col=c(2,1))
################################################################################
#Modelo 2
################################################################################
#Modelo 3
################################################################################
#Modelo 4
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
382 CAP

################################################################################
#Modelo 5
################################################################################
#COMPARANDO GR
AFICAMENTE TODOS LOS PRON
OSTICOS EN LA ESCALA ORIGINAL

################################################################################
win.graph(height=6,width=6)
matplot(152:155,cbind(yt[(n+1):length(yt)],predmodsarima1[,1],predmodsarima2[,1],
predmodsarima3[,1],predmodsarima4[,1],predmodsarima5[,1]),xlab="Time",ylab="Produccion",
col=1,type="b",pch=c(19,1:5),xaxt=n,lwd=2)
axis(1,at=152:155,labels=c("1993.Q4","1994.Q1","1994.Q2","1994.Q3"))
legend("topleft",legend=c("Serie Original","Pronostico Modelo 1",
"Pronostico Modelo 2","Pronostico Modelo 3","Pronostico Modelo 4","Pronostico Modelo 5"),
pch=c(19,1:5),bty="n")
###############################################################################
#COMPARANDO LOS AJUSTES SEG
UN AIC, EN ESCALA LOG

###############################################################################
AICs=cbind(AICmod1=AIC(modsarima1),AICmod2=AIC(modsarima2),AICmod3=AIC(modsarima3),
AICmod4=AIC(modsarima4),AICmod5=AIC(modsarima5))
AICs
################################################################################
#GR
AFICAS PARA AN
ALISIS DE RESIDUALES
################################################################################
#Graficos de residuales Modelos 1 a 4
nf=layout(rbind(c(1,2),c(3,4),c(5,6),c(7,8)))
plot(residuals(modsarima1))
abline(h=0)
plot(fitted(modsarima1),residuals(modsarima1))
abline(h=0)
abline(h=0)
abline(h=0)
abline(h=0)
abline(h=0)
abline(h=0)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
10.7. EJEMPLO 383
abline(h=0)
#Graficos de ACF y PACF Modelos 1 a 4
nf=layout(rbind(c(1,2),c(3,4),c(5,6),c(7,8)))
acf(as.numeric(residuals(modsarima1)),ci.type="ma",lag.max=36,main="ACF residuos Modelo 1")
pacf(as.numeric(residuals(modsarima1)),lag.max=36,main="PACF residuos Modelo 1")
#Graficas de residuales, y ACF y PACF Modelo 5
abline(h=0)
abline(h=0)
################################################################################
#PRUEBAS LJUNG-BOX SOBRE RESIDUOS MODELOS AJUSTADOS
################################################################################
BP.LB.test(residuals(modsarima1),36,type="Ljung")
################################################################################
#PRUEBAS SHAPIRO WILK SOBRE RESIDUOS MODELOS AJUSTADOS
################################################################################
shapiro.test(residuals(modsarima1))
################################################################################
#Test HEGY para la serie del logaritmo
################################################################################
HEGY.test(wts=lnyt2,itsd=c(0,0,c(0)),selectlags=list(mode="aic", Pmax=12))
################################################################################
#Test CH para la serie del logaritmo
################################################################################
Tt=stl(lnyt2,s.window="periodic")[[1]][,2]
wt=lnyt2-Tt
CH.test(wt,f0=0,DetTr=FALSE)
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
384 CAP

E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Ap endice A
Funciones R
A.1. Funci on decompose: Descomposici on estacional cl asica
mediante medias m oviles
Esta funci on R descompone una serie de tiempo en sus componentes de
tendencia, estacionalidad y componente de error utilizando medias m oviles,
para series de componentes aditivas o multiplicativas. Su sintaxis general es
la siguiente:
decompose(x, type = c("additive", "multiplicative"), filter = NULL)
donde,
x: Es un serie de tiempo (objeto del tipo ts)
type: El tipo de componente estacional, aditiva (additive) seg un mod-
elo en (2.1) o multiplicativa ("multiplicative") seg un modelo en (2.2);
filter: Un vector de coecientes de ltramiento dados en orden inverso
del tiempo (como para los coecientes AR o MA), usado para ltrar la
componente estacional. Si su valor es NULL, entonces la funci on aplica
una media m ovil con ventana sim etrica.
La funci on procede de la siguiente manera: Primero halla la componente de
tendencia usando una media m ovil (si filter es igual a NULL, decompose
usa una ventana sim etrica con pesos iguales, es decir, calcula las medias
m oviles bilaterales) y la remueve de la serie rest andola de la serie original
(caso aditivo) o dividiendo la serie original por esta componente. Luego, la
componente estacional es calculada mediante promedios para cada estaci on
sobre todos los periodos. Esta componente es luego centrada para que los fac-
tores estacionales sumen cero (caso aditivo) o normalizados dividiendo por el
promedio de los factores estacionales crudos (caso multiplicativo). Finalmente,
la componente de error es obtenida eliminando de la serie original la tenden-
cia y la estacionalidad, para esto, si la serie es aditiva, a los datos originales le
385
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
386 AP
ENDICE A. FUNCIONES R
resta las componentes de tendencia y estacionalidad, y en el caso multiplica-
tivo, divide la serie original por el producto de las componentes de tendencia
y estacionalidad.
Valor: La funci on decompose produce un objeto R de la clase "decomposed.ts"
que tiene los siguientes componentes:
seasonal: La componente estacional para t = 1, , n;
figure:S olo los s factores estacionales estimados ;
trend: La componente de tendencia;
random El error o resto de la serie;
type: El valor especicado para el tipo de serie.
Ejemplo: Considere la serie presentada en la Figura A.1;
C odigo R A.1.
yt=scan()
154 96 73 49 36 59 95 169 210 278 298 245
200 118 90 79 78 91 167 169 289 347 375 203
223 104 107 85 75 99 135 211 335 460 488 326
346 261 224 141 148 145 223 272 445 560 612 467
518 404 300 210 196 186 247 343 464 680 711 610
613 392 273 322 189 257 324 404 677 858 895 664
628 308 324 248 272
descom=decompose(yt,type="multiplicative")
descom$seasonal #produce los siguientes datos
Jan Feb Mar Apr May Jun Jul
1965 1.3262761 0.8516414 0.6680514 0.5296497 0.4422268 0.4887194 0.7007826
1966 1.3262761 0.8516414 0.6680514 0.5296497 0.4422268 0.4887194 0.7007826
1967 1.3262761 0.8516414 0.6680514 0.5296497 0.4422268 0.4887194 0.7007826
1968 1.3262761 0.8516414 0.6680514 0.5296497 0.4422268 0.4887194 0.7007826
1969 1.3262761 0.8516414 0.6680514 0.5296497 0.4422268 0.4887194 0.7007826
1970 1.3262761 0.8516414 0.6680514 0.5296497 0.4422268 0.4887194 0.7007826
Aug Sep Oct Nov Dec
1965 0.8660279 1.3621465 1.7570249 1.8533501 1.1541034
1966 0.8660279 1.3621465 1.7570249 1.8533501 1.1541034
1967 0.8660279 1.3621465 1.7570249 1.8533501 1.1541034
1968 0.8660279 1.3621465 1.7570249 1.8533501 1.1541034
1969 0.8660279 1.3621465 1.7570249 1.8533501 1.1541034
1970 0.8660279 1.3621465 1.7570249 1.8533501 1.1541034
descom$figure #produce los siguientes datos
[1] 1.3262761 0.8516414 0.6680514 0.5296497 0.4422268 0.4887194 0.7007826
[8] 0.8660279 1.3621465 1.7570249 1.8533501 1.1541034
descom$trend #produce los siguientes datos
Jan Feb Mar Apr May Jun Jul Aug
1965 NA NA NA NA NA NA 148.7500 151.5833
1966 165.5833 168.5833 171.8750 178.0417 184.1250 185.5833 184.7917 185.1667
1967 185.5833 186.0000 189.6667 196.2917 205.7083 215.5417 225.7917 237.4583
1968 272.0000 278.2083 285.3333 294.0833 303.4167 314.4583 327.5000 340.6250
1969 367.0833 371.0417 374.7917 380.5833 389.7083 399.7917 409.7083 413.1667
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
A.1. FUNCI

ON DECOMPOSE 387
1970 428.2917 434.0417 445.4583 461.7500 476.8333 486.7500 489.6250 486.7500
1971 NA NA NA NA NA
Sep Oct Nov Dec
1965 153.2083 155.1667 158.1667 161.2500
1966 185.2917 186.2500 186.3750 186.5833
1967 248.8750 256.0833 261.4583 266.4167
1968 349.7500 355.7917 360.6667 364.3750
1969 411.5417 415.0833 419.4583 422.1250
1970 485.3750 484.4167 484.7917 NA
1971
descom$random #produce los siguientes datos
Jan Feb Mar Apr May Jun Jul
1965 NA NA NA NA NA NA 0.9113461
1966 0.9107086 0.8218842 0.7838265 0.8377545 0.9579366 1.0033278 1.2895874
1967 0.9060078 0.6565437 0.8444675 0.8175764 0.8244499 0.9398193 0.8531837
1968 0.9591207 1.1015739 1.1751293 0.9052322 1.1030043 0.9435074 0.9716509
1969 1.0639744 1.2785036 1.1981784 1.0417916 1.1372902 0.9519620 0.8602781
1970 1.0791627 1.0604688 0.9173725 1.3166195 0.8962932 1.0803577 0.9442742
Aug Sep Oct Nov Dec
1965 1.2873700 1.0062667 1.0196907 1.0165853 1.3165024
1966 1.0538821 1.1450333 1.0603647 1.0856408 0.9427108
1967 1.0260374 0.9881883 1.0223477 1.0070705 1.0602579
1968 0.9220628 0.9340679 0.8958068 0.9155624 1.1105129
1969 0.9585990 0.8277141 0.9323859 0.9145834 1.2521145
1970 0.9583928 1.0239705 1.0080691 0.9961172 NA
descom$type #arroja la siguiente informacion
[1] "multiplicative"
#Graficando la serie original y su descomposicion
plot(descom)
2
0
0
4
0
0
6
0
0
8
0
0
o
b
s
e
r
v
e
d
1
5
0
2
5
0
3
5
0
4
5
0
t
r
e
n
d
0
.4
0
.8
1
.2
1
.6
s
e
a
s
o
n
a
l
0
.7
0
.9
1
.1
1
.3
1965 1966 1967 1968 1969 1970 1971
r
a
n
d
o
m
Time
Decomposition of multiplicative time series
Figura A.1: Descomposici on de una serie multiplicativa. Fuente:O.D. Anderson (1976)
and ODonovan (1983). Ventas mensuales compa na X, ene 65 - may 71.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
388 AP
A.2. Funci on nls: Mnimos cuadrados no lineales
Esta funci on estima por mnimos cuadrados los par ametros de modelos no
lineales. Su sintaxis es como sigue:
nls(formula,data,start,control,algorithm,trace,subset,weights,na.action,model,lower,upper, ...)
formula: F ormula aritm etica del modelo no lineal incluyendo variables y
par ametros.
data: Un data frame opcional que contiene las variables especicadas en
data y los pesos weight (para mnimos cuadrados no lineales ponder-
ados). Puede ser tambi en un objeto lista o un ambiente R pero no una
matriz.
start: Un objeto lista de R para especicar los valores iniciales de los
par ametros a estimar, nombrados usando el mismo nombre dado a cada
uno en formula.
control: Una lista R para ajustar algunos valores de control del algorit-
mo tales como el m aximo de iteraciones, la tolerancia para el criterio de
convergencia del algoritmo, entre otros. Este argumento tiene valores por
defecto. Ver ayuda R, nls.control.
algorithm: Una cadena de caracteres para especicar el m etodo num eri-
co a usar. Por defecto es el m etodo de Gauss-Newton.
trace: Un valor l ogico (FALSE o TRUE) que indica si se debe imprimir los
resultados de cada iteraci on. Por defecto es FALSE.
subset: Un vector opcional para especicar un subconjunto de observa-
ciones a ser usadas para el proceso de ajuste.
weights: Un vector num erico opcional de pesos jos cuando se va a re-
alizar mnimos cuadrados ponderados.
na.action: Una funci on que indica qu e se debe hacer cuando los datos
contienen observaciones NAs (datos faltantes), por defecto produce un
mensaje de error en caso de datos faltantes. Puede modicarse a na.action=na.omit
para excluir las observaciones incompletas. ver m as en ayuda R.
model: Un argumento l ogico para exhibir o no el modelo. Por defecto es
FALSE.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
A.3. FUNCI

ON STL: DESCOMPOSICI
ON USANDO LOESS 389

A.3. Funci on stl: Descomposici on usando LOESS
STL es un m etodo para estimar las componentes de tendencia y estacional-
idad en series estacionales aditivas y multiplicativas. Consiste en una apli-
caci on iterativa de la regresi on local LOESS. Es necesario que el objeto sobre
el cual se desea aplicar la funci on stl() sea un objeto de serie de tiempo, con
la frecuencia de 52 (serie semanal), 4 (serie trimestral) o 12 (serie mensual).
La sintaxis es como sigue:
stl(x, s.window, s.degree = 0,
t.window = NULL, t.degree = 1,
l.window = nextodd(period), l.degree = t.degree,
s.jump = ceiling(s.window/10),
t.jump = ceiling(t.window/10),
l.jump = ceiling(l.window/10),
robust = FALSE,
inner = if(robust) 1 else 2,
outer = if(robust) 15 else 0,
na.action = na.fail)
donde,
x: Es una serie de tiempo univariada creada con funci on ts() y de fre-
cuencia mayor a 1.
s.window: se especica como periodic o bien, un entero impar indi-
cando el ancho de la ventana de la regresi on loess para la extracci on de
la componente estacional
s.degree: El grado del polinomio ajustado localmente en la extracci on
de la componente estacional. Debe ser cero o uno.
t.window: Un n umero impar para indicar el ancho de la ventana loess
a usar para la extracci on de la tendencia, por defecto es ajustada como
nextodd(ceiling((1.5
*
period) / (1-(1.5/s.window)))).
t.degree: el grado del polinomio local a usar en la extracci on de la ten-
dencia, s olo puede ser cero o uno.
l.window: El ancho de la ventana loess para el ltro de las subseries de
la estacionalidad. Por defecto, es el impar m as peque no que es mayor a
la frecuencia de la serie.
l.degree: El grado del polinomio ajustado localmente para la ltraci on
de las subseries de la estacionalidad. Puede ser cero o uno.
s.jump, t.jump, l.jump: Valores enteros indicando la velocidad de in-
cremento del respectivo suavizador.
robust: Un valor l ogico (TRUE o FALSE) para indicar si debe usarse un
ajuste robusto en el procedimiento loess.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
390 AP
inner, outer: el n umero de iteracciones dentro y fuera, respectiva-
mente, en las estimaciones robustas.
na.action: Acci on a realizar con valores faltantes.
Este procedimiento halla la componente estacional ajustando por loess las
subseries de cada estaci on; si s.window =periodic el suavizamiento es
reemplazado tomando medias. Los valores estacionales son removidos y luego
la serie resultante es suavizada para hallar la tendencia. El nivel global es
removido de la componente estacional y sumado a la tendencia. Este proce-
so es repetido iterativamente varias veces. La componente de error es hallada
luego por diferencia de la serie original menos la tendencia y estacionalidad
ajustadas.
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z
Bibliografa
[1] Campos Santill an, T., Problemario de Pron osticos para la Toma de Deci-
siones. Thomson Learning, M exico, 2001.
[2] Cryer, J. D and Chan, K-S., Time Series Analysis With Applications in R.
2
nd
ed. Springer, New York, 2008.
[3] Diebold, F., Elementos de Pron osticos. Thomson Learning, M exico, 2001.
[4] Gaynor, P. E and Kirkpatrick, R. C., Introduction to Time-Series Model-
ing and Forecasting in Business and Economics. McGrawh-Hill, Inc. New
York, 1994.
[5] Guerrero V. M. An alisis Estadstico de Series de Tiempo Econ omicas 2.
ed. Thompson Learning, M exico, 2003.
[6] Hylleberg, S., Engle, R. F, Granger, C. W. J and Yoo, B. S. (1990). Sea-
sonal Integration and Cointegration. Journal of Econometrics, 44, 215-
238.
[7] Makridakis, Wheelwright and McGee Forecasting: Methods and Applica-
tions. Wiley, 1983.
[8] Martinez J. Modelos Box Jenkins. Curso introductorio. II Simposio de Es-
tadstica, An alisis de Series temporales, Departamento de Estadstica,
Facultad de Ciencias, Universidad Nacional de Colombia, Bogot a, 1991.
[9] Wei, William W. S. Time Series Analysis. Univariate and Multivariate
Methods. Addison-Wesley Publishing Company, Inc., New York, 1990.
391
E
S
T
A
D
S
T
I
C
A

I
I
I

-

3
0
0
9
1
3
7

N
E
L
F
I

G
O
N
Z
L
E
Z

NOTASDECLASEESTADISTICAIIIv 01

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

NOTASDECLASEESTADISTICAIIIv 01

Загружено:

Авторское право:

Доступные форматы

Notas de Clase Estad stica III

INDICE GENERAL VII

INDICE DE FIGURAS XIII

ALISIS DE SERIES DE TIEMPO

ALISIS DE SERIES DE TIEMPO

IA DE LOS DATOS DE SERIES DE TIEMPO 31

ALISIS DE SERIES DE TIEMPO

IA DE LOS DATOS DE SERIES DE TIEMPO 33

ALISIS DE SERIES DE TIEMPO

Indice mensual de salario real sector industrial, enero de 1990 - noviembre

ALISIS DE SERIES DE TIEMPO

ALISIS DE SERIES DE TIEMPO

ALISIS DE SERIES DE TIEMPO

ALISIS DE SERIES DE TIEMPO

ALISIS DE SERIES DE TIEMPO

ITULO 3. MODELOS DE REGRESI

ISTICA VS. ESTOC

ITULO 3. MODELOS DE REGRESI

ITULO 3. MODELOS DE REGRESI

ITULO 3. MODELOS DE REGRESI

ITULO 3. MODELOS DE REGRESI

ITULO 3. MODELOS DE REGRESI

ITULO 3. MODELOS DE REGRESI

ITULO 3. MODELOS DE REGRESI

ITULO 3. MODELOS DE REGRESI

ITULO 3. MODELOS DE REGRESI

ITULO 3. MODELOS DE REGRESI

ITULO 3. MODELOS DE REGRESI

AFICAS DE DATOS REALES Y AJUSTADOS EN MISMO GR

ITULO 3. MODELOS DE REGRESI

ITULO 3. MODELOS DE REGRESI

ITULO 3. MODELOS DE REGRESI

ITULO 3. MODELOS DE REGRESI

ITULO 4. FILTROS LINEALES Y SUAVIZAMIENTOS

ITULO 4. FILTROS LINEALES Y SUAVIZAMIENTOS

ITULO 4. FILTROS LINEALES Y SUAVIZAMIENTOS

ITULO 4. FILTROS LINEALES Y SUAVIZAMIENTOS

ITULO 4. FILTROS LINEALES Y SUAVIZAMIENTOS

ITULO 4. FILTROS LINEALES Y SUAVIZAMIENTOS

ITULO 4. FILTROS LINEALES Y SUAVIZAMIENTOS

ITULO 4. FILTROS LINEALES Y SUAVIZAMIENTOS

) independientes. Para la implementaci on se

ITULO 4. FILTROS LINEALES Y SUAVIZAMIENTOS

Ultimos seis perodos

ITULO 4. FILTROS LINEALES Y SUAVIZAMIENTOS

ITULO 4. FILTROS LINEALES Y SUAVIZAMIENTOS

ITULO 4. FILTROS LINEALES Y SUAVIZAMIENTOS

ITULO 4. FILTROS LINEALES Y SUAVIZAMIENTOS

ITULO 4. FILTROS LINEALES Y SUAVIZAMIENTOS

ATICA Y ESTACIONALIDAD TRIMESTRAL

ALISIS DE ESTABILIDAD DEL MODELO

AFICA DE LA COMPONENTE DE TENDENCIA

AFICA SERIE ORIGINAL Y AJUSTADA POR REGRESI

ON CON TODAS LAS OBSERVACIONES

IODOS SGTES Y SUS INTERVALOS

OLO LOS n-4=151 PRIMERAS OBSERVACIONES DE LA SERIE

IODOS SGTES Y SUS INTERVALOS

ATICA Y ESTACIONALIDAD TRIMESTRAL

IODOS A SER PRONOSTICADOS

IODOS t=152 a 155 EN ESCALA ORIGINAL

IODOS DE t=152 a 155

ALCULO DEL MSIMP (MAPE PRON

OSTICO SIMPLE PARA t=152 a 155