Вы находитесь на странице: 1из 34

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

Estimacin de modelos ARIMA: Paro y empleo registrado


El objetivo de este trabajo es realizar un repaso de la metodologa ARIMA de series temporales aplicndola a dos variables econmicas fundamentales, empleo y paro. En general se considera que estos modelos predicen muy bien a corto plazo, pero es discutible que puedan hacerlo de forma aceptable a medio y largo plazo. Al no tener relacin alguna con la teora econmica difcilmente pueden captar el efecto de las nuevas condiciones de la coyuntura econmica, sobre todo cuando se producen cambios o puntos de inflexin del ciclo econmico, como ocurre en la economa espaola actualmente. El anlisis de los modelos ARIMA exige no slo un conocimiento terico suficiente y una destreza prctica, sino tambin la posibilidad de disponer de algn programa de ordenador para la realizacin de los clculos necesarios. Nosotros utilizaremos el programa GRETL, programa de econometra gratuito que se puede bajar de Internet. En el curso virtual (presentacin de la asignatura) se puede descargar el programa. Iremos viendo paso a paso como se utiliza el programa y repasando la teora de los modelos ARIMA, es decir repasaremos lo estudiado en los seis primeros captulos del libro. En general, para identificar, estimar y validar un modelo ARIMA se deben seguir los siguientes pasos:

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

Recomendamos que el alumno vaya siguiendo mediante el programa GRETL los distintos pasos que vamos realizando para adquirir competencia en el manejo del programa y obtener, de esta manera, una mayor comprensin terica y prctica. Tambin recomendamos que al analizar los distintos correlogramas de las series se tenga a mano el anexo I de este documento (forma que toma el Correlograma para la identificacin de modelos ARIMA) de manera que pueda comprender por qu se elije un tipo de modelo determinado y no otro. El anexo II muestra como se calcula el correlograma (Funciones de Autocorrelacin Total y Parcial) de cualquier serie de tiempo, los alumnos deben de comprender y saber calcularlas manualmente. Analizaremos las variables paro y empleo en Espaa durante los ltimos 27 aos (hasta diciembre de 2009, es decir, estimaremos el modelo ARIMA entre enero 1982 y diciembre de 2009 y haremos una prediccin para 2010). La actualidad del tema es evidente, la coyuntura econmica muestra una actividad econmica caracterizada por una grave crisis del sector financiero internacional que en Espaa se ha manifestado esencialmente en una fuerte crisis de liquidez. El panorama nacional se agrava con el fuerte endeudamiento de las familias y las empresas, el extraordinario dficit por cuenta corriente y la cada de la actividad en general (aumento del paro y disminucin del empleo) pero especialmente del sector de la construccin. Primero nos planteamos qu datos utilizar. Tradicionalmente se ha utilizado el paro y el empleo registrado. Pero actualmente se utiliza la Encuesta de Poblacin Activa (EPA) que para algunos autores son de mayor calidad. Aqu utilizaremos las fuente de la Seguridad Social (paro y afiliaciones registradas en la Seguridad Social) que tienen la ventaja de tener periodicidad mensual, la EPA es trimestral, y tambin de ser una estadstica cuyos datos se publican con anterioridad, es decir, tenemos datos ms actualizados para el anlisis de coyuntura. El alumno interesado en el tema puede realizar el anlisis de las series de la EPA que tambin se pueden descargar de la misma base de datos que utilizaremos. La base de datos utilizada es la del Banco de Espaa (www.bde.es). Entrando en Boletn estadstico y Series temporales completas, grabamos en disco la carpeta be.zip, que contiene multitud de ficheros de datos. Tambin la carpeta contiene el fichero denominado Catlogo en el que se describen todas las series de tiempo que contiene la base de datos y los ficheros donde se encuentran cada una de ellas. Los ficheros son del tipo .csv que se pueden leer mediante Excel. Para visualizar los datos correctamente (en Excel) seleccionamos, en el fichero catalogo y la primera columna completa, entramos en el men datos texto en columnas y seleccionamos la opciones delimitados comafinalizar. Los Afiliados a la Seguridad Social, es decir el empleo registrado, se encuentra en el fichero be2419.csv y el paro registrado en be2415.csv. Las afiliaciones comienzan en enero de 1982, el paro en 1939. Para tener ambas variables en el mismo fichero utilizaremos el periodo que va de enero de 1982 a febrero de 2010. Para utilizar estos datos en el programa Gretl primero crearemos un fichero Excel con ambas series temporales, ello se consigue simplemente creando un fichero nuevo de Excel con los datos de afiliaciones y paro en las dos primeras columnas (desde enero de 1982 hasta febrero de 2010, mediante el procedimiento de copiar y pegar) adems en la primera fila de ambas columnas pondremos los nombres de ambas columnas (afiliados y paro

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

en nuestro caso, que luego utilizaremos como nombre de las variables) y finalmente grabamos el fichero para luego utilizarlo (afiliados.xls).

Gretl
Al abrir el programa Gretl aparece su ventana principal, en la opcin Archivo del men podemos seleccionar la opcin Nuevo conjunto de datos si queremos grabar los datos manualmente o Abrir datos si queremos trabajar con datos grabados anteriormente en otra sesin o importar datos. Puesto que vamos a importar los datos de Excel, seleccionamos en el men: Archivo Abrir datos Importar Excel buscamos el fichero Afiliados.xls Afiliados.xls. El programa pregunta si comenzar a copiar en la fila 1 y columna 1 ok Los datos han sido interpretados como sin fecha Desea interpretarlos como serie de tiempo Mensual introducir la fecha de la primera observacin (en este caso enero de 1982) y finalmente en la ventana aparecern las dos variables. Con el objetivo de poder realizar prediccin histrica reduzco el rango de datos hasta diciembre de 2009 (GRETL: en el men Muestra Establecer rango reducir final hasta 2009.12 ok) para realizar la estimacin entre enero de 1982 y diciembre de 2009, es decir, como si slo tuviramos datos hasta diciembre de 2009.

Paro registrado
El Grfico 1 muestra el paro registrado (GRETL: en el men seleccionar Ver Grficos Grfico de series temporales elegir Paro ok)

Grfico 1 Paro registrado (1982.01-2009.12) Se aprecia el fuerte crecimiento del paro hasta la segunda mitad de los ochenta (crisis del petrleo y reconversin industrial); la cada hasta el noventa y dos (obras de infraestructuras para las Olimpiadas y la Exposicin Universal de Sevilla); la crisis del noventa y tres, con aumentos del paro hasta mediados de los noventa; la fuerte cada del 3

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

paro hasta principios del nuevo milenio (entrada en el Euro, tipos de inters bajos, desarrollo de todos los sectores y especialmente de la construccin); el nuevo milenio presenta unos niveles de paro estables hasta el comienzo de la crisis actual donde el paro se dispara desde el entorno de los dos millones de parados en 2008 a los cuatro millones de 2010. Para poder aplicar la metodologa ARIMA la serie debe ser estacionaria: 1. Bajo el supuesto de que una series histrica est compuesta por n variables aleatorias. En sentido estricto esa serie es estacionaria si y slo si las funciones de distribucin de frecuencias de esas n variables son iguales, es decir, si para distintos momentos de tiempo se cumple que: F(Zt)=F(Zt), representando t y t dos momentos diferentes de tiempo (t t). 2. En sentido amplio, sin embargo, basta con que se cumplan las siguientes condiciones: a. Media constante: E(Zt) = Z b. Varianza constante: var(Zt) = 2 De manera que lo primero que hay que hacer es ver si la serie del paro registrado es estacionaria, el menos en sentido amplio. En el grfico 1 se aprecian ciclos que, en principio, y puesto que estos movimientos parecen sistemticos, difcilmente son compatibles con la definicin de estacionaridad (n variables aleatorias con igual Funcin de Distribucin). Una forma prctica de ver si una serie es estacionaria o no, es calcular las Funcin de Autocorrelacin Total y si los valores decrecen rpidamente, la serie es estacionaria. El Correlograma del paro en niveles se reproduce en el grfico 2 (GRETL: en el men seleccionar la variable Paro con el ratn en el men pinchar en Variable Correlograma).

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

Grfico 2 Correlograma del Paro en niveles Donde la Funcin de Autocorrelacin decrece lentamente (parte superior del grfico 2, denominado FAC), consecuentemente el paro en niveles no es estacionario. La metodologa ARIMA asume que la forma de conseguir series estacionarias consiste en diferenciar regular y/o estacionalmente. Una serie es integrada de orden cero si es estacionaria [I(0)] e integrada de orden uno [I(1)] si es necesario una primera diferencia regular para conseguirlo y as sucesivamente. Si consideramos la parte regular y estacional conjuntamente entonces una serie por ejemplo I(1,1) es aquella que se hace estacionaria, o integrada de orden cero [I(0)], realizando una primera diferencia regular [d(Zt)=ZtZt-1] y otra estacional [d12(Zt)=ZtZt-12]. Puesto que el paro registrado no es estacionario en niveles probamos la primera diferencia regular, es decir, comprobamos si el paro es integrado de orden uno [I(1)] calculando la primera diferencia regular para ver si es estacionaria (GRETL: seleccionar la variable Paro y en el men seleccionar Aadir Primeras diferencias de las variables seleccionadas en la ventana se muestra la nueva variable en diferencias d_Paro). El grfico 3 muestra el paro en primeras diferencias (GRETL: en el men selecinar Ver Grficos Grfico de series temporales elegir d_Paro ok).

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

Grfico 3 Paro registrado en diferencias Cuyo Correlograma se muestra en el siguiente grfico (GRETL: seleccionar la variable d_Paro con el ratn en el men Variable Correlograma).

Grfico 4 Correlograma del paro en diferencias (d_Paro)

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

La Funcin de Autocorrelacin del paro registrado en diferencias decrece rpidamente en los desfases regulares (primeros desfases) pero de forma lenta en los retardos estacionales (12, 24, 36 y 48), de manera que no es estacionario en la parte estacional, o dicho de otra forma, el paro registrado no es una serie integrada de orden uno [I(1)]. De manera que diferenciamos estacionalmente para comprobar si el paro es integrado de orden uno estacional [I(0,1)]. Calculamos una diferencia estacional del paro reproducida en el grfico que se muestra a continuacin (GRETL: seleccionar la variable Paro y en el men Aadir Primeras diferencias estacionales de las variables seleccionadas en la ventana aparece la nueva variable en diferencias estacionales sd_Paro).

Grfico 5 Diferencia estacional del paro (sd_Paro) Donde se observa con claridad las crisis del periodo (mximos relativos): principios de los ochenta, crisis del noventa y tres, crisis del noventa y seis, del dos mil tres y sobre todo la actual. Su Correlograma (GRETL: seleccionar la variable sd_Paro con el ratn y en el men Variable Correlograma) es el siguiente.

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

Grfico 6 Correlogarama del paro en diferencias estacionales (sd_Paro) Presenta una Funcin de Autocorrelacin Total (FAC) que decrece lentamente en la parte regular, la serie en diferencias estacionales no es estacionaria, el paro registrado no es integrado de orden uno estacional [I(0,1)]. De manera que probamos si el paro es integrado de orden uno regular y estacional [I(1,1)] calculando una diferencia estacional a partir de la serie en diferencias regulares (GRETL: seleccionar la variable d_Paro y en el men Aadir Primeras diferencias estacionales de las variables seleccionadas en la ventana aparece la nueva variable en primeras diferencias regulares y estacionales sd_d_Paro), cuyo grfico se reproduce a continuacin (GRETL: Ver Grficos Grfico de series temporales elegir sd_d_Paro ok).

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

Grfico 7 El paro en diferencias regulares y estacionales (sd_d_Paro) Cuyo correlograma es (GRETL: seleccionar la variable sd_d_Paro con el ratn y en el men Variable Correlograma).

Grfico 8 Correlograma del paro diferenciado regular y estacionalmente (sd_d_Paro)

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

La parte regular se asemeja a un AR(2) puesto que la Funcin de Autocorrelacin Total presenta dos valores significativamente distintos de cero mientras que la Funcin de autocorrelacin parcial decrece rpidamente. En los desfases estacionales la cuestin es diferente: el primer desfase estacional es significativo, la Funcin de Autocorrelacin Parcial estacional decrece rpidamente1. De manera que el paro en diferencias regulares y estacionales es estacionario [I(1,1)] y parece responder a un modelo AR(2) regular y MA(1)2 estacional, es decir, un SARIMA(2,1,0)(0,1,1) que se puede escribir de las siguiente forma: (1-B)(1-B12)Wt = Zt = a1Zt-1 + a2Zt-2 + bVt-12 + Vt Cuya forma compacta es, (1 - a1B - a2B2)Zt=(1+bB12)Vt [2] [1]

La estimacin del modelo se reproduce en el cuadro 1 (GRETL: en el men seleccionar Modelo Series de tiempo ARIMA seleccionar como variable dependiente sd_d_Paro seleccionar en la parte no estacional: orden AR = 2, diferencia = 0 y orden MA = 0. Y en la parte estacional: orden AR = 0, diferencia = 0 y orden MA = 1. Manteniendo la constante y seleccionar ok apareciendo una ventana con la estimacin del modelo).
ARMA, usando las observaciones 1983:02-2009:12 (T = 323) Estimado usando el filtro de Kalman (MV exacta) Variable dependiente: sd_d_Paro Desviaciones tpicas basadas en la matriz de productos externos Coeficiente Desv. Tpica Estadstico t Valor p ----------------------------------------------------------------const 516.235 841.265 0.6136 0.5395 phi_1 0.230043 0.0541967 4.245 2.19e-05 *** phi_2 0.201914 0.0543272 3.717 0.0002 *** Theta_1 0.857650 0.0395960 21.66 4.89e-104 *** Media de la vble. dep. 1193.783 media innovaciones 1831.765 Log-verosimilitud 3922.995 Criterio de Schwarz 7874.879 D.T. de la vble. dep. D.T. innovaciones Criterio de Akaike Crit. de Hannan-Quinn 57244.63 44426.59 7855.991 7863.531

Cuadro 1 Estimacin del modelo SARIMA(2,1,0)(0,1,1) del paro Todos los parmetros son significativos: a1 (phi_1), a2 (phi_2) y b1 (Theta_1), el trmino independiente se suele mantener por cuestiones de ajuste an cuando en este caso no es significativo. La validacin del modelo se realiza comprobando que los
1

En este sentido hay que recordar que aunque la parte regular parece que se ajusta ms a un AR(2) esto no queda claro y poda tambin corresponder a un ARMA(1,1) regular, de manera que se recomienda estimar tambin este modelo, y elegir el que mejor ajusta siguiendo el criterio de Akaike, esto es lo que se ha hecho siguiendo el criterio de parsimonia (libro de texto pg. 143), resultando que el que mejor ajusta es el AR(2) regular.
2

Para la identificacin de los modelos ARIMA hay que tener siempre en cuenta la forma que toma el Correlograma para cada modelo terico, en el ANEXO I de este trabajo se muestra la forma terica que toman los distintos modelos ARIMA y en el ANEXO II se muestra como se calcula el Correlograma (Funcin de Autocorrelacin Total y Parcial).

10

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

residuos son RB (Ruido Blanco). El grfico 9 muestra el Correlograma de las discrepancias (GRETL: en el cuadro de la estimacin del modelo (cuardo 1) seleccionar Grficos Grficos de residuos Correlograma de los residuos).

Grfico 9 Correlograma de los residuos de modelo SARIMA(2,1,0)(0,1,1) del paro. Que presenta una Funcin de Autocorrelacin (FAC) con slo un valor significativo, mayor de ( 2 323 ) = 0.110, en el retardo 8 (0,146), el estadstico BoxPierce3 en el retardo 50 es 36, con un p-valor del 0.932, lo que muestra unos residuos cercanos a la imagen emprica de RB. De manera que podemos considerar el modelo SARIMA(2,1,0)(0,1,1) para el paro registrado como validado. Una vez estimado el modelo realizamos la prediccin para 2010, para ello calculamos, a partir de la serie original la serie estacionaria en Excel. El cuadro 2 reproduce la serie original del paro a partir de enero de 2009 (se puede calcular en Excel o a partir de la serie calculada por GRETL sd_d_paro), la columna Vt es la que calcula por GRETL como residuos del modelo (GRETL: en la ventana de estimacin del modelo elegir Guardar Residuos se genera una serie denominada uhatxx que es la serie Vt del cuadro 2).

Ver pp. 203-204 del libro de texto.

11

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

Cuadro 2 Prediccin 2010 de la serie estacionaria Paro registrado SARIMA(2,1,0)(0,1,1)


Obs. ene-09 feb-09 mar-09 abr-09 may-09 jun-09 jul-09 ago-09 sep-09 oct-09 nov-09 dic-09 ene-10 feb-10 mar-10 abr-10 may-10 jun-10 jul-10 ago-10 sep-10 oct-10 nov-10 dic-10 Wt Paro 3327801 3481859 3605402 3644880 3620139 3564889 3544095 3629080 3709447 3808353 3868946 3923603 4048493 4130625 dparo dWt=(Wt-Wt-1) 198838 154058 123543 39478 -24741 -55250 -20794 84985 80367 98906 60593 54657 124890 82132 dd12paro (dd Wt=dWt-dWt-12)
12

Vt 59345 90762,2 86599,3 9407,1 -23281,9 -58140,4 -6754 60406,6 43853,5 13454,5 -18291,3 20593,7 18337,0 39581,3

Prediccin

dd 12Wt Zt
7333 10111 51524 -7254 -16298 -33738 -50311 -78288 -58634 -106992 -92141 -105413 -92285 -111507 -105233 -22075 20484 50380 6309 -51291 -37095 -11023 16204 -17146

66460 100652 137899 1936 -39799 -92099 -57286 -18100 -15000 -93752 -110650 -85037 -73948 -71926

La ltima columna es la prediccin que hemos calculado aplicando la ecuacin del modelo estimado, es decir, a partir de [1] tenemos que, Zt = 516,235 + 0,230043Zt-1 + 0,201914Zt-2 0,85765Vt-12 [3]

Como slo disponemos de datos de enero y febrero de 2010, slo podemos comparar la prediccin en estos dos meses, en ambos la prediccin subestima el paro. La prediccin en niveles se realiza a partir de [1], el modelo estimado es (1-B)(1-B12)Wt = Zt = 516,235 + 0,230043Zt-1 + 0,201914Zt-2 0,85765Vt-12 +Vt operando en la parte izquierda de la ecuacin tenemos, (1-B12-B+B13)Wt=Zt =516,235 + 0,230043Zt-1 + 0,201914Zt-2 0,85765Vt-12 +Vt WtWt-12Wt-1+Wt-13=Zt=516,235+0,230043Zt-1+ 0,201914Zt-20,85765Vt-12+Vt el paro en niveles a partir de Zt es, Wt = Zt + Wt-12 + Wt-1 Wt-13 [4]

12

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

De manera que podemos calcular, a partir de [4], la prediccin del paro en niveles hasta diciembre de 2010 que se reproduce en el cuadro 3. Para ello recurrimos a Excel. La segunda columna muestra el paro registrado (Wt) en niveles hasta febrero de 2010, la tercera es la prediccin de la serie estacionaria (ltima columna del cuadro 2) hasta diciembre de 2010, aplicando la ecuacin [4], se llega a la prediccin del paro en niveles hasta diciembre de 2010. Cuadro 3 Prediccin 2010 del paro en niveles Paro registrado SARIMA(2,1,0)(0,1,1)
Obs ene-10 feb-10 mar-10 abr-10 may-10 jun-10 jul-10 ago-10 sep-10 oct-10 nov-10 dic-10 Wt Paro 4048493 4130625 Zt estimada -92285 -111507 -105233 -22075 20484 50380 6309 -51291 -37095 -11023 16204 -17146 Wt estimada 4030156 4091044 4148935 4166339 4162081 4157212 4142727 4176420 4219692 4307575 4384372 4421883

Podemos calcular, a partir de la ecuacin [1], el paro estimado en niveles hasta diciembre de 2009 (GRETL: en el men seleccionar Modelo Series de tiempo ARIMA seleccionar como variable dependiente Paro seleccionar en la parte no estacional: orden AR = 2, diferencia = 1 y orden MA = 0. Y en la parte estacional: orden AR = 0, diferencia = 1 y orden MA = 1. Manteniendo la constante y seleccionar ok apareciendo una ventana con la estimacin del modeloen la ventana de estimacin del modelo seleccionar Grficos grfico de la variable estimada y observada). El grfico 11 muestra el paro registrado y estimado en niveles.

13

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

Grfico 11 Paro registrado y estimacin [modelo SARIMA(2,1,0)(0,1,1)] Donde se observa a simple vista el buen ajuste del modelo. El grfico 12 muestra la prediccin del paro en 2010 y los observados.

Grfico 12 La prediccin subestima el paro efectivo hasta abril (aunque se puede considerar una prediccin aceptable hasta este mes), a partir de mayo la prediccin sobrestima lo realmente sucedido. En este sentido hay que recordar que los modelos ARIMA son especialmente adecuados para predecir a corto plazo, lo que ocurre en este caso si consideramos slo los 4 primeros meses. 14

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

Empleo (Afiliaciones a la Seguridad Social)


Los economistas consideramos, en general, que el empleo es ms adecuado para el anlisis de la evolucin de la economa que el paro puesto que mayor empleo implica necesariamente mayor produccin, mientras que en el paro influyen otras circunstancias no relacionadas directamente, como la incorporacin de la mujer al mercado de trabajo, la emigracin, etc. El grfico 12 muestra el empleo registrado (GRETL: en el men seleccionar Ver Grficos Grfico de series temporales elegir Afiliaciones ok). EL grfico 12 muestra una tendencia creciente si consideramos todo el periodo. Tambin se aprecia la ralentizacin de la primera mitad de la dcada de los ochenta (crisis del petrleo), la crisis del noventa y tres y la crisis actual.

Grfico 12 Empleo (afiliaciones a la Seguridad Social) Puesto que la serie no es estacionaria [I(0)], Calculamos su primera diferencia para ver si es integrada de orden uno [I(1)], su grfico se muestra a continuacin (GRETL: seleccionar la variable Afiliados y en el men Aadir Primeras diferencias de las variables seleccionadas en la ventana principal aparece la nueva variable en diferencias d_Afiliados).

15

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

Grfico 14 Primera diferencia del empleo Que presenta una varianza creciente a lo largo del periodo (heterocedasticidad), en definitiva la serie en primeras diferencias no es estacionaria. En muchas ocasiones aplicando logaritmos se consigue evitar la heterocedasticidad. De manera que transformamos la serie original en logaritmos (GRETL: seleccionar la variable Afiliados y en el men Aadir Logaritmos de las variables seleccionadas en la ventana principal aparece la nueva variable en logaritmos l_Afiliados). El siguiente grfico muestra el empleo en logaritmos.

Grfico 15 Empleo en logaritmos 16

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

Del que se pueden hacer los mismos cometarios que de la serie en niveles (grfico 14): tendencia creciente, crisis de la primera mitad de los ochenta, crisis del noventa y tres y ralentizacin actual. Puesto que la serie no es estacionaria en media calculamos su primeras diferencias con el objetivo de contrastar si la primera diferencia del empleo registrado en logaritmos es integrado de orden uno [I(1)] (GRETL: seleccionar la variable l_Afiliados y en el men Aadir Primeras diferencias de las variables seleccionadas en la ventana principal aparece la nueva variable en diferencias d_l_Afiliados). Cuyo grfico se muestra a continuacin.

Grfico 16 Primeras diferencias del empleo en logaritmos Donde no se aprecia existencia de heterocedasticidad ni tendencia, su Correlograma se muestra en a continuacin (GRETL: seleccionar la variable d_l_Afiliados con el ratn y en el men Variable Correlograma).

17

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

Grfico 17 Correlograma de las primeras diferencias regulares del empleo en logaritmos Cuya Funcin de Autocorrelacin Total (FAC) cae rpidamente en los primeros desfases regulares pero tambin se observa una cada lenta en los retardos estacionales. De manera que no es estacionaria en la parte estacional, el empleo en logaritmos no es integrado de orden uno [I(1)]. Ensayamos una diferencia estacional para ver si el empleo en logaritmos es integrado de orden uno estacional [I(0,1)]. Calculamos la primera diferencia estacional del empleo en logaritmos (GRETL: seleccionar la variable l_Afiliados y en el men Aadir Primeras diferencias estacionales de las variables seleccionadas en la ventana principal aparece la nueva variable en diferencias estacionales sd_l_Afiliados). Cuya grfica se muestra a continuacin.

18

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

Grfico 18 Primera diferencia estacional del empleo en logaritmos Se observa, a partir de sus mnimos relativos la crisis de la primera mitad de los ochenta, la del noventa y tres, y la actual. Su Correlograma (Seleccionar la variable sd_l_Afiliados con el ratn y en el men Variable Correlograma) se muestra a continuacin.

Grfico 19 Correlograma de la primera diferencia estacional del empleo en logaritmos

19

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

Que presenta una Funcin de Autocorrelacin Total que disminuye lentamente, de manera que la primera diferencia estacional del empleo en logaritmos no es estacionaria. Calculamos la primera diferencia regular y estacional del empleo en logaritmos con el objetivo de ver si el empleo en logaritmos es integrado de orden uno regular y estacional [I(1,1)] (GRETL: seleccionar la variable d_l_Afiliados y en el men Aadir Primeras diferencias estacionales de las variables seleccionadas en la ventana principal aparece la nueva variable en diferencias estacionales sd_d_l_Afiliados). Cuyo grfico se muestra seguidamente.

Grfico 20 Primeras diferencias regulares y estacionales del empleo en logaritmos Cuyo Correlograma (GRETL: seleccionar la variable sd_d_l_Afiliados con el ratn y en el men Variable Correlograma) se reproduce seguidamente.

20

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

Grfico 21 Correlograma de las primeras diferencias regulares y estacionales del empleo en logaritmos Correlograma que no es fcil de interpretar (sorprende que sea creciente los tres primeros retardos tanto de la funcin de autocorrelacin parcial como total), en todo caso el empleo en logaritmos es integrado de orden uno regular y estacional [I(1,1)]. El primer desfase no es significativo mientras que el segundo y tercero si lo son. Los desfases estaciones son significativos al menos los dos primeros (desfases 12 y 24) tanto en la autocorrelacin parcial como total. Hemos llegado, mediante estimaciones iterativas de diferentes especificaciones alternativas, siguiendo el criterio de Akaike (pg. 178), al modelo SARIMA(3,1,1)(0,1,2) que se reproduce a continuacin (GRETL: en el men seleccionar Modelo Series de tiempo ARIMA seleccionar como variable dependiente sd_d_l_Afiliados seleccionar en la parte no estacional: orden AR = 3, diferencia = 0 y orden MA =1. Y en la parte estacional: orden AR = 0, diferencia = 0 y orden MA = 2. Tambin eliminar la constante y seleccionar ok apareciendo una ventana con la estimacin del modelo).

21

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

ARMA, usando las observaciones 1983:02-2009:12 (T = 323) Estimado usando el filtro de Kalman (MV exacta) Variable dependiente: sd_d_l_Afiliado Desviaciones tpicas basadas en la matriz de productos externos Coeficiente Desv. Tpica Estadstico t Valor p ---------------------------------------------------------------phi_1 0.371055 0.118985 3.119 0.0018 *** phi_2 0.131039 0.0578205 2.266 0.0234 ** phi_3 0.301385 0.0675287 4.463 8.08e-06 *** theta_1 0.398225 0.120043 3.317 0.0009 *** Theta_1 0.476254 0.0596572 7.983 1.43e-15 *** Theta_2 0.188983 0.0608877 3.104 0.0019 *** Media de la vble. dep. 0.000092 media innovaciones 8.46e-06 Log-verosimilitud 1370.121 Criterio de Schwarz 2699.797 D.T. de la vble. dep. D.T. innovaciones Criterio de Akaike Crit. de Hannan-Quinn 0.004192 0.003446 2726.241 2715.68

Cuadro 5 Estimacin del modelo SARIMA(3,1,1)(0,1,2) del empleo en logaritmos Cuyos parmetros son significativos. La validacin del modelo, a partir del Correlograma de los residuos se muestra a continuacin (GRETL: en el cuadro de la estimacin seleccionar Grficos Grficos de residuos Correlograma).

Grfico 22 Correlograma de los residuos del modelo SARIMA(3,1,1)(0,1,2) del empleo en logaritmos

22

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

Presenta valores significativos (mayores de 0.110 en trminos absolutos) en la Funcin de Autocorrelacin Total en los desfases 14, 23, 28, 32, 33, 39 y 45. El estadstico Box-Pierce en el retardo 50 es 72, de manera que a pesar de que los primeros retardos no son significativos el estadstico Box-Pierce indica que los residuos no son RB. Supuesto que los residuos se pudieran considerar RB, el modelo en notacin compacta es, (1a1Ba2B2a3B3)(1B)(1B12)Ln(Wt) = (1+b1B+b2B12+b3B24)Vt operando tenemos, (1B)(1B12)Ln(Wt) =Zt= Vt+b1Vt-1+b2Vt-12+b3Vt-24+a1Zt-1+a2Zt-2+a3Zt-3 (1B12 B + B13)Ln(Wt) =Zt= Vt+b1Vt-1+b2Vt-12+b3Vt-24+a1Zt-1+a2Zt-2+a3Zt-3 y el modelo estimado es, (1B12B+B13)Ln(Wt)=Zt=Vt-0,40Vt-1-0,48Vt-12-0,19Vt-24+0,37Zt-1+0,13Zt-2+0,30Zt-3 Estimado el modelo realizamos la prediccin para 2010, para ello calculamos, a partir de la serie original, la serie estacionaria en Excel, el cuadro 7 reproduce la serie original del empleo a partir de enero de 2009 (se puede calcular en Excel o a partir de la serie calculada en GRETL sd_d_l_Afiliado), la columna Vt es la que calcula GRETL como residuos del modelo (GRETL: en la ventana de estimacin del model elegir Guardar Residuos se genera una serie denominada uhatxx que es la serie Vt del cuadro 7). Cuadro 7 Prediccin 2010 de la serie estacionaria Afiliados registrado SARIMA(2,1,0)(0,1,1)
Obs. ene-09 feb-09 mar-09 abr-09 may-09 jun-09 jul-09 ago-09 sep-09 oct-09 nov-09 dic-09 ene-10 feb-10 mar-10 abr-10 may-10 jun-10 jul-10 ago-10 sep-10 oct-10 nov-10 dic-10 Wt Afiliados 18150678 18075777 17967287 17955064 18100171 17917981 17958362 17796399 17791858 17870659 17777153 17640018 17546714 17550412 Ln(Wt) 16,7142185 16,7100833 16,7040633 16,7033828 16,7114319 16,7013153 16,7035664 16,6945067 16,6942515 16,6986708 16,6934247 16,6856806 16,6803773 16,6805880 dLn(Wt) dd12Ln(Wt) dln(Wt)=ln(Wt)- dd12Ln(Wt)=dLn(Wt)-ln(Wt-1) -dLn(Wt-12) -0,0084998 -0,0040778 -0,0041352 -0,0075399 -0,00602 -0,0088447 -0,0006805 -0,0017706 0,00804919 0,00118264 -0,0101167 0,000216 0,00225112 0,00303413 -0,0090597 -0,0030696 -0,0002552 0,01125313 0,00441927 0,01139138 -0,0052461 -0,0027403 -0,007744 0,01140938 -0,0053034 0,00319644 0,00021073 0,00434589 Prediccin Vt -0,0006345 -0,00326 -0,004365 0,0004384 0,006958 -0,0003865 0,00354 0,0008793 0,005335 0,008891 -0,005734 0,004613 -0,0031786 -0,000811

dd ln Wt Zt
12

-0,0036334 -0,0037403 -0,003938 -0,0014779 -0,0048668 0,00036113 0,00172091 -0,0032061 0,00460376 0,0047416 0,00386092 0,0078418 0,00637507 0,00515687 0,00891597 0,00496195 0,00071901 0,00625066 0,0023973 -8,375E-05 0,00230021 -0,0018737 0,00341032 0,00022638

23

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

podemos calcular la serie en niveles a partir de la serie estacionaria Ln(Wt) Ln(Wt-12) Ln(Wt-1) + Ln(Wt-13) = Zt Ln(Wt) = Zt + Ln(Wt-12) + Ln(Wt-1) Ln(Wt-13) Wt = exp[Zt + Ln(Wt-12) + Ln(Wt-1) Ln(Wt-13)] [5] [6]

A partir de [6] calculamos la prediccin del empleo en niveles hasta diciembre de 2010. Para ello recurrimos a Excel. La segunda columna del cuadro 8 muestra los afiliados registrados (Wt) en niveles hasta febrero de 2010, la tercera la prediccin de la serie estacionaria (ltima columna del cuadro 7), hasta diciembre de 2010. Calculando [6] se llega a la prediccin de los afiliados registrados en niveles (ltima columna del cuadro 8). Cuadro 8 Prediccin 2010 del empleo en niveles Afiliados SARIMA(3,1,1)(0,1,2)
Obs ene-10 feb-10 mar-10 abr-10 may-10 jun-10 jul-10 ago-10 sep-10 oct-10 nov-10 dic-10 Wt Afiliados 17546714 17550412 Zt estimada 0,00637507 0,00515687 0,00891597 0,00496195 0,00071901 0,00625066 0,0023973 -8,375E-05 0,00230021 -0,0018737 0,00341032 0,00022638 Wt estimada 17602577 17564651 17601310 17676831 17832506 17763699 17846465 17684030 17720231 17765396 17732812 17600003

Podemos mostrar los afiliados observados y estimados en logaritmos, hasta diciembre de 2009 (GRETL: en el men seleccionar Modelo Series de tiempo ARIMA seleccionar como variable dependiente l_Afiliados seleccionar en la parte no estacional: orden AR = 3, diferencia = 1 y orden MA = 1. Y en la parte estacional: orden AR = 0, diferencia = 1 y orden MA = 2. Eliminando la constante y seleccionando ok aparece la ventana con la estimacin del modeloen la ventana de estimacin seleccionar Grficos grfico de la variable estimada y observada). El grfico 23 muestra el empleo registrado y estimado en logaritmos.

24

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

Grfico 23 Empleo registrado y estimacin en logaritmos, modelo SARIMA(3,1,1)(0,1,2) Que muestra un buen ajuste, de manera que aunque no est claro si los residuos son RB, podemos utilizar el modelo para predecir. El grfico 24 muestra la prediccin del empleo para 2010 y el empleo observado en enero y febrero.

Cuadro 24 Prediccin del empleo en niveles para 2010 SARIMA(3,1,1)(0,1,2) Se plantea una coyuntura en la que el empleo termina el ao en los mismos niveles en que empez, comparando la prediccin con lo efectivamente ocurrido la conclusin es que la prediccin en su conjunto se puede considerar adecuada sobrestimado el empleo pero en una cuanta aceptable. 25

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

El alumno debe observar que en la parte regular de este modelo ARIMA(3,1,1), la suma de los componentes autorregresivo y medias mviles es 4, muy alejado de la recomendacin de Anderson (p + q 2) (pg. 143 del libro). Hubiera sido mejor estimar el modelo SARIMA(0,1,0)(0,1,2) y aadir dos autorregresivos de orden 2 y 3. En este caso el criterio de Akaike mejora (-2742,589) y por tanto tambin el ajuste. El correlograma de los residuos presenta valores significativos (mayores de 0.110 en trminos absolutos) de la Funcin de Autocorrelacin Total en los mismos desfases que el modelo anterior y el estadstico Box-Pierce en el retardo 50 es tambin 72, de manera que tampoco en este modelo queda claro si los residuos son RB. En todo caso la prediccin es muy parecida y desde el punto de vista didctico consideramos mejor el modelo estimado anteriormente.

Conclusiones
Las evidencias empricas muestran que ambas variables son integradas de orden uno regular y estacional [I(1,1)]. El paro se ajusta bien el modelo SARIMA(2,1,0)(0,1,1), es decir un AR(2) en la parte regular y un MA(1) en la estacional cuyos residuos son una imagen emprica cercana a ruido blanco. La prediccin es adecuada en los primeros 4 meses, alejndose a partir del mes mayo de lo efectivamente ocurrido. El modelo del empleo que mejor se ajusta es un SARIMA(3,1,1)(0,1,2). Los residuos del modelo presentan dudas respecto a su validacin. El pronstico sobrestima las cifras de empleo pero se comparta bastante bien, el pronstico de estancamiento del empleo ha resultado cierto.

26

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

ANEXO I (forma que toma el Correlograma para la identificacin de modelos ARIMA)

27

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

28

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

29

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

ANEXO II (CLCULO DEL CORRELOGRAMA)


Como sabis, los modelos ARIMA utilizan como herramienta para identificar y validar sus modelos el Correlograma. A continuacin se muestra como se calculan las Funciones de Autocorrelacin Total y Funcin Autocorrelacin Parcial de cualquier serie temporal.

Funcin de Autocorrelacin.
En el libro de Econometra II se ilustra el proceso de clculo de la funcin de autocorrelacin referida a los 12 nmeros de la serie original de manchas solares pg. 85 y siguientes. La funcin de autocorrelacin se puede calcular a partir de los siguientes estadsticos:

1 Cu T 1. Ru C0

T u t 1

Z
T

Z Zt u Z

C 2. Ru u C0

C 3. Ru u C0
donde: Z1

Z Z Z Z 1 Z Z T 1 Z Z Z Z Tu 1 Z Z T
1 Tu
T u t 1 t t u T 2 t 1 t T u t 1 t 1 t u 2 T 2 t 1 t

1 T

t 1

1 T Zt , y T t 1

Z1

1 Tu

T u t 1

Zt u

Asntticamente los tres estadsticos son iguales, pero cuando se trabaja con pocas observaciones puede haber diferencias significativas.

Realizando

1 T 2 Z Z t t 1 T que se reproducen en el cuadro 1.

1 Cu T Ru C0

la

funcin

T u t 1

Z Zt u Z

de

autocorrelacin

partir

del

estadstico

1.

, y teniendo en cuenta los clculos intermedios

30

Modelos ARIMA Paro y empleo registrado Equipo docente de Econometra II

Econometra II UNED

Cuadro 1 (Zt43,28) (Zt2 43,28) (Zt-43,28) Zt-1 (Zt-1-43,28) (Zt-1-43,28) Zt-2 (Zt-2-43,28)

(Zt-43,28)
Zt-3 (Zt-3-43,28)

(Zt-43,28) (Zt-3-43,28)

Obs.

Zt-10

(Zt-2-43,28)

(Zt-1043,28)

(Zt-43,28) (Zt-10-43,28)

1749 1750 1751 1752 1753 1754 1755 1756 1757 1758 1759 1760 Suma Media

80,90 83,40 47,70 47,80 30,70 12,20 9,60 10,20 32,40 47,60 54,00 62,90 519,40 43,28

37,62 40,12 4,42 4,52 -12,58 -31,08 -33,68 -33,08 -10,88 4,32 10,72 19,62

1415,01 1609,35 19,51 20,40 158,34 966,17 1134,57 1094,51 118,45 18,63 114,85 384,81 7054,60 587,88 80,90 83,40 47,70 47,80 30,70 12,20 9,60 10,20 32,40 47,60 54,00 37,62 40,12 4,42 4,52 -12,58 -31,08 -33,68 -33,08 -10,88 4,32 10,72 1509,06 177,18 19,95 -56,83 391,13 1046,99 1114,36 360,06 -46,98 46,26 210,23 4771,39 80,90 83,40 47,70 47,80 30,70 12,20 9,60 10,20 32,40 47,60 37,62 40,12 4,42 4,52 -12,58 -31,08 -33,68 -33,08 -10,88 4,32 166,14 181,19 -55,58 -140,39 423,85 1028,34 366,59 -142,81 -116,63 84,68 1795,38 80,90 83,40 47,70 47,80 30,70 12,20 9,60 10,20 32,40 37,62 40,12 4,42 4,52 -12,58 -31,08 -33,68 -33,08 -10,88 169,90 -504,80 -137,28 -152,14 416,30 338,29 -145,40 -354,54 -213,49 -583,17

80,90 83,40 37,62 40,12 403,13 786,96 1190,08

31

Modelos ARIMA Paro y empleo registrado

Econometra II UNED

En definitiva utilizando este estadstico, la Funcin de Autocorrelacin es:

Desfase 1

Ru

C R1 1 C0

T 1 t 1

Z Z Z Z 4771,39 Z Z 7054,60 0.676


t t 1 T 2 t 1 t

C R2 2 C0

T 2 t 1

Z Z Z Z 1795.38 Z Z 7054,60 0.254


t T t 2 2 t 1 t

3 10

C R3 3 C0
.

T 3 t 1

Z Z Z Z - 583,17 Z Z 7054,60 -0,083


t T t 3 2 t 1 t

C R3 10 C0

T 10 t 1

Z Z Z Z 1190.08 Z Z 7054,60 0,169


t T t 3 2 t 1 t

Funcin de Autocorrelacin Parcial


La Funcin de Autocorrelacin Parcial coincide con el parmetro mnimo cuadrtico autorregresivo de orden q, as el valor de la Funcin de Autocorrelacin Parcial de la serie Zt en desviaciones a las medias ser: Zt = a11Zt-1 [1], donde a11 es el valor de la Funcin de Autocorrelacin Parcial de orden uno. Zt = a1Zt-1 +a22Zt-2 [2], donde a22 es el valor de la Funcin de Autocorrelacin Parcial de orden dos, obsrvese que a11 es distinto que a1. .. Zt = a1Zt-1 + a2Zt-2 + + appZt-p [3], donde app es el valor de la Funcin de Autocorrelacin Parcial de orden p . De manera que se puede calcular la Funcin de Autocorrelacin parcial por MCO. Tambin es posible calcular la Funcin de Autocorrelacin Parcial a partir de la Funcin de Autocorrelacin (ecuaciones de Yule-Walker).

32

Modelos ARIMA Paro y empleo registrado

Econometra II UNED

Clculo de la Funcin de Autocorrelacin Parcial de orden uno (a11). Multiplicando [1] por Zt-1en ambos lados se tiene, ZtZt-1 = a11Zt-1Zt-1, y aplicando esperanzas, E (ZtZt-1) = a11E(Zt-1Zt-1) C1 = a11C0, y dividiendo por C0, R1 = a11, de manera que el Funcin de Autocorrelacin y la Funcin de Autocorrelacin Parcial de orden uno coinciden. Clculo de la Funcin de Autocorrelacin Parcial de orden 2 (a22) Multiplicando [2] por Zt-1 en ambos miembros se tiene, ZtZt-1 = a1Zt-1Zt-1 + a22Zt-2Zt-1 , y aplicando esperanzas, E (ZtZt-1) = a1E(Zt-1Zt-1) + a22E(Zt-1Zt-2) C1 = a1C0 +a22C1, y dividendo por C0, R1 = a1R0 +a22R1 multiplicando [2] por Zt-2en ambos miembros, ZtZt-2 = a1Zt-1Zt-2 + a22Zt-2Zt-2 , y aplicando esperanzas, E (ZtZt-2) = a1E(Zt-1Zt-2) + a22E(Zt-2Zt-2) C2 = a1C1 +a22C0, y dividendo por C0, R2 = a1R1 +a22R0 [5] [4]

De manera que tenemos dos ecuaciones [4] y [5] y dos incgnitas (a1 y a22) sistema de ecuaciones que en forma matricial se:

R1 R0 R1 R2 tenemos,
R a1 0 R1 a22

R1 a1 , premultiplicando por la matriz inversa del segundo miembro R0 a22


1

R1 R0

R1 R2

[6]

de manera que podemos calcular a22 conociendo R1 y R2. Clculo de la Funcin de Autocorrelacin Parcial de orden p (auu) Multiplicando [3] por Zt-u en ambos miembros se tiene, ZtZt-u = a1Zt-1Zt-u + a2Zt-2Zt-u + + appZt-pZt-u, y aplicando esperanzas, E (ZtZt-u) = a1E(Zt-1Zt-u) + a2E(Zt-1Zt-u)++ E(appZt-pZt-u) 33

Modelos ARIMA Paro y empleo registrado

Econometra II UNED

Cu = a1Cu-1 +a2Cu-2+ +appCu-p, y dividendo por C0, Ru = a1Ru-1 +a22Ru-2++ appRu-p Dando valores a u se obtienen las ecuaciones de Yule-Walker. [7]

a1 a22

R0 R1

R1 R0

Ru 1 Ru 2

R1 R2

que

permiten

calcular

la

Funcin

de

auu Ru 1 Ru 2 R0 Ru Autocorrelacin parcial de orden u .


Clculo de la Funcin de Autocorrelacin Parcial de las manchas solares Funcin de Aucorrelacin Parcial de orden 1 se calcula a partir de [1] a11 = R1; a11=0.676 La funcin de Aucorrelacin parcial de orden 2 se calcula a partir de [6]

R a1 0 R1 a22

R1 R0

R1 1 0.676 R2 0.676 1

1 0.676 0.543 0.254 0.676 0.543

0.676 0.543 0.676 1 0.254 0.543

1.84162 1.24494 0.676 1.24494 1.84162 0.254 -0.374

Valores que coinciden con los del Correlograma calculado por el ordenador.
Sample: 1749 1760 Included observations: 12 Autocorrelation . |***** . |** . . *| . .***| . ****| . ****| . . **| . . | . . |* . . |* . | | | | | | | | | | Partial Correlation . |***** .***| . . *| . .***| . . | . . **| . . |* . . **| . . *| . . *| . | | | | | | | | | | 1 2 3 4 5 6 7 8 9 10 AC 0.676 0.254 -0.083 -0.429 -0.534 -0.477 -0.264 -0.014 0.096 0.169 PAC 0.676 -0.374 -0.142 -0.435 0.055 -0.212 0.192 -0.204 -0.094 -0.101 Q-Stat 6.9865 8.0747 8.2022 12.065 18.897 25.277 27.614 27.623 28.141 30.532 Prob 0.008 0.018 0.042 0.017 0.002 0.000 0.000 0.001 0.001 0.001

34

Вам также может понравиться