Вы находитесь на странице: 1из 46

Flix S.

Castillo Vera

Magister de la PUCP

APUNTES DE ECONOMETRA
Qu es econometra? Es la medicin de las relaciones de las variables econmicas.
Es la aplicacin de tcnicas estadsticas a la economa.
La econometra es usada para probar teoras en economa, cuantificar el efecto de los
cambios en las condiciones econmicas y, pronosticar el valor futuro de las variables
econmicas.
Pasos a seguir en la formulacin de un modelo economtrico.
1.-Declaracin general del problema. Esto es la formulacin de un modelo terico. El
modelo es poco probable que sea capaz de capturar todo lo relevante del mundo real
del fenmeno, pero debe presentar una suficiente buena aproximacin.
2.- Coleccin de datos relevantes para el modelo.
3.-Elegir el mtodo de estimacin relevante para el modelo propuesto.
4.-Evaluacin estadstica del modelo. Qu supuestos fueron requeridos para estimar
los parmetros del modelo ptimamente? Fueron estos supuestos satisfechos por los
datos? Tambin El modelo no describe adecuadamente los datos?
5.-Evaluacin del modelo de una perspectiva terica. Son los parmetros estimados
del tamao y signo que la teora o la intuicin sugiere?
6.- Uso del modelo. Para probar la teora especificada, cuantificar efectos, pronosticar
y, sugerir acciones a seguir.
Puntos a considerar cuando se lee un artculo publicado.
1.-El artculo involucra el desarrollo de un modelo terico o, es meramente una tcnica
en busca de una aplicacin para la motivacin de todo ejercicio, es pobre.
2.- Son los datos de buena calidad? Son de una fuente confiable? Es el tamao de
la muestra lo suficientemente grande para la estimacin del modelo tarea a realizar?
3.- Han sido las tcnicas vlidamente aplicadas? Ha llevado a cabo pruebas de
posibles violaciones de algn supuesto en la estimacin del modelo?
4.- han sido los resultados interpretados con sensatez? Es la intensidad de los
resultados exagerados? Los resultados efectivamente obtenidos se refieren a las
cuestiones planteada por los autores? Pueden los resultados ser replicados por otros
investigadores?
1

Flix S. Castillo Vera

Magister de la PUCP

5.- Son las conclusiones apropiadas, dado los resultados?

Terminologa: La poblacin y la muestra.

La poblacin es el conjunto de todos los objetos o las personas que se estudiaran. La


poblacin puede ser finita o infinita, mientras que la muestra es una seleccin de solo
algunos elementos de la poblacin. En general, cualquiera de todas las observaciones
de toda la poblacin no estar disponible o pueden ser tantos en nmero que no es
viable para trabajar con ellos, en cuyo caso una muestra de los datos se toman para el
anlisis, la muestra es por lo general aleatoria, debe ser representativa de la poblacin
de inters. Una muestra aleatoria es una muestra en la cual cada elemento individual
de la poblacin tiene la misma probabilidad de ser extrado. El tamao de la muestra
es el nmero de observaciones que estn disponibles o que se decida utilizar, en la
estimacin de la ecuacin de regresin.
EL PROCESO GENERADOS DE LOS DATOS, LA FUNCION DE REGRESIN DE LA
POBLACIN (PRF) Y LA FUNCIN DE REGRESIN DE LA MUESTRA (SRF).
La funcin de regresin de la poblacin: PRF es una descripcin del modelo que se
cree que es la generacin de los datos reales y que representa la verdadera relacin
entre las variables. La PRF es tambin conocida como el proceso generador de los
datos (DGP). La PRF encarna los verdaderos valores de y , y es expresado como
Yt X t u t .
Note que hay un trmino de error en esta ecuacin, de modo que incluso si se tuviera a
disposicin de uno a todas las observaciones de la poblacin de Yt y de X t , todava
en general, no sera posible obtener un ajuste perfecto de la lnea a los datos.
La funcin de regresin de la muestra: SRF es la relacin que se ha estimado usando
las observaciones de la muestra y es a menudo escrito como
Yt X t

Note que no hay trmino residual y nos da el valor esperado de Yt , denotado Yt . Es


tambin posible escribir as:
Yt X t u t

Esta ecuacin divide el valor observado de Yt en dos componentes: el valor ajustado


del modelo y el trmino residual.
2

Flix S. Castillo Vera

Magister de la PUCP

LOS SUPUESTOS QUE SUSTENTAN EL MODELO DE REGRESION LINEAL


CLSICO
El modelo Yt X t u t , que ha sido obtenida anteriormente, junto con los
supuestos mencionados a continuacin, se conoce como el clsico modelo de
regresin lineal (CLRM). Datos para X t , es observable, pero dado que Yt tambin
depende de u t , es necesario ser especfico acerca de cmo u t se generan.
1. E (u t ) 0 Los errores tienen media cero.
2
2. Var (u t ) La varianza de los errores es constante y finita sobre todos los

valores de X t .
Cov (u t , u j ) 0

Los errores son linealmente independientes uno del otro.

4. Cov ( X t , u j ) 0

No hay relacin entre el error y la correspondiente variable X t

3.

El conjunto de los supuestos se hacen generalmente sobre u t , los errores no


observables o los trminos de perturbacin. Tenga en cuenta que ningn supuesto se
hace sobre sus contrapartes observables, los residuos estimados del modelo.
Siempre que el supuesto 1 se mantenga, el supuesto 4 puede ser escrito
equivalentemente E ( X t u t ) 0 . Ambas formulaciones implican que el regresor es
ortogonal (es decir, no vinculados a) el trmino de error. Un supuesto alternativo al 4,
que es ligeramente ms fuerte, es que las X t son no estocsticos o fijos en muestras
repetidas. Esto significa que no hay variacin de la muestra en X t y que su valor se
determina fuera del modelo.
Un quinto supuesto se requiere para hacer inferencias vlidas acerca de los
parmetros poblacionales (el real de y ) de los parmetros de la muestra ( y
) estimados utilizando una cantidad limitada de datos.
2
5. u t N (0, ) Que u t est normalmente distribuida.

PROPIEDADES DE LOS ESTIMADORES DE LOS MNIMOS CUADRADOS


ORDINARIOS
Si se mantiene los supuestos de 1-4, entonces, los estimadores y determinados
por los mnimos cuadrados ordinarios (MCO) tendr un nmero de propiedades
3

Flix S. Castillo Vera

Magister de la PUCP

deseables, y se conocen como los mejores estimadores lineales insesgados MELI).


Qu significa esta sigla?
Estimador - y , son los estimadores del valor real de y .
Lineal - y son los estimadores lineales, esto significa que las frmulas de y
son combinaciones lineales de las variables aleatorias (en el caso, Yt ).
Insesgado - en promedio, los valores actuales y ser igual a sus verdaderos
valores.
Mejor - significa que el estimador de MCO tiene una varianza mnima entre la clase
de estimadores insesgados lineales; el Teorema de Gauss-Markov demuestra que el
estimador de MCO es el mejor por el examen de un estimador insesgado lineal
alternativa arbitrario y que muestra en todos los casos en que debe tener una variacin
no menor de MCO.
Bajo supuestos 1-4 antes mencionados, se puede demostrar que el estimador de MCO
tiene las propiedades que son consistentes, insesgados y eficientes. Insesgamiento y la
eficiencia ya se han discutido anteriormente, y la consistencia es una propiedad
deseable adicional. Estas tres caractersticas ahora se discuten enseguida.

CONSISTENCIA
Los estimadores de mnimos cuadrados y son consistentes. Una forma de
exponer este algebraicamente para (con la modificacin obvio hecha para ) es:

lim Pr[ ] 0
T

Esta es una forma tcnica de decir que la probabilidad de que es ms de cierta


distancia fija arbitraria lejos de su verdadero valor tiende a cero como el tamao de
la muestra tiende a infinito, para todos los valores positivos de . En el lmite (es decir,
para un nmero infinito de observaciones), la probabilidad de que el estimador de ser
diferente del valor real es cero. Es decir, las estimaciones convergen a sus verdaderos
valores a medida que aumenta el tamao de la muestra hasta el infinito. Consistencia
es, pues, una muestra grande, o la propiedad asinttica. Los supuestos de que
Cov ( X t , u j ) 0 y E (u t ) 0 son suficientes para obtener la consistencia del estimador
de MCO.
INSESGAMIENTO

Los estimadores mnimos cuadrados de y son insesgados. Esto es:


4

Flix S. Castillo Vera

E ( )

Magister de la PUCP

E( )

As en promedio, los valores estimados para los coeficientes sern iguales a sus
verdaderos valores. Es decir, no hay ninguna sobreestimacin o subestimacin
sistemtica de los verdaderos coeficientes. Para probar esto tambin requiere del
supuesto de que Cov ( X t , u j ) 0 . Claramente, insesgamiento es una condicin ms
fuerte que la consistencia, ya que se mantiene tanto para pequeas como grandes
muestras (Esto es para todo tamao de muestra).
EFICIENCIA
Un estimador de un parmetro se dice que son eficientes si no hay otro
estimador que tenga menor varianza. En trminos generales, si el estimador es
eficiente, se minimiza la probabilidad de que sea muy lejos del valor real de . En
otras palabras, si el estimador es el mejor, la incertidumbre asociada con la
estimacin se reduce al mnimo para la clase de los estimadores lineales insesgados.

4. PRUEBAS DE DIAGNSTICO:
Supuestos del modelo lineal de regresin clsica y pruebas de diagnstico
Los resultados del aprendizaje:
En este parte, usted aprender como:
Describir los pasos involucrados para probar la heteroscedasticidad y autocorrelacin
en los residuos de la regresin.
Explicar el impacto de la heteroscedasticidad y autocorrelacin en la optimizacin de la
estimacin los parmetros de los MCO y el error estndar.
Distinguir entre las pruebas Durbing-Watson y Breusch-Pagan para la autocorrelacin.
Destacar las ventajas y desventajas de los modelos dinmicos.
Probar si la forma funcional del modelo empleado es apropiada.
Determinar si la distribucin del residuo de una regresin difiere significativamente de
la normalidad.
Investigar si los parmetros del modelo son estables.
Evaluacin de las diferentes filosofas de cmo construir un modelo economtrico.
5

Flix S. Castillo Vera

Magister de la PUCP

4.1 Introduccin
Recordemos que cinco supuestos se hicieron en relacin al modelo de regresin lineal
clsico. Estos son requeridos para demostrar que la tcnica de estimacin, los
mnimos cuadrados ordinarios (MCO), tiene una serie de propiedades deseables, y
tambin para que las pruebas de hiptesis sobre los coeficientes estimados poda ser
vlidamente realizada, Especficamente se supone que:
1. E (u t ) 0 ;

2
2. Var (u t ) ;

3. Cov (u t , u j ) 0 .

2
4. Cov ( X t , u j ) 0 ; 5. u t N (0, )

Estas hiptesis ahora se tratarn ms, en particular, mirando lo siguiente:


Cmo
puede
ser
detectado
las
violaciones
de
las
hiptesis?
Cules son las causas ms probables de las violaciones en la prctica?
Cules son las consecuencias para el modelo si una hiptesis se viola, pero este
hecho es ignorado y el investigador lleva a cabo?
Las respuestas a esta ltima pregunta es que, en general, el modelo podra encontrar
cualquier combinacin de tres problemas:
-Las estimaciones de los coeficientes son errneos.
-Los errores estndar asociados estn equivocados.
-Las distribuciones que se asumieron para las estadsticas de prueba son inadecuadas.
Un enfoque pragmtico para resolver los problemas asociados con el uso de modelos
donde uno o ms de los supuestos no es apoyado por los datos a continuacin, ser
explicado. Estas soluciones suelen funcionar de tal manera que:
-Los supuestos ya no son violados, o
-Los problemas son eludidos, de manera que se utiliza las tcnicas alternativas que
siguen siendo vlidas.
4.2 Las distribuciones estadsticas para las pruebas de diagnstico.
Estas pruebas se pueden construir de varias formas, y el enfoque preciso para la
construccin del estadstico de prueba determinar la distribucin del estadstico de
prueba que se supone que siguen. Dos enfoques particulares son de uso comn y sus
resultados estn dados por los paquetes estadsticos: la prueba LM y la prueba de
6

Flix S. Castillo Vera

Magister de la PUCP

Wald. Por ahora, los lectores necesitan saber que el estadstica de prueba LM en el
contexto de las pruebas de diagnstico que se presenta aqu sigue una distribucin x2
con grado de libertad igual al nmero de restricciones impuestas en el modelo, y se
denota m. La versin de la prueba de Wald sigue una distribucin F con (m, T-k)
grados de libertad. Asintticamente, estas dos pruebas son equivalentes, aunque sus
resultados difieren algo en muestras pequeas. Son equivalentes a medida que
aumenta el tamao de la muestra hacia el infinito, ya que hay una relacin directa entre
el x2 y la distribucin F. Tomando una variable aleatoria x2 y dividiendo por sus
grados de libertad asintticamente da una variante aleatoria F.
x ^ 2 ( m)
F (m, T k )
m

Cuando T

Los paquetes informticos suelen presentar resultados usando ambos enfoques,


aunque slo uno de los dos ser ilustrado para cada prueba a continuacin. Por lo
general, dar la misma conclusin, aunque si no lo hacen, la versin F se suele
considerar preferible para muestras finitas, ya que es sensible al tamao de la muestra
(uno de sus grados de libertad depende de los parmetros de tamao de la muestra)
de forma que versin x2 no lo es.
4.3 Hiptesis E (u t ) 0
El primer supuesto se requiere que el valor promedio de los errores sea cero. De
hecho, si un trmino constante se incluye en la ecuacin de regresin, este supuesto
no ser violado. Pero si la teora econmica sugiere que, para una aplicacin particular,
no debe haber intercepto a fin de que la lnea de regresin se vea obligada a pasar por
el origen. Si la regresin no se incluy un intercepto, y el valor medio de los errores
ser distinto de cero, varias consecuencias no deseable podra surgir. En primer lugar
R2, definida como ESS / SST pueden ser negativos, lo que implica que la media de la

muestra, Y , explica ms de la variacin en "Y" que las variables explicativas. En


segundo lugar, y ms fundamentalmente, una regresin con ningn parmetro de
intercepto podra dar lugar a sesgos potencialmente grave en la pendiente
estimaciones de los coeficientes. Para ver esto, consideremos la figura 4.1
El efecto es que la lnea estimada en este caso es forzada a travs del origen, de modo
que la estimacin de la pendiente coeficiente

^^

es sesgado. Adicionalmente R2 y R2A

son generalmente sin sentido en este contexto. Este surge, ya que el valor medio de la

Flix S. Castillo Vera

Magister de la PUCP

variable dependiente, Y , no ser igual a la media de los valores ajustados en el


modelo, es decir, la media de

si no hay una constante en la regresin.

2
4.4 Hiptesis 2: Var (u t )

Se ha supuesto hasta ahora que la varianza de los errores es constante, 2 esto es


conocido como el supuesto de homoscedasticidad. Si los errores no tienen una
constante, se dice que heteroscedstico.
Para considerar un ejemplo de heteroscedasticidad, supongamos que una regresin se
haba estimado y los residuos

u , han sido calculados y luego graficado contra una de

las variables explicativas, x2t, como se muestra en la figura (4.2).


Es claramente evidente que los trminos de error en la figura 4.2
son
heteroscedstico, esto es, aunque su valor medio es ms o menos constante, su
varianza est aumentando sistemticamente con X2t.
4.4.1Deteccin de heteroscedasticidad.
Afortunadamente, hay una serie de pruebas estadsticas formales para
heterocedasticidad, y uno de los mtodos ms simples es la prueba el de GoldfeldQuandt (1965). Su enfoque se basa en la divisin del total de la muestra de longitud T
en dos sub-muestras de longitud T1 y T2. El modelo de regresin se calcula para cada

sud-muestra y los dos varianzas residuales se calculan como

^^
2
1 11 1

^^
2
2 22 2

s u u /(T k) s u u /(T k)
y

respectivamente. La hiptesis nula es que las varianzas de las perturbaciones son


2
2
iguales, lo que se puede escribir H 0 : 1 2 , contra algunas alternativas a doble cara.
El estadstica de prueba, denotado GQ, es simplemente la relacin de las dos
varianzas residuales donde la mayor de las dos desviaciones debe ser colocados en el
numerador (es decir, s12 es la mayor varianza maestral para la muestra con tamao
T1, incluso si se trata de la segunda muestra). GQ

s12
s

2
2

Flix S. Castillo Vera

Magister de la PUCP

La prueba estadstica est distribuida como una F(T1 k ,T2 k ) bajo la hiptesis nula, y la
hiptesis nula de varianza constante es rechazada si la prueba estadstica excede el
valor crtico.
La prueba GQ es fcil de construir, pero sus conclusiones pueden depender de un
particular y probablemente arbitrariao momento de dividir la muestra. Claramente, la
prueba es probablemente para ser ms potente cuando esta eleccin se hace por
razones tericas- por ejemplo, antes y despus de un evento estructural mayor.
Supongamos que se piensa que la varianza de las perturbaciones est relacionada con
algunos z1 observable variable (que puede o no puede ser uno de los regresores. Una
mejor manera de realizar la prueba sera ordenar la muestra de acuerdo con los
valores de Z1 (en lugar de a travs del tiempo) y despus de dividir la muestra
reordenado en T1 y T2.
Un mtodo alternativo que es algunas veces usado para agudizar las inferencias de la
prueba y aumentar su potencia es omitir algunas observaciones del centro de la
muestra a fin de introducir un grado de separacin entre las dos sub-muestras.
Una prueba muy popular es la de White (1980), prueba general para
heteroscedasticidad.
La prueba es particularmente til, ya que hace algunas
suposiciones acerca de la probable forma de heteroscedasticidad. La prueba es
elaborada as:
Estimar el modelo siguiente:
Yt 1 2 X 2t 3 X 3t u t

Correr una regresin auxiliar:

u t2 1 2 X 2t 3 X 3t 4 X 22t 5 X 32t 6 X 2t X 3t vt

Donde vt es un trmino de perturbacin normalmente distribuido.


Var (u t ) E[((u t E (u t )) 2 ] y como E (u t ) 0 , la Var (u t ) E[u t2 ]

Una vez ms, no es posible conocer los cuadrados de las perturbaciones de la


poblacin, por lo que sus homlogos del ejemplo, los residuos cuadrados, se utilizan en
lugar.
La prueba pude realizarse bajo dos enfoques:

Flix S. Castillo Vera

Magister de la PUCP

Uno es usar la prueba F, teniendo a la regresin auxiliar como la regresin no

restringida y luego ejecutar una regresin de u t2 sobre una constante. Los RSS de
cada especificacin se utilizarn como insumos para calcular la prueba F estndar.
Un segundo enfoque es la prueba de Multiplicador de Lagrange (LM)
La cual gira en torno al valor de R2 de la regresin auxiliar. Si uno o ms coeficientes
de regresin auxiliar son estadsticamente significativos, el valor de R2 para la
ecuacin ser relativamente alto, mientras que si ninguna de las variables es
significativa, R2 ser relativamente baja. La prueba LM as operara mediante la
obtencin de R2 de la regresin auxiliar y multiplicndola por el nmero de
observaciones T. Se puede demostrar que:
T .R 2 x (2m )

Donde m es el nmero de regresores en la regresin auxiliar (excluyendo el termino


constante), equivalente al nmero de restricciones que tendra que ser colocado bajo
el enfoque de la prueba F.

4.4.2 Consecuencias de usar MCO en presencia de heteroscedasticidad.


Qu sucede si los errores son heteroscedastico, pero este hecho es ignorado y el
investigador procede con la investigacin y la inferencia? En este caso, los estimadores
de los MCO todava son insesgados (y tambin consistentes), pero los coeficientes
estimados,ya no son MELI, esto es, ya no tienen la varianza mnima entre la clase de
los estimadores insesgados. La razn es que la varianza del error 2 , no juega ningn
papel en la prueba de que el estimador MCO es insesgado y consistente, pero 2
aparece en las frmula para la varianza del coeficiente. Si los errores son
heteroscedasticos, la frmula presentada para los errores estndares de los
coeficientes deja de ser.
Soluciones para la heteroscedasticidad:
a) Trasformar la variable en logaritmos o reducirlo por alguna otro medida de tamao.
b) Estimaciones de errores estndares consistente con la heteroscedasticidad.
Llamados algo as como robustes.

4.5 Supuesto 3: Cov(u i , , u j ) 0, i j


10

Flix S. Castillo Vera

Magister de la PUCP

El supuesto que se hace sobre los trminos perturbaciones de CLRM es que la


covarianza entre los trminos de error sobre el tiempo es cero. En otras palabras, se
supone que los errores no estn correlacionados entre s. Si los errores estn
correlacionados entre s, sera declarado que estn autocorrelacionados o que estn
correlacionados serialmente. Una prueba de esta hiptesis es por lo tanto necesario.
Una vez ms, las perturbaciones de la poblacin

u , no puede ser observada, lo que

las pruebas de autocorrelacin se llevan a cabo con residuos u , Antes de que se


pueda proceder a ver cmo las pruebas formales de autocorrelacin se formulan, el
concepto del valor rezagado de una variable se debe definir.
4.5.1 El concepto de valor rezagado.
El valor rezagado de una variable es simplemente el valor que la variable toma durante
un periodo previo, esto es y t 1 . La primera diferencia de y , tambin conocido como
cambio en y , denotado y calculado como.
yt yt yt 1

Note que se pierde la primera observacin.


4.5.2 Prueba grafica para la autocorrelacin.
Graficar u t contra u t 1 y observar algn patrn, positivo o negativo.
4.5.3 Deteccin de la autocorrelacin: La prueba de Durbin-Watson (DW).
Por supuesto, un primer paso para probar si la serie residual de un modelo estimado
son autocorrelacionados sera graficar los residuales como anteriormente, en busca de
cualquier patrn. Mtodos grficos pueden ser difciles de interpretar en prctica, sin
embargo, y por lo tanto una prueba estadstica formal tambin debe aplicarse. La
prueba ms simple es debido a Durbin y Watson (1951). DW es una prueba para la
autocorrelacin de primer orden, es decir, se pone a prueba slo para una relacin
entre un error y su valor inmediatamente anterior. Una forma de motivar a la prueba y
la interpretacin del estadstico de prueba sera en el contexto de una regresin del
error en el tiempo t en su valor anterior.
u t u t 1 vt

2
Donde vt N (0, v )

La prueba estadstica DW tiene como hiptesis nula, que los errores en el tiempo t-1
y t son independientes el uno del otro.
Ho 0

Contra la alterna

Ho 0

11

Flix S. Castillo Vera

Magister de la PUCP

Si la hiptesis nula fuera rechazada, se concluira que existe evidencia de una relacin
entre los residuos sucesivos.
La prueba estadstica DW es posible expresar como una aproximacin del valor
estimado de .

DW 2(1 )

Donde es el coeficiente de correlacin estimado que habra sido obtenida de la

regresin del error. O tambin corr (u t , u t 1 )

Dado que se encuentra

1 1,

los lmites de DW son 0 DW 4

Consideremos ahora las implicancias de DW tome uno de los tres valores: 0, 2, 4.

Si 0, DW 2 Este es el caso donde no hay autocorrelacin en los errores. As


en trminos generales, la hiptesis nula no se rechaza si el DW est cerca de 2.

Si 1, DW
residuos.

Si 1, DW
residuos.

Este es el caso donde existe correlacin perfecta positiva en los

Este es el caso donde existe correlacin perfecta negativa en los

La prueba DW no sigue una distribucin estadstica estndar tal como t, F o X2. DW


tiene dos valores crticos, un superior (du) y un inferior (dl) y existe tambin una regin
intermedia donde la hiptesis nula de no autocorrelacin no puede ser rechazado ni no
rechazado, inconclusa, eta dado por: dl DW du y 4 du DW 4 dl .
En conclusin, la hiptesis nula H0: No hay evidencia de autocorrelacin; no se
rechazda s, el estadisco de Durbin-Watsosn toma valores entre du DW 4 du .

4.5.4 Condiciones para que el estadstico DW sea vlido.


a) Bebe haber un trmino constante en la regresin.
b) Los regresores beben ser no estocsticos.
c) No debe haber variable dependiente rezagada en la regresin.
12

Flix S. Castillo Vera

Magister de la PUCP

4.5.5 Otra prueba para la autocorrelacin: La de Breusch-Godfrey.


Recordemos que DW es solo una prueba de si los errores consecutivos estn
relacionados entre s. Por lo tanto, no slo no sirve aplicar el test DW si un determinado
conjunto de circunstancias no se cumplen, habr tambin muchas formas de

autocorrelacin residual que DW no puede detectar, por ejemplo corr (u t , u t 2 ) ,

corr (u t , u t 3 ) , DW captura solo correlacin de primer orden. Por lo tanto, es deseable

examinar una prueba conjunta de autocorrelacin que permite el examen de la relacin


entre y varios de sus valores retardados al mismo tiempo. La prueba Breusch-Godfrey
es una prueba ms general para la autocorrelacin hasta r orden . El modelo para los
errores en esta prueba es:
u t 1u t 1 2 u t 2 3ut 3 ... r u t r vt

vt N (0, v2 )

La hiptesis nula y la alterna son:


H 0 1 0, 2 0 3 0... r 0
H 0 1 0, 2 0 3 0... r 0

As, bajo la hiptesis nula, el error actual no est relacionado a cualquiera de los
errores previos.
La realizacin de la prueba Breusch-Godfrey es la siguiente:
a) Estimar la regresin lineal:

Yt 1 2 X 2t 3 X 3t 4 X 4t u t Usando MCO y obtener los residuos, u


t

b) Regresar ut 1 2 X 2t 3 X 3t 4 X 4t 1ut 1 2 ut 2 3ut 3 ... r ut r vt


c) Denotando a T como el nmero de observaciones, la prueba estadstica est
dada por: (T r ) R 2 X r2
Esto se debe a que las r primeras observaciones se efectivamente se han
perdido de la muestra con el fin de obtener r rezagos usados en la prueba de
la regresin, de las cuales dejan (T-r) observaciones para estimar la regresin
auxiliar.
Si la prueba estadstica excede el valor crtico de la tabla estadstica chicuadrado, rechaza la hiptesis nula de no autocorrelacin. Al igual que cualquier
prueba conjunta, solo una parte de la hiptesis nula tiene que ser rechazada
para conducir al rechazo de la hiptesis como un todo. As que el error en el
13

Flix S. Castillo Vera

Magister de la PUCP

tiempo t tiene que ser significativamente relacionada slo a uno de sus r valores
anteriores en la muestra, para que la hiptesis nula de no autocorrelacin sea
rechazada. Esta prueba es ms general que el DW.
Una dificultad potencial con Breusch-Godfrey,
sin embargo, es en la
determinacin de un adecuado r, nmero de rezagos de los residuos. Una
respuesta sera para datos mensuales 12 rezagos y para trimestrales 4 rezagos.
Obviamente, si el modelo es estadsticamente adecuado, no se debera
encontrar evidencia de autocorrelacin en los residuos cualquiera sea el valor
de r se elija.
4.5.6 Consecuencias de ignorar la autocorrelacin si est presente.
En realidad, los coeficientes estimados derivados utilizando MCO son todava
insesgados, pero ellos son ineficientes. Es decir no son MELI, incluso en los
tamaos de muestra grandes, de modo que las estimaciones del error estndar
podran estar equivocadas. Por tanto, existe la posibilidad de que puede hacerse
las inferencias equivocadas acerca de si una variable es o no un determinante
importante de las variaciones en y . En el caso de la correlacin serial positiva
en los residuos, las estimaciones del error estndar de los MCO estar sesgada
hacia abajo con respecto a los errores estndar verdaderos. Es decir, MCO
subestimar su verdadera variabilidad. Esto conducira a un aumento en la
probabilidad de error de tipo I, es decir, una tendencia a rechazar la hiptesis
nula a veces, pero es correcta. Adems, R2 es probable que se infle con
relacin a su valor correcto si autocorrelacin est presente pero omite, ya que
la autocorrelacin residual conducir a una subestimacin de la varianza del
error verdadero.

4.6 Supuesto 4: las X no son estocsticas.


Afortunadamente, resulta que el estimador MCO es consistente e isesgado en
presencia de regresores estocsticos, siempre que los regresores no estn
correlacionados con el trmino de error de la ecuacin estimada.
Sin embargo, si una o ms de las variables explicativas son contemporneamente
correlacionadas con el trmino de perturbacin, los estimadores MCO no son
consistentes. Esto resulta de que estimador asigna poder explicativo a variables
donde en realidad se derivan de la correlacin entre el trmino de error y Yt .
Supongamos por ejemplo que X 2t y u t estn positivamente correlacionados. Cuando
el

trmino de perturbacin pasa a tener un valor alto, Yt tambin ser alto. Pero si
14

Flix S. Castillo Vera


X 2t

esta positivamente correlacionado con

Magister de la PUCP
ut ,

entonces

X 2t

es tambin

probablemente alto. As el estimador MCO atribuye incorrectamente el alto valor de Yt


al alto valor de X 2t , conde en realidad Yt es alto simplemente porque u t es alto, lo
que resultar en estimaciones sesgadas e inconsistentes de los parmetros y una lnea
de ajuste que aparece para capturar las caractersticas de los datos mucho mayor de
que lo es en realidad.
4.5 Supuesto 5: Las perturbaciones son normalmente distribuidas.
Recordemos que la hiptesis de normalidad ( ut N (0, v ) ) es necesario para para
llevar a cabo prueba de hiptesis individual o conjunta sobre los parmetros del
modelo.
2

4.7.1 Pruebas de desviaciones de la normalidad


Una de las pruebas ms comnmente aplicado para normalidad es la prueba de
Jarque Bera. BJ utiliza la propiedad de una variable aleatoria con distribucin normal,
que toda la distribucin se caracteriza por los dos primeros momentos, la media y la
varianza. El tercero y cuarto momentos estandarizados de una distribucin se
conocen como asimetra y curtosis. La asimetra mide el grado en que una distribucin
no es simtrica respecto de su valor medio y la curtosis mide que tan gruesas son las
colas de la distribucin. Una distribucin normal no es sesgada y es definido por tener
un coeficiente de curtosis de 3. Es posible definir un coeficiente de curtosis en exceso a
3, igual que el coeficiente de curtosis menor 3; una distribucin normal por lo que
tendr un coeficiente de curtosis superior a cero. Una distribucin normal es simtrica y
se dice que es mesocrtica.
Una distribucin leptocrtica tiene una cola ms gruesa y un pico ms alto en la media
de una variable aleatoria normal con la misma media y varianza; mientras que una
distribucin platicrtica ser menos el pico en la media, presenta colas ms delgadas, y
ms de la distribucin en los hombros que una normal. En la prctica, una distribucin
leptocurtica es ms probable para caracterizar una serie de tiempo financiera (y
econmca), y caracterizar los residuos de un modelo de series de tiempo financiero.
Bera y Jarque (1981) formalizaron las ideas para probar si el coeficiente de asimetra y
el coeficiente de curtosis conjuntamente son cero.
Denotando los errores por u t y su variacin por 2 , se puede demostrar que los
coeficientes de asimetra y curtosis puede ser expresado, respectivamente como:

15

Flix S. Castillo Vera

E (u 3 )
( 2 ) 3 / 2

Magister de la PUCP

E (u 4 )
( 2 ) 2

La curtosis de la distribucin normal es de 3, por lo que su exceso de curtosis (C-3) es


cero.
La prueba Bera-Jarque, est dada por:

A 2 (C 3) 2

24
6

BJ T

Donde T es el tamao de muestra. La prueba estadstica BJ sigue asintticamente


una x 2 (2) bajo la hiptesis nula que la distribucin de las series son simtricas y
mesocrticas.

A y C pueden ser estimados usando los residuos u t de la regresin por MCO. La


Hiptesis nula es de normalidad y esto sera rechazada si los residuos de la modelo
fueron significativamente sesgadas o leptocrtica / platicurticos (o ambos).
4.7.2. Probando la normalidad.
Para no rechazar la hiptesis nula de normalidad, el p-valor del estadstico de prueba
BJ debe ser mayor al nivel 5%. Por ejemplo, si los residuos son muy negativamente (o
positivamente) sesgados y leptocurtica, la hiptesis nula es la normalidad residual es
fuertemente rechazado (el p-valor para la prueba de BJ es de cero a seis decimales), lo
que implica que las inferencias que hacemos sobre las estimaciones de los coeficientes
podra estar equivocado, aunque la muestra sea, probablemente, casi lo
suficientemente grande, de que tenemos que estar menos preocupados de lo que sera
con una pequea muestra. La no-normalidad en este caso parece haber sido causado
por un pequeo nmero de residuos negativos muy grandes en el ejemplo.
4.7.3 Qu debe hacerse si se encuentra pruebas de no normalidad?
No es obvio lo que debe hacerse! Es, por supuesto, posible emplear un mtodo de
estimacin que no asume la normalidad, pero este mtodo puede ser difcil de aplicar, y
uno puede ser menos seguro es sus propiedades. Es deseable, pues, seguir con MCO,
si es posible, ya que su comportamiento en una variedad de circunstancias ha sido
bien estudiado. Por ejemplo, los tamaos que son suficientemente grandes, la violacin
de la hiptesis de normalidad es casi intrascendente. Apelando a un teorema del lmite
central, las estadsticas de prueba asintticamente seguirn las distribuciones
apropiadas, incluso en ausencia de normalidad de error. (Nota: La ley de los grandes
nmeros establece que la media de una muestra (de una variable aleatoria) converge
a la media de la poblacin (que es fijo), y el teorema del lmite central establece que la
media de la muestra converge a una distribucin normal).
16

Flix S. Castillo Vera

Magister de la PUCP

En la elaboracin de modelos econmicos o financieros, en muchas ocasiones es el


caso de que uno o dos residuos muy extremos causan rechazo de la hiptesis de
normalidad. Estas observaciones aparecen en las colas de las distribuciones, y por lo
tanto llevara u 4 , la cual entra en la definicin de curtosis, al ser muy grande. Estas
observaciones que no encajan con el patrn del resto de los datos, se conocen como
los valores extremos. Si este es el caso, una forma de mejorar las posibilidades de la
normalidad error es usar variables ficticias o algn otro mtodo para eliminar
efectivamente esas observaciones.
Sin embargo, en econometra, se podra argumentar que las variables ficticias para
remover valores extremos residuales se pueden utilizar para mejorar artificialmente las
caractersticas del modelo, en esencia falseando los resultados. La eliminacin de las
observaciones extremas reduce los errores estndar, reducir la RSS, y por tanto,
aumentar R 2 , mejorando as el ajuste aparente de modelo a los datos. La eliminacin
de las observaciones es tambin difcil de conciliar con la nocin de las estadsticas
que cada punto de datos representa una pieza til de informacin.
La otra cara de este argumento es que las observaciones que estn muy lejos de los
dems, y parece que no encajan con el patrn general del resto de los datos se
conocen como valores extremos. Los valores extremos pueden tener un efecto grave
en las estimaciones de coeficiente, ya que por definicin, MCO recibir una gran
penalidad, en forma de un aumento de RSS, para los puntos que estn muy lejos de la
lnea ajustada. Consecuentemente, MCO tratar ms fuerte para minimizar la distancia
de los puntos que de otro modo habra sido un largo camine desde la lnea.
As, puede verse un intercambio potencial existe entre la necesidad de eliminar las
observaciones aberrantes que podran tener un impacto excesivo sobre los
estimadores de MCO y la causa no normalidad residual, por un lado y la idea de que
cada punto de datos representa una pieza til de informacin sobre el otro. Este ltimo
es, junto con el hecho de que las eliminaciones de las observaciones a voluntad
artificialmente podra mejorar el ajuste del modelo. Una manera sensata de proceder es
mediante la introduccin de variables ficticias para el modelo slo si no es tanto una
necesidad estadstica para hacerlo y una justificacin terica para su inclusin. Esta
justificacin normalmente proviene de los conocimientos del investigador, de los
acontecimientos histricos que se relacionan con la variable dependiente y el modelo
sobre el perodo de la muestra de referencia. Una variable ficticia puede utilizarse para
eliminar las observaciones correspondientes a los acontecimientos nicos o eventos
extremos que se consideran muy poco probable que se repita, y el contenido de la
informacin de que se considere de no relevancia para los datos en su conjunto.
Ejemplos pueden incluir cadas de los mercados de acciones, pnico financiero, las
crisis de gobierno, y as sucesivamente.
17

Flix S. Castillo Vera

Magister de la PUCP

La no normalidad en los datos financieros tambin podran sugerir cierto tipo de


heteroscedasticidad, conocido como arch, en este caso, la no normalidad es intrnseco
a todos los datos y por lo tanto remover el dato atpico no hara los residuos de ese
modelo normal.
4.8. MULTICOLINEALIDAD.
Un supuesto implcito que es hecho cuando se usan el mtodo de estimacin de los
MCO es que las variables explicativas no estn correlacionadas entre s, Si no existe
una relacin entre las variables explicativas, se dice que son ortogonales entre s. Si
las variables explicativas son ortogonales entre s, adicin o eliminacin de una variable
de una ecuacin de regresin no hara que los valores de los coeficientes de las otras
variables cambien.
En cualquier contexto prctico, la correlacin entre las variables explicativas ser
distinta de cero, aunque esto ser generalmente relativamente en el sentido de que
un pequeo grado de asociacin entre variables explicativas casi siempre ocurre pero
no causar demasiada prdida de precisin. Sin embargo, un problema se produce
cuando las variables explicativas estn altamente correlacionados entre s, y este
problema se conoce como multicolinealidad: multicolinealidad perfecta y cerca de la
multicolinealidad o menos que perfecta.
Multicolinealidad perfecta ocurre cuando existe una exacta relacin entre dos o ms
variables. En este caso no es posible estimar todos los coeficientes del modelo.
Multicolinealidad perfecta por lo general ser observado solo cuando alguna variable
explicativa es inadvertidamente es usada doble en la regresin. Tcnicamente, la
dificultad ocurrira en el intento de invertir la matriz ( X ' X ) ya que no sera de rango
completo, de modo que no se podra invertir y entonces

( X ' X ) 1 X 'Y

los

estimadores de los MCO no son calculados, son indeterminados y sus errores


estndares infinitos.
Cerca de la multicolinealidad o menos que perfecta, es mucho ms probable que
ocurra en la prctica (es decir la multicolinealidad es un problema de grado) y surgira
cuando habra una no despreciable relacin entre dos o ms variables explicativas,
pero no perfecta.
4.8.1 Medicin de la multicolinealidad menos que perfecta.
La forma ms fcil, de detectar la multicolinealidad menos que perfecta, es obtener la
matriz de correlacin de las variables explicativas y observar cuales tienen la ms alta
correlacin (mayor o igual a 0.8). Pero las medidas que a menudo se sugiere son dos:
El factor de varianza inflacin (VIF) y el nmero de condicin (NC).
18

Flix S. Castillo Vera

Magister de la PUCP

El VIF est definido:

VIF ( i )

1
1 Ri2

2
Donde Ri es el cuadrado del coeficiente de correlacin mltiple entre X i y las otras
2
variables explicativas X S . Si el VIF supera a 10 (o Ri 0.9 ) se dice que esa variable
es altamente colineal.

La regla prctica de Klein dice que la multicolinealidad puede ser un problema


2
complicado si Ri es mayor que

R2

de la regresin del modelo en estudio.

Mientras que el VIF es algo que calculamos para cada variable explicativa
separadamente, el NC discutido por Belsley, Kuh, and Welsch (1980) es una medida
global. El NC se supone que es una medida de sensibilidad de la regresin estimada a
pequeos cambios en los datos. Es definido como la raz cuadrada de la proporcin del
autovalor ms grade ( 1 ) entre el ms pequeo ( 2 ) de la matriz ( X ' X ) de variables
explicativas.
El NC est definido:

NC

1
2

Si su valor esta entre 10 y 30 existe multicolinealidad entre moderada y fuerte, si


supera 30 es grave.
4.8.2 Problemas si est presente y es ignorada la multicolinealidad menos que
perfecta.
Primero, R ser alto pero los coeficientes individuales tendrn altos errores
estndares, de modo que la regresin se ve bien como un todo, pero las variables
individuales no son significativas. Este surge en el contexto de variables explicativas
muy estrechamente relacionadas como consecuencia de la dificultad en observar la
contribucin individual de cada variable para el ajuste de la regresin.
2

Segundo, la regresin se vuelve muy sensible a pequeos cambios


en la
especificacin, de modo que aadiendo o sustraendo una variable explicativa conduce
a un gran cambio en el valor del coeficiente o significancia de otra variable.
Finalmente, la multicolinealidad menos que perfecta as har intervalos de confianza
para los parmetros muy amplios, y la prueba de significancia por lo tanto podra dar
conclusiones inapropiadas y as hacer que sea difcil sacar conclusiones agudas.

19

Flix S. Castillo Vera

Magister de la PUCP

4.12 Pruebas de estabilidad de parmetros.


Hasta el momento, las regresiones de una forma tal como:
Yt 1 2 X 2t 3 X 3t 4 X 4t u t

Se han estimado.

Estas regresiones encarnan la suposicin implcita de que los parmetros son


estables para toda la muestra, tanto para el perodo de datos utilizado para estimar el
modelo, y durante cualquier perodo, posterior utilizada en la construccin de las
pronsticos.
Esta suposicin implcita puede ser probada usando pruebas de estabilidad
parmetros. La idea es esencialmente es dividir los datos en subperodos y luego pasar
estimar hasta tres modelos, para cada una de las sub-partes y para todos los datos y
luego comparar la RSS de cada uno de los modelos. Hay dos tipos de pruebas que
sern considerados, a saber, la prueba Chow (anlisis de varianza) y la prueba de
prediccin de quiebre.
4.12.1 La prueba de Chow. Se realiza lo siguiente:
1) Dividir los datos en dos sub periodos. Estimar la regresin sobre todo el periodo y
luego para los dos sub periodos separadamente (3 regresiones). Obtener la RSS para
cada una de las regresiones.
2) La regresin restringida es ahora la regresin para todo el perodo, mientras que la
regresin no restringida se presenta en dos partes: una para cada una de las
submuestras. Por tanto, es posible formar una prueba F, que se basa en la diferencia
entre la RSS, el estadstico es:
F

RSS ( RSS1 RSS 2 ) T 2k


*
RSS1 RSS 2
k

Dnde:
RSS : Suma cuadrada de residuos de toda la muestra. (Regresin restringida)
RSS1 : Suma cuadrada de residuos para la sub muestra 1.
RSS 2 : Suma cuadrada de residuos para la sub muestra 2.

(Suma de ambas, regresin no restringida)


T : Nmero de observaciones.

k : Nmero de regresores en cada regresin no restringida.


20

Flix S. Castillo Vera

Magister de la PUCP

La regresin no restringida es aquella en la que la restriccin no se ha impuesto en el


modelo. Dado que la restriccin es que los coeficientes son iguales a travs de las submuestras, la regresin restringida ser la nica regresin para la muestra completa. Por
lo tanto, la prueba es una cantidad de la suma residual de cuadrados para toda la
muestra (RSS) que es ms grande que la suma de las sumas residuales de los
cuadrados de los dos sub-muestras (RSS1+ RSS2). Si los coeficientes no varan
mucho entre las muestras, la suma de los cuadrados de los residuos no se elevar al
imponer la restriccin. As, la estadstica de prueba F se puede considerar una
aplicacin directa de la formula estndar de la prueba F discutido en el antes. La
suma de cuadrados residual restringida en F es RSS, mientras que la suma de los
cuadrados de los residuales sin restricciones es (RSS+RSS). El nmero de regresores
en la regresin sin restricciones (incluyendo las constantes) es 2k, ya que la regresin
sin restricciones viene en dos partes, cada una con k regresores.
3) Realizar la prueba. Si el valor de la estadstica de prueba es mayor que el valor
crtico de la distribucin F, que es un F (k, T-2k), entonces se rechaza la hiptesis nula
de que los parmetros son estables en el tiempo.
Tenga en cuenta que tambin es posible utilizar un enfoque de variables dummy para
calcular tanto Chow y pruebas de prediccin de error. En el caso de la prueba de
Chow, la regresin sin restricciones sera contener variables ficticias para la
intercepcin y para todos los coeficientes de la pendiente. Por ejemplo, supongamos
que la regresin es de la forma:
Yt 1 2 X 2t 3 X 3t u t : Regresin restringida.

Si la divisin del total de observaciones T se hace para que las sub-muestras contienen
observaciones T1 y T2, la regresin irrestricta vendra dada por
Yt 1 2 X 2t 3 X 3t 4 Dt 5 Dt X 2t 6 Dt X 3t u t . Regresin restringida.

Donde D1=1 para t pertenece a T1 y cero en otro caso. En otras palabras, D1 toma el
valor de uno para observaciones en la primera sub muestra y cero para observaciones
en la segunda muestra. La prueba de Chow visto de esta manera, sera una prueba F
estndar de la restriccin conjunta H 0 : 4 5 6 0 .
4.12.2 La prueba de fracaso en la prediccin:
Un problema con la prueba de Chow es que es necesario disponer de datos suficientes
para hacer la regresin en ambos sub-muestras, es decir, T1> k, T2> k. Esto puede no
ser en la situacin en la que el nmero total de observaciones disponibles es pequeo.
Incluso ms probable es la situacin en la que el investigador desea examinar el efecto
de dividir la muestra en un cierto punto muy cerca del inicio o muy cerca del final de la
21

Flix S. Castillo Vera

Magister de la PUCP

muestra. Una formulacin alternativa de una prueba para la estabilidad del modelo es
la prueba de prediccin de fallos, lo que requiere la estimacin de la muestra completa
y una de las sub-muestras solamente. La prueba de previsin de fallos funciona
mediante la estimacin de la regresin durante un "largo" sub-perodo (es decir, la
mayor parte de los datos) y luego usando los coeficientes estimados para predecir los
valores de Y para el otro perodo. Estas predicciones para Y son entonces
implcitamente en comparacin con los valores reales. A pesar de que se puede
expresar de varias maneras diferentes, la hiptesis nula para este ensayo es que los
errores de prediccin para todas las observaciones esperadas son cero.
Para calcular la prueba:
. Correr la regresin para todo el periodo (la regresin restringida) y obtener RSS.
. Correr la regresin para el sub-periodo largo y obtener RSS (llamado RSS1), el
nmero de observaciones para la estimacin del sub-periodo largo ser denotado por
T1 (a pesar de que puede venir segundo). La prueba estadstica est dada por:
estadistaico

RSS RSS1 T1 k
*
RSS1
T2

Donde T2 es el nmero de observaciones que el modelo est tratando de predecir. El


estadstico de prueba sigue un F (T2 , T1 k ) .
Para una intuitiva interpretacin en formulacin de la prueba estadstica del fracaso en
la prediccin, considerar un camino alternativo para la prueba de fracaso en la
prediccin usando una regresin que contiene variables ficticias. Una variable ficticia
sera utilizada para cada observacin que estaba en la muestra de prediccin.
La regresin sin restricciones sera entonces aquella que incluye las variables ficticias,
que se estima utilizando todas las observaciones T, y tendr (k + T2) regresores (los
originales k variables explicativas, y un variables ficticias para cada observacin
prediccin, es decir, un total de variables ficticias T2). As, el numerador de la ltima
parte de (frmula anterior) sera el nmero total de observaciones (T) menos el nmero
de regresores en la regresin sin restricciones (k + T2). Tomando nota tambin de que
T-(k + T2) = (T1-k), ya que T1 + T2 = T, se obtiene el numerador del ltimo trmino
(frmula anterior). La regresin restringida sera entonces la regresin original que
contiene las variables explicativas, pero ninguna de las variables ficticias. As, el
nmero de restricciones sera el nmero de observaciones en el periodo de prediccin,
lo que sera equivalente al nmero de variables ficticias incluidas en la regresin sin
restricciones, T2.

22

Flix S. Castillo Vera

Magister de la PUCP

Para ofrecer una ilustracin, supongamos que la regresin es de nuevo es de la forma


( Yt 1 2 X 2t 3 X 3t u t ), y que las tres ltimas observaciones en la muestra se
utiliza para una prueba de prediccin de fallos. La regresin sin restricciones incluira
tres variables ficticias, una para cada una de las observaciones en T2.
Ygt rmt 1 D1t 2 D 2 t 3 D3 u t

Dnde: D1=1 para la observacin T-2 y 0 las dems, D2=1 para la observacin
T-1 y o las dems, D3=1 para la observacin T y 0 para las dems. La hiptesis nula
para la prueba de fracaso de prediccin en esta regresin es que los coeficientes sobre
todas las variables ficticias son cero (esto es, H 0 : 1 0; 2 0; 3 0 ). Ambos enfoques
para la realizacin de la prueba de fracaso de prediccin descrito antes son
equivalentes, aunque la regresin con variable ficticia es probable que tome ms
tiempo hacer.
Sin embargo, tanto para las pruebas de Chow y de fallo de prediccin, el mtodo de
variables ficticia tiene la gran ventaja que es la que proporciona al usuario ms
informacin. Esta informacin adicional viene del hecho de que se pueda examinar la
significancia de los coeficientes de las variables ficticias individuales para ver qu parte
de la hiptesis nula est causando un rechazo. Por ejemplo, en el contexto de la
regresin Chow, Es el intercepto o los coeficientes de la pendiente que son
significativamente diferentes entre los dos sub-muestras? En el contexto de la prueba
de prediccin de fallos, el uso del enfoque de variables ficticias se muestra para qu
perodo(s) de los errores de prediccin son significativamente diferentes de cero.

5. MODELADO DE SERIES DE TIEMPO UNIVARIADO Y PRONOSTICO


5.1 Introduccin
23

Flix S. Castillo Vera

Magister de la PUCP

5.2 Algunos conceptos y notacin


5.3 Procesos de medias mviles: MA(q )
Yt u t 1u t 1 2 u t 2 3 u t 3 ... q u t q
q

Yt i u t 1 u t
i 1

5.4 Procesos autorregresivos:

AR( p )

Yt u t 1Yt 1 2Yt 2 3Yt 3 ... p Yt p


p

Yt i Yt 1 u t
i 1

O, usando operador de retardos:

Yt i Li Yt u t
i 1

O:

( L)Yt u t

Dnde:

( L) (1 1 L 2 L2 1 L3 ... p L p )

5.4.1 La condicin de estacionariedad para un modelo

AR ( p )

Haciendo igual a cero, la media del proceso AR ( p ) de Yt queda como:

( L)Yt u t
Sera declarado que el proceso es estacionario si es posible escribir:

Yt ( L) 1 u t
Con ( L) 1 converge a cero.
Esto significa que las autocorrelaciones se reducirn con el tiempo como la longitud de
retardo se incrementa. Cuando la expansin ( L) 1 se calcula, contendr un nmero
24

Flix S. Castillo Vera

Magister de la PUCP

infinito de trminos, y puede ser escrito como un MA() . Si el proceso dado por

( L)Yt u t

es estacionario, los coeficientes en la representacin MA()

disminuir con el tiempo con una longitud del retardo, por otro lado, si el proceso es no
estacionario, los coeficientes de la representacin MA() no convergen a cero a
medida que aumenta la longitud de retardo.
La condicin para las pruebas de estacionariedad de un modelo general AR ( p ) so

que las races de la ecuacin caracterstica, todos se encuentran dentro del crculo
unitario, o las races del polinomio caracterstico, todos se encuentran fuera del crculo
unitario. La nocin de ecuacin caracterstica es as llamada porque sus races
determinan las caractersticas del proceso Yt . Por ejemplo, la funcin de
autocorrelacin simple (ACF) para un proceso AR ( p ) dependera de las races de la
ecuacin caracterstica.
5.4.2 Teorema de descomposicin de Wold.
Establece que cualquier serie estacionaria se puede descomponer en la suma de dos
procesos no relacionados, una parte puramente determinstico y otra parte puramente
estocstico, la cual puede ser un MA() . Una forma de decir esto en un contexto de
un modelado AR es que cualquier proceso autorregresivo de orden p sin constante y
ningn otro trmino se pueden expresar como un modelo de medias mviles de orden
infinito MA() .
Este resultado es importante para derivar la funcin de
autocorrelacin para un proceso autorregresivo.

i
Para un modelo AR ( p ) dado por, ejemplo Yt i L Yt u t , con 0 y expresado
i 1

en notacin de rezagos polinomiales

es

( L)Yt u t

, y la descomposicin

de Wold es:

Yt ( L)u t
Dnde:

( L) ( L) 1 (1 1L 2 L2 3L3 ... p L p ) 1

Las caractersticas de un proceso autorregresivo son como sigue: La media


incondicional de Yt esta dada por:
25

Flix S. Castillo Vera

E (Yt )

Magister de la PUCP

1 1 2 3 ... p

Las autocovarianzas y funcin de autocorrelacin puden ser obtenidas mediante la


resolucin de un conjunto de ecuaciones simultaneas conocido como ecuaciones de
Yule-Walker. Las ecuaciones de Yule-Walker expresan el correlelograma (los s ) en
funcin de los coeficientes autorregresivos (los s )
1 1 1 2 ... p 1 p
2 1 1 2 ... p 2 p

:
:
p p 1 1 2 p 2 2 ... p

Para cualquier AR que sea estacionario, la funcin de autocorrelacin decaer


geomtricamente a cero. Estas caractersticas de un proceso autoregresivo.
5.5 La funcin de autocorrelacin parcial (PACF)
La PACF denotada por kk , mide la correlacin entre la correlacin k periodos atrs y
la observacin actual, despus de controlar las observaciones de los retardos
intermedos (es decir, todos los rezagos menores a k ). La correlacin entre Yt y Yt k
, despus de remover los efectos de Yt k 1 Yt k 2

Yt 1 .

En el rezago 1, los coeficientes de la funcin de autocorrelacin simple y de la funcin


de autocorrelacin parcial son iguales, dado que no hay efectos de rezagos intermedios
que eliminar. As 11 1 .
En el rezago2, 22

2 12
11

Donde 1 y 2 son los coeficientes de autocorrelacin de los rezagos 1 y 2,


respectivamente.
Para rezagos mayores que 2, las frmulas son ms complejas.

5.5.1 La condicin de inveribilidad


26

Flix S. Castillo Vera

Magister de la PUCP

Un modelo MA(q ) se requiere normalmente que la ecuacin caracterstica ( z ) 0


tenga races mayores que uno en trminos absolutos. La condicin de invertibilidad es
matemticamente la misma como la condicin de estacionariedad, pero es diferente en
el sentido de que el primero se refiere a un MA en lugar de AR . Esta condicin
impide al modelo de la explosin bajo la representacin de un AR () , de modo que
1 ( L) converge a cero.
La condicin de invertibilidad para un modelo MA( 2)
Con el fin de examinar la forma de la PACF para los procesos de medias mviles,
considere el siguiente proceso MA( 2) para:
Yt u t 1u 1t 2 u t 2 ( L)u t

A condicin que este proceso es invertible, este MA( 2) puede ser expresado como
un AR () :
Yt

c Y
i 1

t 1

ut

Ahora es evidente cuando se expresa de esta manera que para un modelo de medias
mviles, hay conexiones directas entre el valor actual de Yt y todos sus valores
anteriores. Por lo tanto, la funcin de autocorrelacin parcial (PACF) para un modelo
MA( 2) disminuir geomtricamente, en lugar de caer a cero despus de q retardos,
como es el caso de su fuction de autocorrelacin (ACF). Por ello, podra decirse que la
ACF para un AR tiene la misma forma bsica que la PACF para un MA , y la ACF
para un MA tiene la misma forma como la PACF para un AR .
5.6 Procesos ARMA
Por combinaciones de modelos AR ( p ) y MA(q ) , se obtiene un modelo
ARMA( p, q ) . Tales modelos establecen que, el valor actual de la misma serie Yt
depende linealmente de sus propios valores pasados ms una combinacin de valores
actuales y pasados del trmino de error ruido blanco. El modelo puede ser escrito:
( L)Yt ( L)u t .

Dnde:
( L) (1 1L 2 L2 3L3 ... p L p )

( L) (1 1L 2 L2 3L3 ... q Lq )

27

Flix S. Castillo Vera

Magister de la PUCP

Yt 1Yt 1 2Yt 2 3Yt 3 ... pYt p u t 1u t 1 2 u t 2 3 u t 3 ... q u t q


2
2
Con E (u t ) 0; E (u t ) ; E (u t u s ) 0, t s

La ACF solo se puede distinguir entre un puramente AR ( p ) y MA(q ) puro. Sin


embargo un proceso ARMA( p, q ) tendr un ACF geomtricamente decreciente al
igual que un proceso AR ( p ) . As la PACF es usada para distinguir entre un proceso
AR ( p ) y un proceso ARMA( p, q )
5.7 Pronsticos en econometra.
Para entender cmo se construye el pronstico, se requiere la idea de las expectativas
condicionales. Una expectativa condicional se puede expresar como:
E (Yt 1 / t )

()
Esta expresin indica que el valor esperado de Y se toma para el tiempo t +1,
condicionado a, o dado, toda la informacin disponible hasta el momento e incluyendo
el tiempo t () ). En contraste esto con la expectativa incondicional de Y , que es el
valor esperado de Y , sin referencia al tiempo, es decir, la media no condicional de Y .
Se utiliza el operador de expectativas condicionales para generar pronsticos de la
series.
Cmo esta expectativa condicional se evala?, por supuesto, depender del modelo
en cuestin. Varias familias de modelos de prediccin se desarrollarn en adelante.
Un primer punto a sealar es que la definicin de pronstico ptima para un proceso
ruido blanco de media cero es cero.
E (u t 1 / t ) 0, s 0

A continuacin se tiene dos mtodos de pronsticos sencillos


a) E (Yt 1 / t ) Yt
Este pronstico es ptimo si Yt sigue un proceso de
caminata aleatoria.
b) En ausencia de un modelo completo, el pronstico puede ser generado
usando la media a largo plazo de la series. El pronstico usando la media
incondicional sera ms til en series estacionarias, por su reversin a la
media.
5.7.1 Pronstico del valor futuro de un proceso AR ( p )
A diferencia de un proceso de medias mviles, un proceso autorregresivo tiene
memoria infinita. Para ilustrar, supongamos que un modelo AR ( 2) se ha estimado:
Yt 1Yt 1 2Yt 2 u t

28

Flix S. Castillo Vera

Magister de la PUCP

Una vez ms, apelando apelando al supuesto de estabilidad en los parmetros, esta
ecuacin se mantendr durante tiempo t+1, t+2, y as sucesivamente.
Yt 1 1Yt 2Yt 1 u t 1
Yt 2 1Yt 1 2Yt u t 2
Yt 3 1Yt 2 2Yt 1 u t 3

Elaborar el pronstico un paso adelante es fcil, dado que toda la informacin


requerida es conocida en el tiempo t. Aplicando el operador de esperanza a las
ecuaciones anteriores y estableciendo E (u t 1 ) a cero dara lugar a:
E (Yt 1 / t ) E ( 1Yt 2Yt 1 u t 1 / t )
E (Yt 1 / t ) 1 E (Yt / t ) 2 E (Yt 1 / t )
E (Yt 1 / t ) 1Yt 2Yt 1 f t ,1

Aplicando el mismo procedimiento con el objetivo de generar el pronstico dos pasos


adelante.
E (Yt 2 / t ) E ( 1Yt 1 2Yt u t 2 / t )
E (Yt 2 / t ) 1 E (Yt 1 / t ) 2 E (Yt / t )
E (Yt 2 / t ) 1 f t ,1 2Yt f t , 2

Similarmente, para tres pasos adelante, el pronstico est dado por:


E (Yt 3 / t ) E ( 1Yt 2 2Yt 1 u t 3 / t )
E (Yt 3 / t ) 1 E (Yt 2 / t ) 2 E (Yt 1 / t )
E (Yt 3 / t ) 1 f t , 2 2 f t ,1 f t ,3

As, cuatro pasos adelante es:


E (Yt 4 / t ) 1 f t ,3 2 f t , 2 f t , 4

As sucesivamente, el pronstico para el paso s es:


E (Yt s / t ) 1 f t , s 1 2 f t , s 2 f t , s

29

Flix S. Castillo Vera

Magister de la PUCP

6.11 MODELOS DE VECTORE AUTORREGRESIVO


Modelo de vector autorregresivo (VARs) se popularizo en econometra por Sims(1980)
como una natural generalizacin de modelos autorregresivo univariante. Un VAR es un
modelo de sistema de regresin (es decir hay ms de una variable dependiente) que
puede ser considerado una especie de hibrido entre los modelos de series de tiempo
univariados y los modelos de ecuaciones simultaneas. VARs ha sido invocado con
frecuencia como una alternativa a gran escala a modelos estructurales de ecuasiones
simultaneas.
El caso ms simple que puede ser entretenido es un Var bivariante, donde hay solo dos
variables, y1t y y 2 t , cada uno de sus valores actuales depende de diferentes
combinaciones de k valores previos de ambas variables, y trminos de error.
y1t 10 11 y1t 1 ... 1k y1t k 11 y 2 t 1 ... 1k y 2 t k u1t
y 2t 20 21 y 2t 1 ... 2 k y 21t k 21 y1t 1 ... 21k y1t k u 21t

Donde u it es un trmino de perturbacin ruido blanco con E (u it ) 0

(i 1,2)

E (u1t u 2t ) 0 .

Como es evidente, una caracterstica importante del modelo VAR es su flexibilidad y


facilidad de generalizacin. Por ejemplo, el modelo podra extenderse para incluir los
errores promedios mviles, que sera una versin multivariante de los modelos ARMA,
conocidos como VARMA. En lugar de tener solo dos variables, y1t y y 2 t el sistema
puede ser extendido para incluir g variables, y1t , y 2t , y 3t ,..., y gt cada cual tiene una
ecuacin.

30

Flix S. Castillo Vera

Magister de la PUCP

Otro aspecto til de los modelos VAR es el compacto con el que se expresa la
notacin. Por ejemplo, consideremos el caso anterior donde k 1 , de modo que cada
variable depende solo de los valores inmediatamente anteriores de y1t y y 2 t , ms un
termino de error. Esto puede ser escrito como:
y1t 10 11 y1t 1 11 y 2t 1 u1t

y 2t 20 21 y 2t 1 21 y1t 1 u 21t

O
y1t 10 11 11 y 1t 1 u1t

y
u
2
t
20
2
t

1
2
t

21
21

O incluso en forma ms compacta como:


y t , g .1 0 , g .1 1, g . g y t 1, g .1 u t , g .1

Donde g 2 variables en el sistema y g.g es el tamao de la matriz de coeficientes.


Extendiendo el modelo al caso donde existen k rezagos de cada variable en cada
ecuacin es tambin fcil de acoplar usando la misma notacin.
y t , g .1 0 , g .1 1, g . g y t 1, g .1 2 y t 2 , g .1 ... k , g .1 y t k u t , g .1

El modelo podra ser extendido al caso en el que el modelo incluya trminos en


primeras diferencias y relaciones de cointegracin (modelo de vectores de correccin
de erro (VECM)).
6.11.1 Ventajas de los modelos VAR.
Modelos VAR tienen muchas ventajas comparado con modelos de series de tiempo
univariados o modelos estructurales de ecuaciones simultneas.

Los investigadores no necesitan especificar que variables son endgenas o


exgenas todas son endgenas. Este es un punto muy importante, puesto que
un requisito para los modelos estructurales de ecuaciones simultaneas para ser
estimados es que todas las ecuaciones en el sistema sean identificados.
Esencialmente, este requisito se reduce a una condicin de que algunas
variables sean tratadas como exgenas y que las ecuaciones contienen
diferentes RHS variables. Idealmente, esta restriccin debe surgir de manera
natural a partir de la teora econmica o financiera. Sin embargo, en teora, en
la prctica ser el mejor de los vagos en sus sugerencias de que variables
deben ser tratadas como una variable exgena. Esto deja al investigador con un
31

Flix S. Castillo Vera

Magister de la PUCP

gran margen de discrecin sobre la forma de clasificar las variables. Dado que
las pruebas tipo Hausman no suelen ser empleadas en la prctica, cuando
deberan ser, en la especificacin de ciertas variables como exgenas.
Necesario para formar la identificacin de las restricciones, es probable que en
muchos casos no es vlido. Sims llama a estas restricciones de identificacin
increibles Estimacion del VAR, por otro parte, no requiere restricciones que se
impongan.

VARs permiten que el valor de una variable dependa algo ms que de sus
propios rezagos o combinacin de trminos ruido blanco, as los VARs son ms
flexibles que los modelos AR univariados; este ltimo puede ser visto como un
caso de modelo VAR restringido. Los modelos VAR pueden por lo tanto ofrecer
una estructura muy rica, lo que implica que puede ser capaz de capturar ms
caractersticas de los datos.

A condicin de que no hay trmino contemporneo en el lado derecho de las


ecuaciones, es posible usar simplemente MCO por separado en cada ecuacin.
Esto surge del hecho de que todas las variables del lado derecho son
predeterminadas, es decir, en el tiempo t, se les conoce, esto implica de que no
hay posibilidad de retroalimentacin, de cualquiera de las variables LHS a
ninguna de las variables RHS. Variables predeterminadas incluyen todas las
variables exgenas y los valores rezagados de las variables endgenas.

Los pronsticos generados por los VARs son a menudo mejores que los
tradicionales modelos estructurales. Se ha argumentado en una serie de
artculos (ver, por ejemplo, Sims, 1980) que a gran escala los modelos
estructurales tienen un pobre desempeo en trminos de precisin prevista
fuera de la muestra. Esto quizs podra surgir como resultado de la naturaleza
ad hoc de las restricciones impuesta a los modelos estructurales para asegurar
la identificacin mencionada anteriormente. McNees (1986) muestra que el
pronstico de algunas variables (por ejemplo, la tasa de desempleo de USA y el
PNB real, etc) se producen con mayor precisin usando VARS que a partir de
varias diferentes especificaciones estructurales.

6.11.2 PROBLEMAS CON VARs.


Modelos VAR por su puesto tambin tienen inconvenientes y limitaciones en relacin a
otra clase de modelos:

VARs son a tericos (como lo son los modelos ARMA) ya que utilizan muy poca
informacin terica acerca de las relaciones entre variables para guiar la
especificacin del modelo. Por otro lado, las restricciones de exclusin valido
32

Flix S. Castillo Vera

Magister de la PUCP

que garantice la identificacin de las ecuaciones de un sistema estructural


simultneo informa sobre la estructura del modelo. Un disparo de esto es que
los VARs son menos susceptibles de un anlisis terico y, por lo tanto, las
recetas polticas. Tambin existe una mayor posibilidad en el marco del enfoque
del VAR que un investigador desventurado podra obtener una relacin
esencialmente falsa por la minera de datos. Tampoco es claro cmo muchas
veces las estimaciones de los coeficientes del VAR deben ser interpretados.

Cmo debe determinarse la longitud adecuada del rezago del VAR? Hay
muchos enfoques disponibles para hacer frente a este tema, que se ver ms
adelante.

Tantos parmetros! Si hay g ecuaciones, una para cada g variables y con k


rezagos de cada variable en cada ecuacin, (g+kg^2) parmetros pueden ser
estimados. Por ejemplo, si g=3 y K=3 hay 30 parmetros tendra que ser
estimados. Para tamaos de muestra relativamente pequeos, los grados de
libertad rpidamente se agotarn, lo que implica grandes errores estndar e y
por lo tanto, intervalos de confianza amplios para coeficientes del modelo.

Debera ser todos los componentes del VAR estacionarios? Obviamente, si se


desea utilizar las pruebas de hiptesis, ya sea individual o conjunta, para
examinar la significancia estadstica de los coeficientes, entonces es esencial
que todos los componentes del VAR son estacionarios. Sin embargo, muchos
defensores del enfoque VAR que diferenciar para inducir a estacionariedad no
se debe hacer. Ellos argumentan que el propsito de estimar el VAR no es otra
que examinar la relacin entre variables, y que la diferenciacin arrojara
informacin sobre la relacin a largo plazo entre distancia de las series. Tambin
es posible combinar niveles y primeras diferencias de los trminos en un VECM.

6.11.3 LA ELECCION DE LA LONGITUD PTIMA DE REZAGOS DE UN VAR.


A menudo, la teora financiera tendr poco que decir sobre lo que es la longitud
ptima de rezagos para un VAR y como cambios en el tiempo en las variables
deben hacerse para trabajar a travs del sistema. En estos casos hay en general
dos mtodos que se podran utilizar para llegar a la longitud ptima de rezagos:
restricciones ecuacin cruzada y criterios de informacin.
6.11.4 RESTRICCION ECUACION CRUZADA
LONGITUD DE REZAGOS PARA UN VAR.

PARA SELECCIONAR LA

Una primera (pero incorrecta) respuesta a la pregunta de cmo determinar la


longitud del rezago adecuado para el uso en bloque de las pruebas F se destaca en
la seccin 6.13. Estos sin embargo, no son apropiados en este caso como la
33

Flix S. Castillo Vera

Magister de la PUCP

prueba F se puede utilizar por separado para el conjunto de rezagos en cada


ecuacin, y lo que se necesita aqu es un procedimiento para poner a prueba los
coeficientes de una serie de retardos en todas las variables para todas las
ecuacionews en el VAR, al mismo tiempo.
Vale la pena sealar aqu que en el espritu de la estimacin del VAR (como Sims,
por ejemplo, que la especificacin del modelo debe llevarse a cabo), los modelos
deben ser lo ms libre posible. Un VER con diferente magnitud de rezagos para
cada ecuacin puede ser visto como un VAR restringido. Por ejemplo, considere un
VAR con 3 rezagos de ambas variables en una ecuacin y 4 rezagos de cada
variable en otra ecuacin. Esto podra ser visto como un modelo restringido, donde
ha sido el coeficiente del cuarto rezago de cada variable cero en la primera
ecuacin.
Un enfoque alternativo sera especificar el mismo nmero de rezagos en cada
ecuacin y determinar el orden del modelo de la siguiente manera. Supongamos
que un VAR estimado con datos trimestrales cuenta con 8 rezagos de dos variables
en cada ecuacin, y se desea examinar la restriccin de que los coeficientes de los
rezagos 5 a 8 son conjuntamente cero. Esto se puede hacer mediante una prueba
de razn de verosimilitud. Denote la matriz de varianzas y covarianzas (dado por

u . u ' ), como

. La prueba de razn de verosimilitud esta dado por:

LR T .[log | r | log | u | ]

Donde | r | es el determinante de la matriz de varianzas-covarianza de los

residuos del modelo restringido (con 4 rezagos), | u | , es el determinante de la


matriz de varianzas-covarianza de los residuos del VAR irrestricto (con 8 rezagos) y
T es el tamao de muestra. La prueba estadstica es asintticamente distribuida
como una variable aleatoria x 2 con grados de libertad igual al nmero total de
restricciones. En el caso del VAR anterior, 4 rezagos de 2 variables se est
restringiendo en cada una de las dos ecuaciones = a un total de 4x2x2=16
restricciones. En el caso general de un VAR con g ecuaciones, para imponer las
restricciones en los ltimos q rezagos tienen coeficientes cero, habra g 2 .q
restricciones en total. Intuitivamente, la prueba es un equivalente de variables
mltiples para examinar la medida en que la RSS aumenta cuando se impone una

restriccin. Si | r | y | u | estn prximos; la restriccin es soportada por los


datos.
34

Flix S. Castillo Vera

Magister de la PUCP

6.11.5 CRITERIOS DE INFORMACION PARA SELECCIONAR LONGITUD DE


REZADO DEL VAR.
La razn de verosimilitud (LR) explicada anteriormente es bastante intuitivo y fcil
de calcular, pero tiene sus limitaciones. Principalmente, uno de los dos VARs debe
ser un caso especial de los otros y, ms en serio, solo las comparaciones por pares
se pueden hacer, en el ejemplo anterior, si la longitud del rezago ms apropiado
hubiera sido 7 o incluso 10, no hay manera de que esta informacin pueda ser
obtenida de la prueba LR levado a cabo. Se podra lograr esto solo a partir de un
VAR(10). y sucesivamente una prueba de conjunto de rezagos a la vez.
Otra desventaja del enfoque de la prueba LR es que la prueba x 2 estrictamente
ser vlida asintticamente solo bajo el supuesto de que los errores de cada
ecuacin se distribuyen normalmente. Esta hiptesis es poco probable que se
confirme para datos financieros. Un enfoque alternativo para seleccin apropiada
de la magnitud de rezagos del VAR sera el uso del criterio de informacin.
Los criterios de informacin no requieren como supuesto la normalidad sobre la
distribucin de los errores. En cambio, los criterios intercambian una cada de los
RSS de cada ecuacin a medida que ms rezagos se aaden, con un aumento en
el valor en trminos de una penalizacin. Los criterios univariados se podra aplicar
por separado a cada ecuacin, pero, de nuevo, por lo general es considerado
preferible requerir el nmero de rezagos a ser el mismo para cada ecuacin. Esto
requiere el uso de versiones mltiples variables de los criterios de informacin, que
pueden ser definidos como:

MAIC log | | 2.k ' / T

MSBIC log | | .

k'
log(T )
T

MHQIC log | | .

2k '
log(T )
T

Donde de nuevo | | es la matiz de varianzas y covarianzas de los residuos, T es el


nmero de observaciones y k es el nmero total de regresores en todas las
ecuaciones, que sera igual a p 2 .k p para p ecuaciones en el sistema VAR, cada uno
con k rezagos de las p variables, ms un trmino constante en cada ecuacin. Como
previamente, los valores de los criterios de informacin son construidos para 0,1,, k
rezagos (hasta cierto k pre-especificado mximo), y la eleccin del nmero de rezagos
es aquel que minimice el valor del criterio de informacin dado.
35

Flix S. Castillo Vera

Magister de la PUCP

6.12 EL VAR INCLUYE TERMINOS CONTEMPORANEOS?


Hasta ahora, se ha supuesto que el VAR especificado es de la forma:
y1t 10 11 y1t 1 11 y 2t 1 u1t
y 2t 20 21 y 2t 1 21 y1t 1 u 21t

De modo que no hay trminos contemporneos en el lado derecho del RHH, es decir
no hay termino de y 2 t en el lado derecho de la ecuacin para y1t y no hay trmino de
y1t en el lado derecho para la ecuacin para y 2 t . Pero si las ecuaciones tienen un

trmino de retroalimentacin contempornea, como lo siguiente:


y1t 10 11 y1t 1 11 y 2t 1 12 y 2 t u1t
y 2t 20 21 y 2t 1 21 y1t 1 22 y1t u 21t

El sistema anterior, puede ser tambin escrito por apilamiento de los trminos en
matrices y vectores:
y1t 10 11 11 y 1t 1 12 0 y 2t u1t


y 2t 20 21 21 y 2t 1 0 22 y1t u 2t

Esto se conoce como un VAR en su forma primitiva, a la forma estructural de un


modelo de ecuaciones simultaneas. Algunos investigadores han argumentado que el
carcter terico de un VAR de forma reducida los deja sin estructura y sus resultados
difciles de interpretar tericamente. Ellos argumentan que las formas del VAR dado
anteriormente no son ms que formas reducidas de un VAR estructural ms general,
siendo este ltimo de mayor inters.
Los trminos contemporneos del Var anterior puede ser tomado al lado izquierdo del
sistema y escrito como:

1
22

12

y1t 10 11 11 y 1t 1 u1t

y 2t 20 21 21 y 2t 1 u 2t

O
Ay t 0 1 y1t 1 u t

Si a ambos lados de la ecuacin anterior, pre multiplicamos por A 1


y t A 1 0 A 1 1 y1t 1 A 1u t
36

Flix S. Castillo Vera

Magister de la PUCP

O
y t A 0 A1 y1t 1 et

Este es conocido como VAR en su forma estndar, que se asemeja a la forma reducida
de un conjunto de ecuaciones simultaneas. Este VAR solo contiene valores
predeterminados en el lado derecho del sistema.

CUADRO 6.3 PRONOSTICO CON VARs.


Una de las principales ventajas de la metodologa VAR para el modelado y la
prediccin es que, dado que slo las variables rezagadas se utilizan en el lado derecho,
los pronsticos de los valores futuros de las variables dependientes se puede calcular
utilizando la informacin slo de dentro del sistema. Podramos denominar estas
previsiones incondicionales, ya que no se construyen condicionadas a un conjunto de
valores asumidos en particular. Sin embargo, por el contrario, puede ser til para
realizar predicciones de los valores futuros de algunas variables condicionadas a los
valores conocidos de otras variables en el sistema. Por ejemplo, puede ser el caso de
que los valores de algunas variables dado a conocer antes de los valores de los
dems. Si los valores conocidos de los primeros son empleados, se podra anticipar
que las predicciones deben ser ms precisas que si los valores estimados fueran
realizados innecesariamente, arrojando as informacin conocida de lejos. Por otra
parte los pronsticos condicionales pueden ser empleados para el anlisis contrafactual
sobre la base de examinar el impacto de ciertos escenarios. Por ejemplo, en un
sistema VAR trivariado incorporando rentabilidades mensuales de valores, la inflacin y
el PIB, se podra responder a la pregunta: Cul es el probable impacto en el mercado
de valores en los prximos seis meses de un aumento de 2 puntos porcentuales en la
inflacin y un aumento de 1% en el PIB?

6.15 IMPULSO RESPUESTA Y DESCOMPOSICION DE VARIANZA


El bloque de pruebas F y un examen de causalidad en un VAR sugieren cual de las
variables en el modelo tienen un impacto estadsticamente significativo sobre los
valores futuros de cada una de las variables en el sistema. Pero los resultados de la
prueba F, no lo sern, por construccin, ser capaz de explicar el signo de la relacin o
37

Flix S. Castillo Vera

Magister de la PUCP

el tiempo que estos efectos requieren que tenga lugar. Es decir, los resultados de la
prueba F no revelara si el cambio en el valor de una variable dada tiene un efecto
positivo o negativo de otras variables del sistema, o el tiempo que tomara para que el
efecto de esta variable para trabajar a travs del sistema. Tal informacin, sin embargo,
se da por un examen de respuestas a impulsos del VAR y descomposicin de varianza.
El impulso respuesta traza la capacidad de respuesta de las variables dependientes en
el VAR a los choques a cada una de las variables. Por lo tanto, para cada variable de
cada ecuacin por separado, un choque de una unidad aplicado al error, y los efectos
sobre el sistema de VAR se observa con el tiempo.
Por lo tanto, si hay variables g en el sistema. Se podra genera un total de g 2
respuestas al impulso. La forma que esto se logra en la prctica es mediante la
expresin del modelo VAR como un VMA, es decir, el modelo de vectores
autorregresivos se escribe como vectores de medias mviles (de la misma manera
como se hizo para los modelos autorregresivos univariantes). Siempre que el sistema
es estable, siempre que el sistema es estable, el choque gradualmente desaparece.
Para ilustrar como el impulso respuesta opera, considere el siguiente bivariado
VAR(1).
y t A1 . y t 1 u t

Dnde:

0 .5
A1
0 .0

0 .3
0.2

El VAR tambin puede ser escrito utilizando los elementos de las matrices y los
vectores:
y1t
0.5 0.3 y1t 1 u1t
y 0.0 0.2 y u

2t 1 2t
2t

Considere el efecto en el momento t 0,1,2,....,... de un choque de una unidad en el


tiempo t 0
u 1
y 0 10
u 20 0
0 .5
y1 A1 y 0
0 .0

0 .3 1
0 .5

0. 2 0
0

0.5
y 2 A1 y1
0.0

0.3 0.5
0.25

0.2 0
0

38

Flix S. Castillo Vera

Magister de la PUCP

Y as sucesivamente. Por lo tanto, sera posible trazar las funciones de impulso


respuesta de y1t y y 2t a los choques de una unidad en y1t . Tenga en cuenta que el
efecto sobre y 2 t , es siempre cero, ya que

la variable

y1t 1 tiene un coeficiente

adjunto de cero en la ecuacin de y 2 t .


Ahora consideremos el efecto de un choque de una unidad en y 2 t en el tiempo t 0 .
u 0
y 0 10
u 20 1
0.5
y1 A1 y 0
0.0

0.3 0
0.3

0.2 1
0.2

0.5
y 2 A1 y1
0.0

0.3 0.3
0.21

0.2 0.2
0.04

Y as sucesivamente. Aunque es probable que sea bastante fcil de ver cules son los
efectos de los choques a las variables ser en un simple VAR, los mismos principios
se pueden aplicar en el contexto de un VAR con ms ecuaciones o ms retardos,
donde es mucho ms difcil ver a simple vista cuales son las interacciones entre las
ecuaciones.
Descomposicin de varianza ofrece un mtodo un poco para examinar la dinmica del
sistema VAR. Ellos dan la proporcin de los movimientos en las variables dependientes
que se deben a sus propios choques, frente a los choques con las otras variables. Un
choque a la variable i-esima afectar directamente a esa variable, por supuesto, pero
tambin ser trasmitida a todas las otras variables en el sistema a travs de la
estructura dinmica del VAR. La descomposicin de la varianza determina cunto de la
varianza de errores de pronstico s-pasos-delante de una variable determinada se
explica por las innovaciones de cada variable explicativa para s 0,1,2,... En la prctica
suele observarse que los propios choques de las serie explica la mayor parte del error
(pronostico) de la serie de un VAR. Hasta cierto punto, los impulso respuesta y la
descomposicin de varianza ofrece una informacin muy similar.
Para el clculo del impulso respuesta y la descomposicin de varianza, el orden de las
variables es importante. Para ver por qu este es el caso, recordar que la respuesta al
impulso se refiere a una unidad de choque de los errores de una sola ecuacin del
VAR. Esto implica que los trminos de error de todas las otras ecuaciones en el
sistema VAR se mantienen constantes. Sin embargo, esto no es realista, ya que los
trminos de error es probable que sean similares en las distintas ecuaciones, hasta
cierto punto. Por lo tanto, suponiendo que son completamente independientes dara
lugar a una mala interpretacin de la dinmica del sistema. En la prctica, los errores
39

Flix S. Castillo Vera

Magister de la PUCP

que tienen un componente comn que no puede ser asociado a una variable por s
solo.
El enfoque habitual de esta dificultad es la de generar impulso respuesta
ortogonolizada. En el contexto de un VAR bivariante, la totalidad de los componentes
comunes de los errores se atribuye un tanto arbitrariamente a la primera variable en el
VAR. En el caso general, donde hay ms de dos variables en el VAR, los clculos son
ms complejos pero la interpretacin es la misma. Tal restriccin implica en efecto un
orden de las variables, de modo que la ecuacin para y1t se estima primero y luego
para y 2t un poco como un sistema recursivo o triangular.
Asumiendo un cierto orden es necesario para calcular el impulso respuesta y la
descomposicin de varianza, aunque la restriccin se basa en el orden, no puede ser
apoyado por los datos. Una vez ms, de ser posible, la teora financiera sugiere un
orden (en otras palabras, que los movimientos en algunas variables son propensos a
seguir, en lugar de preceder, otros). En caso contrario, la sensibilidad de los resultados
a los cambios en el orden puede ser observado al asumir un orden, y es exactamente
lo dar marcha atrs y volver a la informtica, los impulso respuesta y la descomposicin
de varianza. Tambien vale la pena sealar que la mayor correlacin en los residuos de
una ecuacin estimada, ms importante ser el orden de las variables. Sin embargo
cuando los residuos son casi sin correlacin, el orden de las variables har poca
diferencia (ver Ltkepohl, 1991, capitulo 2 para ms detalles).
Runkle (1987) sostiene que tanto el impulso respuesta y la descomposicin de varianza
son muy difciles de interpretar con precisin. Argumenta que las bandas de confianza
alrededor del impulso respuesta y la descomposicin de varianza siempre debe ser
construido. Sin embargo, afirma tambin que, incluso entonces, los intervalos de
confianza suelen ser tan amplia que las inferencias fuertes es imposibles.

9.4. LA ESTIMACION DE SIMPLES FUNCIONES LINEALES POR TRAMOS


El modelo lineal por partes es un ejemplo de un conjunto general de los modelos ms
conocidos como las tcnicas de spline. Implica la aplicacin de las funciones
polinmicas de una manera por partes a diferentes partes de los datos. Estos modelos
se utilizan ampliamente las curvas de rendimiento de ajuste a los datos disponibles
sobre los rendimientos de los bonos de vencimientos diferentes (vase, por ejemplo,
Shea, 1984).
Un simple modelo lineal a trozos podra funcionamiento de los mismos de la siguiente
manera. Si la relacin entre las dos series, Y y X, vara dependiendo de si X es mayor o
menor que cierto valor umbral X, esta cn phenomennon ser capturados con variables
40

Flix S. Castillo Vera

Magister de la PUCP

dicotmicas. Una variable ficticia, D, podra definirse tomando valores:


D = 0 si menor Xi X *
D = 1 si el alcalde Xi X *.
Para ofrecer un ejemplo de donde esto puede ser til, a veces es el caso de que
marque los lmites de tamao vara en funcin del precio del activo. Por ejemplo, de
acuerdo con George y Longstaff (1993. Vase tambin el captulo 6 de este libro) de la
Chicago Board Options Exchange limita el tamao de la garrapata es de $ 1 / 8 para las
opciones de trabajo precio de US $ 3 o ms, y $ 1 / 16 para las opciones de trabajo
menos que $ 3. As, si Y es el comprador-vendedor para conocer las opciones de, y X
es el precio de la opcin, utilizada como una variable que explica en parte la magnitud
de la propagacin, la difusin vara con el precio de la opcin en parte, de una manera
por partes debido a la lmite de tamao de la garrapata. El modelo de lo que podra
especificarse como:
Con Di definido igual que antes. Visto a la luz de la discusin anterior sobre variables
ficticias estacionales, el maniqu en el 9,8 se utiliza como interceptar una a la vez un
maniqu de la pendiente. Un ejemplo que muestra los datos y la lnea de regresin se
da en la figura 9.:
Tenga en cuenta que el valor del umbral o nudo se supone conocida en esta etapa. A lo
largo, tambin es posible que esta situacin puede ser generalizada t Yt el caso en que
se extrae de ms de dos regmenes o es generada por un modelo ms complejo.
9.5. Los modelos de Markov de conmutacin.
Aunque un mayor nmero de ms complejas, los modelos no lineales de umbral se
han propuesto en la literatura de econometra, slo dos tipos de modelo ha tenido un
impacto notable en la financiacin (aparte del umbral de los modelos GARCH del tipo
aludido en el captulo 8). Estos son el rgimen de cambio de modelo de Markov
asociados con Hamilton (1989 1990), y el umbral de modelo autorregresivo asociados
con Tong (1983, 1990). Cada una de estas formulaciones se discutir ms adelante.
9.5.1 Fundamentos de los modelos de Markov de conmutacin.
Bajo el enfoque de Markov de conmutacin, el universo de la posible aparicin est
dividido en m estados del mundo, que se denota "s", i = 1, ...., m, que corresponde a
"m" regmenes. En otras palabras, se supone que "Yt" cambia el rgimen de acuerdo
con algunas de las variables no observadas, "s", que toma valores enteros. En el resto
de este captulo, se entender que m = 1 o 2. As que si s = 1, el pocess est en
rgimen de 1 en el tiempo "t, y si s = 2, el proceso se encuentra en rgimen de 2 en el
tiempo" t ". Los movimientos de la variable de estado entre los regmenes se rigen por
un proceso de Markov. Este De propiedad de Markov se puede expresar como;

41

Flix S. Castillo Vera

P[ayi b | y1, y2,. . , yt1] P[ayi b | yt1]

Magister de la PUCP

9.10

En la llanura Ingls, esta ecuacin establece que la distribucin de probabilidad. del


Estado en cualquier momento t depende slo del estado en el tiempo t-1 y no en el
Estado
que se pasaron en horas de t-t, t-3, ... . Por lo tanto los procesos de Markov no son
dependientes de ruta. La fuerza de los modelos radica en su flexibilidad, siendo
capaces de captar los cambios en la varianza entre los procesos estatales, as como
los cambios en la media.

La forma ms bsica del modelo de Hamilton, tambin conocido como filtro de Hamilton
(ver Hamilton, 1989), comprende una variable de estado no observada, zt denota, que
se postula que la evaluacin de acuerdo a un primer proceso para el fin de Markov

P[ z t 1 | z t 1 1] p11 ]
P[ z t 2 | z t 1 1] 1 p11 ]
P[ z t 2 | z t 1 2] p 22 ]
P[ z t 1 | z t 1 2] 1 p 22 ]

Donde, p11 y p22 indican la probabilidad de estar en rgimen de uno, dado que el
sistema estaba en rgimen de uno durante el periodo previo, y la probabilidad de estar
en rgimen dos, dado que el sistema estaba en rgimen de dos durante el perodo
anterior, respectivamente. As, 1 p11 define la probabilidad de que y t cambia de
estado 1 en el perodo t-1 al estado 2 en el perodo t, y 1 p 22 , define la probabilidad
de un cambio del estado 2 al estado 1 entre los tiempos t-1 y t. Se puede demostrar
que en virtud de esta especificacin, z t evoluciona como un proceso AR (1):
z t (1 p11 ) z t 1 nt

Donde p11 p 22 1 . En trminos generales, z t puede ser visto como una


generalizacin de las variables ficticias de una sola vez los cambios en una serie
discutido anteriormente. Bajo el enfoque de cambios de Markov, all puede haber
multiples cambios de un conjunto de comportamiento a otro.
42

Flix S. Castillo Vera

Magister de la PUCP

y t 1 2 z t ( 12 z t ) 1 / 2 u t

Donde u t N (0,1) . Los valores esperados y las varianzas de la serie son 1 y 12 ,


respectivamente, en el estado 1, y ( 1 2 ) y 12 , respectivamente, el estado 2.
La varianza en el estado 2 se define tambin . 22 12 . Los parmetros
desconocido del modelo ( 1, , 2 , 2 , 1 , p11 , p 22 ) son estimados utilizando mxima
verosimilitud. Los detalles estn ms all del alcance de este boook, pero son ms
exhaustivo que figura en Engel y Hamilton (1990).
2

Si una variable sigue un Proceso de Markov, todo lo que se requiere para pronosticar la
probabilidad de que sea en un rgimen determinado, durante el prximo perodo, es la
probabilidad de perodos actuales y un conjunto de probabilidades de transicin,
teniendo en cuenta para el caso de dos de rgimen (9.11 ) - (9.14). En el caso general,
donde hay m estados m, la probabilidad de transicin son los mejores expresado como:

P11
P
P 21
.

Pm1

P12

...

P22
.

...
.

P1m
P2 m
.

Pm 2

...

Pmm

Donde Pij es la probabilidad de movimiento de rgimen i al rgimen j. Dado


que, en un momento dado, las variables deben de estar en una de los m estados, debe
ser cierto que:
m

ij

1, i

jO1

Un vector de probabilidades del estado actual se define como:

t [ 1

... m ]

Donde i es la probabilidad que la variable y se encuentre actualmente en el


estado i. Teniendo en cuenta que t y P , la probabilidad que la variable y estar
en un rgimen determinado en el periodo siguiente se puede pronosticar el uso.
t 1 1 P

Las probabilidades de adoptar medidas S en el futuro est dado por:


43

Flix S. Castillo Vera

Magister de la PUCP

ts t P s

9.8 Un modelo de cambio de rgimen de Markov para el tipo de cambio real.


Ha habido una serie de aplicaciones del modelo de Markov de conmutacin en las
finanzas. Evidentemente, este enfoque es til cuando una serie se cree que someterse
a cambios de un tipo de comportamiento a otro y viceversa, pero donde la variable que
hace que el forzar cambios de rgimen no es observable.
Una de estas aplicaciones es la modelizacin del tipo de cambio real. Como se ha
mencionado en el captulo 7 de paridad de poder adquisitivo (PPP), la teora sugiere
que la ley del precio nico debe aplicar siempre en el largo plazo de tal manera que el
costo de una canasta representativa de bienes y servicios es el mismo donde se
compra, despus de convertirlo en una moneda comn. En algunas hiptesis, una de
las consecuencias es que el PPP es que la tasa de cambio real (es decir, el tipo de
cambio divididos por un ndice general de precios como el ndice de precios al
consumidor (IPC) debe ser parado. Sin embargo, una serie de estudios no han logrado
de rechazar la hiptesis nula de raz unitaria en las tasas de cambio real, con indicacin
de las pruebas en contra de la teora de la PPA.

KOLMOGOROV-SMIRNOV Distancia y Partes Cuantil-Cuantil


Uno de los ms famosos (simple) probabilidad distancia es el Kolmogorov-Smirnov
distancia (KS-distancia). Aplicamos esta probabilidad distancia en nuestra ilustracin en
el captulo. Cuando se usa para probar una hiptesis de distribucin, nos referimos al
KS-distancia como un KS-estadistico, como hemos hecho en nuestra ilustracin.
Dadas dos de distribucin de probabilidad P y Q en la recta real con funcin de
distribucin acumulada F y G, se puede evaluar la distancia entre estas dos
distribucin mediante el clculo de la mayor distancia entre los valores F (x) y G (x)
para diferentes x. Matemticamente, esto significa que el clculo de la distancia
supremo entre F y G:
El supremo es la menor cota superior de un conjunto y se denota por sup.

Se entiende por los estadsticos que la distribucin de esta distancia calculada entre
una funcin de distribucin emprica y la terica sobre la base de una muestra, no
depende del tipo concreto de distribucin, siempre y cuando una distribucin contina.
Este hecho se puede utilizar para realizar la prueba de Kolmogorov-Smirnov famosa de
bondad de ajuste, que se describe a continuacin.
44

Flix S. Castillo Vera

Magister de la PUCP

Dada una muestra de observaciones x = x (x1. ... xn), la funcin de distribucin


emprica Fn est dada por la siguiente expresin:
donde #{..} denota el nmero de elementos incluidos en el conjunto {...} y Fn define una
distribucin de probabilidad discreta en la recta real y para valores grandes de n la
distribucin emprica converge a la terica. Bajo la hiptesis de que la muestra fue
generada por una distribucin de probabilidad con F funcin de distribucin, la
distribucin de la KS-distancia entre F y Fn es tabulados. Eso significa que,
dependiendo del valor concreto edl p-valor dy decidir si debemos creer en la hiptesis o
no.
A veces es til para trazar la distancia entre la funcin de distribucin emprica y terica
para ilustrar grficamente la desviacin. Con el fin de generar un mximo de
comparabilidad, es comn para normalizar las dos distribuciones de la siguiente
manera: En lugar de planear los valores de x frente a la diferencia de valores de la
funcin de distribucin, trazamos los cuantiles de la primera distribucin en
comparacin con los cuantiles de el segundo. El resultado se llama la trama cuantilcuantil o, simplemente, el QQ-Parcela.
Vamos a ilustrar los conceptos presentados con un ejemplo. Supongamos que se nos
da la muestra de 20 observaciones (por ejemplo, datos, todos los das retornos de las
acciones en porcentaje sobre el comercio un mes) en Exhibith A14.1. Queremos
determinar si es razonable suponer que la distribucin subyacente es normal estndar.
Podemos utilizar el QQ-parcela en A14.2 exposicin, que muestra las diferencias entre
la distribucin emprica y la distribucin normal estndar.
La lnea en la exposicin representa la coincidencia perfecta, mientras que los puntos
representan las observaciones reales. Podemos ver que existen diferencias notables
entre los cuantiles correspondientes. Para interpretar estas desviaciones, se calcula,
adems, la SC-distancia. Los clculos se muestran en la figura A14.3. El KS-la
distancia es igual a:

y el valor crtico (que se pueden encontrar en cualquier libro de estadstica) para un


nivel de confianza del 95% es dn = 0,2647. El valor Este ltimo se puede interpretar de
la siguiente manera: Si nos acercamos al azar 20 valores de una distribucin normal
estndar y calcular la KS distancia -, entonces se obtiene en el 95% de los casos un
valor que est por debajo de 0.2467 y slo en el 5% de los casos un valor superior. Por
lo tanto, un valor superior a 0,2467 hablar en contra de la hiptesis de que los datos
son generados por una distribucin normal estndar. En nuestro caso, el valor es
inferior y no podemos rechazar la hiptesis normal estndar.
45

Flix S. Castillo Vera

Magister de la PUCP

46

Вам также может понравиться