Временные ряды
1
Моделирование процессов типа ARIMA(p, d, q)
Оценки 1 , , p и 1, , p в моделях (*) и (**) совпадают (Рис. 3). А вот 0 и '0
будут отличаться. Это связано с тем, что коэффициенты модели (*) оцениваются с помощью
обычного МНК, а в модели (**) с помощью итерационного МНК. Запись: Convergence
achieved after 3 iterations (Рис. 3) означает, что коэффициенты были рассчитаны за 3 итерации.
Выпишем как выглядит модель, представленная на Рис. 2:
(*) y1t 4.742 0.356 y1t 1 t
А на Рис. 3
(**) y1t 7.365 ut , где ut 0.356 ut 1 t . Запишем уравнение (**) для момента t 1:
y1t 1 7.365 ut 1 , тогда ut 1 y1t 1 7.365, подставляя в ut получаем 0.356 ( y1t 1 7.365).
(**) преобразуется так y1t 7.365 0.356 ( y1t 1 7.365) t 5, 480 0.356 y1t 1 t
2
Иткина А.Я. Временные ряды
чтобы был упомянут каждый член авторегрессии по отдельности, т.е. задание модели в виде
*)
Белый шум – временной ряд с нулевым математическим ожиданием, постоянной дисперсией и
некоррелированными уровнями.
3
Моделирование процессов типа ARIMA(p, d, q)
( y yˆ )
t t
2
R2 1 t
,
( y y)
t
t
2
T 1
2
Radj 1 (1 R 2 ) ,
T k
где Т – длина временного ряда; k – число оцениваемых параметров модели.
Поскольку обычный коэффициент детерминации R2 не уменьшается при включении в
оцениваемую модель дополнительных лагов, то он не может служить хорошей мерой
качества модели. При расчете скорректированного коэффициента детерминации вводится
штраф за дополнительные регрессоры (лаговые переменные), поэтому значения
скорректированного коэффициента детерминации не превышают соответствующих значений
2
обычного коэффициента детерминации. Radj может уменьшаться при включении в модель
4
Иткина А.Я. Временные ряды
ˆ
t 1
2
t
s.e.regr.= . (S.E. of regression)^2 показывает дисперсию временного ряда,
T k
относительно построенной модели.
Сумма квадратов остатков регрессии SSR (Sum squared resid). Данный показатель
приводится в окне регрессии для удобства пользователя, поскольку используется для
расчетов многочисленных статистических характеристик модели.
T T
SSR ( yt yˆt )2 ˆ t2 .
t 1 t 1
T
2
T
ˆ t
l 1 log(2) log t 1 , вспомогательный коэффициент. Используется при
2 T
расчете критериев Акаике, Шварца и Хеннана-Куинна (в Eviews 7).
Статистика Дарбина-Уотсона DW (Durbin-Watson stat). Позволяет определить (для
любых моделей, кроме авторегрессионных) наличие автокорреляции остатков первого
порядка.
T
(ˆ t ˆ t 1 )2
DW t 2 , где DW – расчетное значение статистики. Для принятия решения
T
ˆ
t 1
2
t
y t
y t 1
T
Стандартное отклонение зависимой переменной
ˆ y (S.D. dependent var). Приведено
для удобства пользователя.
5
Моделирование процессов типа ARIMA(p, d, q)
( y t ˆ y )2
ˆ y t 1
T 1
Информационный критерий Акаике AIC (Akaike info criterion).
l k
AIC 2 2 ,
T T
где l логарифм функции правдоподобия. Информационный критерий Акаике, также как
и информационный критерий Шварца, используется для выбора лучшей модели из
некоторого набора альтернативных моделей – чем меньше значение критерия, тем лучше
модель.
Информационный критерий Шварца BIC или SC (Schwarz criterion).
l k log(T )
BIC 2
T T
Информационный критерий Шварца всегда выбирает лучшую модель с числом
параметров, не превышающим число параметров в модели, которая была выбрана по
критерию Акаике. Для больших выборок критерий Шварца предпочтительней.
F-статистика (F-statistic). При помощи F-статистики в предположении, что остатки
модели распределены нормально, проверяется гипотеза о незначимости регрессии в целом,
т.е. проверяется нулевая гипотеза о том, что коэффициенты при всех экзогенных
(независимых и лаговых) переменных, включенных в модель, кроме свободного члена, равны
нулю.
R2
(k 1) , где F – расчетное значение F-статистики. Его можно сравнить с
F
(1 R ) 2
(T k )
k 1
табличным F;T k , чтобы принять или отвергнуть нулевую гипотезу на уровне значимости .
6
Иткина А.Я. Временные ряды
7
Моделирование процессов типа ARIMA(p, d, q)
*)
Для решения некоторых задач необходимо сравнивать абсолютные значения этих (MA) корней с единицей.
8
Иткина А.Я. Временные ряды
выполняет роль 0 , а ut 12ut 12 24ut 24 1t 1 12t 12 t . Таким образом модель
перепишется в виде y1t 12.88 t 0.38 ut 12 0.36 ut 24 0.37 t 1 0.61t 12 (*).
к y1t :
y1t 12.88 t 0.38 ( y1t 12 12.88) 0.36 ( y1t 24 12.88) 0.37 t 1 0.61t 12 .
9
Моделирование процессов типа ARIMA(p, d, q)
yˆ1t 3.35 0.38 y1t 12 0.36 y1t 24 0.37 t 1 0.61 t 12 .
Заметим, что в модель включены лаговые переменные с лагом 12 и 24
(авторегрессионная часть), а также случайные отклонения с лагом 1 и 12 (часть скользящего
среднего). Из этого следует, что имеется 24 AR-корня характеристического многочлена и 12
MA-корней.
10
Иткина А.Я. Временные ряды
Сначала запишем вспомогательную модель: y1t 12.74 ut . Уже по этой модели видно,
yˆ1t 2.93 0.50 y1t 12 0.27 y1t 24 0.86 t 1 0.91 t 12 0.78 t 13 .
Чтобы закончить с этой темой приведем окно еще одной модели. Ваша задача
попробовать самостоятельно получить по ней прогноз.
yˆ1t 12.90 0.90 y1t 1 0.58 y1t 12 0.52 y1t 13 0.85 t 1 0.94 t 12 0.80 t 13
11
Моделирование процессов типа ARIMA(p, d, q)
Мы видим, что модели получились очень разными. Стоит иметь в виду, что напрямую
их сравнивать не стоит, поскольку последняя построена по другой выборке, нежели
предыдущие две.
ряда log( yt ) .
Оценим модель временного ряда, используя функцию взятия разностей 1-го порядка
(Рис. 8).
12
Иткина А.Я. Временные ряды
и переходя к прогнозу получаем yˆ1t 6.33 0.16 y1t 1 0.35 y1t 12 0.06 y1t 13 .
13
Приложение
Приложение
1
Не путать с моделями сглаживания скользящим средним.
2
В интерпретации Бокса-Дженкинса – это разность. В Eviews принята запись в виде суммы. В любой форме
записи знак перед каждым слагаемым определяется знаком коэффициента.
14
Иткина А.Я. Временные ряды
15
Приложение
Что же делать, если исходный временной ряд был нестационарным? Модель Бокса-
Дженкинса определена только для стационарных временных рядов. Поэтому исходный ряд
преобразуют, так чтобы он стал стационарным (если это возможно). Для этого применяется
метод взятия разностей. Последовательно рассмотрим случаи нестационарности в части
описания тренда, а затем и в части периодической (сезонной) составляющей.
Введем следующее обозначение: пусть yt yt yt 1 . Если для всех моментов времени
состоящий из yt , будет иметь смысл приростов (изменений) этого показателя. Если новый
временной ряд окажется стационарным, для него возможно построение модели методом
Бокса-Дженкинса. В противном случае, нужно сделать ряд вторых разностей и т.д. Поскольку
процедура взятия разностей достаточно трудоемкая, на практике часто ограничиваются
рядом первых разностей. Такая модель будет называться уже ARIMA (буква I от англ.
integration), она записывается как ARIMA ( p , 1, q ) ( k , 0, l ) и если в году d периодов, то:
yˆt a1yt 1 a2 yt 2 ... a p yt p
b1t 1 b2t 2 ... bq t q
A1yt d A2 yt 2 d ... Ak yt k d
B1t d B2t 2 d ... Bl t l d
Модель осталась такой же как и в предыдущем пункте, только теперь она записана не
для исходного временного ряда, а для ряда из первых разностей. При этом константа a0
Исходный ряд может быть нестационарен как в части тренда, так и в периодической части
одновременно и по отдельности. В случае нестационарности только в периодической части
модель запишется как ARIMA ( p , 0, q ) ( k , 1, l ) и если в году d периодов, то:
16
Иткина А.Я. Временные ряды
yˆt yt d .
Теперь следует понять, что прогноз требовался для yt , поэтому следует раскрыть левую
Поскольку исходные данные имеются тоже для yt , а не для yt , то придется либо
возвращаться к исходным обозначениям в правой части, раскрывая все , либо переходить
от данных исходного временного ряда к преобразованным данным из разностей.
Литература:
17