Вы находитесь на странице: 1из 22

Элементы анализа и прогнозирования временных рядов

1.1. Основные понятия и определения

В современной экономике, в бизнесе важную роль в принятии решений


играет прогноз. Любое серьезное решение, в особенности связанное с
вложением денег, требует прогноза, т.е. предвидения развития экономической
ситуации. Для того чтобы предвидеть будущее, надо хорошо знать прошлое и
присущие ему закономерности.
Если в течение достаточно продолжительного времени регулярно
фиксировать курсы валют, акций, цены на товары и т.д., то такие данные
образуют временные ряды. Временными рядами являются также данные о
выпуске или потреблении различных товаров и услуг по месяцам, кварталам,
годам. В производстве временные ряды возникают при измерении количества
изделий, выпускаемых подразделениями предприятия за час, смену, декаду,
при оценках количества брака за те же периоды, при наблюдении за
изменениями запасов на складах. В экономике и бизнесе данные типы
временных рядов появляются очень часто.
Во временном ряде содержится информация об особенностях и
закономерностях протекания процесса, а статистический анализ позволяет
выявить эти закономерности и использовать их для оценки характеристик
процесса в будущем, т.е. для прогнозирования.
Временной ряд – набор чисел, привязанный к последовательным, обычно
равноотстоящим моментам времени.
Числа, составляющие ряд и получающиеся как результат наблюдения за
ходом некоторого процесса, называются элементами (уровнями), а
промежуток времени между наблюдениями – шагом квантования по времени
(или короче – шагом по времени). Элементы ряда нумеруют в соответствии с
номером момента времени, к которому этот элемент относится (т.е. обозначают
их как Y1,Y2,...,Yn).
Формально задача прогнозирования сводится к получению оценок
значений ряда на некотором периоде будущего, т.е. к получению значения Yр(t),
t = n + 1, n + 2, ... . При использовании методов экстраполяции исходят из
предположения о сохранении закономерностей прошлого развития на период
прогнозирования. Во многих случаях при разработке оперативного (до года) и
краткосрочного (до 2 лет) прогноза эти предположения являются
справедливыми.
Прогноз рассчитывается в два этапа. На первом – формальном – выявляют
при помощи статистических методов закономерности прошлого развития и
переносят их (экстраполируют) на некоторый период будущего. На втором –
производится корректировка полученного прогноза с учетом результатов
содержательного анализа текущего состояния.
Статистические методы исследования исходят из предположения о
возможности представления уровней временного ряда в виде суммы
нескольких компонент, отражающих закономерность и случайность развития
В виде суммы трех компонент (аддитивная модель):
Y(t) = f(t) + S(t) + U(t) + E(t),
В виде произведения четырех компонент (мультипликативная модель):
Y(t) = f(t) S(t) U(t) E(t),
где f(t) – тренд развития (долгосрочная тенденция или устойчивое,
систематическое изменение процесса в течение продолжительного времени);
S(t) – сезонная компонента;
U(t) – циклическая компонента;
Е(t) – остаточная компонента.
Сезонная компонента характеризует устойчивые внутригодичные
колебания уровней, которые носят периодический или близкий к нему
характер. Она проявляется в некоторых показателях, представленных
квартальными или месячными данными.
В тех случаях, когда период колебаний составляет несколько лет, говорят,
что во временном ряде присутствует циклическая компонента.

2
Тренд, сезонная и циклическая компоненты называются регулярными, или
систематическими компонентами временного ряда. Составная часть
временного ряда, остающаяся после выделения из него регулярной компоненты
представляет собой случайную, нерегулярную компоненту. Она является
обязательной компонентой любого временного ряда, так как случайные
отклонения неизбежно сопутствуют любому экономическому процессу.
Если систематические компоненты временного ряда определены
правильно, то остающаяся после их выделения остаточная последовательность
(ряд остатков) будет случайной компонентой, т.е. будет обладать следующими
свойствами:
– случайностью колебаний уровней остаточной последовательности;
– соответствием распределения случайной компоненты нормальному
закону распределения;
– равенством математического ожидания случайной компоненты нулю;
– независимостью значений уровня случайной последовательности.
Основная цель статистического анализа временных рядов – изучение
соотношения между закономерностью и случайностью в формировании
значений уровней ряда, оценка количественной меры их влияния.
Закономерности, объясняющие динамику показателя в прошлом, используются
для прогнозирования его значений в будущем, а учет случайности позволяет
определить вероятность отклонения от закономерного развития и его
возможную величину.
Проверка адекватности трендовых моделей основана на проверке
выполняемости у остаточной последовательности указанных четырех свойств.
Если не выполняется хотя бы одно из них, модель признается неадекватной;
при выполнении всех четырех свойств модель адекватна. Данная проверка
осуществляется с использованием ряда статистических критериев.

1.2. Анализ временных рядов

3
При анализе временных рядов широко применяются графические методы.
Это объясняется тем, что табличное представление временного ряда (табл. 1) и
описательные характеристики чаще всего не позволяют понять характер
процесса, а по графику временного ряда можно сделать определенные выводы,
которые потом могут быть проверены с помощью расчетов.
Визуальный анализ графика временного ряда позволяет сделать выводы о
следующем:
• наличии тренда и его характере;
• наличии сезонных и циклических компонент;
• степени плавности или прерывистости изменений последовательных
значений ряда после устранения тренда.
Так графический анализ ряда обычно задает направление его дальнейшему
анализу.
Задачу анализа временных рядов существенно упрощает применение
средств Excel.
В среде Excel для анализа временных рядов можно использовать средство
Мастер диаграмм.
Для создания диаграммы с помощью средства Мастер диаграмм
необходимо сначала выделить данные, которые будут отображены на
диаграмме (это необязательная операция, однако она позволит сэкономить
время при работе с Мастером). В выделяемые данные следует включить как
числовые данные, так и их подписи (рис. 1). Excel автоматически распознает
подписи и использует их при построении диаграммы.
Работа с Мастером диаграмм состоит из четырех основных шагов,
выполнение которых рассмотрим на следующем примере.

Пример
Построить график временного ряда Индекс потребительских расходов,
выделить тренд этого временного ряда и построить прогноз на два шага вперед.
Исходные данные по этому временному ряду за 16 месяцев приведены в
таблице 1.
4
Для построения графика временного ряда индекса потребительских
расходов, необходимо выполнить следующие действия.

Таблица 1

Индекс Индекс
№ №
потребительских потребительских
п/п п/п
расходов расходов
1 100 9 108,3
2 98,4 10 109,2
3 101,2 11 110,1
4 103,5 12 110,7
5 104,1 13 110,3
6 107 14 111,8
7 107,4 15 112,3
8 108,5 16 112,9
Шаг 1. Выбрать тип и вид диаграммы во вкладке Стандартные (тип:
График, вид: График с маркерами). Щелкнуть на кнопку «Далее» (рис. 2). На
экране появится диалоговое окно Мастер диаграмм (шаг 2 из 4) источник
данных диаграммы (рис. 3).
Мастер диаграмм

5
Рис. 1. Выделение данных перед началом работы
с Мастером диаграмм

6
Рис. 2. На первом этапе выбирается вид создаваемой диаграммы

Шаг 2. Выбрать и уточнить ориентации диапазона данных и ряда.


Используя вкладку Диапазон данных, можно выполнить следующие операции:
– выбрать (или изменить) диапазон данных листа, используемых для
диаграммы. Если перед началом работы с Мастером диаграмм данные не
были выделены, то, используя это окно, можете выделить их сейчас;
– уточнить ориентацию диапазона данных диаграммы с помощью
переключателей в строках и столбцах. При установке первого из них каждая
строка рабочего листа будет рассматриваться как ряд диаграммы. При
установке второго переключателя в качестве ряда диаграмм будут
рассматриваться столбцы данных.

7
Во вкладке Ряд можно управлять параметрами каждого ряда диаграммы. С
ее помощью можно выполнить следующие операции:
– добавить и удалить ряды;
– присвоить рядам имена;
– выделить (или переопределить) данные, используемые для построения
рядов;
– изменить подписи категории.

Рис. 3. Диалоговое окно Мастера диаграмм на втором шаге

Щелкнуть на кнопку «Далее» (рис. 3). На экране появится диалоговое окно


Мастер диаграмм (шаг 3 из 4): параметры данных (рис. 4).

8
 Шаг 3. Настроить диаграмму. В появившемся диалоговом окне
предлагается большое количество самых различных параметров диаграммы
(рис. 4). Если параметры не изменяются, то используется установленное по
умолчанию значение. Щелкнуть на кнопку «Далее».

Рис. 4. Диалоговое окно Мастера диаграмм на третьем шаге

Рис. 5. Диалоговое окно Мастера диаграмм на четвертом шаге

9
 Шаг 4. Выбрать месторасположение диаграммы (рис. 5). Щелкнуть на
кнопку «Готово».
Диаграмма будет расположена на одном листе с исходными данными (рис.
6). Она внедрена как объект в рабочий лист.

Рис. 6. Результат работы Мастера диаграмм

Excel предоставляет дополнительные возможности по работе с


диаграммами. Наиболее полезной, с точки зрения анализа временных рядов,
представляется возможность создания линий тренда.

10
Для построения линии тренда сначала необходимо исключить сезонную
компоненту. Рассмотрим мультипликативную модель, то есть модель в
которую коэффициент сезонности входит в виде множителя Y(t) = f(t) S(t) U(t)
E(t).
Для проведения анализа рассмотрим данные по объему выпуска машин и
оборудования за шесть лет (данные поквартальные) (таблица 2).
Таблица 2
Производств Коэф.
о Центр сезон Скоррект
машин и Скользящ скольз Y (t ) коэф. Десезона-
t оборуд. средн S (t )= сезон
средн Y (t ) лизация
(млн.руб.) Y^ (t) Si
Y (t )
1 Q1 133311,44       1,14 116509,29
2 Q2 104542,31       0,82 127292,22
3 Q3 131442,74 129272,57 133267,54 0,99 0,98 133753,60
4 Q4 147793,81 137262,50 142929,18 1,03 1,05 140517,00
5 Q1 165271,15 148595,86 154788,85 1,07 1,14 144440,90
6 Q2 149875,75 160981,84 168123,50 0,89 0,82 182490,87
7 Q3 180986,66 175265,16 184236,24 0,98 0,98 184168,54
8 Q4 204927,09 193207,32 199585,83 1,03 1,05 194837,25
9 Q1 237039,80 205964,35 213405,26 1,11 1,14 207164,06
10 Q2 200903,84 220846,18 227518,71 0,88 0,82 244623,41
11 Q3 240514,01 234191,24 234978,23 1,02 0,98 244742,42
12 Q4 258307,32 235765,22 228662,90 1,13 1,05 245589,24
13 Q1 243335,73 221560,58 213419,37 1,14 1,14 212666,47
14 Q2 144085,26 205278,15 197596,17 0,73 0,82 175440,29
15 Q3 175384,30 189914,19 186729,62 0,94 0,98 178467,69
16 Q4 196851,46 183545,06 185895,59 1,06 1,05 187159,24
17 Q1 217859,20 188246,11 191608,96 1,14 1,14 190400,92
18 Q2 162889,49 194971,80 197856,29 0,82 0,82 198336,59
19 Q3 202287,04 200740,78 209688,99 0,96 0,98 205843,40
20 Q4 219927,40 218637,20 221950,71 0,99 1,05 209099,00
21 Q1 289444,85 225264,22 232465,63 1,25 1,14 252964,14
22 Q2 189397,58 239667,04 247622,03 0,76 0,82 230613,22
23 Q3 259898,34 255577,02     0,98 264467,54
24 Q4 283567,31       1,05 269605,53

Проведем анализ тенденции объемов производства машин и


оборудования, пользуясь методом скользящих средних.
При сглаживании уровней ряда методом скользящих средних период
скольжения должен быть равен году, чтобы погасить влияние сезонности, то
11
есть используется 4-членная скользящая (как в примере) или 12-членная
скользящая (при месячных данных). Скользящие средние за 4 квартала
приведены в графе 4 таблицы 2. Однако скользящая средняя с четным
периодом скольжения не относится к конкретному периоду времени, поэтому
чтобы найти сглаженный уровень для конкретного квартала проводится
операция центрирования, то есть находится средняя величина из двух смежных
скользящих средних (см. графу 5 таблицы 2). Сглаженные уровни отражают
объемы производств, в которых погашено влияние сезонности. Сезонные
колебания представлены в графе 6 таблицы 1.
Поскольку анализируются данные за несколько лет, то для каждого
квартала имеем несколько показателей сезонности: в примере по пять для
каждого квартала, чтобы иметь оценку сезонной компоненты для конкретного
квартала необходимо рассчитать среднюю арифметическую простую для
одноименных кварталов. Например, для первого квартала S(t)
=(1,07+1,11+1,14+1,14+1,25)/5=1,14. В итоге показатели сезонности для
мультипликативной модели в нашем примере составили:
ИТОГ
КВАРТАЛЫ 1 2 3 4 О
1,1401 0,8183 0,9792 1,0480
S(t) 5 6 3 5 3,98580

Как видим в 1 и 4 кварталах наблюдается увеличение объемов


производства, а во 2 и 3 – снижение.
Сезонные колебания взаимопогашаются в течение года. Сумма
коэффициентов сезонности при квартальных данных должна равняться 4 (при

4
∑ Si =3 , 99
помесячных – 12), а средняя 1. Так как, в примере i =1 , то требуется

корректировка средних коэффициентов сезонности:


S i=S i⋅sпоправки , где

4
s поправки= 4
∑ Si Si
i=1 , где - скорректированный коэффициент сезонности,

12
s поправки - поправочный коэффициент. В нашем примере коэффициент поправки
для мультипликативной модели составляет 1,003563. Умножив на эту величину
средние коэффициенты сезонности, получим скорректированные

коэффициенты сезонности
S i (см. графу 6 таблицы 2).
ИТОГ
КВАРТАЛЫ 1 2 3 4 О
1,1442 0,8212 0,9827 1,0517
S(t) 1 8 2 9 4,00000

Исключая влияния сезонности (сезонные колебания – регулярно


повторяющиеся снижения уровней динамического ряда внутри года на
протяжении ряда лет) с использованием мультипликативной модели (в
мультипликативной модели уровень динамического ряда рассматривается как
произведение его компонент) получим десезонолизированный объем
производств по исследуемой отрасли (графа 7 таблицы 1), линия тренда
строится по данным, очищенным от сезонности (см. графу 7 таблицы 2).
Рассмотрим построение аддитивной модели той же задачи, то есть
построим модель, в которую сезонная компонента входит в виде слагаемого
Y(t) = f(t) + S(t) + U(t) + E(t),
Таблица 2.1
Производств Скоррект
о Центр Десезона-
Скользящ Коэф. коэф.
машин и скольз лизация
t средн сезонности сезонност
оборуд. средн
S(t )=Y (t )−Y^ (t ) и
(млн.руб.) Y^ (t ) Si Y (t )−Si
Y (t )
1 Q1 133311,44       30142,79 103168,65
2 Q2 104542,31       -37622,70 142165,01
3 Q3 131442,74 129272,57 133267,54 -1824,8 -2966,92 134409,66
4 Q4 147793,81 137262,50 142929,18 4864,628 10446,83 137346,98
5 Q1 165271,15 148595,86 154788,85 10482,3 30142,79 135128,36
6 Q2 149875,75 160981,84 168123,50 -18247,8 -37622,70 187498,45
7 Q3 180986,66 175265,16 184236,24 -3249,58 -2966,92 183953,58
8 Q4 204927,09 193207,32 199585,83 5341,254 10446,83 194480,26
9 Q1 237039,80 205964,35 213405,26 23634,53 30142,79 206897,01
10 Q2 200903,84 220846,18 227518,71 -26614,9 -37622,70 238526,54
11 Q3 240514,01 234191,24 234978,23 5535,776 -2966,92 243480,93
12 Q4 258307,32 235765,22 228662,90 29644,42 10446,83 247860,49

13
13 Q1 243335,73 221560,58 213419,37 29916,36 30142,79 213192,94
14 Q2 144085,26 205278,15 197596,17 -53510,9 -37622,70 181707,96
15 Q3 175384,30 189914,19 186729,62 -11345,3 -2966,92 178351,22
16 Q4 196851,46 183545,06 185895,59 10955,88 10446,83 186404,63
17 Q1 217859,20 188246,11 191608,96 26250,25 30142,79 187716,41
18 Q2 162889,49 194971,80 197856,29 -34966,8 -37622,70 200512,19
19 Q3 202287,04 200740,78 209688,99 -7401,95 -2966,92 205253,96
20 Q4 219927,40 218637,20 221950,71 -2023,31 10446,83 209480,57
21 Q1 289444,85 225264,22 232465,63 56979,22 30142,79 259302,06
22 Q2 189397,58 239667,04 247622,03 -58224,5 -37622,70 227020,28
23 Q3 259898,34 255577,02     -2966,92 262865,26
24 Q4 283567,31       10446,83 273120,48

Центрированные скользящие средние Y^ (t ) найдены аналогично тому,


как было показано в мультипликативной модели.
Поскольку анализируются данные за несколько лет, то для каждого
квартала имеем несколько показателей сезонности: в примере по пять для
каждого квартала, чтобы иметь оценку сезонной компоненты для конкретного
квартала необходимо рассчитать среднюю арифметическую простую для
одноименных кварталов. Например, для первого квартала S(t)=
(10482,3+23634,53+29916,36+26250,25+56979,22)/5=30142,79. В итоге
показатели сезонности для аддитивной модели в нашем примере составили:
КВАРТАЛЫ 1 2 3 4 ИТОГО
29452,5
S(t) 3 -38312,96 -3657,18 9756,57 -2761,03

Как видим в 1 и 4 кварталах наблюдается увеличение объемов


производства, а во 2 и 3 – снижение.
Сезонные колебания взаимопогашаются в течение года. Сумма сезонных

4
∑ Si =−2761 , 03
компонент должна равняться 0. Так как, в примере i=1 , то

требуется корректировка средних коэффициентов сезонности:


S i=S i−sпоправки ,

4
s поправки=∑ Si /4
где i=1 , где S i - скорректированный коэффициент сезонности,

14
s поправки - поправочный коэффициент. В нашем примере коэффициент поправки
для аддитивной модели составляет -690,25675. Прибавляя эту величину к
средним значениям сезонных компонент, получим скорректированные

значения сезонных компонент S i (см. графу 6 таблицы 2.1).


КВАРТАЛ
Ы 1 2 3 4 ИТОГО
30142,7 - 10446,8
Si   9 37622,70 -2966,92 3 0,00

Исключая влияния сезонности (сезонные колебания – регулярно


повторяющиеся снижения уровней динамического ряда внутри года на
протяжении ряда лет) с использованием аддитивной модели (в аддитивной
модели уровень динамического ряда рассматривается как сумма его компонент)
получим десезонолизированный объем производств по исследуемой отрасли
(графа 7 таблицы 2), линия тренда строится по данным, очищенным от
сезонности (см. графу 7 таблицы 2.1).
Итак, метод скользящей средней – один из эмпирических методов для
сглаживания и прогнозирования временных рядов. Абсолютные значения ряда
динамики меняются на средние арифметические значения в определенные
интервалы. Выбор интервалов осуществляется способом скольжения: первые
уровни постепенно убираются, последующие – включаются. В результате
получается сглаженный динамический ряд значений, позволяющий четко
проследить тенденцию изменений исследуемого параметра.
Задачу анализа временных рядов существенно упрощает применение
средств Excel.
Применение надстройки «Пакет анализа»
Для примера возьмем ту же задачу.
На вкладке «Данные» находим команду «Анализ данных». В открывшемся
диалоговом окне выбираем «Скользящее среднее»:

15
Заполняем. Входной интервал – исходные значения временного ряда. Интервал
– число кварталов, включаемое в подсчет скользящего среднего. Так как будем
строить сглаженный временной ряд по данным четырех кварталов, в поле
вводим цифру 4. Выходной интервал – диапазон ячеек для выведения
полученных результатов.

16
Установив флажок в поле «Стандартные погрешности», мы автоматически
добавляем в таблицу столбец со статистической оценкой погрешности.

17
Составлять прогнозы по методу скользящего среднего просто и эффективно.

1.2. Построение линий тренда

Линии тренда строятся для описания закономерности, содержащейся в


исследуемом временном ряду.
Одним из наиболее распространенных способов моделирования тенденции
временного ряда является построение аналитической функции,
характеризующей зависимость уровней ряда от времени или тренда. Этот
способ называется аналитическим выравниванием временного ряда.
Параметры функции, моделирующей тренд, определяют обычными МНК,
используя в качестве независимой переменной время t = 1, 2,…, n, а в качестве
зависимой переменной – фактические уровни временного ряда yt. Для
нелинейных трендов предварительно производят процедуру их линеаризации.
В таблице приведены типы линии тренда, которые можно построить в Excel.

Тип зависимости Уравнение


Линейная Y = аo + a1X
Полиномиальная Y = ao + аlX + а2X2 + ... + а6X6
Логарифмическая Y = a lnX + b
Экспоненциальная Y = aebx
Степенная Y = axb

Для вставки линии тренда в диаграмму нужно выполнить следующие


действия.
1. Щелкнуть правой кнопкой мыши на одном из рядов.
2. Выбрать команду «Добавить линию тренда» (рис. 7) из контекстного
меню. На экране появится диалоговое окно Линия тренда (рис. 8). Вкладка
Тип используется для выбора типа создаваемой линии тренда.
3. Выбрать тип регрессии.

18
При выборе типа Полиномиальная введите значение степени в поле
«Степень» (в поле «Степень», используемом для полиномиального типа,
устанавливается величина порядка регрессии).
Если же вы выбрали тип Скользящее среднее (который не является
регрессией), то введите значение в поле «Точки» (поле «Точки» для
скользящего среднего используется для установки количества точек,
необходимых для вычисления средней величины).
4. Убедиться в том, что ряд, для которого необходимо построить линию
тренда, выделен в списке Построение линии тренда на ряде. Если нет, то
выделите его.

Рис. 7. Выбор команды «Добавить линию тренда»

19
Рис. 8. Диалоговое окно Линия тренда (вкладка тип)

5. Переключиться на вкладку Параметры (рис. 9). Установить остальные


параметры линии тренда.
В разделе Название аппроксимирующей (сглаженной) кривой установить
переключатель автоматическое или другое, после чего введите название в
поле. Это название появится в легенде диаграммы. Если линия тренда создается
с помощью регрессии, т.е. выбран любой тип, кроме скользящего среднего, то в
соответствующих полях можно ввести прогнозируемое количество периодов,
которые будут добавлены к линии тренда впереди или сзади. В случае
необходимости можете установить и остальные параметры (они могут быть
доступны или недоступны в зависимости от выбранного типа регрессии). Так,
можно установить пересечение с осью Y отображение на диаграмме уравнения
или величины достоверности аппроксимации R2 (коэффициент детерминации).

20
Рис. 9. Диалоговое окно Линия тренда (вкладка параметры)

6. Для завершения процесса создания линии тренда щелкнуть по кнопке


ОК.
На рис. 10 приведен результат построения тренда
Y = 97,008 + 1,739 t – 0,0488 t2;
и прогнозирования по тренду для временного ряда «Индекс потребительских
расходов». В качестве аппроксимирующей функции выбран полином второй
степени – парабола, по которой построен прогноз на два шага вперед. Значение
коэффициента детерминации составило:
R2 = 0,9664;
это указывает на то, что весьма большая доля вариации признака Y учтена в
модели.

21
Рис. 10. Результат построения тренда и прогнозирования
по тренду для временного ряда «Индекс потребительских расходов»

Прогнозные значения составляют:

Y(17) = 97,008 + 1,739 17 – 0,0488 172 = 112,4678,


Y(18) = 97,008 + 1,739 18 – 0,0488 182 = 112,4988.

22

Вам также может понравиться