Вы находитесь на странице: 1из 415

Ю.П.

ЛУКАШИН

АДАПТИВНЫЕ
МЕТОДЫ
КРАТКОСРОЧНОГО
ПРОГНОЗИРОВАНИЯ
ВРЕМЕННЫХ
РЯДОВ
Рекомендовано
Учебно-методическим объединением
по образованию в области статистики
в качестве учебного пособия для студентов
высших учебных заведений, обучающихся
по специальности 161700 "Статистика"
и другим экономическим специальностям

МОСКВА
"ФИНАНСЫ И СТАТИСТИКА"
2003
УДК 338.27.015(075.8)
ББК 65.23я73
Л84

РЕЦЕНЗЕНТЫ:
кафедра статистики и эконометрики
Московского государственного университета
экономики, статистики и информатики — МЭСИ
(заведующий кафедрой доктор экономических наук,
профессор B.C. Мхитарян);
Е.М. Четыркин,
доктор экономических наук, профессор

Лукашин Ю.П.
Л84 Адаптивные методы краткосрочного прогнозирования
временных рядов: Учеб. пособие. - М.: Финансы и статисти-
ка, 2003.-416 с : ил.
ISBN 5-279-02740-5
Посвящено построению статистических моделей с переменными
параметрами для прогнозирования нестационарных временных рядов.
Рассмотрены адаптивные модели полиномиальных и стохастических
трендов, сезонных и циклических колебаний, гистограмм, модели се-
мейства ARIMA, ARCH. Приводятся примеры прогнозирования курсов
акций, валют, цен на золото. Материалы пособия апробированы на
занятиях в МЭСИ, МИРБИС и других вузах.
Для студентов, аспирантов, преподавателей экономических вузов,
менеджеров и финансовых аналитиков.

л 1602090000-149 УДК 338.27.016(075.8)


010(01)-2003 ^ 7 6 ~ 2003 ББК65.23я73

I S B N 5-279-02740-5 © ю.П. Лукашин, 2003


ПРЕДИСЛОВИЕ

Данное учебное пособие посвящено одному из совре-


менных направлений статистического анализа и прогнозирова-
ния временных рядов. Важность этого направления не вызывает
сомнения, так как необходимость решения соответствующих за-
дач с помощью адаптивных методов возникает сравнительно час-
то. Адаптивные методы могут применяться для прогнозирования
показателей фондового рынка, денежных потоков, изменений ежед-
невных остатков на складах, в инструментальных кладовых, ма-
газинах. С помощью этих же методов удается описать эволюцию
изменения технико-экономических характеристик изделий и пере-
менных параметров химических процессов, изучить поведение по-
казателя частоты отказов оборудования в зависимости от его воз-
раста. Наконец, названные методы полезны при анализе сезонных
явлений. В ряде случаев эти методы могут с успехом применяться
для прогнозирования макропоказателей. Методы адаптивного про-
гнозирования применяются там, где основной информацией для
прогноза являются временные ряды.
Инструментом прогноза при адаптивном методе служит мо-
дель. Первоначальная оценка параметров этой модели основы-
вается на данных базового (исходного) временного ряда. На ос-
нове новых данных, получаемых на каждом следующем шаге,
происходит корректировка параметров модели во времени, их
а д а п т а ц и я к новым, непрерывно изменяющимся условиям
развития явления. Таким образом, модель постоянно «впитыва-
ет» новую информацию и приспосабливается к ней.
Адаптивные модели изолированных рядов при всей их про-
стоте могут давать более надежные результаты, чем сложные
эконометрические системы уравнений. Так, при существенной
перестройке некоторой экономической структуры (например, под
влиянием научно-технического прогресса, изменений социально-
политических условий и т.п.) эконометрическая модель с посто-
янными параметрами будет экстраполировать существенно ус-
таревшие зависимости. Адаптивная модель в таких же условиях
перманентно приспосабливается и учитывает эти изменения.
3
Здесь уместно сослаться на эксперимент Ч. Нельсона (1972 г.), в
котором сравнивалась точность прогнозов, полученных на осно-
ве эконометрической модели, состоящей из нескольких уравне-
ний, и достаточно простых адаптивных моделей, применявшихся
для прогнозирования нескольких временных рядов. Оказалось,
что для периода, использованного при оценивании параметров
эконометрической модели, последняя показала лучшее прибли-
жение к данным наблюдения, чем адаптивные модели. Однако
за пределом периода наблюдения с помощью эконометрической
модели (с экзогенными реальными данными) полученные резуль-
таты хуже, чем с помощью адаптивных моделей.
Рассматриваемые в данном пособии методы обладают сле-
дующими свойствами:
• они применимы для широкого круга задач;
• адаптивное прогнозирование не требует большого объема
информации, оно базируется на интенсивном анализе инфор-
мации, содержащейся в отдельных временных рядах;
• модель, описывающая структуру показателя и его дина-
мику, как правило, отличается ясностью и простотой матема-
тической формулировки;
• неоднородность временных рядов и их связей находит от-
ражение в адаптивной эволюции параметров или даже струк-
туры моделей.
Вышеизложенное, однако, не означает, что адаптивные мето-
ды и модели могут заменить любые другие виды моделей. Эти
методы пригодны лишь для обработки рядов с умеренными из-
менениями во времени. Они оказываются весьма грубыми при
прогнозировании на большое число шагов вперед. Тем не менее
следует отметить, что в последние годы они получили значитель-
ное развитие, в том числе и благодаря усилиям автора книги.
Начало развития методов адаптивного прогнозирования, по-
видимому, положено работой Ч. Хольта, появившейся в 1957 г.
В ней рассматривалась проблема экспоненциального сглажи-
вания. Наиболее полно этот вопрос был изучен Р.Г. Брауном и
автором данного учебного пособия. В настоящее время имеется
обширная литература, в которой предлагаются различные ме-
тоды и модели, относящиеся к адаптивному прогнозированию.
Цель настоящего издания - обобщить материал, представ-
ленный в многочисленных монографиях и статьях, как отече-
ственных, так и зарубежных. При этом автор выявляет их силь-
ные и слабые стороны, сопоставляет их свойства, базируясь на
экспериментальных расчетах.
4
Безусловный интерес вызывают предложенные автором не-
которые новые подходы: адаптивные измерители корреляции
(гл. 9); комбинирование одновременно нескольких моделей с
различными структурами и переключение с одной на другую в
зависимости от текущих свойств ряда (гл. 5); критерии и мето-
ды оптимизации адаптивной гистограммы (гл.11); применение
принципа адаптивной фильтрации для построения адаптивных
авторегрессионных и многомерных моделей (гл. 3, 8 и 14).
Рассмотрены современные представления о детерминирован-
ном и стохастическом характере тренда и методы статистичес-
кой идентификации типа тренда (критерии Дикки—Фуллера (гл.
12)); понятия интегрированности и коинтегрированности пере-
менных (гл. 13), используемые при спецификации регрессион-
ных уравнений модели. Большое внимание уделено моделям ав-
торегрессии-скользящего среднего, разработанным Дж. Боксом
и Г. Дженкинсом (гл. 7), современным методам их оценивания
(гл. 12), их использованию для моделирования локальных коле-
баний дисперсии остаточного члена уравнения или ошибок про-
гнозов (модели семейства ARCH, GARCH и др. - гл. 14).
Положительным моментом является введение в учебное по-
собие примеров практического применения рассматриваемых
подходов для прогнозирования реальных экономических пока-
зателей: курсов акций, цены на золото, курсов валют (гл. 1,2,5,
7 и 16), кассовых остатков в банковском учреждении (гл. 11),
некоторых макроэкономических показателей (гл. 8). Этому спо-
собствовало сочетание автором научной и практической рабо-
ты и, в частности, сотрудничество с Центральным банком Рос-
сийской Федерации, Внешэкономбанком, Центральной расчетной
палатой, Московской межбанковской валютной биржей.
В учебном пособии нашли отражение научные разработки ав-
тора разных лет (последнее десятилетие представлено в гл. 9-16),
апробированные на международных и российских конференциях,
в процессе преподавания таких дисциплин, как «Эконометрика»,
«Статистические методы прогнозирования», «Прогнозирование
социальных и экономических процессов», «Финансовая матема-
тика», в МЭСИ, МИРБИС и других вузах Москвы.
Это учебное пособие поможет студенту освоить современ-
ные методы статистического прогнозирования, аспиранту и
практику — найти наиболее эффективный метод прогнозирова-
ния, теоретику и разработчику моделей позволит сократить
период ознакомления с достижениями данного направления.

Профессор ЕМ. Четыркин


ВВЕДЕНИЕ
Экономическое прогнозирование характеризу-
ет будущее развитие, исходя из гипотезы, что основные
факторы и тенденции прошлого периода сохранятся на
период прогноза или что можно обосновать и учесть на-
правление их изменений в рассматриваемой перспективе.
Надежды здесь возлагаются на инерционность экономиче-
ских систем. Между тем в большинстве случаев подвиж-
ность экономических явлений возрастает.
Наибольшей инерционностью обладают макроэконо-
мические характеристики. Для параметров, описывающих
процессы, происходящие на уровне отраслей, предприятий,
цехов, характерна большая зависимость от местных усло-
вий. В современных условиях исследователь часто имеет
дело с новыми экономическими явлениями с короткими
статистическими рядами или со старыми явлениями,
претерпевающими коренные изменения, поэтому при ис-
пользовании информации для построения моделей встает
вопрос о преемственности данных. Устаревшие данные при
моделировании часто оказываются бесполезными и даже
вредными. К тому же статистическое описание процесса
редко может удовлетворить, потому что необходимо знать,
не как развивается процесс в среднем, а как будет разви-
ваться его тенденция, существующая в данный момент.
Значит, надо строить модели, опираясь в основном на ма-
лое количество самых свежих данных. В этом случае аль-
тернативой статистическому обоснованию модели может
быть наделение ее адаптивными свойствами.
Направленное развитие экономической системы прокла-
дывает себе путь через единичные явления в условиях
столкновения противоборствующих сил и поэтому обычно
предполагается стохастическим процессом. Для прогно-
зирования стационарных процессов1 математический аппа-
1
Процессы с неизменными основными характеристиками, таки-
ми, как математическое ожидание, дисперсия, автокорреляцион-
ная функция.
6
рат разработан довольно хорошо. Но экономические про-
цессы, как правило, являются нестационарными. Чем боль-
ше период прогноза (упреждения), тем больше возможностей
для изменения тенденций экономического развития, особен-
но в современных условиях. Кроме того, в исследуемом
периоде могут произойти вообще непредвиденные, непред-
сказуемые события, существенно деформирующие изучае-
мый процесс. К непредсказуемым событиям относятся та-
кие, для предвидения которых в момент составления прог-
ноза нет необходимых данных, или такие, природа которых
неопределенна.
В. Н. Тутубалин в работе 132] совершенно справедливо
отмечает широко распространенное заблуждение, согласно
которому если некоторая величина не является детерми-
нированной (т. е. предопределенной), то она может рас-
сматриваться как случайная. Это совершенно неверно,
потому что случайность требует статистической устойчиво-
сти. Таким образом, кроме детерминированных и случайных
величин бывают еще неопределенные. Между тем.матема-
тическая модель может содержать либо детерминированные,
либо случайные величины, либо те и другие вместе, но
при нынешнем состоянии науки не может содержать неоп-
ределенных. Следовательно, искусство построения мате-
матической модели состоит в том, чтобы неопределенные ве-
личины, с которыми приходится иметь дело на практике,
приближенно представить через детерминированные и слу-
чайные. Это значительно затрудняет экономическое прог-
нозирование.
В ряде случаев экономико-математические модели прог-
нозирования могут быть полезным инструментом исследо-
вания. При этом, конечно, для увеличения точности прог-
нозов экономического развития в изменяющихся условиях,
в условиях неопределенности или неполной информации
необходима работа по совершенствованию моделей. Важ-
ную роль в этом должны сыграть адаптивные методы про-
гнозирования. Отличие адаптивных моделей от других прог- •
ностических моделей состоит в том," что они отражают те-
кущие свойства ряда и способны непрерывно учитывать эво-
люцию динамических характеристик изучаемых процессов.
Цель адаптивных методов заключается в построении само-
корректирующихся (самонастраивающихся) экономико-ма-
тематических моделей, которые способны отражать изме-
няющиеся во времени условия, учитывать информацион-
7
ную ценность различных членов временной последова-
тельности и давать достаточно точные оценки будущих
членов данного ряда. Именно поэтому такие модели пред-
назначаются прежде всего для краткосрочного прогно-
зирования.
Отметим различие понятия краткосрочного прогноза
в экономике и статистике. В экономике под краткосрочным
прогнозом обычно пойимают прогноз с периодом упрежде-
ния до одного года. В статистике информацию о процессе
обычно получают в виде записей значений, наблюденных
через равные промежутки времени. Соответственно под
краткосрочным прогнозом, как правило, подразумевается
прогноз на один интервал времени (в крайнем случае на
несколько). Сам же интервал может быть любым. Статис-
тика интересует не величина временного интервала, а объем
выборки, ее однородность и т. п. Именно в этом статисти-
ческом смысле нужно понимать название предлагаемой
книги.
Основным средством анализа и прогноза временного ряда
будет модель. Понятие модель используется в двух значе-
ниях: как модель временного ряда, выражающая закон
генерирования членов ряда, и как прогнозная модель, или
предиктор. Главное отличие этих двух типов моделей в том,
что на выходе модели временного ряда фактические члены
ряда, а на выходе прогнозной модели — оценки будущих
членов ряда. Теоретически свойства предиктора исследуют-
ся в предположении, что он применен для получения прог-
нозов некоего процесса, генерируемого моделью, заданной
аналитически.
На временной ряд воздействуют в разное время различ-
ные факторы. Одни из них по тем или иным причинам ос-
лабляют свое влияние, другие воздействуют активнее. Та-
ким образом, реальный процесс протекает в изменяющихся
условиях, составляющих его внешнюю среду, к которой
он приспосабливается, адаптируется. А модель, в свою оче-
редь, адаптируется к ряду, представляющему этот процесс.
Поскольку мы рассматриваем варьирующие, нестационар-
ные ряды, т. е. ряды, у которых уровень, скорость линей-
ного роста и прочие характеристики не остаются постоян-
ными во времени, модель будет всегда находиться в дви-
жении. Образно говоря, процесс адаптации модели к ряду
можно было бы назвать «гонкой за лидером»,
8
По-видимому, трудно провести четкую грань, отделяю-
щую адаптивные методы прогнозирования от неадаптив-
ных. Уже прогнозирование методом экстраполяции обычных
регрессионных кривых содержит некоторый элемент адап-
тации, когда с каждым новым получением фактических
данных параметры регрессионных кривых пересчитываются,
уточняются. Через достаточно большой промежуток времени
может быть заменен даже тип кривой. Однако здесь степень
адаптации весьма незначительна; к тому же с течением вре-
мени она падает вместе с увеличением общего количества на-
блюденных точек и соответственно с уменьшением в вы-
борке удельного веса каждой новой точки.
Модификацией этого метода является метод кусочно-
линейной аппроксимации, использование которого ведет
к уменьшению «памяти» модели, к «забыванию» старых
данных и построению линий регрессии на искусственно
ограниченном количестве информации. Этот метод лучше
учитывает новые тенденции, быстрее приспосабливается
к изменившимся характеристикам процесса, но зато силь-
нее реагирует на помехи, случайные отклонения и искаже-
ния в связи с уменьшением доли «наследственности». Со-
отношение между «изменчивостью» и «наследственностью»
в кусочно-линейном варианте регрессионного анализа
определяется субъективным выбором интервалов аппрок-
симации. Недостатком является также то, что ценность
информации в пределах интервала аппроксимации считается
одинаковой независимо от возраста, а вне его пределов
скачком падает до нуля,-
Ценность информации в зависимости от возраста можно
учесть с помощью геометрически убывающих весовых ко-
эффициентов (взвешенная регрессия).
Введем веса для квадратов ошибок. Совокупность ве*
совых коэффициентов представляет собой функцию цен-
ности информации от времени. Тогда параметры регрессион-
ных кривых будут отыскиваться из условия

где Т — текущий момент времени;


Хт—1 — фактическое значение процесса в мо-
мент Т — i\
а
Ут~{( ь •••> ап) —значение подбираемой функции в мо-
мент Т — i.
9
Веса ошибок для более ранних моментов времени
уменьшаются по закону убывающей геометрической про-
грессии. Минимум этого выражения достигается при равен-
стве нулю частных производных функционала по а}.
• В данном случае функция ценности информации будет
иметь экспоненциальную форму в отличие от прямоугольной
в случае простого или кусочно-линейного метода построе-
ния регрессионных кривых. Такое взвешивание ошибок
обеспечивает лучший подгон
регрессионной кривой к бо-
лее свежим данным.
Выбор величины ß зави-
сит прежде всего от харак-
тера моделируемого процес-
са, от его динамических
свойств и статистических ха-
рактеристик. Во многом вы-
бор ß зависит от опыта ис-
Рис. 1. Сравнение моделей: следователя. Наилучшее ее
а) обычная линейная регрессия; - З н а ч е н и е МОЖНО уСТЭНОВИТЬ
б) 8 К С П О Н Д а а л ь но^вешенная ли- ЭКСПврИМвНТаЛЬНО МетОДОМ
в) обычная параболическая регрес- п р о б .
Положительным свойст-
вом такой модели является ее
способность лучше приспосабливаться к динамике про-
цесса. Следует подчеркнуть, что если при выборе типа кри-
вой регрессии была допущена ошибка, то в данной модели
она обычно частично компенсируется. Это иллюстрирует
рис. 1,
Вместо параболы ошибочно была взята прямая. В слу-
чае обычной регрессионной модели процесс характеризо-
вался бы прямой (а), в случае экспоненциально-взвешенной
регрессии — прямой. (б). Как видим, прогноз по прямой
(б) будет точнее. Однако такой подход обладает рядом не-
достатков, главными из которых являются субъективность
выбора структуры модели, ее чрезмерная жесткость и в си-
лу этого автокоррелйрованность остатков. Громоздкий
пересчет параметров регрессионных кривых с получением
каждой новой точки требует повторного вовлечения в вычис-
лительную процедуру всего объема информации. Адаптив-
ное моделирование позволяет в известной мере избавить-
ся от этих недостатков,
ю
У истоков адаптивного направления лежит простейшая
модель экспоненциального сглаживания. Модификации и
обобщения этой модели привели к появлению целого се-
мейства адаптивных моделей с различными свойствами.
Остановимся на основных особенностях предлагаемых
вниманию читателя методов адаптивного моделирования.
Прежде всего отметим, что все рассматриваемые модели
имеют жесткий алгоритм поведения. Однако, как известно,
система может быть механистической по своей природе и об-
наруживать тем не менее адаптивные свойства. Адаптация
в данных моделях слагается из небольших дискретных сдви-
гов. В основе процедуры адаптации лежит метод проб и оши-
бок, который совершенно справедливо считается универ-
сальным путем выработки нового поведения. Такой процесс
необходим, ибо только он позволяет извлечь нужную ин-
формацию, без которой успешная адаптация невозможна.
Последовательность процесса адаптации в основном вы-
глядит следующим образом. Пусть модель находится в не-
котором исходном состоянии (т. е. определены текущие зна-
чения ее коэффициентов) и по ней делается прогноз. Выжи-
даем, пока истечет одна единица времени (шаг моделирова-
ния), и анализируем, насколько далек результат, получен-
ный по модели, от фактического значения ряда. Ошибка прог-
нозирования через обратную связь поступает на вход си-
стемы и используется моделью в соответствии с ее логикой
для перехода из одного состояния в другое с целью*боль-
шего согласования своего поведения с динамикой ряда.
На изменения ряда модель должна отвечать «компенсирую-
щими» изменениями. Затем делается прогноз на следую-
щий момент времени, и весь процесс повторяется.
Таким образом, адаптация осуществляется итеративно
с получением каждой новой фактической точки ряда. Одна-
ко каковы должны быть правила перехода системы от од-
ного состояния к другому? Другими словами, какова долж-
на быть «логика механизма» адаптации? В сущности, этот
вопрос решается каждым исследователем интуитивно. «Ло-
гика механизма» адаптации задается априорно, а затем
проверяется эмпирически. При построении, модели "мы не-
избежно наделяем ее «врожденными» свойствами и вместе
с тем для большей гибкости должны позаботиться о меха-
низмах «условных рефлексов», усваиваемых или утрачи-
ваемых с определенной инерционностью. Их совокупность
и составляет «логику механизма» адаптации.
П
Быстроту реакции модели на изменения в динамике про-
цесса характеризует так называемый параметр адаптации.
Процесс «обучения» мрдели состоит, в выборе наилучшего
параметра адаптации на основе проб на ретроспективном
материале. Например, воздействие мощного «раздражителя»
в виде процесса «белого шума»1 с большой дисперсией вызы-
вает у модели адекватную «оборонительную» реакцию. Мо-
дель не адаптируется к «белому шуму», а, наоборот, инерт-
на по отношению к нему, отфильтровывает его. При наличии
тенденции в стохастическом процессе наилучшей реакцией
модели является определенный компромисс между двумя
крайними ситуациями, обеспечивающий отражение тен-
денции и одновременно фильтрацию случайных отклоне-
ний от нее. По тому, насколько хорошо модель поддается
«обучению», можно судить о ее способности адекватно отра-
жать закономерности данного временного ряда. После вы-
бора параметра адаптации самообучение модели происходит
в процессе переработки новых статистических данных.
В силу простоты каждой отдельно взятой модели и ог-
раниченности исходной (входной) информации, зачастую
представленной единственным рядом, нельзя ожидать, что
какая-либо одна адаптивная модель годится для прогно-
зирования любого ряда, любых вариаций поведения. Адап-
тивные модели достаточно гибки, однако на их универсаль-
ность рассчитывать не приходится. Поэтому при построении
и объяснении конкретных моделей необходимо учитывать
наиболее вероятные закономерности развития реального
процесса, динамические свойства ряда соотносить с воз-
можностями модели. Исследователь должен закладывать
в модель те адаптивные свойства, которых, по его мнению,
хватит для слежения модели за реальным процессом с'задан-
ной точностью. Вместе с тем нельзя надеяться на успешную
самоадаптацию модели, более общей по отношению к той,
которая необходима для отражения данного процесса, ибо
увеличение числа параметров придает системе излишнюю
чувствительность, приводит к ее «раскачке» и ухудшению
получаемых по ней прогнозов.
Таким образом, при построении адаптивной модели при-
ходится выбирать между общей и частной моделью • и,
1
«Велым шумом"» называется последовательность независимых
случайных величин ... е*_ 2 , et~i, е* ..., имеющих фиксированное
распределение, которое обычно предполагается нормальным, с ну-
левым математическим ожиданием и дисперсией о|.
12
взвешивая их достоинства и недостатки, отдавать предпо-
чтение той, от которой можно ожидать наименьшей ошиб-
ки прогнозирования. Только при этом условии можно на-
деяться, что последовательность проб и ошибок постепен-
но приведет к наиболее эффективному предиктору. Поэто-
му исследователь должен иметь определенный запас спе-
циализированных моделей, разнообразных по структуре
и функциональным свойствам.
Для сравнения возможных альтернатив необходим кри-
терий полезности модели. Несмотря на то что в общем слу-
чае такой критерий является предметом спора, в случае
краткосрочного прогнозирования признанным критерием
обычно является средний квадрат ошибки прогнозирования.
О качестве модели судят также по наличию автокорреляции
в ошибках. В более развитых системах процесс проб и оши-
бок осуществляется в результате анализа как последова-
тельных во времени, так и параллельных (конкурирую-
щих) модификаций модели. Здесь используется принцип
конкуренции или автоматического отбора (селекции) пре-
диктора по заданному критерию.
Предлагаемая книга начинается с изучения простейших
адаптивных моделей. Показаны пути усовершенствования
их структуры и повышения адаптивных свойств, позволяю-
щие более гибко учитывать особенности динамического ряда.
Проведено эмпирическое сопоставление адаптивных ме-
тодов. В заключение рассмотрены принципы построения
адаптивных моделей многомерных временных рядов.
Глава 1
ПРОСТЕЙШИЕ
АДАПТИВНЫЕ МОДЕЛИ
И ИХ СВОЙСТВА

В главе вводятся некоторые общие понятия и изу-


чаются свойства простейшей адаптивной модели, в основе
которой лежит экспоненциальная средняя.
§ 1. ВРЕМЕННЫЕ РЯДЫ
И СТОХАСТИЧЕСКИЕ ПРОЦЕССЫ

Временной ряд — это множество наблюдений,


получаемых последовательно во времени. Если время из-
меняется дискретно, временной ряд называется дискретным.
Мы будем рассматривать только дискретные временные ряды,
в которых наблюдения делаются через фиксированный ин-
тервал времени, принимаемый за единицу счета. Переход
от момента одного наблюдения к моменту следующего на-
блюдения будем называть шагом.
Если значения членов временного ряда точно определены
какой-либо математической функцией, то временной ряд
называется детерминированным. Если эти значения могут
быть описаны только с помощью распределения вероятно-
стей, временной ряд называется случайным.
Явление, развивающееся во времени согласно законам
теории вероятностей, называется стохастическим процес-
сом. В дальнейшем будем называть его просто процессом.
Анализируемый отрезок временного ряда может рассматри-
ваться как одна частная реализация (выборка) изучаемого
стохастического процесса, генерируемого скрытым вероят-
ностным механизмом.
Среди. стохастических процессов выделяют класс про-
цессов, называемых стационарными. Обозначим член вре-
менного ряда, наблюденный в момент t, через xt. Стохасти-
И
ческий процесс называется стационарным, если его свойства
не изменяются во времени. В частности, он имеет постоян-
ное математическое ожидание "к — М (xt) (т. е. среднее зна-
чение, относительно которого он варьирует), постоянную
дисперсию D (х) — М [(xt — х)Ч = а%, определяющую раз-
мах его колебаний относительно среднего значения, а так-
же постоянную автоковариацию и коэффициенты автокор-
реляции1. Ковариация между значениями xt и xt+ht от-
деленными интервалом в k единиц времени, называется
автоковариацией с лагом (задержкой) k и определяется как

Для стационарных процессов автоковариация зависит толь-


ко от лага k и Rxx (0) = а%. Автокорреляция с лагом k
является лишь нормированной автоковариацией и равна:

так как для стационарного процесса а% — const. Таким


образом, &-й коэффициент автокорреляции p h = ^ У .
Он обладает тем свойством, что — 1 ^ р* < 1.
Для описания временных рядов используются матема-
тические модели. Представим, что временной ряд xt, ге-
нерируемый некоторой моделью, можно представить в виде
двух компонент

где величина st генерируется случайным неавтокоррелиро-


ванным процессом с нулевым математическим ожиданием
и конечной (не обязательно постоянной) дисперсией, а ве-
личина It может быть генерирована либо детерминирован-
ной функцией, либо случайным процессом, либо какой-
нибудь их комбинацией. Величины et и I* различаются ха-
рактером воздействия на значения последующих членов
ряда. Переменная е{ влияет только на значение синхрон-
ного ей члена ряда, в то время как величина lt в известной
степени определяет значение нескольких или всех после-
дующих членов ряда. Через величину lt осуществляется
1
Такие процессы называют стационарными процессами второго
порядка, но, так как другие классы стационарных процессов рас-
сматриваться не будут, мы называем их просто стационарными.
15
взаимодействие членов ряда; таким образом, в ней содер-
жится информация, необходимая для получения прогно-
зов.
Назовем величину %t уровнем ряда в момент /, а закон!
эволюции уровня во времени — трендом. Таким образом,
тренд может быть выражен как детерминированной, так
и случайной функциями, либо их комбинацией. Стохасти-
ческие тренды имеют, например, ряды со случайным уров-
нем или случайным скачкообразным характером роста.
Приведем пример детерминированного тренда:

где аъ а 2 , а3 — постоянные коэффициенты;


t — время.
Пример случайного тренда:

где 1о — некоторое начальное значение;


щ — случайная переменная.
Пример тренда смешанного типа:
=
% «1 + 0-%t + щ + qut _ х + b sin at,
где alt Ö2, q, b, to — постоянные коэффициенты;
ut — случайная переменная.
Известно множество определений уровня и тренда ряда
(см. [34, с. 161), отличных от принятых нами. Существую-
щие понятия тренда противоречивы и имеют условный ха-
рактер .^ Каждое из этих определений скорее указывает на
частный способ оценки трендау а не на его сущность. Очень
часто под трендом понимают детерминированную состав-
ляющую процесса, что значительно обедняет содержание
термина и препятствует его применению для анализа вре-
менных рядов в общем случае.
Компоненты временного ряда lt и e f ненаблюдаемы.
Они являются теоретическими величинами. Их выделение
и составляет предмет анализа временного ряда в задаче
прогнозирования. Оценку будущих членов ряда обычно
делают по прогнозной модели. Прогнозная модель —- это
модель, аппроксимирующая тренд. Прогнозы — это оцен-
ки будущих уровней ряда, а последовательность прогнозов
для различных периодов упреждения т = 1, 2, .... k со-
ставляет оценку тренда.
16
При построении прогнозной модели выдвигается гипо-
теза о динамике величины %, т. е. о характере тренда.
•Однако в связи с тем, что уверенность в гипотезе всегда
относительна, рассматриваемые нами модели наделяются
адаптивными свойствами, способностью к корректировке
исходной гипотезы или даже к замене ее другой, более адек-
ватно (с точки зрения точности прогнозов) отражающей
поведение, реального ряда.
Простейшая адаптивная модель основывается на вы-
числении так называемой экспоненциальной средней, к изу-
чению которой мы переходим.

§ 2. ЭКСПОНЕНЦИАЛЬНОЕ СГЛАЖИВАНИЕ

Предположим, что исследуется временной рядя*.


Выявление и анализ тенденции динамического ряда часто
производится с помощью его выравнивания или сглажива-
ния. Экспоненциальное сглаживание — один из простейших
и распространенных приемов выравнивания ряда. В его
основе лежит расчет экспоненциальных средних.
Экспоненциальное сглаживание ряда осуществляется
по рекуррентной формуле
(1Л)
где St — значение экспоненциальной средней в момент t;
а — параметр сглаживания, а — const, О <С а •< 1;
ß = 1 — а.
Выражение (1.1) можно переписать следующим образом:
(1.2)
Экспоненциальная средняя на момент t здесь выражена
как.экспоненциальная средняя предшествующего момента
плюс доля а разницы текущего наблюдения и экспоненци-
альной средней прошлого момента.
Если последовательно использовать рекуррентное со-
отношение (1.1), то экспоненциальную среднюю St можно
выразить через значения временного ряда х\

17
где N — количество членов ряда;
So — некоторая величина, характеризующая началь-
ные условия для первого применения формулы
(1.1) при * = 1.
Так как ß < 1, то при N ->- оо ß w -> 0, а сумма коэф-
фициентов

Таким образом, величина St оказывается взвешенной


суммой всех членов ряда. Причем веса падают экспонен-
циально в зависимости от давности («возраста») наблюде-
ния. Это и объясняет, почему величина St названа экспо-
ненциальной средней. Если, например, а = 0,3, то теку-
щее наблюдение будет иметь вес 0,3, а веса предшествую-
щих данных составят- соответственно 0,21; 0,147; 0,1029
и т. д.
Рассмотрим, ряд, генерированный моделью
щ = аг + е„
где ai — const;
zt — случайные неавтокоррелированные отклонения,2
или шум, со средним значением 0 и дисперсией а .
Применим к нему процедуру экспоненциального сгла-
живания (1.1). Тогда

Найдем математическое ожидание

и дисперсию

(1.4)

Так как 0 < а < 1, D (St) < D (xt) к» о 8 .


18
Таким образом, экспоненциальная средняя St имеет то
же математическое ожидание, что и ряд х, но меньшую дис-
персию. Как видно из (1.4), при высоком значении а дис-
персия экспоненциальной средней незначительно отличает- '
ся от дисперсии ряда х. Чем меньше а, тем в большей сте-
пени сокращается дисперсия экспоненциальной средней.
Следовательно, экспоненциальное сглаживание можно пред-
ставить как фильтр, на вход которого в виде потока после-
довательно поступают члены исходного ряда, а на выходе
формируются текущие значения экспоненциальной средней.
И чем меньше а, тем в большей степени фильтруются, по-
давляются колебания исходного ряда.
После появления работ Р. Брауна [47, 48] экспонен-
циальная средняя часто используется для краткосрочного
прогнозирования. В этом случае предполагается, что ряд
генерируется моделью

где . alt t — варьирующий во времени средний уровень ряда;


et — случайные неавтокоррелированные отклоне-
ния с нулевым8 математическим ожиданием
и дисперсией а .
Прогнозная модель имеет вид

где х% (t) — прогноз, сделанный в момент t на т единиц


времени (шагов) вперед;
alt t — оценка at t (знак Д над величиной здесь
и далее Йудет означать оценку).
Средством оценки единственного параметра модели слу-
жит экспоненциальная средняя а1( t = St. Таким образом,
все свойства экспоненциальной средней распространяются
на прогнозную модель. В частности, если St^t рассма-
тривать как прогноз на 1 шаг вперед, то в выражении (1.2)
величина (xt — St _ г) есть погрешность этого прогноза,
а новый прогноз St получается в результате корректировки
предыдущего прогноза с учетом его ошибки. В этом.и со-
стоит существо адаптации.
При краткосрочном прогнозировании желательно как
можно быстрее отразить •изменения аи < и в то же время как
можно лучше «очистить» ряд от случайных колебаний.
19
' Таким образом, с одной стороны, следует увеличивать
вес более свежих наблюдений, что может быть достигнуто
повышением а (см. (1.3)), с другой стороны, для сглажива-
ния случайных отклонений величину а нужно уменьшить.
Как видим, эти два требования находятся в противоречии.
Поиск компромиссного значения а составляет задачу оп-
тимизации модели.
Для уяснения процедуры расчета экспоненциальной
средней и ее свойств рассмотрим числовой пример сглажи-
вания ряда курса акций фирмы ИБМ 1 (см. табл. 1.1).
Т а б л и ц а 1.1
Экспоненциальные средние*

ены ряда**
ены ряда**

от Р~ *•« 1Л о>
= 0,5

о т
о
II
о
II 8| о
II
О
II
II II II Р* пII II II
0 а 8 в
а
1 510 506,4 508,0 509,6 16 512 505,7 513,3 513,1
2 497 505,5 502,5 498,3 17 510 506,1 511,7 510,3
3 504 505,3 503,2 503,4 18 506 506,1 508,8 506,4
4 510 505,8 506,6 509,3 19 515 507,0 511,9 514,1
5 509 506,! 507,8 509,0" 20 522 508,5 517,0 621,2
6 503 505,8 505,4 503,6 21 523 509,9 520,0 522,8
7 500 505,2 502,7 500,4 22 527 511,6 523,5 526,6
8 500 504,7 501,4 500,0 23 523 512,8 523,2 523,4
9 500 504,2 500,7 500,0 24 528 514,3 525,6 527,5
10 495 503,3 497,8 495,5 25 529 515,8 527,3 528,9
11 494 502,4 495,9 494,2 26 538 518,0 532,7- 537,1
12 499 502,0 497,5 498,5 27 539 520,1 525,8 538,8
13 502 502,0 499,7 501,2 28 541 522,2 538,4 540,8
14 509 502,7 504,4 508,3 29 543 524,3 540,7 542,8
15 525 505,0 514,7 523,3 30 541 525,9 540,9 541,2
* Во всех случаях начальное значение экспоненциальной средней было
1 " x ss e
принято "равным ~Т~ ^ t ^-
** См. приложение Л» 4.
1
Свойства сглаживания особенно наглядно проявляются при
значительной колеблемости исходных данных. В связи с этим для
иллюстрации взят один из показателей, отражающий конъюнк-
т
УР"Ь1е колебания американской экономики, - курс акций фирмы
ИБМ, производящей электронно-вычислительные машины. Этот вре-
менной ряд уже использовался для испытания некоторых адаптив-
ных моделей Р.Г. Брауном, из работы которого [47] он и взят.
20
ö
Определим S0KaK-i 2 * * = j (510 + 497 + 504 + 510 +
+ 509) = 506. Дальнейшие вычисления при а = 0,1 вы-
глядят следующим образом:
S t =.<*#! + (1 — a) S o = 0,1 • 510 + 0,9 • 506 = 506,4;
5 2 = ахг + (1 — а) S x = 0,1 • 497 + 0,9 .- 506,4 =
= 505,46;
5 3 = ах9 + (1 — а) S a = 0,1 • 504 + 0,9 • 505,46 =
= 505,31 и т. д.
Результаты вычислений экспоненциальных средних при
а = 0,1, а = 0,5 и а = 0,9 приведены в табл. 1.1.
На рис. 1.1 изображен график динамики временного
ряда и экспоненциальных средних при а = 0,1 и а = 0,5.
На графике наглядно проявляется влияние величины а на
подвижность экспоненциальной средней.

Рис. 1.1. Экспоненциальное сглаживание времен-


ного ряда

Экспоненциальное сглаживание является простейшим


вариантом самообучающейся модели. Вычисления просты
и выполняются итеративно. Они требуют даже меньше
21
арифметических операций, чем скользящая средняя, а мас-
сив прошлой информации уменьшен до одного значения
5 t _ i . Такую модель будем называть адаптивной экспо-
ненциального типа, а величину а — параметром адапта-
ции. Ниже продолжим изучение ее свойств.

§ 3. НАЧАЛЬНЫЕ УСЛОВИЯ
ЭКСПОНЕНЦИАЛЬНОГО СГЛАЖИВАНИЯ

Экспоненциальное выравнивание всегда требует


предыдущего значения экспоненциальной средней. Когда
процесс только начинается, должна быть некоторая вели-
чина 5 0 , которая может быть использована в качестве зна-
чения, предшествующего Sv Если есть прошлые данные
к моменту начала выравнивания, то в качестве начального
значения So можно использовать арифметическую среднюю
всех имеющихся точек или какой-то их части. Когда для
такого оценивания So нет данных, требуется предсказание
начального уровня ряда.
Предсказание может быть сделано исходя из априорных
знаний о процессе или на основе его аналогии с другими про-
цессами. После k шагов вес, придаваемый начальному зна-
чению, равен (1 — a)k. Если есть уверенность в справедли-
вости начального значения S o , то можно коэффициент а
взять малым. Если такой уверенности нет, то параметру а
следует дать большое значение, с таким расчетом, чтобы
влияние начального значения быстро уменьшилось. Однако
большое значение а, как это следует из (1.4), может явиться
причиной большой дисперсии колебаний St. Если требуется
Подавление этих колебаний, то после достаточного удале-
ния от начального момента времени величину а можно уба-
вить.
Рассмотрим роль параметра а в начальный период сгла-
живания в случае, когда нет уверенности в справедливости
выбора начальной величины S o .
Как видно из табл.,-1.2, составленной для значения
а = 0,1, начальная величина So в течение длительного
времени'имеет чрезмерный вес. Даже после 20 итераций
вес 5 0 равен 0,122, что означает, что ему дается все еще боль-
ший вес, чем любому другому члену ряда. Таким образом,
в этом случае получение прогнозов по экспоненциальной
средней, построенной на малом отрезке ряда (выборке),
чревато большими ошибками. Для того чтобы элиминиро«
22
Т а б л и ц а 1.2
Изменение весов в начальный период времени
при экспоненциальном сглаживании с а=0,1

Вес Вес чет-


Вес началь- Вес первого Вес .второго
Итерация третьего вертого
ной величины члена ряда члена ряда члена ряда члена ряда

1 0,900 0,100
2 0,810 0,090 0,100
3 0,729 0,081 0,090 0,100
4 0,656 0,073 0,081 0,090 0,100

вать избыточный вес, приданный начальной величине,


Р. Вейд [106] предлагает модифицировать процедуру сгла-
живания следующим' образом.
Для исходного момента времени запишем:

где S o — как и раньше, начальная оценка уровня ряда.


Так как коэффициенты а и а (1 — а) в сумме теперь
не дают 1, то следует использовать множитель, равный еди-
нице, деленной на сумму коэффициентов. Таким образом,
модифицированной экспоненциальной средней для t — 1
будет

По табл. 1.3 можно видеть, что сущность этого метода


состоит в том, чтобы убрать избыточный вес от веса, давае-
мого начальному значению 50» и распределить его пропор-
ционально по всем членам ряда. Прогнозы, получаемые
23
Таблица 1.3
Изменение весов в начальный период времени
• при а = 0 , 1 в модифицированной модели

Вес чет-
'Вес началь- Sec первого Вес второго Вес третье- вертого
Итерация ной величины го члена • члена
члена ряда члена ряда
ряда ряда

1 ; 0,474 0,526
2 0,299 0,332 . 0,369
3 : 0,212 0,236 0,262 0,291
4 0,160 0,178 0,198 0,220 0,244

по соответствующей модифицированной модели, основы-


ваются в большей степени на фактических данных, чем на
предварительной оценке 5 0 даже,при малых выборках.
Для того чтобы сократить время вычислений, целесообразно
.вернуться к обычному экспоненциальному сглаживанию,
когда сумма коэффициентов 2 а (1 — а)' приближается
к 1. На основе эмпирического анализа Р. Вейд рекомендует
осуществлять такой переход при сумме коэффициентов
0,995. При заданном значении а можно заранее определить,
на каком шаге следует вернуться к обычной модели.

§ 4. ВЫБОР ПОСТОЯННОЙ СГЛАЖИВАНИЯ

Выбору величины постоянной сглаживания сле-


дует уделять особое внимание. Поиски должны быть на-
правлены на отыскание оснований для выбора наилучшего
значения. Нужно учитывать условия, при которых эта вели-
чина должна принимать значения, близкие то одному край-
нему значению, то другому. Нетрудно заметить, что при
а — 0 St*=S0 представляет случай абсолютной фильтрации
и полного отсутствия адаптации, а при а = 1 приходим
к так называемой наивлой модели хх (/) = S, = хи в со-
ответствии с которой прогноз на любой срок равен теку-
щему фактическому значению ряда. На практике эта модель
нз
"3а простоты пользуется особой популярностью.
В § 2 уже отмечалось, что постоянная сглаживания ха-
рактеризует скорость реакции модели хх (t) =* St на изме-
нения уровня процесса, но одновременно определяет и спо-
•44
собность системы. сглаживать случайные отклонения. По-
этому величине а следует давать то или иное промежуточное
значение между 0 и 1 в зависимости от конкретных свойств
динамического ряда.
В,качестве удовлетворительного компромисса Р. Браун
рекомендует брать а в пределах от 0,1 до 0,3. Эта рекомен-
дация некритически повторена в ряде работ. Между тем
в [5] показано, что даже при прогнозировании ряда, исполь-
зованного Брауном для иллюстрации, наилучшие резуль-
таты получаются при а = 0,9. Наш опыт работы с эконо-
мическими рядами показывает, что наибольшая точность
прогнозирования может быть достигнута при любых допус-
тимых значениях а. Однако, как правило, если в резуль-
тате испытаний обнаружено, что наилучшее значение кон-
станты а близко к 1, следует проверить законность выбора
модели данного типа. Часто к большим значениям а приво-
дит наличие в исследуемом ряде ярко выраженных тенден-
ций или сезонных колебаний. В этом случае для получения
эффективных прогнозов требуется другая модель.
Ясно, что наилучшее значение а в общем случае должно
зависеть от срока прогнозирования х. Для конъюнктурных
прогнозов в большей мере должна учитываться свежая -ин-
формация. При увеличении периода упреждения х более
поздняя информация, отражающая последнюю конъюнкту-
ру, должна, по-видимому, иметь несколько меньший вес,
чем в случае малых t . Для того чтобы сгладить конъюнктур-
ные колебания, следует в большей мере учитывать информа-
цию за прошлые периоды времени. Для проведения подоб-
ного анализа вводят понятие среднего возраста данных.
Возраст текущего наблюдения равен 0, возраст предыдуще-
го наблюдения равен 1 и т. д. Средний возраст — это сумма
взвешенных возрастов данных, использованных для под-
счета сглаженной величины. Причем возраста имеют те же
веса, что и соответствующая информация. При экспонен-
циальном выравнивании вес, даваемый точке с возрастом
k, равен aß*, где ß = 1 — а и средний возраст информации
равен:

Таким образом, чем меньше а, тем больше средний воз-


раст информации. Для конъюнктурных прогнозов значение
25
а как правило, надо брать большим, а для более долгосроч-
ных—малым. Это положение иллюстрирует рис. 1.2,
на котором, отображена . зависимость стандартной ошибки
прогнозирования, обычно принимаемой за показатель точ-
ности, от а. Однако характер зависимостей, аналогичных
тем, что отражены "На рисун-
ке, следует изучать специаль-
но в каждом конкретном
случае.
Теоретический анализ про-
блемы выбора постоянной
сглаживания при примене-
нии простейшей экспоненци-
альной модели для прогнози-
рования стационарного про-
Рис. 1.2. . Примерная зависи- цесса с автокорреляционной
мость среднёквадрат'ической функцией вида p fe = р*. где
ошибки прогноза от величины Pi — коэффициент автокорре-
постоянной сглаживания а и ляции при лаге 1, k—лаг,
периода упреждения х
проведен Д. Р. Коксом [53] и
Дж. Д. Кохеном [52].
Они показали, что минимум среднего квадрата ошибки
при прогнозировании такого ряда на 1 шаг вперед (т = 1)
будет при

(1.5)

Соответствующая дисперсия ошибки прогноза равна:

Табл. 1.4 показывает соотношения между p l t а о п т и точ-


ностью прогнозирования на 1 шаг вперед.
Табл. 1.5 показывает, что для данной .pi величина De
при тг ===== 1 слабо зависит от а, так что точность прогноза
в некоторой окрестности а о п т нечувствительна к выбору
постоянной сглаживания.
Результат (1.5)' означает, что если р х > 1/3, то при со-
ответствующем выборе величины а экспоненциальная сред-
няя в определенной степени, отражает колебания, связан«
26.
Таблица 1.4
Соотношения между pi, а О пт. DC/G%
при прогнозировании стационарного процесса с р л = р *
по модели экспоненциального сглаживания ( т = 1 )

Pi ССопт VI 1 ССовт

<1/3 0 1 0,7 • 0,786 0,581


0,4 0,250 0,980 0,8 0,875 0,395
0,5 0,500 0,889 0,9 0,944 0,199
0,6 0,667 0,750 0,95 0,974 0,100

Таблица 1.5
Dc/a% как функция от а при pi>l/3

OS Pi = 0,4 Pi = 0,7 p, = 0,9 a p, = 0,4 Pt = 0,7 Pi = 0,9

1 1,200 0 ,600 0,200 0,4 0,987 0, 647 0,272


0 ,9 1,136 0 ,587 0,200 0,3 0,980 0, 692 0,318
0 i8 1,087 0 ,581 0,203 o;2 0,980 0, 758 0,397
0 ,7 1,049 0 ,584 0,211 0,1 0,987 0, 853 0,554
0 ,6 1,020 0 ,595 0,223 0 1,000 1, 000 1,000
0 ,5 1,000 0 ,615 0,242 «опт 0,980 o, 581 0,200

ные сильной автокорреляцией. С другой стороны, если


Pi ^ 1/3, то наибольшее, что может дать простейшая мо-
дель, это оценка среднего уровня, вокруг которого варьи-
рует процесс. Но и при pi^l/З на практике не следует брать
а слишком малым, иначе предиктор окажется нечувстви-
тельным к изменениям среднего уровня.
Определенным руководством при этом может служить
табл. 1.6, которая характеризует дисперсии ошибок, полу-
чаемых
с
при прогнозировании стационарных процессов
Рь — Pi> где рА ^ 1 / 3 . Из таблицы видно, что при
Pi < 0 можно добиться немногого, полагая а меньше
0,1—0,2. Вообще говоря, очевидно, что если'р1<0, то
простейшая модель экспоненциального типа не является
хорошим предиктором.
Если т > 1, то существенно повышается критическая
величина р1КРИт» ниже которой оптимальное значение а
равно 0. Этот факт иллюстрирует табл. 1.7.
27
Таблица 1.6
Дисперсия ошибки прогноза
для стационарного процесса с рк=р£.
гдер!<1/3, т = 1

р,=1/3 | Р.=1/Ю | р,=0 | Р.=-1/4 | Pi=—1/2

0 1,000 1,000 1,000 1,000 1,000


0,05 1,001 1,020 1,026 1,036 1,043
0,10 1,002 1,041 1,053 1,074 1 1,089
0,20 1,011 1,087 1,111 1,157 1,190
0,30 1,022 1,139 1,176 1,252 1,307
0,40 1,042 1,197 1,250 1,359 1,442
0,50 1,067 1,263 1,333 1,481 1,600

Таблица 1.7
Зависимость pi крит от т

т• 1 2 3

pi крит 0,333 0,516 • 0,821

Рис. 1.3. Влияние а на точность прогнозирования при одно-


кратном экспоненциальном сглаживании данных с р к = 0 , 9 1 Л 1
28
Рис. 1.3 показывает стандартную ошибку прогнозиро-
вания для всех значений постоянной сглаживания в случае
стационарного процесса с сильной автокорреляцией pk =
= 0 , 9 ' Ч т. е. автоковариацией Rxx (k) = о% (0,9)1 *'.
Пунктирная линия выделяет геометрическое место то-
чек решений, которые минимизируют ошибку прогнозиро-
вания. Отсюда можно сделать вывод, что если данные сильно
коррелированы и период упреждения т мал, то сглаживать
не стоит. Целесообразно в качестве прогноза использовать
наиболее позднее наблюдение.

§ 5. РЕАКЦИЯ МОДЕЛИ
НА НЕКОТОРЫЕ СТАНДАРТНЫЕ
ВХОДНЫЕ ПОТОКИ ДАННЫХ

Рассмотрим, каковы реакции модели экспонен-


циального сглаживания на некоторые стандартные входные
потоки, содержащие типичные нарушения стационарности,
и как сказывается на этих реакциях величина постоянной
сглаживания. Такие входные потоки носят абстрактный
характер, однако проводимый с их помощью анализ позво-
ляет глубже изучить адаптивные свойства модели.

Реакция на импульс
Первым и наиболее важным тестом является импульс
(дельта-функция Кронекера):
xt = б (/) или х0 — 1; xt = 0 при t Ф 0.
Одиночные импульсы представляют собой события, вы-
званные посторонними для изучаемого явления причинами.
В экономике импульс отражает разовое явление, имеющее
место лишь в данный момент времени. В общем случае тре-
бование к прогнозирующей системе состоит в том, чтобы
ее реакция на импульс была как можно слабее, ибо дейст-
вие импульса кратковременно и не будет проявляться в бу-
дущем. Эта реакция характеризует фильтрующие свойства
системы.
Реакция на импульс является функцией времени ht.
Она описывает выход системы через t единиц времени после
поступления единичного импульса на вход. Любой дискрет-
ный временной ряд можно рассматривать как серию импуль-
сов соответствующей амплитуды. Если реакция линейной
29
системы на единичный импульс есть ки то ее реакция на
последовательность импульсов х в момент t определяется
как результат сложения реакций на каждый импульс, т. е.
как сумма:
(1.6)

Рис. 1.4. Реакции простейшей прогнозной мо-


дели экспоненциального типа на единичный им-
пульс в зависимости от постоянной сглажива-
ния а при т=2 (дискретные значения соеди-
нены плавной линией)

Реакция модели экспоненциального сглаживания, как


известно, является линейной функцией членов временного
ряда и имеет вид
(1.7)

Из сопоставления (1.6) и (1.7) следует, что ht = aß'.


Таким образом, можно говорить или о весах, с которыми
взвешиваются члены ряда, или о реакции на единичный
импульс. Любая дискретная система, выражаемая с помо-
щью линейных уравнений в конечных разностях с постоян-
ными коэффициентами, может быть исчерпывающе описана
с помощью ее реакции на единичный импульс.
На рис. 1.4 изображены реакции на единичный импульс
прогнозной модели экспоненциального типа с различными
постоянными сглаживания при т = 2. В этой модели теку-
щее значение экспоненциальной средней относится на
момент t + т, для которого составляется прогноз. На ри-
сунке видно, что модель с большей постоянной сглаживания
реагирует на импульс сильнее, а этот эффект нежелателен.
30
Реакция на ступенчатое изменение
При наличии существенных долговременных изменений
структуры ряда необходимо добиваться, чтобы модель учи-
тывала их как можно быстрее. Рассмотрим прежде всего
ступенчатое изменение уровня входного потока. Запишем
его аналитически:

В экономических исследо-
ваниях ступенчатое измене-
ние может отражать резкое
изменение уровня производ-
ства, спроса или потребле-
ния какого-либо товара в ре-
зультате поворота моды, внед-
рения значительного науч- Рис. 1.5. Влияние а на скорость
ного открытия, изменения реакции прогнозной
т=3
модели при
политической или внешнеэко-
номической ситуации.
Единичный ступенчатый скачок является следующей
функцией:

Так как рассматриваемая процедура сглаживания-явля-


ется линейной, то можно определить реакцию на такого рода
изменения с помощью реакции на единичный' импульс.
Реакция модели будет

С ростом t член ß'+i становится незначительным и ве-


личина St приближается к уровню xt.
На рис. 1.5 показана реакция модели экспоненциальной
•средней на ступенчатый скачок при различных значениях
постоянной' сглаживания (т — 3). Здесь, как видим, для
скорейшего отражения произошедших изменений выгоднее
брать большее значение с*.
31
Реакция на линейную.и квадратическую функции
Временные экономические ряды часто имеют тенденцию
линейного или параболического роста. Можно показать,
что при линейно-нарастающем входном потоке ах + a2t экс-
поненциальная средняя будет постоянно отставать от вре-
менного ряда и что это отставание в конце концов стремится
к величине - а 2 , т. е. чем больше а, тем меньше отставание.
При квадратическом входном потоке типа at + a3t 4-
+ сф экспоненциальная средняя отстает от временного
ряда все больше и больше. Наименьшее отставание будет
при а « 1 .
При прогнозировании в этих обоих случаях нельзя от
модели экспоненциальной средней ожидать хороших прог-
нозов. Для таких временных рядов требуются другие модели,
которые мы рассмотрим ниже.
В сводной табл. 1.8 приведены реакции экспонен-
циальной средней на рассмотренные входные потоки.
Таблица 1.8
Реакции экспоненциальной сродней
на стандартные входные потоки

ВХОДНОЙ ЛОТОК Xf Экспоненциал ьная Установившаяся


средняя Sj ошибка Xfjc—Sco

Импульс xt = 6(t) aß' 0

Ступенчатый скачок
„ Г(Н<0, l-ß'+l 0
*<-{i />о
Линейный рост
хгЫ, feß
JL
a

Парабола 2
xt*=>t , Q>0
a • aa

Приведенные реакции простейшей модели на входные


ряды, представляющие типичные нарушения стационар-
ности, говорят о противоречивых требованиях к постоян-
32
ной сглаживания в задаче прогнозирования. Это свидетель-
ствует о существовании оптимального значения а,-которое
зависит от того, какой тип изменений в процессе встречает-
ся наиболее часто. Кроме того, из табл. 1.8 следует, что
даже когда адаптивная модель становится неадекватной
исследуемому ряду, она все же в какой-то мере учитывает
реальные изменения, хотя в этом случае лучше всего заме-
нить модель.

Реакция на синусоидальную волну


Во многих случаях временные ряды по.своей природе
являются периодическими. Браун показал, что реакция экс-
поненциальной средней на входной поток xt — sin ~ будет:

Рис. 1.6. Прогнозирование синусоидальных


колебаний с помощью экспоненциального
сглаживания

где фазовый угол ф определяется из соотношения

Первое слагаемое стремится к нулю с течением време-


ни, и в результате экспоненциальная средняя будет также
изменяться по синусоиде того же самого периода, но с ам-
плитудой и угловым сдвигом, зависящими от а. Реакция на
синусоидальную волну показана на рис. 1.6.
33
При определенных значениях т и а ряд xt и его прогно-
зы по экспоненциальной средней могут оказаться колеблю-
щимися в противофазе, что приведет кочень большим ошиб-
кам. Как предиктор синусоидальных процессов данная мо-
дель совершенно неудовлетворительна.

§ 6. СВОЙСТВО ОПТИМАЛЬНОСТИ

Главное достоинство прогнозной модели, осно-


ванной на экспоненциальной средней, которре мы устано-
вили, состоит в том, что она способна последовательно адап-
тироваться к новому уровню процесса без значительного
реагирования на случайные отклонения. Однако целесооб-
разно определить статистические свойства таких временных
рядов, по которым этот метод прогнозирования рабо-
тает особенно хорошо. В результате можно будет лучше
судить о сфере применения этого метода или модифициро-
вать его в том случае, когда необходимые свойства у времен-
ного ряда отсутствуют.
Первым этот вопрос исследовал Д . Мат [84]. Он взял
временной ряд х, генерированный математической моделью
(Ь8)
где &i — случайные независимые отклонения со средним
значением 0 и дисперсией <г|;
It — величина, получающая на каждом шаге некото-
рые приращения ии т. е.

где величины щ независимы, имеют среднее значение 0 и


дисперсию а%.
Значения величин е й « пока предполагаются независи-
мыми. Такой временной ряд можно рассматривать как слу-
чайное движение уровня процесса %, на которое наложен
шум et.
Д. Мат поставил задачу отыскать оптимальные веса
a>Ä в предикторе вида

(1.9)
34
которые минимизируют дисперсию ошибки прогноза ряда
(1.8). Он пришел к выводу, что оптимальными весами в мо-
дели (1.9) будут:

Веса имеют ту же самую форму, что и в модели экспо-


ненциальной средней, определяемой выражением

если положить а = 1 — К. Следовательно, модель экспо*


ненциальной средней в данном случае является оптималь-
ной при

Если дисперсия приращений уровня аЦ мала по срав-


нению с дисперсией шума о|, то а будет близка к 0. Прог-
нозы в таком случае мало зависят от новой информации.
Низкое значение а обеспечивает хорошую фильтрацию шу:
ма. И наоборот, если ol велика по сравнению с дисперсией
шума, то а будет близка к 1, так что вес новой информации
возрастет,
В том случае, если е й « коррелированы и

необходимо только в выражении для <* заменить отношение

§ 7. МОДЕЛИ ЛИНЕЙНОГО РОСТА

В §5 было показано, что экспоненциальная


средняя приводит к смещенным прогнозам, т. е. дает систе-
матическую ошибку, когда временной ряд имеет тенденцию
линейного роста. Для этого случая разработано несколько
вариантов адаптивных моделей, также использующих про-
00
цедурУ экспоненциального сглаживания. В основе моделей
лежит гипотеза о том, что прогноз может быть получен по
уравнению

где ßlf t, aZit — текущие оценки коэффициентов адаптив-


ного полинома первого порядка.
Одной из первых моделей этого типа была двухпараме-
трическая модель Ч. Хольта [68], в которой оценка коэф-
фициентов производится следующим образом:

(1.10)

где ах и а а — параметры экспоненциального сглаживания


(0 < а ъ а 2 < 1), которые мы также будем называть пара-
метрами адаптации.
Эти уравнения могут быть переписаны в виде:

где et — xt —- Хх (t — 1) — ошибка прогноза.


Частным случаем модели Хольта является модель ли-
нейного роста Брауна:

(1.11)

где параметр ß •— коэффициент дисконтирования, характе-


ризующий обесценение данных наблюдения за единицу вре-
мени, 0 < ß < 1.
Если модель Хольта усовершенствовать путем вклю-
чения разности ошибок, то получим полную трехпараметри-
ческую модель прогнозирования Дж. Бокса и Г. Дженкин-
са [44]:

36
где cclt а 2 , а 3 являются параметрами модели, 0 < ах, а 2 ,
«з < 1; et — xt — lei (t — 1) — ошибка прогнозирования.
На основе практических испытаний модели на многих
экономических рядах Бокс и Дженкинс пришли к выводу,
что включение в модель разности ошибок не является необ-
ходимым. Коэффициент сс3 всегда оказывался близким к
нулю. П. Харрисон [65] пришел к такому же заключению.
Это объясняется стохастическим характером данных, и, в
частности, тем, что корреляция ошибок в подобных слу-
чаях неустойчива.
Харрисон провел эмпирическое сравнение однопараме-
трической модели Брауна с многопараметрическими моде-
лями. Многопараметрические модели ни в одном случае не
дали заметного преимущества. Поэтому на практике для
прогнозирования рядов с линейной тенденцией предпочти-
тельнее использовать более простую модель Брауна. Из
теоретического сопоставления различных моделей, прове-
денного П. Харрисоном [67] и Д. Вардом [108], следует ана-
логичный вывод. К положительным чертам метода Брау-
на можно отнести следующие: логичная, ясная и легко
понимаемая' концепция; оптимальное значение единствен-
ного параметра можно быстро найти эмпирическим путем;
коэффициенты модели прогнозирования оцениваются сов-
местно таким образом, чтобы уменьшить автокорреляцию
в остатках. Все это делает модель Брауна легко примени-
мой. Мы еще вернемся к ней в следующей главе.

§ 8. СТОХАСТИЧЕСКИЙ ПРОЦЕСС
ТЕЙЛА И ВЕЙДЖА
Г. Тейл и С. Вейдж [103] аналогично тому, как
это сделал Д. Мат [84] при изучении экспоненциальной сред-
ней, в целях дальнейшего изучения свойств адаптивных мо-
делей предложили применить двухпараметрический предик-
тор Хольта (1.10) для прогнозирования некоторого вероят-
ностного процесса, характеризующегося стохастическим
трендом. Они вывели выражения для определения опти-
мальных параметров адаптации, минимизирующих средний
квадрат ошибки прогнозирования.
Процесс Тейла—Вейджа аналитически записывается как:

(1.12)

37
где eh, t — значение уровня исследуемого временного
ряда xt в момент t;
да_ f — прирост уровня от момента t — 1 к моменту t\
Et, 'vt — временные последовательности с нулевым
математическим ожиданием, постоянными
дисперсиями и отсутствием ковариации, т. е.

M(ptet') = Q для любой пары (t, ?).


Временной ряд xt не является стационарным и не име-
ет строго определенной автоковариационной функции.,
Однако М. Нерлов и С. Вейдж 189] показали, что из урав-
нений (1.12) следует стационарность вторых разностей про-
цесса xt) которые мы обозначим через yt:
yt = (Xt—xt^~(xt^~-xt.2)=Vixt^zallt+VHtr=vt+V2et,
где V—-разностный оператор, Vxt = xt— xt-i, V2xt—.
= V(Vxt).
Вторые разности имеют вполне определенную автоко-
вариационную функцию

(1.13)

где

Эти свойства могут быть использованы для решения во-


проса о возможности адекватного представления наблюден-
ного временного ряда процессом Тейла—Вейджа. При этом
не следует упускать из виду то обстоятельство, что оценки
автоковариационной функции являются довольно грубы-
38
ми и коррелированными и точные равенства (1.13) на
практике будут выполняться лишь приближенно.
Схема составления прогноза в соответствии с (1.10)
выглядит следующим образом:
(1.14)
(1.15)

Если ошибку прогноза, сделанного в момент t на 1 шаг впе-


ред, обозначить через e^t), то уравнения адаптации (1.14)
и (1.15) можно записать в виде:

Ошибка прогноза:

Следовательно, ошибка прогноза является суммой трех


компонент: ошибки оценки уровня процесса в момент t,
ошибки оценки прироста уровня в момент t и комбинации
случайных компонент v и е в момент t + 1.
Очевидно, что определение оптимальных ах и у эквива-
лентно определению оптимальных а х и а 2 . Оптимум обычно
отыскивается путем минимизации среднего квадрата ошиб-
ки прогноза. Но когда рассматриваются нестационарные вре-
менные ряды, то в общем случае не очевидно, что средний
квадрат ошибок прогнозирования адаптивным методом явля-
ется величиной устойчивой, которая может быть минимизи-
рована. Используя соотношение

Нерлов и Вейдж показали, что проблема прогнозирования


xi + 1 эквивалентна задаче прогнозирования второй раз-
ности yt + 1 и что при ограничениях, наложенных на па-
раметры адаптации с^ и а 2 , ошибка прогноза является
39
линейной комбинацией текущего и прошлых значений
стационарного ряда у{.

где {©} — сходящийся ряд весов.


Это означает, что ошибки прогноза стационарны и их
средний квадрат вполне определенен.
В результате минимизации дисперсии ошибки прогноза
на 1 шаг вперед De (1) Тейл и Вейдж получили следующие
результаты:

Для практического применения этого, однако, недоста-


точно, и нами в приложении № 1 выведено более общее вы-
ражение для дисперсии ошибки прогнозирования на х ^ 1
по той же схеме.
Грубая оценка соотношения дисперсий g a может быть
получена из соотношений (1.13) по подсчитанным автокова-
риациям процесса yt. Уточнение g* производится экспери-
ментально методом проб на имеющемся отрезке ряда. Да-
вая значения в окрестностях грубой оценки, находят ga,
минимизирующее дисперсию ошибки De (1).
Нерлов и Вейдж провели теоретический анализ чувст-
вительности дисперсии ошибки прогноза De(l) к ошибке
в определении g2. Оказалось, что процентное изменение
дисперсии De (1) пропорционально квадрату относитель-
ной ошибки оценки g2 с коэффициентом пропорциональ-
ности

Для наиболее реальных,


2
малых значений g2 даже 50 % -ная
ошибка в оценке g дает увеличение в D e (1) менее чем на
1,5%.
Наши эксперименты говорят о том, что несмотря на
довольно жесткую структуру процесса Тейла—Вейдж.а его
40
можно использовать для аппроксимации некоторых реаль-
ных временных рядов. Сопоставительный анализ, проведен-
ный в §3 гл. 7, показывает, что процесс Тейла—Вейджа
занимает особое место среди моделей стохастических рядов.

§ 9. ПРИМЕРЫ

Сравним свойства нескольких отрезков реаль-


ных временных рядов со свойствами стохастического про-
цесса Тейла—Вейджа и в тех случаях, когда они будут при-
близительно одинаковыми, построим предикторы и получим
прогнозы и их доверительные границы.
Для исследования возьмем сильно
1
колеблющиеся ряды
курса акций фирмы ИБМ и цен на золото, приведенные
в приложении № 4. Разобьем первый ряд на 3 отдельных
участка по 48 точек, второй ряд разделим на 6 участ-
ков по 60 точек и проанализируем автокорреляционную
функцию для вторых разностей соответствующих данных
(см. табл. 1.9).
Таблица 1.9
Автокорреляционные функции вторых разностей
№ участка

Лаг k
Ряд
1 2 3 4 б 6

Курс акций 1 -0,36 -0,05 -0,16 —0,01 0,16 -0,11


фирмы ИБМ 2 -0,32 -0,45 0,31 0,03 —0,15 0,07
3 -0,57 0,08 0,08 —0,19 0,04 0,16

Цена на 1 -0,59 0,01 0,14 —0,03 —0,10 0,04


золото 2 -0,47 —0,01 0,04 -0,16 0,12 -0,05
3 -0,62 0,07 0,04 0,08 -0,11 0,04
4 -0,44 -0,16 0,09 0,08 —0,13 —0,03
5 -0,20 -0,40 ' 0,08 —0,07 -0,06 0,30
6 -0,61 0,08 0,15 —0,21 0,13 -0,01

Для рядов, описываемых процессом Тейла—Вейджа,


автокорреляционные функции вторых разностей должны

1
Используется ряд цен на золото на Лондонском рынке на на*
чало рабочего дня с 1 апреля 1971 г. по 14 сентября 1972 г.
41
иметь следующие свойства!

Поэтому при моделировании можно выдвинуть гипотезу


что участок 3 ряда курса акций и участки 1, 3, бряда цен
на золото генерированы процессом Тейла—Вейджа.
Методом перебора для этих отрезков были найдены зна-
чения g\ минимизирующие средний квадрат ошибки прог-
нозирования на 1 шаг. Начальные условия для уравнений
адаптации находились по обычной линейной регрессии.
Затем каждый отрезок экстраполировался на х,— 10.
Экстраполяция производилась по следующим моделям:
И Б М 3 ( р и с . 1.7);
з о л о т о ! ( р и с . 1.8);
з о л о т о 3 ( р и с . 1.9);
золотов (рис. 1.10).
Доверительные границы рассчитывались по формуле,
выведенной в приложении № 1, Результаты представлены
на рис. 1.7—1.10.
Для отрезков ИБМ 3 , золото^ золотоа прогнозы и до-
верительные уровни достаточно хорошо описывают будущее
поведение процесса. При экстраполяции отрезка золото6,
в предположении что временной ряд цен генерируется про-
цессом Тейла—Вейджа, получается слишком большой раз-
мах доверительных уровней, лишающий прогноз ценности.
Отметим, что прогнозы по адаптивной модели могут
подсчитываться формально по одной и той же схеме, каким
бы ни был временной ряд. Однако качество прогноза зави-
сит от динамики процесса. Поэтому при моделировании
прежде всего делаются предположения относительно истин-
ной структуры ряда, выбирается наиболее подходящая мо-
дель й в соответствии с этим рассчитываются доверитель-
ные границы полученного прогноза. Эти границы будут
тем уже, чем лучше принятая гипотеза отражает реальные
свойства ряда. Альтернативных гипотез может быть, мно-
жество, в частности, стохастический нестационарный про-
цесс Тейла—Вейджа является одной из них.
42
В завершение следует подчеркнуть, что конечная цель
в данном случае состояла не столько в изучении выбранных
рядов, сколько в исследовании самого метода. Отобран-
ные ряды характеризуются большой изменчивостью, по-

Рис. 1.7. Прогнозирование курцса акций


2 фирмы ™ М по модели
Хольта с гипотезой Тейла-Вейджа5,зЯ =0,045;/1=0,317, а=0,482,

этому их использование для испытания адаптивных свойств


рассматриваемых, моделей .представляется „ o n P a B A! H ™.
К.этим рядам будем обращаться и в дальнейшем. Однако
нельзя утверждать, что адаптивные методы являются наи-
лучшим способом прогнозирования данных рядов.
Сделаем некоторые выводы. В гл. 1 рассмотрены про:
стейшие модели экспоненциального сглаживания, линейные
адаптивные модели, стохастический процесс Тейла и веид-
43
Рис. 1.8. Прогнозирование цены на золото по модели Хольта
с гипотезой Тейла—Вейджа, g*«=0,ll; А=0,391; а«0,562;у*= 0,220

Рис. 1.9. Прогнозирование цены на золото по модели Хольта с гипо-


тезой Тейла-Вейджа, £г=0,18; й=0,255; «==0,406; у=0,103

и
жа. Несмотря на то-что эти модели в дальнейшем получили
эмпирическое или теоретическое развитие, они и без усо-
вершенствования сохраняют практическое значение. Глав-
ное их достоинство — простота и возможность построения

Рис. 1.10. Прогнозирование цены на золото по модели Хольта с ги-


потезой Тейла — Вейджа, g2=»0,08; fc=0,363; а=0,533; v=0,193

и использования для прогнозирования при наличии не-


большого количества фактических точек. Эти модели могут
рассчитываться с помощью ЭВМ любого класса.
Методы экспоненциального сглаживания благодаря ра-
ботам Хольта и Брауна стали эффективным и удобным ин-
45
струментом прогнозирования в экономике. В основном экс-
поненциальное сглаживание используется для прогнози-
рования рядов спроса и для управления ресурсами. Р. Бра-
ун [46] указывает, что благодаря этим методам прогнозиро-
вания «в трех дюжинах компаний», с которыми он работал,
удалось сократить затраты на материально-техническое
снабжение приблизительно на 150 млн. дол. при улучшении
обслуживания. С. Эйлону и Дж. Элмалеху [57], разработав-
шим систему снабжения, удалось благодаря адаптивным
моделям уменьшить затраты на 30%. А. Моррелл, прини-
мавший участие в обсуждении работы Д. Варда [108], счи-
тает, что экспертный прогноз спроса дает в среднем ошибку
40%, а метод Брауна позволяет ее уменьшить приблизи-
тельно на 30%. В работе Р. Маркланда [73] адаптивные мо-
дели используются при существенно изменяющихся усло-
виях протекания процесса и делается вывод о том, что при-
менение экспоненциального сглаживания вполне приемле-
мо для непрерывного обновления нормативной базы.
Этот метод может быть использован как для прогнози-
рования некоторых глобальных показателей, так и в систе-
мах управления различного уровня.
Главный недостаток этих методов в том, что они рассмат-
ривают временной ряд изолированно от других явлений,
и если даже имеется дополнительная информация, она мо-
жет быть использована исследователем лишь путем регули-
рования скорости адаптации. Кроме того, точность прогно-
зов заметно падает при долгосрочном прогнозировании.
Глава 2
РАЗВИТИЕ МОДЕЛЕЙ
С ПОСТОЯННЫМИ ПАРАМЕТРАМИ
АДАПТАЦИИ

В этой главе рассматривается развитие лростей-


шей адаптивной модели экспоненциального типа по несколь-
ким'направлениям. Одни модификации позволяют применять
ее для изучения изменяющихся во времени законов распре-
деления вероятностей, другие — адекватно описывать вре-
менные ряды с лериодическими сезонными колебаниями,
третьи — аппроксимировать тенденции ряда с помощью по-
линомов с адаптивными коэффициентами.

§ 1. АДАПТИВНАЯ МОДЕЛЬ ДЛЯ ИЗУЧЕНИЯ


ЭВОЛЮЦИОНИРУЮЩИХ ЗАКОНОВ
РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ

В некоторых задачах требуется определить фор-


му^закона распределения вероятностей какой-либо случай-
ной переменной, в то время как стохастический процесс,
который она представляет, претерпевает некоторые измене-
ния. В этом случае нужно найти способ изучения эволюци-
онирующих законов распределения вероятностей.
Будем рассматривать полную систему п несовместных
событий, определенных на числовой оси с помощью п + 1
границы:

Если исследуются объемы заказов покупателей на ка-


кой-либо продукт, то могут быть, например,-определены
три события: 1) объем заказа менее 5 штук; 2) объем заказа
не менее 5 штук, но менее 20; 3) объем заказа не менее
20 штук.
Независимо от того, в каком объеме продукт был зака-
зан, мы можем рассматривать этот заказ как осуществле-
47
ние одного и только одного из указанных событий. Событие,
связанное с наблюдением xt, соответствует номеру интерва-
ла, в котором оказывается наблюдение. Любое возможное
наблюдение должно либо быть равным одной из границ,
либо оказаться между двумя соседними границами, т. е.
имеется только одно k, такое, что Хъ _ i < xt ^ Хъ.
Поэтому мы связываем с наблюдением xt событие к. Это оз-
начает, что первая граница событий Хо должна быть мень-
ше, чем любое наблюдение, которое может иметь место, и
последняя граница Хп должна быть больше, чем любое воз-
можное наблюдение. Так как нельзя быть абсолютно уве-
ренным, что наблюдаемые величины будут ограничены, то
возможны две альтернативы конструирования системы. Од-
на состоит в том, чтобы положить Хо = — ооиХ п = + °°.
Другой путь — положить Хо столь малым, а Хп столь боль-
шим конечным числом, чтобы можно было ожидать, что ре-
альные наблюдения будут находиться в этих пределах. Тог-
да для случая, когда появляется наблюденное значение,
выходящее за установленные пределы, следует обеспечить
выработку особого сигнала для вмешательства исследовате-
ля, который должен проанализировать неожиданные наблю-
дения, прежде чем обрабатывать их автоматически.
Рассмотрим простой метод оценки вероятностей Ph (О
наступления различных событий

предложенный Р. Г. Брауном [47]. Так как рассматривает-


ся полная система п несовместных событий, то степеней сво-
боды будет п— 1, ибо сумма вероятностей должна быть
равна единице, т. е. не все п значений Ph независимы.
Анализ прошлых данных или суждение о будущем дела-
ет возможным установить границы событий и сделать на-
чальные, хотя бы грубые, оценки вероятностей различных
событий Ph(0), k = 1,2, . . ., п. Пусть наблюдение xt в
момент t свидетельствует о наступлении события k. Пост-
роим я-мерный вектор-столбец U (*), который имеет п — 1
нулевую компоненту, а k-я компонента равна единице.
Предыдущие оценки п вероятностей можно рассматривать
как п-компонентный вектор-столбец P(t~-l). Процесс
пересмотра этих оценок с учетом текущей информации яв-
ляется экспоненциальным сглаживанием по правилу

48
Каждая компонента вектора модифицируется -простым
экспоненциальным сглаживанием нуля или единицы. На-
пример, если исследуется система из 3 событий и наблю-
дение означает наступление второго, то

Так как Р (t— 1) является вектором вероятностей, то


все его компоненты должны быть неотрицательны и их сум-
ма должна быть точно равна 1.
Рассмотренный процесс векторного сглаживания не мо-
жет сделать компонентуотрицательной,и сумма итоговых
компонент та же, что сумма их прежних значении. Следо-
вательно, если $ (* л - I) является вероятностным вектором,
Т
° К о т р Т с о б ы т и е i. Если закон распределения наблю-
денных значений xt не меняется, то м а « ш ч е с ш ° ж д а .
ние значения i-й компоненты вектора U Ю, « « * » ? ?
сглаживанию, точно равно действительной вероятности^
наступления события i и математическое ожидание оценки
равно действительной вероятности

Вероятность того, что придется сглаживать единицу,


равна Л , а вероятность того, что будем сглаживать нуль,
равна 1 2- Р,. РЛегко подсчитать, что Ья компонента векто-
pa U (0 характеризуется дисперсией РГ (1 ~- го-
Выражая дисперсию результата экспоненциального
сглаживания через дисперсию на входе, получим дисперсию
оценки вероятности наступления t-ro события:

где а — постоянная сглаживания. nmv,innM««fl


Таким образом, имеются два способа « « « я Щ Р о м н м
системы, которые наиболее предпочтительны. Границы со
бытии целесообразно выбирать так, чтобы Рк была °чень
большой (близкой к 1) или очень маленькой (почти 0). это
обеспечит малую дисперсию оценок компонент вектора
вероятностей. .д
/1—1866
Если форма распределения со временем меняется, то
может быть использована большая постоянная сглаживания,
для того чтобы быстро уменьшить влияние прежних данных.
И наоборот, если вероятностное распределение постоянно во
времени, то нет нужды уменьшать влияние старых данных,
и для уменьшения дисперсии оценок можно использовать
меньшую постоянную сглаживания.
Модель предназначается для изучения, например, спро-
са на отдельные виды товаров по возрастным группам, эво-
люции распределения семейных бюджетов по статьям рас-
ходов, распределения сумм текущих вкладов и других яв-
лений экономической жизни.
§ 2. СЕЗОННЫЕ МОДЕЛИ

В экономике многие явления характеризуются


периодически повторяющимися сезонными эффектами. Со-
ответственно временные ряды, их отражающие, содержат
периодические сезонные колебания. Эти ряды и их колеба-
ния можно представить как генерируемые моделями двух
основных типов: моделями с мультипликативными и с ад-
дитивными коэффициентами сезонности.
Модели первого типа имеют вид:

где динамика величины alt t характеризует тенденцию раз«


вития процесса;
fu ft-x, •••> h-i + i~ коэффициенты сезонности;
/ — количество фаз в полном сезонном цикле (если ряд
представляет месячные наблюдения, то в экономике обычно
/ — 12, при квартальных данных / = 4 и т. п.);
et — неавтокоррелированный шум с нулевым математи-
ческим ожиданием.
Модели второго типа записываются как:

где величина (h, t описывает тенденцию развития процес-


са;
, ёи gt -it •... gt - г + i—аддитивные коэффициенты сезон-
ности;
/ — количество фаз в полном сезонном цикле:
50
et — неавтокоррелированный шум с нулевым математи-
ческим ожиданием.
Адаптивная модель с мультипликативной сезонностью
была предложена П. Р. Уинтерсом [113]. Аддитивная модель
рассмотрена Г. Тейлом и С. Вейджем [103].
Уинтерс поставил задачу разработать модель для прогно-
зирования объемов сезонных продаж с использованием ЭВМ.
Модель должна быть такой, чтобы: а) прогнозы рассчиты-
вались на основе одних и тех же программ для большого ко-
личества продуктов; б) вычисления производились быстро
и дешево; в) использовался минимальный объем памяти
для информации; г) учитывались изменяющиеся условия.
Прогнозы объемов продаж предназначаются для систем
управления запасами и планирования производства. Такие
системы предполагают наличие правил принятия решений,
которые определяют, когда и сколько производить или за-
казывать отдельных видов товаров. Правила однообразно
применяются ко многим продуктам, часто к десяткам ты-
сяч или даже сотням тысяч изделий. Прогнозы должны де-
латься часто (ежемесячно или еженедельно). Метод прогно-
зирования должен быть четко формализован, что необходи-
мо для автоматической обработки на ЭВМ. Необходимо
иметь возможность легко вводить свежую информацию о
фактических продажах.
Для прогнозирования продаж отдельных видов товаров
могут быть применены несколько методов. Модель Уинтер-
са базируется на анализе изолированных временных рядов
о продажах. Единственной используемой информацией яв-
ляется предыстория продаж данного товара.- Модель Уин-
терса является моделью экспоненциального типа. Эта схе-
ма, очевидно, имеет необходимые характеристики.
Для некоторых продуктов, характеризующихся стабиль-
ной интенсивностью продаж и малыми сезонными колеба-
ниями, уже простая экспоненциальная модель является
вполне удовлетворительной. Многие продукты, однако, име-
ют заметную тенденцию роста или падения продаж, осо-
бенно когда они производятся впервые или когда появля-
ются конкурирующие товары. Для некоторых продуктов
существенны сезонные изменения уровня продаж.
Поэтому целесообразно в прогностических моделях учи-
тывать конкретный характер тенденции и сезонных колеба-
ний. Это и сделал Уинтерс с помощью экспоненциальной
схемы. Модель при этом становится сложнее, зато и точность
51
4*
прогнозов для большинства товаров существенно возраста-
ет.
Прежде чем переходить к полной модели Уинтерса, от-
ражающей и сезонность, и линейную тенденцию роста, рас-'
смотрим более простой вариант, который содержит только
сезонный эффект.
Прогнозирование с коэффициентами сезонности
Модель имеет вид:

Как видим, alt t является взвешенной суммой текущей


оценки т^—, полученной путем очищения от сезонных коле-
баний фактических данных xt и предыдущей оценки altt _!•
В качестве коэффициента сезонности Д берется его наиаолее
поздняя оценка, сделанная для аналогичной фазы цикла.
Затем величина ati t, полученная по первому уравнению, ис-
пользуется для определения новой оценки коэффициента
сезонности по второму уравнению.
Прогноз следующего значения ряда:

Более общим выражением для прогноза на х шагов впе-


ред будет:

Величины <hitv.ft могут быть записаны через прошлые


данные и начальные условия:

1
Если прогнозы составляются на отрезок времени, больший чем
I, то повторно используется / наиболее свежи* оценок коэффициен-
тов сезонности Ъ + t-i, ,..,%
52
где alt о — начальное значение ах\
Jtt о — начальное значение f в соответствующей i фазе
(месяце) цикла (года);
J — наибольшая целая часть -? .
Следовательно, прогноз является функцией всех прош-
лых значений фактического ряда, параметров ах и а 2 и на-
чальных условий 2^,0, fi,0, ?i.o, - , ho-
Влияние начальных условий на прогноз зависит от ве-
личины весов и длины ряда, предшествующего текущему
моменту t. Влияние ai, 0 обычно будет уменьшаться быстрее,
чем влияние начальных значений Jt,0, так как ах пересмат-
ривается на каждом шаге, а ft только один раз за цикл.
, Если эта сезонная модель прогнозирования, структура
которой не содержит элементов для отражения какой-либо
тенденции роста, применяется для прогнозирования ряда,
•характеризующегося ярко выраженной тенденцией, то ко-
эффициенты % перестают быть простыми коэффициентами
сезонности и вскоре вбирают в себя в определенной мере
эффект роста., Например, при обработке ряда ежемесячных
наблюдений с длительной тенденцией к повышению будет
получена сумма двенадцати /ь превышающая 12. Именно
это и компенсирует отсутствие в структуре модели соответ-
ствующих элементов.
Если ряд имеет тенденцию, а многие ряды, по-видимому,
ее имеют, то в модель необходимо ввести специфический
член, учитывающий эту тенденцию.

Модель сезонных явлений с линейным ростом


Полная сезонная модель Уинтерса с линейным ростом
аналогична только что рассмотренной:
Единственным изменением в выражении для a1>t являет-
ся добавление а2, t -1 — наиболее поздней оценки аддитив-
ного фактора роста, характеризующего изменение среднего
за полный сезонный цикл уровня процесса за единицу вре-
мени (месяц). Выражение для обновления коэффициента
сезонности остается тем же, что и раньше. Оценки <22, t M 0 "
дифицируются по аналогичной процедуре экспоненциаль-
ного сглаживания. Прогноз является здесь функцией прош-
лых и текущих данных, параметров аъ <ха, а 3 и первона-
чальных значений а 1 ) 0 , я2,о> ff,о« Качество и точность прог-
нозов зависит от этих факторов.
Оптимальные параметры alt aZt a3 Уинтерс предлагает
находить экспериментальным путем. Критерием сравнения
он берет стандартное отклонение ошибки. При этом предпо-
лагается, что прогноз не смещен. Поиск, осуществлялся с
помощью сетки значений аъ а 2 , а 3 . Функция стандартной
ошибки вблизи минимума предполагалась достаточно пло-
ской.
У Уинтерса и других исследователей это положение на-
шло экспериментальное подтверждение. В связи с этим
предполагалось использовать один набор весов для ши-
рокого класса продуктов. Уинтерс использовал данные за
5—7 лет. При этом рядами были: данные о продажахдсухон-
ной утвари, о продажах краски, о котлованах для изготов-
ленных заводским способом сооружений. Первая часть рядов
(2—3 года) использовалась для построения модели, а на ос-
тальных данных проверялась точность прогнозирования.
Для получения представления о влиянии различных на-
боров величин ( a l t а 2 , а 8 ) на все три ряда сразу Уинтерс
предложил следующую комбинированную оценку. В каче-
стве меры потерь в точности прогнозирования для каждого
ряда в отдельности при данном наборе (at, a 2 , а 3 ) он брал
возрастание дисперсии ошибки, выраженное в процентах,
по сравнению с дисперсией, соответствующей оптимальным
параметрам сглаживания. Например, при (0,2; 0,4; 0.,2)
для первого ряда превышение над минимумом составило
2л>, для второго — 2%, а для третьего — 22%. Комбини-
рованная оценка равна их сумме — 2 6 % . Наилучшей ком-
бинированной оценкой у Уинтерса были 24% при (0,2;
и,4; 0,1),
Определение оптимальных параметров путем минимиза-
ции комбинированной оценки является попыткой найти
54
универсальные веса, подходящие для широкого класса ря-
дов. Несмотря на то что полученный результат несет отпе-
чаток специфических свойств использованных рядов, он
является полезным ориентиром при работе с недостаточной
информацией.
График ретроспективных прогнозов добычи газа в быв-
шем СССР, полученных по модели Уинтерса (рис. 2.1),
свидетельствует об увеличении несоответствия прогнозов

Рис, 2.1. Ретроспективное прогнозирование добычи газа


по модели Уинтера, т =1
фактическим данным с ростом годового уровня добычи. Легко
заметить более значительный размах сезонных колебании
прогнозов по сравнению с колебанием фактических данных
при общем росте кривых. Все это свидетельствует о неадек-
ватности мультипликативной модели реальному процессу.
По-видимому, рост добычи газа в большей, степени обеспе-
чивается за счет разработки месторождений, продуктив-
ность которых в меньшей мере подвержена сезонным коле-
баниям, чем это следует из гипотезы о мультипликативном
характере сезонности.

Аддитивная модель сезонных явлений


Несмотря на то что для экономических временных рядов
мультипликативная модель обычно оказывается наиболее
подходящей, иногда требуется аддитивная модель Рассмот-
рим аддитивную модель сезонных явлений с линейным рос-
том, предложенную Г. Тейлом и С. Вейджем [103].
Построение такой модели имеет целью упрощение про-
цедуры прогнозирования, поскольку комбинация мультип-
ликативной сезонной модели с линейным ростом математи-
чески громоздка. Кроме того, на практике чаще встречают-
ся экспоненциальные тенденции, чем линейные. Поэтому
замена значений первоначального временного ряда их ло-
гарифмами преобразует экспоненциальную тенденцию в
линейную и одновременно мультипликативную сезонную
модель в аддитивную.
1
Тогда временной ряд (исходный или
преобразованный) можно представить следующим образом:
(2.1)
(2.2)
rp£aXit — величина уровня процесса после элиминирова-
ния сезонных колебаний;
ait t — аддитивный коэффициент роста;
gt — аддитивный коэффициент сезонности;
8t — белый шум.
Сначала рассмотрим адаптивную процедуру обновления
значения ä1)t.B момент t мы располагаем наблюдением xt, о
котором известно, что

Однако о шуме и сезонном факторе gt никакой информации


нет. Величину et заменим нулем, а в качестве заменителя
для gt возьмем самую последнюю оценку сезонного фактора
gtr.i, где / — период сезонного цикла.
Величину Xf—gt-t будем рассматривать как новое
«фактическое» значение at) t. Последней оценкой уровня а%
является äit t _ l t но она соответствует моменту t—l, а не t.
Поэтому необходимо к Oj.i-i добавить ещеа 2 ( < (см.2.2).
Но так как оценку а2, % мы еще не можем получить, то вместо
нее берем оценку a%t t _ lt полученную на предыдущем шаге.
Это приводит к следующей процедуре адаптации:
(2.3)
которая при данных весах ах и (1 — а х ) оценивает а 1( t через
наиболее свежее наблюдение xt и ранее подсчитанные величи-

1
Об особенностях прогнозирования временных рядов после
логарифмического преобразования см. приложение № 3.
58
Учитывая (2.2) и вычитая из полученного ält t прежнюю
оценку«^ t _i, можем получить оценку äZt t. Однако посколь-
ку вычисления *£, t не являются совершенными, в частности
потому, что не принимались в расчет остатки из (2.1), то,
очевидно, лучше не полагаться на эту разность полностью,
а считать ее «фактическим» свидетельством динамики ряда
по
и объединить со старым значением ß a , t - i известной
формуле экспоненциального сглаживания
(2-4)
где а а и (1 — а а ) — веса двух источников информации.
Наконец, та же процедура применяется для получения
оценки gt. Новое «фактическое» значение сезонного фактора
будет xt — аХу ь старое значение равно gt _ и экспоненци-
ально-сглаженное значение
(2.5)
Все три параметра • сглаживания будут удовлетворять
условию 0 <; <хь а а , а 3 <С 1.
Адаптивное прогнозирование теперь провести сравни-
тельно просто. Предположим, что t — текущий момент вре-
мени, так что dt,t, «a.t gt> St-if — имеются в нашем рас-
поряжении. Предположим также, что мы хотим получить
прогноз величины Xt+% (прогноз на % шагов вперед). Экст-
раполируем тенденцию линейного роста, используя самое
последнее значение коэффициента a^ti, добавляем самую
свежую оценку сезонного члена для этой фазы цикла и пре-
небрегаем шумом. В результате получаем

при условии, что 0 < t < /. Если I < х < 2/, то необходи-
мо gf-j-и заменить на gt-ц+х и т * Д«
Модель готова, Однако на практике удобнее осуществ-
лять адаптивное регулирование alt u aZtt Kgt с помощью
Уравнений, связывающих эти величины с ошибкой прогно-
за, сделанного в конце периода t — 1 на один шаг вперед.
Уравнение (2.3) можно переписать следующим образом:

57
из уравнений (2.3) — (2.5) легко получить:
(2.7)
(2.8)
Корректировки всех параметров модели совпадают по
знаку и пропорциональны по величине ошибке последнего
прогноза на один шаг вперед. Коэффициентами пропорци-
ональности будут аъ ахссг и (1 — ai)a 3 соответственно.
Можно заметить, что процедура (2.3) — (2.5) является
рекурсивной в том смысле, что для определения alt t исполь-
зуются прошлые данные о сезонных колебаниях и коэффи-
циенте роста. Оценка %, t используется для получения но-
вых значений а2, t и gt. Но совершенно очевидно, что прош-
лые значения сезонного фактора и коэффициента роста при
вычислении а1г t являются лишь суррогатом; не лучше ли
было использовать более свежие, текущие оценки этих ком-
понент? Рассмотрим такой вариант.
Вместо выражения (2.3) имеем:
(2.9)
Выражения (2.4) и (2.5) остаются прежними, и путем их под-
становки в (2.9) получаем:

При этом 0 < а { - < 1 . Общая форма выражения, как


видим, та же, что и в (2.3). В выражениях (2.6), (2.7) и
(2.8) лишь а х меняется на а{, в остальном они остаются без
изменений. Отметим, что а! = &х при а а » а а .
58
Альтернативы моделей
Вообще возможно множество комбинаций различных
типов тенденций и циклических явлений аддитивного и
мультипликативного вида. В работе [93] представлены де-
вять возможных моделей, которые обобщенно выражены
одной формулой. Поскольку всегда необходимо использо-
вать модель, наиболее точно отражающую динамику про-
цесса, то целесообразно остановиться на этом вопросе под-
робнее.
Девять упомянутых моделей составляют три группы по
три варианта в каждой. Графическое отображение первой
группы представлено на рис. 2.2, а. Ее образуют модель
без тренда 1 — А , модель с аддитивным линейным трен-
дом 1 — В и модель с мультипликативным (экспоненциаль-
ным) трендом 1—С. Вторую группу (рис. 2.2, б) составляют
три модели из первой группы с наложенным на них аддитив-
ным сезонным'эффектом. В третью группу (рис. 2.2,б)
входят три модели из первой группы, но с наложенным на
них мультипликативным сезонным эффектом.
Из девяти моделей большинство представляются прак-
тически полезными и лишь модель 3—Л, по-видимому, не-
реалистична. Графики на рис. 2.2 позволяют быстро выб-
рать в конкретном случае наиболее подходящую модель по
имеющимся прошлым данным или на основе предположе-
ний о будущем поведении ряда.
Все девять моделей могут быть отражены в одной общей
записи

где а1( t — текущий уровень ряда после элиминирования


сезонных колебаний;
а х — параметр сглаживания, 0 < аг < 1;
значения dt и d2 даны в табл. 2.1, каждая клетка которой
характеризует ту или иную модель.
Например, модель В—2 с аддитивным трендом и аддитив-
ным сезонным эффектом записана в клетке, находящейся
на пересечении строки В и колонки 2.
Рассмотрим величины, соответствующие в обобщенной
формуле символам 4 и 4 8 :
xt — фактическое наблюдение;
Т а б л и ц а 2.1
Значения символов обобщающей формулы

l 2 3
\ ^ Характер
\ . сезонности
Отсутствие сезон- Аддитивный се- Мультипликатив-
Тенденция ^"Ч. ного эффекта зонный эффект ный сезонный
роста \ . эффект

di xt Xt—gt-l Xtlft-l
Отсутствие
А тенденции
роста
d% «M-l
a
i,t-x

dx xt xt—gt-l xt/ft-i
В Аддитивный
рост
di ei,«-l+ß2,t-X 01,<-1 + в2,<-1

di xt xt—gt-l xtltt-l
С Экспоненци-
альный рост
d* ai,t~i ft-x <ti,t-\ 4-х «i.<-i U-x

«2, t—коэффициент линейного роста, оценивается по фор-


муле

»
rt — коэффициент экспоненциального роста, его полу-
чают по формуле

8t — аддитивная сезонная компонента, вычисляется по


формуле

I — периодичность сезонного явления;


It — мультипликативный коэффициент сезонности,
подсчитывается по формуле

61
Прогнозы фактических значений, ожидаемых в момент
t + т, могут быть получены по общей формуле

где Рх подсчитывается для каждой модели способом, указан-


ным в табл. 2.2
Таблица 2.2
Формулы для прогнозов

V*. Характер 1 2 3
\. сезонности
Отсутствие Аддитивный се- Мультипликатив-
сезонного зонный эффект ный сезонный
Тенденция >». эффекта эффект
роста >.

Отсутствие
А тенденции
роста

Аддитивный
В рост

С Экспонен-
циальный
рост

§ 3. АППРОКСИМАЦИЯ
ПОЛИНОМИАЛЬНЫХ ТРЕНДОВ
С ПОМОЩЬЮ МНОГОКРАТНОГО СГЛАЖИВАНИЯ

Многократное сглаживание

В главе 1 было рассмотрено экспоненциальное


сглаживание для оценки текущего значения единственного
коэффициента в прогнозной модели; мы познакомились с
одно-, двух- и трехпараметрическими моделями линейного
роста. Наиболее предпочтительной оказалась однопарамет-
рическая модель Брауна, отличающаяся рядом достоинств.
Р. Г. Брауном и Р. Ф. Майером [481 эта модель была разви-
та для более сложных процессов путем включения в нее
большего количества полиномиальных членов. Оценка коэф-
фициентов полиномиальных членов производится путем
многократного сглаживания. Здесь также предполагается,
62
что значения коэффициентов будут меняться медленно и
оценки этих величин будут основываться на последних
наблюдениях хи # , _ ! , ..."
Понятие экспоненциальной средней St для временного
ряда xt можно обобщить на случай экспоненциальных сред-
них более высоких порядков. Экспоненциальная средняя
произвольного /7-го порядка определяется как

начальные значения экспоненциальных средних соответ-


ствующего порядка, т. е. выравнивание р-го порядка явля-
ется простым экспоненциальным сглаживанием, применен-
ным к результатам сглаживания (р — 1)-го порядка.
Если в качестве гипотезы тренда некоторого процесса
•принимается полином степени п, то метод экспоненциального
сглаживания и прогнозирования позволяет вычислить ко-
эффициенты предсказывающего полинома через экспонен-
циальные средние соответствующих порядков.
В общем случае принимается гипотеза, что исследуемый
процесс является параболой /г-го порядка, а прогноз на т
шагов вперед выражается формулой

где параметры Ъъ а 2 , ..., ап + 1 нужно определить.


Идея экспоненциального предсказания основана на том,
что прогноз осуществляется полиномом, представляющим
первые п + 1 членов разложения процесса xt в ряд Тейло-
ра:

Если наблюдаемый процесс может быть представлен по-


линомом степени я, то все производные порядка я + 1 и
выше будут равны нулю.
, Фундаментальная теорема метода экспоненциального
сглаживания и прогнозирования, впервые доказанная
р
> Брауном и Р. Майером [48], говорит о том, что коэффи-
63
циенты ах, аг, .... ап + х предсказывающего полинома свя-
заны с экспоненциальными средними

соотношением

Таким образом, имеется п + 1 уравнение, дающее сглажен-


p]
ные значения Sj через линейные комбинации производных
х?\
Линейные уравнения для сглаженных величин можно
записать в компактной форме, используя матрицы.

коэффициентов в разложении Тейлора.


Тогда содержание фундаментальной теоремы может быть
выражено так:

где М — матрица (п + 1) • (п •+• 1) с элементами, содержа-


щими бесконечные суммы степеней постоянной сглажива-
ния:

64
Система« + 1 линейных уравнений может быть разреше-
на относительна коэффициентов предсказывающего полино-
ма по формуле

Для экстраполяции трендов обычно используются поли-


номы не выше второго порядка.
1
Для этих случаев элементы
обратной матрицы М" определяются аналитически как
функции постоянной сглаживания а.
Д.А.Д' Эзопо- [58] доказал, что для любой последова-
тельности наблюдений полином Р степени п, полученный с
помощью многократного сглаживания, является решением,
которое минимизирует взвешенную сумму квадратов оши-
бок:

Экспоненциальное сглаживание очень просто. Однако


]
надо отметить, что для сглаженных величин Sp , p — 1,2,
.-., п + 1 должны быть установлены начальные значения.
Простейший путь задания исходных условий — оценка ко-
эффициентов полинома разложения.
Если имеются выборочные данные, то эти оценки могут
быть получены методом наименьших квадратов, как это де-
лается в регрессионном анализе. Для новых временных ря-
дов коэффициенты должны быть предсказаны или на основе
аналогии с другими подобными рядами, или исходя из ожи-
даемых характеристик моделируемого процесса. В том и
Другом случае должны быть некие начальные оценки этих
коэффициентов.
При выборе порядка полинома обычно решается вопрос о
том, окупается ли сложность расчетов по выбранной кри-
вой повышением точности прогнозирования. На практике
используются полиномы не выше второго порядка. Приве-
дем формулы расчета по этим моделям.
Во всех рассматриваемых ниже случаях предполагается,
что тренд может быть представлен полиномом и наблюдает-
ся при наличии шума, т. е.

где ег — белый шум.


-18бб
5 65
Ожидаемое значение xt в момент Т + % будем обозна-
чать хх (Т), где t — время упреждения, на которое делается
прогноз; Т — текущий момент времени.
Адаптивная полиномиальная мо-
д е л ь н у л е в о г о п о р я д к а : я = 0.
Гипотеза: % = ах.
Экспоненциальная средняя:

Начальное условие:

Оценка коэффициента:

Прогноз:

Адаптивная полиномиальная модель


п е р в о г о п о р я д к а : п — \.
Гипотеза: \t = ÖI + a^t.
Экспоненциальные средние:

Начальные условия:

Оценки коэффициентов:

Прогноз:

66
Адаптивная полиномиальная мо-
д е л ь в т о р о г о п о р я д к а : п = 2.
Гипотеза:
Экспоненциальные средние:

Начальные условия:

Оценка коэффициентов:

Прогноз:

Итак, прогнозы являются линейными комбинациями вы-


равненных величин. Целью выравнивания данных явля-
ется получение рекурсивных процедур пересмотра перво-
начальных оценок коэффициентов полинома.
5*
Свойства полиномиальных моделей
Многократное экспоненциальное сглаживание является
линейной дискретной системой с постоянными коэффициен-
тами и может быть поэтому полностью описано своей реак-
цией на импульс. Изучив реакцию на импульс, легко полу-
чить реакции на другие стандартные входные потоки.
Раньше мы рассмотрели реакцию на импульс системы од-,
нократного экспоненциального сглаживания и использова-
ли ее для изучения динамических свойств модели. Это было
полезно для практического выбора компромиссного значе-
ния константы сглаживания а.
Можно провести подобный же анализ для системы много-
кратного сглаживания. Для этого вводят понятие эквива-
лентной постоянной сглаживания, которое позволяет вы-
воды, сделанные для однократного экспоненциального сгла-
живания, распространить на случай сглаживания любого
порядка.
Предположим, что достаточно долго входной поток х = О
и экспоненциальные средние всех порядков также равны
нулю. Затем в момент времени t — 0 на вход подается еди-
ничный скачок х0 — 1. Это может быть импульс, ступенча-
тое изменение или начало какой-либо другой временной
функции. Экспоненциальная средняя первого порядка при-
мет значение а: Реакция экспоненциальной средней второ-
го порядка будет а 2 , Реакция экспоненциальной средней
k-то порядка будет ak. На основании фундаментальной тео-
ремы оценка свободного члена aXtt для полиномиальной
модели л-порядка тогда будет выражена так:

Для анализа моделей, использующих экспоненциальные


средние высокого порядка, удобно определить эквивалент-
ную постоянную сглаживания таким образом, чтобы оценки
свободного члена для различных моделей были одинаковы-
ми.
Пусть при однократном выравнивании использовалась
постоянная сглаживания ах. Тогда для модели линейного
роста, использующей двойное сглаживание, значение эк-
вивалентной постоянной а а будет такое, что

68
Вообще для выравнивания порядка р эквивалентная по-
стоянная сглаживания будет такая, что

Это определение эквивалентной постоянной связано так-


же с другой эквивалентностью. Для любой полиномиальной
модели свободный член alt t может быть оценен рекурсивно:

где хх (t—l) — ожидаемое значение наблюдения в момент


t, полученное на основе информации, имевшейся к моменту
t—l,
Следовательно, эквивалентная постоянная сглаживания
дает одинаковую коррекцию свободного члена при одинако-
вой ошибке прогноза на 1 шаг вперед.
Реакция адаптивных полиноми-
альных моделей нулевого, первого и
в т о р о г о п о р я д к о в . На рис. 2.3, 2.4, 2.5, 2.6 адап-
тивные полиномиальные модели нулевого, первого и второ-
го порядков с эквивалентными постоянными сглаживания
сравниваются по их реакции на импульс, на ступенчатое
изменение уровня, на входной поток с линейным ростом, на
параболу при периоде упреждения т « 3. Наиболее сильно
на импульс реагирует полиномиальная модель второго по-
рядка (см. рис. 2.3). „ „ „.„
На рис. 2.4 видно, что прогноз на три шага вперед в кон-
це концов стремится к уровню ступенчатого изменения, но
более сложные модели требуют на это больше времени, ре-
акция может быть ускорена увеличением постоянной сгла-
живания, , , ЛЙ .,__„
Стоит отметить, что прогнозы по полиномиальной моде
ли первого порядка превышают уровень ступенчатогоскач
ка и стремятся к нему сверху, в то время как прогнозы по
квадратической модели превышают новый уровень входно
го потока, затем опускаются ниже и стремятся к нему сни
3V
'Рис. 2.5 показывает, что после первоначального переход-
ного периода прогнозы полиномиальной модели нулевого
порядка отстают от линейно растущего входного-потока на
постоянную величину; прогнозы полиномиальной модели
первого порядка в конце концов приближаются к деистви
тельным значениям ряда; прогнозы полиномиальной моде
ОУ
Рис. 2.3. Реакции на импульс прогнозных моделей экспоненци-
ального типа, т=3:
модель 1 — полиномиальная модель нулевого порядка,
модель 2 — полиномиальная модель первого порядка,
модель 3 —полиномиальная модель второго порядка.

Рис. 2.4. Реакции на ступенчатое изменение, х~3

70
ли второго порядка превышают значения входного ряда, а
затем приближаются к ним.
При прогнозировании параболы (рис. 2.6) первая модель
все больше отстает от ее фактических значений; второй мо-
дели присуще постоянное смещение. Все более точные про-
гнозы дает квадратическая модель.

Рис. 2.5. Реакции на линейно-нарастающий входной поток, т=3

Что касается конкретных численных значений постоян-


ной сглаживания, то для очень стабильных процессов Браун
предлагает выбирать аА — 0,05 или ai = 0,1; для менее ста-
бильных ~ а г - 0,1 или ах = 0,25. Эти три значения он
и использует для моделирования.
Д и с п е р с и я о ц е н о к п а р а м е т р о в по-
л и н о м а . Выход рассматриваемых моделей является сум-
мой двух типов реакций: реакции на детерминированную
составляющую % и реакции на наложенный на нее шум.
Если тип модели соответствует порядку полинома, представ-
ляющего детерминированную составляющую, то для опре-
деления дисперсии оценок параметров достаточно рассмот-
реть случай, когда на входе только .шум xt = е4 с нулевым
математическим ожиданием и дисперсией о| и автокорреля-
ция отсутствует.
7}
Такой анализ приводит к следующим результатам. При
прогнозировании процесса xt = ах + &t по полиномиаль-
ной модели нулевого порядка дисперсия оценки единствен-
ного параметра будет равна:

При прогнозировании процесса х\ — аг + azt + в< по


соответствующей модели получаем:
(2.10)

(2.11)

Для квадратической модели получить такие соотноше-


ния затруднительно. Поэтому оставим этот вопрос до рас-
смотрения обобщенной модели Брауна.
В ы б о р п о р я д к а п о л и н о м а . Выбор поряд-
ка полинома — важная проблема, решение которой не всег-
да очевидно. Встает вопрос: не предпочтительнее ли брать
«на всякий случай» более сложную модель и полагаться на
ее свойства адаптировать'свои параметры? В случае ошибки
можно ожидать, что оценки соответствующих параметров
72
полинома будут стремиться к нулю, оказывается, что по-
ступать так довольно опрометчиво. Дж.Д. Кохен [52] рас-
смотрел случай, когда для стационарного процесса с по-
стоянным уровнем и нулевой корреляцией для лагов,
отличных от нуля, была ошибочно выбрана адаптивная по-
линомиальная модель первого порядка. В этом случае в за-
висимости от а дисперсия ошибки прогноза на 1 шаг лежит
между а% и 4о%. Для того же процесса модель экспоненци-
альной средней дает дисперсию ошибки в пределах о% —
—• 2о%. С ростом х ошибка более общей модели будет, конеч:
но, еще больше.
Выбирать структуру модели следует на основе визуаль-
ного анализа графика процесса, априорных знаний характе-
ра и законов развития явления, метода проб.

Следящий контрольный сигнал


Для скорейшего обнаружения неадекватности модели
реальному процессу, что необходимо для внесения соответ-
ствующих изменений в модель прогнозирования, Р. Браун
[47] разработал способ анализа прогнозирующей системы,
состоящий в подсчете величины следящего контрольного
сигнала. Следящий контрольный сигнал Kt определяется
как сумма ошибок прогнозирования eh деленная на вели-
чину их сглаженного абсолютного значения:

т.е.

где 0 < у < 1 — постоянная сглаживания.


Браун указывает значения критических уровней конт-
рольного сигнала, превышение которых говорит о необходи-
мости дополнительного изучения и изменения модели.
Такой прием имеет два недостатка. Во-первых, в случае
когда контрольный сигнал вышел за установленные преде-
лы, он не обязательно вернется в эти же пределы, даже если
рассматриваемый процесс вновь будет развиваться по преж-
ним законам и прогнозирующая модель окажется адекват-
ной реальному процессу. Следовательно, потребуется вме-
73
шательство, чтобы сделать сумму ошибок снова близкой к
нулю и избежать таким образом ложных сигналов тревоги.
Во-вторых, возможна и обратная ситуация, когда конт-
рольный сигнал выходит из указанных пределов, а система
начинает давать более точные прогнозы. Например, если с
некоторого момента имеют место совершенные прогнозы,
то среднее абсолютное отклонение будет стремиться к ну-
лю, в то время как сумма ошибок остается неизменной. Та-
ким образом, контрольный сигнал будет стремиться к бес-
конечности.
Д. Тригг [104] предложил простую модификацию пра-
вила Брауна, преодолевающую эти недостатки. Вместо, сум-
мы ошибок он использовал сглаженную ошибку %t\

Следящий контрольный сигнал Kt определяется отношени-


ем

Если прогнозирующая система окажется настолько не-


адекватной изучаемому процессу, что все ошибки будут од-
ного знака, то контрольный сигнал будет стремиться к
+ 1 или —1 (выйти за эти пределы он не может). Если из-
вестно, что прогнозирующая система адекватна реальному
процессу и полученные ошибки образуют неавтокоррели-
рованную, нормально распределенную случайную последо-
вательность с нулевым средним и стандартным отклонением
с, то для контрольного сигнала могут быть определены до-
верительные интервалы.
Уравнение для сглаженной ошибки можно переписать
в виде:

ее дисперсия будет равна сумме дисперсий отдельных чле-


нов:

74
Так как 0 < (1 — у) < ], то при t -у <х> этот ряд сходит-
ся и его сумма равна:

Пределы для сглаженной ошибки, определяемые вели-


чиной 2о^, равны, поэтому

Известно, что 0 « 1,2 среднего абсолютного отклонения.


Если 7 Достаточно мало, то можно принять, что локальная
оценка среднего абсолютного отклонения относительно по-
стоянна и приблизительно равна истинному среднему аб-
солютному отклонению, т. е. равна - ^ .
Таким образом, при малых у, при принятых допущениях
относительно et величина et является случайной, нормально
распределенной, a e~t приблизительно постоянной величи-
ной. Это дает возможность (несмотря на то, что —1 < Kt ^
а.

^ Н- 1) аппроксимировать распределение Kt — ^- нор-


мальным распределением.
Следовательно, пределы для контрольного сигнала, оп-
ределяемые величиной 2(Тк, приблизительно равны

Для v = 0,1 получим ±0,55, т. е. с вероятностью 95%


— 0,55 ^ Kt < + 0,55. nn...
Пределы в 3(Т/< (соответствующие вероятности 99%) при
том же значении у составят — 0,83 <1 Kt < + 0,83.
Для значений у, которые не очень малы, эти рассуждения
теряют справедливость, и доверительные интервалы целе-
сообразно получать путем моделирования методом Монте-
Карло. ,,
Таблицы вероятностей 2.3 и 2.4 Для однократного и двой-
ного экспоненциального сглаживания были получены
М. Бэтти [391.
75'
Таблица 2.3
Функция распределения контрольного сигнала
в случае однократного экспоненциального сглаживания
(полиномиальная модель нулевого порядка)
Вероятность Кт
Я(|/<1 <Кт) v=o,i 1>=0,2 V=0,3 V=0,4 7=0.5

0,70 0,24 0,33 0,44 0,53 0,64


0,80 0,29 0,40 0,52 0,62 0,73
0,85 0,32 0,45 0,57 0,67 0,77
0,90 0,35 0,50 0,63 0,72 0,82
0,95 0,42 0,58 0,71 0,80 0,88
0,96 0,43 0,60 0,73 0,82 0,89
0,97 0,45 0,62 0,76 0,84 0,90
0,98 0,48 0,66 0,79 0,87 0,92
0,99 0,53 0,71 0,82 0,92 0,94

Таблица 2.4
Функция распределения контрольного сигнала
в случае двойного экспоненциального сглаживания
(полиномиальная модель первого порядка)
Вероятность Кт
Р(\К1<Кт) V=0,2 7=0,3 V=0,4 V=0,5
v=o,i

0,70 0,21 0,30 0,39 0,48 0,58


0,80 0,25 0,37 0,47 0,57 0,66
0,85 0,28 0,41 0,52 0,62 0,71
0,90 0,32 0,46 0,57 0,67 0,76
0,95 0,38 0,52 0,65 0,74 0,82
0,96 0,39 0,54 0,67 0,76 0,83
0,97 0,41 0,56 0,69 0,78 0,85
0,98 0,43 0,59 0,72 0,81 0,87
0,99 0,46 0,65 0,76 0,86 0,90

Итак, следящий контрольный сигнал является мерой не-


адекватности модели реальному процессу. При превышении
контрольным сигналом заданного доверительного уровня
(обычно определяемого величиной 2ак) модель может быть
пересмотрена и заменена другой.

§ 4. ОБОБЩЕННАЯ МОДЕЛЬ БРАУНА

Р. Браун [47] еще более расширил возможности


прогнозирования с использованием адаптивных моделей.
Он рассмотрел процесс

76
где

8t — случайная неавтокоррелированная величина со


средним значением 0 и дисперсией о%;
ft (t) — некоторые известные, выбранные заранее детерми-
нированные функции от времени;
at — коэффициенты, подлежащие определению и адап-
тации.
Рассматриваемый процесс может иметь слабые случай-
ные изменения одного или более коэффициента. Р. Браун
задался целью разработать адаптивную процедуру для пере-
смотра оценок коэффициентов при каждом получении но-
вой фактической точки ряда. Ему удалось построить ком-
пактную итеративную модель для случая, когда функции,
входящие в модель, удовлетворяют соотношению

где

L—-матрица постоянных коэффициентов размерностью


(п-п), названная Р. Брауном матрицей перехода.
Такие функции являются решениями линейных разност-
ных уравнений. Ими могут быть лишь полиномы, экспонен-
ты и синусоиды или их произведения. Имея матрицу пере-
хода для соответствующего набора функций, использован-
ных в модели, необходимо также определить значения функ-
ций в какой-либо начальный момент времени, обычно при
t = 0 или t ~ 1. По вектору начальных значений и матри-
це L можно получить значения f (t) для любого момента вре-
мени

Для упрощения расчетов Р. Браун за начало отсчета


времени принимает текущий момент Т, т. е. момент состав-
ления прогноза, За критерий ошибки, который следует ми-
77
нимизировать, взята взвешенная сумма квадратов отклоне-
ний:

где

ß —дисконтирующий фактор, 0 < ß < l .


Далее для подбираемых функций вводится (it'ti) матрица
F (t) с элементами:

F (t) может быть подсчитана рекурсивно:

Здесь проявляется одно полезное свойство принятого


способа отсчета времени. Когда подбираемые функции яв-
ляются тригонометрическими или полиномами и 0 < ß < 1,
то ß' стремится к нулю быстрее, чем они могут расти, так
что матрица F (t) стремится к стабильному значению и ее
обратная матрица \ которая понадобится позже, при до-
статочно большом t рассчитывается один раз и уже не пере-
сматривается.
Для определения оценок коэффициентов модели в соот-
ветствии с выбранным критерием Р. Браун вывел п-компо-
нентный вектор

где F — матрица функций в стабильном состоянии.


1
Так как ни одна из подбираемых функций ft (t) не является
линейной комбинацией остальных (желательно, чтобы они были
т
ортогональными, т. е. чтобы У, U (t) fk (t) = 0 для всех пар IФ k),
то F будет иметь обратную матрицу F- 1 .
78
С его помощью адаптивные коэффициенты щ должны об-
новляться по формуле
(2.12)

где V — транспонированная матрица L;


ег (t — 1) — ошибка прогноза, рассчитанного в момент
t — .1 на 1 шаг вперед.
Константы hi зависят только от частного набора подби-
раемых функций, от вектора начальных значений f (0) и от
величины ß.
Из (2.12) видно, что даже при отсутствии ошибок прог-
нозирования коэффициенты будут изменяться по закону

Это связано с переносом, начала отсчета времени на каж-


дом шаге на 1 интервал вперед. Второе слагаемое в (2.12)
дает правило корректирования коэффициентов в зависимо-.
сти от ошибки прогноза.
Исследуя дисперсию прогнозов, Р. Браун установил,
что модели, состоящие из тригонометрических функций и
постоянной составляющей, характеризуются примерно од-
ной и той же дисперсией прогнозов для всех периодов про-
гнозирования т. При грубой прикидке для этих моделей
можно использовать соотношение

Здесь так же, как в § 3, вводится понятие эквивалентной


постоянной сглаживания, определяемой соотношением

где п — число искомых коэффициентов.


Для моделей, содержащих возрастающие от времени
полиномиальные члены, дисперсия прогнозов зависит от
времени упреждения т. Для небольших значений эквива-
лентной постоянной сглаживания ах — 1 — ß* дисперсия
прогноза по полиномиальной модели первого порядка про-
порциональна периоду прогнозирования

79
а для прогноза по полиномиальной модели второго порядка
она квадратично возрастает от г:

Отметим, что в предельном случае, при Т->-оо, обобщен-


ная модель Р. Брауна, содержащая только полиномиаль-
ные функции, в точности совпадает с рассмотренными выше
моделями многократного сглаживания того же порядка.
Для десяти моделей Р. Брауном разработаны подроб-
ные таблицы, 5 из них (табл. 2.5—2.9) здесь приводятся.
Дисперсии в таблицах измерены в единицах а§. Отметим,
что для получения дисперсии ошибки прогноза нужно к дис-
персии прогноза добавить а%. Все данные приведены для
трех специфических значений эквивалентной постоянной.
Низкое значение ßx = 0,75, т. е. ß" = 0,75, рекомендует-
ся использовать при необходимости быстрой адаптации
оценок коэффициентов. Среднее значение ßx = 0,90. Высо-
кое значение дисконтирующего фактора ß соответствует 0 Д =
= 0,95 и обычно используется при несильном изменении
коэффициентов «генерирующего» процесса.
Под кумулятивным прогнозом в таблицах понимается
сумма прогнозов для периодов упреждения от 1 до т, т. е.

Начальный вектор коэффициентов а 0 должен быть по-


лучен методом взвешенной множественной регрессии на ос-
нове достаточно большого числа данных о процессе, а вы-
бор функций fi (f) осуществляется путем сопоставления
свойств элементарных функций с особенностями реального
процесса. Причем если подбираемые функции являются
тригонометрическими, то для каждой гармоники следует
включать как синус, так и косинус. Адаптация оценок коэф-
фициентов осуществляется по уравнению (2.12),
Рассмотренный метод, строго говоря, правомерен толь-
ко в установившемся состоянии. Заслуга Р. Брауна в том,
что он первый показал, возможность построения адаптив-
ных моделей, способных описывать периодические колеба-
тельные процессы.
В гл. 7, где изучаются процессы интегрированной авто-
регрессии — скользящего среднего, будет показано, что
сейчас появился более обоснованный метод построения мо-
80
Т а б л и ц а 2.5
Адаптивная полиномиальная модель нулевого порядка
Гипотеза:
Модель:
Число коэффициентов: п= 1.

Матрица перехода L Начальные условия

f(0) !(1)
1 h 1 1

Сглаживающий вектор h Дисперсии оценок коэффициентов

ß= 0,75 £>,90 0,95 ß = 0,75 0,90 0,95


0,25 С),10 0,05 1 - 5«= 0,25 0,10 0,05
0,25000 С), 10000 0,05000 0,14286 0,05263 0,02564

Среднеквадратнческая ошибка
Дисперсия прогноза кумулятивного прогноза

TtPMfnTT
ß ß
прогнози- 0,7600 0,9000 0,9500
0,7500 0,9000 0,9500
рования

1 0,1429 0,0526 0,0256 1,0000 1,0000 1,0000


2 0,1429 0,0526 0,0256 1,6036 1,4868 1,4500
3 0,1429 0,0526 0,0256 2,0702 1,8638 1,7974
4 0,1429 0,0526 0,0256 2,5071 2,2005 2,1001
5 0,1429 0,0526 0,0256 2,9277 2,5131 2,3751
6 0,1429 0,0526 0,0256 3,3381 2,8098 2,6312
7 0,1429 0,0526 0,0256 3,7417 3,0950 2,8734
8 0,1429 0,0526 0,0256 4,1404 3,3717 3,1050
9 0,1429 0,0526 0,0256 4,5356 3,6419 3,3282
10 0,1429 0,0526 0,0256 4,9281 3,9068 3,5446
11 0,1429 0,0526 0,0256 5,3184 4,1676 3,7554
12 0,1429 0,0526 0,0256 5,7071 4,4248 3,9614

6-1866 81
Таблица 16
Адаптивная Полиномиальная Модель первого порядка
Гипотеза:
Модель:
Число коэффициентов: п—2.

Матрица перехода Ь Начальные условия

1 0 КО) 1 (1)
к 1 1
1 1 h о •1

Сглаживающий вектор h Дисперсии оценок коэффициентов

ß= 0,86603 13,94868 0,97468 ß= 0,86603 0,94868 0,97468


0,25 3,10 0,05 l - ß « = 0,25 0,10 0,05
hi 0,25000 3,10000 0,05000 Dia,) 0,16937 0,06446 0,03173
К 0,01795 5,00263 0,641X • D (eg) 0.740Х 0.365Х 0,422*
ХЮ-з хю-» хю-* ХЮ-5
Дисперсия прогноза Срсднеквадратическая ошибка
кумулятивного прогноза

период
Р ß
прогнози- 0,86603 0,94868 0,97468 0,86603 0,94868 0,97468
рования

1 0,1900 0,0672 0,0324 1,0000 1,0000 1,0000


2 0,2121 0,0701 0,0331 1,5418 1,4609 1,4369
3 0,2357 0,0730 0,0337 2,0402 1,8457 1,7875
4 0,2607 0,0760 0,0344 2,5351 2,1970 2,0960
5 0,2873 0,0791 0,0351 3,0390 2,5305 2,3794
6 0,3153 0,0822 0,0358 3,5579 2,8540 2,6461
7 0,3448 0,0854 0,0365 4,0950 3,1720 2,9011
8 0,3758 0,0887 0,0372 4,6522 3,4872 3,1475
9 0,4082 0,0921 0,0380 5,2309 3,8016 3,3876
10 0,4422 0,0955 0,0387 5,8319 4,1166 3,6228
11 0,4776 0,0990 0,0394 6,4558 4,4331 3,8543
12 0,5145 0,1026 О.О402 7,1030 4,7519 4,0831

82
Таблица 2.7
Адаптивная полиномиальная модель второго порядка

Гипотеза:
Модель:
Число коэффициентов: « = 3 .

Матрица перехода L Начальные условия

f(0) f (1)
1 0 0 1
1 1 0 h о 1
0 1 1 h о 0

Сглаживающий вектор h Дисперсии оценок коэффициентов

(
ß 0,90856 0,96549 о, 38305 ß= 0,908560,96549 0,98305
l-ßt = 0,25 0,10 о,<35 l-ß«= 0,25 0,10 0,05
Ai 0,25000 0,10000 0,( 35000 D( 0,182730,07038 0,03478
к 0,02394 0,00351 0J 355 X
X Ю-з
D( 0,00154O,758X 0.875X
X10-4 xio-* Л 5
R

0.765Х 0,411Х 0, 187 X D{ 0.151X O.IOOX 0.274X


XlO-s Х10-« X ю-? x 10-? X10-» xio- 9

Среднеквадратическая ошибка
Дисперсия прогноза кумулятивного прогноза

ß
период
прогнози- 0,90856 0,96549 0,98305 0,90856 0,96549 0,98305
рования

I 0,2137 0,0745 0,0358 1,0000 1,0000 1,0000


2 0,2489 0,0789 0,0368 1,5622 1,4666 1,4394
3 0,2884 0,0835 0,0378 2,0921 1,8600 1,7937
4 0,3326 0,0882 0,0389 2,6322 2,2229 2,1071
5 0,3818 0,0932 0,0399 3,1963 2,5708 2,3964
6 0,4364 0,0984 0,0410 3,7912 2,9117 2,6700
7 0,4966 0,1039 0,0422 4,4215 3,2501 2,9328
8 0,5628 0,1095 0,0433 5,0901 3,5889 3,1881
f\ Ч О О I

9 0,6354 0,1154 0,0445 5,7995 3,9301 3,4380


10 0,7147 0,1215 0,0457 6,5516 4,2752 3,6841
11 0,8010 0,1279 0,0469 7,3483 4,6251 3,9275
n лпТС
12 0,8948 0,1345 0,0482 8,1909 4,9808 4,1692
83-
6*
Т а б л и ц а 2.8
Адаптивная модель синусоидальных колебаний

Гипотеза:

Модель:
Число коэффициентов: /г—3.

Матрица перехода L Начальные условия

f(0) f(l)
1 0 0 h ^ 1,00000
0,86603 0,50000 <)I 50000
0
0 -0,50000 0,86603
h
h
о,
0 , 86603

Сглаживающий вектор h Дисперсии оценок коэффициентов

ß= 0,90856 С1,96549 0,98305 ß= 0,90856 0,96549 0,98305


0,25 0,05
l-ß" =
h 0,08593
»,ю
С
С), 03347 0,01668
l - ß » = 0,25 0,10 0,05
D{ax) 0,04512 0,01740 0,00853
0,04360 С,00640 0,00156
Dfa) 0,09012 0,03475 0,01706
h 0,16408 С1,06654 0,03333 D(a3) 0,09456 0,03511 0,01711

Дисперсий прогноза Среднеквадратическая ошибка


•кумулятивного прогноза

период '
ß ß
прогнози-
рования 0,90856 0,96549 0,98305 0,90856 0,96549 0,98305

1 0,1505 0,0530 0,0257' 1,0000 1,0000 1,0000


2 0,1471 0,0527 0,0257 1,5617 1,4696 1,4416
3 0,1395 0,0523 0,0256 1,9894 1,8316 1,7817
4
с 0,1330 0,0520 0,0256 2,3529 2,1407 2,0705
0
о 0,1309 0,0520 0,0256 2,6606 2,4101 2,3237
*7 0,1322 0,0521 0,0256 2,9212 2,6473 2,5495
/ 0,1333 0,0521 0,0256 3,1460 2,8591 2,7537
0 0,1322 0,0520 0,0256 3,3480 3,0522 2,9418
У 0,1309 0,0520 0,0256 3,5411 3,2339 3,1185
Ш • 0,1331 0,0522 0,0256 3,7388 3,4111 3,2883
11 0,1396 0,0526 0,0257 3,9525 3,5894 3.4547

0,1472 0,0529 0,0257 4,1885 ' 3,7719 3,6199
84
Т а б л и ц а 2.9
Адаптивная модель синусоидальных колебаний
с тенденцией линейного роста

Гипотеза:

Модель:
Число коэффициентов: п = 4.
Матрица перехода L Начальные условия

1 0 0 0 f(0) f (1)
0 0 1 ,00000
1 1
0
0
0
0
0,86603
-0,50000
0,50000
0,86603
Ü 0 1 ,00000
кпппп
и ,öUUUU
0
Ü 1
0 ,86603

Сглаживакмци! вектор h Дисперсии оценок коэффициентов

0,93061 0,97400 0,98726


1-.&»"= 25 0,10 ?:
93061 0,97400 98726
05 i-F"= 0,25 0,10 0,05
0,08510 0,03245 0,01593
h 0 12949 0,05024 о, 02503
К 0 ,00457 0.660Х 0.160Х Dfa) 0.866X 0.452X 0.526X
4
3
хю- хю-? хю- 8
хю- хю-
8
h3 0 ,04113 0,00605 о,00148 D(aa) 0,06879 0,02614 0,01281
0 ,12052 0,04977 о,02499 D(at) 0,07074 0,02633 0,01283
Среднеквадратическая ошибка
Дисперсия прогноза кумулятивного прогноза
— . —
. •
ß
Р »•I ' —
——
период . и —

0,98726
прогнози- 0,98726 0,93060 < ),97400
0,93060 0,97400
рования -

.

1,0000 1,0000
1 0.172С 0,0602 0,0291 1,0000 1,4342
1,4545
2 0,1798 0,0613 0,0293 1,5188
1,8224 1,7769
3 0,1825 0,0621 0,0296 1,9656
n 1440 2,0715
4 0,1824[ 0,0626 0,0297 2,369U 2,4325 2,3336
5 0,1825 0,0629 0,0298 2,7361 2,6951 2,5713
6 0,1821/г 0,0630 0,0298 3,0732 2,9379 2,7903.
7 0,183« 0,0631 0,0298 3,3884 3,1666 2,9953
8 0.185J 0,0632 0,0298 3,6923 3,3872 3,1905
9 0,189«$ 0,0637 0,0299 3,9968 о 6054 3,3796
10 0,1997Г 0,0646 0,0301 4,3135 3,8255 3,5656
11 0,21651 0,0660 0,0304 4,6518 4,0504 37503
12 0,23351 0,0677 0,0308 5,0166
85
Влияние величины периода упреждения т
оптимальное значение параметра адаптации а и средний квадрат
экспериментов

|
ело точек

модели
Выборка из ряда Средний
а, квадрат
ошибки

I 2 3 4 8 6

1 Курс акций фирмы ИБМ, дол. 144 1 0,9600 41,427


2 Курс акций фирмы ИБМ
(часть 1) 48 1 0,9450 32,956
3 Курс акций фирмы ИБМ
(часть 2) 48 1 0,9992 46,294
4 Курс акций фирмы ИБМ
(часть 3) 48 1 0,9120 43,419
5 Цена на золото, дол. за унцию 360 1 0,8410 0,50123
6 Цена на золото (часть 1) 60 1 0,7510 0,08265
7 Цена на золото (часть 2) 60 1 0,9991 0,10480
8 Цена на золото (часть 3) 60 2 0,2711 0,02884
9 Цена на золото (часть 4) 60 1 0,9709 0,14521
10 Цена на золото (часть 5) 60 1 0,9999 0,84637
11 Цена на золото (часть 6) 60 1 0,5709 1,6928
12 Поставка минеральных
удобрений сельскому
хозяйству, тыс. т усл. ед. 30 2 0,8010 28.148Х
13 Производство электроэнер- xios
гии, млрд. кВт-ч 31 2 0,8990 26,593
14 Производство гидроэлектро-
1 С энергии, млрд. кВт-ч 31 2 0,5121 27,456
15 Сумма вкладов населения
в сберкассы, млн. руб. 26 2 0,9909 10.920Х
v .10 в
16 Численность городского
населения, млн. чел. 27 2 0,9191 0,32741
17 Протяженность нефте- и
нефтепродуктопроводов,
тыс. км 21 2 0,6029 1,4529
18 Грузооборот нефте- и нефте-
1О продуктопроводов, ткм 21 3 0,7298 168,732
19 Урожайность зерна,
ц с га 30 2 0,0191 2,2653
20 Урожайность картофеля,
ц с га 30 1 0,3060 170,716
21 Урожайность овощей,
on ц с га 30 2 0,0668 78,732
22 Производство яиц,
млрд. шт. 30 2 0,7291 1,9412
86
Таблица 2.10
на выбор типа модели Брауна,
ошибки ретроспективных прогнозов
t== 2 т== 3 Т=4 x== 5

1 1 I 1
а
1||
и ио
а
ill §
а
ill
б-Sl 2
а
§§*°
U XО

'7 " 8 ' 9 То И 12 13 и 15 ti 17 IS

1 0,8801 80,153 1 0,9480 112,390 1 0,9109 149,867 1 0,9610 184,634


] 0,0200 60,628 1 0,5830 76,934 1 0,6779 89,011 1 0,8500 102,58
1 0,6740 89,277 1 0,8320 108,44 1 0,9210 138,34 1 0,9490 179,08
И Q.9900 80,414 2 0,1350 120,91 2 0,1080 147,54 2 0,0990 171,05
1 0,7440 0,86646 1 0,6990 1,17043 1 0,7160 1,44257 1 0,7701 1,71068
1 0,7900 0,12906 1 0,9200 0,17592 1 0,8720 0,25169 1 0,9898 0,31361
1 0,6999 0,21768 1 0,9995 0,34643 1 0,9518 0,47156 1 0,9990 0,57996
0,2801 0,03570 2 0,2980 0,04503 1 0,7998 0,05862 1 0,7998 0,07811
2 0,870 0,43443 2 0,1781 0,54055
! 0,2201 0,26517 2 0,2020 0,34595 1,6260
2 0,2035 1,2007 2 0,2070 1,3898 2 0,2229 1,5265 2 0,2519
1 0,5780 1 0,2390 3,0749 1 0,1760 3,4759
2,0442 1 0,7190 2,4167

2 0,6529 96.117Х 2 0,6520 184,265X 2 0,6909 313.713х 2 0,7200 539.805X


ХЮ'
ХЮ» ХЮ»
х Ш5
2 0,8900 113,153 2 0,9390 293,255 2 0,9620 674,750 2 0,9890 1367,83
2 0,3900 59,887 2 0,3372 98,412 2 0,3248 133,206 2 0,3481 160,083
2 0,9916 54.069Х 2 0,9990 135.774Х 2 0,9990 291.646Х 2 0,9990 544,420X
ХЮ»
ХЮ1 ХЮ'
Х105
2 0,8001 1,46924 2 0,0708 0,22443 2 0,0622 2,58524 2 0,0589 2,88108

2 0,6699 3,3538 2 0,4900 6,5018 2 0,4020 8,0100 2 0,3602 9,4980


3 0,6192 829,823 3 0,5490 1723,930 3 0,4907 3002,625 3 0,3709 4870,605
2 0,0210 2,2758 2 0,0089 2,3475 2 0,0031 2,4393 2 0,0031 2,5337
1 0,3500 166,539 1 0,3700 190,810 1 0,3271 219,417 1 0,3780 238,950
2 0,0710 76,065 2 0,1000 68,214 2 0,0701 75,964 2 0,0770 78,838
2 0,5611 6,1755 2 0,5030 12,0070 2 0,0010 10,608 2 0,0010 11,0246
87
делей, частным случаем которого являются модели, paccMOf-
ренные в данном параграфе. Однако на практике метод
Р. Брауна благодаря своей простоте может быть полезен на
этапе грубых прикидок или для обработки большого коли-
чества сходных рядов, когда проведение полной процедуры
идентификации и оценки параметров модели, предусмот-
ренной в гл. 7, для каждого ряда невозможно. Но и в этих
случаях метод Р. Брауна лучше использовать не в чистом
виде, а с модификациями, рассмотренными в гл. 4 и 5.

§ 5. ПРИМЕРЫ
Пример 2.1
Проведен эксперимент, целью которого было вы-
явление влияния величины периода упреждения т на выбор
порядка полиномиальной модели и величину оптимального
а в моделях многократного сглаживания. Результаты пред-
ставлены в табл. 2.10. В этой таблице номера моделей озна-
чают: № 1 — полиномиальная модель нулевого порядка,
№ 2 — полиномиальная модель первого порядка, № 3—
полиномиальная модель второго порядка.
Как-видно из таблицы, в экспериментах № 4, 8, 9, 10 с
увеличением т произошла замена одной модели другой. В
экспериментах № 1 1 , 14,16,17, 18, 22 значение оптималь-
ного а с ростом % заметно падает. Это означает, что с увели-
чением периода упреждения веса, приписываемые членам
ряда, перераспределяются в пользу более ранних наблюде-
ний. В остальных случаях величина а 0 П т остается прибли-
зительно постоянной.

Пример 2.2
На рис. 2.7 изображены прогнозы курса акций ИБМ,
полученные по полиномиальной модели Брауна второго по-
рядка с h — 0,1. Доверительные уровни прогнозов, нане-
сенные на график, определялись адаптивно методом экс-
поненциального сглаживания квадратов ошибок прогно-
зов с постоянной сглаживания а = 0,1. Анализ графика по-
казывает, что реальный процесс укладывается в получен-
ные таким образом доверительные уровни. Однако для луч-
шего выравнивания квадратов ошибок целесообразно ис-
пользовать а < 0,1.
88
Глава 3
АДАПТИВНАЯ МОДЕЛЬ
ПРОГНОЗИРОВАНИЯ ВРЕМЕННОГО РЯДА,
ГЕНЕРИРУЕМОГО
АВТОРЕГРЕССИОННОЙ СХЕМОЙ
С ДРЕЙФУЮЩИМИ КОЭФФИЦИЕНТАМИ

В этой главе рассматривается еще один метод


прогнозирования членов ряда на основе предшествующих
данных, называемый адаптивной фильтрацией. Этот Метод
применяется, когда текущий член ряда связан с предыду-
щими членами этого же ряда линейным соотношением, в
котором коэффициенты могут быть переменными.

§ 1. ОБЩАЯ СХЕМА АДАПТИВНОГО ФИЛЬТРА

В работах [109, ПО, 111] С. УилрайтиС. Макри


дакис предприняли попытку использовать адаптивную
фильтрацию для получения краткосрочных прогнозов. Од-
.нако Д. Монтгомери в [81] подверг их метод критике; ме-
тод охарактеризован как предназначенный для обработки
только авторегрессионных стационарных рядов. Параметры
авторегрессии в методе оцениваются в итеративном процес-
се обучения модели. Значение параметра, обеспечивающего
сходимость этого процесса, отыскивается методом проб.
Такое оценивание с вычислительной точки зрения значи-
тельно уступает прямому оцениванию методом линейной
множественной регрессии. Кроме того, на том же ряде ме-
сячных продаж шампанского во Франции, использовав-
шемся при расчетах авторами метода, было проведено про-
гнозирование по модели П. Уинтерса (см. гл. 2, § 2) и моде-
ли Дж. Бокса — Г. Дженкинса ([5], вып. 1, гл. 9). Преиму-
щество осталось за двумя последними моделями,
90
Учитывая опыт первых попыток построения моделей,
основанных на идее адаптивной фильтрации, мы предла-
гаем способ организации адаптации моделей авторегрес-
сионного типа на принципах, сходных с теми, которые ис-
пользуются в экспоненциальной средней.
Операция линейной фильтрации заключается в вычис-
лении взвешенной суммы предыдущих наблюдений. В на-
иболее общем виде эта сумма записывается как
(3.1)

где S — взвешенная средняя;


(Hi — вес, приписываемый наблюдению £;
Xt — значение, наблюденное в момент i;
I — число наблюдений, используемое при подсчете S.
Метод скользящих средних, например, состоит в том, что
усредняются / последних членов ряда, а затем полученное
среднее используется как прогноз, т. е.
(3.2)

Таким образом, последние / данных имеют'одинаковый


вес -j, а более ранние данные имеют нулевой вес.
Формула экспоненциального сглаживания

может быть записана в виде:


(3.3)
Здесь наибольший вес имеет текущее значение xt, а для
более старых наблюдений имеет место геометрическое убы-
вание весов.
Отсюда видно, что эти методы отличаются лишь прави-
лом определения весов со,. Метод прогнозирования с по-
мощью адаптивного фильтра это просто другой подход к оп-
ределению весов, другой способ построения фильтра.
Очевидно, что из-за различий в весах от этих методов сле-
дует ожидать различных результатов, различной точности
прогнозов.
Первая работа, посвященная синтезу фильтра, была
опубликована Н. Винером [112] в 40-е годы. Винер рассмот-
91
рел вопросы построения линейных фильтров с постоянными
коэффициентами для элиминирования шума и для сглажи-
вания и прогнозирования стационарных процессов. Разра-
ботанные им процедуры дают оптимальные с точки зрения
критерия наименьших квадратов результаты для случаев,
когда ряд действительно стационарен.
Продолжая работу Винера, различные авторы, включая
Р. Кальмана и Р. Бьюси [70], разработали процедуры^ да-
ющие оптимальные изменяющиеся во времени линейные
фильтры для неста-
ционарных времен-
ных рядов. Для та-
ких рядов метод
Кальмана — Бьюси
может дать лучшие
результаты, чем обыч-
ный метод Винера.
Недостаток про-
Рис. 3.1. Общая схема определения весов
в прогнозе временного ряда цедур Винера и Каль<
мана — Бьюси,в том,
что фильтры должны быть построены на основе апри-
орных данных или допущений относительно статистик рас-
сматриваемого временного ряда. На практике эти два мето-
да фильтрации дают минимальные ошибки прогноза только
при условии, что статистические характеристики ряда дей-
ствительно соответствуют априорной информации, на ос-
нове которой были построены фильтры.
В описываемом здесь методе адаптивной фильтрации ста-
тистики ряда не измеряются, но учитываются неявно в про-
цессе построения фильтра и итеративного обновления весов
в- ходе его адаптации.
Для того чтобы понять процедуру адаптивной фильтра-
ции, рассмотрим рис. 3.1, на котором представлена общая
схема определения весов в прогнозе временного ряда.
Нижняя часть рисунка отражает то, что происходит- в
действительности. Реальные события взаимодействуют друг
с другом в некой сложной динамической системе, в резуль-
тате на выходе переменная принимает определенное значе-
ние.
Блоки и линии связи, расположенные выше, отражают'
процедуру адаптивной фильтрации. Это итеративная про-
цедура. Ее цикл состоит в том, что берется данный набор
весов, по ним делается прогноз, затем подсчитывается ошиб-
92
ка прогноза как разница между прогнозом и фактическим
наблюдением, наконец, осуществляется корректировка ве-
сов для уменьшения среднего квадрата ошибки.
Задача состоит в том, чтобы найти подходящую проце-
дуру корректировки (адаптации) весов, позволяющую пере-
страивать модель (фильтр) в соответствии с текущей дина-
микой ряда. В следующем параграфе рассмотрим такую про-
цедуру.

§ 2. АДАПТАЦИЯ КОЭФФИЦИЕНТОВ
МОДЕЛИ АВТОРЕГРЕССИИ

Итак, ключом к эффективности адаптивной филь-


трации является правило, используемое для адаптации ве-
сов на каждом шаге. Это правило может быть выведено пу-
тем анализа ошибки прогноза.
В модели адаптивного фильтра предполагается, что про-
гноз следующего члена ряда может быть получен с помощью
взвешенной суммы / прошлых членов ряда
(3.4;
где S — взвешенная средняя, определяемая выражением
(3.1).
Выражение (3.4) имеет авторегрессионный характер. По-
этому эту модель будем также называть адаптивной моделью
авторегрессии порядка /. После того как становится извест-
ным xt + г — фактическое значение ряда в момент t -f I,
можно подсчитать ошибку прогноза et + 1 — xt + i— %\(t)—
~ xt + 1— Scope,.
Ьсе суммирования здесь и далее будут производиться от
t - / + 1 до L
Запишем выражение для квадрата ошибки:

Это выражение показывает, что квадрат ошибки является


квадратической функцией от весов щ. Геометрической ин-
терпретацией этой функции в трехмерном пространстве яв-
ляется параболический цилиндр. При определенном со-
четании весов (вдоль прямой 2 в д « xt +,) функция при-
нимает минимальное значение, равное нулю.
93
Предполагается, что в момент t — 1 были получены не-
которые оценки весовых коэффициентов, по которым и под-
считана оценка xt. Если использованные оценки весовых
коэффициентов привели к ненулевой ошибке, то имеется
возможность скорректировать веса так, чтобы уменьшить
ошибку. Можно было бы выбрать такие веса, которые сводили
бы ошибку к нулю. Но нужно иметь в виду, что по оценкам
весов, полученным в момент t, будет сформирована оценка
величины xt + 1. Между тем в момент * + 1 функция ef+i от
весов изменится, так как ее коэффициенты (т. е. значения
х-ов) будут другими. В трехмерном пространстве эту функ-
цию будет отображать другой параболический цилиндр, при-
нимающий минимальное значение вдоль новой прямой. Та-
ким образом, процедуру адаптации весов в момент t нельзя
рассматривать изолированно, так как корректировка весов
на основе текущей ошибки производится с целью минимиза-
ции будущей ошибки. Поэтому процедура адаптации весов
должна учитывать динамические особенности процесса и
предусматривать сглаживание чисто случайных колебаний
параметров изучаемой системы.
Очевидно, корректировку весов можно осуществлять
различными способами. Мы рассмотрим один из них. Для
адаптации весов воспользуемся методом наискорейшего
спуска. Сущность его состоит в выборе начальной точки на
исследуемой поверхности и последующем передвижении к
низшей точке поверхности с применением итеративной
процедуры. Для этого необходимо иметь возможность вы-
числять в каждой точке поверхности вектор, указываю-
щий направление движения. Тогда можно корректировать
веса таким образом, что новые веса будут представлять точ-
ку, которая ближе к оптимальному набору весов по сравне-
нию со старыми весами, При использовании метода наиско-
рейшего спуска корректировка весов осуществляется по
следующему правилу:

где Wc — вектор старых весов;


W н — вектор новых весов;
к — коэффициент (k > 0);
grad (ef+i) — вектор, градиент ef+i.
Это уравнение показывает, что корректировка весов
производится путем добавления к старому вектору весов по-
правки, получаемой умножением коэффициента k на гра-
94
диент, взятый с отрицательным знаком. Градиент с отрица-
тельным знаком указывает наикратчайший путь достижения
минимума исследуемой поверхности, а коэффициент к оп-
ределяет, насколько мы продвигаемся в этом направлении.
Компоненты градиента находим дифференцированием
квадрата ошибки по весам:

В результате получаем, что градиент в целом

где X — вектор / последних наблюдений. Это определяет


способ корректировки весов

Неизвестным остается значение k, определяющее ско-


рость движения в направлении, обратном градиенту. Что-
бы определить характер влияния k на процедуру адапта-
ции, поступим следующим образом. Вернемся в точку /
и вновь сделаем прогноз, но уже с весами Wn. Получим но-
вое значение ошибки:

где et + 1 — ошибка, полученная при старых весах (tuc)f.


Теперь если положить

и п р и О < а < 2 | ( « « ) l + 1 | < | * + i|.


Следовательно, а определяет реакцию модели на полу-
ченную ошибку и корректирует веса так, чтобы компенси-
ровать ошибку на ( 1 — | \—а\) • 100% или при 0 < а < 1
на а • 100%. Вспомним простое экспоненциальное сгла-
живание (гл. 1, § 2), где экспоненциальная средняя кор-
ректируется аналогичным образом: S< = S 4 -i + «<*ь гДе
e
t **<— S , ^ .
Будем называть а параметром адаптации модели и счи-
тать его заданным и постоянным, k при этом будет пере-
менной величиной. Оптимальное значение а, обеспечиваю-
щее минимум среднего квадрата ошибки, можно определить
95
методом проб на ретроспективном материале. Определение
оптимального значения а можно назвать процедурой «обу-
чения» адаптивного фильтра.
§ з. ПРИМЕРЫ
Нами было проведено экспериментальное срав-
нение метода адаптивной фильтраций с другими методами,
рассматриваемыми в этой книге. Модели сравнивались на
одном и том же статистическом материале, приведенном в
приложении № 4. Временные ряды экономического содер-
жания имели различную динамику. Объем выборок от 21 до
360 точек.
Результаты сопоставления моделей на основе оценок
точности ретроспективного прогнозирования приведены в
табл. 6.7 и 7.4. Из этих- таблиц видно устойчивое преиму-
щество адаптивной модели авторегрессии перед моделями
Брауна и их модификациями. Как известно, экономические
ряды очень часто имеют авторегрессионный характер. По-
этому такие результаты получены, очевидно, не случайно.
Лишь метод Бокса — Дженкинса, рассматриваемый в гл. 7,
по-видимому, чаще дает несколько меньшую, ошибку про-
гнозирования, чем метод адаптивной фильтрации. Одна-
ко простота построения и использования адаптивной модели
авторегрессии позволяет выбирать структуру модели (оп-
ределять величину I) и получать прогнозы на ЭВМ. Это де-
лает ее намного привлекательнее моделей Бокса — Джен-
кинса, построение которых требует привлечения высоко-
квалифицированных специалистов.
На рис. 3.2 приведен график, иллюстрирующий ретро^
спективное прогнозирование одного из рядов по адаптивной
модели авторегрессии. Первые значения весов для начала
итеративной процедуры адаптации как в этом, так и в ос-
тальных случаях моделирования определялись оцениванием
методом наименьших квадратов соответствующей линейной
множественной регрессии на базе первых 15 точек выборки.
Порядок модели авторегрессии, т. е. оптимальное зна-
чение параметра /, в экспериментах определялся методом
перебора значений / от 1 до 5. В большинстве случаев /0Пт
было равно 1 и ни разу не оказалось больше 3.
В заключение отметим, что использование статисти-
ческих измерителей точности в методе адаптивной фильт-
рации остается областью, еще не исследованной. Практи-
чески/если выборка невелика « 50—60 точек), в качестве
статистического показателя, характеризующего довери-
тельные интервалы прогноза, можно использовать средне-
квадратическую ошибку ретроспективных прогнозов. Если
же объем выборки составляет 100—200 или более точек,

Рис. 3.2. Ретроспективное прогнозирование


производства яиц по адаптивной модели
авторегрессии # t (7) « а,х,, т =1

можно рекомендовать оценку доверительных интервалов


по среднеквадратической ошибке, подсчитанной с помощью
метода экспоненциального сглаживания.
В гл. 8 (§ 2) метод адаптивной фильтрации будет при-
менен для построения адаптивной модели множественной
регрессии общего вида.
Глава 4
МОДЕЛИ С АДАПТИВНЫМИ
ПАРАМЕТРАМИ АДАПТАЦИИ

Глава посвящена моделям с повышенной спо-


собностью к самообучению — моделям с адаптивными пара-
метрами адаптации. Рассматриваются различные способы
регулирования быстроты реакции модели в зависимости
от текущих свойств временного ряда.

§ 1. СКОРОСТЬ РЕАКЦИИ КАК ФУНКЦИЯ


СЛЕДЯЩЕГО КОНТРОЛЬНОГО СИГНАЛА
(МОДЕЛЬ ТРИГГА — ЛИЧА)

В гл. 2 § 3 был рассмотрен следящий контроль-


ный сигнал Kt =-И-. Было показано, что он является мерой
et
неадекватности' модели реальному процессу. Оказалось
возможным использовать его для автоматического регу-
лирования параметра адаптации модели.
Д. Тригг и А. Лич [105] предложили модифицировать
предсказывающие системы, использующие экспоненциаль-
ное сглаживание, посредством изменения скорости реакции
в зависимости от величины контрольного сигнала. В прос-
тейшей модели это эквивалентно регулированию параметра
сглаживания а. Наиболее очевидный способ заставить
систему автоматически реагировать на расхождение прог-
нозов и фактических данных — это увеличение а с тем,
чтобы придать больший вес свежим данным и, таким обра-
зом, обеспечить более быстрое приспособление модели к но-
вой ситуации. Как только система приспособилась, необ-
ходимо опять уменьшить величину а для фильтрации
шума.
98
Простой способ достижения такой адаптивной ско-
рости реакции состоит в" выборе

где Kt — следящий
1
-контрольный сигнал.
На рис. 4.1 показано испытание полиномиальной мо-
дели нулевого порядка с переменным, параметром а при
прогнозировании искусственного ряда.

Рис. 4.1. Сравнение реакций полиномиальных моделей


нулевого порядка Брауна (ß=0,9) и Тригга—Лича на
ступенчатое изменение уровня ряда, т=1

Крестики на рисунке, отражают значения членов вре-


менного ряда, в котором наблюдается изменение ступен-
чатого типа. Ряд искусственно генерирован по модели

где Bt — неавтокоррелированные. случайные нормальные


отклонения с нулевым математическим ожиданием и диспер-
1
Рис. 4Л—4.4 заимствованы из работы Тригга н Лнча.
99
7*
сией а 2 . Реакция простейшей модели экспоненциального
типа с постоянным коэффициентом сглаживания а = 0,1
отмечена кружками. Пунктирная линия характеризует
реакцию подобной же системы, но с переменным cct. Можно
видеть, что система с адаптивным а приспосабливается
к ступенчатым изменениям намного быстрее, а после отра-
ботки ступеньки размах ее колебаний не больше, чем
у обычной системы, поскольку контрольный сигнал, по-
строенный по принципу сглаженной ошибки, остается боль-
шим, как правило, только пока прогнозирующая система
находится'в переходном режиме; Аналогичная модифика-
ция возможна и- для более сложных моделей. Рассмотрим
частный случай обобщенной модели Р. Брауна — модель
линейного роста (п = 2)

для которой уравнения обновления коэффициентов будут:

Из уравнений видно, что оценка среднего уровня процес-


са % реагирует на ошибку прогноза со скоростью (1 — ßa)<
В моделях Р. Брауна с п параметрами скорость реакции
определяется величиной (1 — ß n ), называемой эквивалент-
ной постоянной сглаживания.
В многопараметрической модели Р. Брауна представ-
ляется естественным приравнять эквивалентную постоян-
ную сглаживания модулю контрольного сигнала. В линей-
ной модели мы могли бы положить

откуда

Это означало бы, что каждый элемент вектора h как функ-


ции от ß каждый раз претерпевает соответствующие изме-
нения. Однако эксперименты показали, что зависимость
всех элементов hi от контрольного сигнала ухудшает прог-
ноз, делая его неустойчивым. Если же ограничить моди-
фикацию вектора h только его первой составляющей hlt
то эксперимент показывает, что во всех случаях такая сис-
тема приводит к более стабильным результатам.
100
На рис. 4.2 показан ряд с линейной тенденцией роста,
на который наложены те же случайные данные, что и на
рис. 4.1. В этом примере среднеквадратическое отклонение
шума взято пропорциональным среднему уровню ряда.
Реакция, соответствующая прогнозу на один шаг вперед
обычной модели линейного роста с эквивалентной постоян-

Рис. 4.2. Сравнение реакций на линейное изменение


Уровня ряда полиномиальных моделей первого порядка
Брауна и Тригга—Лача, ß 2 =0,9, т = 1

ной (1 — ß2) == о, 1, отмечена кружками. Прогнозы ана-


логичной модели, но с К = | Kt | показаны пунктиром.
На рис. 4.3 линия, обозначенная крестиками, пока-
зывает те же случайные данные, но с синусоидальным коле-
банием с периодом 52 (52 недели в году).
Через 15 интервалов возникает ступенчатое изменение и
отмеченная кружками линия показывает реакцию модели

при ( 1 — ß4) = 0 , 1 , т = 1.
Пунктирная линия обозначает реакцию той же модели,
когда hx^lKtl-
Практическое моделирование дало результаты, похожие
на представленные на рис. 4.1—4.3, т. е. приравнивание Кх
модулю следящего контрольного сигнала дает значительно
101
большую скорость приспособления к новому характеру
ряда.
Ясно, что не во всех реально возникающих ситуациях
модели с адаптивным параметром а дают лучшие прогнозы
по сравнению с обычными адаптивными системами. На
рис. 4.4 показаны сравнительные реакции этих моделей
на большой одиночный импульс. Система с адаптивной JCKO-
ростью испытывает большее возмущение от этой случайной
помехи. М. Л. Шоун [99] предлагает решать проблему чрез-

Рис. 4.3. Сравнение моделей Брауна и Тригга—Лича,


rt=4; ß n =0,9, t = l

мерной реакции на большой одиночный импульс путем за-


держки использования контрольного сигнала на' один шаг.
Если взять в качестве первого элемента вектора h для дан-
ного момента t модуль контрольного сигнала, подсчитанный
в предыдущий момент t — 1, то отмеченный недостаток
преодолевается. Реакция на ступеньку или на линейный
тренд станет при этом медленнее.
Метод приравнивания ht — | Кt\ прост и эффективен.
Особенно он удобен там, где прогнозы делаются на ЭВМ
для большого числа рядов. Если динамика ряда не изме-
няется, то шум фильтруется столь же эффективно, как и
обычным методом с постоянным параметром а. Когда такие
возмущения все же случаются, адаптация происходит более
быстро.
Этот метод особенно ценен для моделирования .рядов
с короткой историей или на первоначальном этапе построе-
ния модели. Чтобы им воспользоваться, достаточно про-
вести грубую оценку коэффициентов прогнозирующей мо-
!02
дели. Если ошибки прогнозов по этой модели велики, то
у контрольного сигнала проявляется тенденция к быстро-
му абсолютному росту и система приспосабливается с соот-
ветствующей скоростью. Этот метод позволяет обойти про-
блему определения оптимального значения а. Однако воз-
никает задача выбора наилучшего значения у для подсчета
контрольного сигнала.

Рис. 4.4. Сравнение реакций простейших моделей


Брауна и Тригга—Лича (п=1) на единичный им-
пульс, т = 1
В приведенных выше примерах моделирования величина
V = 0,1. Если необходима большая осторожность по отно-
шению к скорости процесса адаптации, величину у можно
уменьшить и взять Y = 0,05. После того как у задана, мо-
дель работает автоматически. Иногда все же необходимо
вмешательство человека для корректировки прогнозов,
даваемых системой с адаптивной скоростью реакции, так-
как нельзя ожидать, что система справится с любыми из-
менениями в структуре ряда. Кроме того, исследователь
может располагать ценной дополнительной информацией.
Моделирование реакции простейшей модели на ступен-
чатые изменения показало, что хотя модель довольно быстро
устанавливается на новом среднем уровне, контрольный
сигнал еще некоторое время остается большим. Это мешает
системе отфильтровывать случайный шум, что особенно
проявляется, когда константа у, использованная для полу-
103
чения сглаженной ошибки и среднего абсолютного откло-
нения, мала, скажем, 0,05. Большая величина v увели-
чивает дисперсию экспоненциальной средней ошибки, до не-
которой степени ухудшая возможности достижения цели,
ради- которой используется адаптивная скорость реакции.
Заметим, что функции, распределения контрольного
сигнала, указанные в табл. 2.3—2.4, не могут быть исполь-
зованы для анализа системы с адаптивной скоростью реак-
ции.
Примеры
Рассмотрим некоторые примеры. Для того чтобы выяс-
нить, насколько полезна модификация Тригга и Лича,
к временному ряду курса акций фирмы ИБМ из 150 точек
и к ряду цен на золото из 370 точек мы применили модели
Брауна, Тригга—Лича (ТЛ), Тригга—Лича—Шоуна
ТЛШ). Полученные результаты сведены в табл. 4.1 и 4.2.
Таблица 4.1
Средние квадраты ошибок прогнозирования
курса акций фирмы ИБМ
по адаптивным моделям с ß n =0,9

^ч. Срок
х,. прогноза х
1 2 3 4 S 6 7 8 9 10
Полиноииаль-^N.
иая модель \ ^

Брауна порядка 0 248 297 349 402 458 518 579 643 707 772
порядка 1 180 217 255 297 343 388 435 477 512 559
порядка 2 182 221 263 320 388 436 471 493 613 716

ТЛ порядка 0 59 94 130 167 206 249 297 355 417 474


7 = 0 , 3 порядка 1 60 94 128 166 208 253 296 338 366 405
порядка 2 61 93 131 195 297 361 373 311 422 584

ТЛШ порядка 0 63 102 134 169 205 248 303 362 421 474
? = 0 , 3 порядка 1 61 100 132 167 205 247 299 345 369 403
порядка 2 61 100 138 197 297 352 373 318 400 525

Сравнение этих результатов свидетельствует о преиму-


ществах моделей Тригга—Лича перед соответствующими
моделями Брауна. Задержка при использовании контроль-
ного сигнала для обновления параметра сглаживания, пред-
ложенная Шоуном, для ряда курса акций ИБМ практически
104
Т а б л и ц а 4.2
Средние квадраты ошибок прогнозирования цен на золото
по адаптивным моделям с ß n = 0 , 9

^ ч Срок
N^ прогноза т
2 3 5 6 7 8 9 10
Полнномналь- Л.
ная модель ^ \

Брауна порядка 0 2,16 2,57 2,98 3,40 3,85 4,32 4,81 5,32 5,84 6,38
порядка 1 1,48 1,75 2,01 2,28 2,56 2,86 3,18 3,50 3,83 4,17
порядка 2 1,64 1,96 2,27 2,59 2,94 3,31 3,71 4,12 4,56 5,01

ТЛ порядка 0 0,68 1,13 1,45 1,70 1,97 2,22 2,55 2,89 3,18 3,47
Y=0,3 порядка 1 0,69 1,13 1,42 1,64 1,87 2,07 2,35 2,63 2,85 3,07
порядка 2 0,72 1,14 1,41 1,61 1,81 1,98 2,23 2,45 2,61 2,79

ТЛШ порядка 0 0,57 0,95 1,26 1,52 1,79 2,09 2,46 2,86 3,22 3,51
7 = 0 , 3 порядка 1 0,60 0,95 1,21 1,42 1,62 1,85 2,15 2,47 2,75 2,94
порядка 2 0,62 0,96 1,22 1,43 1,63 1,85 2,14 2,42 2,67 2,84

ничего не меняет, а для ряда цен на золото дает некоторое


повышение точности.
Из таблиц также видно, что полиномиальные модели
ТЛШ нулевого, первого и второго порядков имеют примерно
одинаковые дисперсии ошибок для небольших т. Графики
(мы их не приводим) для моделей ТЛШ при % — 1, 2, 3
подтверждают, что специфика полиномиальных моделей
нулевого, первого и второго порядков здесь теряется и
прогнозы этих предикторов располагаются весьма близко.
Это же относится к моделям ТЛ. Такой результат объяс-
няется тем, что корректировка прогнозов обеспечивается
в основном за счет корректировки первого коэффициента
полиномиальных моделей.
§ 2. РЕГУЛИРОВАНИЕ ПАРАМЕТРА АДАПТАЦИИ
ПО ИЗМЕНЕНИЯМ СПЕКТРАЛЬНЫХ
ХАРАКТЕРИСТИК

Модель Рао и Шапиро (спектральная модель)


Изменения в структуре рядов (острый пик или
ступенчатое изменение) будут обнаруживаться в их спект-
ральных характеристиках. Основная идея метода 1Ш зак-
лючается в том, чтобы использовать изменения в спектре
105
для управления величиной а в процедуре подсчета экспо-
ненциальной средней. Спектр оценивается сначала для
отрезка временного ряда, образуемого членами 1, 2, ..., N,
затем для отрезка с членами ряда 2, 3, ..., N + 1 и т. д.
Ряд рассматривается как бы через движущееся вдоль оси
времени окно постоянной ширины N. Таким образом,
спектр последовательно оценивается для частично пере-
крывающихся отрезков временного ряда постоянной дли-
ны. Длина этих отрезков N должна быть достаточно ве-
лика, чтобы получать устойчивые оценки некоторого числа
компонент спектра, но не слишком большой, иначе случай
фундаментального изменения ряда будет потерян при ус-
реднении.
Спектральная плотность случайного процесса характе-
ризует распределение всей энергии стационарного ряда как
функцию частоты. Математически этоможет быть выражено
в виде преобразования Фурье автоков'ариационной функции
ряда.
Оценки спектральной плотности как функции частоты
получают, подсчитывая1:

где т — максимальная величина лага, для которого под-


считывается автоковариационная функция;
N — длина временного отрезка.
Первичные спектральные оценки затем выравниваются.
Это предлагается делать методом Тьюки—Хеннинга:

ф
* Еслиотне простое число, то возможно быстрое преобразование
УРье, экономное с вычислительной точки зрения (см. [13, вып. 2,
с 681).
106
для h = 1, 2, .... т — 1;

В экспериментах была выбрана длина временного отрез-


ка N = 36 точек, при т — б, т. е. всего семь компонент
спектра. Таким образом, сначала оценивался спектр отрез-
ка от точки хх до точки хзв, затем отрезка от лга до # 3 7 и
т. д. Эти спектры могут быть отражены в табл. 4.3.

Т а б л и ц а 4.3
Последовательные спектры
Спектральные характеристики
Отрезок ряда
fe = 0 *-, ... й=б

Хх, . . ., Xat Fn At
#2, • . ., #37 До FiS
F31 \ Fu

Fih~ln?ih здесь означает натуральный логарифм оценки


спектральной плотности для k-й гармоники на i-ы отрезке
ряда. Ясно, что изменения в структуре ряда будут пред-
ставлены изменениями в последовательных спектрах, т. е.
векторами

Для сравнения этих изменений нужны элементы Pik,


которые перед подсчетом разностей желательно выравни-
вать. Для выравнивания использовалась скользящая сред-
няя для- трех значений F и отклонения от этой скользящей
средней подсчитывались следующим образом:

Обозначим через %t максимальное по модулю изменение


спектра, выравненного за три периода:

107
Если величина Я,- мала по сравнению со стандартным
отклонением, то это означает, что никаких значительных
перемен в структуре временного ряда не произошло. Таким
образом, а следует оставлять малой. Когда Я* велико, ве-
личину а следует повышать вплоть до максимума, т. е.
до I.
Для определения величины а значения %t могут быть
использованы различными путями. Считалось, что новое
значение а должно зависеть от (Я*)2, чтобы сделать модель
более чувствительной к изменениям в структуре рядов.
Вводилась величина

где а — стандартное отклонение 8th;


b и с — соответствующим образом выбранные константы,
рассматриваемые ниже.
Величина а определялась по формуле
аг=тах[0,1; min(expdj—1; 1)].
Константы б и с могут быть определены из условий:

где гг —то значение -^, при котором а достигает значения


а = 0,95;
h — то значение -*, ниже которого а остается равным

0,1. Придя к заключению, что ^ , —-, ..., •— можно


считать случайными величинами, асимптотически распре-
деленными как %а с одной степенью свободы1, авторы метода
предлагают следующую интерпретацию гх и г 2 .
1
Величина, являющаяся суммой квадратов / независимых стан"
дартизованных нормально распределенных переменных, как извест"
но, имеет %ъ распределение с / степенями свободы (см., например,
[31], с. 49). Так как б ^ по предположению распределены асимпто-
тически нормально, то 2Ё будут распределены как %* с одной сте-
пенью свободы. Таблицы стандартных распределений можно найти
в учебниках по статистике и справочниках по математике.
108
Для того чтобы найти такое значение Л, при котором
Р (А* < Л) = 0,99, необходимо, чтобы п • Р (| &ih | > Л) =
= 0,01, где /г — количество частот в разложении, т. е.
в нашем случае п = 7. Отсюда Р (| 8ih | > Л) = 0,0014,
или

Но асимптотически распределено как %* с одной


степенью свободы. Отсюда ^ = 10,2, или -^- = 3,1.
Следовательно, гх — 3,1 означает, что щ приравнива-
ется 0,95, когда %i принимает такое значение, вероятность
превышения которого при условии, что коренных изменений
ряд не претерпел, равна 0,01,' т. е. получение столь боль-
ших %i при отсутствии изменений в динамике ряда малове-
роятно. Поэтому есть основание полагать, что ряд претерпел
существенные изменения и нужно обеспечить быструю
адаптацию модели.
Интерпретацию г2 можно получить аналогичным образом
(Р (ki > А) — 0,99 и т. д.). Остается определить стандарт-
ное отклонение а, необходимое для вычисления di.
Авторы рассматриваемого метода получили следующую
приближенную оценку дисперсии:

где /С — константа, зависящая от специфического исполь-


зуемого фильтра;
__ f 1, если k — 0,
™ "~ \ 0 —- в других случаях;
Rp — когерентность (сохранено обозначение, принятое
в [96]).
Когерентность на частоте /?Av является показателем
корреляции между соответствующими частотными состав-
ляющими двух отрезков ряда {xj X / + N - I } И {хи •
••»
Xi+jsr-i) no N членов в каждом.
Для стационарных процессов когерентность практи-
чески не зависит от частоты, а от / и / зависит только через
разность р = |/ — /|. Для Rap авторы вывели следующее
простое соотношение:

109
Для рассматриваемого ими примера N = 36, т = б,
К = 0,75, р = 1. Отсюда

Таким образом, алгоритм вычислений полностью опре-


делен. .
Однако применение . спектральной модели сопря-
жено еще с одной трудностью, которую можно проил-
люстрировать следующим примером. Пусть хх, ..., х1Оо
будет временной ряд продаж. Предположим, что этот ряд
характеризуется. положительным ступенчатым скачком
от хб0 до хш, т. е. М {X]) = ... = М (х49) < М (.%,)' =
= ... — М (хш), и что оценка спектра St подсчитывается
для последовательных отрезков ряда

{Si, конечно, функция частоты). Никаких значительных


изменений в спектре S ge , ..., S 4 9 не должно быть. Однако
^49 и "5БО должны различаться существенно, так как пер-
вая, величина не включает ступенчатое изменение, а вто-
рая включает. Некоторые различия могут также иметь место
для нескольких следующих значений спектра. Далее спектр
практически не меняется. Однако между S 84 и S 8 6 опять
будет значительная разница, так как 5 8 4 включает сту-
пенчатый скачок, ä 5 8 Б не включает. Таким образом, ве-
личина- а8^ буде? большой, даже если структура ряда
в точке 85 не изменилась.
Может показаться, что наипростейший способ устра-
нения указанного недостатка состоит в том, чтобы в про-
грамме предусмотреть автоматическое установление а = 0,1
через 36 точек (в данном примере) после того, как отмечено
изменение структуры ряда, Однако этот путь может быть
опасен. Во-первых, в данной точке может произойти дей-
ствительное изменение и оно будет пропущено. Во-вторых,
может иметь место целая серия промежуточных скачков
в уровне продаж между первой и 36 точками.
Эта проблема- была- решена оценкой двух спектров:
для 36-точечных и 18-точечных отрезков временного ряда.
Для каждого из этих спектров определялось соответст-
вующее а(. Меньшее из них' использовалось в качестве
текущего значения сглаживающего коэффициента.
ПО
Авторами метода предлагается и другое, более простое
решение данной проблемы. Перед подсчетом спектральных
оценок начало 36-точечного отрезка преобразуется путем
замены хи t — 1,..., 6, на x't = xt sin ^ " ^ " " ^ .

Сравнение спектральной модели


с моделью Тригга—Лича
Для сравнения рассмотренной адаптивной процедуры
с методом Тригга—Лича авторами было промоделировано
несколько рядов с различными типами изменений.

Рис. 4.5. Сравнение спектрального метода с методом


Тригга—Лича при ступенчатом изменении уровня ряда

Первый ряд был сконструирован для проверки реакции


спектрального метода на ступенчатое изменение. Ряд был
образован из независимых наблюдений *i, ..., х10, таких»
что xlt ..., # 4 0 были распределены нормально со средним
значением 10 и ах = 1, в то время как ха ..., х10 были
распределены нормально со средним значением 13 и сх — 1.
Реакция спектральной модели и модели, использую-
щей контрольный сигнал Тригга, для этого случая показа-
на на рис. 4.5. Видно, что ни тот, ни другой метод не отра-
жает первого скачка. Причиной является то, что величина
скачка не превышает пределов За стохастических колебаний
относительно первоначального уровня и скачок восприни-
мается моделями как случайное отклонение. В следующей
точке, однако, спектральная модель следует за рядом к его
новому среднему уровню, в то время как модель Тригга—
Лича слегка отстает. Спектральный метод в-данном случае
дает меньшее среднеквадратическое отклонение.
Далее исследовалась реакция на острый пик. Пример
такого пика показан на рис. 4.6 в точке 46. Спектральная

Рис. 4.6. Сравнение спектрального метода с методом


Тригга—Лича при импульсном изменении структуры
ряда

модель почти идеально отслеживает пик, а реакция модели


с контрольным сигналом отражает лишь половину высоты
пика; затем, как видно на рисунке, потребовалось 6 точек
на возвращение назад.
Рао и Шапиро указывают, что спектральный метод
в данном случае отражает значение ряда с меньшей ошиб«
кой, чем метод Тригга—Лича. Но на рис. 4.6, взятом из ра-
боты Рао и Шапиро, эффект запаздывания прогноза спект-
ральной модели по отношению к реальным изменениям не от-
ражен (т = 0). Однако спектральная модель, как и любая
адаптивная модель рассматриваемого класса, характери-
зуется запаздыванием реакции на изменения в реальном
процессе по крайней мере на один шаг. Значит, в точке 45
нет информации для прогнозирования скачка в точке 46.
В точке 46 составляется прогноз на следующий момент
времени. Спектральная модель при этом уже в полной мере
112
учитывает изменения в точке 46, несмотря на то, что этот
скачок имеет характер помехи. Поэтому прогноз по спект-
ральной модели на момент времени 47 будет иметь большую
погрешность, чем прогноз модели Тригга и Лича, хотя
в дальнейшем она быстрее приспособится к фактическому
уровню. Вообще сильная реакция на пик едва ли является
положительным свойством модели прогнозирования.
На рис. 4.7 показан третий тип нарушения стационар-
ности — линейный рост уровня ряда. Для этого случая
точность обоих методов приблизительно одинакова.

Рис. 4.7. Сравнение спектрального метода с методом


Тригга—Лича при линейном изменении уровня ряда

Авторы спектральной модели видят ограниченность


своего метода и считают, что он найдет применение, веро-
ятнее всего, для небольшого числа рядов. Они рекомендуют
этот метод только для весьма колеблющихся процессов.
Однако для таких рядов эффект запаздывания реакции
модели будет особенно сказываться на точности прогнози-
рования. По-видимому, в подобном случае предпочтитель-
нее использовать «наивную» модель *т (0 = xt.
Рао и Шапиро считают, что особенно эффективно при-
менение спектральной модели для определения типа пере-
мен в структуре ряда. Пусть ÄAv означает частоту, при
которой ki = |6{ь|. Эксперименты показывают, что когда
перемены в структура ряда имеют ступенчатый характер,
то k принимает малые значения, т. е. максимальные изме-
нения спектра имеют место в низких частотах.
Когда перемены имеют форму пика, значение k соот-
ветствует высоким частотам. Линейный рост вызывает мак-
симальные отклонения в середине частотного диапазона.
из
Эти особенности дают возможность использовать изме-
нения в спектре для введения существенных изменений
в структуру модели, а не только для регулирования па-
раметра сглаживания. Мы же попытаемся решить эту
проблему в следующей главе более простым способом.

§ 3. АДАПТАЦИЯ ПАРАМЕТРА
МЕТОДОМ ЭВОЛЮЦИИ

Другой способ модификации однопараметри-


ческой экспоненциальной модели с коррекцией коэффици-
ента линейного тренда предложен У. Чоу [50]. Он также от-
казывается от поиска какого-либо одного оптимального
значения параметра сглаживания и предлагает процедуру,
обеспечивающую адаптацию самого этого параметра к из:
менениям в динамике ряда. Метод комбинирует экспонен-
циальное сглаживание с методом эволюционного планирова-
ния 143, 26].
Предполагается, что используются три оценки следую-
щего члена ряда, получаемые с помощью трех различных
значений параметра а: высокого, нормального, низкого.
Эти значения первоначально выбираются произвольно, а
затем модифицируются по мере продвижения модели во вре-
мени. Оценка, сделанная при нормальном значении пара-
метра, считается прогнозом, остальные две оценки являют-
ся контрольными. По получении новой, фактической точки
можно сделать вывод о том, какое из трех значений пара-
метра привело к меньшей ошибке и оказалось наилучшим.
Теперь это значение параметра рассматривается уже как
нормальное. Прогноз на следующий период делается именно
на основе данного наилучшего значения. Одновременно
рассчитываются контрольные оценки будущего наблюде-
ния по более высокому и более низкому (по сравнению
с нормальным) значениям параметра.
В своих экспериментах Чоу использовал значения па-
раметров

где Л=0,05 — шаг изменения (эволюции) параметра;


а — нормальное значение параметра;
(a—h) — низкое значение параметра;
(a-j-h) — высокое значение параметра.
114
В качестве начального значения он брал а = 0,1, как
наиболее широко употребляемое на практике. Всего было
проанализировано 60 рядов месячных данных о сделках-
на различные виды продукции. Здесь были ряды с данными
о перчатках, смазочных материалах, сальниках, подшип-
никах и т. д. Данные представляли собой разнообразные
образцы' поведения экономических временных рядов, вклю-
чая циклическое движение. В 59 случаях предлагаемый
метод показал преимущества перед стандартной процеду-
рой и в одном случае результаты были почти одинаковы.
Обобщая результаты исследований, Чоу делает вывод
о том, что точность его схемы (если судить по относительной
ошибке прогноза) более чем на 10% выше, чем у стандарт-
ного метода; ее преимущества становятся особенно явными
при моделировании нестационарных рядов с изменяющими-
ся автокорреляционными свойствами.
Идея Чоу получила дальнейшее развитие в работе С. Ро-
бертса и Р. Рида [97], в которой рассмотрены также двух- и
трехпараметрические модели. Адаптационная оптимизация
модели и в этом случае проводится методом эволюционного
планирования. В данной схеме реализуются все возможные
опыты (пробы) при различных сочетаниях значений пара-
метров сглаживания, заданных из расчета по три значения
на каждый"параметр. Эти опыты образуют так называемый
полный факторный эксперимент с добавлением центральной
точки. Всего при k управляемых k параметрах в каждый
момент времени подсчитывается 2 + 1 оценок будущего
наблюдения, и одна из них, соответствующая центральной
точке плана, считается прогнозом.
После получения фактической точки анализируется
точность пробных оценок (анализируются ошибки, являю-
щиеся функциями рассматриваемых параметров). В ре-
зультате может быть принято решение о переносе цент-
ральной точки в точку с минимальной ошибкой. Прогноз
на следующий момент времени осуществляется при значе-
ниях параметров сглаживания, определяемых центральной
точкой. Вследствие переноса центральной точки изменяется
набор высоких и низких уровней рассматриваемых пара-
метров. При этом для стабильности прогностической сис-
темы накладывают ограничение, чтобы значения параметров
были ^в пределах 0,05—0,95. „
Можно провести аналогию этой схемы с биологической
эволюцией. Небольшие изменения независимых параметров
•И5
8*
можно уподобить мутациям. Отбор лучших значений пара-
метров аналогичен процессу естественного отбора. Отсюда
и название метода — эволюционное планирование.
В качестве базовой модели авторы схемы взяли трехпара-
метрическую модель Уинтерса, рассмотренную в гл. 2, § 2.
Это модель с аддитивным коэффициентом роста и мульти-
пликативной сезонностью; более простые модели были
получены путем наложения на нее соответствующих огра-
ничений.
Рассматривались три случая: 1. Один параметр а. Отсут-
ствие тенденции роста и сезонности. 2. а) два параметра
«!, а 2 . Наличие тенденции роста и отсутствие сезонности;
б) два параметра alt а 2 . Наличие
сезонности и отсутствие тенденции
роста. 3. Три параметра а х , а 2 , а 8 .
Наличие и сезонности, и тенденции
?ак44имГТаФ?л7сНи°с: Р 0 ™" ПоЛНая М
°Д е л Ь У н т е р « .
темы с одним парамет- Однопар а м е т р и ч еская
ром система. Оценки будущего
члена временного ряда получают
по трем значениям единственного параметра а, как это
показано на рис. 4.8. Точка 1 соответствует нормальному
значению а, точка 2 — высокому, точка 3 — низкому зна-
чению а.
В гл. 5, § 3 приведены результаты, полученные нами
при эмпирических испытаниях однопараметрических пре-
дикторов с регулированием параметра адаптации методом
эволюции. Проведено их сравнение с однотипными моде-
лями Брауна с оптимальными значениями а, определенными
при помощи итеративной процедуры поиска.
Двухпарэметрическая с и с т е м а . Рас-
смотрим случаи 2а. Результаты в случае 26 аналогичны.
Система имеет два параметра а ь а 2 . Оценку будущего члена
ряда получают в соответствии с планом факторного экспе-
римента: по два значения на каждый параметр плюс цент-
ральная точка (см. рис. 4.9).
Трехпараметрическая с и с т е м а . Сис-
тема имеет параметры а х , а 2 , а 3 , для которых план фактор-
ного эксперимента, представленный на рис. 4.10, строится
аналогичным образом. Всего точек плана 2 8 -f 1.
На основе статистических критериев нельзя установить
существенное преимущество рассмотренной схемы перед
обычной моделью Уинтерса. Однако для рядов, характери-
116
зующихся высокой автокорреляцией, предложенная мо-
дель дает более точные прогнозы, чем модель Уинтерса.
С учетом того, что в экономических рядах часто присутст-
вует автокорреляция, эта модель во многих случаях ока-
жется полезной. Кроме того, реакция на стандартные вход-
ные потоки — единичный импульс, ступенчатое изменение
уровня, линейно-нарастающая функция— у данной схемы
лучше (с точки зрения точности прогнозов), чем у модели

Рис. 4.9. План факторного Рис. 4.10. План факторного


эксперимента для системы эксперимента для системы
с двумя параметрами с тремя параметрами

Уинтерса, и ее применение предпочтительно, когда о струк-


туре исследуемого ряда имеется недостаточно полное пред-
ставление.
Другой прием адаптационной оптимизации — симплекс-
планирование ~ предложен У. Спиндлеем, Дж. Хецтом
и Ф. Химсуорсом [101] и использован в адаптивных моде-
лях прогнозирования Д. Монтгомери [80]. Этот метод дает
возможность заранее определить четкие правила принятия
решений о том, куда и когда двигаться из данной точки па-
раметрического пространства. В отличие от метода эво-
люционного планирования, требующего в каждой точке
рассчитывать 2* + 1 пробу (k — количество управляе-
мых параметров), метод симплекс-планирования требует
в каждой точке делать один-единственный прогноз. В этом
методе используются линейные симплекс-планы (см., на-
пример, 1251). Симплекс —простейшая фигура. На плоско-
сти—это треугольник, в трехмерном пространстве —
тетраэдр и т. д. 1
1
Существо симплекспланирования состоит в ««wauHOHHO*
оптимизации путем последовательного перехода от одного симплек
Рассмотрим правильный симплекс 5 0 с вершинами
йъ d2, ..., dh + 1 и центром с 0 . На каждой грани симплекса
So можно построить новый симплекс Sj с центром Cj и k
вершинами db аъ ..., dj„ltdi + 1, ..., dk + 1, принадлежа-
щими множеству So и одной новой вершиной dj, являю-
щейся зеркальным отобра-
жением точки dj относи-
тельно грани, общей для
обоих симплексов.
На рис. 4.11 выполнено
построение симплекса S3
из симплекса So для слу-
чая k — 2. Чтобы найти
ту или 'иную координату
точки d}, нужно взять уд-
Рис. 4.11. Построение симплекса военное среднее из соот-
S3 из симплекса So в задаче с дву- ветствующих координат
мя независимыми параметрами
точекdbd2, ...,rf i _ 1 /ö! i + 1 ,
..-, dh + 1 и вычесть из
него соответствующую координату точки dj. В вектор-
ном обозначении это запишется так:

Допустим теперь, что каждая точка dt симплекса харак-


теризует значения параметров сглаживания и каждой точке
после накопления результатов (в каждый момент времени де-
лается лишь один прогноз — одна проба) поставлена в со-
ответствие абсолютная ошибка прогноза (e t |. Отсюда
следует, что до начала итеративной процедуры необходим
« + 1 шаг для получения первых прогнозов и определения

са к другому, смежному, по направлению крутого снижения. Начи-


нается процедура с вычисления в вершинах исходного симплекса
значении целевой функции, на основании которых по установленно-
му правилу принимается четкое решение о том, куда и когда двигать-
В
°™ичие от симплекс-планирования симплекс-метод в линей-
ном программировании предлагает правила перехода от одной вер-
п п П л ~ „ С И М п л е к с ' М Н 0 Г 0 Г Р а н н и к а Условий, определяемого в /t-мерном
« S a H C T B e наложенными линейными ограничениями, к соседней
иой фо е мь Ш г ° Ж с и м п л е к с а > обеспечивающей возрастание линей-
постаК ВИДИМ< э т и д в а мет
°Д а решают задачи, различающиеся'по
118
их ошибок в вершинах исходного симплекса. Предположим
далее, что | ер | — ошибка в точке dp — наибольшее значение
среди k + 1 значений, полученных для симплекса So-
Тогда ясно, что надо двигаться в направлении точки dp.
Можно доказать, что движение из центра симплекса за грань,
находящуюся против точки dp, будет совпадать с направ-
лением крутого снижения, рассчитанным по результатам
наблюдений в вершинах правильного симплекса.
Стратегия симплекс-планирования, в соответствии с ко-
торой осуществляется эволюция параметров сглаживания,
формулируется в трех простых правилах:
e
1. Отобрать наибольшее значение \ер\ из значений
l il> 1^21> —» kft + il» замеренных в точках, образующих
симплекс So. Перейти к новому симплексу Sp, заменив
в симплексе 5 0 точку dp, соответствующую | ер |, точкой
dp. Подсчитать прогноз на следующий момент времени,
используя значения параметров, определяемые точкой d*p.
2. Если применение первого правила приводит к тому,
что одна i-я точка (вершина) сохранилась в k + 1 последо-
вательных симплексах, то следует прекратить применение
этого правила и рассчитать прогноз на следующий момент
времени, используя значения параметров, определяемые
точкой di> Затем применять правило первое.
3. Если значение | ер | было наибольшим в предыдущем
симплексе, а значение \ер\ оказалось.наибольшим в после-
дующем симплексе, то, не возвращаясь к предыдущему
симплексу, следует двигаться из последнего симплекса,
отбросив (заменив ее на зеркальную) точку, которой соот-
ветствует значение ошибки, ближайшее к наибольшему.
Таким образом, в этом методе четко указано, когда и
куда двигаться. Это позволяет полностью возложить на
ЭВМ процесс управления параметрами.
Д. Монтгомери экспериментировал с двухпараметри-
ческой моделью, учитывающей линейный тренд, и трех-
параметрической моделью, аналогичной модели Уинтерса.
Исходный симплекс с произвольной ориентацией и дли-
ной ребра обычно задают матрицей D, строки которой опре-
деляют вершины симплекса. Матрица D может быть скон-
струирована из последних k столбцов матрицы Yk+1 • Н,
где Н - . любая ортогональная матрица размерности
(k -f I) • (k -f 1), элементы первого столбца которой равны.
119
В двухпараметрической модели, произвольно полагая
а х = 0,100 и а г = 0,075, Монтгомери использовал матри-
цу:

Длина ребра в этом конкретном случае / =


= [(dj — ф)'(ф — uj)\x'2 = 0,07. Верхний и нижний
пределы изменения параметров здесь также были установ-
лены равными 0,95 и 0,05 соответственно.
В трехпараметрической модели, полагая щ. — 0,100,
а а = 0,075, а 3 = 0,100, в качестве исходного он исполь-
зовал симплекс, определяемый матрицей:

Здесь также / = 0,07, 0,95 > alt а а , а 8 ^ 0,05.


Рассмотренный метод является альтернативным методу
Робертса и Рида. Его преимущество в том, что он намного
экономичнее с вычислительной точки зрения. К сожале-
нию, сопоставление точности этих методов проведено не
было.
Глава 5
АДАПТИВНЫЕ
КОМБИНИРОВАННЫЕ МОДЕЛИ

В главе предпринята попытка построения- более


гибких комбинированных моделей, в состав (базовый на-
бор), которых входит несколько более простых адаптивных
моделей. В комбинированных моделях селективного типа
на каждом шаге организован автоматический выбор по за-
данному критерию наилучшей модели из числа входящих
в базовый набор. Таким образом, адаптация происходит
на двух уровнях: по структуре или типу модели и по пара-
метрам. В комбинированной гибридной модели прогноз
формируется как взвешенная сумма прогнозов, получен-
ных по альтернативным моделям. Веса при этом имеют адап-
тивный характер.

§ 1. АДАПТИВНАЯ СЕЛЕКТИВНАЯ МОДЕЛЬ

Вполне естественно предположить, что реальный


процесс время от времени претерпевает коренные изменения.
Изменяются уровень и динамические свойства ряда. При-
чем на одних участках сохраняется прблизительно постоян-
ный уровень, на других ряд растет с определенной ско-
ростью или характеризуется появлением ускорения. Поэ-
тому всякая, попытка подобрать какую-либо одну прогноз-
ную модель для всего ряда приводит к некоей усредненной
модели с чрезмерными дисперсиями оцениваемых парамет-
ров и ошибками прогнозирования. Когда изменение струк-
туры происходит резким скачком, исследователю довольно
просто отсечь устаревшие данные и строить модель только
на свежей информации. Однако гораздо чаще изменения
коренных свойств ряда происходят не сразу, а непрерывно.
Причем
т
ряд меняет тенденцию, делает зигзаги и бывает
РУДно, а при одновременном исследовании многих рядов
121
даже невозможно быстро анализировать такую динамику
и заменять одну модель другой.
Мы предлагаем две процедуры адаптации структуры
модели, которые могут выполняться на ЭВМ. Одна из них
основывается на принципе непрерывной селекции.
Предположим, что • рассматриваемый процесс генери-
руется моделью с постоянным уровнем, моделью с линей-
ным ростом, квадратической моделью поочередно. Учиты-

Рис. 5.1. Сравнение реакций на ступенчатое


изменение уровня полиномиальных моделей
Брауна нулевого, первого и второго поряд-
ков (модели 1, 2, 3 соответственно) и по-
строенной на их основе адаптивной комби-
нированной модели (АКМ) селективного
типа, т = 3

вая это, построим адаптивную комбинированную модель


(АКМ), которая включает в свой базовый набор три моде-
ли: экспоненциальной средней, линейного роста и квадра-
тическую.
Вычисления будущих значений ряда осуществляются
по каждой из них в отдельности, но в .качестве прогноза
выбирается расчетная величина, полученная по модели,
наилучшим образом отражающей на данном временном
интервале реальный процесс. Наилучшая модель избира-
ется в соответствий с заданным критерием селекции. Наи-
лучшей, естественно, считать "ту модель, которая дала ми-
нимальную абсолютную ошибку- прогноза текущего члена
ряда при заданном периоде упреждения t.
На рис. 5.1 изображена реакция на ступенчатое измене-
ние АКМ, построенной цр принципу селекции (выбора)
той модели, которая имеет на текущий момент наимень-
шую ошибку прогноза. До ступенчатого скачка и через
122
t — 1 единиц времени после его появления все три модели,
входящие в базовый набор предикторов, дают одинаковые
т-прогнозы. Это приводит к затруднению при выборе про-
гнозирующей модели. В такой ситуации для большей опре-
деленности можно взять модель линейного роста в качестве
компромисса между моделью скользящей средней и квад-
ратической моделью. В момент t = 3 становится ясно, что
квадратическая модель дает результаты, более близкие
к реальным точкам. АКМ переключается на нее. В даль-
нейшем из-за заметного превышения этой моделью уровня
ступенчатого скачка АКМ переключается на модель линей-
ного роста и модель экспоненциальной средней, но пере-
ключение это происходит не сразу, а с лагом т = 3. Такая
задержка ухудшает общий результат. Ясно, что наиболее
эффективно в данном случае критерий селекции должен
работать при малых т.
В рассмотренном примере АКМ испытывалась на вход-
ном потоке данных, содержащем детерминированный сту-
пенчатый скачок. Если тот же эксперимент провести в более
жизненных условиях, при наличии помех, то столь простой
критерий селекции будет не всегда удовлетворителен, так
как из-за случайной составляющей лучший результат будет
то у одной, то у другой модели. Таким образом, нельзя
в общем случае исходить только из последней ошибки про-
гнозирования. Необходимо учитывать некоторую их со-
вокупность. Имеется довольно много вариантов построения
критерия селекции. Предложим, например, два таких
критерия.
К р и т е р и й К' Переключение на данную модель
осуществлять тогда, когда К ее последних прогнозов яв-
ляются наилучшими в сравнении с прогнозами по другим
моделям, входящим в базовый набор АКМ.
К р и т е р и й В. Переключение на данную модель
осуществлять тогда, когда ее экспоненциально сглаженный"
квадрат ошибки прогнозирования В минимален по сравне-
нию-с аналогичным показателем для остальных моделей
в базовом наборе АКМ.
Критерий В формируется следующим образом:

где 0 < а в < 1 — параметр сглаживания;.


е% у __ т ) _ ошибка прогноза, сделанного в мо-
мент / - т на t шагов вперед.
123
Легко заметить, что при ав = 1 критерий В эквивален-
тен критерию К при К — 1.
Если раньше отмечалось, что, в модели экспоненциаль-
ного типа параметр сглаживания часто бывает близок
к 0, то здесь этого сказать нельзя. Параметр В характери-
зует инерционность переключения, а мы уже видели, что
промедление с переключением может привести к плохой
работе АКМ, нарушить, соответствие структуры модели
динамике процесса. То же относится к критерию /С.
По существу, величину Bt можно было бы назвать оцен-
кой текущего значения дисперсии ошибки прогноза на х
единиц времени вперед. Но учитывая, что ав обычно ве-
лико, сглаживание квадратов ошибок будет недостаточным.
Поэтому придавать величине В такой смысл в общем случае
было бы неоправданным. При малых значениях параметра
сглаживания эта интерпретация допустима и аналогичная
процедура может использоваться для грубой оценки дове-
рительных уровней прогнозов при прогнозировании не-
стационарных процессов.
Принцип непрерывной селекции весьма прост. Но в свя-
зи с тем, что переход с модели на модель зависит от предик-
торов, входящих в базовый набор АКМ, и специфических
динамических свойств ряда, общий теоретический анализ
эффективности АКМ затруднителен, и мы оставляем решаю-
щее слово за экспериментом (см. § 3).

§ 2. АДАПТИВНАЯ ГИБРИДНАЯ МОДЕЛЬ

Адаптивная селективная модель рассчитана на


выбор одного предиктора из некоторого их множества.
Но очевидно, что такой выбор однозначно и эффективно
можно осуществлять, только если модели, входящие в ба-
зовый набор, существенно различны. Для тех случаев, когда
в АКМ входят модели, дающие сравнительно близкие ре-
зультаты, и селекция затруднена, можно предложить гиб-
ридную АКМ, прогноз по которой является взвешенной
суммой прогнозов, полученных по входящим в нее предик-
торам. Веса прогнозов ©г предлагаем взять адаптивными,
обратно пропорциональными величине Bit u подсчитывае-
мой, как и в селективной АКМ:

124
Коэффициент пропорциональности gt определяется из ра-
венства суммы весов единице. Например, для базового
набора из трех моделей веса будут определяться так:

Получаемый в данном случае прогноз будет ближе к ре-


зультату, получаемому то по одной, то по другой модели,
являясь некоторой адаптивной равнодействующей.
В отличие от модели, рассмотренной ранее, гибридная
модель осуществляет переключение более плавно, со мно-
жеством промежуточных положений. В результате ^полу-
чается непрерывный спектр возможных конструкций про-
гноза.
Для обеих процедур построения АКМ были составлены
программы, которые содержат наборы по 5 моделей: экс-
поненциальной средней, линейного и квадратического роста
(Брауна или Тригга—Лича) и две «наивные» модели:

Базовый набор АКМ формируется исследователем или


автоматически из любого сочетания предикторов этого
программного набора.
Автоматическое формирование основано на непрерыв-
ном сравнении средних квадратов ошибок прогнозов, полу-
ченных по различным моделям к текущему моменту вре-
мени. Плохие модели могут случайно приближаться к ре-
альному процессу и кратковременно давать хорошие про-
гнозы, что приводит к переключению АКМ именно на них.
В результате появляются большие ошибки, что ухудшает
эффективность АКМ. Такие модели лучше сразу вывести
из базового набора. Поэтому если базовый набор формиру-
ется автоматически, то из программного набора моделей
в
него включаются только те модели, средние квадраты
ошибок которых не больше чем в т раз превосходят мини-
мальную из них:
125
Обычно т = 1,2—1,5. Причем меньшее значение т со-
ответствует малым t, так как при увеличении периода уп-
реждения разброс средних квадратов ошибок различных
моделей, как правило, возрастает.
При автоматическом формировании базовый набор не яв-
ляется раз навсегда определенным. Если с течением времени
меняется соотношение между средними квадратами оши-
бок, то меняется соответственно и базовый набор.
Таким образом, при прогнозировании модель подвер-
гается двум испытаниям. Одно, основанное на анализе
средних квадратов прошлых ошибок, дает ответ на вопрос
о целесообразности включения модели в базовый набор
предикторов. Другое, путем сравнения текущих свойств
моделей по критерию В, определяет ту модель из базового
набора, от которой можно ожидать наилучшего прогноза.
Принципы, изложенные в этом параграфе, являются до-
статочно общими и могут быть применены для построения
АКМ с разнообразными базовыми наборами, в том числе
включающими одинаковые по структуре, но отличающиеся
значениями параметров модели. Число предикторов в наборе
не целесообразно брать большим. Обычно достаточно 3—4
модели.

§ 3. ПРИМЕРЫ

Пример 5.1
Построим селективную АКМ. Включим в ее ба-
зовый набор предикторов полиномиальные модели Брауна
нулевого, первого и второго порядков — модели много-
кратного сглаживания с постоянной а = 0,1. Испытаем
эту модель на данных о Kypcev акций фирмы ИБМ и цене
на золото. На рис. 5.2 представлены прогнозы курса
акций на т = 3 по АКМ и по каждой из моделей, входящих
в ее базовый набор.
Об эффективности процедуры селекции по критерию В
можно судить по среднему квадрату ошибок прогнозирова-
ния в зависимости отт (рис, 5.3,5.4). Как видим, применение
процедуры селекции для малых т оказывается полезным и
приводит к уменьшению среднего квадрата ошибок прогноза.
Из графиков также видно, что выбор моделей для ба-
зового набора довольно трудное дело. Казалось бы, что
чем лучше работает модель отдельно, тем полезнее будет
ее ßKJiK/Wtf ч <?->?жй набор. Но из рис. 5.2 следует,
126
Рис. 5.2. Прогнозирование по селективной АКМ, т—3
что, хотя модель линейного роста является более точной
по сравнению с остальными двумя, при моделировании
по АКМ прогнозирование в основном производится то
по модели с гипотезой об отсутствии тенденции, то по квад-
ратической модели. Лучший результат по модели линейного
роста объясняется тем, что она является промежуточной
между двумя остальными и обладает некими компромисс-

Рис. 5.3. Средний квадрат Рис. 5.4. Средний квадрат


ошибки прогноза курса акций ошибки прогноза целы на зо-
фирмы ИБМ лото

ными динамическими свойствами. Но при моделировании


по АКМ именно поэтому она и оказалась излишней.
Испытаем селективную АКМ, прогнозируя цены на сви-
нец . В базовый набор включим полиномиальные модели
Тригга—Лича—Шоуна (ТЛШ) и " постоянную «наивную»
модель. Селекцию будем осуществлять по критерию В
° °ЧГ °' 6 ' Полученные результаты представлены в табл. 5.1.
Можно сделать вывод, что постоянную «наивную» модель
в ряде случаев полезно включать в базовый набор АКМ.
* Все стохастические временные ряды, используемые для испы-
тания моделей, приведены в приложении № 4.
128
•Таблица 5.1
Средний квадрат ошибок прогнозирования цен на свинец
^^_^^ Срок прогноза х
1 2 3 4 5
Модель """*---^^^

Полиномиальная ТЛШ:
порядка 0 269 496 734 1025 1367
порядка 1 271 496 731 1023 1373
порядка 2 258 482 729 1152 1686
«Наивная» постоянная
139 374 626 922 1253
159 402 623 915 1233
АКМ—В (ав=0,6)

Применение селективной АКМ—В с автоматическим по.


строением базового набора иллюстрируется табл. 5.2. Мо-
дель использовалась для прогнозирования цен на золото.
Программный набор предикторов состоял из постоянной,
линейной, квадратической моделей ТЛШ, постоянной и
линейной «наивных» моделей,

Т а б л и ц а 5.2

Средний квадрат ошибки прогнозирования цен наi золото


по селективной АКМ-Я в автоматическом режиме
при т=1»3

"""•N-^N^ Срок прогноза т


1 2 3 4 5
Модель ^**"""**«^^-^^
|

Полиномиальная ТЛШ: 1,52 1,79


порядка 0 57 0, 95 1, 26
еэскэ

60 95 21 1 ,42 1,62
порядка 1
порядка 2 62 §: 96 l! 22 1,43 1,63
«Наивная» постоянная
1,70
о, 50 0, 87 1 18 1,45
«Наивная» линейная 4 Г* С

1 14 з 27 6 41 10,5 15,5

ARM-B («в=0,6) | о ,77 | о ,86 V,14 1 ,43


1 1,ОУ
JOO
9-1866 129
Как видим, модель неплохо справилась с выбором по-
лезных предикторов и прогнозов. Можно отметить, что при
т = 1 «наивная» линейная модель явно портит общий ре-
зультат АКМ. В таких случаях рекомендуются два пути.
Во-первых, заведомо плохую модель можно сразу устранить
и перейти на режим принудительного задания базового на-
бора предикторов. Во-вторых, при т == 1 можно уменьшить
m до 1,2. Это позволит осуществлять более строгий отбор
предикторов в автоматическом режиме.
Пример 5.2
В качестве примера применения гибридной АКМ рас-
смотрим прогнозирование курса акций фирмы ИБМ. За ба-
зовые взяты линейная модель ТЛШ и постоянная «наив-
ная» модель. Прогнозы характеризуются такими диспер-
сиями ошибок (табл. 5.3):
Таблица 5.3

Средние квадраты ошибок прогнозирования курса акций


по гибридной АКМ

1 2 3 4 5 6 7 8 9 10
Модель ^*~^~^.^

ТЛШ линейная 61,4 100 132 167 205 247 299 345 369 403

Постоянная «наивная» 40,9 79 Ш 148 182 219 267 323 379 433

АКМ (03 = 0,5) 40,9 82 117 155 190 227 281 336 366 400

Как видно из табл. 5.3, гибридная АКМ в случаях, когда


трудно отдать предпочтение той или иной модели, помогает
уйти от максимальной возможной ошибки.
Пример 5.3
На базе полиномиальных моделей нулевого, первого и
второго порядков (модели № 1, 2, 3 соответственно) с па-
раметром а, регулируемым методом эволюции, была построе-
на селективная АКМ с выбором предиктора на каждом шаге
по критерию К ** 1. Алгоритм программы построен таким
образом, что комбинированная модель рассматривается как
одна из равноправных моделей наряду с предикторами,
130
входящими в ее базовый набор. Реальный прогноз делается
по предиктору, отобранному после анализа работы этих
четырех моделей на ретроспективных данных.
Результаты испытаний этих моделей при х — 1 и т = 2
сведены в табл. 5.4 и 5.5. Там же для сравнения приведены
данные по моделям Брауна. Прямоугольником выделен
наилучший результат по строке, а наилучший результат,
полученный методом эволюции, выделен жирным шрифтом.
При т = 1 незначительное преимущество имеют модели
Брауна..При %~2 это преимущество утрачивается и оба
метода дают примерно равную точность. При этом с вычис-
лительной точки зрения метод эволюции предпочтительнее
метода Брауна, при котором требуется процедура опти-
мизации параметра а.

Сделаем некоторые выводы. В главах 4 и 5 рассмотрены


попытки эмпирического совершенствования адаптивных
моделей с помощью автоматической регулировки параметра
сглаживания, предложена простая схема адаптации струк-
туры модели методом селекции или путем симбиоза несколь-
ких предикторов. Показана- эффективность ряда моделей
при краткосрочном прогнозировании. В силу простоты
этих моделей нельзя ожидать от них большой точности. Ви-
димо, почти в каждом случае можно отыскать способ по-
лучения более точных прогнозов. Однако надо иметь в виду,
что основное назначение этих моделей — автоматическая
обработка большого количества рядов. Поэтому решалась
не столько задача поиска оптимальных систем, сколько
проблема создания универсальных предикторов, пригодных
Для практической обработки рядов с различной динамикой.
Предлагаемые методы могут быть также рекомендованы для
случаев, когда нельзя раз и навсегда выбрать какую-либо
одну определенную структуру модели. Именно поэтому они
могут найти применение в ряде исследований.
Применение моделей с адаптивной структурой вызывает
множество вопросов, ответить на которые пока трудно, это
прежде всего вопросы, касающиеся выбора исходных пре-
дикторов для формирования базового набора и регулиро-
вания инерционности переключения с модели на модель.
Однако это направление, на наш взгляд, перспективно для
Дальнейших исследований.
131
Т а б л и ц а 5.4
Сравнение метода Брауна с методом эволюции
по средним квадратам ошибок ретроспективных прогнозов,
сделанных на один шаг вперед ( т = 1 )
Метод Брауна Метод :»волюции

Число точ
средний квадрат ошибки

№ модели
Выборка нз ряда средний
с Квадрат комбини-
с ошибки модель № 1 модель № 2 модель № 3 рованная
1 2 3 4 5 6 7 8 9

1 Курс акций фирмы ИВМ, дол. 144 1 | 41,427 | 43,419 64,315 80,240 44,728
2 Курс акций фирмы ИБМ
(часть 1) 48 1 | 32,956 | 37,565 47,913 73,710 34,863
3 Курс акций фирмы ИБМ
(часть 2) 48 1 1 46,294 | 46,445 72,234 79,970 49.30&
4 Курс акций фирмы ИБМ
(часть 3) 48 1 | 43,419 | 53,252 58,787 68,305 49 ,-516
5 Цена на золото, дол. за унцию 360 1 | 0,50123^] 0,51263 0,64924 0,76728 0,65877
6 Цена на золото (часть 1) 60 1 10,08265] 0,09869 0,09877 0,14866 0,0971»
7 Цена на золото (часть 2) 60 1 10,104801 0,10958 0Д4941 0,27336 0,13601
8 Цена на золото (часть 3) 60 2 10,028841 0,02913 0,02902 0,03089 0,03224'
9 Цена на золото (часть 4) 60 1 [0,145211 0,16726 0,18879 0,30078 0,1472fr
10 Цена на золото (часть 5) 60 1 J0,84637 ( 0,96741 0,93089 0,98194 0,94999-
II Цена на золото (часть 6) 60 I 1,6928 1 1,4022 f 1,9341 2,6717 1.540Г
12 Поставка минеральных
удобрений сельскому
хозяйству, тыс. т усл. ед. 30 2 128,148-105 | 201,978-105 41,999-10s 30,898-10S 32,579-105
13 Производство электроэнер-
гии, млрд. кВт-ч 31 2 26,593 1888,7 22,829 31,063 1 21,722 |
14 Производство гидроэлектро-
энергии, млрд. кВт-ч 31 2 I 27,456 1 54,920 37,274" 38,893 32,424
15 Сумма вкладов населения
в сберкассы, млн. руб 26 2 10,92X101 307,6- 10S 19,04-105 J9,872-105| И.вб-Ю 5
16 Численность городского
населения, млн. чел. 27 2 10,32741) 28,067 0,56278 0,81668 0,43933
17 Протяженность нефте- и
нефтепродуктопроводов,
тыс. км 21 2 | 1,4529 | 13,872 1,6304 1,4723 1,5126
18 Грузооборот нефте- и нефте-
продуктопроводов, ткм 21 3 | 168,73 | 2757,0 322,11 296,64 298,66
19 Урожайность зерна,
ц. с га 30 2 | 2,2653 | 3,2946 3,1126 3,0164 3,2191
20 Урожайность картофеля,
ц с га 30 1 170,716 1 162,68 | 186,43 202,33 198,12
21 Урожайность овощей,
ц с га 30 2 | 78,732 | 121,31 90,85 100,58 117,68
22 Производство яиц,
млрд. шт. 30 2 1,9412 9,2810 2,2714 2,2063 | 1,7782 f
Т а б л и ц а 5.5
Сравнение метода Брауна с методом эволюции по средним квадратам ошибок
ретроспективных прогнозов, сделанных на два шага вперед ( т = 2 )
ы Метод Брауна Метод эволюции

№ модели
средний квадрат ошибки

Число точ
Выборка из ряда средний
с
квадрат комбиниро-
ошибки модель № 1 модель № 2 модель № 3 ванная
1 2 3 4 7 8 9

1 Курс акций фирмы ИБМ, дол. 144 1 ) 80,153 I 81,478 96,944 144,213 85,298
2 Курс акций фирмы ИБМ
(часть 1) 48 1 60,628 66,315 67,956 109,710 1 58,396 |
3 Курс акций фирмы ИБМ
(часть 2) 48 1 89,277 87,494 | 119,665 117,536 95,678
4 Курс акций фирмы ИБМ
(часть 3) 48 1 80,414 103,062 | 79,826 1 110,895 85,628
Ь Цена на золото, дол. за унцию 360 1 | 0,86646 | 0,89830 1,10362 1,28570 1,03500
6 Цена на золото (часть 1) 60 Л J 0,12906 | 0,18163 0,19527 0,21458 0,15003
7 Цена на золото (часть 2) 60 1 | 0,21768 | 0,24762 0,35511 0,40347 0,25994
8 Цена на золото (часть 3) 60 2 0,03570 0,037352 | 0,033487 | 0,037917 0,040031
9 Цена на золото (часть 4) 60 2 1 0,26517 | 0,32079 0,31179 0,48198 0,36845
10 Цена на золото (часть 5) 60 2 [t 1,2007 | 1,77632 1,32608 1,32086 1,63410
И Цена на золото (часть 6) 60 -1 2,0442 | 1,9197 | 3,1570 3,8169 2,0578
12 Поставка минеральных удоб-
рений сельскому хозяйству, 30 2 96,117-10s 684,509-105 98,276- 10s ]89,329-10б | 99,061-10&
тыс. т усл. ед.
Продолжение
Метод Брауна Метод эволюции
средний квадрат ошибки
в
к
Выборка из ряда
к !
средний
квадрат
ошибки модель № 1 " модель № 2 модель № 3
комбиниро-
ванная
I 2 13 4 5 6 7 8 9
13 Производство электроэнер-
гии, млрд. кВт-ч 31 2 113,153 6937,3 82,446 51,701 | 95,061
14т Производство гидроэлектро-
энергии, млрд. кВт-ч 31 2 59,887 158,68 60,268 | 51,062 | 51,592
15 Сумма вкладов населения
в сберкассы, млн. руб 26 2 54,069-105 1014,2.10s 80,8Ы05 | 44,59-Ю5. | 48,83-Ю5
16 Численность городского
населения, млн. чел. 27 2 1,46924 86,821 0,95485 | 1,28914 1,27009
17 Протяженность нефте- и
нефтепродуктопроводов,
тыс. км 21 2 3,3538 44,1430 2,2234 | 1,7879 | 2,0119
18 Грузооборот нефте- и нефте-
продуктопроводов, ткм 21 3 829,8 8836,7 1051,5 599,1 | 702,2
19 Урожайность зерна,
ц с га 30 2 | 2,2758 3,4959 3,3335 3,9829 4,1992
20 Урожайность картофеля,
ц с га 30 1 | 166,539 188,17 215,31 250,76 225,86
21 Урожайность овощей,
ц с га 30 2 [ 76,065 173,23 93,43 110,26 133,86
22 Производство яиц,
млрд. шт. 30 2 6,1755 26,318 | 3,2831 4,1259 4,9086
Глава 6
БАЙЕСОВСКИЙ ПОДХОД
К КРАТКОСРОЧНОМУ ПРОГНОЗИРОВАНИЮ

В основе подхода, рассматриваемого в этой гла-


ве, лежит гипотеза о том, что исследуемый временной ряд
генерируется не одной, а несколькими простейшими веро-
ятностными моделями поочередно, т. е. речь идет, как и
в предыдущей главе, о построении модели с множеством
состоянии. Причем переключение с одного состояния на дру-
гое является вероятностным процессом и соответствует то
появлению увеличенных случайных возмущений, то сту-
пенчатым изменениям уровня ряда, то скачкам в динамике
их роста. При таком подходе события, имеющие случай-
ный характер, получают ясное отражение в модели, а по-
следовательно поступающие данные используются для под-
счета апостериорных вероятностей и анализа ситуаций.

§ 1. МОДЕЛЬ С МНОЖЕСТВОМ СОСТОЯНИЙ

Если ввести обозначения: xt — текущее зна-


чение ряда; alt t — текущий уровень после исключения
сезонных колебаний; а2, t — текущее значение коэффици-
ента линейного роста; ft — текущее значение коэффициента
сезонности, то обычно принимается гипотеза, что ряд гене-
рируется следующим образом:

(6.1)

где е* — шум;
щ — возмущение уровня;
vt — возмущение коэффициента линейного роста.
Случайные компоненты ё, и, v предполагаются незави*
симо и нормально распределенными с нулевыми средними
и известными дисперсиями D e , £>u, Dv.
Этот тип модели, в котором как уровень, так и параметр
линейного роста подвержены непрерывным случайным воз-
мущениям, часто оказывается полезным в прогнозировании
практических временных рядов. Харрисоном было показа-
но [67], что при генерировании ряда моделью типа (6.1)
с постоянными дисперсиями £>е> #ц» ^о и без эффекта се-
зонности оптимальный предиктор (в смысле минимума квад-
ратов ошибок) в точности эквивалентен модели Хольта:

где постоянные сглаживания а х и а а теоретически являются


функциями отношений дисперсий Du/De и DjDe.
Широкое применение этой модели для краткосрочного
прогнозирования, как и линейной модели Брауна (см. гл» 1),
основанной на экспоненциально взвешенной регрессии и
являющейся частным случаем модели Хольта, фактически
свидетельствует о приемлемости гипотезы (6.1) для многих
временнйх рядов.
Как уже отмечалось, важной проблемой при построении
таких прогностических систем является выбор параметров %
и «2, который определяет ее чувствительность. Чувстви-
тельная система быстро реагирует на реальные изменения,
а нечувствительная не реагирует на шум и случайные от-
клонения. Оба свойства полезны, но находятся в противо-
речии, и вследствие того, что фильтрация шума и случайных
возмущений требуется чаще, чем адаптация к новому уров-
ню или скорости роста, обычно на практике делают эту
систему малочувствительной. Однако, когда такая система
встречается с серьезными изменениями в динамике ряда,
она не сигнализирует о их появлении, а лишь медленно дви-
гается к новому уровню. В итоге в течение определенного
периода ошибки прогнозов могут достигать значительной
величины.
В гл. 4 были рассмотрены попытки сконструировать
адаптивные системы, которые одновременно сигнализируют
о появлении необычных ситуаций и повышают чувстви-
137
тельность модели так, что необходимость вмешательства
человека значительно уменьшается. В частности, Тригг и
Лич предложили систему, адаптивную к изменениям в уров-
не, но не обладающую такими свойствами по отношению
к резким скачкам в коэффициенте роста. К тому же их сис-
тема характеризуется нежелательной реакцией на импульс-
ные возмущения. В данной главе рассматривается попытка
преодолеть эти трудности с помощью байесовского под*
хода, использованного П. Харрисоном и К. Стевенсом 166]
при разработке модели с множеством состояний.
Возвратимся к гипотезе (6.1). Генерирующая модель
содержит случайную компоненту &t, которая оказывает
воздействие только на текущее'наблюдение и не отражается
на будущих значениях аг и а2) а также возмущения щ и vu
значения которых влияют на последующее движение сис-
темы. Например, необычно большое значение щ означало
бы ступенчатый переход на новый уровень, а необычно боль-
шое значение vt вызвало бы скачок в коэффициенте линей-
ного роста; в то же время чрезмерно большое значение et
выражалось бы в появлении случайного импульсного от-
клонения, не оказывающего, однако, никакого влияния
на будущее поведение ряда. Такие чрезмерно большие зна-
чения случайных компонент могут встречаться в реальных
данных, хотя вероятность их появления обычно мала.
Может быть выдвинуто предположение, что для каждой
из случайных величин щ, Щ> vt имеется не одно, а некоторое
число альтернативных распределений, в соответствии с кото-
рыми генерируются их текущие значения. Формально в этом
случае генерирующая модель имеет следующий вид.
Пусть k — число состояний,
Prj — вероятность наступления /-го состояния,
/ = 1, .-, к.
Тогда, если в момент t система находится в /-м состоя-
нии, случайные компоненты в*, ut> vt генерируются про-
цессами:

(6.2)

Таким образом, система имеет параметры:

138
В дальнейшем будем различать четыре состояния про-
цесса, иллюстрируемые рис. 6.1, а именно: «отсутствие из-
менений», «ступенчатое изменение», «изменение в коэффи-

Рис. 6.1. Основные состояния процесса, генерирую-


щего временной ряд

циенте линейного роста», «случайное импульсное отклоне-


ние». Качественная характеристика дисперсий, необхо-
димых для описания этих состояний, приведена в табл. ь л .
Т а б л и ц а 6.1
Характеристика дисперсий генерирующего процесса
с четырьмя состояниями

Du Dv
Состояние De
-
——————— 1.

Нормальная Ноль Ноль


Отсутствие изменений Большая Ноль
Ступенчатое изменение Нормальная
Изменение коэффициента ли- Нормальная Ноль Большая
нейного роста
Случайное импульсное от- Ноль Ноль
клонение Большая

139
§ 2. БАЙЕСОВСКИЙ ПОДХОД

Совершенно очевидно, что действительные зна-


чения a lf i и а2, t B нашем генерирующем процессе остаются
неизвестными, более того, они подвержены непрерывным
возмущениям. В этой ситуации естественно говорить о за-
конах распределения значений a1>t и а2, t и изучать моди-
фикацию этих распределений по'поступающим новым на-
блюденным членам ряда xt,xt + 1, ... Будем рассматривать
двумерные нормальные распределения р (их, аг) и введем
следующие обозначения первого и второго моментов, опу-
ская при этом индекс t:

(6.3)

где, например, М (ах) — ^ciipjfli, а^дщйа^. Введем


также вектор моментов Ф = {öi, aa, m (alt а1), т (ах, а2),
т (аа, аг)}.
Индексы при Ф будем понимать как относящиеся ко всем
его компонентам, т. е.

Запись (аг, а а ) ~ N (Ф) будет означать, что пара величин


(«1, а2) имеет совместное двумерное нормальное распреде-
ление с параметрами Ф.
Для обозначения смеси k двумерных нормально распре-
деленных совокупностей с параметрами Ф<'\ i — 1, ..., к,
будем использовать запись

Эта запись указывает, что значения двух случайных ве-


личин могут с вероятностью v<*> принадлежать совокуп-
ности с i-u распределением.
Следует обратить внимание на то, что распределение
(ai.t» «2,<) — это байесовское апостериорное (по отноше-
140
нию к текущему наблюдению xt) распределение. В ряде
случаев будем отмечать это записью (ах>t, а 2 , {!#*)•
Перейдем к проблеме вычисления 'апостериорных ве-
роятностей. Рассмотрим сначала простейший случай, когда
генерирующий процесс (6.1) имеет лишь одно состояние,
т. е. дисперсии De, Du, Dv неизменны во времени. В этом
случае если совместное распределение (%, *~1, ß2, *-i)
в момент t — 1 является двумерным нормальным:

где

то апостериорное распределение в момент t также является


двумерным нормальным:

где компоненты вектора Ф4 определяются следующим обра-


зом (см. приложение № 2).
Пусть
(6.4)
(6.5)

Далее, пусть
(6.7)

Тогда параметры совместного апостериорного распре-


деления (а 1( „ аг t) в момент t можно вычислить по форму-
лам:

(6.8)

141
Введем для всего алгоритма пересчета моментов, задан-
ного выражениями (6.4)—(6.8), обозначение:
(6.9)
Функция В выражает вычисление байесовского апосте-
риорного распределения в момент t через моменты апосте-
риорного распределения в момент t — 1 и дисперсии гене-
рирующего процесса.
Теперь рассмотрим генерирующий процесс с множест-
вом состояний, который описывается смесью априорных
(относительно момента t) распределений:
(6.10)

г д е — вероятность (апостериорная по отношению


к наблюдению xt -i) того, что процесс в мо-
мент / — 1 был в состоянии i;
— вектор моментов 1-го распределения, описы-
вающего состояние i в момент t — 1.
Используя результаты, полученные для генерирующего
процесса с одним состоянием, для описания каждого из k
состояний / = 1, ..., k по очереди, получаем:
(6.11)
где st — номер состояния в момент t,
(6.12)
Здесь использована fJ-функция уравнения (6.9). Поэтому
полное апостериорное распределение может быть записано
как
(6.13)

где Ф(/'!) задается уравнением (6.12), а Р\1'!) — вероятность


(апостериорная относительно наблюденного значения xt)
того, что процесс в момент t — 1 был в i-u состоянии и
теперь переходит в /-е состояние.
Возникает вопрос о том, как оценить вероятность пере-
хода генерирующего процесса из состояния i в состояние /.
Рассмотрим проблему в общем виде. Пусть событие г может
наблюдаться лишь при условии, что произошло какое-ни-
будь событие НГ из числа несовместных событий Я ъ Я2,...»
142
Нп, вероятности которых известны. События Ht обычно
называют гипотезами относительно г. Вероятность реализа-
ции i-й гипотезы при условии, что наблюдается событие
г, определяется соотношением Байеса:

где Р (z) — полная вероятность наступления события г.


Используя эту формулу в нашем конкретном случае,
lt h
можно получить оценку P\ следующим образом:

где x(t) - вектор всех наблюдений до t включительно;

буква Р обозначает вероятность, буква р - плотность


^ Н т о м ш р а ж е н и и использовалась функция плотности
вероятности для нормального распределения

а также то, что

ИЗ
где Axt — некоторый отрезок переменной х, содержащий
точку xit в пределах которого плотность распределения
вероятности можно считать постоянной.
Величину К в выражении (6.14) можно считать нормали,
/}
зующим коэффициентом и найти ее из условия 2 Я}'* = 1,
Л
что полностью определяет Р}'' и апостериорное распре-
деление (6.13).
Здесь возникает одно серьезное практическое затрудне-
ние. Начиная сfc-компоиёнтногоаприорного распределения,
представленного в выражении (6.10), мы приходим к ^-ком-
понентному апостериорному распределению в (6.13). Про-
должая этот процесс, мы должны по получении последую-
щих наблюденных значений xt+1, xt+i , ..,, переходить
к апостериорным распределениям с fea, k* и т. д. компонен-
тами. Это очевидно неприемлемо с вычислительной точки зре-
ния, так как требования к объему памяти и к машинному
времени становились бы чрезмерными уже после неболь-
ших рядов наблюдений. Поэтому авторы рассматриваемого
метода предлагают некоторые приближения для удержания
требований к ресурсам компьютера в разумных рамках.
Имеется несколько путей уменьшения числа компонент
апостериорного распределения, идин из них заключается
в следующем.
Все множество компонент смеси распределений в (6.13)
с одинаковым текущим состоянием / в целом заменяется
на единственное двумерное нормальное распределение,
первые и вторые моменты которого получают соответствую-
щей процедурой взвешивания, т. е.

(6.15)

где

(6.16')

ж
Выражения для вторых моментов более громоздки.
В качестве примера приведем одно из них:

(6.16")
Рассмотренным способом удается сохранить наиболее
ценную информацию о текущем состоянии процесса в вы
и
«сжать» апостериорное распределение (a1>t, ß2, t\xt) "
ражении (6.15), приведя его к тому же виду, что и в выра-
жении (6.10) в начале цикла обновления.
Сделаем краткий обзор метода по этапам цикла обнов-
ления.
Эта,л 1. После получения наблюдения AT(_I пред-
полагается, что апостериорное распределение

является смесью двумерных нормальных распределений:

где как

так и параметры Q>t-i известны.


Э т а п 2. Априорно,-до получения члена *„ пред-
полагается, что процесс в момент t может оказаться в любом
из возможных состояний, каждое из которых характери-
зуется параметрами:
рГ] — вероятность состояния /;
D(J\ D{J\ Din — дисперсии генерирующего процесса в сос-
тоянии /. ппп
Эт а п 3. Рассматривая все возможные переходы про-
цесса из одного состояния в другое при движении от момента
t - 1 к моменту t и учитывая вероятности этих переходов,
получаем выражение апостериорного распределения через
смесь fea двумерных распределений:

где

и РУ'Н равно выражению (6.14).


145
ЛУЧ1НЯ Ян я nn Распределении с k* компонентами, по-
лученная на предыдущем этапе, сжимается в приближенно
эквивалентное распределение с k компонентами:

J) })
где Q\ « 2 / f • i\ a параметры Ф\ задаются уравнениями
(6.16') и (6.16").
T o r ^ I n J l ?' А п о с т е Р и ° Р н с е распределение теперь имеет
бш-fRKmo^J И Н а Э т а п е l j и слеДУюЩая итерация может
оыть выполнена аналогичным образом. •
d T a n 6
- Д л я получения прогнозов по модели

n D O K C H S S f 6 Н И Й С к к о м п о н ентами в свою очередь ап-


Д В у м е р ш м
?n^Spyamf нормальньш распределением

г М ( 5 ^ 1 Х О Д И М 0 ^ а т ь н е ^олько замечаний относительно


НИЙ M o < Z b ( 6 Л ) ВКЛ1
пиеГ,™ ' P °чает сезонные коэ#и-
циенты как известные (а не как неизвестные, подобно <ht и
Раз меется
äöfi У ' модель можно расширить таким образом,
соЙкпГп,°и НН в Ь1е п КОЭффиЦиентЬ1 0ПРеДелять на той же бай^
в с в я ^ ° с ^ в е ' ° д а а к о дайте это не рекомендуется, так как
DOB i v / f ™ в°3Растанием числа неизвестных парамет-
° ЛН0Й
ба& 0ВСК0Й
ния б ^ т пи ЩК Т
МаЛ П0 с а в н е н
р а б о т к и сезонного явле-
поiSSSl Т ° Р и ю с затратами, особенно
вод состояний"^™ 6 ' ЧТ
° использ
У е т с я подход с множест-
HocS° C rpi b I y з н а ч е н и я озонных коэффициентов, в сущ-
ности, связаны с вращением Земли вокруг Солнца, то им
обычно присуща большая стабильность, чем уровню или
коэффициенту линейного роста. Однако на практике и се-
зонные факторы подвержены изменениям, и в случае необ-
ходимости это предлагается учитывать вне байесовской си-
стемы.
§ 3. РЕАЛИЗАЦИЯ МЕТОДА

Полагаем, что дисперсия основной стохастичес-


кой составляющей процесса в его «нормальном» состоянии
(т. е. при отсутствии изменений) известна:

Это требование не является чрезмерным. Приближен-


ные значения характеристик основной стохастической ком-
поненты необходимы в любой задаче практического прогно-
зирования, а байесовская система, как утверждают авторы
метода, не боится даже больших ошибок в численных оцен-
ках этих значений.
Считаем также, что к началу процесса оценки коэффи-
циентов сезонности известны. В общем случае как коэффи-
циенты сезонности, так и характеристики случайных откло-
нений можно оценивать посредством предварительного ана-
лиза, например применением той или иной сглаживающей
процедуры к прошлым выборочным данным. При этом, ко-
нечно, необходимо особое внимание к искажениям, вноси-
мым самим процессом сглаживания. Иногда у исследовате-
ля имеется какая-то априорная информация. Тогда ее мож-
но использовать непосредственно вместо анализа прошлых
Данных или в дополнение к нему.
Далее должны быть заданы остальные параметры систе-
мы:
— количество состояний процесса;
— вероятность наступления состояния /;
— дисперсии стохастических компонент, ха-
рактеризующие состояние /.
На практике удобно определять эти дисперсии в еди-
ницах дисперсии основных флуктуации Do следующим
образом:

147
10*
Выбор значений параметров
Как отмечалось в § 1, будем различать четыре основные
ситуации: отсутствие изменений, ступенчатое изменение, из-
менение в коэффициенте линейного роста, случайное импуль-
сное отклонение, т. е. речь идет о четырех состояниях про-
цесса, но если необходимо различать степени изменений, то
их число может быть и большим. Авторы метода считают,
однако, что четыре состояния системы дают хорошие резуль-
таты и нет необходимости вводить более тонкие различия.
Таким образом, они берут k — 4.
Что касается остальных параметров, то при испытаниях
с большим числом их различных численных значений авто-
рами метода был сделан вывод о том, что работа системы ма-
ло чувствительна к значениям параметров, если при их вы-
боре соблюдаются некоторые правила:
1. Состоянию «отсутствия изменений» приписывается
высокая вероятность.
2. Состояние «ступенчатое изменение» должно характе-
ризоваться большим значением Ru и очень малой вероят-
ностью.
3. Состояние «изменение в коэффициенте линейного рос-
та» должно иметь или a) Ro <С Ru и ТУ ж е вероятность, чтои
и состояние «ступенчатое изменение», или б) R„ = Ru
намного меньшую вероятность, чем вероятность «ступенча-
того изменения».
4. Вероятность «случайного импульса» должна быть по
крайней мере в 10 раз больше, чем вероятность «ступенчато-
го изменения» или «изменения в коэффициенте линейного
роста».
5. Сумма относительных коэффициентов R, -f Ru -Ь Re
для состояния «случайного импульса» должны быть не мень-
ше, чем соответствующая сумма для любого другого состоя-
ния.
Условие (1) является гипотезой того, что «нормальное»
течение процесса лишь изредка прерывается скачкообраз-
ными изменениями в уровне или коэффициенте линейного
роста.
Эффект условия (2) и (4) состоит в том, что получение
первой большой ошибки будет рассматриваться системой
как случайный импульс до тех пор, пока последующие дан-
ные не подтвердят, что произошло ступенчатое изменение
уровня или коэффициента линейного роста.
148
Следствием условия (3) является то, что система стано-
вится менее чувствительной к изменениям в коэффициенте
линейного роста, чем в уровне. Во многих практических
ситуациях это свойство желательно: оно предотвращает
«раскачку» системы.
Условие (5) обеспечивает более широкий диапазон ам-
плитуд состоянию случайного импульсного возмущения.
В табл. 6.2 представлен рекомендуемый авторами метода
набор значений параметров, удовлетворяющих перечислен-
ным требованиям; этот набор давал у них хорошие резуль-
таты при проверке на искусственных и реальных данных.
Таблица 6.2
Рекомендуемые значения параметров (ft=4)

Состояние Вероятность Re Я«

0,900 1 0 0
1. Изменения отсутствуют 1 100 0
2. Ступенчатое изменение 0,003
3. Изменение коэффициента линей- 1 0 1
ного роста 0,003
4. Случайное импульсное откло- 101 0 0
нение 0,094

Несмотря на то что до сих пор речь шла о н ^ о т о Р М


ле различных состояний с известными f С Т 0 Я Н ™ Д е т Р и ge-
ностями их наступления, нет оснований считать чтсгэти ве
роятности неизменны во времени. Поэтому в < * ^ <**£
метода иногда целесообразно включать ту ^ WJrSSS
дуру модификации первоначально з а Д а н н ы х *^°fНОСТ
состояний с учетом фактических входных данных.

ного роста величиной в 1<т. пппгнозы на один


На рис. 6.2 представлены данные и о Д « « ™ ° ^ а
шаг вперед. Видно, что с л у ч а й н ы м ^ ^ ^ S p S T a .
дает очень малый вес при формировании текущего пр
Рис. 6.3 показывает, что ™onVef™™°™C™Smro
носительно значений уровня и коэ#ициента линейно
роста, выражаемая величинами оа% и о*а„ резко возрастает.
В точке С система сначала опять обрабатывает событие как
случайный импульс тем же самым образом, что и в точках

Рис. 6.2. Прогнозирование искусственного ряда по байе-


совской модели с четырьмя состояниями, т= 1

А и В. После получения следующего значения ряда система


«понимает», что эта гипотеза несостоятельна и что, вероят-
но, имело место большое ступенчатое изменение; Неопреде-

Рис. 6.3. Неопределенность оценок коэффициентов прогнозной


модели ст^ и о ^

150
ленность системы резко возрастает — прошлые данные те-
перь не дают информации относительно нового уровня, а за-
тем быстро уменьшается с получением новых фактических
данных. Поведение в точке D, где имеет место изменение
коэффициента линейного" роста, отличается своеобразием.
Фактически истинное событие в течение некоторого времени
скрыто нормальной колеблемостью. Если последовательно
открывать на графике данные, то вплоть до t = 44,45 не
ясно, было ли это изменение в коэффициенте роста, и даже
после этого момента представление о его величине далеко от
определенности. Байесовская система в целом оказывается
весьма неопределенной относительно значений уровня и
коэффициента линейного роста, но она становится более чув-
ствительной, постепенно адаптируется' и возвращается к
нормальному состоянию по мере того, как последующие
данные подтверждают новое направление развития ряда.
Исследование чувствительности этой системы показало,
что ее эффективность (с точки зрения точности прогнозов)
слабо зависит от четырехкратных ошибок в оценкеD o . Столь
большие ошибки в оценке этой величины на практике пред-
ставляются почти невероятными.
Несмотря на то что описанный метод не получил распро-
странения и требует большего объема вычислений, чем ме-
тоды Хольта, Брауна или Бокса и Дженкинса (см. гл. 7),
он представляет значительный интерес и заслуживает изуче-

Т а б л и ц а 6.3

Варианты значений Относительных дисперсий

в байесовской модели с четырьмя состояниями,


использовавшиеся при прогнозировании _____
Вариант Mi 1 Вариант № 2 Вариант J№ 3

Состояние

Отсутствие изменений 1 0 0 1 0 0 1 0 0

Ступенчатое изменение 1 10 о' 1 50 0 1 100 0

Изменение скорости роста 1 0 1 1 0 1 1 0 1

Случайное импульсное от-*


клонение U 0 0 61 0 0 101 0 0
151
Т а б л и ц а 6.4
Варианты априорных вероятностей четырех состояний
в байесовской модели,
использовавшиеся при прогнозировании
Вероятность

Состояние вариант вариант вариант вариант вариант


№ I № 2 №3 №4 №6

Отсутствие изменений 0,425 0,250 0,600 0,800 0,900


Ступенчатое изменение 0,050 0,050 0,050 0,050 0,003
Изменение скорости .роста 0,425 0,600 0,250 0,050 0,003
Случайное импульсное от-
клонение 0,100 0,100 0,100 0,100 0,094

Т а б л и ц а 6.5
Варианты значений параметров байесовской модели
с четырьмя состояниями,
из которых отыскивался наилучший вариант

№ варианта
значений
параметров 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15»

№ варианта
значений от-
носительных
дисперсий
(см. табл.
6.3) 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3

№ варианта
априорных
вероятно-
стей состоя-
ний (см.
табл. 6.4) 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
%

* Вариант Ni 15 является рекомендацией автороп метода в (06].


152
Т а б л и ц а 6.6
Сравнение результатов прогнозирования
по байесовской модели с четырьмя состояниями
при различных вариантах значений ее параметров
(всего 15 вариантов; см. табл. 6.5)

:ло-
Вариант

е-
к Вариант парамет-
ом 3и парамет- Наилуч- ров, даю-
«а А ров, реко- ший вари- щий ре-
Выборка
0)
с мендуемый ант пара- зультаты,
о авторами метров близкие
из ряда а « метода к наилуч-
tf
о
(•>
gii к шим
о о» пя
п/п

• я
средний т pi средни! средний
чя § квадрат ™ а квадрат квадрат

1-
V
3
sis
4 5
ошибки
6
•Si S
«5 а
7
ошибки
8
eg
9
ошибки
10
2

1 Курс акций фир-


мы ИБМ, дол. 144 30 64,822 76,384 3 52,932 8 53,132
2 Курс акций фир-
мы ИБМ
(часть 1) 48 30 64,822 55,457 4 44,723 9 45,067
г
с
Курс акций фир-
мы ИБМ
(часть 2) 48 30 76,797 75,059 3 53,549 8 53,707
4 Курс акций фир-
мы ИБМ
(часть 3) 48 30 83,738 67,170 1 52,187 6 52,346
5 Цена на золо-
то, дол. за ун-
цию 360 30 0,10278 0.800ЯЗ 2 0,57678 1 0,57709
6 Цена на золото
(часть 1) 60 30 0,10278 0,16464 3 0,08542 8 0,09595
7 Цена на золото
(часть 2) 60 30 0,07807 0,25988 2 6,14159 1 0,14267
8 Цена на золото
(часть 3) 60 30 0,01920 0,03223 4 0,02768 14 0,02769
9 Цена на золото
(часть 4) 60 30 0,16998 0,20290 4 0,17058 3 0,17174
10 Цена на золото
(часть 5) 60 30 0,07612 1,18003 2 0,93812 1 0,93817
11 Цена на золото 4 2,20804 3 2,22290
(часть 6) 60 30 2,66693 2,27642
12 Поставка
минеральных
Удобрений
сельскому
хозяйству,
тыс. т усл. ед. 30 15 161659 19721500 2 5108376 1 5356601

153
Продолжение
о
Вариант
Ь1 №
S
Вариант
параметре» Наилуч-
парамет-
ров, даю-
# 2 О.
рекомен- ший вари- щий ре-
Выборка й) дуемый , ант пара- зультаты,
§£ К
S а; ч&•
м авторами метров близкие
%
из ряда в* метода к наи-
s № лучшим
8 8
«01 S
О S-J
о Ч «^
О "Л.
я Igs
'Iо в
средний
квадрат
щ
я
средний
квадрат
я
к
средний
квадрат
V ~ «я ОС1 ошибки ошибки ошибки
1 2 ~т 4 S 6
£g
7 8 т
1 Производство
электроэнер-
гии, млрд.
кВт-ч 31 15 158,92 461,50 12 59,315 59,995
1 Производство
гидроэлектро-
энергии, млрд
кВт-ч 31 15 26,280 48,825 11 30,743 1 30,752
15 Сумма вкладов
населения
в сберкассы, 34.307Х 38.32Х
млн. руб 26 15 186324 212,8-10 2 ХЮ5 1 xios
16 Численность
городского
населения,
млн. чел. 27 15 1,0546 1,1694 12 0,4961 7 0,5008
17 Протяжен-
ность нефте- и
нефтепродук-
топроводов,
тыс. км 21 15 0,53562 6,09359 12 1,50304 7 1,52253
18 Грузооборот
нефте- и
нефтепродук-
топроводов,
гкм 21 15 382,646 2052,27 12 529,64 7 538,76
19 Урожайность
1 с га 30 15 0,63794 2,54825 5 2,49374 10 2,52021
20 Урожайность
картофеля,
1 с га
21 Урожайность 30 15 38,720 70,871 5 170,635 10 170,825

овощей,
I с га 30 15 6,142 81,834 5 81,231 10 81,699
22 1роизводство
яиц, млрд.
шт. 30 15 ,51425 4,11174 2 2,26763 7 2,26091
154
йия. Прежде всего желательно сопоставить его эффектив-
ность с точностью прогнозов, получаемых другими метода-
ми. Между тем практическому использованию описанного
метода посвящена, по-видимому, лишь одна работа [63].
Поэтому нами были проведены эмпирические сопоставле-
ния, результаты которых приведены в следующем парагра-
фе. Первые значения параметров распределения коэффи-
циентов ( а ъ а 2 ), необходимые для начала рассмотренной в
этой главе итеративной процедуры, и основная дисперсия Do
определялись нами путем оценивания линейной регрессии
на первых Nx точках выборки. Считалось, что Q</> == Р/>
Рассмотрим соответствующий пример.
Байесовская модель с 4 состояниями была испытана на-
ми на 22 выборках различного объема. Было, опробовано
15 вариантов задаваемых значений параметров модели
(см. табл. 6.3, 6.4, 6.5), из которых вариант № 15 представ-
лял значения, рекомендуемые авторами метода.
"Результаты, приведенные в табл. 6.6, свидетельствуют
о том, что рекомендация авторов относительно значений па-
раметров не получила экспериментального подтверждения.
Анализ результатов приводит к выводу, что средний квад-
рат ошибки особенно чувствителен к значениям априорных
вероятностей состояния процесса.

§ 4. СРАВНЕНИЕ МЕТОДОВ

Теперь, познакомившись с разнообразными моде-


лями адаптивного типа, целесообразно провести эмпиричес-
кое сравнение точности получаемых по ним прогнозов.
Результаты испытаний адаптивных моделей представле-
ны в сводной табл. 6.7. В ней прямоугольником выделен
результат, наилучший в строке, а подчеркнут — результат,
лучший из тех, которые дают модели метода эволюции един-
ственного параметра адаптации. Номера моделей в графах
8
« 11,12,13 означают: № 1 — полиномиальная модель нуле-
вого порядка, № 2 — полиномиальная модель первого по-
Рядка, № 3 — полиномиальная модель второго порядка.
Как видно из таблицы, превосходство осталось за адап-
тивной моделью авторегрессии, рассмотренной в гл. 3. Со-
вершенно не выдерживает конкуренции намного более слож-
ная байесовская модель с 4 состояниями (см. выборки № 1 1 ,
*2,13,15,18). Остальные модели в общем ненамного отстают
от модели адаптивной авторегрессии.
155
Сравнение адаптивных методов
ретроспективных прогнозов

Выборка Метод Байеса Адаптивная


авторегрессия

число средний средний


из ряда точек квадрат a S 3 <и квадрат
S? ошибок ошибок
зав«:
1 2 3 4 5 6 7

Г Курс акций фирмы


ИБМ, дол. 144 30 52,932 1 | 40,937 1
2 Курс акций фирмы
ИБМ (часть 1) 48 30 44,723 1 33,969
3 Курс акций фирмы
ИБМ [часть 2) 48- 30 53,549 3 1 42,854 .!
4, Курс акций фирмы
ИБМ (часть 3) 48 30 52,187 1 | 41,898 1
5 Цена на золото, дол.
за унцию 360 30 0,57678 1 0,50989
6 Цена на золото
(часть 1) 60 30 0,09542 1 0,08964

7 Цена на золото
(часть 2) 60 30 0,14159 1 0,10582
8 Цена на золото
(часть 3) 60 30 | 0,02768| 2 0,02898
9 Цена на золото
(часть 4) 60 30 0,17058 1 1 0.14467J
10 Цена на золото
(часть 5) 60 30 0,93812 1 | O.7792ÜJ
И Цена на золото
(часть 6) 60 30 2,20804 3 '[" 0,8557]П
12 Поставка минераль-
ных удобрений в
сельское хозяйство,
тыс. т усл. ед. 30 1Б 51,083405 1 | 21,459 ЛОЯ

166
ta6fl«ua 6.7
по средним квадратам ошибок
сделанных на один шаг вперед (т—1)
Метод эволюции
Метод Брауна
средний квадрат ошибок
№ мо- параметр средний комбиниро-
дели а квадрат модель 1 модель 2 модель 3 ванная
опт ошибок
8 9, 10 11 12 13 И

1 0 ,9600 41,427 43 ,419 64 ,315 80,240 44,728

1 0 ,9450 132,956 I 37 ,565 47 ,913 73,710 34,863

1 0 ,9992 46,294 46 ,445 72 ,234 79,970 49,308

1 0 ,9120 43,419 53 ,252 58 ,787 68,305 49,516

1 0 ,8410 10.50123
1.° ,51263 0 ,64924 0,76728 0,65877

0,14866 0,09719
1 0 ,7510 10,08265 о 09869 0 09877

0,13601
1 о 9991 10,10480 0 10958 0 14941 0,27336

2 о 2711 0,02884 о 02913 0 02902 0,03089 0,03224

1 о 0709 0,14521 о, 16726 о, 18879 0,30078 0,14726

1 о, 9999 0,84637 о, 96741 о, 93089 0,98194 0,94999

2,6717 1,5401
1 0, 6709 1,6928 1,4022 1, 9341

28.148Х 201.98Х
2 0, 8010 Х108 42,00-105 30,90.10? 32,58-105
ХЮ5

157
Метод Байеса Адаптивная
Выборка авторегрессия

макси-
средний средний

маль-
число квадрат

ный
из ряда точек квадрат

лар
ошибок ошибок
i 2 ' 3 4 5 6 7

1
13 Производство электрс
энергии, млрд.
31 15 59,315 1 1 19,115 |
кВт-ч
14 Производство гидро-
электроэнергии, 34,933
млрд. кВт-ч
31 15 30,743 1

15 Сумма вкладов насе-


ления в сберкассы, 34.307Х
26 15 Х105 1 18,45810-10?
млн.руо
16 Численность город-
ского населения, 27 15 0,4961 1 0,37938
млн, чел.
17 Протяженность
нефте- и нефтепро-
дуктопроводов, 21 15 1,50304 1 1 1,1703
тыс. км
18
Грузооборот нефте-
и нефтепродуктопро- 21 15 529,64 1 | 99,479__
водов, ткм
19
Урожайность зерна, 30 15 2,4937 2 3,1536
ц с га
20 Урожайность карто-
феля, ц с га
30 15 170,63 3 165,24

21 Урожайность овощей,
ц с га 30 15 81,231 3 1 71,758 |
22 Производство яиц,
млрд. шт. 30 15 2,2676 1 2,0802

158
Продолжение
Метод эволюция
Метод Брауна
средние квадрат онгабок

№ мо- параметр средний комбини-


дели а квадрат модель 1 модель 2 модель 3 рованная
опт ошибок
8 9 10 11 12 13 14

2 0,8990 26,593 1888,7 22,829 31,063 21,722

2 0,5121 | 27,456 | 54,920 37,274 38,893 32,424

W.921X
2 0,9909 ХЮ5 307,6.105 19,04-105 9,872.10* 11,86.105

2 0,9191 1 0.3274Ц 28,067 0,56278 0,81668 0,43933

2 0,6029 1,4529 13,872 1,6304 1,4723 1,5126

3 0,7298 Л68.73 2757,0 322,11 296,64 298,66

2 0,0191 | 2,2653 | 3,2946 3,1126 3,0164 3,2191

1 0,3060 170,72 1162,68 | 186,43 202,33 198,12

2 0,0668 78,732 121,31 ' 90,85 100,58 117,68

2 0,7291 1,9412 9,2810 2,2714 2,2063 | 1,7782 |

159
Глава 7
МОДЕЛИ АВТОРЕГРЕССИИ —
СКОЛЬЗЯЩЕГО СРЕДНЕГО
(МЕТОД БОКСА —ДЖЕНКИНСА)

В главе излагается метод построения смешанных


моделей авторегрессии — скользящего среднего, исследуют-
ся свойства моделей, проводится их эмпирическое сравне-
ние с адаптивной моделью авторегрессии, рассмотренной
в гл. 3. Здесь рассматриваются модели для временных ря-
дов без эффекта сезонности.

§ 1. ОБЩЕЕ ОПИСАНИЕ МОДЕЛЕЙ И ИХ СВОЙСТВ

Еще одно направление развития и обоснования


адаптивных моделей дано в работе Дж. Бокса и Г. Джен-
кинса 15]. В их книге особое внимание уделено проблеме
выбора модели и ее оцениванию, что и вызвало интерес спе-
циалистов. Однако недостаточное количество практичес-
ких примеров прогнозирования с использованием этого ме-
тода вызывает определенные сомнения. Возникает необходи-
мость проверить метод наделе, сравнить его с другими мето-
дами.
Прежде всего кратко опишем модели, лежащие в осно-
ве процедуры прогнозирования, и методы построения этих
моделей, а затем проанализируем особенности их приме-
нения и конкретные результаты, полученные при проведе-
нии экспериментов.
Для описания моделей потребуются следующие опера-
торы1 и обозначения:
xt — значение ряда в момент /;
1
О правомерности и особенностях алгебраических действий
над рассматриваемыми операторами см. в (1, приложение А].
100
— оператор сдвига назад, определенный следую-
m
щим образом: Bxt = xt _ l t B xt = xt _ m ;
— оператор разности назад: 4xt — xt — xt _ j =
-(1-Я)*,;
— оператор суммирования:

e^ — белый шум с дисперсией о%>


Остальные обозначения будут введены по ходу изложе-
ния.
Модель основывается на гипотезе, что изучаемый процесс
является выходом линейного фильтра, на вход которого по-
дан процесс белого шума, т. е. что член ряда xt является
взвешенной суммой текущего и предыдущих значений вход-
ного потока:

где [А = const в общем случае является параметром, харак-


теризующим процесс, и оператор^ (В) = 1 + % ß + ty2ß2+
"г ••>
Если последовательность %, i|>a, ••• конечна или беско-
нечна, но сходится, то фильтр называется устойчивым, а
процесс xt будет стационарным. Тогда ц — среднее значе-
ние, вокруг которого процесс варьирует. В противном слу-
чае xt — нестационарен и ц не имеет особого смысла, кроме
как некой точки отсчета уровня процесса.
Рассмотрим некоторые специфические модели, получае-
мые линейной фильтрацией белого шума.
Типы моделей
А в т о р е г р е с с и о н н а я м о д е л ь . В этой мо-
дели текущее значение процесса выражается через конеч-
ную линейную совокупность предыдущих значений про-
цесса и возмущения et. ^ ^
Если обозначить через ~xt отклонение от среднего xt =
5=1 x
t — tt, то получаем процесс
(7.1)
где q>i = const, i - 1, ..., р,
называемый авторегрессионным процессом порядка р, ко-
торый будем обозначать АР (р). Введем авторегрессионныи
оператор порядка р:
161

ш
тогда модель может быть записана экономно:
(7.2)
В этой модели р + 2 неизвестных параметра ц, <plf ф2,...,
ФР, <т|, которые должны быть оценены по имеющимся
данным об изучаемом процессе.
Если последовательно выразить xt'~ 1, я* _ 2 и т. д.
через et, 8 f _ l f 8f_2>-". то получим эквивалентную запись
через бесконечную взвешенную сумму реализаций белого
шума:
(7.3)
Однако здесь количество неизвестных параметров моде-
ли оказывается бесконечным и форма (7.2) явно предпочти-
1
тельней. Из (7.2) и (7.3) следует, что ij> (В) — Ф" (В). (7.4)
Процессы могут быть стационарными и нестационарны-
ми. Для того чтобы процесс был стационарным, коэффи-
циенты Ф должны быть такими, чтобы в е с а ^ , i|)a, ... в
(7.3) образовывали сходящийся ряд; Для решения практи-
ческих задач, как правило, достаточно р ^ 2.
М о д е л ь с к о л ь з я щ е г о с р е д н е г о . Дру-
гим типом модели, имеющим практическую ценность, яв-
ляется модель конечного скользящего среднего, в которой
xt линейно зависит от конечного числа предыдущих значений
8, т.е.
(7.5)
Это процесс скользящего среднего порядка q или крат-
ко СС (q). Следует отметить, что в данном случае название
«скользящее среднее» вводит в заблуждение, так как веса
h —Qi, —Q2> •••, —Qq не обязательно должны в сумме да-
вать единицу и не обязательно должны быть положитель-
ными.
Если введем оператор процесса скользящего среднего
порядка q

то модель СС (q) может быть записана кратко:


(7.6)
Она содержит q + 2 неизвестных параметра (л, Qu Qt>
*..» Qq, е|. Обычно q — 0, 1, 2,
С м е ш а н й а я м о д е л ь АРСС. Для достижения боль-
шей гибкости при построении модели исследуемых процес-
сов полезно включать в нее и члены скользящего среднего,
и авторегрессионные члены. Это приводит к смешанной мо-
дели АРСС (р, q)\

с р + q + 2 неизвестными параметрами.
Модель может быть записана и так:

Особый практический интерес представляет случай р = 1,


Н е с т а ц и о н а р н ы е м о д е л и . В этих моделях
используются идеи, разработанные в [36], о возможности
трансформировать нестационарные ряды в стационарные
путем перехода от исходного ряда к его разностям соответ-
ствующего порядка d. Тогда преобразованный, стационар-
ный ряд можно описать одной из рассмотренных выше мо-
делей.
Введем обобщенный авторегрессионный оператор
¥ (В) = ф (ß)(l — B)d, где Ф (В) — стационарный опера-
тор, рассмотренный выше. Тогда модель можно записать
таким образом:

(7.7)
(7.8)
На практике обычно d = 0,1 или, наконец, 2. Модель
(7.7, 7.8) является более общей и называется интегриро-
ванной моделью авторегрессии —скользящего среднего
(АРИСС) порядка (р, dy q). Она называется интегрированной
потому, что соотношение обратное (7.8) есть xt — S wu где
5 — оператор суммирования.
Для преобразования исходного ряда в стационарный мо-
гут использоваться и различные другие преобразования.
Например, для экономических и других рядов, характери-
163
зующихся приблизительно экспоненциальным ростом, по-
лезно предварительно применять операцию логарифмирова-
ния (см. § 4 этой главы).
Включение д е т е р м и н и р о в а н н о й по-
л и н о м и а л ь н о й т е н д е н ц и и р о с т а в мо-
д е л ь АРИСС. Иногда бывает полезна небольшая модифи-
кация модели АРИСС путем добавления постоянного члена
в правую часть. Это новое слагаемое придает модели наи-
более общий вид:
(7.9)
Если постоянный член Qo опущен, то модель может ото-
бражать ряды, имеющие стохастические тренды (случайные
изменения уровня, темпа роста и т.п.). В общем случае, одна-
ко, может быть желательным включение в модель детерми-
нированной функции времени / (t). В частности, можно
включить полином порядка d, если положить Qo Ф 0.
Взяв математическое ожидание от обеих частей равенства
(7.9), получаем

Отсюда следует, что модель (7.9) эквивалентна модели


(7Л0)
где щ = wt — [iw.
Поскольку предполагается, что временной ряд генери-
руется моделью из класса стационарных и обратимых, то
необходимо уяснить требования, накладываемые при этом
на ее параметры.
Стационарность линейного процесса
Единственное условие стационарности состоит в том,
чтобы i|) (В) сходилась при \В | < 1, где В — комплексное
число*.
Для процесса АР(р) в общем случае <р (В) можно рас-
сматривать как полином порядка р относительно В, поэтому
Ф {В) можно представить в виде ф (В) = (1 — G]ß)X

* Необходимо отличать В — комплексную переменную от В—


оператора сдвига назад. Одинаковое обозначение введено для боль-
шей формализации анализа, ибо всегда для получения характерис-
тических уравнений (см. дальше) требуется замена оператора сдви-
га назад на комплексную переменную.
164
X(l — 02B).,.(\ — GPB). Тогда, если все корни полинома
различны,

Так как для стационарности процесса последовательность


1
1|) (В) = ф" (В) должна быть сходящейся при | В | ^ 1, то
необходимо иметь \Gt \ < 1, i — 1, 2, .... р. Это требование
эквивалентно тому, что корни выражения ср (В) = О долж-
ны лежать за пределами единичного круга. Уравнение
Ф (В) = 0 называется характеристическим. Ясно, что для
процесса АРСС условия стационарности те же.
На параметры процесса скользящего среднего из-за ко-
2
нечного числа членов вчр (В) — Q (В) = 1 — QiB — Q2B —
—...—QgBv никакие ограничения для того, чтобы гаранти-
ровать стационарность, не накладываются.
Мы видели, что процесс АРСС является стационарным,
если корни ф (В) — 0 лежат вне единичного круга. На прос-
том примере легко убедиться, что если корни лежат внутри
единичного круга, то модель проявляет нестационарность.
Особое внимание авторов модели привлек случай, когда
корни лежат на единичной окружности. Так появилась не-
стационарная модель АРИСС.
Обратимость
Линейный процесс

может быть записан через взвешенную сумму прошлых зна-


чений х и аддитивный скачок st

или
(7Л1)
где

165
В общем случае линейный процесс (7.11) обратим, если
веса п}- таковы, что л (В) сходится при | В | ^ 1.
Получим одно полезное соотношение, применив оператор
1|) (В) к обеим частям (7.11):

Отсюда ч» (В)п (В) = 1, т.е. я (В) = ар-1 (В). (7.12)


Из (7.12) можно получать веса я , зная-ф, и наоборот.
Рассмотрим модель xt = (1 — Qxß) е ь в которой

Выражая et через # i } получим &t = (1 — QXB)—Х5^-


Отсюда
(7.13)
так что для этой модели п/ = — Q[.
Из выражения (7.13) видно, что модель СС(1) выражает-
ся моделью авторегрессии с бесконечным числом членов.
Справедливо и обратное: модель АР (1) эквивалентна моде-
ли СС с бесконечным числом членов. Это говорит о большой
гибкости модели АРСС (/, /).
Теперь выведем условия, которым должны удовлетво-
рять параметры Qlt Q 2 ,..., Qg, для того чтобы гарантировать
обратимость процесса СС(<7). Запишем модель следующим об-
разом:

Далее используем уже известный прием (считаем, что


корни полинома Q (В) различны):

Таким образом, л (В) сходится при | В | < 1, если | #/1 <


< 1 для / = 1, 2, ..., q. Так как корни Q (В) = 0 есть Я/" 1 ,
то, следовательно, условие обратимостидля процесса СС(<?)
заключается в том, чтобы корни характеристического
уравнения Q (В) — 0 лежали вне единичного круга. Для
процесса АРСС условия обратимости аналогичны.
166
На параметры AP-процесса никакие ограничения для
обеспечения обратимости не накладываются, так как
я (В) — ф (В) — 1 — фд5 — ... — сррВ" содержит • конеч-
ное число членов.
Автокорреляционная функция
Автокорреляционная функция в этом методе является
основным инструментом при построении модели. Изучим ее
свойства сначала для АР-процессов:

(7.14)

Умножим (7,14) на #*_&.


Берем математическое ожидание и получаем разностное
уравнение для автоковариаций R:

Отметим, что М & _ h et) = 0, когда k > О, так как


xt _ h может включать реализации е, имевшие место до
момента t — k, а они некоррелированы с et. Разделив все
члены на R0) убедимся, что автокорреляционная функция
удовлетворяет разностному уравнению того же вида:
(7,15)

Оно аналогично разностному уравнению, которому удов-


летворяет сам процесс xt. Таким образом, (7.15) можно за-
писать как ( 7 Л 6 )

Учитывая, что <р (В) = П (1 - GtB), получаем общее


решение уравнения (7.16):
(7.17)

где Gf\ Go-1, .... Gp1 — корни характеристического урав-


нения Ф (В) = 0 и благодаря условию стационарности
Ю | | < 1. Если корни G, различны, то возможны два рлу-
чая
1. Корень Gt вещественный. Тогда член А$ в (7.17)
геометрически убывает к нулю с ростом k (затухающая экс-
понента),
2. Пара корней Gi, Gj — комплексно-сопряженные чис-
k
ла. В этом случае они дают член Ab sm (2nß + 9), который
является затухающей синусоидальной волной.
В общем случае автокорреляционная функция стацио-
нарного АР процесса будет состоять из смеси затухающих
экспонент и затухающих синусоидальных волн.
Имея коэффициенты автокорреляции, можно с их по-
мощью оценить параметры АР процесса. Для этого подста-
вим в (7.15) k — 1,2,..., р и получим систему линейных урав-
нений для фх, ф а , ..., ф р :

(7.18)

Это уравнения Юла-Уокера.


Если перейти к матричным обозначениям:

то решение системы (7.18) относительно параметров <р мож-


но записать в виде
(7Л9)

Заменив теоретические автокорреляции р& на их оценки


rh, можно получить оценки Юла-Уокера для параметров
модели. Отметим сразу же,что в статистике имеется несколь-
ко оценок автокорреляций, свойства которых подробно рас-
смотрены в 113), Там сделан вывод о предпочтительности
оценки автокорреляции p ft по формуле

где выборочная оценка ав-


токовариации;
х — среднее значение временного ряда по W наблюде-
ниям.

Обратимся теперь к СС-процессам. Получим сначала ав-
токовариационную функцию:

Отсюда дисперсия процесса будет:

(7.20)

Следовательно, автокорреляционная функция будет:

(7.21)

Итак, для к > q автокорреляционная функция СС-про-


Десса равна нулю. Другими словами, автокорреляционная
функция процесса скользящей средней обрывается при ла-
ге q. Это значит, что по автокорреляционной функции можно
для процессов СС определить численное значение q.
Учитывая, однако, что имеются лишь грубые оценки
Гц,..., г„, необходим некий показатель того, насколько оце-
ненное значение rt может отличаться от соответствующего
теоретического значения, в частности, для суждения, яв-
ляются ли автокорреляции нулями после некоторого лага
q. Для этих лагов можно подсчитать стандартные ошибки
оценок ГГ ПО упрощенной формуле Бартлетта:

В [22, вып. 2, с.46] показано, как определить стандартные


ошибки оценок rt в общем случае. „ .
По оценкам гх rq, используя q уравнении (7.21),
можно получить оценки Qx, Q2 Q„. Однако в отличие от
Уравнений Юла-Уокера для AP-процессов, которые являют-
ся линейными; уравнения (7.21) являются нелинейными. По-
этому, за исключением простого случая, когда q - 1, эти
Уравнения должны решаться итеративно. ,лппопопипн.
Наконец, для смешанных процессов автокорр^еляцион
ная функция может быть выведена аналогично тому, как она
169
выводилась для AP-процесса. Автоковариационная функ-
ция здесь удовлетворяет разностному уравнению:

(7.22)
где Rxe (k) — М (xt _ й et) — йзаимная ковариационная
функция между я и е

Выражение (7.22) означает, что

Таким образом, для процесса АРСС (р, q) будет q авто-


корреляций р д , р 3 _ 1,..., рх, значения которых зависят и от
параметров скользящего среднего и от автокорреляционных
параметров.
р величин р д , Рд-!, ..., Pg-jo + t составляют необхо-
димые начальные значения для разностного уравнения
(7.23), которое затем полностью определяет автокорреля-
ции с более высокими лагами. Если q — р < 0, вся авто-
корреляционная функция ру, / = 0, 1,2,... будет выражать-
ся совокупностью затухающих экспонент и (или) затухаю-
щих синусоидальных волн, а ее свойства будут определять-
ся полиномом Ф {В) ир начальными значениями автокор-
реляционной функции. Если, однако, q — р^О, то будет
q-^-p^rl значений р 0 , p l t ..., p g _ p , выпадающих из
данной схемы. Эти моменты полезны при идентификации
смешанных процессов.
Частная автокорреляционная функция
При построении модели вначале неизвестно, какого по-
рядка авторегрессионный процесс надо ставить в соответст-
вие фактическому ряду. Инструментом решения этого воп-
роса-служит частная автокорреляционная функция. Здесь
используется тот факт, что процесс АР (р), имеющий авто-
корреляционную функцию с бесконечным числом членов, по
своей природе может быть описан с помощью р ненулевых
функций от автокорреляций.
170
Обозначим через q>hj j-ik коэффициент в авторегрессион-
ном процессе порядка fe, так что cp^t — последний коэф-
фициент. По (7.18) cpbj удовлетворяют системе уравнений
Юла-Уокера:

(7.24)

или

Решая эту систему уравнений последовательно для k =


= 1, 2, 3, ..., получим фи = pi,

(7.25)

В общем случае в выражении для cpftft определитель чис-


лителя имеет те же самые элементы, что и определитель зна-
менателя, но последний столбец заменен на p h . В е л ™ а
<Pfccf рассматривается как функция лага k и называется част-
ной автокорреляционной функцией. „„„,„,. а я п
Для авторегрессионного процесса порядка Р « с г н м ав-
токорреляционная функция ш будет отлична от нуля при
k < р и равна нулю при k > р. Другими ™°*т$™*™а*
автокорреляционная функция АР (Р>^от™™каиблю-
после лага р. Если значения параметров не « и ш « ^
кв к границам нестационарности,, то Усп&ш^^21вт^о
использованы оценки Юла-Уокера; при невыполнении этого
условия оценки оказываются грубыми. ш м
При гипотезе, что процесс является ^тоР е гре^иоиным
порядка р, оценки частных автокорреляций дляi лагов p + i
и выше, как показал М. Кенуй [94], распределены приблизи
тельно независимо с дисперсией D (<рьь) & jf ^ p
171
Таким образом, стандартная ошибка оцененной частной
автокорреляции ф^ Л будет:
(7.26)

Это и служит критерием определения момента обрыва


функции.
Частная автокорреляционная функция существует также
и для процессов скользящего среднего. Как мы уже видели
(7.13), модель СС(1) эквивалентна модели АР с бесконечным
числом членов. Это означает, что частная автокорреляцион-
ная функция в данном случае будет убывать бесконечно, но
обрыва иметь не будет. Это свойство имеет более общий ха-
рактер и присуще моделям СС высоких порядков, а также
процессам АРСС.
Рассмотренные свойства моделей сведены в табл. 7.1.
Здесь наглядно видны взаимно-обратные свойства СС и АР-
процессов.
Таблица 7.1
Свойства автокорреляционных функций
\,Процесс
ÄP (р) СС (<?) АРСС (Р, Ч)
Функция ^ ч -

Рл бесконечная обрыв после бесконечная, после


убывающая лага q первых {q—р) ла-
гов доминирует
наложение затуха-
ющих экспонент и
синусоид

ФА*. .обрыв после бесконечная бесконечная, после


лага р убывающая' первых (р—q) ла*
гов доминирует на-
ложение затуха-
ющих экспонент и
синусоид

§ 2. ИДЕНТИФИКАЦИЯ МОДЕЛЕЙ.
ИНТЕРПРЕТАЦИЯ R 2 В МОДЕЛЯХ АРСС

Теперь у нас достаточно информации для того,


чтобы перейти к проблемам построения, оценки и использо-
вания моделей прогнозирования.
172
Если имеется достаточно длинный отрезок ряда (жела-
тельно 50 или более точек) и принято решение искать адек-
ватную модель в классе процессов АРИСС, то выбор и при-
вязка модели этого типа к имеющимся данным лучше всего
достигаются с помощью трехстадийной итеративной проце-
дуры, включающей идентификацию, оценку и диагности-
ческую проверку модели. После этого модель можно ис-
пользовать для прогнозирования (см. рис. 7.1).

Рис. 7.L Блок-схема построения модели

Под идентификацией имеется в виду использование на-


блюденных данных и любой другой информации для опре-
деления подкласса экономных (с точки зрения количества
параметров) моделей, среди которых следует искать адек-
ватную.
Под оценкой понимается эффективное использование дан-
ных для получения численных значений параметров моде-
ли при предположении ее адекватности процессу.
Диагностическая проверка имеет целью проверку адек-
ватности подобранной модели и ее улучшение.
Идентификация моделей
Методы идентификации являются грубыми процедурами,
применяемыми к исходным данным для определения типа
модели, который стоит исследовать дальше. С п е « ^ е с к о я
Целью здесь является получение некоторого предетавления
о величинах р, d, q, необходимых для конструирования ли-
173
нейной модели АРИСС (р, d, q) и получение предваритель-
ных оценок ее параметров. Идентификация распадается на
две стадии.
1. Определение порядка разности d исходного ряда х,
который обеспечивает стационарность.
d
2. Идентификация модели АРСС для ряда \7 Xf
Главными инструментами анализа на обеих стадиях яв-
ляются автокорреляционная и частная автокорреляционная
функции. Они используются не только для определения вида
модели, но и для приближенной оценки параметров.
И д е н т и ф и к а ц и я п о р я д к а р а з н о с т и rf.
Мы видели, что для стационарного смешанного процесса
автокорреляционная функция удовлетворяет разностному
уравнению ф (В)рь = 0, k >• q — p.
Решение этого уравнения для fe-й автокорреляции
(в предположении, что корни характеристического уравне-
ния различны) имеет вид:

(7.27)
Условие стационарности, требующее чтобы нули поли-
нома ,Ф {В) лежали вне единичного круга, означает, что
Gj, б 2 , ..., Gp лежат внутри единичного круга. Из (7.27) яс-
но, что в случае стационарного процесса, для которого ни
один из корней не лежит близко к границе единичного кру-
га, автокорреляционная функция будет сравнительно быст-
ро затухать с ростом k. Если же один вещественный корень,
скажем Gx, близок к 1, так что Gx = 1 — Ö, где б является
некоторой малой положительной величиной, то для боль-
шого k

автокорреляционная функция будет затухать медленно и


почти линейно. Это свойство используется в качестве инди-
катора корня, близкого к 1.
Способность автокорреляционной функции сохранять по-
стоянное значение с ростом k может означать, что нужно
рассматривать исследуемый процесс как нестационарный, но
возможно, что его разность при этом стационарна. Отметим,
что оцененные корреляции не обязательно должны быть
очень высоки.
По изложенным причинам предполагается, что порядок
разности dt обеспечивающий стационарность, достигнут тог-
Ш
да, когда автокорреляционная функция процесса wt —
=У% падает довольно быстро. На практике обычно d =
= 1,2, и, как правило, достаточно проанализировать пер-
вые 15—20 значений автокорреляционной функции исход-
ного ряда и его первых и вторых разностей. d
И д е н т и ф и к а ц и я п р о ц е с с а S7 xt. Опре-
делив экспериментально d, изучаем затем общий вид оце-
ненной автокорреляционной и частной автокорреляцион-
ной функций для разностей порядка d. На их основе выби-
раются р и q для АР и СС операторов. Для этого используют-
ся рассмотренные выше свойства (см. табл. 7.1). Кроме то-
го, в работе [54] показано, что теоретически возможный мак-
симум коэффициентов автокорреляции для процесса CC{q)
определяется соотношениями:

В частности, рА (max) ~ cos \^Щ-


Особое практическое значение имеют АР и ОС-процес-
сы 1-го и 2-го порядков и простейший смешанный процесс
(1, d% 1), Для моделей этих процессов имеют место законо-
мерности и соотношения, сведенные в табл. 7.2.
Мы видим, что предварительные оценки параметров для
моделей (0, d 1) и (1, d, 1) находят решая квадратические
уравнения, значит, формально будет получено по два реше-
ния. Однако лишь одно из каждой пары решении будет спот
в,oq-
п
ласти допустимых значений, определяемой У ™ ™*
ционарности и обратимости. Из оставшихся случаев лишь
(О, dt 2) представляет трудность. Для этого процесса прно-
лиженные оценки,параметров находят итеративно следую-
щим образом. ,„_ / 7 от«
Имея оценки автоковариаций и соотношения (1.Ы).
Т а б л и ц а 7.2

Основные свойства и соотношения


для наиболее важных моделей АРИСС

Модель (1, d, 0) (0, rf, 1)

Поведение рл убывает экспоненциаль- только pi=£0


но
Поведение cpuk ТОЛЬКО фцт^О доминирует экспонен-
циальное затухание

Предваритель-
ные оценки

Допустимая — 1<ф1 <1 — 1<QI<1


область

Модель (2, d, 0) (0, d, 2)

Поведение рл наложение затухающих ТОЛЬКО Pl^=0, р2=#°


экспонент и синусоид

Поведение ФАЛ ТОЛЬКО фц=)Ь0 доминирует наложение


ф22=Й затухающих экспонент
и синусоид

Предваритель-
ные оценки
«Р1= \-г\

Область допу- — 1<ф 2 < 1 —1 « З а < 1


стимых значе- Ф2 + Ф1 < 1
ний
ф2 —фх < 1 Q a —Qi<l
Модель (1. а, 1)

Поведение рл Экспоненциально убывает, начиная с А = 1

176
Продолжение

Модель ( 1 . d, 1)

Поведение фьь Начиная с ft = l, доминирует затухающая


экспонента

Предваритель- ( l - Ö i Фх) (<Р1-&).. r r ^


ные оценки 1+Q2 _2ф1 ,Qi

Область допу-
стимых значе-
ний

можно подсчитать- последовательно в указанном порядке


оценки параметров ст|, Qq,Qq-v •••>&. используя ите-
рацию:

при условии что On = 0. Для начала итерации параметры


К •Ü & приравниваются нулю. В частности, для про-
цесса (0, d, 2) уравнения имеют вид:

При получении оценок, конечно, необходимо сверяться


с областью допустимых значении. 177
Интерпретация R2 в моделях АРСС
Для анализа моделей авторегрессии и2 скользящего сред-
него также можно ввести статистику
1
R , как это делается
в множественной регрессии :

(7.28)

где а% — дисперсия белого шума;


D (х) — дисперсия временного ряда.
Величина R2 изменяется от 0 до I и представляет собой
относительную меру определенности Прогноза, получае-
мого на основе прошлой 2информации. В работе Ч. Нельсо-
на 188] показано, как R связан с автокорреляциями вре-
менного ряда и характеристиками генерирующего процес-
са. Большое внимание уделено интерпретации R2. Эта вели-
чина может быть особенно полезна при построении модели
на стадии идентификации, когда ее предварительная оценку
дает исследователю представление о прогнозируемости вре-
менного ряда и помогает избежать дальнейшего бесполез-
ного поиска лучших моделей, повышающих R2.
Рассмотрим временной, ряд хи генерируемый моделью
авторегрессии — скользящего среднего:

где Ф и Q — фиксированные параметры, удовлетворяющие


условиям стационарности и обратимости соответственно, а
et — белый шум.
Этот процесс может быть записан в обращенном виде как
процесс скользящего среднего бесконечного порядка:

гдё 1 ^ являются функциями от <fo и Qi и


(7.29)

1
Далее, в § 3, показано, что дисперсия ошибки прогноза по мо-
дели АРСС на 1 шаг вперед равна о*.
178
В результате подстановки (7.29) в (7.28) получаем

(7.30)

2
Таким образом, R не зависит от а!. Подсчет величины
R* по формул^ (7.30) на стадии идентификации затрудните-
лен. Поэтому, учитывая, что веса tp определяют
c
автокорре
c
ляционную
2
функцию временного ряда, ^ n ° ° f TfRfp°ro ^
зать R с коэффициентами автокорреляции. Проще всего это
сделать для чистых авторегрессионных процессов.

Обозначая автоковар^иации процесса ™ - n J 2 5 f У ^


лом Rjt получаем, что дисперсия xt определяется выраже
нйем:

Так что, обозначая R2 для AP-процесса порядка р через


Rp, имеем:

где рр — вектор-столбец (pi, •••» РР), 5


Чр — вектор-столбец (cpi, •••. Ф^ • Юла-Уокера
Далее, используя оценки параметров 1ила
(см. 7.19)
где Р, - автокорреляшю»ная » = , <>%££*,£&
функцию одних лишь коэффициентов лы rv
(Ри .... PJJ): (7.31)

В частности, для процесса АР (1)


179
для процесса АР(2)

Возможен еще один альтернативный способ выражения


2
R , который с точки зрения интерпретации особенно поле-
зен.
Рассмотрим долю дисперсии хи которая может быть
объяснена регрессией xt на xt-i, затем регрессией на
xt _ i и xt _ г, потом на xt _ t, xt-z и xt _ 3 и т, д.
2
Если опять обозначить R , характеризующий эти по-
следовательные регрессии через R?, RJ, R1 и т. д., то из
теории линейной регрессии следует, что
(7.32)
где qijf — коэффициент частной автокорреляции.
Это выражение означает, что дополнительный вклад в
2
R при последовательном добавлении новой лаговой объяс-
няющей переменной определяется коэффициентом частной
автокорреляции для данного лага, который показывает, ка-
кая доля необъясненной до этого дисперсии xt теперь полу-
чает объяснение. Становится понятным, почему R* для про-
цесса АР(р) зависит только от (р 1г ..., р_р). Это объясняется
тем, что ф/у = 0 для / > р, а также тем, что, как это следует
из уравнений Юла-Уокера, частные автокорреляции до ла-
га р включительно зависят только от (р ъ ..., р р ) .
На практике можно считать, что добавление новых лаго-
вых объясняющих переменных (увеличение порядка эмпи-
рической модели) даст малый вклад в R2, если выборочные
оценки частных автокорреляций для этих лагов малы.
Анализ R2 для моделей чистого скользящего среднего
CC(q)

легко проводить, если известны параметры Q, так как веса


% в (7.30) в этом случае равны коэффициентам &:

(7.33)

183
Отсюда ясно, что процессы с относительно большими ко-
эффициентами более предсказуемы.
Однако, поскольку стадия идентификации предшествует
процедуре оценивания модели, желательно опять установить
связь R* с автокорреляциями. В случае СС (1) легко полу-
чить точное соотношение:
(7.34)

Но, как мы уже видели, функциональная связь между


коэффициентами Q и автокорреляциями процесса СС нели-
нейна и именно поэтому в общем случае трудно выразить
R2 через автокорреляции. Есть два пути для выхода из по-
ложения. Первый — это учет того, что любой обратимый
процесс СС можно аппроксимировать AP-процессом высо-
кого порядка:

Соответствующий этой аппроксимации Ra подсчитывает-


ся'по формуле (7.31). Увеличивая k для получения более
точной аппроксимации, получаем
(7.35)

Второй способ аппроксимации R2 для процессов СС со-


стоит в использовании рекуррентного соотношения (7.32):
(7.36)

На практике аппроксимация AP-процессом даже доволь-


но низкого порядка обычно дает удовлетворительную оцен-
ку Ra.
Легко заметить, что какой бы ни была гипотеза относи-
тельно порядка процесса СС (q) мы получаем одну единствен-
ную AP-аппроксимацию. Отсюда, конечно, не следует, что
любая модель СС (?) будет давать один и тот же R2. Это
просто означает, что аппроксимация дает оценку теорети-
чески достижимого Ra, на основе которого можно делать вы-
воды о достаточности порядка модели СС (q). Например,
е
сли R2 для модели СС(1), подсчитанный по формуле (7.34),
намного меньше Ra, полученного путем АР-аппроксимации,
т
о Целесообразно увеличить порядок модели q.
Случай смешанных процессов АРСС столь же сложен,
к
ак и случай процессов СС, так как опять уравнения, свя-
181
зывающие параметры с автокорреляциями, нелинейны. Здесь
также используются оценки R2 по формулам (7.35) или
(7.36).
В заключение еще раз подчеркнем, что оценки автокор-
реляций, лежащих в основе процедуры идентификации, мо-
гут иметь довольно большие дисперсии и быть сильно авто-
коррелированными. Поэтой причине нет строгого соответст-
вия между теоретической и оцененной автокорреляционными
функциями. Это приводит к затруднениям при выборе р, d, q
и на данной стадии могут быть выбраны две или несколько
различных моделей для дальнейшего исследования. На этой
стадии особенно полезны графические методы, опыт самого
исследователя. В сомнительных случаях может быть целе-
сообразней использовать нестационарную модель, чем стаци-
онарную, ибо она является более гибкой. Выбор пробных
моделей на этой стадии — отправной пункт для примене-
ния более формальных и эффективных методов оценивания.

§ 3. ОЦЕНИВАНИЕ МОДЕЛЕЙ
И ПРОГНОЗИРОВАНИЕ

На стадии идентификации были получены грубые


оценки параметров модели, теперь необходимо получить
такие оценки параметров, которые приводят к наиболее точ-
ным прогнозам.
Предположим,что находимся в точке t и должны сделать
прогноз хх (f) величины xt+%. Пусть для получения про-
гноза используется линейная комбинация бесконечного чис-
ла значений &и ъг _ г, ... — реализаций белого шума к мо-
менту t. Допустим далее, что наилучший прогноз может быть
представлен в виде

где .веса орх, 1|5т+ь ••• должны быть определены. Тогда,


учитывая, что*/+ т = 2 ^ - и - Л средний квадрат ошиб-
ки прогноза равен:

182
Он достигает минимума при "фт-н/ = 4i't+/. Таким обра-
зом, значение прогнозируемого члена ряда можно пред-
ставить в виде двух групп слагаемых:

где
(7.37)

есть ошибка прогноза xx(t).


Ошибка прогноза на 1 шаг вперед будет

Как видим, ошибка прогнозирования на один шаг впе-


ред оказывается равной значению белого шума, генерирую-
щего процесс в следующий момент времени. И следователь-
но, дисперсия белого шума будет также дисперсией ошибки
прогнозов на один шаг вперед.
Самый простой и наглядный способ получения модели
с минимальным средним квадратом ошибки прогноза — это
графическое изучение Ее? суммы квадратов расхождений
между реальными членами ряда и их прогнозами, сделан-
ными на предыдущем шаге, в зависимости от значении пара-
метров, задаваемых в окрестности их предварительных оце-
нок. Минимум этой суммы будет определять искомые зна*
чения параметров. При условии нормальности распределе-
ния множества значений е эти оценки будут совпадать с
оценками, полученными по методу максимума правдоподо-
бия.
Существуют и другие способы поиска оценок парамет-
ров. Например, алгоритм Марквардта для нелинейного ме-
тода, наименьших квадратов. Различные модификации этого
алгоритма можно найти в [74] и в [5]. Рассмотрим лишь
один из способов оценивания, предложенный Боксом и
Дженкинсом.
Общая модель может быть записана как' e t =
88
Q-1 (В)Ф (B)wu
rf
где wt = V #f, щ = wt — ix».
Необходимо минимизировать 2е?.
183
Пусть ß = (<р, 0) — вектор параметров модели, а ß 0 =
=(фо» Qo)—вектор их предварительных оценок. Рассматри-
вая каждое значение et как функцию от ß, можно разложить
ei в ряд Тейлора около его значения st, 0, соответствующего
вектору предварительных оценок параметров ß 0 :

(7.38)
где

Если начальные значения в, v, и положить равными ну-


лю, то остальные могут быть подсчитаны рекурсивно сле-
дующим образом:

В соответствии с (7.38) получаем приближенное уравне-


ние линейной регрессии
(7.39)

в котором e t играет роль остатка. Тогда корректировками


параметров, минимизирующих 2е*, оказываются коэффи-
циенты регрессии e t i 0 на «*_,/ и vt„t. Добавляя к°Р"
ректировки к первым приближенным оценкам (q>0, Qo)> п0*
лучаем набор вторых приближений, которые во второй ите-
рации заменяют вектор ß 0 . Итерация проводится до тех пор»
пока не будет достигнута сходимость.
184
Поскольку итеративный цикл начинается с нулевых зна-
чений е, v, и, то несколько их первых значений будут грубы-
ми, они отбрасываются и не используются в уравнении (7.39).
Из этого уравнения легко получить частные случаи для раз-
личных рад.
При построении модели следует проанализировать нет
ли параметрической избыточности, нельзя ли упростить
структуру. Наличие избыточности не всегда очевидно. На-
пример, общий множитель слева и справа в модели

можно увидеть только после выделения множителей в левой


части

т.е.

Модель с параметрической избыточностью создает серьез-


ные трудности в процедуре оценивания. На практике труд-
ности создают не только случаи точного сокращения, но и
близкие к этому. Оценки при этом будут нестабильными
из-за почти одинаковых множителей в обеих частях модели.
В табл. 7.3 приведены ковариационные матрицы оценок
параметров для моделей, представляющих особый прак-
тический интерес.
Т а б л и ц а 7.3
Ковариационные матрицы оценок параметров
некоторых моделей (n=N — а)

Процесс Ковариационная матрица

АР(1) V(q>)=n-4l~<P2)
АР (2) РхО+фа)]
1—Ф1 J
СС(1) V(Q) =n~ 1 (l-Q a )
СС(2)
V(Q 1 Q a ) = n '[ _ Q l ( 1 H _ Q a ) x_Ql\
АРСС (1,1) „ r 'h\ 1-Ф<Э[(1-Фа)(1-Ф(г) (1-Ф») (1—Q^i
1

185
Из табл. 7.3 видно, что при ц> = Q дисперсии оценок <р
и Q в модели АРСС (1,1) бесконечны. Это и есть случай со-
кращающихся множителей АР и СС-частей.

Диагностическая проверка модели на адекватность


Одним из способов проверки является построение моде-
ли несколько более общей, чем та, которая считается истин-
ной, и сравнение этих моделей, выявление незначимых
параметров. Данный метод предполагает, что можно опре-
делить слабое звено в модели, из-за которого она оказалась
неадекватна. Однако сделать это довольно затруднительно,
особенно когда выборка невелика. Более формальная про-
верка основана на анализе автокорреляционной функций
остатков. Рассмотрим ее.
А н а л и з о с т а т к о в . Если' бы модель была адек-
ватна исследуемому процессу, то et были бы нёкоррёлиро-
ваны и.оценки rB (k) распределены приблизительно нормаль-
но около нуля с дисперсией, равной гг1, или соответствен-
но со стандартной ошибкой п *. В нашем случае п — N—d,<
где N — число наблюдений в выборке, ad — порядок раз-
ности. Это положение можно использовать для приближен-
ной оценки статистической значимости отклонений оценок
этих автокорреляций от нуля. Однако Дж. Дарбин 156] пре-
достерегает от недооценки статистической значимости откло-
нений автокорреляций re (k) от их теоретических нулевых
значений, если при малых лагах k исходить из стандартной
ошибки п 2 . Он, например, показал, что для процесса
АР (1) с параметром <р дисперсия ге (1) есть <p2ft-\ а это мо-
жет быть существенно меньше чем пг1. Кроме случаев срав-
нительно больших лагов, п~^ следует рассматривать как
верхнюю границу стандартных ошибок для r e (k).
Помимо индивидуального анализа коэффициентов ге {Щ
возможен общий совокупный тест автокорреляционной функ"
ции остатков. При этом задаются целью выяснить не свиде-
тельствуют ли первые, скажем, 20 автокорреляций остат-
ков, взятые вместе, о неадекватности модели.
Пусть имеется К оценок автокорреляций

180
Тогда можно показать [45], что если построенная модель
адекватна временному ряду, то случайная величина

а
распределена как % (/(—р — q). Если же модель не соответ-
ствует временному ряду, автокорреляции остатков будут
существенными, а величина © большой. Таким образом, об-
щую проверку гипотезы об адекватности модели можно осу-
ществить путем сопоставления © с таблицей у? с (К—р—ф-
степенями свободы.
Неадекватность модели может иметь место из-за измене-
ний значений параметров во времени при сохранении формы
модели. Для выявления этой особенности проделывается
следующая операция. Исследуемый отрезок данных разби-
вается на два и к каждому привязывается модель.
Пометим параметры моделей для каждой из половин отрез-
ка соответствующими индексами Ql1*, Q{ a \(p^\ ср}а).Им со-
ответствуют
0 }
стандартные ошибки оценок 0QI X \ OQV",
Ф/> Оф* . Отсюда находим, что стандартные ошибки разно-
стей

Сопоставляя разности параметров с их стандартными


ошибками, можно сделать вывод о вероятности действитель-
ного изменения параметров. Если такие изменения имели
место, то берутся оценки параметров, полученные на основе
более свежих данных. 2
И с п о л ь з о в а н и е R д л я п р о в е р к и ста-
т и с т и ч е с к и х г и п о т е з . Опыт свидетельствует о
том, что часто уже после оценивания нескольких альтерна-
тивных моделей исследователь оказывается в затруднении,
не зная, какой модели отдать предпочтение. На этой стадии
Целесообразно получить уточненные оценки R2, которые
в работе Ч. Нельсона [88] предложено использовать для
проверки статистических гипотез. Для этого разработана
асимптотическая теория, основывающаяся на анализе от-
ношения правдоподобий.
Пусть р означает вектор (ф х , .... <рр; Q l t .... Q3), a ß , —
вектор подмножества элементов вектора ß. Часто исследо-
187
вателя интересует проверка гипотезы того, что все элементы,
ßs равны нулю, т. е. что соответствующие s параметров не
нужно включать в модель. В более общем виде можно рас-
смотреть гипотезу вида
(7.40)
где ßs — специфицированный набор значений s параметров.
Обозначим максимальное^ значение функции правдоподо-
бия для вектора ß через L (ß), а для вектора ßc, на который
наложены ограничения (7.40), — через L (ßc). Отношение
L фс) к L (ß) показывает, насколько хорошо гипотеза (7,40)
соответствует данным. Проверка гипотезы может быть ocrio-
вана на том факте, что для больших выборок статистика
(7.41)
а
распределена как % с s-степенями свободы. Если гипотеза
неверна, то Ä, принимает большое значение, и в этом случае
гипотеза (7.40) отвергается.
Легко показать, что в случае нормального закона рас-
пределения (7.41) сводится к

где zt (ß) — остаток, подсчитанный для момента / как функ-


ция параметров $,
Выборочная оценка Я2,для модели без наложения огра-
ничений на параметры определяется как

а для модели с наложенными ограничениями

таким образом, статистический критерий принимает вид

все еще зависящий от неизвестного параметра аЦ. Если


вместо с ! подставить оценку ггх 2ег* ф), где п = N —' &
188
х
N — число наблюдений, то получим выражение , удобное
для вычислений:
(7.42)

2
Статистика к определяется относительным увеличением R
в результате устранения ограничений на параметры. Если
увеличение большое, то гипотеза (7.40) отвергается.
Теория распределений X является асимптотической. Меж-
ду тем на практике часто имеется очень немного данных для
получения выборочной оценки а%. В связи с этим по анало-
гии с соответствующей ситуацией в линейной регрессии,
для которой разработана теория малой выборки, предла-
гается также, несколько видоизмененная статистика:
(7.43)

где F имеет ^-распределение es и (п — р — q —1)-степенями


свободы (одна степень свободы вычтена в предположении, что
константа определена). Распределения F пу? будут давать
практически одинаковые результаты, если (п — р — q — 1)
порядка ста или выше. Об адекватности двух статистик при
выборках обычного для практики объема ничего неизвестно.
В частном случае, когда s = 1, F превращается в ^-рас-
пределение с (n—p — q— 1)-степенями свободы.
На практике часто выдвигается гипотеза ß = 0, т. е.
что все (р + q) параметров равны нулю. В этом случае % =
= n[RV(l-R2 ) ] i т а к к а к К | = 0 .
Итак, имея оценки R2, можно вычислить значения F или
л и, сопоставив их с табличными значениями, отвергнуть
или принять проверяемую гипотезу.
При сравнении моделей возможны ошибки двух видов,
ьо-первых, может быть отвергнута модель с меньшим чис-
лом параметров, которая на самом деле адекватна ряду, и
принята более общая модель, оценки некоторых параметров
которой будут незначимыми. Другая возможная ошибка со-
стоит в том, что может быть отвергнута более общая адекват-
ная модель и принята модель с ограничениями, что приве-
дет к некорректным значениям параметров. Следовательно,
П
РИ анализе статистических критериев нежелательно поль-
за Нельсон показывает, что эта статистика приближенно равна
'«и, которую используют А. Зельнер и Ф. Пальм в (115].
189
зоваться очень низкими уровнями значимости, такими, как
0,01 или 0,001. Это в какой-то мере оправдывает обычную
практику принятия решения в пользу более общей модели
в сомнительных случаях.
Недостаток рассмотренных статистических критериев в
том, что они позволяют сравнивать две модели лишь в том
случае, когда одна из них является более общей ло отноше-
нию к другой, т.е. (рх < рц\ ft < <7г). и не могут быть исполь-
зованы в тех случаях, когда (pt < p 2 ; qt > qu) или {рх >
>Р*\ <7i<<7a)-
После того как модель выдержала диагностическую про-
верку и статистические критерии свидетельствуют о ее обо-
снованности, можно переходить к прогнозированию.
Прогнозирование
Пусть в момент t необходимо сделать прогноз величины
Xt+t, Т > 1.
Проще всего осуществлять прогнозирование рекурсивно
непосредственно по разностному уравнению xt+t =*
!
= Ч Г 1 # ш - 1 + ••• + Ур+d ^f+i-p-d — Qie*+i-i—-•— Q g e / + i- e ,
последовательно полагая i = 1, 2, ..., х и заменяя Xj для
t < / < t + i их прогнозами, полученными на предыдущих
шагах.
Доверительные границы прогнозов.
Дисперсия ошибки прогноза на г шагов вперед есть матема-
тическое ожидание от е% (t) = {xt+% — х% (t)}*, и соглас-
но (7.37) дается выражением*.

Оценка с | может быть получена уже на стадии оценки


параметров как средний квадрат ошибок ретроспективного
прогнозирования на один шаг вперед. Веса ty можно полу-
чить исходя из следующего:
(7.44)
(7.45)
Подставляем (7.44) в (7.45): '

или ¥ (ß)ij) (В) - Q (В).


190
Приравнивая коэффициенты при одинаковых степенях
В слева и справа, получаем:

где Для / < О tyi '= О и для / > (f Q} = 0.


Таким обр'азом,' коэффициенты'^ легко подсчитываются
рекурсивно. Тогда1 прогноз с вероятностью 1 — v не будет
выходить за пределы

т№'Щ/2 является квантилем уровня 1 — v/2 стандартного


нормального .распределения., Это величина табличная:

1-V бОО/0 95%

"v/2 0,674 1,96

А д а п т и в н ы е с в о й с т в а м о д е л и . Рассмот-
рим модель V # t = (1 — QB)et> В момент t + т она может
быть записана:

Верем условное математическое ожидание в момент if при


известном до момента t прошлом. Учитывая, чточ

получаем
(7.46)

191
Используя тот факт, что xt — xt (t— 1) + et, (7.46) мож-
но записать в виде хх (t) — ~xx(t — 1) -f X&it где X =
— 1 — Q или в виде хх (t) — hxt + (1 — К)хх it — 1), что
является обычной моделью экспоненциальной средней
(см. гл. 1), которая может быть записана и так:

где alit — экспоненциальная средняя процесса в момент /;


alit — адаптивный коэффициент.
Можно также показать, что предиктор процесса

приводится к модели линейного роста экспоненциального


типа:

Когда хх (t) рассматривается как функция от т при фик-


сированном t будем называть ее прогнозирующей функцией
для момента t. Общий процесс (0, d, q) имеет своей прогно-
зирующей функцией полином от х степени d — 1.
(7.47)

для х > q — d.
Коэффициенты aiit должны последовательно обновлять-
ся с получением каждой новой фактической точки. Для t <•
<<7 — d прогноз будет зависеть от гь ef_i, .... Bt~q+x>
а после этого определяться полиномом (7.47).
Класс функций п р о г н о з а . Посмотрим,
какими еще функциями можно описать будущее поведение
ряда исходя из модели АРИСС.
При прогнозировании процесса

будущие значения 8 являются неизвестными и непредсказуе-


мыми, поэтому заменим их при вычислении прогнозов нулем.
Тогда класс функций прогноза для т > q будет определяться
192
общим решением однородного линейного разностного урав-
нения:
(7.48)
где
(7.49)

Предположим сначала, что Glt G2, ..., Gp> различны.


Тогда общее решение для момента k при условии, что ряд
начинается в момент t (при прогнозировании / соответствует
текущему моменту времени), будет:

гдеЛ{ — константы. В этом можно убедиться непосредствен-


ной подстановкой в исходное уравнение. Тогда при выпол-
нении условия стационарности | Gt | < 1 действительный
корень уравнения ¥ (В) = 0 даст в качестве слагаемого за-
тухающую экспоненту G/~"'. Пара комплексных корней
дает затухающую синусоидальную волну:

Предположим теперь, что ¥ (В) = 0 имеет т равных


корней Gö1, так что И (В) содержит множитель (1 — G0B)m
Тогда подстановкой можно проверить, что общее решение
будет:

В частности, при Go — 1 получаем полином от k — t поряд-


ка m—'l.
Вообще , когда ¥ (В) раскладывается на множители как
(1 _ GlB)(l - G 2 ß)...(l - GPB)(\ - G o ß m )
общее решение будет:

т. е. функция прогнозирования состоит из смеси затухающих


экспонент, полиномиальных членов, затухающих синусои-
дальных волн и их комбинаций.
Если взять комплексные корни характеристического
Уравнения на границе стационарности | G j | — 1, то модель
193
превращается в нестационарнуюивключаетрегулярные(не-
затухающие) периодические колебания. Например, функция
прогноза, которая является синусоидальной волной с 12-.
точечным периодом, будет удовлетворять уравнению:

где оператор В относится к т.


Это означает, что модель Брауна по своей структуре и
функциям прогнозирования является частным случаем мо-
дели АРИСС. Модель Брауна является более жесткой и при
заданном наборе функций, включенных в нее, процесс про-
гнозирования полностью определяется единственным пара-
метром ß, который, кстати сказать, часто задается интуитив-
но, Поэтому для обработки протяженных рядов предпочти-
тельней использовать метод Бокса-Дженкинса. Однако при
небольшом количестве точек, когда этот метод бессилен, мо-
дель Брауна может оказаться полезной. Подбирать какие-
либо сложные функции при малом объеме выборки нецеле-
сообразно, поэтому для практического применения из всех
моделей Брауна имеет смысл оставить лишь самые простые.
В экономических исследованиях включение в модель
синусоид, даже с адаптивной фазой и амплитудой, редко
приводит к удовлетворительному отображению сезонных
колебаний, и в каждом случае требуется дополнительный
анализ. Если включение синусоиды все же оказывается
полезным, то удобнее проводить исследование по модели
АРЙСС для преобразованного ряда. Например, при 12-
точечном периоде целесообразно
2
перейти к анализу ряда
щ. = (1 _ узв + B )xt и т. п'.
Для более качественного анализа сезонных явлении
Бокс и Дженкинс в [5] предлагают специальную схему.
Учитывая, что в ней используются уже рассмотренные на-
ми принципы и процедуры, не будем на этом останавливать-
ся.
Сравнение процесса АРИСС с процессом Тейла—-Вейджа
Процесс Тейла—Вейджа можно записать как
(7.50)
где и и v — независимые случайные переменные. Посмот-
рим, не является ли этот процесс частным случаем процес-
сов класса АРИСС. Для достижения стационарности не-
194
обходимо бзять вторую разность от исходного ряда х, т.«.
d — 2. Автокорреляционная функция для вторых разностей
в соответствии с (1.5) обрывается при лаге k ~ 3. Поэтому
среди процессов АРИСС адекватными процессу Тейла—Вей-
джа могут оказаться только те, которые имеют порядок
(О, 2, 2), т. е.
(7.51)
Предположим, что (7.50) может быть эквивалентно пред-
ставлен процессом (7.51). Тогда имеем соотношение
(7.52)
Рассмотрим условные математические ожидания. По

Вычтем (7.54) из (7.53) — 2щ~г = — QlBt„1 (7.55)


и (7.53) из (7.52)
vt + щ — 8 ( . (7.56)
Тогда связь между е* и щ, vt по (7.56) будет ej = и» + fj»
а по (7.55) е, =.-|^«/.
Это приводит к соотношениям:

или

Таким образом, гипотеза адекватности двух рассмат-


риваемых
ст х ти
процессов приводит к тому, что два независимых
° |5 ческих процесса а и о выражаются один через дру-
гой. Это противоречие не устранимо ни при каких значениях
4i. Следовательно, процесс Тейла—Вейджа нельзя привес-
ти к процессу АРИСС с одним источником белого шума.
13
* 195
§ 4. ПРОГНОЗИРОВАНИЕ ПОСЛЕ
ЛОГАРИФМИЧЕСКОГО ПРЕОБРАЗОВАНИЯ

В экономике часто встречаются негомогениые


временные ряды, в которых рост в процентном измерении
представляет, однако, гомогенный процесс. В этих случаях
обычно переходят от исходного неоднородного ряда к на-
туральным логарифмам. Если к преобразованному ряду по-
добрать модель АРИСС, то прогнозы, генерированные
этой моделью, будут, конечно, прогнозами логарифмов
будущих наблюдений. Представляется естественным об-
ратный переход от логарифмов к исходному представлению
операцией антилсгарифмирования полученного прогноза.
Но даст ли такая операция условное математическое ожи-
дание будущего значения исходного ряда? Ответ будет от-
рицательным, так как если обозначить исходный ряд че-
рез xt, a In (xt) — через уи предложенная операция бу-
дет давать оценку ехр [М (yt+JX)), где X — совокупность
прошлых значений х, а это, вообще гооворя, не является
математическим ожиданием.
Прежде чем продолжить рассуждения, рассмотрим лог-
нормальное распределение [86].
Пусть у — случайная переменная с нормальным' рас-
пределением N (|и, о8) и х — случайная переменная, свя-
занная с у соотношением х = &>. Тогда распределение х
описывается логнормальной функцией плотности:

где х принимает только положительные значения и при


х = 0 р (х) — 0. Мода распределения будет в точке х рав-
на е»~а\ а медиана в точке х равна е». Моменты относи-
тельно начала отсчета:

Отсюда математическое ожидание

а дисперсия
196
На рис. 7.2 пред-
ставлены кривые нор-
мального и логнор-
мального распределе-
ний. Отметим отно-
сительное расположе-
ние моды, медианы и
математического ожи-
дания для логнор-
мального.распределе-
ния. Иллюстрируют-
ся также логнормаль-
ные кривые для раз-
личных значений и
и а2.
ЭТИ результаты
непосредственно при-
менимы к прогнози-
рованию, когда лога-
рифм исходного ряда
представляется нор-
мальным процессом
АРИСС. Модель, гене-
рирует прогноз V* +-С
как условное рас-
пределение yt+x ~
~N{yx(t),De(t)\X}
при данной выборке
X. Следовательно, ус-
ловное математиче-
ское ожидание члена
xt+x дается выраже-
нием: хх (t) — ехр
ft* (0 + ~2De (т)}, а
Дисперсия xt+x, или,
Другими словами, ди- Рис. 7.2. Кривые нормального и логнор-
сперсия ошибки прог- мального распределений
ноза е г ( 0 = * и - т
(t)==ex
X fexp КП") ?1Х\^1Х)==Г)* P {** W + D° W> X
Далее, если yx(t)±kat(x) образует V%-HHU довери
тельный интервал для yt + т , то ехр {^т (t) ± kae (t)} об
197
разует v%-Hbifi доверительный интервал для *<+*. Заме-
тим, что доверительный интервал для Xt+X несимметричен
относительно хх (f), в то время как для yt+x он симметри-
чен.
§ 5. АГРЕГИРОВАНИЕ РЯДОВ И МОДЕЛЕЙ

Со времени введения Дж. Э. Юлом (1921) авто-


регрессионных моделей и моделей скользящего среднего они
вызывают интерес у статистиков, занимающихся анализом
временных рядов. Это объясняется тем, что модели доста-
точно просты и могут успешно применяться на практике.
Очевидным обобщением этих моделей является смешанная
модель авторегрессии — скользящего среднего. На прак-
тике смешанную модель АРСС труднее оценивать, чем, на-
пример, AP-модель, но, с другой стороны, смешанная мо-
дель может быть статистически более эффективной, чем АР-
или СС-модели. Согласно Боксу и Дженкинсу, еслиr оце-
ниваются одновременно две модели АР (р) и АРСС (p , q'),
то, как правило, во второй модели потребуется меньше па-
раметров для достижения удовлетворительных результа-
тов, т. е. р' + q' < р. Так как имеются веские основания
отдать предпочтение модели с наименьшим числом парамет-
ров, то смешанная модель часто предпочтительнее.
В работе К. Гренджера и М. Морриса [62] проведен тео-
ретический анализ, на основе которого сделан вывод о воз-
можности появления смешанных моделей в результате аг-
регирования рядов со сравнительно простой структурой.
Основная теорема, доказанная в этой работе, формулиру-
ется следующим образом.
Пусть xt и yt — два независимых стационарных ряда
с нулевым математическим ожиданием. Тогда если xt ^
~ АРСС (р, т), t/t ~ АРСС (q, п) и zt = xt + Уи т 0 z ~
-АРСС (г, в), т. е. АРСС (р, /n)+APCC, (q, n) =
= АРСС (г, s), где г < р + q и й < max (р -Ь п, q + m).
В тех случаях, когда два независимых ряда описыва^
ются моделями АРИСС, теорема утверждает, что АРИСС
(Рь <k, qt) + АРИСС (pz, dit д») « АРИСС (г; d\ s),

198
Не составляет трудности обобщить основную теорему на
случай суммы любого числа независимых рядов:

где

С точки зрения интерпретации два случая представляют


особый интерес. Первый, когда ряды агрегируются и обра-
зуется один общий; большинство макроэкономических ря-
дов, таких, как валовой национальный продукт, экспорт и
т. д., являются агрегатными. Второй, когда наблюденный
ряд является суммой истинного, процесса и ошибки наблют
дения: «сигнал плюс шум», фактически любой макроэко-
номический ряд содержит существенные ошибки наблюде-
ния.
Рассмотрим несколько частных случаев, полнее раскры-
вающих содержание основной теоремы.
1. АР (р) + белый шум — АРСС (/?, р).
Это соответствует наблюдению авторегрессионного про-
цесса в присутствии белого шума.
2. АР (р) + АР (?) = АРСС (р + ft max (p, q))
и, в частности,
АР (1) + АР (1) = АРСС (2, 1).
Это может соответствовать ситуации, когда исследуемый
ряд является агрегатом двух независимых ' авторегрессион-
ных рядов, или случаю, когда процесс АР (р) искажается
ошибкой наблюдения АР (q).
Отметим, что сумма к рядов, описываемых моделью АР(1).
приводит к модели АРСС (к, к — 1).
3. СС (р) + СС (q) = СС ( max (p, q))
и, в частности, СС (р) + белый шум = СС (р).
Таким образом, если истинный процесс генерируется
моделью СС, то добавление белого шума ошибок наблюде-
ния не изменит типа и порядка модели. Значения парамет-
ров при этом, конечно, изменятся.
4. АРСС (р, т) -j-белый шум = (АРСС (р,р)> если р > т\
\APCC (р, т), если р < т
199
Это говорит о том, что добавление ошибки наблюдения
может изменить порядок модели АРСС, хотя и не обяза-
тельно.
5. АР (р) + СС (?) = АРСС (р, р + q).
Этот случай также можно интерпретировать либо как
агрегирование, либо как наложение ошибки наблюдения,
не являющейся белым шумом.
Итак, в четырех из пяти рассмотренных случаев, кроме
случая 3, после сложения независимых рядов были полу-
чены смешанные модели авторегрессии — скользящего сред-
него. Между тем требование независимости рядов может
быть несколько ослаблено и получены те же выводы. Пред-
положим, что каждый ряд, входящий в агрегат, состоит из
двух компонент. Одна компонента, общая для всех рядов,
представляет влияние общеэкономических факторов, а дру-
гая не зависит от первой и характерна только для данного
ряда. Тогда для каждой компоненты могут быть приняты
простые модели, а после агрегирования получена общая
модель суммы рядов в соответствии с основной теоремой.
Такие модели успешно использовались за рубежом при ана-
лизе цен на фондовой бирже и доходов фирм.
Наконец, рассмотрим еще один случай, когда xt и yt ге-
нерированы авторегрессионной схемой двух переменных с
обратной связью a (B)xt -f Ь (B)yt = ги с (B)xt+d (В)у^Щ>
где &t, щ — некоррелированные белые шумы;
Ь (0) - с (0) == 0.
Модель, описывающая только хь определяется элими-
нированием yt и имеет вид: [a (B)d (В) — с (В)Ь (В) ]xt =
= d (B)et + b (B)ut.
Таким образом, вновь появляется модель АРСС (р,ф
и легко показать, что вообще р> q.
Рассмотренные случаи говорят о том, что по-видимому,
многие реальные данные описываются моделью АРСС. Фак-
тически можно сделать вывод, что наиболее вероятной мо-
делью на практике будет смешанная модель авторегрессии —
скользящего среднего, что надо учитывать на стадии иден-
тификации.
§ 6. .ПРИМЕРЫ
Метод Бокса и Дженкинса был испытан на рядах
курса акций фирмы ИБМ и цен на золото.
Ряд ИБМ также был разделен на 3 отрезка по 48 точек,
а ряд цен на золото — на 6 отрезков по 60 точек. Для каж-
200
Рис. 7.3. Прогнозирование курса акций
фирм« ИБМ по модели АРИСС(1, 0,0):
xt=525+0,944 (*<-,—525) +et

Рис. 7.4. Прогнозирование курса акций фирмы ИБМ по модели


АРИСС (0, I, 1): (1~В)д:,=0,830+е £ +0,126е(_1
201
Рис. 7.5. Прогнозирование курса акций фирмы ИБМ по мо-
дели АРИСС (0, 1, 1): (1—B)xt = l,72+et-0,204bt-i

Рис, 7.6, Прогнозирование цены на золото по модели


АРИСС (0, 1, 1); ( 1 — B)x, = e,--0,248ei-i
202
дой части модель подбиралась отдельно. По построенным
моделям производилась экстраполяция на т = 10. Резуль-
таты отражены на рис. 7.3—7.11.
Проанализируем полученные результаты. Хорошо согла-
суется прогноз с фактическим поведением процесса на от-

Рис. 7.7. Прогнозирование цены на золото по модели


АРИСС (0, 1,1): (1—£)*<«= в«+0,068ej-j

Рис. 7,8. Прогнозирование цены на золото по модели


АРИСС (0, 1, 1): ( l - ß ) . v t = 6(~0,387e(- 1

резках: Золотох, Золотоа, Золото3, Золото4> Золото5, Зо-


лото6( ИБМ2, ИБМ3. Особенно интересно сравнить прогно-
зы для отрезка Золото0 с экстраполяцией по модели Холь-
та с гипотезой, что ряд генерируется процессом Тейла—
Вейджа (см. рис. 1.10). Модель АРИСС дала здесь намного
лучший результат.
203
На участке ИВМ^ реальный процесс уходит из довери-
тельной области. Это можно объяснить резким падением
курса акций (на 40 дол.) от точки 46 до точки 51. Таких пе-
репадов на участке 1—48 не наблюдалось. В данном слу-
чае оказалась неверна гипотеза о возможности экстраполя-
ции динамических свойств ряда.

Рис. 7.9. Прогнозирование цены на золото по модели


АРИСС (0, 1, 0): (1—5)лг( = е<

Наш опыт работы с моделями АРИСС показал, что не-


удачи при прогнозировании часто объясняются неоднород-
ностью свойств ряда. Поэтому целесообразно в общей блок-
схеме построения модели АРИСС (см. рис. 7.1) добавить
блок предварительного анализа ряда на однородность.
Иногда полезно при построении модели отказаться от части
имеющейся устаревшей информации с тем, чтобы данные
характеризовались большей однородностью.
В табл. 7.4 приведены результаты эмпирического сравне-
ния моделей Бокса—Дженкинса и адаптивной модели авто-
регрессии, рассмотренной в гл. 3. Адаптивная модель ав-
торегрессии хорошо себя зарекомендовала при эмпиричес-
ком сравнении с другими моделями (см. гл. 6, § 4), На ос-
нове данных табл. 7.4 можно сделать вывод о том, что мо-
дели Бокса—Дженкинса, по-видимому, приводят к более
точным прогнозам, чем адаптивная модель авторегрессии.
204
РйС ?1 Г 08 1р аН
" АРИ?г° т 1 п /? е о ? е н ы н а З о л о т ° по модели
АРИСС (0, 1, I): (l~ß)*,»0,196+ei+0 416B|
t tai

205
Т а б л и ц а 7.4
Сравнение моделей Бокса—Дженкинса
с адаптивной моделью авторегрессии
по среднему квадрату ошибки ретроспективных прогнозов ( т = 1 )
Средний квадрат ошибки
Ttmn Номер Количество модель адаптивная
"яд отрезка членов Бокса— модель авто-
Дженкинса регрессии*

Курс акций 1 48 30,254 30,72а


фирмы ИБМ 2 48 33,808 44,363
3 48 44,547 45,008

Цена на золото 1 60 0,09208 0,09571


2 60 0,10623 0,10947
3 60 0,02797 0,02910
4 60 0,13410 0,13851
5 60 0,40441 0,83498
6 60 0,68115 0,81166

• В связи с тем, что при подсчете среднего квадрата ошибки в "спользо


ванных нами программах метода Бокса-Дженкинса первые пять з н » ' ^ ы е
ошибки не учитываются, как связанные с начальными условиями, дани
скорректированы.
Сделаем некоторые выводы. В данной главе рассмотрев
ны методы построения интегрированных моделей авторег-
рессии — скользящего среднего, изучены их свойства, про-
ведено экспериментальное моделирование. Преимущества
метода Бокса—Дженкинса проявились в том, что, во-пер-
вых, возможности адаптивных моделей расширились за счет
учета авторегрессионных свойств исходного ряда или его
разностей; во-вторых, теперь при наличии достаточного
количества однородных данных можно более обоснованно
конструировать модель; в-третьих, в процедуре исполь-
зуется критерий 0 (критерий Бокса—Пирса), и критерий
%, на основании которых можно отвергнуть ту или иную'
модель. Однако, как показывают эксперименты, и при хо-
роших значениях критерия адекватности модели реальному
процессу в некоторых случаях модели могут давать плохие
прогнозы.
Проведенные исследования показал.и, что основным
фактором погрешности в таких случаях являлась неодно-
родность анализируемых рядов (они охватывали временные
отрезки с качественно различной динамикой развития). В
практических исследованиях такого рода погрешности, по*
видимому, наиболее опасны. Поэтому перед построением мо-
дели необходим тщательный качественный анализ исходного
ряда. В связи с этим следует-считать неправомерным чисто
формальное применение рассмотренной процедуры для син*
теза модели АРИСС на основе.автокорреляционнойи. част*
ной автокорреляционной функций. Перёд построением мо-
дели Бокса—Дженкинса необходим анализ данных на од-
нородность. В ряде случаев может'появиться возможность
усилить однородность путем преобразования части исход«
ных данных.
Как отмечалось, для исключения тенденций, выражаемой
полиномом порядка d, Бокс и Дженкинс предложили пере«
ходить от исходного ряда к его разностям wt, = 7ахгя стро-
ить модель. АРСС для ряда щ = Wt — ц ш (см. (7.10)),
где ц ш — среднее значение wu т. е.

(7.67)
207
Представим (7.57) для случая d = 1 в виде:

где n=N — 1.
При d —I и Ци, Ф 0 речь идет об исключении тенденции,
выражаемой полиномом первого порядка, причем ц№ есть
коэффициент линейного роста. Способ его оценки (7.58),
очевидно, не является наилучшим, так как он опирается
лишь на два крайних наблюдения выборки, а остальные
данные в расчет не принимаются.
Точно так же можно показать, что при d — 2

Это свидетельствует о том, что предлагаемый метод ис-


ключения полиномиальных тенденций может быть пригоден
лишь при краткосрочном прогнозировании. При увеличе-
нии же периода упреждения тенденцию лучше исключать
каким-либо другим способом, а модель АРСС строить для
отклонений от тенденции.
Сравнивая процессы Бокса—Дженкинса и Тейла—Вей-
джа, мы пришли к выводу, что это различные процессы.
Между тем линейный предиктор Хольта, использованный
Тейлом и Вейджем, является частным случаем предикторов
Бокса—Дженкинса. Таким образом, один и тот же предик-
тор может быть оптимальным для прогнозирования различ-
ных процессов, при этом доверительные границы прогноза
должны рассчитываться, конечно, по различным формулам.
Мы видели, что модели Брауна являются частным слу-
чаем моделей Бокса и Дженкинса. Подчеркнем теперь ос-
новное различие между этими методами. Модели Брауна
полностью определяются единственным параметром ß.
Браун пытался прогнозировать все многообразие рядов С
помощью всего лишь трех различных значений ß. Таким
образом, его целью было создание простых универсальных
моделей, дающих минимум среднеквадратической ошибки
для совокупности многих рядов в целом.
У Бокса и Дженкинса к каждому ряду подход индиви-
дуален. Они решают проблему построения специальной,
оптимальной модели отдельно в каждом случае. По-види-
мому, оба подхода для практики сохраняют свое значение,
но различаются по целям и области применения.
Глава 8
МОДЕЛИРОВАНИЕ ВЗАИМОСВЯЗАННЫХ
ВРЕМЕННЫХ РЯДОВ

Глава посвящена вопросам многомерного ста-


тистического анализа. Рассматривается возможность про-
верки адекватности линейных динамических эконометри-
ческих моделей реальному процессу на основе изучения и
сопоставления стохастических свойств переменных, вхо-
дящих в состав уравнений. Предлагается адаптивная мо-
дель множественной регрессии. На ее основе построена
адаптивная производственная функция на данных, харак-
теризующих экономику США (1947—1973 гг.).

§ 1. АНАЛИЗ ЛИНЕЙНЫХ ДИНАМИЧЕСКИХ


ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ

В предыдущих главах рассматривалась техника


анализа изолированного временного ряда. В центре нашего
внимания были методы построения прогностических моде*
лей на основе анализа данных единственной выборки. Пред-
полагалось, что будущая тенденция является той или иной
функцией времени или предшествующих значений ряда;
Вследствие того, что на коэффициенты этой функции не на-
кладывалось требование быть неизменными во времени, а
модель, по которой рассчитывались прогнозы, наделялась
адаптивными свойствами, методы анализа и прогнозиро-
вания изолированного ряда были достаточно гибкими и по-
лезными для моделирования широкого класса одномер-
ных процессов или их отдельных сторон. В случае ограни-
ченности исходной информации, неразработанности теории
исследуемого процесса, неопределенности представления о
взаимосвязях данного ряда с другими рядами эти мето-
ды могут оказаться незаменимыми и упрощение, в резуль-
14-1866 209
тате которого совокупное воздействие всех сторонних фак-
торов выражается в модели через время, становится необ-
ходимым.
Если же известно о воздействии на изучаемый процесс
каких-то других процессов и имеется возможность полу-
чить временные ряды, описывающие их развитие, то мето-
ды анализа изолированных рядов уступают место много-
мерному статистическому- анализу. Это позволяет включить
в модель ценную дополнительную информацию, учесть
структуру изучаемого объекта и получить взаимоувязанные
прогнозы нескольких переменных.
В случае многомерного статистического анализа обыч-
но строят системы линейных уравнений, модели множествен-
ной регрессии. Вопросам их построения посвящено доста-
точно много работ (см. например, [14]). В процедуре по-
строения таких моделей можно выделить пять основных
этапов: отбор временных рядов (факторов) для включения
в модель, разделение всех отобранных факторов на экзо-
генные и эндогенные, принятие гипотезы о характере свя-
зи эндогенных и 'экзогенных переменных (т. е. структуры
модели), оценивание параметров модели по заданному кри-
терию, анализ адекватности модели, На все этапы, кроме,
пожалуй, оценивания, огромное влияние оказывает субъ-
ективное мнение исследователя, его опыт, знание реаль-
ных процессов и теорий. В силу этого структура модели
часто задается произвольно, интуитивно. Этим и объясня-
ется потребность в методах анализа гипотез о структуре
научаемого объекта. Интересным в этом плане является
предложение А. Зельнера и Ф. Пальма [115] сначала теоре-
тически вывести свойства каждого включенного в модель
фактора исходя из гипотетической структуры модели, а
затем провести эмпирический анализ статистических дан-
ных. Если результаты эмпирического и теоретического ана-
лиза не противоречат друг другу, то предполагается, что
структура модели выбрана верно. Если же обнаруживает-
ся противоречие, модель перестраивается в соответствии с
новой гипотезой и вновь осуществляется проверка.
Иными словами, структура эконометрической системы
уравнений проверяется на основе раздельного анализа каж-
дого входящего в нее временного ряда методом, рассмот-
ренным в гл. 7, и сопоставления статистических свойств
эндогенных и экзогенных переменных. Таким образом, тра-
диционный эконометрический подход соединяется с послед-
210
ними достижениями техники исследования временных ря-
дов. Остановимся на этой идее более подробно.
Предположим, что исследуется линейный многомерный
процесс. Наблюденные временные ряды многомерного про-
цесса можно представить в виде вектора переменных zt =
z
= (z 1 ) b z2lU •••> P,t)' В предположении, что этот процесс
адекватно аппроксимируется многомерным процессом АРСС,
можно вслед за М. Кенуем [127] записать:
(8.1)
где щ == (е l i f , e 2 i , ..., е ^ ) вектор случайных ошибок;
0 = (0 Ъ Ö2, ...', Qp) — вектор констант;
Н (В) и F (В) — матрицы операторов сдвига назад раз-
мерности (р X р), элементами которых являются полино-
мы от В конечного порядка, т. е.

r{j и qu обозначают порядок hu (В) и fu (В) соответственно.


В отношении вектора ошибок принимается, что

где btf дельта-функция Кронекера1; 1Р — единичная матри-


ВД (Р Х/>). •
Взаимные корреляции одновременных значений, авто-
корреляции, а также различные дисперсии элементов век-
тора ошибок могут быть введены посредством соответствую-
щей спецификации матрицы F (В). Если элементы матрицы
F {В) имеют нулевой порядок от В, то (8.1) чистый АР-про-
цесс. Если элементы матрицы Н (В) имеют нулевой по-
рядок от В, то (8.1) чистый СС-процесс. Если и Н (В) и
F (В) содержат полиномы, порядки которых отличны от
нуля, то (8.1) представляет смешанный процесс АРСС.
Если Н (В) обратима, т. е. имеет собственные значения
в
не единичного круга, то можно обе части (8.1) умножить
1
См. стр. 29.
211
на матрицу Н* (В), присоединенную1 к матрице Н (В):
(8.2а)
где | Н (В) | — детерминант матрицы Н (В), полином от В
конечного порядка;
в " = (8ь Эг, ..., Эр) — вектор новых констант.
Таким образом, система (8.2а) состоит из уравнений вида:
(8.26)
где с' обозначает i-ю строку Н* (В) F (В). Такие уравнения
назовем к о н е ч н ы м и у р а в н е н и я м и (КУ).
Из (8.26) видно, что отдельные элементы вектора zt опи-
сываются АРСС-процессами. Если обе части выражения не
содержат общих сокращающихся множителей, то порядок и
параметры AP-частей всех'уравнений в (8.26) должны быть
идентичными. Это может быть проверено анализом статис-
тических выборок. Если эмпирический анализ , каждого
временного ряда в отдельности подтверждает, что порядок
и параметры AP-частей КУ идентичны, то вектор может
быть генерирован процессом (8.1) без наложения каких-
либо дополнительных ограничений на Н (В). Если, однако,
порядок и параметры AP-частей КУ оказались различными
для различных элементов гь то возможно, что Н (В) имеет
•какой-либо особый вид, например, может быть треугольной
или блочной диагональной матрицей.
На основе эмпирических результатов изучения КУ
можно сделать выводы о возможных свойствах матрицы
H-(ß) и наложить на нее соответствующие ограничения.
В частности, в больших системах, если бы на Н (В) не
накладывались никакие ограничения, процессы (8.2а) име-
ли бы высокий порядок AP-частей, что не согласуется с эм-
пирическими исследованиями, которые указывают на от-
носительно низкий порядок AP-частей КУ для многих эко-
1
Напомним, что присоединенной матрицей к квадратной мат-
рице А называется матрица А*, составленная из алгебраических до-
полнений к элементам матрицы А.
Известно, что произведение

где d = | А | — определитель матрицы А.


212
номических переменных. Важно отметить, что независимо
от того, возможно или нет вывести свойства Н (В) из эмпи-
рического анализа, определенные по статистическим дан-
ным КУ позволяют генерировать прогнозы раздельно по
каждой переменной.
В эконометрических работах обычно предполагается,
что не все переменные равноправны: некоторые из перемен-
ных в zt заданы экзогенно, т. е. генерированы процессами,
независимыми от процессов, генерирующих остальные
переменные. Это означает, что матрицам Я (В) и F (В) предъ-
являются определенные требования и они приобретают спе-
цифический вид.
Разобьем zt следующим образом: zt = (yt, xt),
где y t — вектор эндогенных переменных размерностью
(Pi X 1);
xt — вектор экзогенных переменных размерностью
(р2 X 1), р -pt + Ръ-
Тогда систему (8.1) можно "записать как

(8.3)
где Н (В), F (В), в , Zi расчленены в соответствии с разбие-
нием zt.
Предположение, что xt — вектор экзогенных перемен-
ных — приводит к следующим ограничениям:
Н 2 1 (В) . 0; F« (В) ш 0; F 1 2 (В) ш 0. (8.4)
Это означает, что на поведение xt элементы вектора e l t не
оказывают влияния, а элементы вектора еа* воздействуют
на yt только через элементы х ( .
При этих ограничениях, наложенных на (8.3), получаем
(ниже матриц и векторов указана их размерность):

и ( 8 . 5 а )
(8.56)

то
Уравнения (8.5а) являются с т р у к т у р н ы м и , в
время как уравнения (8.66) описывают процессы, гене-
213
рирующие вектор стохастических экзогенных переменных

Предположение о том, что х, — вектор экзогенных пе-


ременных, приводя к ограничениям (8.4), сильно сказыва-
ется на форме КУ. При условии обратимости Н 2 2 (В) КУ
для элементов xt имеют вид:
(8.6)
где | Н 2 2 (В) | и Шг (В) — детерминант и присоединенная
матрица соответственно;
Щ — вектор новых констант.
Подставляя xt из'(8.6) в (8.5а) и умножая обе части на
матрицу, присоединенную к Н п (В), т. е. на tt*u(B), по-
лучаем КУ для элементов yt:

где б'/ — вектор новых констант.


При сравнении (8.6) и (8.7) видно, что КУ для элемен-
тов вектора эндогенных переменных yt имеют АР-опера-
торы, порядок которых равен или выше, чем порядок у
AP-операторов КУ для элементов xt. Если | Н и (В) | поли-
ном нулевого порядка от В, то порядки АР-частей (8.6) и
(8.7) совпадают. Обычно же порядок АР-оператора (8.7)
будет превосходить порядок АР-оператора (8.6). Это может
быть проверено эмпирически.
Далее, порядок СС-оператора в (8.7) будет выше, чем
в (8.6). Это также можно проверить эмпирически. Наконец,
если, как это обычно и бывает, относительно элементов Н (В)
и F (В) сделаны дополнительные предположения, то их влия-
ние на вид КУ может быть определено теоретически и про-
верено эмпирически.

§ 2. АДАПТИВНАЯ МОДЕЛЬ
МНОЖЕСТВЕННОЙ РЕГРЕССИИ

Классический регрессионный анализ опирается


на гипотезу о возможности аппроксимации изучаемого про-
цесса линейным уравнением с постоянными коэффициента-
ми. Эти коэффициенты отражают степень связи различных
переменных с изучаемой величиной. В реальной жизни си-
ла взаимодействия переменных не остается неизменной,
как не остается неизменной и внешняя среда, в которой раз-
214
вивается исследуемый процесс. Оценки же коэффициентов,
полученные на основании упомянутой гипотезы, отражают
характер связи переменных лишь в среднем по выборке,
поэтому трудно ожидать, чтобы они привели к хорошим
краткосрочным прогнозам.
Таким образом, множественная регрессия с постоянны-
ми коэффициентами имеет ограниченное применение и весь-
ма желательно было бы найти способ корректировки, об-
новления ее коэффициентов. Это открыло бы возможность
исследовать направление и характер эволюции взаимосвя-
зей переменных и получать прогнозы по модели, лучше от-
ражающей текущее состояние процесса. Здесь мы и пред-
лагаем способ адаптации коэффициентов множественной
регрессии.
Предположим, что исследуется связь ряда у с рядами
хь ..., хм и что оценку значения t/t+x можно получить как
взвешенную сумму вида:

Это уравнение множественной регрессии.


В случае, когда х = О, будем решать задачу чистого
анализа эволюции коэффициентов связи (о<(1. При х >- О —
задачу анализа эволюции коэффициентов' множественной
регрессии и прогнозирования на х шагов вперед на основе
текущей информации.
Сравнивая оценку ух (t) с фактической точкой ряда
У(+т» можем вычислить ошибку:

и на основе полученного результата произвести корректи-


ровку коэффициентов ю м .
Для адаптации коэффициентов (aiiU как и в гл. 3, вос-
пользуемся методом наискорейшего спуска, т. е. обновле-
ние весов будем осуществлять по следующему правилу:

где \ус — вектор старых коэффициентов;


WH — вектор новых коэффициентов;
k — коэффициент (k > 0);
Srad (е*_и) _ вектор, градиент е\+х.
215
Используя выражение для et+t, находим элементы гра-
диента:

В целом градиент будет равен:

где Xt — вектор lxlti XM.tY,


Таким образом, корректировка коэффициентов должна
осуществляться по правилу: WH = Wc + 2ket+±Xt.
Неизвестным в этом выражении остается лишь значение
коэффициента й, определяющего скорость движения в наш
равлении обратном градиенту. Для того чтобы выявить его
роль в процессе адаптации, поступим следующим образом.
Вернемся в точку t и вновь сделаем прогноз, но уже с но-
выми весами WH. Получим новое значение ошибки:

где (ec)t+x — ошибка, полученная при старых весах (®e)i,r


Теперь если положить

и при 0 < а < 2 | Ы * + т | < 1 Ы / + т | . „


Следовательно, а определяет реакцию модели на полу-
ченную текущую ошибку и корректирует коэффициенты мно-
жественной регрессии так, чтобы уменьшить ошибку на
(1 — 11 ~ - а | ) • 100%. Будем называть« параметром адап-
тации и считать его постоянным для данной модели. Коэф-
фициент k будет при этом меняться во времени. Оптималь-
ное значение а можно определить методом проб, т. е. в про-
цессе «обучения» модели.
216
Очевидно, что, для того чтобы включить в уравнение
множественной регрессии свободный член, достаточно один
экзогенный ряд, скажем хх, задать в виде единиц. Ла-
говые, запаздывающие- переменные можно ввести в число
экзогенных, полагая, например,

Следует сказать несколько слов о проблеме мультикол-


линеарности. Мультиколлинеарность, т. е. корреляция меж-
ду независимыми переменными уравнения, имеет место тог-
да, когда существуют линейные соотношения между экзо-
генными переменными. Сильная мультиколлинеарность час-
то возникает при введении в уравнение лаговых перемен-.
ных. Проблема мультиколлинеарности, неразрывно свя-
занная с проблемой оценивания параметров уравнения,
рассмотрена практически во всех серьезных работах, посвя-
щенных регрессионному анализу. Остается отметить, что
в нашем случае мультиколлинеарность проявляется в ухуд-
шении процесса адаптации. Это приводит к тому, что оцен-
ки параметров могут значительно искажать представление
о реальной структуре объекта в текущий момент времени.
Проведем эксперимент. Возьмем ряд натуральных чи-
сел от 1 до 20. Легко убедиться в том, что этот ряд точно
воспроизводится авторегрессионной схемой второго поряд-
ка:

f.e. й 1 = 2 и а г = - 1 , Значения этих коэффициентов оце-


ним с помощью адаптивной модели множественной регрес-
сии. В качестве начальных оценок весов произвольно поло-
жим G> = 0,5 и (»2,о — 0,5. Процесс адаптации проведем
1I0

многократным прогоном модели от значения х = 3 до х =


^ 20, считая в каждом цикле (по 18 итераций в каждом)
начальными те значения параметров, которые были полу-
чены в конце предыдущего цикла. Результаты, приведен-
ные в табл. 8.1, свидетельствуют о медленной сходимости
оценок к истинным значениям параметров при наличии
с
ильной корреляции экзогенных переменных.
Перед построением модели адаптивной множественной
Регрессии рекомендуем строить обычную множественную
Репрессию методом наименьших квадратов. Это помогает
н
а начальном этапе моделирования определить структуру
Уравнения множественной регрессии, отобрать переменные
217
Т а б л и ц а 8.1
Адаптация коэффициентов множественной регрессии
при сильной мультиколлинеарности экзогенных переменных

Общее Оценки параметров


а Количество количество
циклов итераций и,

' 0 0 0,5 0,5


5 90 0,99674 0,04146
1,8 50 900 1,96574 —0,96443
100 1800 1,99914 —0,99911
150 2 400 1,99992 -0,99992

0 0 0,5 0,5
5 90 1,22087 —0,29308
1,9 50 900 1,99271 -0,99339
100 1800 1,99991 —0,99992
150 2 400 1,99995 —0,99995

для их включения в уравнение. Полученные на этой стадии


результаты можно рассматривать как исходные для адап-
тивного моделирования, их полезно также использовать
для сопоставлений.

§ 3. АДАПТИВНАЯ МОДЕЛЬ
ПРОИЗВОДСТВЕННОЙ ФУНКЦИИ

Построение и оценка производственных функ-


ций, отражающих связь между факторами и результатами
производства, являются классической проблемой экономет-
рии (см. [6], [27], [31]).
Производственные функции имеют достаточно общую
форму для экономического анализа. Они применяются в
исследованиях различных уровней экономики в зависимо-
сти от характера исходных данных. В одних случаях про-
изводственные функции, описывают отдельные технологи-
ческие процессы, в других — отражают деятельность пред-
приятия, отрасли или экономики страны в целом. Произ-
водственная функция отражает устойчивую количествен-
ную связь, существующую между затратами и выпуском
Продукции, но безотносительно к содержанию происходя-
щих при этом реальных производственных процессов. Со-
четание производственных факторов при этом условно на-
зывается абстрактной технологией,
218
, Простейшая производственная функция, функция Коб-
U
ба—Дугласа имеет вид: Y = AK LP; а > 0; ß > О,
где Y — выпуск продукции, a L и К — используемые объ-
емы живого и овеществленного труда соответственно.
Смысл параметров а и ß, статистическая оценка кото-
рых производится на основе рядов Y, К и L, легко выявля-
ется с помощью логарифмического дифференцирования пре-
дыдущего уравнения:

Это выражение означает, что рост в исследуемый пери-


од объема К на 1% определяет рост выпуска продукции
на а%. Параметр ß интерпретируется аналогично для затрат
живого труда. Таким образом, а и р являются эластично-
стями выпуска по факторам производства.
В экономической системе, описываемой производствен-
4
ной функцией Кобба—Дугласа, при а + ß > 1 имеет мес-
тоэкономия на масштабах производства, а при а + ß < 1 —
рост удельных издержек. Соотношение а + ß = 1 означает,
что совокупная эластичность факторов равна единице.
Производственная функция предполагает, что существу-
ет возможность для взаимного замещения факторов, т. е.
что производственные факторы могут сочетаться в различ-
ных пропорциях. Однако при любой данной комбинации
факторов можно достичь различных объемов выпуска про-
дукции в зависимости от эффективности технологии и ор-
ганизации производственного процесса. Эффективность —
характеристика абстрактной технологии, относящаяся
только к зависимости между затратами и выпуском. Она
не затрагивает отношений между затратами. Можно сказать,
что эффективность абстрактной технологии выступает как
масштаб преобразования затрат в выпуск, Эффективность
в производственной функции отражает параметр А. Если при
прочих равных условиях параметр А в производственной
функции для одной экономической системы выше, чем для
Другой, то первая может считаться более эффективной, так
как равные затраты ресурсов обеспечивают в ней больший
выпуск продукции.
В связи с тем, что эффективность экономической систе-
мы, как правило, не остается постоянной на отрезке вре-
мени, для которого строится производственная функция,
логично отражать эффективность в производственной функ-
219
ции переменным множителем A{t). В качестве простейше-
го способа учета возрастания экономической эффективности
Я. Тинберген предложил функцию A (t) = Aext. При этом
на параметры производственной функции обычно наклады-
вают ограничение а + ß = 1.
Таким образом, получаем динамическую производствен-
ную функцию:
(8.8)
где оцениваемыми параметрами являются А, а, к, причем
А теперь характеризует эффективность технологии в мо-
мент t = 0.
Если рост эффективности происходит при неизменном
отношении a/ß, то говорят, что наблюдается нейтральный
технический прогресс. Если же это соотношение меняется
во времени (a = a (t) и ß = ß (t)), то в случае увеличения
a/ß прогресс называется капиталорасходующим (трудосбе-
регающим), а при уменьшении a/ß — капиталосберегаю-
щим (трудорасходующим).
Перейдем к проблеме оценивания. Уравнение произ-
водственной функции относится к классу нелинейных. Меж-
ду тем наиболее распространенным методом оценки пара-
метров экономико-математических моделей является метод
наименьших квадратов (МНК), разработанный преимущест-
венно для оценки линейных моделей. В тех случаях, когда
использование линейной модели не отвечает поставленной
задаче, нелинейные модели обычно сводят к линейным, а за-
тем эти производные модели оценивают с помощью МНК.
Статистическая связь между тремя переменными в про-
изводственной1 функции выражается в форме:
(8.9)
где ef — случайная переменная.
На практике же оценивание параметров Л, а и « часто
осуществляют по регрессионному уравнению, получаемому
из (8.8) путем почленного деления на Lt и логарифмирова-
ния обеих частей:
(8.10)

где щ — случайная переменная.


Однако применение МНК непосредственно к этому УР*0"
нению приводит к тому, что оценки параметров оказыва-
220
ются смещенными, так как минимум 2«? в (8.10) не соот-
ветствует минимуму 2в* в (8.9).
В [12] (см. также приложение 3) делается вывод, что для
компенсации смещения в случае производственной функ-
ции рассматриваемого нами вида нужно обе части уравне-
ния (8.10) предварительно умножить на переменную, стоя-
щую в левой части уравнения (8.9). Таким образом, приходим
к задаче оценивания уравнения:

где vt — случайная переменная; vt = Ytut Ä* et.


Если теперь для оценивания этого уравнения вместо
МНК применить метод адаптивной множественной регрес-
сии, то получим адаптивную модель производственной
функции.
Пример
Построим адаптивную модель производственной функ-
ции экономики США по данным за 1947—1973 гг., приве-
денным в табл. 8.2. В качестве переменной Y возьмем вало-
вой национальный продукт в ценах 1958 г., в качестве К —
величину основного капитала по полной стоимости в ценах
1958 г., умноженной на индекс загрузки оборудования, и в
качестве L — численность занятых в народном хозяйстве.
После простого преобразования получим возможность
рассчитывать производственную функцию на основе ин-
дексов, как это обычно и делается:
(8.11)

Делим обе части исходного уравнения (8.11) на LtILx


и логарифмируем:

Проводим преобразование уравнения, необходимое для


корректировки смещения при оценивании параметров:
Оценивание проводим методом адаптивной множествен-
ной регрессии и получаем картину эволюции параметров
(см. табл. 8.2).
Т а б л и ц а 8.2
Адаптивная производственная функция экономики США
(1947—1973)
Исходные данные Результаты


•2•
* «я
_ о ь* »к
Ч я " х -с
l§i
m а V. а
е
а+нх
х(<-1)
Год

га З
SSBSSS со а- я
1 2 3 4 5 6 7 8 9

1947 309,9 428 705 95,2 57039 0,27823 0,02769 —0,00797 0,9921
1948 323,7 447216 92,4 58 344 0,27820 0,03102 —0,00464 1,0267
1949 324,1 461 761 81,3 57 649 0,27811 0,03296 -0,00367 1,0642
1950 355,3 480 881 89,5 58 920 0,27812 0,03459 —0,00313 1,1059
1951 383,4 500640 90,6 59 962 0,27818 0,03928 -0,00195 1,1679
1952 395,1 518053 88,5 60 254 0,27809 0,03186 —0,00344 1,1687
1953 412,8 536325 92,3 61181 0,27806 0,03045 —0,00367 1,1961
1954 407,0 553462 82,9 60110 0,27805 0,02876 -0,00391 1,2182
1955 438,0 572 708 90,8 62171 0,27801 0,02678 -0,00416 1,2338
1956 446,1 595509 89,8 63 802 0,27792 0,02162 -0,00473 1,2091
1957 452,5 615884 86,5 64 071 0,27794 0,02309 -0,00459 1 2540
1958 447,3 630255 75,9 63036 0,27794 0,02327 -0,00457 I 2858
1959 475,9 645 172 82,2 64630 0,27793 0,02208 —0,00467 1 2973
1960 487,7 663 545 80,5 65 778 0,27792 0,02125 -0,00473 13120
1 3526
1961 497,2 680 050 77,7 65 746 0,27792 0,02191 —0,00469 1,3920
1962 529,8 699872 81,2 66 702 0,27793 0,02270 —0,00463 1 4087
1963 551,0 712 014 82,8 67 762 0,27792 0,02171 —0,00469 1 4379
1964 581,1 745 146 85,7 69 305 0,27792 0,02164 -0,00470 1 4554
1965 617,8 778 123 90,6 71088 0,27791 0,02111 -0,00473 1 4824
1966 658,1 817 822 95,8 -0,00474
72 895 0,27791 0,02097 -0,00478 1 4841
1967 675,2 855304 92,7 74 372 0,27789 0,01998 -0,00478 1 5153
1968 706,6 894 529 94,5 75920 0,27789 0,02002 -0,00488 14757
1969 725,6 936 600 95,6 77902 0,27784 0,01791 - 0 00487 1 5072
1970 722,5 973400 87,9 78627 0,27785 0,01805 -0,00485 1,5536
1971 746,3 1006 800 85,3 79120 0,27785 0,01856 -0,00488 1 5556
1972 792,5 1045 100 89,6 81702 0,27784 0,01787 -0,00490 1 5640
1973 839,2 1090 200 95,8 84 409 0,27783 0,01739

• Economic report oi the president, transmitted to the congress, Fe •


197
»"* Fixed nonrestdential business, Capital in the U. S., 1925-1970, P-
1; Survey of current business, 1974, n. 3.
**» Economic report of the president, 1976, Wharton series.
222
Т а б л и ц а 8.3
Сравнение обычной и адаптивной множественных регрессий
Фактическое Обычная регрессия Адаптивная регрессия
значение
эндогенной Модельное Модельное
Ошибка
1 переменной значение Ошибка значение
% 7 Уобычк Y—Уобычн Кадапт

I 2 3 4 5 6

1 0,0000 0,0737 —0,0737 0,0124 —0,0124


2 0,0219 0,0921 —0,0702 0,0176 0,0042
3 0,0357 0,0905 —0,0547 0,0326 0,0031'
4 • 0,1195 0,1469 —0,0274 0,1158 0,0038
5 0,2015 0,1886 0,0129 0,1864 0,0150
6^ 0,2398 0,2172 0,0226 0,2697 —0,0300
7 0,2885 0,2669 0,0216 0,2956 —0,0070
8 0,2891 0,2684 0,0207 0,2987 —0,0096
9 0,3672 0,3405 0,0267 0,3811 —0,0138
10 0,3631 0,3714 —0,0083 0,4043 —0,0412
11 0,3830 0,3985 —0,0156 0,3698 0,0132
12 0,3854 0,3892 —0,0038 0,3836 0,0018
13 0,4668 0.4658 0,0010 0,4803 —0,0135
14 0,4893 —0,0107 0,4997 —0,0105
15 0,5305 о;5ооо —0,0023 0,5214 0,0091*
16 0,6492 0,5328 0,0312 0,6367 0,0125
17 0,7169 0,6180 0,0365 0,7342 —0,0173
18 0,8136 0,6804 0,0413 0,8150 —0,0014*
19 0,9364 0,7723 0,0503 0,9479 -0,0115
20 1,0784 0,8862 0,0619 1,0820 —0,0036
21 1,1186 1,0165 0,0432 1,1448 —0,0262
22 1,2273 1,0754 0,0424 1,2261 0,0012
23 1,2621 1,1849 —0,0099 1,3286 —0,0665
24 1,2251 1,2720 —0,0525 1,2205 0,0046
25 1,3285 1,2776 —0,0300 1,3103 0,0182
26 1,4822 1,3584' —0,0332 1,5092 —0,0270
27 1,6363 1,5154 -0,0587 1,6072 —0,0208
1,6950

Средние квадраты отклонений

В обычной регрессии, В адаптивной


оцененной МНК регрессии

0,00163 0,00043

223
Начальные значения параметров для процесса адапта-
ции были получены как оценки МНК обычной регрессии,
построенной на первых Nt точках выборок. Наилучшее Nu
найденное методом перебора, оказалось равным 9, а наи-
лучшее значение параметра адаптации равным 1,642.

Рис. 8.1. Иллюстрация результатов, по-


лученных по адаптивной модели.произ-
водственной функции экономики США
но данным за 1947—1973 гг.

Динамика показателя экономической эффективности


представлена в столбце 9 табл. 8.2. Следует отметить, что
явная тенденция показателя и к снижению свидетельству-
ет о невыполнении обычно принимаемой гипотезы об экспо-
ненциальном росте экономической эффективности. В дей-
ствительности, как это следует из адаптивной модели, про*
224
исходит последовательный переход с более быстрой экспо-
ненты на более медленную. Технический прогресс при этом
носит нейтральный характер U-^—« const).
Для Сравнения уравнение (8.12) было оценено обычным
МНК по тем же данным (см. табл. 8.3).
Сопоставление средних квадратов отклонений приво-
дит к выводу о значительно более гибком отражении функ-
ционирования экономики адаптивной моделью.
На рис. 8.1 на графике по оси ординат отложены индек-
сы валового национального продукта (ВНП) и значения по-
казателя экономической эффективности A (t). Показатель
экономической эффективности отражает роль интенсивных
факторов роста, а роль экстенсивных факторов можно оп-
ределить разделив индекс ВНП на соответствующий по-
казатель экономической эффективности. Этот показатель,
обозначенный как В (t)t также представлен на графике.
Легко заметить совпадение тенденций индекса ВНП и
показателя В (t) и колеблемость эффективности A (t) как
бы в противофазе с В (t) и индексом ВНП. Первое говорит
о прямом влиянии экстенсивных факторов на рост ВНП, а
второе — о падении эффективности в период роста произ-
водства и ее увеличении во время кризисных явлений. Это
объясняется тем, что в период экономических спадов из
процесса производства в первую очередь выбывают уста-
ревшие производственные фонды и работники с низкой ква-
лификацией, а в период подъема начинают функциониро-
вать и отсталые предприятия, которые тянут показатель
экономической эффективности вниз.
В заключение отметим, что результаты, получаемые мето-
дом адаптивного моделирования, могут давать ценную ин-
формацию о последовательном развитии экономических сис-
тем • и полезны как для краткосрочного прогнозирования,
так и для анализа долгосрочных тенденций.
Глава 9

НЕТРАДИЦИОННЫЙ
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
ВРЕМЕННЫХ РЯДОВ

В этой главе дана критика применения класси-


ческой теории корреляции для анализа связи временных (и,
в частности, экономических) рядов, когда не выполняются
гипотезы об их стационарности и эргодичности. Предлага-
ется ряд новых измерителей.

§ 1. УСЛОВИЯ ПРИМЕНИМОСТИ
ТРАДИЦИОННОГО КОРРЕЛЯЦИОННОГО
АНАЛИЗА

Корреляционный анализ часто используется в


экономических исследованиях для изучения статистической
связи между переменными, представленными временными
рядами [3]. Несмотря на то что он не позволяет отделить
прямые причинно-следственные связи от косвенных или даже
просто от случайных совпадений колебаний переменных, этот
анализ ценен тем, что предоставляет возможность придать
количественную определенность степени сопряженности
колебаний этих рядов, подтвердить или поставить под со-
мнение те или иные гипотезы. Корреляционный анализ в
соединении с содержательным исследованием оказывается
полезным и достаточно простым аналитическим средством.
Этим и объясняется его популярность у экономистов.
Корреляционная теория была разработана для случай-
ных стационарных процессов, допускающих получение лю-
бого числа реализаций (наблюдений, измерений). Под ста-
ционарностью понимается неизменность среднего уровня
226
случайного процесса, дисперсии отклонений и постоянство
автокорреляционной функции. Эта теория предназначалась
прежде всего для технических приложений, где гипотеза о
стационарности считается приемлемой, а принципиальных
ограничений на число реализаций нет.
На самом деле выдвигаются (или молчаливо используют-
ся) даже еще более жесткие требования к случайному про-
цессу, заключающиеся в том, что предполагается его эрго-
дичность. Эргодическими случайными процессами называется
подкласс стационарных случайных процессов, для которых
усреднение по множеству реализаций эквивалентно усред-
нению по времени. Тогда корреляционный анализ особенно
упрощается, и это одна из причин его распространенности.'
Именно эта теория, разработанная для стационарных и
эргодических случайных процессов, некритически воспри-
нята экономистами и используется ими для анализа про-
цессов заведомо нестационарных (например, имеющих тренд)
и даже неслучайных (случайный процесс должен описывать-
ся тем или иным законом распределения вероятностей), ко-
торые обычно представлены единственной реализацией.
Большое число реализаций в экономике при одних и тех же
условиях часто принципиально невозможно.
В экономических исследованиях требуется особая теория
корреляционного анализа, специально предназначенная для
изучения сопряженности (или связности) колебаний неста-
ционарных процессов, представленных единственной реали-
зацией. Такая теория, предложенная нами в [122] и [125], и
будет изложена в этой главе. Вводятся новые виды корреля-
ционных коэффициентов, позволяющие измерять изменение
силы связи двух переменных во времени, а также в зависи-
мости от амплитуды их отклонения от некоторой критичес-
кой величины. Рассматривается корреляционная связь с ве-
роятностной точки зрения.

§ 2. ПОСТАНОВКА ПРОБЛЕМЫ

Постулирование стационарности и эргодичности


процессов хи и x2t- вынужденная мера, к которой экономис-
ты прибегают, чтобы обеспечить себе хоть какую-то возмож-
ность провести корреляционный анализ связи двух перемен-
227
ных. Арифметические средние величины т , и т 2 трактуются
как неизменные средние уровни процессов хи и х21 соответ-
ственно, а с , и о 2 — как постоянные среднеквадр этические
отклонения от среднего. И это, с нашей точки зрения, вооб-
ще говоря, неправомерно.
На самом деле переменные хи и х21, как правило, не име-
ют фиксированных средних уровней и каких-либо опреде-
ленных среднеквадратических отклонений от них. Величи-
ны т , и т 2 являются некоторыми условными уровнями,
относительно которых вычисляются отклонения исследуемых
рядов. В этой ситуации обычный показатель корреляции г
выражает скорее силу связи между такими отклонениями
рядов хи и х21 от т , и т2, чем между собственно рядами хи и
х2Г Неопределенный характер т , и т2 объясняется тем, что
они не отражают каких-либо действительных, устойчивых
характеристик временных рядов. Дело в том, что как толь-
ко мы сдвинем границы выборочного периода, т.е. расши-
рим, сузим или как-то изменим его диапазон, все оценки mi
и т2, 6, и Ьг станут другими, особенно (как это обычно и
бывает в реальных данных) если исследуемые ряды имеют
временные тренды. Это приводит к тому, что одному и тому
же моменту времени при одних и тех же статистических
наблюдениях будут соответствовать отклонения ряда, раз-
личающиеся не только по величине, но, возможно, даже и
по знаку в зависимости от таких внешних по отношению к
данной точке обстоятельств, как расположение границ вы-
борочного периода на оси времени. Тем более что, как изве-
стно, вопрос о границах выборочного периода (тесно свя-
занный с т) решается исследователем субъективно. Таким
образом, единое движение ряда от момента t—l к моменту /
может оказаться искусственно и произвольно разделенным
величиной т на положительную и отрицательную части. В
результате слагаемое в числителе формулы для коэффици-
ента корреляции, соответствующее моменту /, также будет
переменным, зависящим от т , и пг2. А ведь слагаемое -
фактически локальное, частное свидетельство о характере
корреляционной связи рядов, поступившее в момент /. Зыб-
кость, изменчивость этого свидетельства, его зависимость от
внешних обстоятельств представляется серьезным недостат-
ком изложенной методики, проистекающим из ложной по-
сылки, что классическую теорию корреляционного анализа
можно формально применять для изучения нестационар-

228
ных экономических временных рядов. С нашей точки зрения,
переход от наблюдаемых рядов хи и х21 к рядам (хи — т , ) и
(х21 — т 2 ) в общем случае «портит» первичную информацию.
Выход из этого затруднительного положения обычно на-
ходят в том, чтобы исходный нестационарный ряд преобра-
зовать к приблизительно стационарному виду. С этой целью
предпринимается попытка предварительно исключить из
рядов временные тренды. Но, во-первых, эта операция так-
же зависит от границ выборочного периода и таких субъек-
тивных факторов, как выбор типа тренда, метода его оцени-
вания, и, во-вторых, в результате элиминирования тренда из
временного ряда удаляется весьма существенная информа-
ция, Остатки, после исключения тренда, как правило, оказы-
ваются слабо коррелированными, а исходные ряды могут
обнаруживать корреляцию, близкую к идеальной из-за по-
чти одинакового характера тренда. Получив такие результа-
ты, практик остается в растерянности. Можно констатиро-
вать, что в случае предварительного исключения тренда
искажение первичной информации лишь усугубляется.

§ 3. МОДИФИЦИРОВАННЫЙ КОЭФФИЦИЕНТ
КОРРЕЛЯЦИИ

Возможен, однако, другой выход: судить о нали-


чии положительной или отрицательной корреляции в момент
t по совпадению или несовпадению знаков прироста интере-
сующих переменных. Для получения общего представления
об усредненных корреляционных свойствах двух нестацио-
нарных рядов целесообразно разработать специальный ста-
тистический показатель корреляции, основывающийся на
использовании приростов переменных. Для этого модифици-
руем коэффициент корреляции следующим образом (для
упрощения будем считать лаг т « 0):

(9.1)

229
Знаменатель формулы (9.1) играет роль нормирующего
коэффициента. Благодаря ему r mod не может выйти за пре-
делы —1 < гтдй< 1. При таком измерителе степени коррелиро-
ванности двух рядов отмеченный выше недостаток устраня-
ется и никакой деформации исходных данных не происходит.
Каждое слагаемое в числителе и знаменателе неизменно, не
зависит от каких-либо субъективных процедур или желаний
исследователя.
Отметим, что усреднение по времени вместо усреднения
по реализациям здесь остается, поскольку мы считаем, что
имеется лишь одна реализация для каждого момента и дру-
гого пути нет. По существу, такое усреднение основывается
на гипотезе о постоянстве корреляционной связи двух рядов
на всем выборочном периоде. Это предположение, очевидно,
также слишком сильное для экономических нестационарных
процессов. Мы к нему вернемся несколько позже. А сейчас
продолжим анализ формулы (9.1).
Вычисление этого коэффициента возможно для неслучай-
ных функций, так как его определение не связано с какими-
либо гипотезами вероятностного характера. В частности, лег-
ко заметить особенность предложенного коэффициента
корреляции, заключающуюся в том, что модифицированный
коэффициент корреляции любых двух монотонно возраста-
ющих или монотонно убывающих функций всегда будет ра-
вен единице. В этом случае целесообразно перейти к анали-
зу разностей второго (или даже более высокого) порядка.
Получаемый коэффициент можно назвать модифицирован-
ным коэффициентом корреляции второго (или более высо-
кого) порядка.

§ 4. АДАПТИВНЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ

Напомним, что речь идет прежде всего о неста-


ционарных временных рядах: корреляционная связь между
ними может становиться то слабее, то сильнее, и если найти
способ выявить динамику этой связи, то можно получить
дополнительную интересную информацию о взаимосвязях
переменных, полезную в содержательном анализе исследу-
емых явлений. В таком случае гипотезу о постоянстве кор-
реляционной связи, использовавшейся в (9.1), придется при-
230
знать несостоятельной. Арифметическое усреднение по вре-
мени дает лишь весьма грубый результат, ничего не говоря-
щий о движении коэффициента корреляции во времени.
Поэтому в [122] и [125] предложен еще один, рекуррентный
(или адаптивный), коэффициент корреляции

(9.2)

Как видим, st и dt являются экспоненциально-взвешен-


ными скользящими средними произведений приростов и аб-
солютных произведений приростов двух рядов. Параметр а —
постоянная сглаживания или параметр адаптации (гл. 1 §2).
Ясно, что и здесь - 1 £ rt(a) й 1. График rt(a) относительно
времени показывает, как изменяется сила корреляционной
связи на выборочном' периоде. Открытым остается лишь воп-
рос о начальных значениях s0 и d0, необходимых для начала
рекуррентной процедуры, и величине постоянной сглажи-
вания а.
Начальные значения s0 и d0 предлагаем определять как
простые арифметические средние произведений и абсолют-
ных значений произведений приростов, вычисляемые на осно-
ве Го наиболее ранних наблюдений выборки, 0 < TQ <, Т-1.
Тогда г0 * s 0 /rf0 будет начальным коэффициентом корреля-
ции, совпадающим с модифицированным коэффициентом кор-
реляции, рассчитанным по (9.1) при Т =* Т~ Величина а может
выбираться из указанного диапазона [0, 1], исходя из конкрет-
ного применения вычисляемого коэффициента корреляции.
Если вычисление такого коэффициента ставится как са-
мостоятельная задача, то можно предложить следующий
способ определения наилучшего а, Будем рассматривать
г
,_|(«)как прогноз совпадения колеблемости рядов л:,, и хй1 в
момент t, a

(9.3)

231
как ошибку этого прогноза на тот же момент. Тогда можно
ввести функцию потерь Q^cc)

(9.4)

где v=l или 2, и определять оптимальное значение а путем


минимизации функции Qv(oc) по а. Минимум легко найти
методом проб различных а из интервала [0, 1]. При необхо-
димости точно так же методом проб устанавливается и наи-
лучшее значение То. В этом случае функция потерь рас-
сматривается как функция двух переменных QV(TO, a).
Возможен и другой вариант адаптивного коэффициента
корреляции

(9.5)

здесь в качестве г0 можно взять отношение го~ с0/ q0,

где

Такой коэффициент назовем адаптивным коэффициен-


том знаковой корреляции приростов. Далее, если действо-
вать так же, как и в предыдущем случае, нетрудно вычис-
лить ошибки et и построить критерий QV(TO, а), используя
(9.4) и (9.5). Оптимальные значения То и а будуг соответ-
ствовать минимуму Q.

§ 5. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ОТКЛОНЕНИЙ


ОТ ЗАДАННЫХ УРОВНЕЙ

В классическом корреляционном анализе отсчет


отклонений переменной ведется от математического ожида-
ния. Однако на практике такое отклонение представляет
интерес лишь в частных случаях. В экономических исследо-
232
ваниях, например, гораздо чаще важен знак отклонения от
предыдущего значения ряда (т.е. знак приращения) или от
нулевого уровня. Тогда и отклонения целесообразно рас-
сматривать от соответствующих величин.
Вообще говоря, в зависимости от задачи анализу могут
подвергаться отклонения от моды, медианы, от какого-либо
заданного уровня. Назовем такой уровень критическим,
подразумевая под этим, что отклонения от него в разные
стороны имеют существенные качественные различия. Обо-
значим такой уровень для ряда xt через Ех. Пусть в этом
случае требуется установить, существует ли взаимосвязь
между отклонениями одной переменной, например (я, — Ех),
с отклонениями другой (zt — Ег), и если существует, то на-
сколько она сильна.
Возьмем в качестве измерителя корреляционной связи в
этом случае коэффициент

(9.6)

и рассмотрим его свойства. Совершенно ясно, что он нахо-


дится в обычных пределах -1 й гЕ<, 1. Его оценкой может
служить корреляционный коэффициент:

(9.7)

Если Ех = 0 и Ег «= 0, то коэффициент г я характеризует


силу взаимосвязи между отклонениями соответствующих пе-
ременных от нуля. При Ех - xt_{ и Ег« гы получаем рассмот-
ренный выше модифицированный коэффициент корреляции,
который также можно назвать коэффициентом корреляции
приростов. Отметим, однако, что при Ех = М(х) и Ег *= M(z),
где М — символ математического ожидания, коэффициент гЕ
не идентичен классическому коэффициенту корреляции из-за
различных нормирующих множителей (знаменателей).
Никаких ограничений для использования корреляцион-
ного коэффициента (9.7) нет. Он применим для переменных,
имеющих смещенное (когда Ех * М(х)) и несимметричное
233
распределение относительно критического уровня Ех. Одна-
ко стационарность и эргодичность переменных предполага-
ются. Если же эти предположения слишком сильные, мож-
но построить адаптивный коэффициент корреляции по
аналогии с (9.2), где приращения следует заменить на от-
клонения от критических значений.

§ 6. УСЛОВНЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ

Рассмотренные коэффициенты корреляции отра-


жают силу взаимосвязи колебаний двух рядов в целом. Та-
кая характеристика может оказаться слишком общей и не
всегда удовлетворит исследователя. Поставим вопрос конк-
ретнее: насколько сильна связь, например, положительных
отклонений х( с отклонениями zt? Для ее измерения введем
понятие условного коэффициента корреляции. Определим
его как

(9.8)

где суммируются только те произведения, в которых xt £ Ех.


Точно так же можно вычислить коэффициент взаимосвязи
отрицательных отклонений ряда xt с отклонением zt. Есте-
ственно, что в обоих случаях коэффициенты корреляции
могут принимать неодинаковые значения. Таким образом,
особенности взаимосвязи двух рядов теперь не скрываются
за одним-единственным значением коэффициента корреля-
ции, как это предполагается в классической теории, а пред-
ставляются более дробно двумя коэффициентами.
Преимущества такого подхода наиболее ярко проявля-
ются тогда, когда одна переменная (например, xt) является
контролируемой, а другая (zt) - непосредственно недоступ-
ной, но коррелированной с первой. Тогда можно «нащупать»
такое критическое значение Ех, при котором удерживание
х, в области Ех й х( (или х, £ £,) имело бы наиболее благо-
приятные последствия (т.е. наибольшее значение коэффи-
циента корреляции) для удержания zt в пределах zt £ Ег
(или, наоборот, zt £ Ег).
234
В общем виде условия при вычислении коэффициента
корреляции могут, конечно, иметь произвольный вид

(9.9)

лишь бы хватило статистических данных для получения ус-


тойчивых оценок коэффициентов.
Доводом в пользу применения условного коэффициента
корреляции (9.9) могут служить следующие рассуждения.
При низких значениях амплитуды отклонений корреляци-
онная связь может не просматриваться из-за влияния слу-
чайных помех, т.е. быть несущественной. А при больших
отклонениях определенность этой связи возрастает почти
до детерминированности. Тогда при большой амплитуде
отклонений одной переменной резко возрастает степень пре-
допределенности области нахождения (например, знак при-
роста) второй переменной. Легче определить и лаг (запаз-
дывание во времени) одной переменной относительно другой.
Можно считать, что в этом случае возрастает мощность
критерия.
Задавая значения А и В, можно выделить любую инте-
ресующую нас область амплитуд отклонений первой пере-
менной {xt - Ех) и вычислить коэффициент корреляции с
переменной zt для этой области. Такой подход открывает
путь к доскональному изучению взаимосвязи рядов, выяв-
лению специфических локальных корреляционных свойств.
Можно сказать, что корреляционные свойства предстают в
«расщепленном» виде - их выражает множество коэффи-
циентов.

§ 7. ВЕРОЯТНОСТНЫЙ КОЭФФИЦИЕНТ
КОРРЕЛЯЦИИ

Рассмотрим еще один метод исследования силы


сопряженности двух переменных на основе оценки услов-
ной вероятности их связи [125]. Определим коэффициент кор-
реляции как
235
(9.10)

где/? — вероятность того, что С £ г(— Ег<, D при условии


А £ х,~ Ех<: В. Отсюда следует, что областью суще-
ствования коэффициента корреляции будет отрезок
(О, 1]. Она отличается от области существования рас-
смотренных выше коэффициентов корреляции, которая
охватывает отрезок [—1, 1].

Определение (9.10) теоретическое. Практическую оцен-


ку на основе статистических данных можно получить как
отношение

(9.11)

где я 2 | г - число наблюдений, когда zt - Ег оказывалось в пре-


делах С £ 2, - EZ£D при А <, xt- ЕХ<,В; Nx - общее
число наблюдений в выборке, удовлетворяющих ус-
ловию Айх(— ЕхйВ.

Обратное направление связи характеризуется вели-


чиной

(9.12)

Здесь обозначения аналогичны использованным в (9,11).


Отсюда очевидно, что в общем случае

(9.13)

Этот вид корреляционного коэффициента позволяет ис-


следовать взаимосвязь переменных с вероятностной точки
зрения и найти диапазоны отклонений переменных, взаимо-
связь между которыми наблюдается с наибольшей вероят-
ностью.
236
§ 8. ПРИМЕР

На рис. 9.1 показано, как меняется адаптивный


коэффициент корреляции процентных ставок по долгосроч-
ным (первый ряд) и краткосрочным (второй ряд) операциям,
рассчитанный на основе годовых данных США с 1857 по
1985 г., v = 1. Эта связь достаточно высокая, гДа) — повсюду
выше 0,5. Можно, однако, отметить, что в XX в., особенно
после первой мировой войны, взаимосвязь этих двух величин
стала теснее, чем во второй половине XIX столетия. Можно
также видеть временное снижение корреляции двух показа-
телей во время первой мировой войны и в период мирового
энергетического кризиса после 1974 г. Найдены оптималь-
ные значения параметров: То= 18, аор1 - 0,0729 при V = 1.
Для сравнения интересно отметить, что обычный коэффи-
циент корреляции равен 0,859, а модифицированный — 0,836.
Условный коэффициент корреляции рассчитывался для пер-
вых разностей двух рядов. При этом критическим уровнем
был выбран нулевой. Получены следующие результаты. Ус-
ловный коэффициент корреляции положительных приростов
процентных ставок по долгосрочным операциям с приростами
ставок по краткосрочным операциям составил 0,85, а отрица-
тельных приростов первого ряда с приростами второго — 0,82.

Рис. 9.1, Адаптивный коэффициент корреляции процентных ставок


по краткосрочным и долгосрочным кредитам
237
Это свидетельствует о приблизительно одинаковой силе связи
падений и подъемов первого ряда с колебаниями второго.
Вероятностный коэффициент корреляции положительных
приростов первого ряда с положительными приростами вто-
рого равен 0,79, а отрицательных с отрицательными — только
0,64. Как видим, вероятность совпадения подъемов несколько
выше вероятности совместного снижения рассматриваемых
процентных ставок.
Вычисление условных коэффициентов автокорреляции со-
седних приростов ( т = 1) дало следующие результаты. У пер-
вого ряда корреляционная связь положительного текущего
прироста с будущим приростом характеризуется коэффици-
ентом 0,52, а текущего отрицательного прироста с будущим
приростом — 0,41. Таким образом, положительные приросты
первого ряда позволяют строить более точные прогнозы на
будущее, чем отрицательные. Аналогичные коэффициенты для
второго ряда соответственно равны —0,21 и 0,08, т.е. связь
последовательных приростов у процентных ставок по кратко-
срочным операциям совершенно незначительна.
Вероятностные коэффициенты автокорреляции прирос-
тов позволяют сделать такие выводы. Положительные теку-
щие приросты первого ряда влекут за собой положитель-
ные приросты этого же ряда с вероятностью 52,6% (г =0,526),
а отрицательные с вероятностью 60,6% (г р = 0,606) сопро-
вождаются также отрицательными приростами. Это может
быть использовано для прогнозирования знака прироста.
Для второго ряда аналогичные коэффициенты равны 0,549
и 0,429. Здесь возможности для прогнозирования знака при-
роста меньше, поскольку появление в ближайшем будущем
того или иного знака почти равновероятно.

Сделаем некоторые выводы. Введенные определения кор-


реляционных коэффициентов обладают рядом достоинств по
сравнению с классическим, но, разумеется, не претендуют
на то, чтобы полностью заменить собой последнее. Напро-
тив, в каждой конкретной задаче нужно использовать тот
тип корреляционного коэффициента, который наиболее адек-
ватен поставленной цели.
В предложенном модифицированном коэффициенте кор-
реляции учитываются приращения переменных вместе с их
238
знаком. Это равносильно тому, что вместо отклонений от ма-
тематического ожидания здесь рассматриваются отклонения
от ранее достигнутых значений. Идея отказа от математичес-
кого ожидания как от уровня отсчета отклонений и замены
его на некоторый критический (в сущности, произвольный, за-
данный исследователем) уровень нашла себе применение и в
других рассмотренных нами определениях. Адаптивный коэф-
фициент корреляции позволяет прослеживать динамику кор-
реляционной связи во времени. Для исследования корреля-
ции знаков приращений переменных построен адаптивный
коэффициент знаковой корреляции. Практическое использо-
вание этого подхода для краткосрочного прогнозирования ва-
лютных курсов освещено в [126]. Этот метод может, конечно,
применяться и на рынке ценных бумаг.
Условный коэффициент корреляции, как и вероятност-
ный^ можно назвать парциальными коэффициентами кор-
реляции, так как они способны отражать частичные свой-
ства двух исследуемых временных рядов, наблюдаемые при
определенных условиях. Два последних подхода позволяют
проводить дифференцированный анализ взаимосвязи пере-
менных, выявлять, переходя от одного диапазона амплитуд
отклонений к другому, неоднородность связи в разных под-
диапазонах и давать более богатую информацию исследо-
вателю для размышления и использования в аналитичес-
кой и прогнозной деятельности. При необходимости могут
быть построены адаптивные варианты этих коэффициентов.
Одной из перспективных областей применения подобных
подходов является построение переключающихся моделей, т.е.
моделей с переключением в критические моменты времени с
одного режима работы на другой. Каждый режим можно пред-
ставить в модели специальным регрессионным уравнением, а
для определения критических моментов переключения режи-
мов целесообразно проводить предварительный корреляцион-
ный анализ. В качестве критических моментов выступают
моменты, когда переменная пересекает (в наших обозначена
ях) уровень Ех, А или В.
Рассмотренные подходы, объединенные общим названи-
ем - нетрадиционный корреляционный анализ, дают воз-
можность получать значительно более подробную инфор-
мацию о взаимосвязях переменных, чем это предлагает
классическая теория, и открывают новые перспективы в по-
знании сложных динамических систем.
Глава 10
ФАЗОВЫЙ АНАЛИЗ
ВРЕМЕННЫХ РЯДОВ

Рассматривается подход к анализу нерегуляр-


ных циклических колебаний временных рядов, теоретичес-
кие и методологические основы для изучения этих колеба-
ний по фазам циклов, предложенные в [129]. Описан анализ
циклических колебаний на примере инвестиционных про-
цессов в США и странах Западной Европы,

§ 1. ПОСТАНОВКА ПРОБЛЕМЫ

В экономических исследованиях часто встречаются


показатели, движение которых во времени представляет со-
бой нерегулярные циклические колебания с переменной ам-
плитудой и неустойчивым периодом. Внешне стохастический
характер этих явлений отражает циклическое развитие эко-
номики в условиях влияния на нее многих случайных, рыноч-
ных и волевых, управляющих воздействий.
Исследование фаз движения упомянутых показателей
традиционными методами, такими, как спектральный и рег-
рессионный анализ, по ряду причин не подходит. Так, спек-
тральный метод аппроксимирует движение временного ряда,
отражающего движение того или иного показателя, суммой
регулярных синусоид. Между тем строгой периодичности и
постоянства амплитуды от экономических показателей труд-
но ожидать, поэтому для хорошей аппроксимации требует-
ся большое число синусоид различной частоты. Возникают
Трудности и с интерпретацией результатов [120]. Регресси-
онный метод аппроксимирует всю выборку в целом, и ло-
кальные свойства ряда при этом играют второстепенную
240
роль. Между тем в экономике каждый цикл обычно имеет
свои особенности и важно не потерять их во время статис-
тической обработки. Очень часто наблюдается асимметрия
колебаний относительно уровня отсчета. Например, у поло-
жительных полуволн может быть одна амплитуда и дли-
тельность, а у отрицательных — другая.
Для исследования локальных колебаний временного ряда
существенным является определение фазы.

§ 2. РАЗБИЕНИЕ ВРЕМЕННОГО РЯДА НА ФАЗЫ

При исследовании циклических колебаний эконо-


мисты используют нечеткое понятие цикла. Представление о
цикле изменяется в зависимости от того, какие свойства ряда —
краткосрочные или долгосрочные — интересуют аналитика.
Положительная или отрицательная фаза цикла определяет-
ся знаком остатка, полученного вычитанием непосредствен-
но из исходного ряда того или иного временного тренда. Но
временной тренд, как известно, устанавливается весьма
субъективно. Иногда исследователь и вовсе экспертно делит
весь ряд на фазы, а затем анализирует полученное [147, 152].
Поэтому в [129] предпринята попытка разработать более
объективные способы вычленения фаз во временном ряде и
специальные статистические методы их изучения.
Для изложения предложенного подхода сначала введем
некоторые определения.
Пусть xt — исходный временной ряд, наблюдаемый в
моменты t = 1, 2,..., N.
Флуктуация — величина отклонения xt от некоторого ус-
тановленного исследователем уровня. Это может быть от-
клонение от среднего уровня тх =—£*,, предшествующего
W t
значения xt_v нуля, тренда или какой-либо другой величи*
ны. Важно отметить, что уровень отсчета флуктуации в об-
щем случае может меняться: его динамику обычно отража-
ет тренд. Понятие тренда достаточно неопределенно. Его
вид и параметры зависят от объема выборки, опыта и же-
ланий исследователя, от метода оценивания. Все это позво-
ляет сделать вывод, что элиминирование (исключение) трен-
16 -шб 241
д<1, вообще говоря, существенно "Трансформирует исходный
ряд. Переход от первичных наблюдений к исчисленным от-
клонениям от искусственно построенной линии тренда мо-
жет .повлечь за собой ухудшение качества исходной для
анализа информации. Поэтому с операциями исключения
тренда нужно быть очень осторожным. Предпочтительным
способом исключения тренда, с нашей точки зрения, явля-
ется переход к логарифмам, разностям, цепным индексам,
относительным величинам (когда тренд элиминируется де-
лением одной величины на другую). Но во всех случаях ис-
следователь должен определить, какие именно отклонения
он рассматривает в качестве флуктуации ряда. Обозначим
величину флуктуации в момент t через Dxt
Мощность флуктуации — абсолютная величина флук-
туации \Dxtl Нерегулярные циклические колебания — нали-
чие у ряда xt разнонаправленных отклонений Dxt с различ-
ной амплитудой без их детерминированной повторяемости.
Принципиально важно для фазового анализа, чтобы в вы-
борке присутствовали отклонения обоего знака. В против-
ном случае выборка представляет собой одну фазу, и тогда
задачи разбиения на фазы не существует.
Фаза — период положительных или отрицательных флук-
туации ряда Dxt Положительная и отрицательная фазы -
периоды соответственно положительных и отрицательных
флуктуации ряда. Длительность фазы — временной отре-
зок положительных или отрицательных флуктуации ряда.
Точка смены фаз — момент смены знака флуктуации. Мощ-
ность флуктуации ряда, или просто мощность ряда, - сум-
ма абсолютных флуктуации всего ряда, т.е.

(ЮЛ)

Мощность фазы — сумма абсолютных флуктуации ряда


внутри фазы, т,е. мощность фазы /

(10.2)

где/, - момент начала фазы i;


tM— момент окончания фазы / (поворотные точки).
242
Из (10.1) и (10.2) следует, что мощность ряда равна сум-
ме мощностей составляющих его фаз, т.е.

(10.3)

Уровень агрегирования фаз - номер итерации в процес-


се последовательного объединения фаз путем фильтрации
маломощных флуктуации. Уровень теряемой мощности —
процент мощности ряда, теряемой при элиминировнии ма-
ломощных флуктуации. Фазовая диаграмма — представле-
ние временного ряда в виде сменяющих друг друга фаз.
Основная идея метода заключается в том, чтобы посте-
пенно (итеративно) очищать ряд от маломощных колеба-
ний, отождествляемых со случайными или второстепенны-
ми, конъюнктурными флуктуациями. В ходе такого процесса
фильтрации производится сглаживание наименее мощных
фаз, в результате чего соседние фазы объединяются в одну
более крупную. Поясним это следующим образом.
Начнем с исходного ряда хг Для определенности будем
считать его флуктуацией величину Dx( = xt — хы — прирост
ряда. Найдем моменты t, в которых выполняется одно из
двух условий:

(10.4а)

либо
(10.46)

Первое условие означает, что в точке t — локальный мак-


симум, и ее можно рассматривать в качестве поворотной,
так как за ней следует снижение ряда. Второе условие сви-
детельстэует о том, что в точке / - локальный минимум, и
ее тоже можно рассматривать как поворотную, так как в
ней заканчивается снижение, а после нее начинается возра-
стание ряда. Найденные поворотные точки обозначим /,, ...,
'„_,. Отметим, что между соседними поворотными точками
флуктуации ряда Dxt имеют одинаковый знак и, следова-
тельно, образуют одну фазу. Таким образом, в данном слу-
2 4 3
16*
чае поворотные точки ряда xt разделяют исходный ряд на
т фаз. Каждая фаза характеризуется своей мощностью в
соответствии с данным выше определением.
Теперь вспомним, что экономист, как правило, имеет дело
с временным рядом, содержащим случайные флуктуации.
В исходном ряде каждая такая флуктуация или несколько
соседних могут образовать фазу, не имеющую, однако, ка-
кого-либо существенного содержания. Требуется очистить
ряд от случайных флуктуации и соответствующих им фаз и
получить интерпретируемые движения ряда.
Примем, что фазы, образованные случайными флуктуа-
циями, маломощны. При независимости случайных флукту-
ации это предположение вполне приемлемо. Исключить
маломощные фазы предлагается с помощью следующей
итеративной процедуры.
Э т а п 1. Задаемся критерием остановки итерационно-
го процесса. В качестве такового могут выступать:
а) уровень теряемой мощности v — процент совокупной
мощности ряда, которым мы решаемся пожертвовать в про-
цессе агрегирования фаз путем подавления случайных флук-
туации;
б) наперед заданное число фаз, на которое желательно
разбить весь выборочный период. Процесс объединения (аг-
регирования) фаз останавливается при достижении этого
числа;
в) средняя длительность фаз. Если, например, ставится
задача изучения приблизительно 4-летних циклов, то про-
цесс целесообразно остановить, когда средняя длительность
фаз будет близка 2;
г) экспертное решение, принимаемое на основе анализа
графиков и числовых таблиц.
Нетрудно заметить, что критерии б и в тесно связаны
между собой, так как средняя длительность фаз равна объе-
му выборки N, деленному на число образованных фаз.
Обычно трудно априори выбрать критерий остановки и
задать такое его значение, которое приведет к наилучшему
исключению относительно коротких, маломощных фаз, к удов-
летворительному выделению динамики процесса, подлежа-
щей исследованию. В связи с этим целесообразно выпол-
нять указанную итерационную процедуру до образования
всего лишь нескольких фаз (заведомо пройдя необходимый
244
уровень деления на фазы). После этого для каждой итера-
ции слияния фаз следует вычислить значение критериев а,
б, в и сравнить их изменения при переходе от одной итера-
ции к другой. Полезно процесс образования фаз контроли-
ровать на графиках.
В конечном счете решение о необходимом уровне агре-
гирования фаз остается за исследователем, а рассмотрен-
ные критерии представляют собой вид информации, помо-
гающей квалифицированно принять это решение.
Важно отметить, что роль числовых критериев останов-
ки возрастает при сопоставлении нерегулярных колебаний
в двух или нескольких временных рядах, так как тогда тре-
буется идентичный критерий для всех сравниваемых рядов.
Выбор типа критерия, очевидно, зависит и от конкретно
поставленной цели исследования, и от стохастических свойств
отобранных временных рядов. Одни ряды могут содержать
более мощные «шумовые» колебания, у других — их удель-
ный вес невелик.
Э т а п 2. Находим наименее мощную фазу, например /.
Возможны два варианта ее расположения в выборке: а - в
начале или в конце; б - внутри. Рассмотрим второй вариант.
Принимаем решение об устранении соответствующих ей
флуктуации. Для этого заменяем фазы / - 1 , /, /+1 одной,
мощность которой равна рм - р} + p/+v В ходе этой опера-
ции число фаз уменьшается на 2, а совокупная мощность
временного ряда сокращается на 2рг Последнее легко уви-
деть, так как в сумму (10.3) вместо рн + р. + р / + 1 теперь
будет входить р, , — р + р. +1 . Коэффициент 2 можно объяс-
нить также тем, что при элиминировании колебания устра-
няется его движение как в положительном, так и в отрица-
тельном направлении. Таким образом, 2р, — мощность,
теряемая в процессе агрегирования фаз в случае б. Слу-
чай а отличается от б лишь тем, что число фаз в результате
элиминирования наименее мощной краевой фазы уменьша-
ется на одну, а не на две, так как объединению подлежат не
три, а две соседние фазы (/ и /+1, если у — первая фаза;
/-1 и /, если / — последняя фаза).
Э т а п 3. Этап 2 будем повторять до тех пор, пока не
Достигнем заданного критерия остановки (см. этап 1). Тогда
процесс агрегирования прекращается и полученные фазы
подлежат содержательному или статистическому анализу.
245
Э т а п 4. В результате применения изложенной про-
цедуры весь интервал выборки ряда будет разбит точками
смены фаз на. отрезки, внутри которых можно представить
движение ряда упрощенно линейным образом. Для этого
достаточно разделить мощность фазы на ее длительность -
получим среднюю мощность флуктуации внутри данной
фазы, а ее знак определит знак флуктуации. Интерес мо-
жет представлять наложение графика агрегированных фаз
(фазовой диаграммы) на график исходного ряда.
Возможна аппроксимация каждой фазы синусоидаль-
ной полуволной равной мощности и соответствующего зна-
ка. Нетрудно установить, что мощность р. синусоидальной
полуволны связана с ее амплитудой А. и периодом колеба-
ний Т} следующим соотношением (для простоты будем вес-
ти отсчет времени внутри фазы / от нуля до «;.)

(10.5)

где« — длительность фазы /;


Т. - период колебаний синусоиды;
Т
, - 2п,'
w. — круговая частота;
wf = 2n/Tf,

Поскольку речь идет об аппроксимации дискретного вре-


менного ряда, синусоидальную полуволну необходимо заме-
нить на п, равноотстоящих дискретных значений (флуктуа-
ции), суммарная мощность которых равна мощности фазы.
В соответствии с этим представим (10.5) в виде суммы

(10.6)

246
Интегралы вычисляются по формуле

(10.7)

и каждый из них характеризует величину и знак колебания


в момент Ь.
Таким образом, на графике каждая фаза будет пред-
ставлена синусоидальной полуволной со своей амплитудой
и периодом колебаний. Исключение составляют лишь пер-
вая и последняя фазы. Их аппроксимировать синусоидой
неправомерно, так как неизвестно, когда началась первая
и когда закончится последняя фаза. Поэтому их целесооб-
разно оставить такими, какие они есть, вычислив лишь уро-
вень их средней мощности.
Отметим, что для аппроксимации фазы гармоникой дли-
тельность этой фазы, естественно, должна быть хотя бы не
меньше трех, в противном случае гармоника вырождается.

§ 3. ФАЗОВЫЙ АНАЛИЗ ИНВЕСТИЦИОННЫХ


ЦИКЛОВ В США И ЗАПАДНОЙ ЕВРОПЕ

Рассмотрим ряд валовых капитальных вложений


в экономику США в постоянных ценах (в долларах 1985 г.)
с 1960 по 1988 г. (см. Приложение № 4, табл. V). Обозначим
этот ряд kr Предварительный анализ обнаруживает экспо-
ненциальный тренд, поэтому прежде чем приступать к фа-
зовому анализу, выполним несколько несложных преобра-
зований исходного ряда, чтобы элиминировать тренд и
выделить скрытый в нем колебательный процесс в явном
виде. Для этого перейдем от ряда kt к его логарифмам In kt.
Логарифм kt имеет четко выраженную тенденцию линейно-
го роста. Перейдем к первым разностям логарифмов

(10.8)

247
Смысл xt нетрудно установить. Из (10.8) следует, что

(10.9)

Таким образом, xt — это доля, на которую возрастают


валовые капитальные вложения в году t, т.е. xt — темп при-
роста. На графике (здесь не приводится) видно, что xt имеет
нерегулярные циклические колебания. Динамику х, можно
исследовать, изучая либо отклонения х( от среднего
тх =—]Г;с ( , либо первые разности xt — xt_x. Среднее тх здесь
выступает в роли некоторого стандарта, от которого изме-
ряются отклонения вверх и вниз, и представляет собой сред-
ний темп прироста. А величина xt — xt_x характеризует уве-
личение темпов прироста, если она положительна, или их
снижение — в противном случае. Правомерны постановка и
решение задачи в обоих вариантах. Остановимся на первом.
Итак, считаем флуктуацией

(10.10)

Далее последовательно проводим фазовый анализ по


изложенной схеме. За критерий остановки возьмем число
фаз, равное 7, но попутно будем вести расчет и других кри-
териев остановки (табл. 10.1). На итерации V процесс за-
канчивается. На рис. 10.1 показаны ряд х1 — тх и его фазо-
вая диаграмма, полученная путем усреднения мощности
флуктуации внутри каждой найденной фазы.
Результаты аналогичных исследований, выполненных для
Западной Европы, представлены в табл. 10.2 и на рис. 10.2.
Обобщающие характеристики обоих примеров - в табл. 10.3.
Для сравнения колебательных процессов в валовых ка-
питальных вложениях США и Западной Европы фазовые
диаграммы (рис. 10.1 и 10.2) наложены одна на другу10
(рис. 10.3). Нетрудно заметить, что динамика валовых инве-
стиций в Западной Европе повторяет динамику валовых ка-
питальных вложений в США с некоторым опозданием, при-
чем1 величина лага переменная и постепенно сокращается с
четырех лет в начале выборочного периода до года в его
конце. Явно повторяется даже величина средней мощности
фаз (амплитуда фазовой диаграммы).
248
Таблица 10.1.
Агрегирование фаз — фильтрация маломощных флуктуации на данных США
Флуктуации Знаки и мощности фаз
Номер на итерации
фазы перво-
Год,/ •V* я
начальных I II III IV V

1961 -0,0145 1 -0,0145(1) -0,0145(1) -0.0145(1) 0,0780(6) 0,0780(6) 0,0780(6)


1962 0,0300 2 0,0925(5) 0,0925(5) 0,0925(5) -0,0685(4) -0,0685(4) -0,0685(4)
1963 0,0112 3 -0,0211(1) -0,0211(1) -0,0685(4) 0,0666(3) 0,0666(3) 0,0666(3)
1964 0,0085 4 0.0117П) 0,0117(1) 0,0666(3) -0,1382(2) -0,1382(2) -0,1382(2)
1965 0,0344 5 -0,0591(2) -0,0591(2) -0,1382(2) 0,1101(3) 0,1101(3) 0,1101(3)
1966 0,0084 6 0,0666(3) 0,0666(3) 0,1101(3) -0,0831(2) -0,0831(2) -0,1546(4)
1967 -0,0211 7 -0,1382(2) -0,1382(2) -0,0831(2) 0,0187(1) 0,01870) 0,1067(6)
1968 0,0117 8 0,1101(3) 0,1101(3) 0,0187(1) -0,0902(1) -0,0902(1)
1969 -0,0050 9 -0,0831(2) -0,0831(2) -0,0902(1) 0,1222(2) 0,1067(6)
1970 -0,0541 10 0,0187(1) 0,0187(1) 0,1222(2) -0.0155Г4)
1971 0,0269 11 -0,0902(1) -0,0902(1) -0,0155(4)
1972 0,0166 12 0,1222(2) 0,1222(2)
1973 0,0231 13 0,0258(2) -0,0155(4)
1974 -0,0445 14 0.0102(2"»
Продолжение
Флуктуации Знаки и мощности фаз
Номер
фазы первоначаль- на итерации
Т7ш t x —m
ных I II III IV V

1975 -0,0937
1976 0,0458
1977 0,0398
1978 0,0246
1979 -0,0226
1980 -0,0605
1981 0,0187
1982 -0,0902
1983 0,0216
1984 0,1006
1985 -0,0127
1986 -0,0130
1987 0,0088
1988 0,0015

П р и м е ч а н и е . В скобках указана длительность фазы; подчеркнуты фазы с минимальной мощностью.


Таблица 10.2
Агрегирование фаз — фильтрация маломощных флуктуации на данных Западной Европы

Флуктуации Знаки и мощности фаз


Номер
фазы первоначаль- на итерации
Год,* х,-тх
ных I II III IV V

1961 0,0098 1 0,0113(2) 0,0113(2) 0.0113^ -О.О0ОЗГ31 0,1313(10) 0,1313(10) 0,1313(10)


1962 0,0015 2 -0,0115(1) -0,0115(1) -0,0115(1) 0,1316(7) -0,0445(2) -0,0445(2) -0,0445(2)
1963 -0,0115 3 0,0590(3) 0,0590(3) 0,1316(7) -0,0445(2) 0,0443(2) 0,0443(2) 0,0443(2)
1964 0,0514 4 -0,0049(1) -0.0049ГП -0,0445(2) 0,0443(2) -0,0949(1) -0,0949(1) -0,1394(4)
1965 0,0060 5 0,0775(3) 0,0775(3) 0,0443(2) -0,0949(1) 0,0384(1) 0.0384ГП 0,0692(2)
1966 0,0016 6 -0,0445(2) -0,0445(2) -0,0949(1) 0,0384(1) -0,0830(2) -0,0830(2) -0,1314(3)
1967 -0,0049 7 0,0443(2) 0,0443(2) 0,0384(1) -0,0830(2) 0,0692(2) 0,0692(2) 0,0705(5)
.196« 0ДЮ72 8 -0,0949(1) -0,0949(1) -0,0830(2) 0,0692(2) -0,1130(1) -0,1314(3)
1969 0,0384 9 0,0384(1) 0,0384(1) 0,0692(2) -0,1130(1) 0.0225Ш 0,0705(5)
1970 0,0319 10 -0,0830(2) -0,0830(2) -0,1130(1) 0,0225(1) -0,0408(1)
1971 -0,0302 11 0,0692(2) 0,0692(2) 0,0225(1) -0,0408(1) 0,0705(5)
1972 -0,0142 12 -0,1130(1) -0,1130(1) -0,0408(1) 0,0705(5)
1973 0,0316 13 0,0225(1) 0,0225(1) 0,0705(5)
1974 0,0128 14 -0,0408(1) -0,0408(1)
8 Продолжение
Флуктуации Знаки и мощности фаз
Номер
фазы первоначаль- на итерации
Год,/ х
Гт, ных I II Ш IV V VI

1975 -0,0949 15 0,0167(1) 0,0705(5)

1976 0,0384 16 -о.оооип


1977 -0,0386 17 0,0539(3)
1978 -0,0444
1979 0,0544
1980 0,0148
1981 -0,1130
1982 0,0225
1983 -0,0408
1984 0,0167
1985 -0,0001
1986 0,0192
1987 0,0114
1988 0,0233

П р и м е ч а н и е . В скобках указана длительность фазы; подчеркнуты фазы с минимальной мощностью.


Рис. ЮЛ. Флуктуации (/) и фазовая диаграмма (2)
темпов прироста валовых капитальных вложений
в США с 1961 по 1988 г.

Рис. 10.2. Флуктуации (/) и фазовая диаграмма (2)


темпов прироста валовых капитальных вложений
в Западной Европе с 1961 по 1988 г.

Таблица 10.3
Обобщающие характеристики разбиения на фазы

Мощность Средняя Потери


Регион Число Число
ряда длитель- мощности,
фаз итераций
х, — тх ность фазы %

США 0,8640 7 4 16,35 5


Западная Европа 0,7854 7 4 9,93 6
253
Рис. 10.3. Фазовые диаграммы темпов прироста
валовых капитальных вложений в США (/)
и в Западной Европе (2) с 1961 по 1988 г.

Вследствие изменчивости лага формально рассчитанные


коэффициенты лаговой корреляции не могут дать столь на-
глядной картины развития двух процессов во времени, как
это демонстрируют фазовые диаграммы.

Применение рассмотренного нами метода фазового ана-


лиза временных рядов дает возможность сохранить локаль-
ную индивидуальность нерегулярных циклических колебаний
и последовательно переходить к анализу все более длинных и
мощных волн, абстрагируясь от колебаний меньшего масш-
таба. Метод отличается простотой и ясностью концепции.
Анализ проводится во времени, что облегчает интерпре-
тацию получаемых результатов, позволяет сопоставить их с
другими событиями окружающего мира. Обработка ряда
возможна с помощью универсальных электронных таблич-
ных процессоров типа Excel, Lotus 1-2-3 и т.п.
От исследователя требуется подготовка задачи к фазово-
му анализу, включая предварительное преобразование ис-
ходного ряда, определение уровня отсчета флуктуации, зада-
ние критерия останова итеративного процесса агрегирования
фаз. В остальном алгоритм носит жесткий, однозначный ха-
254
рактер и не зависит от желаний исследователя, поэтому можно
полагать, что рассмотренный фазовый анализ дает достаточ-
но объективные результаты.
Достоинством метода является его способность выделять
локальные колебательные движения временного ряда и ис-
следовать их особенности, недостаток состоит в том, что ме-
ханизм, генерирующий колебания, остается неизученным. Для
его познания требуется построение гибкой многофакторной
модели [124], поэтому результаты, получаемые с помощью
фазового анализа временных рядов, следует рассматривать
как исходные для более глубокого изучения колебательных
процессов.
Глава 11
АДАПТИВНАЯ ГИСТОГРАММА, ПРОБЛЕМА
ОПТИМИЗАЦИИ

Рассматриваются критерий и метод оптимиза-


ции адаптивной процедуры последовательного обновления
гистограммы временного ряда, изложенной в гл. 2 §1. При-
водится пример использования адаптивной гистограммы для
анализа динамики распределения кассовых остатков в бан-
ковском учреждении.

§ 1. ПОСТАНОВКА ПРОБЛЕМЫ

В анализе кассовых остатков банковского учреж-


дения, как и во многих других экономических задачах, час-
то требуется определить форму закона распределения ве-
роятностей случайной переменной. На практике для этих
целей используется построенная на выборочных данных до-
статочного объема гистограмма, показывающая эмпиричес-
кий закон распределения.
Так, если процесс, представляемый переменной, стацио-
нарен, то такое решение задачи следует признать вполне
удовлетворительным. Однако гораздо чаще стохастический
процесс, порождающий переменную, является нестационар-
ным — изменяются его средний уровень, размах отклонений
от среднего, а также форма кривой распределения амплитуд
колебаний. Если эти изменения носят эволюционный харак-
тер, то, как показал Р.Г. Браун [47], может быть построена
адаптивная процедура обновления гистограммы, основыва-
ющаяся на экспоненциальном сглаживании нуля или едини-
цы. Эта процедура рассмотрена нами в гл. 2 § 1. Обновлен-
256
ные значения частостей на момент^ для разных диапазонов
значений исследуемой переменной и определяют гистограм-
му, приближенно отражающую закон распределения.
Нерешенным, однако, остался вопрос о критерии каче-
ства этой процедуры и об оптимальном значении парамет-
ра адаптации. Решение данного вопроса изложено в [123].

§ 2. АДАПТИВНАЯ ПРОЦЕДУРА ОБНОВЛЕНИЯ


ГИСТОГРАММЫ

Напомним, что в общем случае рассматривает-


ся полная система п несовместных событий, определенных
на числовой оси с помощью п+1 границы

(ИЛ)

Событию, связанному с наблюдением х, в момент /,


соответствует номер интервала k — такой, что Хк_{ < х,<,Хк,
в который попадает наблюдённое значение. Предполага-
ем, что моменты наблюдения разделены равными проме-
жутками времени и t - 1,2, ..., Т. Оценку на момент t
вероятности наступления события k будем обозначать как

(11.2)

Разбиение оси х на интервалы произведем, разделив весь


диапазон (Хтах-ХтЫ) между верхним и нижним значением х
на п равных частей. В общем случае границы могут быть
заданы произвольно в зависимости от характера задачи и
Целей исследования.
Грубые начальные оценки рк(0), k = 1, 2, ..., п, можно
получить, например, используя прошлые данные или на-
чальную часть выборки объемом Г, <, Т как частость

(11.3)

где чик— число точек из подвыборки {х,}, t<-l,2,...,Tl, попавших в


интервал Хк_{ < х,£Хк.
257
Далее построим «-мерный вектор-столбец u(t), который
имеет (я— 1)-нулевую компоненту, а k-я компонента равна еди-
нице. Предыдущие оценки п вероятностей можно рассматри-
вать как «-компонентный вектор-столбец p(t—1). Процесс пе-
ресмотра этих оценок с учетом текущей информации является
экспоненциальным сглаживанием вектора u(t) по формуле

(11.4)

где а — константа из интервала 0 < сс< 1, параметр адапта-


ции, определяющий скорость обновления оценок. Каж-
дая компонента вектора модифицируется экспоненци-
альным сглаживанием нуля или единицы.
Так как p{t~ 1) — вектор вероятностей, то все его компо-
ненты неотрицательны и их сумма должна быть точно рав-
на.единице. Экспоненциальное сглаживание не'может сде-
лать компоненту отрицательной, и сумма полученных новых
оценок компонент равна предыдущей сумме, т.е. единице:

(П.5)

Таким образом, экспоненциальное сглаживание векто-


ра вероятностей дает обновленный вектор вероятностей.

§ 3. ПРОБЛЕМЫ ОПТИМАЛЬНОСТИ
АДАПТИВНОЙ ПРОЦЕДУРЫ
ОБНОВЛЕНИЯ ГИСТОГРАММЫ

Рассмотрим событие i. Если закон распределе-


ния наблюденных значений х, не меняется, то математичес-
кое ожидание значения компоненты i вектора и(/), подлежа-
щего сглаживанию, точно равно действительной вероятности р,
наступления события i и математическое ожидание оценки
равно действительной вероятности:
268
(11.6)

Вероятность того, что придется сглаживать единицу,


равна р., а того, что сглаживать нуль, составляет 1—р.. Легко
подсчитать, что компонента i вектора \\{t) характеризуется
дисперсией

(11.7)

Если к компоненте и, применить процедуру экспоненци-


ального сглаживания, то дисперсия получаемой на выходе
экспоненциальной средней выражается через дисперсию
входного потока по известной формуле

(П.8)

где а — постоянная сглаживания.

После подстановки (11.7) получим дисперсию оценки


вероятности наступления события i:

(Н.9)

Из (11.9) Р.Г. Браун делает вывод, что имеются два наи-


более предпочтительных способа конструирования системы
границ Хо, Xv Xv .... А_, при которой дисперсия оценки срав-
нительно невелика. Он предлагает устанавливать такие
границы событий, чтобы р, была либо очень большой (близ-
кой к единице), либо очень маленькой (почти равной нулю).
Это обеспечит малое значение произведения р/1— pt) и, сле-
довательно, низкую дисперсию оценок компонент вектора
вероятностей. Максимум дисперсии достигается при р,~ 0,5.
259
Однако подобные рассуждения слишком формальны, а
полученные рекомендации не всегда реализуемы. Если, на-
пример, положить, что р.= 0,9, то на все остальные события
остается лишь 10% вероятности. Такое разбиение на собы-
тия, конечно, возможно, если речь идет, например, о разде-
лении стандартных и нестандартных ситуаций. Но при адап-
тивном анализе распределения вероятностей потребуется
построить границы, разделяющие числовую ось на 5—9 или
более событий. Тогда условие pt~ 1 становится неприемле-
мым по очевидным причинам. В этом случае целесообразно
потребовать, чтобы все оценки вероятностей имели равные
дисперсии &. = const или одинаковое отношение стандарт-
ной ошибки к оценке вероятности о*//>,=>= const.
В первом случае выдвинутое требование означает, что

(11.10)

или
(11.11)

Несмотря на то что здесь формально можно получить


два решения, годится лишь одно - то, которое меньше 0,5,
поскольку таких р, должно быть 5-9 или более.
Во втором случае
(11.12)

или
(11.13)

откуда
(11.14)

Таким образом, в обоих случаях приходим к одному и


тому же выводу, что для равенства дисперсий оценок о^или
коэффициентов вариации oj/p, границы событий надо вы-
бирать так, чтобы вероятности наступления этих событий
были одинаковыми.
260
Весьма важный вопрос, оставленный Р.Г. Брауном без
ответа, касается выбора оптимального значения параметра
адаптации а. Формула (11.10) лишь свидетельствует о том,
что чем ближе ос к нулю, тем меньше дисперсия оценки веро-
ятности. Но нас в конечном счете интересует не столько ее
колеблемость, сколько степень соответствия последователь-
но формируемого и корректируемого распределения (точнее,
гистограммы) характеру реального разброса значений ис-
следуемой величины, по предположению, изменяющемуся во
времени. Совершенно очевидно, что вопрос об оптимальном
значении параметра а может быть решен только при нали-
чии критерия качества рассматриваемой процедуры.
За основу такого критерия в [123] предлагается взять
максимальный уровень значимости, при котором получен-
ную в момент t фактическую точку можно отнести к постро-
енному на этот же момент распределению. Сумма (или нор-
мированная сумма) таких максимальных уровней значимости
по моментам времени t = 1,2, ..., Т даст значение итогового
критерия Q, который будет функцией параметра адапта-
ции а и начальных оценок вероятностей событий на момент
t= 0. Максимальная величина Q определяет оптимальное
значение а и начальных оценок вероятностей.
Поясним этот критерий на графике (рис. 11.1). Пусть на
момент t адаптивно построена функция плотности распре-
деления вероятностей (p(x,a,t), которая, как ожидается, опи-
сывает стохастический процесс х в момент /. Полагаем, что

Рис, 11.1. Графическая интерпретация критерия качества


адаптивной гистограммы <р (x,a,t) — оценка плотности
распределения х в момент t\ а— параметр адаптации
261
в момент t мы получаем значение х( (реализацию) исследу-
емой величины х. Тогда заштрихованная область А под кри-
вой распределения равна вероятности того, что х примет
значение меньше xt, и представляет собой максимальный
уровень значимости qmaxt, при котором xt еще можно счи-
тать принадлежащей генеральной совокупности с плотнос-
тью распределения (p(x,a,t).
Если бы наблюденное значение превосходило медиану
тх и равнялось х\, то максимальный уровень значимости
определялся бы заштрихованной областью В.
Изложенное можно записать так:

(11.15)

где Рг — вероятность;
тх - медиана распределения х\
Ф(х,а^)'~ интегральная функция распределения х,

(11.16)"

Сама динамика qmMi может показать, в какие периоды


соответствие гистограмм и реальных наблюдений было «луч-
ше», а в какие — «хуже».
Суммирование по всем временным точкам выборки по-
зволяет сформировать критерий качества Qt для процеду-
р ы в целом:

(11.17)

или его нормированный вариант Q2:

(11.18)

262
Критерий Q, является агрегатом, характеризующим сте-
пень соответствия наблюдений временного ряда и ряда по-
строенных гистограмм на всем выборочном интервале в це-
лом. Критерий Q2 интерпретируется как усредненное по
выборке максимальное значение уровня значимости, при
котором наблюденные значения ряда можно считать при-
надлежащими распределениям, представляемым соответ-
ствующими гистограммами.
В формулах (11.17) и (11.18) показано, что в обоих случа-
ях критерий .качества процедуры адаптации является функ-
цией не только данных {х,} и параметра адаптации а, но и
объема выборочных данных Тг используемых для определе-
ния начальных значений вероятностей событий, необходи-
мых для запуска рекуррентной процедуры.
Отметим также, что Q, и Q2 сформированы как односто-
ронние критерии, предполагающие, что сопоставление реа-
лизации процесса х( с построенным распределением произ-
водится на одном его «хвосте». Однако на самом деле
фактические точки случайным образом ложатся по обе сто-
роны от медианы, и поэтому целесообразно перейти к дву-
стороннему критерию, для которого все значения q нужно
лишь удвоить. Тогда получим критерий <?3:

(11.19)

Критерий Q3 можно интерпретировать как достигнутый


в среднем по выборке уровень значимости, при котором
выборочные значения исходного ряда xt принадлежат рас-
пределениям вероятностей, построенным для соответствующих
моментов времени. Ясно, что чем выше значение критерия,
тем лучше процедура адаптации «успевает» за изменениями
в реальном процессе.
Очевидно, что Qv Qv Q3 принимают максимальное зна-
чение одновременно, т.е. при одних и тех же а и Т,. Замеча-
тельное свойство критерия (11.19) состоит в том, что если,
начиная с какого-то момента времени, переменная х, при-
нимает постоянное значение, равное медиане, то все после-
дующие qmMl равны 0,5, Q3-±l, a распределение постепенно
стягивается в точку. В общем случае значение критерия
263
находится в пределах 0 < <?3 < 1, и это делает его удобным
для различных сопоставлений.
Следует отметить, что при использовании построенной
гистограммы для выработки вероятностных суждений мо-
гут применяться как односторонний, так и двусторонний кри-
терии в зависимости от задач, и результаты, конечно, будут
различные.
Имея критерий качества процедуры, нетрудно определить
и оптимальное значение параметра адаптации а. Для этого
надо на интервале 0 < сс< 1, например, методом проб найти
такое его значение, которое максимизирует Q. Точно так же
можно найти и оптимальное значение Т, — начальную часть
выборки, используемую для вычисления грубых оценок ве-
роятностей рк(0), необходимых для первого применения ре-
куррентных формул экспоненциального сглаживания.
Конечно, оптимизация критерия Q по двум параметрам
а и Г, несколько усложняет вычислительный процесс. Но,
во-первых, область определения обоих параметров ограни-
чена: 0 < ос< 1, 1 «ТХ<,Т. Во-вторых, применение сначала
грубой сетки значений для локализации области поиска, а
затем более тонкой помогают резко снизить объем вычисле-
ний. В-третьих, быстродействие современных компьютеров
делает проблему легко преодолимой.

§ 4. АДАПТИВНЫЙ АНАЛИЗ РАСПРЕДЕЛЕНИЯ


КАССОВЫХ ОСТАТКОВ

Необходимость анализа нестационарных распре-


делений часто возникает в экономических исследованиях.
Например, в банковской деятельности это может быть за-
дача изучения распределения сумм на корреспондентских
счетах или в более общей постановке — анализ и использо-
вание вероятностных закономерностей формирования кас-
совых остатков.
В качестве примера рассмотрим задачу о кассовых ос-
татках. Предположим, что имеются ежедневные данные об
остатках наличных средств, являющихся результатом дви-
жения денег за день. Необходимо определить, какую сумму
из этого остатка можно пустить в оборот, обеспечив при этом
заданную вероятность незамедлительного удовлетворения
запросов клиентов с учетом ожидаемых новых поступлений.
264
Для решения этой задачи нами была создана специаль-
ная программа, в основу которой положен описанный выше
алгоритм. Предусмотрена оптимизация адаптивной процеду-
ры как по параметру а, так и по начальному объему выбор-
ки Tv Результаты счета представляются на экране в таблич-
ном виде (рис. 11.2) и графически (рис. 11.3). На графике

АДАПТИВНЫЙ АНАЛИЗ КАССОВЫХ ОСТАТКОВ


Имя файла сданными? Cashres.dat, имя ряда: LOROinp, число точек 132
Т а б л и ц а 1. Суммы, изымаемые из остатка,
и вероятности обслуживания клиентов

Вероятность 60 дней 40 дней 20 дней 10 дней Прогноз


обслуживания, % назад назад назад назад
100 34,00 34,00 34,00 34,00 34,00
95 39,16 48,95 53,76 46,90 51,18
90 44,31 51,37 60,65 51,71 57,98
85 49,00 53,80 66,54 55,37 64,47
80 51,64 56,22 71,91 59,03 70,06
75 54,28 58,65 77,27 62,70 75,66
70 56,92 61,07 79,39 66,76 80,26
65 59,56 65,11 81,37 70,86 84,37
60 62,20 75,34 83,35 74,96 88,49
55 67,02 82,08 85,33 78,35 93,73
50 72,78 87,88 87,31 80,56 105,56

Таблица 2, Минимальное и максимальное значения


остатков за последние дни
Значение За все дни За 60 За 40 За 20 За 10
остатков дней дней дней дней

Минимальное 34,00 44,00 44,00 44,00 67,00

Максимальное 179,00 179,00 179,00 179,00 179,00

Таблица 3. Оптимальные значения параметров

Начальная выборка Т1=79; параметр адаптации ALF=0,07;


критерий качества QMAX=0,53898

Рис, 11,2, Макет выдачи на экран результатов счета


в виде трех таблиц
265
Рис. 11.3. Анализ кассовых остатков и вероятностей
обслуживания клиентов: результаты счета в графическом виде
(исходный ряд х и изоквантили гистограмм), t — рабочие дни

представлен исходный ряд со сложной неустойчивой дина-


микой и 11 кривых, соответствующих различным квантилям
распределения (от 0 до 50% с шагом 5%).
Из полученных результатов следует, что при заданной
вероятности обслуживания запросов клиентов без задерж-
ки, равной, например, 90%, можно часть кассовых остатков
в размере 57,98 пустить в оборот. Отметим, что здесь для
выработки вероятностного суждения применялся односто-
ронний критерий.

Адаптивная гистограмма позволяет получать не только


точечный и интервальный прогноз будущих значений вре-
менного ряда, но и прогноз в виде функции плотности рас-
пределений.
Вероятностная модель может предназначаться для изу-
чения, например, распределения доходов в различных сло-
ях общества, спроса на отдельные виды товаров по возрас-
тным группам, эволюции распределения семейных бюджетов
266
по статьям расходов, распределения сумм текущих вкладов
и других финансовых, экономических и социально-экономи-
ческих процессов.
Особое значение предложенный подход имеет для ана-
лиза рисков, и, в частности, в анализе, получившем назва-
ние Value at Risk (VAR). Такой анализ позволяет оценить
величину максимального обесценения актива при заданном
уровне значимости (вероятности).
Предложенная процедура адаптивного исследования
распределений применима при определении размеров раз-
личных резервных и страховых фондов. С ее помощью мож-
но, например, анализировать изменения в распределении
депозитов по величине и сроку, непрерывно обновлять таб-
лицы смертности, рождаемости, заболеваемости, используе-
мые в страховой медицине, а также таблицы аварий и пожа-
ров, используемые в страховании автомобилей, недвижимости
и т.д.
Подобные задачи возможны и в «технологических» зве-
ньях в связи с исследованием надежности и качества с уче-
том непрерывной модернизации технологий и модификации
изделий и т.п.
Имеются резервы и для совершенствования рассмотрен-
ной методики. Так, в данном изложении мы полагали, что
параметр адаптации постоянен. Между тем скорость де-
формации распределения со временем может существенно
меняться. Тогда возникает задача автоматического управ-
ления параметром адаптации (см. гл. 4). Заметное влияние
на эффективность процедуры могут оказывать также силь-
ные тренды временного ряда. В этом случае процедура об-
новления гистограммы отстает от реальных изменений, что
проявляется в снижении показателя качества Q. Такие воп-
росы требуют специального изучения в каждом отдельном
случае.
Глава 12

КРИТЕРИИ ДИККИ-ФУЛЛЕРА
ДЛЯ ИДЕНТИФИКАЦИИ
ХАРАКТЕРА ТРЕНДА
(ОБНАРУЖЕНИЕ ЕДИНИЧНЫХ КОРНЕЙ)

Экономические ряды очень часто характеризуют-


ся наличием временного тренда. Обнаружение трендов и их
правильный учет в структуре модели представляют собой
важную задачу в анализе временных рядов. Для решения
этой задачи Дикки и Фуллер разработали критерии [137,138],
рассмотрению которых и посвящена данная глава.

§ 1. ДЕТЕРМИНИРОВАННЫЙ
И СЛУЧАЙНЫЙ ХАРАКТЕР ТРЕНДА

В экономических исследованиях часто приходится


иметь дело с нестационарными временными рядами, обнару-
живающими тот или иной тренд. При построении регрессион-
ной модели необходимо учитывать наличие этого тренда и ис-
ключать его. Известны две процедуры исключения тренда:
1) оценивание регрессии на время;
2) переход к последовательным разностям (приростам)
переменной.
В регрессионном подходе предполагается, что ряд у, ге-
нерируется моделью

где f(t) - тренд;


и, - стационарная случайная компонента с нулевым ма-
тематическим ожиданием и дисперсией <з\.
268
Если предположить, что f(t) является линейной функ-
цией от времени, то
(12.1)
После элиминирования тренда остается ряд ошибок ме-
тода наименьших квадратов (МНК) et со свойствами £е,= О
и Ste,= 0.
Если для элиминирования тренда перейти к разностям,
то получим

Для элиминирования ß нужно еще раз взять разности


первого порядка

Полученный ряд не содержит тренда. Однако, если пред-


положить, что у( генерирован моделью
(12.2)

где е, - стационарный ряд с нулевым математическим ожида-


нием и дисперсией о2; в этом случае первые разности
оказываются стационарными с математическим ожи-
данием ß. Эта модель называется моделью случайного
блуждания с дрейфом.

Переходя от начального значения у0 к yt путем суммиро-


вания приращений, получим выражение

(12.3)

имеющее тот же общий вид, что и уравнение (12.1), за исклю-


чением того, что член возмущения не является стационарным,
так как его дисперсия to2 растет во времени. К« Нельсон и
К. Плоссер [153] назвали выражение (12.1) моделью с детер-
минированным трендом (trend-stationary processes - TSP), a
уравнение (12.2) — моделью стационарных приращений
(difference-stationary processes — DSP). Обе модели отража-
ют линейный тренд, но различаются способом элиминирова-
ния тренда из исходных данных.
269
Для проверки гипотезы о том,.что ряд генерирован моде-
лью TSP против альтернативной, которая означает, что ряд
описывается моделью DSP, К. Нельсон и К. Плоссер предло-
жили применять критерий, разработанный Д. Дикки и В. Фул-
лером [137, 138]. Критерий предполагает оценку модели:
(12.4)

Ряд у1 принадлежит к классу DSP, если р = 1, ß = 0, и к


классу TSP — если р=0 или в более широком смысле, если
1р|<Г.
Таким образом, нужно проверить нулевую гипотезу Но:
р = 1, ß = 0 против альтернативной Н,: |р| < 1.Проблема,
возникающая здесь, состоит в том, что нельзя использовать
обычную теорию распределения оценок МНК, когда р = 1.
Дикки и Фуллер показали, что оценка МНК параметра р
при гипотезе о модели DSP (т.е., что р = 1) имеет математичес-
кое ожидание не 1, а значение, меньшее 1. Однако отрица-
тельное смещение уменьшается с увеличением числа наблю-
дений. Авторы критерия получили критические значения для
проверки гипотезы р = 1 против |р| < 1.
Процедура проверки гипотез относительно характера
тренда является частным случаем более общей процедуры
идентификации авторегрессионной зависимости, которую мы
рассмотрим чуть позже, а сейчас обсудим последствия не-
верной спецификации модели.

§ 2 . ЛОЖНЫЕ ТРЕНДЫ

Если в уравнении (12.2), представляющем модель


DSP, ß = 0

то получаем модель случайного блуждания без тренда (ее


также называют случайным блужданием с нулевым дрей-
фом). Однако из представления этой модели в виде выра-
жения (12.3)

270
видно, что даже если у среднего нет тренда,- то он имеется у
дисперсии.
Теперь предположим, что истинной моделью является
DSP, т!е. уравнение (12.2) с ß=0, а оценивается ошибочно
модель типа TSP (12.1):

т.е. модель с линейным трендом среднего, но без тренда у


дисперсии. Априори ясно, что возрастающая дисперсия слу-
чайной компоненты означает широкие движения и,, кото-
рые будут приписаны дрижению среднего, и коэффициент ß
при переменной времени t окажется значимым, даже если в
действительности никакого тренда у среднего нет. Каковы
будут последствия ошибочной спецификации? К. Нельсон и
Г. Канг [155] анализировали эту проблему и сделали следу-.
ющие выводы:
1. Регрессия случайного блуждания на время, оценен-
ная МНК, дает R2 в районе 0,44 независимо от объема вы-
борки, когда в действительности среднее значение перемен*
ной не связано с временем каким-либо образом.
2. В случае когда случайное блуждание имеет дрейф,
т.е. ß * 0, R2 будет выше и будет увеличиваться с ростом
объема выборки, достигая в пределе 1, независимо от зна-
чения ß.
3. Остатки от регрессии на время, рассматриваемые как
ряд с исключенным трендом, имеют в среднем только около
14% истинной дисперсии стохастической компоненты исход-
ного ряда. .
4. Остатки от регрессии на время автокоррелированы и
коэффициент автокорреляции для лага 1 г,« 1—10/п, где
п — объем выборки.
5. Обычные /-критерии для проверки значимости отдель-
ных регрессоров более не работают. Имеется тенденция от-
вергать на их основе нулевую гипотезу о независимости от
времени, когда она верна.
6. Регрессия одного случайного блуждания на другое с
включением времени в правую часть уравнения с высокой
вероятностью приводит к ложным зависимостям, т.е. обыч-
ная /-статистика часто указывает на связь между перемен-
ными, когда ее нет.
271
Основной вывод состоит в том, что использование рег-
рессии на время имеет серьезные последствия, когда в дей-
ствительности временной ряд относится к классу DSP и,
следовательно, адекватной процедурой для исключения трен-
да является переход к разностям.
Теперь предположим, что истинной является модель ли-
нейного тренда, а мы перешли к разностям. Тогда ошибка
имеет характер скользящей средней, и в худшем случае иг-
норирование этого приведет к неэффективным оценкам.
Например, пусть истинная модель

гдем, — независимы, с нулевым средним и постоянной диспер-


сией. Если перейти к первым разностям, то получим

где ошибка V, == Дм, — ut — «,_, является скользящей средней


и, следовательно, автокоррелированной. В этом случае оце-
нивание МНК уравнения для первых разностей все еще дает
состоятельные оценки. Таким образом, последствия перехо-
да к разностям, когда этого не требуется, намного менее
серьезны, чем те, что связаны с непереходом к разностям,
когда это обусловлено свойствами ряда, т.е. когда истинная
модель относится к классу DSP.
Нельсон и Плоссер применили критерий Дикки — Фул-
лера для проверки широкого круга исторических времен-
ных рядов, описывающих экономику США, и пришли к вы-
воду, что во всех случаях следует принять гипотезу DSP, за
исключением нормы безработицы. Они делают вывод, что
для большинства экономических временных рядов модель
DSP более адекватна, а модель TSP была бы подходящей
только, если предположить, что ошибки ut в (12.1) сильно
автокоррелированы.
Таким образом, для учета тренда на практике лучше
использовать переход к разностям и строить регрессии на
их основе, чем регрессии для уровней с временем в качестве
Дополнительной объясняющей переменной.
А теперь рассмотрим подробнее процедуру Дикки -
Фуллера.
272
§ 3. КРИТЕРИЙ ДИККИ - ФУЛЛЕРА
ДЛЯ ОБНАРУЖЕНИЯ ЕДИНИЧНЫХ КОРНЕЙ

Задача проверки гипотезы р = 1 в авторегресси-


онном уравнении первого порядка '
(12.5)

называется проверкой наличия единичных корней. Процесс


у, является стационарным, если —1 < р < 1. Если р = 1, то
yt- нестационарный и модель (12.5) представляет случай-
ное блуждание с дрейфом. Если р > 1, ряд имеет нестацио-
нарный, взрывной характер. Поэтому гипотеза о стационар-
ности ряда может быть проверена путем сравнения p e l .
Однако обычный критерий МНК. - ^-статистика здесь не-
применим и требует корректировки. Рассмотрим этот воп-
рос подробнее.
Найдем дисперсию оценки МНК р" для больших выборок
в модели парной регрессии (12.5), воспользовавшись фор-
мулой
(12.6)

где в качестве объясняющей переменной xt выступает лаго-


вое значение yt_{. Последовательно раскрывая yt через про-
шлые (лаговые) значения у, получаем

Математическое ожидание:

Дисперсия:

273
lg-1866
Отсюда, после подстановки в (12.6), получаем

где Т — объем выборки.

Таким образом, уагф) = 0при нулевой гипотезе НО: р= I.


Следовательно; для того чтобы можно было применять этот
критерий, нужно получить предельное распределение р при
нулевой гипотезе Но: р = 1.
Одним из наиболее широко используемых критериев
наличия единичных корней является критерий Дикки -
Фуллера. Они начали с построения процедуры проверки
гипотезы Н о : р = 1 в модели (12.5):

Этот тест выполняется путем оценивания уравнения,


получаемого после перехода к разностям, когда модель за-
писывается как

где у = р - 1.

Проверка гипотезы р - 1 эквивалентна проверке гипоте-


зы у=» 0. Затем авторы рассмотрели три различных регрес-
сионных уравнения, в которых проверяется наличие еди-
ничного корня:
(12.7)

(12.8)

(12.9)

Отметим, что рассмотренная ранее модель (12.4) может


быть приведена к виду (12.9) при у= р - 1.
Различие в моделях (12.7), (12.8) и (12.9) состоит в нали-
чии детерминированных элементов а и ß/. Первая модель -
это модель чисто случайного блуждания, во вторую модель
274
добавляется свободный член, который является парамет-
ром дрейфа, а в третью — включены и дрейф, и линейный
временной тренд.
Во всех трех регрессиях интерес представляет параметр у,
если у=0, то ряд у, характеризуется единичным корнем р=1.
Процедура проверки предполагает оценивание МНК одно-
го иди нескольких записанных выше уравнений с целью
получения оценки у и ее стандартной ошибки. Делением
оценки на ее стандартную ошибку получают /-статистику,
которая, однако, при нулевой гипотезе о наличии единично-
го корня имеет распределение, отличное от распределения
Стьюдент^. Авторы получили критические значения для /
путем модельных статистических испытаний. Сравнение
полученных /-статистик с критическим значением, приве-
денным в таблицах Дикки — Фуллера, позволяет исследо-
вателю принять или отвергнуть нулевую гипотезу Н о : у = 0.
Пусть, например, оценивание модели

дало следующие результаты: р =» 0,9546 с о = 0,030. Тогда


оценка МНК уравнения в разностном виде

дает у== -0,0454 с той же самой стандартной ошибкой 0,030.


Следовательно, соответствующая /-статистика для гипотезы
Y=0 равна:
/ - -0,0454 / 0,030 - -1,5133.
Для каждого из трех видов регрессионных уравнений
(12.7), (12.8) и (12.9) методология остается одинаковой. Од-
нако нужно иметь в виду, что критические значения /-ста-
тистик зависят от вида уравнения, от включения свободно-
го члена или временного тренда. В своем исследовании
методом Монте-Карло Дикки и Фуллер нашли критические
значения для гипотезы у— 0 в зависимости от вида регрес-
сии и объема выборки. Эти статистики для трех видов рег-
рессии обозначены как х, г и тт соответственно. В табл. 12.1
275
18*
Таблица 12.1
Критические значения статистик Дикки — Фуллера
для 95% и 99% доверительных интервалов

Критические
Статистика
Модель Гипотеза значения
критерия
95% 99%

y=0 *т -3,45 -4,04


a = 0 при у = 0 Т« 3,11 3,78

ß — 0 при у=0 2,79 3,53

Y=ß=O 6,49 8,73


Фз
ф2 4,88 6,50
a=y=ß=0

Ay, = а+у л _, +и, у= 0 *М -2,89 -3,51


a = 0 при у = 0 2,54 3,22
6,70
сс = у = 0 Ф» 4,71

у=0 X -1,95 -2,60


&У1=УУ(-1+Щ

представлены критические значения для проверки гипоте-


зы у = 0 при объеме выборки в 100 наблюдений на уровне
значимости 5% и 1% для различных видов уравнения.
В частности, для уравнения без свободного члена и вре-
менного тренда (ос= 0 и ß = 0) т = -1,95 для 5% и t = -2,6
для 1% уровня значимости. Таким образом, в числовом при-
мере с у - -0,0454, a = 0,030, t = -0,0454/0,030= -1,5133
находим, что t < %, и это означает, что нельзя отвергнуть
нулевую гипотезу о единичном корне при заданных уровнях
значимости.
Поскольку критические значения зависят от объема вы-
борки, отметим, что при заданном уровне значимости кри-
тические значения статистик уменьшаются с ростом числа
наблюдений. В 1991 г. Мак-Киннон провел более масштаб-
ные испытания, чем Дикки и Фуллер, и получил критичес-
кие значения для выборок любого объема и любого числа
переменных в правой части.
276
§ 4. РАСШИРЕННЫЙ КРИТЕРИЙ ДИККИ - ФУЛЛЕРА

По-английски этот критерий называется Augmented


Dickey-Fuller Test (ADF). Если обычный критерий Дикки -
Фуллера позволяет проверять гипотезу о наличии авторег-
рессии первого порядка, то расширенный предназначен для
идентификации авторегрессии более высоких порядков.
Итак, не все временные ряды могут быть хорошо пред-
ставлены авторегрессионным процессом первого порядка.
Рассмотрим авторегрессионный процесс р-го порядка

(12.10)

Прибавим и вычтем apyt_p+l, получим

Вновь прибавим и вычтем получим

Продолжая этот процесс и вычитая г/м из левой и пра-


вой части, приходим к следующему выражению:

(12.11)

(12.12)

(12.13)

277
Интерес представляет коэффициент у. Если он равен
нулю, уравнение (12.11) оказывается полностью записан-
ным через первые разности, и таким образом имеется еди-
ничный корень. Проверка наличия единичного корня может
быть осуществлена с помощью тех же самых статистик кри-
терия Дикки — Фуллера, распределения которых зависят от
включения в регрессионное уравнение детерминированных
компонент.
Другими словами, расширенный критерий Дикки — Фул-
лера используется для проверки наличия единичного корня
в авторегрессионных уравнениях более высокого порядка,
имеющих следующий вид:

(12.14)

(12.15)

(12.16)

Если нет свободного члена и тренда, используется ста-


тистика х; если включен только свободный член, использу-
ется статистика х, а если присутствует и свободный член, и
тренд, то — статистика xt.

• Отметим, что из (12.12) следует, что если сумма коэффи-

циентов исходного уравнения равна 1, т.е. 2^а, =1. то Y^ ^


м
а это значит, что имеется единичный корень. Для проверки
совместных гипотез о значениях коэффициентов Дикки и
Фуллер [138] предложили еще три статистики, названные
ими ф,, ф2 и ф3. Для уравнений (12.8) или (12.15) нулевая
гипотеза Н о : у = с с = 0 проверяется по статистике ф,. Если
в регрессию включается временной тренд и оцениваются
уравнения (12,9) или (12.16), то совместная нулевая гипоте-
за Но: oc = ß = Y== 0 проверяется по статистике фг, а гипотеза
а = ß = 0 - по статистике ф3.
278
Статистики ф,, ф2 и ф3 приведены нами в той же таблице.
Они построены точно так же, как и обычные /^-статистики
для сравнения общей модели с частной [128]:

(12.17)

где R2UR - коэффициент детерминации общей модели (без


ограничений UnRestricted);
R2R - коэффициент детерминации частной модели (с ог-
раничениями - Restricted);
т — число ограничений (число параметров, прирав-
ниваемых нулю);
п — объем исходной выборки;
р - порядок лага;
k — число параметров, оцениваемых в общей модели,
(п- р - А) — число степеней свободы модели без ограничений.

Формулу (12.17) можно эквивалентным образом запи-


сать через суммы квадратов ошибок CKOü/? и СКО Д для

соответствующих моделей. Так как

(12.18)

Отметим, что критические значения статистик ф Дикки


и Фуллера намного выше, чем в обычных таблицах F-pac-
пределения. Для сравнения приведем их для 5%-ного уров-
ня значимости (табл. 12.2), числе степеней свободы числи-
теля 2 и числе степеней свободы знаменателя (п - р - 3).
В качестве иллюстрации рассмотрим пример, описан-
ный Дикки и Фуллером. Они предположили, что логариф-
мы квартальных данных об индексе производства, рас-
считываемым Федеральной резервной палатой, можно адек-
ватно представить за период с I кв. 1950 г. по IV кв. 1977 г.
моделью:

279
которую адекватно можно записать как

где u,~IN(0,a2) — случайная переменная, у= а, — 1.

Таблица 12.2

Сравнение критических значений


^-статистики и статистики ф (2, п - р - 3)

Стандартная
Объем выборки Статистика
(п-р) статистика
Дикки - Фуллера ф F

25 7,24 3,42
50 6,73 3,20
100 6,49 3,10
00 6,25 3,00

Для проверки обоснованности структуры уравнения оце-


нивались МНК три альтернативные модели, что дало сле-
дующие результаты.
О б щ а я м о д е л ь (без ограничений):

äyt - 0,52 + 0,00120/ - 0,119ум + 0,498Дг/,_, + <12.19)

a =0,15 0,00034 0,033 0,081

С К О ^ - 0,056448.

Ч а с т н а я м о д е л ь 1 (с ограничениями H 0 :ß= 0, у ^ ^
At/, = 0,0054 + 0,447At/,_, + е, (J 2 - 2 0 )

a - 0,0025 0,083
CKCL - 0,063211.

280
Ч а с т н а я м о д е л ь 2 (с ограничениями Но: ос= 0, ß= О,
у=0):
Ау, - 0,511Ду м + е, (12.21)

а = 0,079

СКО Л = 0,065966.

Для проверки значимости в модели (12.19) только одно-


го коэффициента у, т.е. гипотезы Но: у= 0, вычислим статис-
тику

Ее критическое значение при 5%-ном уровне значимос-


ти равно —3,45, т.е. наблюденное значение по модулю боль-
ше критического. Следовательно, нулевую гипотезу следует
отвергнуть.
Выполним более сложные проверки, в которых выдвига-
ются совместные гипотезы относительно нескольких пара-
метров модели.
Для проверки нулевой гипотезы, что данные генериро-
ваны моделью (12.21) против альтернативной, что «истин-
ной» моделью является (12.19), т.е. Но: а = 0, ß = 0, у = 0,
используется статистика ф2. Наблюденное значение статис-
тики при проверке указанной гипотезы Н о равно:

Число степеней свободы знаменателя получено следую-


щим образом. Всего квартальных наблюдений за полных 28
лет равно 112, однако в уравнении предполагается лаг за-
висимой переменной второго порядка, так что для оценива-
ния остается только 110 наблюдений, и из этого числа вычи-
тается число оцениваемых коэффициентов в общей модели,
т.е. ПО - 4 = 106. Критическое значение ф2 при 5%-ном
уровне значимости равно 4,88, т.е. наблюденное значение
больше критического, следовательно, гипотезу Но (модель
(12.21)) отвергаем.
281
Для проверки нулевой гипотезы, что данные генериро-
ваны моделью (12.20) против альтернативной, что «истин-
ной» моделью является модель (12.19), т.е. Но: ß = 0, у = 0,
используется статистика ф3. Наблюденное значение статис-
тики при проверке указанной гипотезы Н о равно:

При объеме данных около 100 наблюдений критическое


значение ф3 = 6,49 при 5%-ном уровне значимости. Таким
образом, наблюденное значение ф3 меньше критического, ги-
потеза Но, которая означает наличие единичного корня и
(или) детерминированного временного тренда, не отверга-
ется, т.е. принимается модель (12.20).
Критерий Дикки — Фуллера предполагает, что ошибки
независимы и имеют постоянную дисперсию. Здесь возника-
ют четыре проблемы:
1. Процесс, порождающий временной ряд, может содер-
жать- как авторегрессию, так и скользящую среднюю. Необ-
ходимо понять, как нужно проводить тест, если порядок
скользящей средней неизвестен.
2. Нельзя получить хорошую оценку у и ее стандартной
ошибки, если не все авторегрессионные члены включены в
уравнение. Другими словами, возникает проблема выбора
порядка авторегрессии (максимального лага).
3. Критерий Дикки -' Фуллера предназначен для обна-
ружения единственного единичного корня. Однако авторег-
рессия порядка р имеет р характеристических корней. Если
имеется d <,p единичных корней, то для достижения стаци-
онарности нужно перейти к разностям временного ряда по-
рядка d.
4. Обычно заранее неизвестно, включать свободный член
и временной тренд в уравнение (12.10).
Рассмотрим эти проблемы. Поскольку обратимая модель
скользящего среднего (СС) может быть преобразована в
авторегрессионную модель, то рассмотренная выше проце-
дура Дикки - Фуллера применима и при наличии в модели
компонент скользящего среднего. Пусть последовательность
282
значений {yt} генерирована смешанной моделью авторегрес-
сии-скользящего среднего APCC(p,q)

где ф (В) и Q(B) — полиномы от оператора сдвига назад В со-


ответственно порядка р и q. Оператор сдви-
га назад В означает, что Byt=> «/,_,, В2у,=
- у,_2 и т.д.

Если корни Q(B) лежат вне единичного круга, то после-


довательность {у,} можно представить авторегрессионным
процессом

или, введя обозначение D(ß)= <p(B)/Q(B), получаем

D(B)y, - и,.

Даже если оператор D(B) будет полиномом бесконечного


порядка, используя тот же прием, что и в (12.11), можно прий-
ти к авторегрессионной модели бесконечного порядка вида
(12.22)

Бесконечную авторегрессию (12.22) нельзя оценить на


конечной выборке. Однако Сайд и Дикки в 1984 г. показа-
ли, что процесс интегрированной модели авторегрессии-
скользящего среднего АРИСС(р,\,я), т.е. смешанный про-
цесс авторегрессии-скользящего среднего для первых
разностей, может быть хорошо аппроксимирован процес-
сом АРИСС(р,1,0), где порядок авторегрессии р не больше,
чем п1/3. Таким образом, первую проблему можно решить,
используя авторегрессию конечного порядка для аппрокси-
мации (12.22). Проверка нулевой гипотезы Но: у- 0 может
быть выполнена с помощью статистик т, т^ или t T рассмот-
ренного выше критерия Дикки - Фуллера.
Теперь возникает проблема определения подходящего
лага. Завышенный лаг снижает мощность критерия по про-
283
верке нулевой гипотезы о единичном корне, так как в этом
случае требуется оценить большее число параметров, а,
кроме того, уменьшается число наблюдений, используемых
для оценивания. И то, и другое снижает число степеней сво-
боды. С другой стороны, заниженный лаг недостаточно хо-
рошо будет отражать действительные свойства ошибок, так
что у и ее стандартная ошибка будут оценены плохо. Как
.же выбирать хорошее значение лага в таком случае?
Один подход состоит в том, чтобы начать с достаточно
большого лага и постепенно сокращать его в модели на ос-
нове обычных t- и /^-критериев. Повторять процесс до тех
пор, пока коэффициент при лаговом значении не станет су-
щественно отличным от нуля. В чисто авторегрессионном
процессе это приведет к определению истинного значения
лага. При наличии сезонных явлений процесс будет несколь-
ко иным. Например, используя квартальные данные, мож-
но начать с трехлетнего лага, т.е. т = 12. Если /-статистика
у лага 12 несущественна, а ^-критерий указывает на то, что
лаги с 9 по 12 также несущественны, переходите к лагам с
1 по 8. Повторите этот процесс для лага 8 и лагов с 5 по 8
и так далее, пока не будет достигнута приемлемая величи-
на лага.
После того как лаг выбран, требуется выполнить диаг-
ностическую проверку. Прежде всего следует изучить гра-
фик остатков: в них не должно быть признаков структур-
ных сдвигов или автокорреляции. Коррелограмма остатков
должна быть такой, как у белого шума. Статистика Бок-
са — Пирса Q (см. гл. 7 § 3) или ее модификация — статисти-
ка Льянга — Бокса

не должна показывать существенную автокорреляцию ос-


татков. Не рекомендуется альтернативная процедура, на-
чинающая с низкого значения лага, а затем увеличиваю-
щая его до тех пор, пока не будет достигнут незначимый
лаг. Исследования методом Монте-Карло показали, что ДЛЯ
этой процедуры характерно смещение в сторону заниже-
ния лага,
284
Множественность корней
Дикки и Пентала предложили простое расширение кри-
терия Дикки — Фуллера на случай, когда корней больше,
чем один. По существу, речь идет о применении процедуры
Дикки — Фуллера к последовательным разностям yt. Если
подозревается один корень, то оценивается уравнение вида

Если предполагаются два корня, то оценивается урав-


нение
(12.23)

Дл^я проверки существенного отличия у, от нуля исполь-


зуются те же самые статистики х, т или т т (в зависимости от
детерминированных элементов, включенных в модель). Если
нельзя отвергнуть гипотезу, что у,=0, то гипотеза о втором
порядке разностей принимается и делается вывод, что ряд
yt является интегрированным порядка 2, т.е. /(2). Если же у,
отличен от нуля, следует проверить гипотезу о том, что име-
ется один корень, путем оценивания уравнения
(12.24)

Наличие одного корня означает, что либо у,, либо у2, либо
оба коэффициента отличны от нуля. При нулевой гипотезе о
наличии единственного корня у, < 0 и у 2 = 0. При альтерна-
тивной гипотезе yt является стационарным, так что у, и у2
отрицательны. Таким образом, нужно оценить модель (12.24)
и использовать критические значения статистик Дикки -
Фуллера для проверки гипотезы у, = 0. Если нулевая гипо-
теза отвергается, делается вывод о том, что у, стационарен.
Отметим, что экономические ряды не требуют перехода
к разностям выше второго порядка.

Сезонность и единичные корни


Для простоты изложения предположим, что кварталь-
ные наблюдения у, генерируются моделью

285
т.е. разности лага 4 стационарны:

Если начальные значения положить равными нулю: уо =


= #_,= ... = 0 , т о

так что

Следовательно, первые разности Ayt являются разностя-


ми между двумя стохастическими трендами. Поскольку
дисперсия Ayt неограниченно возрастает с ростом t, после-
довательность Ау( нестационарна. Однако разности лага,
равного периоду сезонности, могут быть стационарными.
Например, если yt генерируется моделью у( ~ yt_K + м,, то
разности лага 4 А4у, = у,— у,^ =* ut+ ",_, + м,_2+ ut_3 стацио-
нарны, однако их дисперсия больше дисперсии первых раз-
ностей.
Процедура Дикки — Фуллера может быть модифициро-
вана для обнаружения единичных корней, связанных с се-
зонностью, и для различения сезонных и несезонных еди-
ничных корней.
Возможно несколько альтернативных способов обработ-
ки сезонности в нестационарных рядах. Наиболее прямой
метод применим, когда сезонность является чисто детерми-
нированным явлением. Например, пусть Dx, Dv Ds пред-
ставляют квартальные сезонные фиктивные переменные, так
что Dt => 1 в квартале / и О - в других случаях. Оценим
регрессионное уравнение

где/?, - регрессионный остаток, который можно рассматривать


как yt, очищенный от сезонных колебаний.
286
Затем используем регрессионные остатки для оценива-
ния регрессии:

(12.25)

Нулевая гипотеза о наличии единичного корня (т.е. у- 0)


может быть проверена с помощью статистики тй Дикки -
Фуллера. Отклонение нулевой гипотезы эквивалентно при-
нятию альтернативной, что последовательность yt является
стационарной. Этот критерий применим, так как Д. Дикки,
В. Белл и Р. Миллер [139] показали, что на предельное рас-
пределение для у не влияет удаление детерминированных
сезонных компонент. Если желательно включить временной
тренд в уравнение (12.25), то следует использовать статис-
тику тт.

§ 5. СОВРЕМЕННЫЕ МЕТОДЫ ПОСТРОЕНИЯ


МОДЕЛИ АРИСС

В главе 7 была рассмотрена модель, предложен-


ная Дж. Боксом и Г. Дженкинсом [5], которая объединяет
авторегрессию исходного временного ряда и скользящую
среднюю для ошибок.
Нестационарные модели авторегрессионного типа раз-
работаны для тех случаев, когда нестационарные времен-
ные ряды могут быть преобразованы в стационарные путем
перехода от исходного ряда к его разностям соответствую-
щего порядка d. Такая модель является более общей и назы-
вается интегрированной моделью авторегрессии-скользя-
Щего среднего порядка р, d, qu обозначается АРИСС(рД<7).
г
Де р — порядок авторегрессии, q — порядок скользящей
средней. Обычно порядок разностей d &2,
Первый шаг в построении модели АРИСС(/?Д<7) для
одномерного временного ряда состоит в выборе порядков р,
d, q, который осуществляется в два этапа. Сначала опреде-
ляют порядок разности d, при котором достигается стацио-
нарность процесса. Этот порядок называется порядком ин-
теграции и обозначается I(d). Он определяется с помощью
расширенного критерия Дикки - Фуллера (ADF test). За-
287
тем определяются порядки модели АРСС р и q для разно-
стей порядка d. Дж. Бокс и Г. Дженкинс делали это на
основе изучения коррелограммы временного ряда и сравне-
ния ее с теоретической коррелограммой конкретной теоре-
тической модели. Однако сейчас выбор порядков,/? и q осу-
ществляется на основе информационного критерия Акайка
или байесовского критерия Шварца.
Оценивание параметров моделей АР, СС и АРСС про-
2
изводится путем минимизации суммы квадратов ошибок 2и( ;
для этого применяются итеративные процедуры или проце-
дуры поиска наилучших оценок на сетке значений. Значе-
ния ошибок и, интерпретируются как ошибки прогнозов на
один шаг (на одну единицу времени) вперед. Одной из це-
лей при построении модели является поиск модели с наи-
меньшим числом параметров — принцип экономности.
Общим критерием качества модели АРСС является кри-
терий Акайка и байесовский критерий Шварца. Они анало-
гичны критерию максимума скорректированного коэффи-
2
циента детерминации R или минимума дисперсии ошибки
2
а . Эти критерии позволяют найти наилучшие значения по-
рядков р и q модели. Однако наилучшая модель из задан-
ного класса моделей еще не гарантирует того, что она явля-
ется хорошей. Необходимы дополнительные исследования
ее качества. В частности, следует проверить автокорреля-
цию остатков. Для авторегрессионных моделей нельзя ис-
пользовать статистику Дарбина — Уотсона (DW). В этом
случае следует применять критерий h Дарбина или крите-
рий множителей Лагранжа (LM). Как уже упоминалось,
Дж. Бокс и Дж. Пирс [45] предложили изучать автокорре-
ляцию не только первого порядка, а всех порядков.
Статистика Q Бокса - Пирса (Box - Pierce test) имеет вид

где rk — коэффициент автокорреляции лага k\


п - число наблюдений в ряде.
Если модель адекватна, то Q имеет асимптотическое
распределение %2 с числом степеней свободы т - р - Ц>гД
288
р и q — порядки АР и СС частей модели. Льянгом и Боксом
предложена модификация этого теста для выборок умерен-
ного объема:

(12.26)

Однако имеются свидетельства того, что и критерий Q, и


критерий Q* имеют малую мощность, а критерий LM являет-
ся более предпочтительным, и он уже введен в современные
программы. Однако в настоящее время в программах и пуб-
ликациях чаще встречается критерий Q или его модификация.
Информационный критерий Акайка
Пусть /л(8)будет максимальное значение логарифмичес-
кой, функции правдоподобия эконометрической модели, где
9 — оценка максимального правдоподобия (ML) вектора па-
раметров 9, полученная на выборке объема п. Информаци-
онный критерий Акайка (Akaike information criterion — AIC)
[132, 133], предназначенный для выбора наилучшей модели
для временного ряда yt из некоторого их множества, имеет
вид

(12.27)

гдер - размерность вектора 9, т.е. число оцениваемых коэф-


фициентов регрессионной модели.

В случае линейной или нелинейной регрессионной моде-


ли, состоящей из одного уравнения, этот критерий эквива-
лентным образом может быть переписан как

(12.28)

где о 2 — оценка ML-дисперсии регрессионных остатков е/,


5 2 =l!£, e — вектор ошибок,
и
289
Оба варианта критерия Акайка дают одинаковые ре-
зультаты, но в первом варианте выбирается модель с наи-
большим значением А/Ср а во втором — с наименьшим AICo*.
Таким образом, и в том, и в другом случае в этом критерии
вводится штраф за добавление в правую часть уравнения
каждой новой объясняющей переменной.
В случае линейных регрессионных моделей эквивалент-
ность двух вариантов критерия вытекает из следующих пре-
образований. Подставим максимальное значение логариф-
мической функции правдоподобия

(12.29)

в (12.27):

(12.30)

и, используя (12.28), получаем

(12.31)

Так что максимум AICt будет достигаться при миниму-


ме AIC .
О
Байесовский критерий Шварца
Байесовский критерий Шварца (Schwarz Bayesian crite-
r i o n - SBC) также предназначен для выбора наилучшей
модели, как и информационный критерий Акайка. Он пред-
ставляет собой аппроксимацию на больших выборках апос-
териорного отношения вероятностей сравниваемых моделей.
Он определяется как

(12.32)

Из ряда сопоставляемых моделей выбирается та, у ко-


торой наибольшее значений SBC.
290
Альтернативный вариант критерия для регрессионных
моделей выражается через Ьг

(12.33)

В соответствии с этим вариантом критерия выбирается


модель с наименьшим значением SBCO. Оба варианта крите-
рия приводят к одинаковому выбору модели. Однако резуль-
таты критериев Акайка и Шварца могут немного отличаться.
Как правило, при выборе порядка лага в авторегрессионной
модели критерий Акайка указывает на больший порядок,
что означает большую величину «штрафа» за добавление
переменной в правую часть уравнения у критерия Шварца.
Общий критерий множителей Лагранжа
для обнаружения автокорреляции остатков
Обычно для обнаружения автокорреляции в регрессион-
ных остатках применяется критерий Дарбина — Уотсона, ко-
торый обозначается как DW или как d. Однако он неприме-
ним в случае, когда среди регрессоров имеются лаговые
значения эндогенной переменной. На это указали сами авто-
ры критерия, и одним из них, Дарбиным, был предложен аль-
тернативный h-критерий, который, однако, можно вычислить
не всегда. И, кроме того, оба критерия и D W, и h являются
критериями автокорреляции только первого порядка. Breusch
(1978), и Godfrey (1978) рассматривают несколько общих тес-
тов, которые легко применять и сохраняют свою силу при очень
общих гипотезах относительно автокорреляции в регрессион-
ных остатках. Эти критерии получены на основе общего прин-
ципа, называющегося принципом множителей Лагранжа. Один
из них, критерий множителей Лагранжа (LM-test), является
более общим и позволяет обнаруживать в регрессионных ос-
татках автокорреляцию и более высоких порядков. Как и h-
тест, он применим только для больших выборок.
Рассмотрим регрессионную модель

(12.34)

в которой
291
(12.35)

Необходимо проверить нулевую гипотезу Но:

Среди объясняющих переменных могут быть лаговые


значения зависимой переменной. LM-тест состоит из следу-
ющих шагов:
1)оценить регрессию (12.34) методом наименьших квад-
ратов, получить остатки üt;
2) оценить регрессию

(12.36)

и проверить, не являются ли все коэффициенты р, при лаго-


вых значениях остатков нулевыми. Для этого вычисляется
2
F-статистика и рассматривается pF как % (р). Здесь исполь-
2
зуется х -критерий, а не F, так как LM-тест предназначен
для больших выборок.
Этот критерий может быть использован для различных
спецификаций процесса, описывающего ошибки регрессии.
Например, при проверке автокорреляции четвертого порядка
(связанной с возможной сезонностью в квартальных данных)

(12.37)

нужно оценить регрессию

(12.38)

и проверить нулевую гипотезу Н о : р 4 =0.


Процедура одна и та же для авторегрессионной или
скользящей средней модели, генерирующей ошибки. Напри-
мер, если ошибка описывается скользящей средней

то все равно следует оценить уравнение (12.38) и проверить

292
Пример
Выбор порядков р и q в модели АРСС. Сравнивая зна-
чения AIC или SBC для различных порядков р и <7, в пакете
MicroFit [156] выбирают спецификацию модели с наиболь-
шим значением критерия (в некоторых программах, напро-
тив, с наименьшим значением — это зависит от вида крите-
рия, выбранного программистом). Данные удобно
представлять в табличном виде (табл. 12.3).

Таблица 12.3

Таблица значений AIC

f
р
0 1 2 3
0 42,59 46,47 48,87 48,02
1 48,35 47,92 48,08 47,10
2 48,76 48,21 47,22 46,25
3 48,13 47,29 46,30 45,35

По этим данным выбирается модель АРСС(0,2), т.е. СС(2) -


скользящая средняя второго порядка (в табл. 12.3 она вы-
делена полужирным шрифтом).
В таблице 12.4 приведены для тех же данных значения
SBC.

Таблица 12.4
р Ч
0 1 2 3
0 41,15 43,59 44,55 42,25
1 45,46 43,60 42,32 39,89
2 44,43 42,44 40,02 37,60
3 42,37 40,08 37,65 35,26

По данным табл. 12.4 выбирается модель АРСС(1,0), т.е.


АР(1) — авторегрессия первого порядка.
Как видим, два критерия могут давать различные ре-
зультаты.
293
Определение типа тренда, порядка разностей d. Тип
тренда во временном ряде может быть детерминированным
либо стохастическим. Тип тренда устанавливается с помо-
щью критерия ADF. Этот же критерий позволяет установить
порядок разностей, обеспечивающий стационарность.
Рассмотрим, например, процесс АР{{)

2
где и распределены идентично и независимо, т.е. u-nd(0,a ).
Если ]ф| < 1, то тренд детерминированный, а если ф= 1, то имеет-
ся единичный корень и первые разности стационарны, т.е. тренд
стохастический с ненулевым дрейфом а и d =1.
Попытка определить тип тренда в общем виде принима-
ет форму проверки односторонней гипотезы о наличии еди-
ничного корня против альтернативной гипотезы о стацио-
нарности стохастического тренда:
Н о : ф = 1 против Н,: ф < 1.
Важно отметить, что при использовании /-статистики для
проверки, что ф = 1 , критические значения нужно брать не
из таблиц стандартного /-распределения, а из нестандарт-
ного распределения Дикки — Фуллера.
В более общем случае, когда возмущения ut, t = 1,2,..., п,
автокоррелированы, следует применять расширенный кри-
терий Дикки — Фуллера для проверки наличия единичных
корней, который предполагает учесть автокорреляцию ошиб-
ки путем добавления лаговых разностей у,:

что может быть также записано как

где нулевая гипотеза теперь имеет вид Но: р - 1 - ф - 0.

В ходе проверки на наличие единичных корней необхо-


димо выбрать оптимальный порядок р регрессии ADF. Это
делается методом проб на основе критерия AIC или SBC.
294
Отметим, что к полученным первым разностям следует
повторно применить критерий ADF с целью проверки, не
следует ли перейти ко вторым разностям для обеспечения
стационарности и т.д., пока не будет определен порядок
интегрированности d. Напомним также, что критические зна-
чения статистик Дикки — Фуллера зависят от включения в
уравнение свободного члена и временного тренда. Отметим,
что, например, в пакете MicroFit имеется специальная, по-
зволяющая проводить анализ наличия единичных корней
процедура, которая автоматически выводит и критические
значения статистик Дикки — Фуллера.

Данная глава посвящена проблемам тренда во времен-


ном ряде. Еще в гл. 1, § 1 были введены понятия детермини-
рованного и стохастического трендов. Теперь же рассмотре-
ны критерии обнаружения трендов и установления их типа.
Материал этой главы весьма важен для построения моде-
лей Бокса - Дженкинса KPWQC{p,d>q)> рассмотренных нами
в гл. 7, в частности, для определения необходимого порядка
разностей d. Это первый, но, очевидно, важнейший шаг в
построении моделей такого класса. Определение порядка
авторегрессии р и порядка скользящей средней q осуществ-
ляется с помощью информационного критерия Акайка (AIC)
или байесовского критерия Шварца (SBC), которые имеют-
ся в стандартных эконометрических пакетах программ, на-
пример в пакете MicroFit.
Глава 13

ИНТЕГРИРОВАННОСТЬ
И КОИНТЕГРИРОВАННОСТЬ
ПЕРЕМЕННЫХ

В эконометрическом моделировании часто тре-


буется предварительное элиминирование временных трен-
дов из исходных данных. Кроме того, необходима сбаланси-
рованность динамических свойств переменных, стоящих в
левой и правой частях регрессионного уравнения. Каким
образом осуществляется контроль в этом случае, мы и рас-
смотрим в этой главе.

§ 1. ИНТЕГРИРОВАННОСТЬ
И КОИНТЕГРИРОВАННОСТЬ
ДВУХ ПЕРЕМЕННЫХ

Большинство экономических рядов нестационар-


но, поскольку обычно они имеют линейный, параболичес-
кий или экспоненциальный временной тренд. Однако часто
временной ряд можно привести к стационарному виду, если
перейти к его разностям (приростам) вида У~УЫ- Если пер-
вые разности ряда стационарны, то говорят, что этот ряд
является интегрированным первого порядка., Переход к
разностям приводит к потере ценной долгосрочной инфор-
мации в данных. Сравнительно недавно для решения этой
проблемы были предложены понятия интегрированности и
коинтегрированности временных рядов [142]. Несмотря на
то что предположение о нормальности и независимости не
является необходимым, дадим определения при этом пред-
положении.
296
Если стационарный временной ряд и~1Щ0,а2), говорят,
что и, является интегрированным процессом порядка ноль
и записывают это символически как /(0).
Если yt генерирован моделью случайного блуждания

то, приняв, что у0 — 0, путем последовательных подстановок


получаем

Таким образом, yt является суммой и., и

является процессом /(0). В этом случае говорят, что yt явля-


ется интегрированным процессом порядка один, т.е. yt~I(l).
Если //, есть /(1) и мы прибавляем к нему zt, который
является /(0), то сумма (у(+ zt) будет /(1).
Когда специфицируют регрессионную модель для вре-
менных рядов, то обращают внимание на то, чтобы различ-
ные переменные уравнения имели одинаковый порядок ин-
тегрированности, т.е.чтобы при одном порядке разности они
достигали стационарного вида. В противном случае урав-
нение не имеет смысла. Например, если специфицируется
регрессионная модель

(13.1)

и предполагается, что «/-INfO.c2), т.е. что ut является /(0), то


нужно удостовериться, что yt и xt являются интегрирован-
ными процессами одного порядка. Например, если у, есть
/(1), a xt~ процесс /(0), то ни при каком ß соотношение
(13.1) не будет удовлетворено.
Пусть ^есть /(1) и х, тоже /(1), тогда, если существует
такое ненулевое значение ß, что yt~ ßx, есть процесс /(0), то
говорят, что у, и xt коинтегрированы.
297
Предположим, что yt и xt являются процессами случай-
ного блуждания, так что оба они /(1). Тогда уравнение в
первых разностях вида

(13.2)

является правомерным, так как Aylt Ах(, (y—^xt) и все и,


являются процессами /(0).
Уравнение (13.1) рассматривается как долгосрочное со-
отношение между yt и xt, а уравнение (13.2) описывает крат-
косрочную динамику. Энгл и Гренжер предлагают оцени-
вать выражение (13.1) методом наименьших квадратов,
получать оценку д и подставлять ее в уравнение (13.2) с
тем, чтобы затем получить оценки параметров ос и А,. Одна-
ко эта двухшаговая процедура основывается на предполо-
жении, что yt и х, коинтегрированы. Поэтому предваритель-
но нужно проверить наличие коинтегрированности. Энгл и
Гренжер предлагают оценивать модель (13.1) МНК, полу-
чать остатки hv а затем применять критерий Дикки — Фул-
лера для анализа этих остатков. Целью данного теста явля-
ется проверка гипотезы, что р ** 1 в уравнении

т.е. проверка гипотезы Но: ut~I(l). По сути дела, проверяет-


ся гипотеза, что yt и х, не коинтегрированы. Поскольку у,~1( 1)
и х~[(1), мы хотим убедиться, что и. не является процессом
/(1).
Р. Бьюли, М. Уиккенс и Т. Бройш [134, 162] показали, что
двухшаговая процедура оценивания, предложенная Р. Энг-
лом и К. Гренжером, предполагающая сначала оценивание
параметра долгосрочной связи ß в уравнении (13.1), а затем
оценивание параметров краткосрочной связи о и X в уравне-
нии (13.2), не является необходимой. Они предлагают одно-
временное оценивание долгосрочных и краткосрочных пара-
метров, что позволяет получить более эффективные оценки
долгосрочного параметра р\ Разделив уравнение (13.2) на л.
и немного перестроив уравнение, получаем

(13.3)

298
Поскольку &yt будет коррелирована с ошибкой ut, урав-
нение (13.3) следует оценивать методом инструментальной
переменной. Коэффициенты при Ayt и Axt описывают крат-
косрочную динамику. Отметим, что если у( и xt являются
/(1), то Ayt и Axt, как и at есть /(0). М. Уиккенс и Т. Бройш
показали, что ошибки в спецификации краткосрочной дина-
мики не оказывают большого влияния на оценивание долго-
срочных параметров. Например, даже если в уравнении (13.3)
опущена Axt, оценка параметра ß будет состоятельной.

§ 2. КОИНТЕГРАЦИЯ МНОГИХ ПЕРЕМЕННЫХ

Итак, в простейших случаях стохастический тренд


в переменной устраняется путем перехода к разностям. По-
лученный стационарный ряд может быть представлен мо-
делью АРИСС, оцененной на статистических данных. Эта
идея может быть обобщена на случай множественного рег-
рессионного анализа, когда все нестационарные ряды при-
ведены к стационарному виду путем перехода к разностям
соответствующего порядка. Однако в многомерном случае
работа с нестационарными рядами не столь проста.
Определение коинтеграции. Переменные, вхо-
дящие в регрессионную модель, должны находиться в неко-
тором равновесии, что означает наличие связи между их сто-
хастическими трендами. Формальный анализ начнем с
рассмотрения множества экономических переменных в дол-
госрочном равновесии, когда

Если ввести вектора х,~ (хи, х21,..., хк1) и ß « (ß,, ß y .», ß*)'»
то в векторном виде долгосрочное равновесие можно запи-
сать как

где t =» 1,2,..., п\ п — объем выборки.

Отклонение от долгосрочного равновесия et«- x,ß назо-


вем ошибкой равновесия. Если равновесие в действитель-
299
ности существует, то ошибка равновесия должна быть ста-
ционарным процессом. Р. Энгл и К. Гренжер в общем слу-
чае дают следующее определение коинтеграции.
Говорят,1 что компоненты вектора х,= (хи, х21,..., хш) коин-
тегрированы порядка (d, b), что обозначается как xt~CJ(d,b),
если:
1) все компоненты вектора х, - интегрированные про-
цессы порядка d;
2) существует вектор ß = (ß |( ß2, ..., ßA)' такой, что линей-
ная комбинация

представляет собой интегрированный процесс порядка (d -


— Ь), где b > 0; вектор ß называется вектором, коинтеграции.
Следует сделать четыре важных замечания относитель-
но этого определения.
1. Понятие коинтеграции относится к линейной комби-
нации нестационарных переменных. Теоретически вполне
возможно, что существуют нелинейные долгосрочные соот-
ношения между множеством интегрированных переменных.
Однако современная эконометрика не располагает крите-
риями для проверки нелинейных коинтеграционных связей.
Отметим также, что вектор коинтеграции не единствен. Если
(ß,, ß2,..., ßA)' является таким вектором, то для любого отлич-
ного от нуля X вектор (X,ß,, Xß2,..., XfiJ также является векто-
ром коинтеграции. Поэтому обычно одна из переменных
используется для нормализации вектора коинтеграции пу-
тем приравнивания ее коэффициента единице. Для норма-
лизации вектора коинтеграции относительно х{ просто сле-
дует взять Х- l / ß , .
2. Все коинтегрированные переменные должны иметь
одинаковый порядок интеграции (необходимое условие). Это,
конечно, не означает, что все переменные одного порядка
интеграции являются коинтегрированными. Обычно как раз
наоборот. Отсутствие коинтеграции означает отсутствие
долгосрочного равновесия в переменных, так что они могут
уходить сколь угодно далеко одна от другой. Однако, если
переменные имеют разные порядки интеграции, то они не
могут быть коинтегрированы. Например, если xu~l{dxh
a x2~I(d2) имеют разные порядки интеграции, т.е. d^t dv то

300
из равенства ß,jcw + ß2X,( = 0 следует хи =~&хъ, что является
недопустимым, так как dx Ф dT
3, Если вектор х, имеет k компонент, то может быть k — 1
линейно независимых векторов коинтеграции. Ясно, что если
х, содержит только две переменные, то самое большее мо-
жет быть один независимый вектор коинтеграции. Число
векторов коинтеграции называется рангом коинтеграции
вектора xt.
4. В большинстве работ, посвященных проблемам коин-
теграции, рассматривается случай, когда каждая перемен-
ная имеет единственный единичный корень. Причина этого
состоит в том, что традиционный регрессионный анализ
временных рядов имеет дело с переменными /(0), /(1) и очень
редко с экономическими показателями, имеющими порядок
интеграции выше 1. Поэтому часто термин коинтеграция
употребляется в узком смысле для обозначения процессов
С 1(1,1), хотя можно себе представить множество перемен-
ных /(2), имеющих порядок коинтеграции С/(2,1), так что
существует их линейная комбинация 1(1).
К о и н т е г р а ц и я и т р е н д ы . Рассмотрим простей-
ший случай, когда вектор xt содержит только две перемен-
ные yt и zt, очищенные от циклических и сезонных колеба-
ний, т.е. x^(yt, z,), и каждую переменную можно представить
моделью случайного блуждания с аддитивной случайной
компонентой:

где \Lyl и \1г1 представляют процессы случайного блуждания


трендов переменных yt и zt соответственно в момент t, а иу1 и
иг1 — стационарные случайные отклонения.

Если иу1 и иг1 коинтегрированы С 1(1,1), то должны суще-


ствовать ненулевые значения ß, и ß2, для которых линейная
комбинация

301
является стационарной. Но для стационарности этой сум-
мы член (ßjjA^ + ß ^ , ) должен быть равен нулю. Если он не
равен нулю, то ß,#,+ $2zt также будет иметь тренд. Поскольку
второй член в скобках стационарен, необходимым и доста-
точным условием того, чтобы yi и zt были коинтегрирован-
ными процессами С/(1,1), является

Ясно, что \iyl и цг, непрерывно изменяются во времени.


Поскольку ß,?* 0 и ß25* 0, то

что означает идентичность стохастических трендов с точно-


стью до постоянного (масштабного) множителя. Таким об-
разом, можно сделать вывод: с точностью до постоянного
множителя — ß2/ß, два стохастических процесса с порядком
интеграции один /(1) должны иметь одинаковый стохасти-
ческий тренд, если они коинтегрированы с порядком С/(1,1).
П р и м е р . Рассмотрим три процесса

и все случайные компоненты uyt, иг1, uwl, e, - независимо


распределенные отклонения (белые шумы).
Каждый процесс является интегрированным первого
порядка /(1) и критерий Дикки ~ Фуллера не отверг бы
гипотезу о наличии в каждом из них единичного корня. Это
означает, что процессы расходятся во времени. Однако тренд
у показателя wt является суммой трендов в у{ и zt

302
Следовательно, вектор х,= (yt, zt, wt) имеет вектор коин-
теграции (1, 1,-1), так как линейная комбинация

является стационарной.
Этот пример иллюстрирует тот факт, что коинтеграция
имеет место тогда, когда тренд одной переменной может
быть выражен через линейную комбинацию трендов других
переменных. Элементы вектора коинтеграции должны быть
таковы, чтобы тренд был исключен из линейной комбина-
ции переменных. Такой результат может быть обобщен на
случай k переменных. Рассмотрим векторное уравнение
(13.4)
где xt - (xlt, x2l,,.., хы) — вектор значений переменных в момент /;
Ц, — (ц,, \i2l, .... цк1) — вектор стохастических трендов;
и, «- (м„'и2,, ...,ukt) — вектор случайных компонент.

Если тренд одной переменной может быть выражен в


виде линейной комбинации трендов других переменных си-
стемы, то это означает, что существует вектор-столбец ß =
(ß,, ß2, ..., ß^)', такой, что:

Умножив справа уравнение (13.4) на ß, получим

Так как \ifi - 0, то x,ß = u,ß. Следовательно, линейная


комбинация xji стационарна.
Легко сделать обобщение и на случай, когда имеется
множество линейных соотношений между трендами. Если
ранг коинтеграции г, то имеется г < к линейных соотноше-
ний между трендами и можно написать:

•Tieß ~ матрица (г х k) с элементами ß(/.


303
Например, если имеются два независимых вектора коин-
теграции для k переменных, то они могут быть представлены
как

Заметим, что если умножить вторую строку на ß,/ß2, и


вычесть ее из первой, то получим другую линейную комби-
нацию элементов вектора х,, которая будет стационарной.
Однако в этой комбинации будет только k — 1 ненулевых
коэффициентов при х.
В более общем случае, когда имеется г векторов коин-
теграции между k переменными, существует вектор коин-
теграции для каждого подмножества из (k—r) переменных.

§ 3. КОИНТЕГРАЦИЯ И МОДЕЛИ
КОРРЕКТИРОВКИ ОШИБОК

В последние годы получил распространение класс


моделей с распределенными лагами, названных моделями
корректировки ошибок (Error correction models — ЕСМ). Эти
модели основываются на том факте, что часто между двумя
переменными существует долговременное равновесное соот-
ношение. Например, между потреблением и доходом, зарп-
латой и ценами и т.п. Однако в краткосрочном плане равно-
весие может нарушаться. Отклонение от равновесия в одном
периоде, корректируется в следующем. Например, измене-
ние цены в одном периоде может зависеть от избыточного
спроса в предыдущем. Процесс корректировки ошибок та-
ким образом является средством согласования краткосроч-
ной и долгосрочной динамики изучаемого процесса. Вклад в
разработку этой темы сделали Д. Сарган [159], Д. Дэвидсон,
Д. Хендри, Ф. Срба, С. Йо [136], Р. Энгл и К. Гренжер [142].
Предположим, что долгосрочное соотношение между У(
и X, имеет вид
(13.5)

где К — константа.
304
В качестве примера Фридман сформулировал гипотезу
о постоянном доходе, в которой утверждается, что потреб-
ление У, пропорционально постоянному доходу Хг Он апп-
роксимировал постоянный доход процессом с распределен-
ными лагами. Другой пример — это гипотеза о жизненном
цикле, в которой утверждается, что в долгосрочном плане
потребление есть постоянная доля богатства. Еще один при-
мер: зарплаты и цены должны иметь примерно равные дол-
госрочные темпы роста, хотя в краткосрочном плане их тем-
пы могут различаться.
Взяв логарифмы от обеих частей уравнения (13.5), полу-
чаем

или
(13.6)

где малые буквы обозначают логарифмы.

Поскольку уы = k + x(_lt то, вычитая это равенство из


выражения (13.6), получаем
(13.7)
В общем виде краткосрочная модель с лаговой коррек-
тировкой выглядит так:

(13.8)

Теперь установим, при каких условиях краткосрочная


модель будет совпадать с долгосрочной. Для этого поло-
жим, что в установившемся состоянии yt=* у* и х,- х' для
всех t. Тогда уравнение (13.8), полагая, что в долгосрочном
плане «( = 0, принимает следующий вид:

Для того чтобы это совпадало с уравнением (13.6), дол-


жно выполняться условие

305
которое обеспечивает равенство

Обозначим 1 — а, = ßt + ß 2 =7- Тогда сс,= 1 - у и ß 2 =y-ß,.


Делая эти подстановки в (13.8), получаем

или

т.е.
(13.9)

Полученное уравнение представляет собой простейшую


модель с корректировкой ошибки. Оно связывает изменение в
одной переменной с изменениями в другой и с разрывом меж-
ду двумя переменными в предыдущем периоде. Важно отме-
тить, что уравнение содержит краткосрочную корректировку
и в то же самое время основывается на долгосрочной теории.
Член xt_t — «/,_, обеспечивает корректировку краткосрочного
отклонения от равновесия, поэтому тест относительно у есть
тест для компоненты, отражающей нарушение равновесия.
В общем виде спецификация модели с корректировкой
ошибки такая:
(13.10)

Однако эта общая формулировка не предполагает, что


у2 = —у,. На практике мы должны это проверить, поэтому
тест относительно Y i и Y2 является тестом для члена коррек*
тировки отклонения от равновесия.
Наиболее общий вариант модели с корректировкой ошиб-
ки имеет еще одно, второе уравнение, связывающее измене-
ния в xt с изменениями в у, и лаговыми значениями. Таким
образом, имеем

306
Построение модели корректировки ошибок тесно связа-
но с изучением коинтеграции переменных.
П р и м е р . Несмотря на то что модель с корректировкой
ошибки ввел Филлипс, первым применил ее Дж. Сарган [159].
Он исследовал связь между зарплатой и ценами в Велико-
британии. Им сформулировано большое число моделей, не-
которые из которых имели структуру модели с корректи-
ровкой ошибки.
В частности, на квартальных данных он оценил следую-
щую модель (ниже даны /-статистики):

гдеду, - 1п(7ш,) - логарифм индекса зарплаты;


р, — 1п(7 ',) - логарифм индекса цен;
и, — \n(Rut) — логарифм доли безработных;
D, — фиктивная переменная, равная 0 до конца 1954 г. и I —
в дальнейшем (введена для учета замораживания зар-
платы в раннем периоде).

Зависимая переменная представляет темп прироста уров-


ня зарплаты, так как

— темп прироста зарплаты


за квартал.

В качестве объясняющих переменных Дж. Сарган ис-


пользовал темп прироста цен за целый год, а не за один
квартал; переменная безработицы введена для отражения
эффекта экономического цикла, в предположении, что в пе-
риоды высокой безработицы рост зарплаты не будет боль-
шим; член (м>м - рм) - корректировка отклонения от рав-
новесия; временной тренд включен для отражения роста
зарплаты вследствие технического прогресса.
По оцененному уравнению видно, что темп прироста цен
и фактор замораживания зарплаты незначимы, но член кор-
307
ректировки ошибки значим. Когда незначимые члены были
опущены, оцененная модель приняла вид:

Значимость члена корректировки возросла. Отрицатель-


ный знак его коэффициента означает, что рост реальной зар-
платы уменьшает темп прироста зар-
платы.

§ 4. КРИТЕРИИ КОИНТЕГРАЦИИ

Поскольку тип модели зависит от ответа на воп-


рос, является ли переменная (кандидат на фигурирование
в качестве регрессанда) коинтегрированной с независимой
переменной, необходима проверка коинтегрированности двух
или большего числа переменных. Р. Энгл и К. Гренжер рас-
смотрели множество тестов на коинтегрированность. Мы рас-
смотрим два, рекомендованных ими.
П е р в ы й тест основывается на статистике Дарбина -
Уотсона DW. Процедура предполагает сначала оценку урав-
нения

и вычисление обычной статистики Дарбина - Уотсона DW.


Если yt и xt являются /(1), то можно ожидать, что и и, может
оказаться /(1). Если это так, то статистика DW будет близ-
ка к нулю и ряды yt и х, не коинтегрированы. Если же DW
значимо больше нуля, то это может означать коинтегриро-
ванность двух переменных и и,~/(0). Однако стандартные
таблицы для теста DW здесь не применимы, поскольку они
построены для проверки нулевой гипотезы, что DW - 2, а
не DW = 0. Энгл и Гренжер с помощью имитационного мо-
делирования получили критические значения, представлен-
ные в табл. 13.1 для выборки в 100 наблюдений.
308
Т а б л и ц а 13.1
Критические значения для проверки коинтегрированности,
л - 100
Уровень (-статистика расширенного
Статистика DW
значимости критерия Дикки—Фуллера

0,01 0,511 3,77


0,05 0,386 3,17
0,10 0,322 2,84

В т о р о й тест использует расширенный критерий Дик-


ки - Фуллера. Он также предполагает сначала оценку урав-
нения yt — ос + ßj^ + ut, получение ошибок

а затем оценивание регрессии Дикки — Фуллера

где р — предварительно выбранный порядок лага для остатков.


н о
Статистикой критерия является f-статистика для Y>
/•распределение не подходит. Для этого случая Р< Энгл и
К. Гренжер получили критические значения с помощью ими-
тационной процедуры. Для выборки в 100 наблюдений кри-
тические значения приведены в той же табл. 13.1.

Вопросы, рассмотренные в этой главе, имеют большое зна-


чение для правильной спецификации регрессионной модели,
содержащей несколько объясняющих переменных. Если с со-
держательной точки зрения экономиста могут удовлетворить
модели с различной структурой уравнения, то эконометрик
должен уделять внимание сбалансированности динамических
свойств статистических рядов, используемых в обеих частях
равенства, и их связанности (коинтегрированности). В случае
несбалансированности требуется то или иное предваритель-
ное преобразование данных, поиск новых переменных.
Глава 14

РЕКУРРЕНТНЫЕ АЛГОРИТМЫ
ОЦЕНКИ ТРАЕКТОРИЙ ПАРАМЕТРОВ
МНОЖЕСТВЕННОЙ РЕГРЕССИИ

Линейная регрессионная модель, или просто рег-


рессия, отражает связь между одной переменной у и несколь-
кими другими переменными х2,..., хр в виде линейного урав-
нения

(ИЛ)

где^ - номер наблюдения, t «= 1, 2, ,.., Т, Т — число наблюде-


ний или объем выборки;
ß, — параметры уравнения, регрессионные коэффициенты,
/= 1,2, ...,р;
и{ — случайное возмущение, ошибка уравнения, остаток.

В матричных обозначениях эта модель записывается как


(14.2)

где

хи=\ для всех t.


В классическом регрессионном анализе параметры рег-
рессионного уравнения считаются постоянными и их оценки
310
получают прямым вычислением по формуле метода наи-
меньших квадратов

(14.3)

Ковариационная матрица вектора оценок вычисляется


также по формуле

(14.4)

2 е'е
где* - — оценка дисперсии ошибки уравнения;

- вектор ошибок.

При оценивании используются все выборочные наблю-


дения сразу. Однако предположение о постоянстве пара-
метров уравнения в экономических исследованиях не все-
гда реалистично. В гл. 8 § 2 был предложен градиентный
алгоритм адаптации регрессионных коэффициентов. Здесь
мы рассмотрим рекуррентные методы оценивания парамет-
ров множественной регрессии.

§ 1. РЕКУРРЕНТНОЕ ОЦЕНИВАНИЕ
ПАРАМЕТРОВ РЕГРЕССИИ

Для рекуррентного подхода характерно то, что ин-


формация в виде выборочных, упорядоченных во времени зна-
чений (временных рядов) обрабатывается последовательно. На
каждом шаге рекуррентных вычислений полученные на пре-
дыдущем шаге оценки обновляются с учетом новой порции
Данных, поступивших за очередную единицу времени. Это оз-
начает, что при рекуррентных вычислениях статистическая база
оценивания расширяется вместе с продвижением модели впе-
ред по оси времени. При одинаковой статистической базе ре-
куррентные оценки эквиваленты оценке «по формуле». Досто-
инством рекуррентных вычислений является то, что в ходе их
выполнения будут получены оценки параметров для проме-
жуточных моментов. Эти оценки, отложенные на графике вме-
сте со своими доверительными интервалами и дисперсией ос-
311
татков, дают дополнительную полезную информацию для раз-
мышления относительно устойчивости (изменчивости) оценок
и наилучшего объема выборки.
Рассмотрим теоретические основания рекуррентной про-
цедуры оценивания регрессии [160, 124]. Запишем множе-
ственную линейную регрессию в векторной форме для мо-
мента t:
(14.5)

со стандартными предположениями, что


— вектор постоянных коэффициентов;
— [хи, ...,xpt\;
— независимые ошибки с нулевым математическим
ожиданием и постоянной дисперсией а2.
Оценку МНК (14.3) можно переписать в векторной фор-
ме как

(14.6)
Е*А (2>tÄ
LM <t=i

Нам необходимо построить рекуррентную процедуру


оценивания. В рекуррентном алгоритме целью является
получение оценки $, на момент t как функции от предше-
ствующей оценки ß M и значений переменных, наблюдае-
мых в момент t. Рекуррентную оценку в общем случае бу-
дем представлять в виде произведения двух рекуррентных
величин, одна из которых содержит операцию обращения:
(14.7)

где

(14.8)

(14.9)

312
Выражения (14.8) и (14.9) означают, что

(14.10)

(14.11)

Как видим, рекуррентное обновление gt не вызывает за-


труднений. Обновление же F, требует на каждом шаге об-
ращения матрицы размерности р хр. Существует более эко-
номный с вычислительной точки зрения алгоритм, в котором
удается избежать прямого обращения. Рассмотрим этот ал-
горитм подробнее.
Умножив выражение (14.10) слева на F, и справа на F M ,
получаем

(14.12)

Умножим выражение (14.12) справа на х, и соберем


члены с FjX, вместе. Затем после умножения справа на
(1+x ( F M x / )~'x ( F M и подстановки F^XfF,.., = F M - F,
из уравнения (14.12), приходим к равенству, часто называе-
мому леммой об обращении матрицы

(14.13)

Поскольку 1 + x ' , F M х, - скаляр, операция обращения не


представляет никаких сложностей, и рекуррентная процеду-
ра с вычислительной точки зрения будет иметь преимуще-
ство по сравнению с решением по формуле, где требуется
матричное обращение на каждом шаге продвижения во
времени.
Запишем алгоритм в собранном виде. Введем вектор

(14.14)

Тогда формула (14.13) переписывается как

(14.15)
313
Сравнивая равенство (14.12) с выражением (14.15), по-
лучаем

(14.16)

а из равенства (14.7) и (14.11)


(14.17)
Используя выражения (14.7), (14.15) и- подставляя фор-
мулу (14.16) в (14.17), приходим к выводу, что оценка равна:
(14.18)
Эта формула рекуррентного оценивания имеет ясную
интерпретацию. Она означает, что оценка вектора парамет-
ров в момент / равна предыдущей оценке $,_, плюс коррек-
тирующий член, являющийся произведением множителя к,
на ошибку уравнения. Рекуррентная оценка фактически
выражает существо байесовского подхода в том смысле, что
при известной априорной оценке р\_, дает возможность по-
лучить апостериорную оценку $,.
Выражения (14.13), (14.16) и (14.18) образуют рекуррен-
тный алгоритм МНК для оценивания коэффициентов ли-
нейной множественной регрессии общего вида.
Нетрудно вычислить и дисперсии ошибок рекуррентных
оценок. При прямом решении по формуле при принятых
допущениях оценке МНК соответствует ковариационная
матрица (14.4), которая в векторном виде может быть запи-
сана как

Таким образом, при выборке объема t

(14.19)

В качестве оценки s) можно использовать величину

(14.20)
314
При условии гауссовского распределения остатков по-
лученные оценки могут быть интерпретированы как оценки
максимального правдоподобия или как оценки байесовско-
го типа.
Легко также построить рекуррентный алгоритм для по-
лучения оценок обобщенным методом наименьших квадра-
тов (ОМНК). Как известно, этот метод применяется в случае
гетероскедастичности остатков, т. е, тогда, когда дисперсия
остатков не постоянна. Тогда оценка ОМНК может быть по-
лучена с помощью обычного МНК, примененного к преобра-
зованным данным. Следовательно, и для рекуррентного оце-
нивания требуются лишь переход к новым переменным и
использование только что изложенной процедуры.

§ 2. СКОЛЬЗЯЩАЯ РЕГРЕССИЯ

Одним из способов проверки постоянства пара-


метров регрессии состоит в оценке регрессии на последова-
тельно сдвигаемом во времени интервале постоянной дли-
ны и построении траекторий оценок коэффициентов вместе
с их доверительными интервалами. Такую процедуру мож-
но назвать скользящей регрессией по аналогии со скользя-
щей средней (в англоязычной литературе ее называют Rolling
regression).
Пусть, например, у нас имеется выборка достаточно
большого объема Т и определена спецификация уравнения
регрессии у на хх, ху..„ хр. Тогда процедура оценивания сколь-
зящей регрессии предполагает сначала оценку регрессии
на выборке от наблюдения 1 до т , где тп«Т. Величину т
можно назвать окном или скользящим интервалом оцени-
вания. Далее сдвигаем «окно» на одну единицу времени
вперед и вновь оцениваем регрессию на выборочном интер-
вале от наблюдения 2 до т + 1 и т.д. Полученные оценки
вместе с их доверительными границами можно отложить на
графике и изучать особенности движения параметров рег-
рессии и ширину доверительных интервалов.
Такой подход позволяет вскрыть характер движения
параметров, принять реалистичные гипотезы относительно
моментов сдвига и типа эволюции регрессионных коэффи-
циентов, произвести периодизацию изучаемого явления, а в
315
случае необходимости перейти к кусочно-линейным регрес-
сиям или сплайнам. В этой процедуре на каждой итерации
параметры регрессии могут оцениваться как константы
обычным МНК- Однако такой прием не очень эффективен с
вычислительной точки зрения, поскольку на каждой итера-
ции требуется обращение матрицы. Гораздо более эффек-
тивен рекуррентный подход [117, 124, 161]. Поскольку сколь-
зящую регрессию можно рассматривать как частный случай
взвешенной регрессии, то сейчас мы перейдем к взвешен-
ной регрессии, а затем в § 4 будет изложен рекуррентный
метод оценивания параметров взвешенной регрессии.

§ 3. ВЗВЕШЕННАЯ РЕГРЕССИЯ

В быстро изменяющейся экономике уравнения и


параметры взаимосвязи различных факторов, характерные для
прошлого периода, перестают быть адекватными в новых ус-
ловиях. На смену старым технологиям приходят новые, изме-
няются как материальные, так и финансовые потоки ресурсов
и результатов производства, происходит структурная пере-
стройка экономики и финансовых рынков, меняются законы,
уровень инфляции, степень риска, налогообложение и т.п. Та-
кие изменения, конечно же, желательно учесть в модели в яв-
ном виде, особенно, когда речь идет о прогнозировании. Одна-
ко это не всегда или не сразу возможно, поскольку новое
постепенно вырастает из старого.
Перед эконометриком встает сложная и противоречи-
вая задача отразить в регрессионной модели новейшие тен-
денции изучаемого явления, но при этом опираться на доста-
точный объем статистических данных, с тем чтобы получить
статистически значимые, оценки регрессионных коэффици-
ентов. Выходом из положения является компромисс, в соот-
ветствии с которым сохраняется старая форма регрессион-
ного уравнения с постоянными коэффициентами, но ее
несовершенство отчасти компенсируется неравноценным от-
ношением к ошибкам уравнения в начале и в конце выбо-
рочного периода: старые ошибки имеют меньший вес, а
ошибки последних моментов - больший. В этом случае оцен-
ки регрессионных коэффициентов в модели

(14.21)
316
получают минимизацией взвешенной суммы квадратов ос-
татков

(14.22)

гдем>, = веса;

Такой метод оценивания называется взвешенным, или


дисконтированным МНК. Введение критерия Q означает,
что статистическим данным, относящимся к разным момен-
там времени, приписывается различная информационная
ценность. Веса являются функцией времени. Эта функция
характеризует «память» модели. Если предполагается, что
изучаемый процесс претерпевает быстрые изменения, то и
весовая функция должна быстро убывать (затухать) при
движении от текущего момента t в прошлое.
Для того чтобы получить оценки $,, минимизирующие
взвешенную сумму квадратов остатков, нужно последова-
тельно продифференцировать (14.22) по параметрам и час-
тные производные приравнять нулю. Сделаем это, исполь-
зуя для наглядности сначала скалярные обозначения:

Отсюда получим систему линейных уравнений относи-


тельно коэффициентов ß,:

(14.23)

317
В матричных обозначениях получаем

где

Отсюда находим оценку вектора коэффициентов

(14.24)

Легко заметить, что, если положить В = W"1, то эту оценку


можно рассматривать как оценку обобщенным МНК
(ОМНК) регрессии

(14.25)

где
(14.26)

Таким образом, оценивание линейной регрессии (14.21)


по критерию (14.22) эквивалентно оцениванию регрессии с
преобразованными переменными

(14.27)

обычным МНК.
Проанализируем характер остатков и, взвешенной рег-
рессии (14.25). Если веса в матрице W уменьшаются от мо-
мента t = Т к t « 1, то дисперсия а 2 В ошибки и( в уравнении
(14.25) будет возрастать в этом направлении таким образом,
что в начальные моменты допускаются большие ошибки.
318
Вообще говоря, весовая функция может быть любой
функцией времени. Но в целях упрощения работы в каче-
стве весовой функции выбирают какую-либо известную ана-
литическую функцию .с одним параметром, удовлетворяю-
щую качественным представлениям исследователя о темпах
и характере перемен.
Двумя такими функциями могут быть арифметическая
прогрессия, генерирующая веса, лежащие на графике на
прямой линии, и убывающая в прошлое геометрическая
прогрессия, обеспечивающая экспоненциальное падение
величины весовог.о коэффициента. Могут быть, конечно, и
другие функции, например ступенчатая или логистическая.
Отметим, что особой популярностью пользуются веса,
геометрически убывающие в прошлое [161]. В этом случае
весовой коэффициент имеет вид

(14.28)

гдеО < q < 1,


а минимизируется взвешенная сумма квадратов остатков:

(14.29)

Суммы смешанных произведений переменных р системе


линейных уравнений (14.23) тоже оказываются взвешенны-
ми экспоненциально:

(14.30)

К этому интересному свойству мы еще вернемся в § 5.


Что касается выбора величины qt и вообще wt, то они
считаются здесь заданными или известными. Вопрос о вы-
боре оптимальных весов будет рассмотрен в § 4.
319
§ 4. РЕКУРРЕНТНОЕ ОЦЕНИВАНИЕ
ПАРАМЕТРОВ ВЗВЕШЕННОЙ
РЕГРЕССИИ

Альтернативой оценивания коэффициентов взве-


шенной регрессии по формуле (14.24) является рекуррент-
ное оценивание. Рекуррентное оценивание параметров взве-
шенной регрессии при известных весовых функциях сводится
к задаче рекуррентного оценивания обобщенным МНК или
применению рекуррентного алгоритма обычного МНК к пре-
образованным данным. Более подробно мы остановимся на
рекуррентном оценивании взвешенной регрессии лишь для
двух часто используемых весовых функций.
В общем виде взвешенная регрессия имеет тот же вид,
что и обычная линейная регрессия

(14.31)

но предполагается, что коэффициенты ß(-, / = 1, 2,..., р, могут


иметь некоторое движение, например, с целью компенсации
определенного упрощения взаимосвязей, приближенно вы-
ражаемых уравнением (14.31). Ожидается, что это движение
параметров можно с достаточной точностью уловить путем
минимизации взвешенной суммы квадратов регрессионных
остатков

(14.32)

Рекуррентное оценивание скользящей рег-


рессии. На практике часто используется регрессия, в ко-
торой для обновления оценок параметров в расчет всегда
принимаются только тп последних точек:

(14.33)

Этот вид регрессии, которую можно назвать скользящей


регрессией, был рассмотрен в § 2. Ее можно представить в
320
виде взвешенной регрессии и критерий Q записать как вы-
ражение (14.32) с весами

(14.34)

Таким образом, для вычисления функций потерь на каж-


дом шаге используется «окно» шириной т, передвигаемое
по оси времени, и только данные, попавшие в это «окно»,
используются для вычисления критерия Qr Остальные дан-
ные считаются невидимыми или несущественными и в рас-
чете оценок не участвуют.
Получить рекуррентный алгоритм для этой весовой фун-
кции можно в два этапа, представив продвижение «окна»
на один шаг вперед в виде двух событий. Сначала добавим
новую выборочную точку, т.е. расширим «окно» вправо, и с
помощью формул (14.11), (14.13) и (14.17) получим проме-
жуточные величины F* и ty, а. затем с помощью тех же са-
мых уравнений устраним устаревшую, ставшую несуще-
ственной точку / -* т. При этом мы лишь меняем знак «плюс»
на «минус», ах,,;»,- на х,_от, у(_тн находим F, и р\.
На основе изложенной процедуры полезно проводить ана-
лиз ошибок прогнозов, получаемых с помощью скользящей
регрессии с различной длиной скользящего отрезка (окна).
Для этого можно вычислить средний квадрат ошибок про-
гнозирования на один шаг вперед @, для различных m

(14.35)

- оценка вектора регрессионных коэффици-


ентов на временном отрезке [г — т, г - 1).
Величина т, при которой Q, достигает ми-
нимального значения, указывает на опти-
мальный объем выборки для целей прогно-
зирования с помощью регрессионной модели
данной спецификации.
321
Целесообразно также вычислять величину

(14.36)

где п — максимальная длина рассматриваемых скользящих от-


резков (ширина «окна»). Величина Q2отличается от Q,
лишь тем, что при ее вычислении принимаются во вни-
мание ошибки, полученные для одного и того же пери-
ода от г => п до Т.

Рекуррентное оценивание регрессии с гео-


метрически убывающими весами. Другой часто
используемой весовой функцией является
(14.37)
г д е О £ а £ 1 , / = 1,2, ..., t
1
Из выражения (14.32) следует, что умножение всех весо-
вых коэффициентов на одну и ту же константу не меняет зна-
чений оценок параметров, при которых Q, достигает миниму-
ма. Смысл множителя а в выражении (14.37) состоит в том,
чтобы нормализовать веса таким образом, чтобы в сумме они
давали 1 при t -> °°.
Решение по формуле для выборки объема t находится
из уравнения

(14.38)

Для построения рекуррентного алгоритма запишем оцен-


ку ß, в виде
(14.39)
где

(14.40)

и
(14.41)
322
Справедливость такого представления оценки нетрудно
показать с помощью повторных подстановок. Отметим, что
при а = 1 прошлые данные полностью игнорируются («за-
бываются») и имеют значение только текущие значения пе-
ременных, а при а = 0 начальная оценка остается неизмен-
ной, все последующие наблюдения не принимаются во
внимание.
Та же последовательность переходов, которую мы при-
меняли раньше (в § I) при выводе рекуррентного алгорит-
ма МНК, приводит в данном случае к рекуррентному алго-
ритму, состоящему из аналогичных уравнений:

(14.42)

(14.43)

(14.44)

(14.45)

Начальные оценки | L F p и g p при t *= р находят по фор-


мулам (14.7), (14.8) и (14.9) для МНК без учета весов, а далее
продолжают рекуррентные вычисления с учетом весов. Вы-
бор оптимального а может быть сделан, например, методом
проб различных значений, взятых из интервала [0, 1], и срав-
нения соответствующих сумм квадратов ошибок прогнозиро-
вания на один шаг вперед. Наилучшему а соответствует наи-
меньшая из этих сумм.
323
§ 5. ОЦЕНКА ТРАЕКТОРИЙ ПАРАМЕТРОВ
РЕГРЕССИИ МЕТОДОМ АДАПТИВНЫХ
КОВАРИАЦИЙ

Рассмотрим еще один метод последовательной


корректировки параметров линейной множественной рег-
рессии с помощью экспоненциально-взвешенных скользящих
средних, предложенный нами в [149, 150, 124]. Будем счи-
тать, что коэффициенты регрессии являются переменными
во времени, т.е.

(14.46)

Однако сначала рассмотрим оценку МНК вектора па-


раметров регрессии с постоянными коэффициентами и за-
пишем ее в несколько преобразованном виде:

(14.47)

где

Здесь для общности обозначений индекс р + 1 присвоен


эндогенной переменной у, т.е. x/ri.ilsyr Обратим внимание
на величину gtj. Ключ к практическому решению проблемы
построения адаптивной регрессии (14.46) состоит, очевидно,
в том, чтобы найти хороший способ обновления оценок сред-
324
них значений g... Другими словами, мы предлагаем выбо-
рочные средние g.. заменить на g.jt — текущие оценки ло-
кальных средних значений. Получить g можно различны-
ми способами. Например, в скользящей регрессии, т.е. в
регрессии, оцениваемой МНК. на последовательно сдвигае-
мом отрезке времени, gri фактически оцениваются как сколь-
зящие средние. Можно также отыскивать тренды смешан-
ных произведений и аппроксимировать их известными
функциями времени или какими-либо моделями. Однако,,
по-видимому, лучше заранее исключать тренд из перемен-
ных (регрессанда и регрессоров), переходя к разностям,
цепным индексам, темпам приростов и т.п. с учетом поряд-
ков интегрированности переменных.
Таким образом, в рассматриваемом методе в общем виде
задача сводится к изучению динамики средних значений
попарных произведений наблюдаемых переменных. Эти про-
изведения образуют временные ряды, которые можно от-
кладывать на графике и анализировать визуально или с
помощью математических средств. Из уравнения (14.46)
видно, что ступенчатый скачок параметра ß, непременно
найдет отражение в уровне эндогенной переменной у, а сле-
довательно, и во всех gtpH, i = 1, 2, ..., р, в которых она
участвует. Совокупность таких графиков позволяет раскрыть
структуру и динамику процесса, локализовать точки, в ко-
торых подозревается сдвиг. В целом уже на стадии анализа
многомерная задача построения множественной регрессии
разлагается на р(р + 3)/2 одномерных. Отметим, однако,
что указанный одномерный анализ нельзя проводить изо-
лированно от аналогичных параллельных задач. Все эти од-
номерные задачи должны быть согласованы, подчинены од-
ной общей конечной цели, одному критерию. Промежуточные,
частные или косвенные критерии могут уводить от цели
вследствие рассогласованности отдельных частей модели,
приводить к «раскачиванию» ее как целого.
Перейдем теперь к практическому построению адаптив-
ной регрессии. Будем полагать, что все переменные, уча-
ствующие в модели, не имеют ярко выраженного тренда,
т.е. их средний уровень подвержен лишь слабой эволюции.
Тогда предлагается в формуле (14.47) заменить арифмети-
ческие средние g!t на экспоненциально-взвешенные сколь-
зящие средние gljt. В этом случае обновление gtj будет пос-
ледовательно производиться по формуле
325
(14.48)

где а — постоянная сглаживания, величина которой находится


в интервале 0 < a < 1.

Далее по формуле (14.47) с gljt вместо g.. можно опреде-


лить текущие оценки коэффициентов ß( в момент t. Для нача-
ла вычислений по формуле рекуррентного типа (14.48) необ-
ходимо задать некое начальное значение gij0 для момента
t - 0. Его можно определить, например, как простое арифме-
тическое среднее на основе первых То членов выборки, т.е.

(14.49)

Для упрощения дела для всех пар / и / будем задавать


То и параметр сглаживания а одинаковыми. Но для того
чтобы найти их оптимальные значения, необходимо задать
критерий качества модели.
Будем считать ту модель лучшей, на основе которой на
выборочном периоде получают более точные прогнозы на
один шаг вперед. Ошибка прогноза равна:

(14.50)

ß, - оценка вектора параметров в момент t.

В задаче поиска оптимальных значений параметров со-


вокупным показателем погрешности модели будем считать
сумму квадратов ошибок прогнозов:

<?(Го,а)=£^, (14.51)

зависящую от параметров То и а. Поиск минимума суммы


квадратов ошибок можно производить итеративно. Пара-
метр То может принимать только дискретные значения в
326
ограниченном диапазоне 0 < TQ<T. Поэтому его оптималь-
ное значение легко найти перебором. При этом для каждого
значения То следует определить оптимальное значение а
путем разбиения отрезка [0, 1] на сетку значений и поиска
минимума Q(TQa) на этом множестве. Постепенно переходя
от грубой сетки к более частой, оценку а можно получить с
любой желательной точностью. Этим построение адаптив-
ной процедуры обновления регрессионных коэффициентов
завершается.
Весьма важное свойство изложенной процедуры следу-
ет из сопоставления ее с взвешенной регрессией, рассмот-
ренной нами в § 3 данной главы. Там установлено, что если
при оценивании регрессии минимизировать взвешенную
сумму квадратов ошибок с весами, геометрически убываю-
щими в прошлое, то коэффициентами при ß, в системе нор-
мальных уравнений (14.23) будут суммы экспоненциально-
взвешенных произведений регрессионных переменных,
взятых попарно, см. (14.30). Но из выражения (14.48) выте-
кает, что

(14.52)

Это означает, что, положив в (14.23) веса

(14.53)

где t - текущий момент времени, на который определяется адап-


тивная оценка, можно прийти к выводу, что в каждый
момент / оценка ß<( полученная с помощью адаптивной
регрессии, построенной на основе экспоненциально-сгла-
женных попарных произведений (ковариаций), миними-
зирует экспоненциально-взвешенную сумму квадратов
ошибок:

(14.54)

327
Таким образом, поиск оптимального значения а означает
выбор геометрически убывающих весов, наилучшим обра-
зом отражающих обесценение информации с течением вре-
мени, весов, доставляющих минимум функции потерь (14.51).
Проверку метода на примерах можно найти в [124,
с. 226-229].

§ 6. СВЯЗЬ АДАПТИВНОЙ РЕГРЕССИИ С


АДАПТИВНЫМ КОРРЕЛЯЦИОННЫМ АНАЛИЗОМ

Связь коэффициентов адаптивной регрессии с


адаптивными коэффициентами корреляции будем исследо-
вать в предположении, что уравнение ^регрессии записано
для первых разностей переменных

(14.55)

В соответствии с алгоритмом адаптивной регрессии те-


кущая оценка вектора параметров равна:

где

328
Формула (14.56) означает, что оценка $ ( является реше-
нием системы линейных уравнений

(14.57)

Для того чтобы установить связь оценок регрессионных


параметров ß., с адаптивными коэффициентами корреля-
ции (см. гл. 9), перепишем систему (14.57) в преобразован-
ном виде

Sij,i
Величины "1 являются адаптивными коэффициента-
миa
ij,i
i
ми корреляции rtj((a), которые мы будем обозначать просто
как rijt. Поэтому систему (14.58) можно переписать как

(14.59)

329
Система (14.59) выражает связь адаптивных регрессион-
ных коэффициентов с адаптивными корреляционными коэф-
фициентами.
Отметим, что в системе (14.59) подразумевается, что и в
регрессионном, и в корреляционном анализе используется
одно и то же значение а, выбираемое таким образом, чтобы
наилучшим образом согласовать оценивание адаптивных
коэффициентов корреляции для различныххпар переменных
с главной целью адаптивных вычислений — достижения наи-
высшей точности ретроспективных прогнозов, измеряемой
критерием Q(T0,a), представленным формулой (14.51).

§ 7. МОДЕЛИ С АВТОРЕГРЕССИОННОЙ
УСЛОВНОЙ ГЕТЕРОСКЕДАСТИЧНОСТЬЮ

В эконометрическом моделировании неопреде-


ленность взаимосвязей переменных отражается дисперси-
ей остаточного члена регрессии и{. Признавая важность
этого показателя, его влияние на те или иные экономичес-
кие переменные, эконометриками предлагается исследовать
его движение во времени с помощью авторегрессионных
моделей.
Модель ARCH
Простейшей моделью является модель с авторегрессион-
ной условной гетероскедастичностью (AutoRegressive Conditio-
nal Heteroscedasticity - ARCH), предложенная Р. Энглом [141].
В этой модели безусловная дисперсия М(и*) =» vär(u) яв-
ляется постоянной, а условная дисперсия Af(«*|l M ). где
1,_/~ совокупностью информации, известной на момент t—U
включающей значения х, и лаговые значения у, и *,, Tie.
1/_, = (Х(, х,_ , уы, у12,,..), изменяется во времени.
Обозначая условную дисперсию через Щ, в простейшем
случае модель ARCH можно записать как

где а, >0.
330
Последнее уравнение означает следующее: если ошибка
в предыдущий момент была большой, то и дисперсия теку-
щей ошибки будет увеличенной. Если же а, = 0, то это озна-
чает, что эффекта ARCH не наблюдается, дисперсия посто-
янна, т.е. имеет место гомоскедастичность и можно применять
обычные методы оценивания (МНК). При ос,* 0 для оценива-
ния модели используются более сложные методы максималь-
ного правдоподобия.
Проверка нулевой гипотезы Но: а, = 0 выполняется с по-
мощью оценивания МНК первого уравнения, получения ос-
татков йД оценивания регрессии квадратов остатков uf на
ЙД, (с постоянным членом) и проверки значимости коэффи-
циента при йД,.
Если гипотеза о гетероскедастичности принимается, то
полученные оценки ht применяются для новой оценки пер-
вого уравнения модели уже с учетом характера гетероске-
дастичности. Далее этот процесс может быть повторен ите-
ративным образом до достижения сходимости. Проблемы
могут возникнуть, если оценка а, меньше нуля или больше
единицы.
Отметим, что эффекты ARCH обнаружены у курсов ак-
ций и у других активов, с которыми производят спекуля-
тивные операции. Читатель легко может вспомнить, что после
резких сдвигов в курсе валюты разница между курсом про-
дажи и курсом покупки сразу увеличивается, так как возра-
стает неопределенность относительно дальнейшего его дви-
жения: то ли он вернется к прежнему уровню, то ли продолжит
движение в том же направлении. Это говорит о воздействии
дисперсии колебаний случайной компоненты на уровень кур-
са. Эффекты ARCH признаны полезными в моделях инфля-
ции, когда последовательности больших и малых ошибок
прогнозирования образуют кластеры. Все это объясняется
краткосрочным ажиотажным спросом, возникающим при оче-
редном повышении цен и ожиданиях их дальнейшего роста.
Уточненная дисперсия остаточного члена позволяет гиб-
ко строить доверительные интервалы для будущих значе-
ний эндогенной переменной, т. е. для ум.
Модель Энгла была расширена до включения большего
числа лагов остаточного члена. В этом более общем случае
спецификация модели ARCH имеет вид
331
(14.60)

(14.61)

гдех, = (xu,x2l,...,xkl) — вектор-строка значений экзогенных пе-


ременных в момент t;
ß = (ß,, ß2, ..., ßA)' - вектор-столбец коэффициентов при эк-
зогенных переменных;
1,_,— совокупность информации, известной на момент / - 1 ,
включающая значения х/ и лаговые значения yt и х,, т.е.

где/i^ — дисперсия ир условная по 1 М .

Безусловная дисперсия и1 постоянна и равна:

Модель GARCH
Модель GARCH(p,<7) - обобщенная модель ARCH
(generalized ARCH), введенная Т. Болерслевым [135] явля-
ется особым случаем модели ARCH{p,q), в уравнении кото-
рой есть авторегрессия и скользящая средняя

(14.62)

(14.63)

332
Модель GARCH-M
Обобщенная модель ARCH в среднем значении (по-анг-
лийски называется GARCH-in-mean, кратко она обозна-
чается как GARCH (p,q) — М) имеет следующую специфи-
кацию:

(14.64)

где h] = var(aJlM)определена в уравнении (14.62).

Таким образом, среднее значение зависимой перемен-


ной у(в момент t зависит от условной дисперсии остаточно-
го члена и{, представляемой, в свою очередь, моделью ARCH.
Необходимое условие ковариационной стационарности
(14.64) состоит в том, чтобы

(14.65)

В дополнение к ограничениям (14.63) и (14.65) Т. Болерс-


лев предполагает также, что сс,£ 0, i •» 1,2,..., q и ф.£ 0, / = 1,
2, ... , р. Этих дополнительных ограничений достаточно для
того, чтобы условная дисперсия была положительной, но они
не являются необходимыми.

Модель AGARCH

Модель GARCH(p,<7). B которой условная стандартная


ошибка ut в (14.60) определяется как

(14.66)

называется абсолютной GARCH и обозначается AGARCH(p,<7).


Она также содержит авторегрессионную часть порядка р и
скользящую среднюю порядка ц.
333
Модель AGARCH-M
AGARCH-M - это модель AGARCH в среднем значении
(AGARCH-in-mean) — специфицируется уравнениями (14.64)
и (14.66).

Модель EGARCH
EGARCH - это экспоненциальная модель GARCH(p,<7),
в которой логарифм условной дисперсии ошибки уравнения
(14.60) имеет следующую спецификацию:

(14.67)

Значение ц зависит от функции плотности вероятностей,


которая, по предположению, описывает стандартизованные

возмущения £/=-*•• Эта модель, разработанная Д. Нельсо-


ном [154], допускает асимметричные воздействия прошлых
ошибок на условные дисперсии ошибок.

Модель EGARCH-M

Г Р Г Э л Т о г т Д е ? Ь BQA*CH(P><!) в среднем значении


m m e a n ) с п е ц и и ц и
(14 64) n 4 f i ^ ' * Р У е м а я Уравнениями

Оценивание моделей семейства ARCH


Параметры моделей семейства ARCH получают мето-
дом максимального правдоподобия, применяя приближен-
ные итеративные методы, например алгоритм Ньютона -
Нафсона, использующего численные оценки производных.
Сходимость обычно зависит от характера условной гетеро-
скедастичности в данных и от выбора начальных оценок
параметров.

Тесты на наличие эффектов ARCH или GARCH


Самый простой способ обнаружения эффектов ARCH(p)
состоит в использовании процедуры множителей Лагран-
жа, предложенной Р. Э.нглом [141]. Процедура предполага-
ет два шага. На первом шаге получают остатки ui после
применения обычного МНК для оценивания регрессии у, на •
х/( а на втором — оценивается регрессия квадратов остатков
Щ на константу и р лаговых значений квадратов остатков

для t ~ р + 1, р + 2, ... , п. Далее проверяется статисти-


ческая значимость коэффициентов, т.е. нулевая гипотеза Но:
а, - ... - ар - 0.

В этой главе представлены методы рекуррентного оце-


нивания параметров линейной множественной регрессии.
Данный подход позволяет получить важную дополнитель-
ную информацию об устойчивости параметров, оценить тра-
ектории движения коэффициентов. На основе такого рода
информации могут быть выдвинуты более адекватные гипо-
тезы о структуре регрессионного уравнения или добавлены
уравнения, отражающие динамику коэффициентов, а так-
же определены моменты скачков в значениях коэффициен-
тов, что позволит весь выборочный период разделить на
отдельные подпериоды относительно однородного поведения
исследуемого временного ряда.
Критерий качества, использовавшийся здесь, предпола-
гает минимизацию суммы квадратов ошибок прогнозирова-
ния на один шаг вперед. И этот критерий, по нашему мне-
нию, обладает преимуществом по сравнению с коэффициентом
2
Детерминации R , который не является операциональным в
335
том смысле, что он не имеет максимума и может только воз-
растать при увеличении числа регрессоров. Так, в одном ис-
следовании [151] в результате статистического анализа нами
были получены три модели практически одинакового каче-
ства, если судить по обычным статистическим критериям. И
только с применением критерия, построенного на анализе
ошибок ретроспективных прогнозов на один шаг вперед, по-
лученных рекуррентным способом с использованием адап-
тивной регрессии, сразу удалось выявить достоинства одной
из моделей.
Авторегрессионные модели семейства ARCH, предпола-
гающие условную (локальную) изменчивость дисперсии ос-
таточного члена регрессии, позволяют на каждом шаге об-
новлять оценку этой дисперсии и более гибко строить
точечные и интервальные оценки прогнозов.
Глава 15

КРАТКОСРОЧНОЕ ПРОГНОЗИРОВАНИЕ
КУРСОВ ВАЛЮТ С ПОМОЩЬЮ
СТАТИСТИЧЕСКИХ МОДЕЛЕЙ

Повышение эффективности краткосрочных опе-


раций с валютой — одна из важных задач в деятельности
банков и других инвесторов. Ежедневно (а иногда и несколь-
ко раз в день) банки продают и покупают различные валю-
ты в значительных объемах, стремясь придать движение
имеющимся в наличии свободным валютным резервам с
целью избежать потерь от конъюнктурных колебаний кур-
сов и получить дополнительную прибыль. Причем валют-
ные операции осуществляются с большой скоростью путем
Договоренности представителей банков с помощью совре-
менных средств связи, и очень важно выйти на валютный
рынок с предложениями раньше конкурентов. Все это, по
сути дела, составная часть непрерывного процесса форми-
рования оптимальной структуры валютных резервов.
Эффективность валютных операций существенным об-
разом зависит от надежности прогнозов колебания курсов
валют. Именно поэтому краткосрочное прогнозирование
курсов имеет большое практическое значение для опера-
тивной деятельности банков и прочих инвесторов, а воп-
рос о возможности применения статистических методов для
этой цели представляется актуальным и естественным.
Проблема краткосрочного прогнозирования курсов валют
с применением статистических моделей будет рассмотре-
на здесь исходя из того, что для успешного ведения валют-
ных операций требуется получение прогнозов на одни сут-
ки вперед.
337
§ 1. ПОСТАНОВКА ПРОБЛЕМЫ

Информация о динамике курсов национальных


валют создает впечатление хаотического движения: паде-
ние и рост курсов сменяют друг друга в каком-то случай-
ном порядке. Даже если за большой интервал времени от-
мечается тенденция, например, к росту, то на графике легко
можно увидеть, что эта тенденция прокладывает себе путь
через сложные движения временного ряда курса валюты.
Направление ряда все время меняется под воздействием
нерегулярных и часто неизвестных сил. Исследуемый объект
в полной мере подвержен воздействию стихии мирового
рынка, и точной информации о будущем движении курса
нет. Необходимо сделать прогноз. При этом совершенно оче-
видно, что прогнозировать даже знак прироста курса очень
сложно. Делать это обычно поручают экспертам, которые
анализируют текущую конъюнктуру, а также пытаются
выделить факторы, регулярным образом связанные с дви-
жением курса (фундаментальный анализ). При построении
формальных моделей также пытаются выделить круг суще-
ственных факторов и на их основе сконструировать какой-
либо индикатор или предиктор.
Насколько нам известно, ни эксперты-практики, ни фор-
мальные методы не дают пока устойчивых хороших резуль-
татов. Полагаем, объясняется это прежде всего тем, что если
и есть действительно какой-либо круг факторов, влияющих
стабильным образом на курс, то их воздействие надежно
скрыто наложенной случайной составляющей, да й управ-
ляющими воздействиями центральных банков. В результа-
те эти факторы и их влияние выделить довольно трудно.
Мы склоняемся к тому, чтобы считать краткосрочное
прогнозирование курса по существу задачей прогнозирова-
ния последовательного движения изолированного времен-
ного ряда, причиной которого является главнцм образом
массовое поведение на валютном рынке мелких дельцов и
крупных финансовых воротил, совершающих основной объем
финансовых операций с валютой. Такой подход можно отне-
сти к так называемому техническому анализу.
Конечно, отдельно взятый участник валютной игры во-
лен совершенно произвольно менять свою стратегию. И все
же можно предположить, что поведение всей массы участ-
338
ников через соотношение спроса и предложения, влияющее
на курс валюты, обладает в текущий период времени ка-
кой-то определенной доминирующей логикой, обнаружива-
ющейся через закон больших чисел. Например, при паде-
нии курса валюты ее могут скупать, ожидая в дальнейшем
повышения курса. И такой массовый спрос валюты дей-
ствительно ведет к росту ее курса. Или наоборот, если пос-
ле падения курса валюты доверие к ней падает и ожидает-
ся ее дальнейшее обесценение, то преобладает массовое
предложение и курс падает еще ниже.
Заметим, что при таком упрощенном подходе саму ди-
намику временного ряда можно прочитать как хронологи-
ческую запись о массовом поведении участников валютного
рынка. Это дает возможность при построении модели исхо-
дить из самого ряда, не привлекая дополнительной инфор-
мации, а все рассуждения о массовом поведении участников
рынка использовать лишь для качественной интерпретации.
Если бы удалось найти в динамике ряда хотя бы крат-
косрочные закономерности, реализующиеся с вероятностью
более 50%, то это дало бы основания рассчитывать на ус-
пех. Тогда для прогнозирования курсов стало бы возмож-
ным применение статистических методов, улавливающих
более или менее устойчивые отношения последовательных
событий временного ряда.
В данном случае мы ставим перед собой следующую зада-
чу. Во-первых, выяснить применимость для краткосрочного
прогнозирования валютных курсов каких-либо статистичес-
ких методов, назначение которых — описывать повторяющие-
ся события или ситуации, характеризующиеся относительно
устойчивыми связями. Во-вторых, если статистические мето-
ды применимы для решения поставленной задачи, то устано-
вить их наиболее перспективный класс, указать характерные
особенности этих методов, особое внимание уделить простей-
шим из них. В-третьих, показать на примере практические
результаты хотя бы некоторых попыток.
Отметим, что вопросам прогнозирования курсов валют
всегда уделялось большое внимание. Из публикаций на близ-
кую тему укажем, например, работу К. Гренжера и О. Мор-
генштерна (Granger Clive W.J., Morgenstern Oscar.
Predictability of stock market prices. Massachusetts, 1970), в
339
которой исследуется динамика курсов акций и приведена об-
ширная библиография. В этой монографии фактически сде-
лан вывод о том, что если и есть какая-либо корреляция в
рядах подобного рода, то наиболее вероятно, что она имеется
между смежными приростами курсов. В дальнейшем появи-
лись модели класса ARCH, GARCH и др. (см. гл. 14, § 7), по-
зволяющие учитывать волатильность.
Однако возникает вопрос, не пытаемся ли мы прогнози-
ровать совершенно случайные колебания курсов валют. Для
ответа на этот вопрос в [126] проведено специальное иссле-
дование.

§ 2. АНАЛИЗ СЛУЧАЙНОСТИ
ДВИЖЕНИЯ КУРСОВ ВАЛЮТ

Объектом исследования являлся временной ряд


последовательных ежедневных данных (наблюдений) о кур-
се той или иной валюты по отношению к американскому
доллару, который будем записывать как xvxv...,xN, где N -
длина ряда, точнее длина исследуемого отрезка ряда. За-
дача состояла в том, чтобы выявить наличие более или ме-
нее устойчивой зависимости i-ro наблюдения от предшеству-
ющих и на этом основании сделать прогноз на (ЛЖ)-й момент.
В качестве статистической базы исследования взяты данные
о курсах пяти валют: британского фунта стерлингов, запад-
ногерманской марки, японской иены, французского и швей-
царского франков. Длина каждого временного ряда была
произвольно принята равной 150 ежедневным наблюдениям
за период с 31 декабря 1982 г. по 29 июля 1983 г. Таким
образом, ряды взяты достаточно протяженными для того,
чтобы можно было сделать более или менее основательные
выводы.
Прежде чем приступать к изучению механизма связи
между последовательными значениями курса валюты, была
предпринята попытка выяснить, не являются ли исходные
ряды абсолютно случайными, представляющими так назы-
ваемый белый шум, в котором отсутствует зависимость меж-
ду значениями ряда, относящимися к различным моментам,
и направление движения которого в будущем равновероят-
но, т.е. непредсказуемо. Для этого отобранные ряды испы-
340
таны с помощью критериев случайности и в результате по-
лучено первое представление об исходном материале.
В качестве критериев случайности использовались: кри-
терий поворотных точек, критерий распределения длины
фазы, критерий, основанный на знаках разностей, и крите-
рий, основанный на ранговой корреляции. Подробнее об этих
критериях см., например, [120].
К р и т е р и й п о в о р о т н ы х т о ч е к состоит в подсче-
те числа пиков и впадин. Пиком называется наблюдение,
величиной более двух соседних; впадина, наоборот, — значе-
ние, которое меньше двух соседних. Оба эти значения назы-
ваются поворотными точками. Число поворотных точек в
исследуемом ряде сравнивается с их числом в совершенно
случайном ряде и на этом основании делается вывод, слу-
чаен ряд или нет. Проверка показала, что для всех рас-
сматриваемых рядов наблюдаемое число поворотных точек
существенно меньше, чем это следует теоретически для слу-
чайного ряда. Другими словами, данный критерий свиде-
тельствует о том, что эти ряды не совсем случайны: в них
может быть скрыта некоторая закономерность движения
вперед.
Критерий распределения длины фазы
предназначен для изучения распределения интервалов меж-
ду соседними поворотными точками, называемых фазами.
Расчеты обнаружили заметные отличия теоретического рас-
пределения длины фазы у случайного ряда от тех, которы-
ми обладают временные ряды валютных курсов. Для всех
выбранных рядов характерно меньшее число коротких фаз
и большее число более длинных фаз, чем для случайного
ряда, а также меньшее общее число фаз, т. е. фазы движе-
ния курсов валют оказываются в среднем более продолжи-
тельными, и их смена происходит реже, чем у чисто случай-
ного ряда. Это наводит на мысль, что, несмотря на большую
колеблемость, движение валютных курсов генерируется
каким-то инерционном механизмом, познание которого мог-
ло бы послужить известной базой для получения полезных
прогнозов.
К р и т е р и й , о с н о в а н н ы й на з н а к а х р а з н о с -
т е й , состоит в подсчете числа положительных разностей
первого порядка, иначе говоря, числа точек возрастания.
В основном этот критерий используется для проверки нали-
341
чия линейного тренда. Здесь можно отметить некоторый
разброс наблюдаемого числа точек возрастания относительно
их теоретического числа. Так, швейцарский франк и британ-
ский фунт имеют число точек возрастания меньше теорети-
ческого, а остальные валюты — больше. Однако весь заме-
ченный разброс, хотя и на пределе, укладывается в 99%-ный
доверительный интервал. Это свидетельствует об отсутствии
четко выраженного устойчивого линейного тренда, но одно-
временно величина разброса дает основания предположить
наличие относительно долгосрочных «кренов» в ту или иную
сторону, что может быть полезным при прогнозировании.
К р и т е р и и , о с н о в а н н ы е на р а н г о в о й к о р -
р е л я ц и и , усиливают подозрение о наличии линейных трен-
дов у четырех из пяти валют за исключением фунта стер-
лингов. Для британского фунта коэффициент т Кендэла
близок к нулю, а для остальных валют положителен и су-
щественно отличен от нуля.
В целом проведенное изучение рядов валютных курсов
показало, что, несмотря на сильную колеблемость ежеднев-
ных данных, они не являются совершенно случайными. В
них проявляется некоторая инерционность движения, и это
позволяет надеяться на применимость статистических ме-
тодов для прогнозирования курсов. В то же время их иссле-
дованные характеристики не очень сильно отличаются от
тех, которые теоретически выведены для совершенно слу-
чайного ряда. Вследствие этого нельзя ожидать от статис-
тических прогнозов большой степени осуществимости. Од-
нако в совокупности за достаточно протяженный отрезок
времени они, по-видимому, могут оказаться полезными.

§ 3. АДАПТИВНАЯ МОДЕЛЬ
ПРОГНОЗИРОВАНИЯ ВРЕМЕННОГО РЯДА
С НЕУСТОЙЧИВЫМ ХАРАКТЕРОМ КОЛЕБАНИЙ

Исходя из того, что средний уровень ряда под-


вержен дрейфу, а флуктуациям относительно него присуща
сильная изменчивость, при построении прогнозной модели
выбор был сделан в пользу класса адаптивных моделей.
Модель такого типа всегда находится в движении, впиты-
вает новую информацию и на основе ошибки прогноза на
342
предыдущем шаге корректирует свои параметры, подстра-
иваясь к механизму, генерирующему временной ряд (под-
робнее см. гл. 1).
Нам необходим прогноз курса валюты на следующий
день. Конечно, желательно знать и направление изменения
курса за день и его величину. Однако для получения поло-
жительного эффекта от валютных операций практически
достаточно предвидеть знак приращения курса валюты, т.е."
определить движение курса вверх или вниз. В связи с этим
для упрощения задачи сделаем некоторые преобразования
исходных рядов. Во-первых, от данных'*,, # 2 ,..., xN перейдем
к (ЛМ)-м первым разностям этого ряда Axv ..., AxN_v где
Д*,= хм ~ xv i •= 1,2,..., N— 1. Затем сделаем замену разно-
стей на k( по следующему правилу:

Ряд Ä,£2,...,£W_,, состоящий из единиц и нулей, будем для


краткости называть знаковым рядом. Разумеется, упроще-
ние, достигнутое переходом от исходного временного ряда к
знаковому, сопряжено с потерей части информации. По зна-
ковому ряду, например, ничего нельзя сказать об амплитуде
колебаний исходного ряда. Однако несомненно, что в знако-
вом ряде основная информация о характере и последова-
тельности изменений курса валюты сохраняется, причем в
самом рафинированном виде, а исключается информация,
имеющая для нас второстепенное значение. Одним из след-
ствий такого преобразования исходной статистической базы
является то, что довольно-таки сложный вопрос о наличии
тренда и его использовании при прогнозировании в этом слу-
чае переходит в другую плоскость и сводится к изучению
закономерности чередования или сохранения знаков. Знако-
вый ряд, очевидно, более адекватен поставленной задаче.
Итак, имеется ряд, характеризующий динамику валют-
ного курса, состоящий из - 1 , 0 и +1. Требуется определить,
каким будет следующее значение этого ряда. Для прогно-
зирования временного ряда обычно строится модель, отра-
жающая свойства генерирующего его механизма. В основу
343
прогнозной модели в данном случае положим гипотезу об
инерционности действий основной массы участников валют-
ной игры. Разумеется, мы не рассматриваем периоды нару-
шения обычной жизни валютного рынка внезапными круп-
ными чрезвычайными событиями.
В сущности, могут быть лишь три ситуации. П е р в а я ,
когда основной массой участников валютного рынка ожи-
дается неизменное движение курса, и их совместные дей-
ствия через спрос и предложение способствуют сохранению
знака прироста курса. В т о р а я , когда большинством иг-
роков предполагается изменение направления движения кур-
са и массовый характер валютных операций в предвидении
этого действительно вызывают перемену.знака прироста кур-
са. Т р е т ь я , когда не ожидается ни роста, ни падения, и
индифферентность к валюте оставляет ее курс в неопреде-
ленном состоянии. Направление ее движения в будущем аб-
солютно случайно. О нем заранее ничего нельзя сказать.
Модель должна уловить, какая именно из трех ситуаций
превалирует в последнее время, и исходя из гипотезы, что
она сохранится по крайней мере в течение еще одной едини-
цы времени, дать прогноз на следующий момент.
Построение модели начнем с рассмотрения произведе-
ния 7/1,= £,£,-г Легко заметить, что

Первое равенство в этом выражении соответствует со-


хранению тенденции движения курса при переходе от одно-
го момента к другому, третье - смене тенденций, т.е. в этом
случае речь идет о поворотной точке, а второе — неопреде-
ленной ситуации.
Заметим, что т , описывает движение курса лишь на еди-
ничном интервале от точки i—l к точке L Для того чтобы
выяснить, какая же ситуация чаще встречается в после-
днее время, целесообразно каким-то образом усреднить ряд
т1 за известный интервал. Для этого применим метод экс-
поненциального сглаживания.
344
Экспоненциальное сглаживание ряда т. осуществляет-
ся по рекуррентной формуле

(15.1)

где5/ — значение экспоненциальной средней в момент t;


ос — постоянная сглаживания (параметр адаптации), 0 < ее ^ 1,
ß - 1 - а.

Свойства экспоненциальной средней подробно рассмот-


рены в гл. 1.
Выражение (15.1) можно переписать как

(15.2)

Здесь S M можно рассматривать как прогноз на один


шаг вперед, т.е. как прогноз величины mt, сделанный в мо-'
мент *—1, тогда величина {mt— S M ) есть погрешность это.го
прогноза, а новый прогноз St получается в результате кор-
ректировки предыдущего прогноза с учетом его ошибки. В
этом и состоит адаптация прогнозной модели. Наилучшее
значение а легко устанавливается методом проб и поиска
минимума потерь или максимума выигрыша.
Приняв во внимание, что

Нет
рудно убедиться в том, что S ( есть не что иное, как адап-
тивный коэффициент корреляции, рассмотренный в гл. 9.
Ясно, что значение 5,, являющееся результатом усред-
нения единиц и нулей, будет дробным числом из интервала
Ы , 1], поэтому прогноз т на момент Я-1 будем определять
так:
345
Положительный знак tfiM означает сохранение того зна-
ка прироста, который имел место в момент t, а отрицатель-
ный - перемену. Прогноз знака прироста курса валюты на
момент Н-1 определим как

Обратим внимание на то, что эта модель способна в раз-


личное время отражать то положительную, то отрицатель-
ную корреляцию соседних приростов- Она время от време-
ни, приспосабливаясь к наблюдениям, как бы меняет свои
свойства на противоположные. Перейдем теперь к практи-
ческим испытаниям этой модели.

§ 4. ПРОГНОЗИРОВАНИЕ КУРСОВ ВАЛЮТ

Прежде всего нужно выбрать критерии, по кото-


рым будем судить о полезности работы прогнозной модели.
Критерии оценки результатов испытаний.
Нас, разумеется, будет интересовать не только точность про-
гнозов, но и получаемый от них удельный экономический эф-
фект. Поэтому при расчете критериев условно будем считать,
что объем операций с данной валютой (т.е. объем ее покупки
или продажи) равен 1 дол. США в день. Если прогноз оказал-
ся правильным, то выигрыш равен разности Ц+,—*J. а е с л и
прогноз ошибочен, то \хм-х\ будет уже размером ущерба.
Учитывая, что исследуемому статистическому материа-
лу присущи сильные стохастические колебания, в основе
критериев оценки результатов положим средний (на базо-
вом периоде) выигрыш (или проигрыш) от операций с ва-
лютой за единицу времени (т.е. за день) в расчете на один
доллар или совокупный выигрыш за определенный период
функционирования модели. Кроме того, целесообразно рас-
считывать и некоторые другие абсолютные и относительные
показатели. Вот перечень критериев, которые мы использу-
ем в наших экспериментах:
346
L — число оправдавшихся прогнозов знака прироста кур-
са валюты, т.е. число выигрышей;
М — число ошибочных прогнозов знака прироста, т.е.
число проигрышей;
PL = [L/(L + Л1)]100% - процент оправдавшихся про-
гнозов знака прироста;
РМ = [M/(L + М)]Ю0% - процент ошибочных прогнозов
знака прироста;
SPR - сумма выигрышей (т.е. суммируются только вы-
игрыши) в валютных операциях за весь исследуемый пери-
од функционирования прогнозной модели, который будем
обозначать через Т (измеряется в национальной валюте);
SLOS — сумма потерь в валютных операциях за период
Т (в национальной валюте);
SPR-SLOS - сальдо, сумма чистого выигрыша (в наци-
ональной валюте);
R=SPR/SLOS - отношение суммы выигрышей к сумме
потерь;
REL=SPR/(SPR + SLOS)100% - процент реализован-
ных возможностей (SPR + SLOS - максимально возмож-
ный выигрыш).
Э к с п е р и м е н т № 1. Проведем испытание изложен-
ной выше адаптивной модели. Всего имеется 150 точек ряда.
Адаптируем нашу модель, например, на первых 20 точках,
которые принимаем за статистическую базу модели. Число
20 выбрано, строго говоря, произвольно; основные сообра-
жения, которыми мы руководствовались, состоят в том, что
за 20 шагов влияние на прогноз начального значения прак-
тически исчезает. Сделаем прогноз 21-й точки. Затем сдви-
нем базу на один шаг вперед и прогоним модель от точки 2
До точки 21 и сделаем прогноз 22-й точки и т.д. Всего полу-
чим 130 прогнозов. Однако прежде чем получать прогноз,
будем на каждой статистической базе из 20 точек методом
перебора определять наилучшее для данного этапа значе-
ние а (из 10 значений от 0,1 до 1,0 с интервалом 0,1). Ре-
зультаты приведены в табл. 15.1, из которой видим, что по
четырем валютам (британский фунт, западногерманская
марка, японская иена, швейцарский франк) получена при-
быль, причем процент реализованных возможностей замет-
но превышает 50%. Операции с французским франком при-
вели к некоторым потерям. Несколько слов нужно сказать о
347
показателе среднего выигрыша за день. Он, как правило,
представлен очень малым числом. Однако если речь идет
не об одной операции в 1 дол., а об операциях на крупную
сумму в течение большого числа дней, то суммарный выиг-
рыш достигнет значительной величины.
Сделаем теперь оценку результатов валютных операций
в пересчете на годовую норму прибыли. Для этого отнесем
средний выигрыш за день к среднемууровню курса данной
валюты за исследуемый период (т.е. к среднему значению
130 последних точек) и получим относительную прибыль г
за один день. Будем считать, что в году 260 рабочих дней
(имеются в виду рабочие дни банков). Тогда за год норма
260
прибыли составит [(1 + г) - 1] • 100%. Результаты расче-
тов по этой формуле приведены в табл. 15.2. Как видим, по
всем валютам, кроме французского франка, получены вполне
положительные итоги. По французскому франку понесены
относительно небольшие убытки.
Хотелось бы также оценить, насколько устойчив поло-
жительный результат в отдельно взятой валютной опера-
ции, велика ли зависимость от выпадения благоприятного
случая. Для измерения относительной устойчивости возьмем
математическое ожидание выигрыша и стандартное откло-
нение от него. Исходя из предположения, что результаты
подчиняются нормальному закону распределения, вычис-
лим площадь под кривой распределения, находящуюся в
области отрицательного аргумента (т.е. определим вероят-
ность проигрыша). Эту площадь обозначим через F. Нахо-
дить ее будем приближенно по известным таблицам, а вы-
ражать в процентах. Отметим, что показатель PERDAY
является оценкой математического ожидания выигрыша, а
аргументом для определения F по таблицам нормального
распределения будет отношение PERDAY/a, где а - стан-
дартное отклонение выигрыша от его математического ожи-
дания. Значения F также приведены в табл. 16.2, и они сви-
детельствуют о том, что в каждой конкретной валютной
операции вероятность проигрыша весьма велика.
Э к с п е р и м е н т № 2. Теперь получим прогноз по наи-
вным моделям. Будем различать два типа так называемых
наивных моделей. Согласно модели первого типа все время
предполагается, что прирост курса в следующий момент
будет таким же по знаку, что и в текущий момент. В модели
348
Таблица 15.1
Прогнозирование курсов валют по адаптивной и наивной моделям
(результаты экспериментов № 1 и 2)
Британский Западногерманская Французский Швейцарский
Японская иена
фунт марка франк франк
Критерии
Адашив~ Адапгяв- Адаптив- Адаптив- Адаптив-
Наивна* Наивная Наивная Наивная Наивная
ная яах нах ная ная

L, число выигрышен 70 63 73 71 65 65 63 76 71 69
М, число 60 67 56 57 63 61 65 50 57 57
проигрышей
PL, */% выигрышей 53,85 48,46 56,59 55,47 50,78 51,59 49,22 60,32 55,47 54,76
РМ, % проигрышей 46,15 51,54 43,41 44,53 49,22 48,41 50,78 39,68 44,53 45,24
•SPÄ, сумма 0,52 0,46 0,72 0,71 72,47 77,02 2,32 0,77 0,67 2,88
выигрышей
SLOS, сумма 0,43 0,49 0,53 0,54 52,89 48,34 2,38 0,39 0,48 1,82
проигрышей

SPR-SLOS, сальдо 0,09 -0,03 0,19 0,17 19,58 28,68 -0,06 0,38 0,19 1,06
R=SPR/SLOS 1,22 0,95 1,37 1,32 1,37 1,59 0,97 1,96 1,39 1,59

PERDAY,cpcMBB& 0,737 -0,197 1,501 1,321 150,615 220,615 -0,498 2,888 1,464 8,197
выигрыш за день
на 1 дол. X10*

REL, % реализован- 55,02 48,66 57,83 56,89 57,81 61,44 49,31 66,25 58,24 61,33
СО
ных возможностей
ел Таблица 15.2
О
Оценки нормы прибыли операции с валютами
по адаптивной и наивной моделям

Относительная Норма прибыли Вероятность проигрыша


Валюта Модель прибыль за день, за год, в отдельной валютной
% % операции (F)

Британский фунт адаптивная 0,048 13,28 47,0


наивная -0,013 -3,27 50,8

Западногерманская марка адаптивная 0,060 17,02 45,2


наивная 0,053 14,83 45,8

Японская иена адаптивная 0,063 17,86 45,4


наивная 0,093 27,24 43,3

Французский франк адаптивная -0,0068 -1,745 50,3


наивная 0,112 33,64 40,6

Швейцарский франк адаптивная 0,071 20,16 45,3


наивная 0,139 43,66 44,6
второго типа логика противоположна: ожидается, чтов сле-
дующий момент знак прироста изменится. Ясно, что пра-
вильное поочередное применение этих двух моделей может
дать абсолютно точные прогнозы. Но проблема состоит в
определении момента, когда прибегать к первой, а когда -
ко второй.
Построим на основе этих двух моделей новую, в которую
они входят как альтернативы. Организуем автоматический
выбор той или иной модели по такому правилу: если на
последних п точках (статистической базе) применение пер-
вой модели дало отрицательный результат, то для прогно-
зирования (л-М)-й точки применяется вторая модель, и на-
оборот. Результаты испытания этой модели на прежних
данных со смещаемой базой с п=20 приведены в табл. 15.1
и 15.2. По четырем валютам (на этот раз — кроме британс-
кого фунта) получен положительный итог. Особенно велика
норма прибыли у швейцарского и французского франка.
Риск, однако, остается.

В этой главе мы хотели показать, что простейшие стати-


стические модели могут оказаться полезными даже в столь
сложной задаче, как прогнозирование валютных курсов.
Была исследована стохастическая природа валютных кур-
сов. Сделан вывод о наличии в их движении определенной
инерционности. Рассмотрены адаптивная и наивная моде-
ли, которые применены к реальным данным. Результаты в
Целом оказались положительными, хотя полностью риска
избежать не удается.
Предложенные подходы к краткосрочному прогнозиро-
ванию валютных курсов позволяют эксперту оперативно
принимать решения по текущим валютным операциям. Сам
прогноз, вообще говоря, является исходной информацией для
второго этапа работы - выработки оптимального решения.
На этом этапе решение задачи по одной валюте целесооб-
разно сопоставить с решениями задач по другим валютам в
рамках комплексного подхода. Одномерная задача есте-
ственным образом перерастает в многомерную.
Глава 16
СТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
ВАЛЮТНЫХ АУКЦИОНОВ
НА МОСКОВСКОЙ МЕЖБАНКОВСКОЙ
ВАЛЮТНОЙ БИРЖЕ

В этой главе представлена методика построения


модели валютных торгов, позволяющей прогнозировать курс
доллара к рублю на основе предварительных заявок на по-
купку и продажу'валюты с учетом возможных вариантов
интервенции Центрального банка Российской Федерации
(ЦБ РФ).

§ 1. ЦЕЛИ ИССЛЕДОВАНИЙ

Актуальность построения модели валютных тор-


гов объясняется важностью курса доллара по отношению
к рублю для всей экономики России, для ее внешней тор-
говли, для юридических и физических лиц, для руководя-
щих органов, и в первую очередь для ЦБ РФ.
В рамках рассматриваемого эконометрического иссле-
дования* валютного рынка основное внимание было сосре-
доточено на механизмах формирования курса рубля на тор-
гах Московской межбанковской валютной биржи (ММВБ).
В нашем распоряжении имелась статистическая информа-
ция за январь-ноябрь 1992 г. Это один из драматических
периодов экономической истории нашего государства - пе-
риод революции цен, гиперинфляции, структурной ломки
народного хозяйства.

* Это исследование выполнено нами совместно с канд.экон.


наук A.C. Лушиным [130].
352
Основные цели работы:
• исследовать статистическую зависимость динамики
курса от спроса и предложения валюты со стороны коммер-
ческих банков, а также интервенции ЦБ РФ на торгах ММВБ;
• рассмотреть теоретические модели торгов и разрабо-
тать методику, позволяющую: отобрать модели, наиболее
адекватные реальным статистическим наблюдениям и пер-
спективные для прогнозирования и управления курсом, оце-
нить параметры этих моделей статистическими методами и
выбрать наилучшие из них для практической деятельности
экспертов ММВБ и ЦБ РФ;
• использовать модели для оценивания курса доллара
на предстоящих валютных торгах на основе начального спро-
са и предложения коммерческих банков с учетом возмож-
ных вариантов участия ЦБ РФ.

§ 2. ТЕОРЕТИЧЕСКИЕ МОДЕЛИ
ВАЛЮТНЫХ ТОРГОВ

Для того чтобы выявить основные количественные


соотношения между спросом, предложением и курсом долла-
ра к рублю, проведем небольшое теоретическое исследование.
Пусть накануне торгов сформировалось некоторое на-
чальное предложение долларов к продаже S o и начальный
спрос Do при цене (курсе) Рй, установившейся на предыду-
щих торгах (рис. 16.1). Разность Do- So характеризует де-
фицит долларов на торгах, который должен быть устранен
путем регулирования цены долларов, т.е. корректировки его
курса. Цена, при которой наступает равенство спроса и
предложения, называется равновесной (Р, - рис. 16.1).
Простейшая модель торгов может быть сформулирована
как

(16.1)

где

Модель (16.1) означает, что прирост курса пропорцио-


нален дефициту долларов на рынке при прежнем курсе, где
А - константа, коэффициент пропорциональности.
353
Рис. 16.1. Спрос и предложение долларов как функции курса:
S o - предложение долларов на начало торгов при курсе Яо; '1
£>„ - заявки на покупку долларов на начало торгов при курсе Р о ;
Л>"" КУРС доллара в рублях, сложившийся к концу предыдущих
торгов;
Р, - новый равновесный курс доллара;
Q, - объем продаж в равновесной точке:

Рассмотрим, однако, этот вопрос подробнее, в частности,


сосредоточим внимание на коэффициенте пропорциональ-
ности А — является ли он в действительности постоянным?
На рис. 16.1 зависимости предложения и спроса от цены
упрощенно представлены линейными функциями. Переход
от Ро к новой равновесной цене Р, описывается уравнением

или
(16.2)

Прирост предложения ÄS можно аппроксимировать как

(16.3)

а прирост спроса АО как

(16.4)
354
Подставим (16.3) и (16.4) в (16.2):

(16.5)

Преобразуем (16.5)

откуда

(16.6)

Из сопоставления (16.1) и (16.6) видим, что множитель

характеризует связь скачка курса с дефицитом долларов


на торгах. Если верна гипотеза о линейной зависимости
спроса и предложения от цены, то dS/dP = const, dD/dP -
- const и, как следствие, А = const. Тогда (16.6) можно ис-
следовать методами регрессионного анализа и, в частности,
оценить регрессию вида
(16.7)

где t - номер или дата торгов (пусть t - 1 Т, где Т - объем


выборки); ,
е, - случайная ошибка уравнения для торгов в день t.
В экономических исследованиях при изучении зависи-
мостей между переменными часто рассматривают не сами
355
23*
производные, а эластичности. Преобразуем выражение (16.6)
с тем, чтобы ввести в него эластичности предложения и спро-
са по цене доллара. С этой целью рассмотрим сначала
знаменатель (16.6)

(16.8)

где индекс '0' означает «на начало торгов», а, и а 2 эластич-


ности предложения и спроса по курсу доллара

Тогда (16.6) можно переписать в виде

(16.9)

Если принять, что эластичности постоянны

(16.10)

то их оценки можно получить статистически, рассматривая


(16.9) как регрессионное уравнение. Для его оценки имеют-
ся два способа: 1) непосредственное оценивание регрессии
нелинейной по параметрам; 2) оценивание параметров пос-
ле преобразования (16.9) и приведения его к линейному виду:

(16.11)

Легко заметить, что у регрессии (16.11) оценки а, и а 2


будут иметь большие ошибки из-за очевидной коллинеарно-
сти регрессоров. Поэтому предпочтительнее получать оцен-
ки нелинейными методами.
356
Рассмотрим, что означает гипотеза о постоянстве эла-
стичностей на примере предложения. Для спроса резуль-
тат аналогичен. Имеем

(16.12)

Отсюда

(16.13)

или

(16.14)

Это означает, что производная предложения по цене не


является более постоянной - она изменяется пропорцио-
нально отношению предложения к цене. Преобразуем (16.13)
к виду

Отсюда интегрированием обеих частей1 равенства полу-


чаем

где с — const,

или

(16.15)

Полученный результат свидетельствует о том, что гипоте-


за о постоянстве эластичностей эквивалентна гипотезе о сте-
пенной зависимости предложения (и спроса) от цены. Изме-
357
нение предложения (и спроса) для перехода от первоначаль-
ной Ро к новой равновесной цене Я, можно найти так:

(16.16)

Таким образом, в этом случае зависимость предложе-


ния и спроса от цены уже не является линейной. Действи-
тельно, более вероятно, что зависимости спроса и предло-
жения от цены криволинейны и, возможно, не постоянны во
времени. Поэтому целесообразно попытаться аппроксими-
ровать эти зависимости известными функциями и выбрать
из них наилучшую пару для отражения предложения и спро-
са и на их основе построить модель торгов. В качестве та-
ких известных функций были взяты парабола второго по-
рядка (F1), гипербола (F2), логарифмическая зависимость
(F3), экспонента (F4) и степенная функция (F5). Тогда
(16.17)

(16.18)

(16.19)
(16.20)

(16.21)

где а0, а,, а2 - постоянные параметры.

Основным равенством для построения модели торгов по-


прежнему служит модель (16.2), где присутствуют не сами
функции, а приросты предложения и спроса, приводящие
первоначальную цену Я к новому равновесному значению
Я,. Приросты функций (16.17)-(16.21) будем описывать с
помощью следующего приближенного равенства (формула
дифференциала):

(16.22)

где АР - Я, - Яо.
358
Используя соотношение (16.22), построим, например, мо-
дель торгов на основе модели (16.2) при гипотезе, что спрос
отражается логарифмической функцией, а предложение -
экспоненциальной:

где а, и Ьг - постоянные параметры. После подстановки AS и


AD в выражение (16.2) имеем

Отсюда

или, переобозначив параметры для упрощения записи, по-


лучим:

Открытым остается лишь вопрос об интервенции ЦБ РФ и


ее учете в модели. До сих пор мь, считали, что сирос и iред
ложение формируются свободно без » е ш ^ ь ' т в „ б ^ 3 о м

359
Поскольку ЦБ РФ на торгах играет регулирующую роль,
его реакция на рост или падение курса коренным образом
отличается от действия обычного участника торгов. Интер-
венцию ЦБ РФ можно также рассматривать как погашение
части или всего первоначального спроса. В этой интерпре-
тации назовем (£>0 — /) реальным или эффективным спро-
сом, воздействующим на торгах на уровень курса доллара.
Так или иначе, в модели вместо (Do — Sg) для учета интер-
венции ЦБ РФ используем (Dg — So — I), где интервенция
/ > 0, если ЦБ РФ продает доллары, и / < 0, если ЦБ РФ
покупает и тем увеличивает эффективный спрос.
Окончательно модель принимает вид

(16.23)

Множество вариантов сочетания различных пар функ-


ций дли аппроксимации спроса и предложения порождает
множество возможных моделей торгов. Все они могут быть
обобщенно представлены как

(16.24)

где Л - коэффициент пропорциональности, который теперь не


является в общем случае постоянным, а сам зависит
от некоторых конъюнктурных переменных (см. табл. 16.2
и 16.3).
Однако все эти модели нецелесообразно строить й ис-
следовать: необходимо выделить из них те, от которых мож-
но надеяться получить хороший результат. Для этого было
проведено вспомогательное исследование, целью которого
было выявить наиболее подходящие функции для аппрок-
симации спроса и предложения.

§ 3. АНАЛИЗ ИСХОДНЫХ ДАННЫХ

Предварительный анализ статистических данных


о торгах на ММВБ в исследуемом периоде показал, что ме-
ханизм формирования курса существенно различался в за-
360
висимости от того, происходит ли его рост или снижение. В
связи с этим было принято решение строить модели отдельно
для падающего и растущего курсов, поскольку «усреднен-
ная» модель может привести к большим ошибкам при про-
гнозировании.
Р а з д е л е н и е на п о д в ы б о р к и . Н а основе исход-
ных данных о торгах ММВБ за январь-ноябрь 1992 г. были
сформированы две подвыборки: 1) для растущего курса АР > О
и 2) для падающего курса АР <0. Торги, на которых курс не
менялся (А/3 = 0), были исключены из рассмотрения. Кроме
того, из подвыборки / были исключены два наблюдения с рез-
ким ростом курса, относящиеся к январю-февралю 1992 г. и
вызванные паническим состоянием рынка. Что касается под-
выборки 2, то здесь были исключены 12 точек, для которых
характерно неэластичное поведение предложения (AS = 0) и
сверхэластичный спрос. Данные торги относились в основном
к первой половине года и сопровождались массированными
интервенциями ЦБ РФ при незначительном снижении курса.
При формировании подвыборок следовало также учесть,
что валютный рынок России функционировал в 1992 г. в
двух режимах: множественных курсов (до 1 июля) и единого
курса (после 1 июля). Это нашло отражение в характере
торгов на ММВБ и было исследовано нами для случая ра-
стущего курса (для падающего курса после 1 июля было
слишком мало наблюдений).
Приведем перечень выборок, для которых проводились
статистический анализ и оценивание регрессионных моделей.
Р а с т у щ и й к у р с ( в ы б о р к а 1):
1.1 - март-ноябрь 1992 г. - 34 точки;
1.2 - июль-ноябрь - 28 точек;
1.3 - сентябрь-ноябрь - 17 точек;
1.4 - октябрь-ноябрь - 11 точек.
П а д а ю щ и й курс ( в ы б о р к а 2):
2.1 - январь-ноябрь 1992 г. - 26 точек;
2.2 - январь-июнь - 21 точка.
В принципе для падающего курса было бы желательно
построить выборку для случая отрицательных интервенций
ЦБ РФ, т.е. когда ЦБ РФ покупал валюту для уменьшения
глубины падения курса. Таких наблюдений (за сентябрь-
ноябрь) в нашем распоряжении было всего четыре. Этого
недостаточно для статистического оценивания.
361
К о р р е л я ц и о н н ы й а н а л и з . Самые общие пред-
ставления о характере взаимосвязи курса со.спросом и пред-
ложением можно получить, рассмотрев корреляционные мат-
рицы, содержащие коэффициенты корреляции представленных
в них показателей. Соответствующие матрицы для растущего
и падающего курсов позволили сделать следующие предва-
рительные выводы.
В случае растущего курса, т.е. когда АР > 0, отмечается
достаточно высокая корреляция между изменениями спроса
и предложения банков в ходе торгов и изменениями курса.
При этом спрос в большей степени реагировал на относи-
тельный прирост курса, а предложение — на его абсолютное
изменение; связь с курсом более тесная у спроса, нежели у
предложения. Кроме того, прослеживалась достаточно высо-
кая зависимость изменений курса от дефицита валюты на
торгах, что подтверждает правильность рассмотренных в § 2
этой главы теоретических моделей.
При АР < 0 связь между изменениями спроса, предло-
жения и курса была выражена менее отчетливо и лучше
прослеживалась для предложения. Другой вывод состоял в
том, что в ходе торгов банки в большей степени ориентиро-
вались на абсолютное снижение курса, нежели на его отно-
сительное падение. Зависимость величины падения курса
от избытка валюты на торгах также имела место, хотя и не
такая тесйая, как в случае АР > 0. В целом можно заклю-
чить, что в силу высокой степени неопределенности меха-
низм падения курса хуже поддавался количественному опи-
санию, чем его рост.

§ 4. МОДЕЛИ ТОРГОВ ДЛЯ РАСТУЩЕГО КУРСА

Зависимость спроса и предложения


от к у р с а . Дальнейшее исследование зависимости спро-
са и предложения от курса заключалось в подборе кривых,
наилучшим образом описывающих данные взаимосвязи. Этот
подбор заключался в поиске наилучшего уравнения для
приростов, причем тип уравнения вытекал из аналитичес-
кого вида рассматриваемых функций. Результаты статис-
тического оценивания для двух выборок с растущим кур-
сом приведены в табл. 16.1.
362
Наилучшие кривые отбирались по величине коэффици-
ента детерминации R2, а также значимости параметров а и
ß, определяемой по величине /-статистики. Как следует из
табл. 16.1, для спроса лучшими функциями оказались лога-
рифмическая, параболическая и гиперболическая, а для
предложения — линейная, экспоненциальная и параболи-
ческая. Этот вывод вполне согласуется с данными корреля-
ционного анализа, поскольку в полученных функциях (за
исключением параболы) изменение спроса зависит от тем-
па, а изменение предложения — от абсолютного прироста
курса.
Возможные модели торгов. На основе выяв-
ленных лучших кривых можно сформировать наиболее перс-
пективные модели динамики курса, общий вид которых за-
дается соотношением (16.24), а конкретное выражение для
параметра А вытекает из функций спроса и предложения.
Перечень этих 13 моделей (отобранных из 36) приводится в
табл. 16.2, а их аналитическое выражение - в табл. 16.3.
Параметры а и ß подлежат оцениванию. Во всех моделях
табл. 16.3 параметр а отражает чувствительность спроса к
увеличению курса, а параметр ß - чувствительность предло-
жения.
Статистическое оценивание регрессион-
ных м о д е л е й . Результаты статистического оценивания
отобранных моделей нелинейным МНК для четырех выбо-
рок с растущим курсом доллара приведены в табл. 16.4
(показаны только наиболее удачные результаты).
Как и в случае анализа функций спроса и предложения,
наилучшие уравнения (модели) отбирались исходя из вели-
чины коэффициента детерминации R*, дисперсии ошибки
уравнения s 2 и значимости параметров (f-статистики). При-
нимались также во внимание коэффициент Дарбина-Уот-
сона (DW) и коэффициент корреляции параметров cor(a,ß).
Из представленных в табл. 16.4 наиболее адекватными
оказались модели 4, 5 и 12, имеющие наилучшие статисти-
ческие характеристики. Именно они и были выбраны для
прогнозирования величины растущего курса на торгах
ММВБ. Расчетные приросты курса (АР) для модели 4 в со-
поставлении с их фактическими значениями приведены на
рис. 16.2.
363
Таблица 16.1

Статистический анализ зависимости спроса и предложения от валютного курса при АР > О

Зависимость Уравнение Выборка 1.1 Выборка 1.2


от курса для приростов Л2 « Г-статистнка В* а f-статистика

Спрос
Линейная AD-aAP 0,775 -0,53 10,7 0,774 -0,52 9,6
Логарифмическая ДО = оДР/Ро 0,871 -123,0 14,9 0,897 -131,8 15,3
Экспоненциальная AD = aDobP 0,737 -0,0074 9,6 0,764 -0,0072 9,3
Степенная М> = а£>оДР/Ро 0,837 -1,79 13,0 0,853 -1,78 12,5
Параболическая AD = aAP+ßPoAP 0,870 а=-1,1 8,9 0,882 а=-1,184 8,3
ß = 0,002 4,8 ß = 0,002 4,9
Гиперболическая ДО=-аДР/Р0 2 0,780 204447 10,8 0,881 26355 14,2

Предложение
Линейная AS = aAP 0,601 0,141 7,1 0,647 0,152 7,0
Логарифмическая А5 = аДР/Р0 0,442 26,4 5,1 0,555 33,4 5,8
Экспоненциальная А.У = гг.? 0 АР 0,624 0,0062 7,4 0,625 0,0062 6,7
Степенная AS=aSobP/Po 0,567 1,51 6,6 0,568 1,52 6,0
Параболическая AS = oAP+ßPoAj> 0,631 а = 0,045 0,7 0,655 а =0,1 1,2
ß = 0,004 1,6 ß = 0,0002 0,8
Гиперболическая Д5=-аДР/Р 0 2 0,254 -3508 3,3 0,406 -5729 4,3
Таблица 16.2
Возможные модели торгов с учетом зависимости спроса и предложения от курса доллара

Предложение
Спрос
Линейная Логарифмическая Экспоненциальная Степенная Параболическая

Линейная Модель 1

Логарифмическая Модель 2 Модель 3 Модель 4 Модель 5

Экспоненциальная Модель б

Степенная Модель 7 Модель 8 Модель 9

Параболическая Модель 10

Гиперболическая Модель 11 Модель 12 Модель 13


Таблица 16.3
Модели торгов, отобранные для статистического оценивания

Зависимость от курса доллара


Модель Оцениваемое уравнение
предложения спроса

1 Линейная Линейная
AP=-_L(£>0-.?0-/)
ß-a
2 Линейная Логарифмическая

3 Логарифмическая Логарифмическая
AP = -~~(D0-S0-I)
ß-a

4 Экспоненциальная Логарифмическая

5 Степенная Логарифмическая

б Экспоненциальная Экспоненциальная
7 Линейная Степенная
^ ~ Rр-а£>'0/Р/р-(А>^о-/)
0

S Экспоненциальная Степенная
АР— . СП,. ... «?,, .. А

9 Степенная Степенная

10 Параболическая Параболическая

11 Линейная Гиперболическая

12 Экспоненциальная Гиперболическая

13 Степенная Гиперболическая
Таблица 16.4
Результаты оценивания регрессионных моделей
на различных выборках при АР > О

Параметры и критерии качества


Модель Выборка
R2 s2 DW а ß cor(a,ß)
1 1.1 0,836 53,5 1,42 -1,243 12,9
1.2 0,837 59,6 1,20 -1,247 11,8
1.3 0,900 51,0 1,22 -1,497 12,0
1.4 0,936 43,8 1,43 -1,701 12,1
3 1.1 0,895 34,2. 2,07 -0,005 16,8
1.2 0,912 32,2 2,20 -0,005 16,7
1.3 0,918 41,8 1,99 -0,005 13,4
1.4 0,924 51,8 1,66 -0,006 11,0
4 1.1 0,912 29,7 2,02 -146,0 9,8 0,006 2,3. 0,768
1.2 0,924 29,1 2,06 -154,1 9,3 0,005 1,8 0,794
1.3 0,938 33,6 1,95 -134,3 6,1 0,007 2,1 0,851
1.4 0,954 34,4 1,87 -127,0 5,9 0,007 2,2 0,820
5 LI 0,912 29,4 2,17 -133,5 7,8 2,244 2,5 0,837
1.2 0,923 293 2,19 -145,1 7,2 1,768 1,9 0,862
1.3 0,936 35,1 2,20 -126,8 5,0 2,352 2,1 0,885
1.4 0,956 33,3 2,10 -112,1 4,3 3,110 2,3 0,886
8 1.1 0,820 60,5 2,25 -2,614 6,9 0,005 1,1 0,767
1.2 0,827 65,6 2,19 -2,509 5,7 0,005 1,1 0,802
1.3 0,909 49,5 2,36 -1,726 4,4 0,010 2,3 0,849
1.4 0,943 43,2 3,36 -1,717 4,8 0,010 2,4 0,823
10 1.1 0,889 37,1 1,95 -1,241 8,6 -0,002 4,2 0,954
1.2 0,897 39,1 1,85 -1,273 7,8 -0,002 4,0 0,959
1.3 0,921 43,2 1,67 -1,034 5,1 -0,001 2,1 0,972
1.4 0,939 46,2 1,57 -0,770 3,0 -0,001 0,8 0,981
12 1.1 0;907 3U 2,23 -25962 8,4 0,013 5,4 0,691
1.2 0,929 26,9 2,57 -28448 8,8 0,011 5,3 0,708
1.3 0,938 34,0 2,35 -30519 6,1 0,011 3,9 0,775
1.4 0,959 31,1 2,10 -30247 6,1 0,011 4,1 0,750
1

Рис. 16.2, Фактические (кривая со светлыми кружочками)


и расчетные (кривая с черными кружочками) приросты
курса доллара для модели 4 при АР > О

§ 5. МОДЕЛИ ТОРГОВ
ДЛЯ ПАДАЮЩЕГО ВАЛЮТНОГО КУРСА

Зависимость спроса и предложения


от к у р с а д о л л а р а . Для случая ДР < 0 поиск наилуч-
ших кривых для аппроксимации спроса и предложения в
зависимости от изменений курса валют прризводился теми
же методами, которые описаны в § 4 этой главы. Исследо-
вание проводилось на выборке 2.2 (январь-июль), посколь-
ку связь курса со спросом и1 предложением здесь прослежи-
вается наилучшим образом.
Результаты проведенного анализа (табл. 16.5) показы-
вают, что при АР < О и спрос, и предложение лучше всего
описываются экспоненциальной и степенной функциями.
370
Таблица 16.5

Статистический анализ зависимости спроса и предложения


от курса доллара при АР < 0 и АР > О

Выборка 2.2
Зависимость Уравнение
от валютного для приростов г-статис-
курса Яг a тика

Спрос
Линейная 0,532 -0,093 4,5
Логарифмическая М)~аАР1Ра 0,571 -17,44 5,2
Экспоненциальная AD-аДАР 0,734 -0,016 7,4
Степенная ДО = аДАР/Ро 0,710 -2,50 7,0
Параболическая AD = aAP + ßP(AP 0,584 a=-0,31 2,2
ß = 0,0011 1,5
Гиперболическая ДО=-аАР/Р0 2 0,582 3027 5,3

Предложение
Линейная AS=aAP 0,668 0,21 6,4
Логарифмическая AS-aAP/Pa 0,617 36,44 5,7
Экспоненциальная AS=a50AP 0,740 0,017 7,8
Степенная AS = a5oAP/Po 0,722 3,17 7,2
А С
Параболическая AS-otAP + ßPoAP 0,700 a=-0,ll 0,5
ß = 0,002 1,4
0,544 -5888 4,9
Гиперболическая AS=-aAP/Po2

Именно эти функции и были использованы при построе-


нии моделей сдающего курса. Необходимо отметить что
качество аппроксимации функций спроса и n p w « « « ™
пои падающем курсе хуже, чем при растущем. Соответствен-
но^ нескТьк?хужеРоказалс;сь и качество окончательных про-
гнозных моделей о ц е н и в а н и е
регрессион-
ных м о д е « ! В табл. 16.6 представлены результаты
стЬ т'истТче^огГоцени/ания для выборок с п = к У Р ;
сом доллара по моделям 6, 8 и 9, вторые оказались аибо
лее удачными. Для прогнозирования курса приiAP><а
0 окон
чательно отобраны модели^6 и 8. JP^JJ Ф ™ ^ S e H
расчетных приростов курса (АР) для модели о пред
на рис. 16.3. 37
j

24*
Таблица 16.6

Результаты оценивания регрессионных моделей


на различных выборках при АР < О

Параметры и критерии качества


Модель Выборка
DW ос 'а ß Ч cor(a,ß)
б 2.1 0,860 21,9 2,14 -0,030 3,4 0,014 3,5 0,836
2.2 0,871 24,8 2,18 -0,030 3,2 0,014 з,з 0,834
8 2.1 0,860' 22,0 2,17 4605 3,3 0,161 4,7 0,783
2.2 0,870 25,1 2,15 -4,517 3,1 0,016 4,4 0,776
9 2.2 0,857 27,5 2,16 4151 2,3 3,406 4,2 0,823
Рис. 16.3, Фактические (кривая со светлыми кружочками)
и расчетные (кривая с черными кружочками) снижения
курса доллара для Модели 6 при.ЛЯ < О

§ 6. ОЦЕНКА КАЧЕСТВА СТАТИСТИЧЕСКИХ


МОДЕЛЕЙ

Анализ устойчивости параметров.


Проблема устойчивости параметров регрессионных моде-
лей - одна из ключевых при эконометрическом прогнозиро-
вании. Если параметры устойчивы, то при использовании
соответствующей модели можно рассчитывать на получе-
ние достаточно достоверного прогноза, в противном случае
прогноз может оказаться ошибочным, если не предусмотре-
на корректировка и адаптация параметров.
Значения параметров а и р для моделей 4 (выборка
АР > 0) и 6 (выборка АР < 0), рассчитанные непосредствен-
но по формулам для приростов спроса и предложения в
каждой точке, показали, что в обоих случаях в динамике
373
параметров отсутствует какая-либо тенденция, однако rtx
отклонения от среднего уровня могут быть значительными.
Как правило, наибольшие отклонения («всплески») имеют
место при сверхэластичной реакции банков, когда неболь-
шим изменениям курса сопутствуют значительные сдвиги
в спросе или предложении. Однако такие ситуации соот-
ветствуют неординарным внешним условиям (всплеск инф-
ляционных ожиданий, изменения в законодательстве и т.п.)
и встречаются не очень часто. В нормальных же условиях
можно надеяться, что использование оценок а и ß в наших
моделях приведет к получению удовлетворительных про-
гнозов.
Оценка точности моделирования курса.На
рис. 16.2 и 16.3 приведены фактические приросты курса (АР)
и их прогнозы по моделям 4 и 6 для растущего и падающего
3
курсов (A/ mod). Как видим, точность прогнозов сильно меня-
ется от торгов к торгам. Тем не менее средняя ошибка про-
гноза АР по каждой модели равна нулю — это вытекает из
способа оценивания параметров регрессионных моделей.
Поэтому требуется какой-то иной устойчивый показатель
точности, характеризующий качество прогнозов в среднем
по выборке. Точность прогнозирования по регрессионным
моделям может оцениваться по-разному, в связи с чем рас-
смотрим несколько показателей.
Одним из них является стандартная ошибка уравне-
ния. В наших моделях она представляется стандартной ошиб-
кой прогноза прироста курса на торгах. В модели 4 она
равна о, = 5,33 руб., а в модели 6 о 2 = 4,58 руб.
Вызывает интерес также и относительная ошибка про-
гноза. Иногда для ее измерения берут отношение абсолют-
ной ошибки модели к реальному значению объясняемой
переменной (т.е. в нашем случае отношение модуля ошибки
к реальному изменению курса на данных торгах) и усред-
няют эту статистику по выборке. Однако здесь подобный
показатель не годится, так как если на торгах t ошибка
была отличной от нуля, а курс почти не изменился, то отно-
сительная ошибка будет очень большой, и это проявится
при усреднении по всей выборке.
Для того чтобы получить представление об относитель-
ной точности построенных регрессионных моделей, нами
374
предложен другой показатель, равный отношению суммы
ошибок модели, взятых по модулю, к сумме модулей приро-
стов курса за тот же период:

где

Для модели 4 этот показатель 0 = 22,7%, а для модели 6


8=45,1%.
Еще одной характеристикой точности модели может быть
ошибка прогноза курса, равная ошибке прогноза прироста
курса, так как Pt = Я м + äPt, а относительная погрешность
здесь может быть измерена статистикой

а
Для модели 4 X., - 1,85%, для модели 6А, 2 2,15%.
Таким образом, можно сделать следующие выводы.
1. Ожидаемая стандартная ошибка модельного прогно-
в
за равна о, =• 5,33, если курс растет, или о 2 4,58, когда он
снижается.
2. Относительный показатель ошибки моделирования
прироста курса в среднем на выборке равен 9, = 22,7% при
растущем курсе и 62 = 45,1% - при падающем. Это свиде-
тельствует о том, что модели возрастающего курса можно
доверять в большей степени, чем модели снижающегося
курса, хотя и здесь ошибка достаточно велика.
3. Относительная ошибка прогноза абсолютного уровня
курса в среднем равна Х{ - 1,85%, если он растет, и \ -
2,15%, когда он снижается.
375
§ 7. ВОЗМОЖНЫЕ СПОСОБЫ ИСПОЛЬЗОВАНИЯ
МОДЕЛЕЙ

Прогнозирование курса накануне торгов на


ММВБ. Как указывалось в § 2 этой главы, все многообра-
зие моделей торгов описывается так:

(16.25)

где коэффициент At в общем случае не является константой


и может быть функцией от некоторых известных перемен-
ных (в частности, начального спроса и предложения банков
и курса предыдущих торгов). Оценивание моделей заклю-
чается в том, чтобы на ретроспективном статистическом
материале (на данных о прошлых торгах) найти оценки ко-
эффициента Аг Получив эти оценки на основе регрессион-
ного анализа, можно использовать их для прогнозирования
курса на предстоящих торгах в зависимости от заявок бан-
ков на продажу и покупку, а также от различных вариан-
тов вмешательства ЦБ РФ.
Регулирование курса с помощью интер-
венций ЦБ РФ. Центральный банк Российской Федера-
ции является на торгах регулирующим органом. В первой
половине 1992 г. его функция выражалась в сдерживании
роста курса доллара, а впоследствии - в сглаживании его
колебаний. Возникала задача — оценить затраты ЦБ РФ по
регулированию курса и выбору наилучшей стратегии.
Обратимся к выражению (16.25). Очевидно, что здесь
коэффициент At, изменяющийся во времени, может быть
интерпретирован как мера чувствительности курса долла-
ра к интервенциям ЦБ РФ, показывающая, какое снижение
курса доллара приходится на единицу продаж ЦБ РФ на
торгах t, так как

(16.26)

В связи с этим динамика At представляет интерес. В ре-


зультате можно сделать важное заключение: чем выше А,,
тем большего эффекта (при прочих равных условиях) дос-
тигнут продажи ЦБ РФ.
376
Отметим, что, если переписать (16.25) в виде

(16.27)

где At определяется типом модели, то можно получать оценки


величины интервенции ЦБ РФ, необходимой для удержания
изменения курса в заданных пределах.

В данной главе достаточно подробно изложен порядок


построения модели валютных торгов на ММВБ. Начав с
простейшей модели с постоянным параметром Л, постепен-
но, на основе анализа с использованием микроэкономичес-
ких подходов, были получены альтернативные модели с пе-
ременным параметром А. Это привело к новой задаче -
проблеме идентификации, т.е. к выбору наилучшей модели.
Такой выбор был сделан на основе статистических показа-
телей качества моделей. Насколько нам известно, эти мо-
дели несколько лет использовались для практических целей
регулирующими органами.
Разумеется, статистическая модель описывает наиболее
устойчивые связи переменных. У эксперта информации го-
раздо больше, поэтому последнее решающее слово остается
за экспертом, за «лицом, принимающим решение», а стати-
стические модели можно рассматривать как инструмент
получения дополнительной информации об интересующем
объекте или процессе.
ЗАКЛЮЧЕНИЕ

Заканчивая рассмотрение адаптивных методов


прогнозирования, отметим их некоторые особенности. Суть
адаптации состоит в том, что модель следует за процессом.
Это обусловливает отставание изменений в модели от но-
вых тенденций в реальном процессе, и чем больше время
упреждения, тем больше несоответствие между прогнозом
и фактическим значением ряда. Следовательно, модели рас-
сматриваемого класса можно рекомендовать для получе-
ния в рсновном краткосрочных прогнозов.
Многие из рассмотренных моделей характеризуют связь
между исследуемой величиной и временем. Это обстоятель-
ство само по себе является довольно серьезным ограниче-
нием. С другой стороны, время в модели выражает эволю-
цию всего комплекса условий протекания процесса. Через
время исходный ряд неявно связан с множеством взаимо-
связанных факторов, учесть влияние которых порознь зат-
руднительно. За счет упрощенного представления исследу-
емой величины, связанной с одним лишь фактором времени,
моделирование становится возможным даже при самой скуд-
ной информации. Положительной чертой адаптивных мето-
дов является то, что с их помощью тщательно изучается
внутренняя структура временного ряда, взаимосвязь его
последовательных членов, а модели, являющиеся инстру-
ментом прогноза, чутко реагируют на динамические изме-
нения и соответственно перестраиваются тем или иным об-
разом, учитывая обесценение устаревшей информации.
Сфера применения адаптивных моделей одномерного
ряда довольно обширна. Они могут быть использованы для
прогнозирования спроса и предложения, конъюнктурных
колебаний финансового рынка, отдельных экономических и
378
технико-экономических показателей, уровня запасов в сис-
темах материально-технического снабжения, для прогнози-
рования структурных и технологических сдвигов, для опре-
деления траекторий некоторых глобальных показателей.
Наиболее простыми являются полиномиальные модели
Брауна. Их отличает ясность концепции, достаточная гибкость,
универсальность и простота расчетов. Особое значение имеют
адаптивные модели для более гибкого, чем обычно, выравни-
вания рядов, очищения их от случайных наслоений. Однако
точность получаемых по ним прогнозов не всегда удовлет-
ворительна. Более строгим является метод, основывающий-
ся на теории, разработанной Дж. Боксом и Г. Дженкинсом, -
метод построения смешанных моделей авторегрессии-сколь-
зящего среднего. Имеются сведения [85], что, несмотря на
ограниченность используемой информации, модели Бокса -
Дженкинса в деле прогнозирования могут с успехом кон-
курировать со сложными эконометрическими моделями.
Очевидно, не случайно положительно показала себя в опы-
тах по прогнозированию экономических рядов и адаптив-
ная модель авторегрессии (например, для прогнозирования
курсов валют), и адаптивная гистограмма (для анализа
кассовых остатков).
Рассмотренные в данном пособии методы анализа и по-
строения моделей изолированного временного ряда могут
найти применение и в качестве вспомогательного средства.
Например, для прогнозирования экзогенных переменных при
построении многофакторных моделей, а это очень важно,
так как от точности прогноза экзогенных переменных зави-
сит успех прогнозирования по многофакторной модели в
целом.
Модели Бокса -Дженкинса можно также использовать
как своеобразную меру динамических свойств ряда, и это
их качество положено в основу анализа эконометрических
систем линейных динамических уравнений. С помощью та-
ких моделей можно также получить ряды с некоторыми за-
ранее заданными автокорреляционными свойствами, что мо-
жет найти применение в имитационных моделях.
Получил развитие адаптивный многомерный анализ:
разработаны адаптивный корреляционный и адаптивный
регрессионный анализ. Применение моделей АРСС для от-
ражения колебаний дисперсии регрессионных остатков при-
379
вело к появлению моделей с авторегрессионной условной
гетероскедастичностью. В экономике большую роль играют
циклические колебания показателей. Колебания такого рода
имеют несистематический характер: у них переменные амп-
литуда и период, деформированные положительная и отри-
цательная фазы. Для исследования подобных колебатель-
ных процессов нами предложен метод фазового анализа.
Этим, однако, не ограничивается область использования
адаптивных моделей. Представим себе случай, когда для
отображения реального процесса построена какая-либо
сколь угодно сложная модель. Для лучшего ее согласова-
ния с реальными данными можно в качестве корректирую-
щего элемента использовать адаптивную модель. Ее на-
значение состоит в том, чтобы прогнозировать ошибку,
даваемую основной моделью, и вносить соответствующую
корректировку. Это значительно расширяет сферу приме-
нения адаптивных моделей.
Тем не менее некоторые направления адаптивного моде-
лирования, по-видимому, не находят широкого применения
в экономических исследованиях по объективным причинам.
Например, вызывает сомнение возможность плодотворного
развития метода, связывающего адаптивные свойства мо-
дели с изменениями в спектральных характеристиках дина-
мического ряда, так как оценки спектральной плотности,
определяемые на нескольких десятках точек, весьма нена-
дежны.
Как мы видели, в адаптивном моделировании использу-
ется целый ряд подходов. Это обогащает арсенал исследо-
вателя, но одновременно создает трудности при выборе ме-
тода в конкретном случае. Многие методы сравнительно
новые, и поэтому еще не накоплен достаточный практичес-
кий опыт работы с ними, в связи с чем в пособии особое
внимание уделено изучению и сопоставлению свойств раз-
личных методов и моделей, что должно помочь делать пра-
вильный выбор с учетом целей и ресурсов исследователя.
Полагаем, что в условиях рыночной экономики адаптив-
ные методы экономических показателей являются наиболее
адекватным средством прогнозирования.
ПРИЛОЖЕНИЯ

№ 1
ДИСПЕРСИЯ ОШИБКИ ПРОГНОЗИРОВАНИЯ
СТОХАСТИЧЕСКОГО ПРОЦЕССА
ТЕЙЛА — ВЕЙДЖА С ПОМОЩЬЮ
ЛИНЕЙНОГО ПРЕДИКТОРА ХОЛЬТА

Г. Тейлом и С. Вейджем [103] было предложено


выражение для оценки дисперсии ошибки прогноза на один
iiiar вперед (т = 1). Здесь мы выводим более общую форму-
лу для любого х ^ 1. Напомним вкратце модель.
Процесс

0)

(2)

М (etvf) = 0 для любой пары (t, f).


Схема прогнозирования:
(3)
(4)

где

ч (t_ 1) » Xt — хх (t—\)~ошибка прогноза, сде-


ланного в момент t — 1 на один шаг вперед.
381
Ошибка прогноза, сделанного в момент t на т шагов впе-
ред, будет:

(5)

где

Ошибка прогноза имеет три источника: ошибку оцен-


ки коэффициента ах в момент t, ошибку оценки коэффици-
ента а 2 в момент / и кумулятивную сумму случайных ком-
понент за промежуток времени (t, t -j- т) с учетом их влия-
ния на точность прогноза.
Используя уравнения адаптации (3), (4) и (5), можно
найти выражения для ошибок моделирования At и Bt.
Запишем (3) в виде:

Затем после простых преобразований для At может быть


записано следующее соотношение:
(6)
Тем же путем для Bt получаем

(7)
Запишем (6) и (7) в векторной форме:

(8)

где

382
Используя соотношение (8) п раз, получаем

(9)

Первый член справа сходится к нулю при п -*» оо (см.


[103]). Объединяем (9) и (5) и получаем

Возводим обе части в квадрат и берем математическое


ожидание:

(10)

где

Выражение (10) можно упростить. Пусть

вычтем

В результате получим
(И)
Выражение (11) можно рассматривать как систему ли-
нейных уравнений с тремя > элементами, slb s ia , s22 матрицы
S. Ясно, что S симметрична, т. е. % = s i a .
Можно (11) записать в развернутой форме:

383:
что эквивалентно следующему:

Решение будет такое:

Возвращаясь к (10) и (11), видим, что дисперсия ошиб-


ки

После подстановки получим искомый результат:

Дисперсия ошибки прогноза на один шаг вперед De (1)


находится экспериментально в результате оптимизации па-
раметров модели.
384
№ 2
СОВМЕСТНОЕ АПОСТЕРИОРНОЕ
РАСПРЕДЕЛЕНИЕ ПАРАМЕТРОВ
ЛИНЕЙНОЙ МОДЕЛИ

В приложении дан вывод результатов, исполь-


зуемых в гл. 6. В разделе А рассматривается общий случай,
в разделе Б — частный случай линейной модели прогно-
зирования с двумя параметрами.

А. Общий случай
Рассмотрим модель, генерирующую временной ряд, ко-
торая в момент t имеет вид:
(АЛ)
(А.2)
где Xt является вектором значений, наблюдаемых в момент
t размерности (1x1). Двумерные матрицы L, С и F име-
ют размерности (п X я), (п X р) и (I X п) соответственно.
Вектор параметров At имеет размерность (п X 1). Вектора
e t и щ размерности (/ X 1) и (р X 1) соответственно явля-
ются векторами случайных независимых переменных с
математическим ожиданием 0. Предполагается, что зако-
ны распределения вероятностей et и и* и матрицы F, L и С,
соответствующие каждому периоду времени / (/ ^ t +1),
известны, но не оговорено как они изменяются во време-
ни. X (t — 1) определяется как матрица, состоящая из век-
торов прошлых наблюдений Х<_1_г (i == 1, ..., °о), a Af_i
и et определены как:
(А.З)
(А.4)
По формуле Байеса, записывая X(t—l) как X, сов-
местное распределение вероятностей равно:
(А.5)
где
(А.6)
385
25 -ш
Так как знание Xt и X эквивалентно знанию et и X:
(А.7)
и
(А.8)
Теперь рассмотрим случай нормальных законов распре-
деления, в котором:
(А.8)
(АЛО)
(А.11)
Из уравнений (А.2) и (А.З) непосредственно следует, что

и, так как щ не зависит от X, ковариационная матрица


(Af | X) является суммой ковариационных матриц LAf-i
и Ciif.
Обозначая эту сумму через /?, получим
(А. 12)
Таким образом,
(А.13)
Вычитая FLA^j из обеих частей уравнения (АЛ) и ис-
пользуя уравнение (А.4), получаем
(АЛ4)
поэтому

и ковариационные матрицы et и е* идентичны, так что


(АЛ5)
Так как
(А Л 6)
то, используя результаты, полученные в [2] для многомер-
ного нормального распределения, получаем, что
(АЛ7)
386
где V может быть записана в расчлененном виде как:

(А. 18)

Аналогично, используя статистические результаты, вы-


веденные для условных многомерных нормальных распре-
делений, . получаем требуемое распределение вероятностей
At при условии, что заданы все наблюдения до Xt включи-
тельно, как условное распределение при заданных е4 и X.
Таким образом,

(А.19)
где
(А.20)
По (А. 14) и (А. 13) можно заметить, что

так что W + FRF' является ковариационной матрицей


прогноза, сделанного в момент (t — 1) на один шаг вперед.

Б. Частный случай
Рассмотрим процесс:

где et, щ, vt являются независимыми нормальными случайг


ными переменными с нулевыми математическими ожидания-
ми и дисперсиями De> # u » &v
В обозначениях рассмотренного выше общего случая:

387
25*
Из результатов, полученных в общем случае, следует,
что если х (t) представляет собой все наблюденные значения
до момента t включительно и если

где

то из (19)

где

a D e = f% ru + D е является дисперсией ошибки прогноза


на один шаг вперед.
Величины Гц определены (А. 12) как

где

388
Используя уравнение (А.20):

и обозначение:
получаем:

№ 3
ОЦЕНКА ПАРАМЕТРОВ
В НЕЛИНЕЙНОЙ РЕГРЕССИИ

Очень часто при оценивании экономико-математических


моделей нелинейные модели приходится сводить к линей-
ным и оценивать уже эти производные модели с помощью
линейных методов.
Предположим, что необходимо оценить параметры про-
изводственной функции типа Кобба—Дугласа:
(1)
Относительно неизвестных параметров А, и, а это урав-
нение нелинейно и непосредственно применять метод наи-
меньших квадратов (МНК) нельзя. Уравнение (1) преобра-
зуют в линейное путем деления на L и логарифмирования:

(2)
Последнее уравнение уже допускает использование
обычного МНК для оценки параметров In Л, 1к и а. Одна-
ко если не принять определенных мер (см. П2] ), то оценки
1
Так как указанная работа опубликована малым тиражом и
широкому кругу читателей не известна, повторяем ход рассуждений.
389
параметров вследствие проведенных преобразований ока-
жутся смещенными.
Запишем (1) в общем виде:

или
(3)
— теоретическое значение Yt;
— эндогенная переменная модели;
— вектор экзогенных переменных;
— вектор неизвестных оцениваемых пара-
метров;
е — случайная ошибка.
Разделим обе части (3) на элемент некоторого ряда Ri
и получим новое уравнение:
(4)
или

Применение МНК к уравнению (4) означает минимиза-


цию суммы квадратов новых отклонений щ\
(5)

Из этого уравнения видно, что после деления обеих час-


тей уравнения (3) на Rt мы приходим к минимизации сум-
мы квадратов отклонений, отличной от Q — 2е?, которая
минимизируется при непосредственном применении МНК'
к уравнению (3). Поскольку Q' ф Q, то и вектор оценен-
ных параметров (Г будет отличен от ß.
Значения Щ- являются как бы весами по отношению
к ошибкам е?. Следовательно, большим значениям R? бу-
дет соответствовать меньшее слагаемое 8?/Я?, входящее в
общую сумму Q'. В том случае, когда ряд R возрастающий,
ошибки, соответствующие более ранним моментам времени,
входят в общую' сумму Q' с большим весом, а ошибки неда-
лекого прошлого с меньшим весом, т. е. уравнение регрес-
сии (4), будет лучше приближать значения У*, наблюдавшие-
ся в первые моменты времени. Таким образом, можно гово-
рить о смещении уравнения регрессии в прошлое.
390
Аналогичное явление наблюдается в случае оценки урав-
нения регрессии линейной в логарифмах. Пусть исходное
нелинейное уравнение линейно в логарифмах. Производное
уравнение тогда можно представить в виде:

или

Применение МНК к последнему уравнению означает мини-


мизацию выражения

т. к, Yi является приближением Yt, то можно считать, что


в среднем У{ &.Yit поэтому

Последнее уравнение аналогично уравнению (5), но с


той разницей, что ошибки ег входят с весами У?, а не с Rf.
Если предположить, что ряд У возрастающий, то Q' дает
смещение оценок параметров в прошлое и линия регрессии
тоже будет смещена.
Рассмотрим подробнее вопрос о том, с какими весами
входят ошибки ег в минимизируемую сумму квадратов от-
клонений для производственной функции (1).
После деления наХг ошибки ег входят с весом MLU т. е.
ej =5 til Li. После логарифмирования получаем новую
ошибку:

Итак, окончательно е/' = е{/Уг. Поэтому, чтобы вер-


нуться к минимизации исходной суммы квадратов откло-
нений Q — Ее?, нужно обе части уравнения (2) предвари-
тельно умножить на У и оценить параметры In А, « и а .
391
№ 4
СТАТИСТИЧЕСКИЕ ВРЕМЕННЫЕ. РЯДЫ,
ИСПОЛЬЗОВАННЫЕ ДЛЯ ИСПЫТАНИЯ
МОДЕЛЕЙ
I. Курс акций фирмы ИБМ, дол.
точки I

точки
точки
Дата о Дата о Дата о
о.
й & SS & &

1960 Сентябрь
39 1 545 78 26 509
1 Июль 40 2 546 79 27 515
1 11
1 1 O1U 41 5 545 80 28 507
О 19
\& Л.О7
з 504 42 6 536 81 31 511
13
АО UUTt 43 7 534 Ноябрь
4 14 510
5 44 8 541 82 521
р. 15 509 45 9 541 83 2. 520
to KflO
7 1
хо
Q
127
O\J0
46 12 541 84 3 524
я 20
cJvu
ЧОП
47 13 538 85 4 527
48 14 531 86 7 528
Ju\J
с 91
я л«! ÜUU
49 15 521 87 8 529
10 22 495 50 16 523 88 9 541
11
д. х 25 4Q4
51 19 501 89 10 537
12 2fi 4QQ
13 27 509 52 20 505 90 14 549
14 28 50Q 53 21 520 91 15 551
15 29 52fi 54 22 521 92 16 541
Август
\JZi\J
55 23 511 93 . 17 547
16 1
д
Klo 56 26 504 94 18 559
ли 57 •27 507 95 21 559
17 2 58 28 502 96 22 560
18
1Q
з4 HÖR
R1K 59 29 505 97 23 556
20 5 522 60 30 510 98 25 560
21 8 523 Октябрь 99 28 558
22 9 527 61 8 509 100 29 558
23 10 523 62 4 507 101 30 557
24 11 528 63 5 508 Декабрь
25 12 529 64 6 509 102 1 553
26 15 538 65 7 518 103 2 554
27 16 539 66 10 515 104 5 555
28 17 541 67 11 520 105 6 562
29 18 543 68 12 619. 106 7 569
30 19 541 69 13 526 107 8 585
31 22 539 70 14 529 108 9 590
32 23 543 71 17 528 109 12 596
33 24 548 72 18 527 ПО 13 589
34 25 550 73 19 524 111 14 583
35 26 548 74 20 515 112 15 584
36 29 550 75 21 509 113 16 597
37 30 544 76 24 504 114 19 591
38 31 536 77 25 502 115 20 591
392
Продолжение
точки

точки

точки
Дата и Дата Ü Дата
о.
& %

116 21 589 128 10 599 143 31 636


117 22 581 129 11 601
118 23 588 130 12 608 Февраль
119 27 592 131 13 622
120 28 597 132 16 613
1 АЛ
144 1 637
ал 1
121 29 594 133 17 618 1 ЛК 2п Ь41
134 18 622 146 О 640
122 30 593 147
Q
135 19 620 6 643
1961 136 20 624 148 7 644
Январь 149 8 650
137 23 628
123 3 583 138 24 628 150 9 644
124 4 592 139 25 641 151 10 04-1
1 КО 1О
125 5 591 140 26 630 1&Z 1о oil
СЛ 1

126 6 597 141 27 638 153 14 642


127 9 597 142 30 647 154 15 643

И с т о ч н и к . B r o w n R. Q. Smoothing forecasting and prediction


of discrete «me series. N. Y., 1963, Table С. б, р. 422.

И. Цены на золото на Лондонском рынке, дол. за унцию

В
точки
точки

Дата Дата Дата а


I 5 £ Н
а
й
1971
Апрель 18 28 39,15 3S 21 41,05
г 19 29 .39,42 36 24 40,75
1 4
1 38.95 20 30 39,60 37 25 40,97
2 2 38,82 38 26 40,96
3 38,90 Май 39 27 40,70
5 38,90 21 3 39,42 40,80
4 67 40 28
5 38,92 22 4 39,86
6 8 38,95 23 5 39,66 Июнь
7 13 38,90 24 6 40,20 41 1 40,85
8 14 38,90 25 7 39,87 42 2 40,65
9 15 38,89 26 10 39,65 43 3 40,52
10 16 38,93 27 11 40,00 44 4 40,60
П 19 38,95 28 12 40,70 45 7 40,50
12 20 38,95 29 13 40,85 46 8 40,50
13 21 38,90 30 14 40,80 47 9 39,95
14 22 38.97 31 17 41,10 48 10 39,60
15 23 39,08 32 18 41,20 49 11 39,65
16 26 39,00 33 19 40,50 50 14 39,60
17 27 38,91 34 20 40,80 51 15 39,49

393
точки 1 Продолжение

точки

точки
.Дата « Дата я Дата я
X
к
« * % й
52 16 39,47 92 11 42,75 132 8 42,50
53 17 39,95 93 12 42,23 133 И 42,45
54 18 39,90 94 13 43,27 134 12 42,52
55 21 37,95 95 17 43,05 135 хЗ 42,60
56 22 41,10 96 18 43,00 136 14 42,54
57 23 40,25 97 19 43,40 137 15 42,57
58- 24 40,40 98 20 43,30 138 18 42,51
59 25 40,11 99 23 43,25 139 19 42,55
60 28 40,08 100 24 43,10 140 20 42,50
61 29 39,87 101 25 43,10 141 21 42,52
62 30 40,20 102 26 42,75 142 22 42,47
УЛ %f\ TTJ- 103 27 41,40 143 25 42,47
104 31 41,00 144 26 42,50
63 1 40,10 145 27 42,51
64 40,41 Сентябрь 146 42,25
2 28
65 б 40,22 105 1 40,70 147 29 42,40
66 6 40,30 106 2 41,60
67 7 40,20 107 .3 41,72 Ноябрь
68 8 40,27 108 6 41,80 148 1 42,12
69 9 40,24 109 7 41,70 149 2 42,40
70 12 40,35 ПО 8 41,32 150 3 42,20
71 13 40,35 111 9 41,70 151 4 42,15
72 14 40,40 112 10 41,57 152 5 42,25
73 15 40,44 113 13 41,59 153 8 42,35
74 16 40,60 114 14 41,85 154 9 42,47
75 19 41,01 115 15 41,89 155 10 42,62
76 20 40,97 116 16 42,22 156 11 42,55
77 21 41,20 117 17 42,10 157 12 42,55
78 22 41,59 118 20 42,05 158 15 42,85
79 23 41,80 119 21 42,30 159 16 43,00
80 26 41 50 120 22 42,20 160 17 42 81
81 27 41,90 121 23 42,25 161 18 42,80
82 28 42,10 122 24 42 65 162 19 43,15
83 29 42,30 123 27 42,35 163 22 43,25
84 30 42,47 124 28 42,72 164 23 43,20
125 29 42,70 165 24 43,37
Август 126 30 42,47 166 25 43,64
85 2 167 26 43,32
42,47 Октябрь 43,65
86 42 14 168 29
87 з4 тс*». л и
127 1 42,17 169 30 43,55
88 5 42,19
42,80 128 4 42,50 Декабрь
89 6 42,65 129 5 42,35
90 9 42,90 130 6 42,44 170 1 43,50
91 10 43,30 131 7 42,45 171 2 43,60

394
Продолжение

точки

точки

точки
Дата с« Дата Дата g
S
S

сг
ä а
Февраль
172 3 43,32 48,22
173 6 252 28
43,90 212 1. 47,49 253 29 48,42
174 7 43,83 213 2 48,60 48,37
175 254 30
8 43,60 214 3 48,40
176 9 43,50 215 4 47,55 Апрель
177 10 43,67 216 -7 47,45 осе л да до
6QO
178 13 43,65 217 8 48,20 ОКе с 48 40
о
179 14 .43,75 218 9 47,92 ОЕ7 с
to, iu
Л/01 О
180 15 43,61 219 lO- 48,40 *tO,Ow
•bUU 7/ 4Я , 4R
TtO Of
181 16 43 ДО 220 ll 48,25 OEQ 4ft ДО
£t\J*J 1П
ли TtO. тси
182 17 43,05 221 14 48,25 it
183 20 42,40 222 15 47,98
Ofin
0R1
Л1 48
*±о,4й
*tu
10
184 21 42,95 223 16 48,05
AAJ Д
1Я 48 у81
*IU ОА
269 4Q 42
185 22 43,15 224 17 48,50 £t\f£t ли
49 35
186 23 43,52 225 18 48,24 9ß3 14
1 *
4Q 35
187 28 43,20 226 21 48,40
•CUvC
17
265 18 49,47
188 29 43,52 227 22 48,60 td\J\J
IQ 40 25
30 43,50 228 23 2ß6 XU
189 48,62 267 49,42
20
190 31 43,64 229 24 48,70 268 21 49,37
230 25 48,60 49,35
1972 231 28 48,42
269 24
Январь 270 25 49,21
232 29 48,40 271 49,30
191 3
А 0 Г7П
'ко,72 26
Март 272 27 49,37
192 4 44,40 273 28 49,50
193 5 44,42 233 1 47,80
194 6 44,55 234 2 48,20 Май
195 7 45,75 235 3 48,05 074 1А 50 20
196 10 45,70 236 6 48,00 27B 9 50,70
197 11 45,34 237 7 48,27 *»# и
з 50,30
198 12 45,25 238 8 27ß
48,25 077 4 50,35
199 13 45,45 239 9 48,30 278 б 50,52
200 14 45,72 240 10
«/V
48,20 279 8 51 60
201 17 45,97 241 13 48,35 280 9 54,00
202 18 46,09 242 14 48,40 281 10 53,30
203 19 45,90 243 15 48,30 282 И 53,00
204 20 46,75 244 16 48,47 283 12 52,80
205 21 45,89 245 17 48,40 284 15 52,80
206 24 45,92 246 20 48,35 285 16 54,50
207 25 46,10 247 21 48,40 286 17 57,50
208 26 47,07 248 22 48,40 287 18 57 15
209 27 46,20 249 23 48,40 288 19 56,50
210 28 47,00 250 24 48,40 289 22 57,20
211 31 47,95 251 27 48,35 290 23 57,50

395
точки I Продолжение

точки
точки
Дата я • Дата я Дата а
я Я
а
% я-
Июль
291 24 56,65 318 3 64,25 345 9 65,70
292 25 56,92 319 4 65,50 346 10 66,15
293 26 57,50 320 5 65,30 347 11 66,10
294 30 58,70 321 6 65,90 348 14 64,75
295 31 59,30 322 7 65,80 349 15 65,75
Июнь 323 10 65,05 350 16 65,80
324 11 ' 65,70 351 17 66,25
296 1 58,80 .325 12 64,85 352 18 " 66,25
297 2 59,20 326 13 65,10 353 21 66,60
298 5 59,40 327 14 65,20 354 22 66,97
299 6 59,75 328 17 65,20 355 23 67,40
300 7 64.75 329 18 65,60 356 24 67,30
301 8 66,75 330 19 65,10 357 25 67,05
302 9 65,60 331 20 64,70 358 29 66,60
303 12 59,00 .332 21 65,30 359 30 66,80
304 13 63,30 333 24 65,10 360 31 66,80
305 14 60,70 334 25 65,45 Сентябрь
306 15 61,60 335 26 65,57
307 16 61,80 336 27 65,65 361 1 66,80
308 19 60,60 337 28 67,45 362 4 66,35
309 20 61,60 338 3J 68,90 363 5 66,85
310 21 61,12 364 6 67,00
311 22 61,47 Август 365 7 66,97
312 23 64,00 339 1 68,80 366 8 67,10
313 26 63,50 340 2 70,00 367 11 67,10
314 27 62,30 341 3 66,70 368 12 67,00
316 28 63,30 342 4 67,75 369 13 67,95
J16 29 64,10 343 7 63,40 370 14 66,85
317 30 64,10 344 8. 66,25
И с т о ч н и к , Московский Народный Банк, Лондон, «Экономи-
ческая информация» за соответствующий период.
396
III. Среднемесячные котировки Лондонской биржи металлов
на свинец, дол. за т

Месяц I960 1961 1962 •1963 1964 196S

Январь 206 173 163 150 218 349


Февраль 204 180 162 151 223 391
Март 210 182 167 154 224 396
Апрель 214 185 167 160 227 353
Май 213 184 165 167 244 303
Июнь 202 179 159 179 247 279
Июль 196 179 148 179 271 272
Август 195 179 141 185 301 272
Сентябрь 193 177 143 184 308 289
Октябрь 135 173 146 192 332 307
Ноябрь 188 167 150 191 366 300
Декабрь 179 167 153 205 385 301

Месяц 1966 1967 1968 1969 1970 1971

Январь 301 220 219 254 325 265


Февраль 292 222 228 258 335 268
Март 293 229 234 261 336 270
Апрель 281 227 235 268 321 270
Май 257 229 238 278 313 267
Июнь 259 228 239 286 308 268
Июль 264 231 247 311 301 264
Август 264 233 250 316 286 259
Сентябрь 253 230 252 302 285 239
Октябрь 234 226 248 295 285 229
Ноябрь 223 226 258 316 280 221
224 223 250 334 277 231
Декабрь

Источник. Lead and Line statistics, Monthly Bulletin of the


International Lead and Zinc Study Group, N. Y., 1961-1971. ^
IV. Некоторые статистические ряды, характеризующие
р-азвитие народного хозяйства бывшего СССР
о
выборки

Единица
Ряд Годы 1к
Номе

измерения
&1
1 Поставка минеральных удобрений тыс. т 1946-1975 30
сельскому хозяйству усл. ед.
2 Производство электроэнергии млрд. 1945-1975 31
кВт-ч
3 Производство » 1945-1975 31
гидроэлектроэнергии
4 Сумма вкладов населения млн. руб. 1950-1975 26
в сберкассы
5 Численность городского млн. чел. 1950-1976 27
населения на 1 января
6 Протяженность нефте- тыс. км 1955-1975 21
и нефтепродуктопроводов
7 Грузооборот нефте- ткм 1955-1975 21
и нефтепродуктопроводов
8 Урожайность зерна ц/га 1946-1975 30
9 Урожайность картофеля » 1946-1975 30
10 Урожайность овощей » 1946-1975 30
11 Производство яиц млрд. шт. 1946-1975 30
И с т о ч н и к . Статистические ежегодники «Народное хозяйство
СССР» за соответствующие годы.

V. Валовые инвестиции в 1960-1988 гг. в постоянных ценах,


млрд. дол.

Год США Западная Европа

1960 324,16 329,77


1961 324,01 346,85
1962 358,79 357,89,
1963 380,47 358,37
1964 400,98 414,83
1965 448,53 432,50
398
Продолжение

Год США Западная Европа

1966 472,57 446,36


1967 465,21 453,84
1968 493,93 474,55
1969 504,55 533,09
1970 460,37 589,93
1971 506,17 565,85
1972 543,46 563,13
1973 592,31 622,73
1974 552,49 659,49
1975 460,14 545,11
1976 528,35 612,37
1977 598,39 576,17
1978 654,37 534,92
1979 642,02 623,47
1980 577,15 663,32
1981 622,65 525,82
1982 522,77 569,41
1983 567,81 533,04
1984 739,75 569,60
1985 742,39 585,57
1986 744,54 629,35
1987 785,11 664,46
1988 814,13 720,89

* Прирост запасов + валовые капитальные вложения (Increment


in stocks + Gross fixed capital formation) пересчитаны в постоян-
ных ценах в долларах США 1985 г.
И с т о ч н и к . National Accounts, Main Aggregates, 1960-1988. -
Paris, 1990. -V.l.
ЛИТЕРАТУРА

К главам 1-8
1. Аллен Р. Дж. Математическая экономия. — М.: ИЛ, 1963.
2. Андерсон Т. Введение в многомерный статистический ана-
лиз. — М.: Физматгиз, 1963.
3. Андерсон Г. Статистический анализ временных рядов. —
М.: Мир, 1976.
4. Бартлетт М.С. Введение в теорию случайных процес-
сов. - М.: ИЛ, 1958.
5. Бокс Лж., Дженкис Г. Анализ временных рядов, прогноз и
управление. — М.: Мир, 1974. - Вып. 1.
6. Браун М. Теория и измерение технического прогресса. —
М.: Статистика, 1971.
7. Винер Н. Кибернетика или управление и связь в живот-
ном и машине. 2-е изд. — М.: Советское радио, 1968.
8. Гельфонд А.О. Исчисление конечных разностей. 3-е изд. -
М.: Наука, 1967.
9. Геминтерн В.И., Френкель A.A. Обобщенные модели ав-
торегрессии и скользящего среднего в анализе временных
рядов // Статистический анализ экономических времен-
ных рядов и прогнозирование. - М.: Наука, 1973.
10. Гренджер К., Хатанака М. Спектральный анализ времен-
ных рядов в экономике. - М.: Статистика, 1972.
11. Грицевич И.Г. Моделирование временных рядов с помо-
щью схем Бокса — Дженкинса // Математические методы
в экономике и международных отношениях. Вып. 3. Мето-
ды эконометрического моделирования. - М.: ИМЭМО АН
СССР, 1974.
12. Демиденко Е.З. Оценки параметров в нелинейной регрес-
сии. Серия «Математические методы в экономике и меж-
дународных отношениях», Вып. «Проблемы эконометричес-
кого моделирования». - М.: ИМЭМО АН СССР, 1972.
13. Дженкинс Г., Ватте Д. Спектральный анализ и его при-
ложения. Вып. 1 и 2. - М.: Мир, 1971, 1972. •
400
14. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. -
М.: Статистика, 1973.
15. Кейн Э. Экономическая статистика и эконометрия. Вып. 1
и 2. - М.: Статистика, 1977.
16. Кендалл М. Дж., Стьюарт А. Статистические выводы и
связи. - М.: Наука, 1973.
17. Кендалл М. Дж., Стьюарт А. Многомерный статистичес-
кий анализ и временные ряды. - М.: Наука, 1976.
18. Кильдишев Г.С, Френкель A.A. Анализ временных рядов
и прогнозирование. - М.: Статистика, 1973.
19. Клеандров Д.И., Френкель A.A. Прогнозирование эконо-
мических показателей с помощью метода простого экспо-
ненциального сглаживания // Статистический анализ эко-
номических временных рядов и прогнозирование. - М.:
Наука, 1973.
20. Лэнинг Дж.Х., Бэттин Р.Г. Случайные процессы в зада-
чах автоматического управления. — М.:.ИЛ, 1958.
21. Лукашин Ю.П. Анализ временных рядов по методу интег-
рированной авторегрессии — скользящей средней. Статис-
тические методы анализа (алгоритмы и программы). Вып.
5. - М.: ИМЭМО АН СССР, 1975.
22. Лукашин Ю.П. Программы адаптивных методов прогно-
зирования на Фортране-IV. - М.: ИМЭМО АН СССР, 1978.
23. Маленво Э. Статистические методы эконометрии. Вып. 1 и
2. - М.: Статистика, 1975, 1976.
24. Моррис У. Наука об управлении, байесовский подход. -
М.: Мир, 1971.
25. Налимов В.В. Теория эксперимента. - М.: Наука, 1971.
26. Налимов В.В., Чернова H.A. Статистические методы пла-
нирования экстремальных экспериментов. - М.: Наука,
1965.
27. Прогнозирование капиталистической экономики, пробле-
мы методологии/Отв. ред. А.И. Шапиро. — М.: Мысль, 1970.
28. Рывкин A.A., Сараджишвили В.Ю. Адаптивные методы
прогнозирования экономических временных рядов. Мате-
риалы к симпозиуму «Актуальные проблемы моделирова-
ния капиталистической экономики». Вып. 1. — М. — 1968.
29. Смирнов А.Д. К проблеме оптимального экономического
прогнозирования // Экономика и математические методы. -
Вып. 5 . - М . - 1966.-Т. 2.
30. Смирнов А.Д. Моделирование и прогнозирование социа-
листического воспроизводства, - М.: Экономика, 1970.
401
31. Тинтпнер Г. Введение в эконометрию. - М.: Статистика,
1965.
32. Тутпубалин В.Н. Статистическая обработка рядов наблю-
дений. — М.: Знание, 1973.
33. Френкель А. Математические методы анализа динамики и
прогнозирования производительности труда. - М.: Эконо-
мика, 1972.
34. Чегпыркин Е.М. Статистические методы прогнозирования.
— 2-е изд. — М.: Статистика, 1977.
35. Эшби У. Росс. Конструкция мозга, происхождение адап-
тивного поведения. — М.: Мир, 1964.
36. Яглом A.M. Корреляционная теория процессов со случай-
ными стационарными я-ми приращениями. Матем. с б . -
Т. 37 (79), № 1. - М.: Изд-во АН СССР, 1955.
37. Amemiya Т., Wu R.Y. The effect of aggregation on prediction
in the autoregressive model. — J. Amer. Statist. Ass.. 1972. —
Vol. 67. - PP. 628-632.
38. Bailey M.G« Prediction of an autoregressive variables subject
both to disturbances and to errors of observation //J. Amer.
Statist. Ass. - 1965. Vol. 60. - PP. 164-181.
39. Batty M. Monitoring an exponential smoothing forecasting
system // Oper. Res. Quart. - 1969. - Vol. 20. - № 3.
40. Bates IM., Granger C.W.I. The combination of forecasts //
Oper. Res. Quart. - 1969. - Vol. 20. - № 4.
41. Bhattacharyya M.N. Forecasting the demand for telephones
in Australia // Applied Statistics. - .1974. - Vol. 23. - № 1.
42. Bossons I. The effects of parameter misspecification and
nonstationarity on the applicability of adaptive forecasts //
Management Science, - 1966. - Vol. 12. - № 9.
43. Box G.E.P. Evolutionary operation: a method for increasing
industrial productivity//Applied Statistics. - 1957. - Vol. 6. -
№2.
44. Box G.E.P., Jenkins G.M. Some statistical aspects of adaptive
optimization and control //J. of the Royal Stat. Soc. - 1962. -
Ser. B. - Vol. 24. - № 2.
45. Box G.E.P., Pierce D.A. Distribution of residual
autocorrelation in autoregressive - integrated moving
average time series models //J. Amer. Statist. Ass. - 1970. -
Vol. 65. - PP. 64.
46. Brown R.G. Statistical forecasting for inventory control. -
N.Y., 1959.
402
47. Brown R.G. Smoothing forecasting and prediction of discrete
time series. - N.Y., 1963.
48. Brown R.G., Meyer R.F. The fundamental theorum of
exponential smoothing//Oper. Res. - 1961. - Vol.9. - № 5.
49. Chatfield C, Prothero D.L. Box-Jenkins seasonal forecasting
problems in a case study //J. of the Royal Stat. Soc, 1973. -
Ser. A. - Vol. 136. - PP. 295-352.
50. Chow WM. Adaptive control of the exponential smoothing
constant. // J. of Indust. Engineering. - 1965. - Vol. 16. -
№5.
51. Cogger КО- The optimality of general-order exponential
smoothing // Oper. Res. - 1974. - Vol. 22. - № 4.
52. Cohen G,D. A note on exponential smoothing and
autocorrelated inputs // Oper. Res. - 1963. - Vol. 11. - № 3.
53. Cox D.R. Prediction by exponentially weighted moving
averages and related methods //J. of the Royal Stat. Soc. -
1961.-Vol. 2 3 . - № 2.
54. Davies N., Pate M.B., Frost M.G. Maximum autocorrelations
for moving average processes // Biometrika. —1974. — Vol. 61. —
№ 1.
55. Dobbie J.M. Forecasting periodic trends by exponential
smoothing // Oper. Res. - 1963. - Vol. 11. - PP. 908-918.
56. Durbin J. Testing for serial correlation in least-squares
regression when some of the regressors are lagged dependent
variables // Econometrica. - 1970. - Vol. 38. - PP. 410—421.
57. Eilon S., Elmaleh J. Adaptive limits in inventory control //
Management Science. - 1970. - Vol. 16. - № 8.
58. D'Esopo D.A. A note on forecasting by the exponential
smoothing operator // Oper. Res. - 1961. - Vol. 9. - № 5.
59. Fagan T.L, Wilson M.A, Exponential smoothing for prediction
of reliability growth // Industrial Quality Control. - 1967. -
Vol. 23. - № 7.
60. Geoffrian AM. A summary of exponential smoothing // J. of
Industr. Engineering. - 1962. - Vol. 13. - № 4.
61. Goodman M.L. A new look at higher-order exponential
smoothing // Oper. Res. - 1974. - Vol. 24. - № 4.
62. Granger C.W., Morris MJ. Time series modelling and
interpretation //J. of the Royal Stat. Soc. - 1976. - Ser. A. -
Vol. 139. - Part. 2.
63. Green M., Harisson PJ. Fashion forecasting for a mail order
company using a Bayesian approach // Oper. Res. Quart. -
1973. - Vol. 24. - № 2.
403
64. Harisson P.J., Davies O.L. The use of cumulative sum
(CUSUM) techniques for the control of routine forecasts of
product demand // Oper. Res. - 1964. - Vol. 12. - № 2.
65. Harisson PJ. Short-term sales forecasting. - Applied
Statistics, J. of the Royal Stat. Soc. - 1965, - Ser. С - Vol.
14. - № 2,3.
66. Harisson P.J., Stevens C.F. A Bayesian approach to short-
term forecasting // Oper. Res. Quart. - 1971. - Vol. 22. - № 4.
67. Harisson P.S. Exponential smoothing and short-term sales
forecasting//Management Science. — 1967. — Vol. 13. — №11.
68. Holt C.C. Forecasting trends and seasonals by exponentially
weighted moving averages // O.N.R. Memorandum, Carnegie
Inst. of Technology. - 1957. - № 2.
69. Kaiman R.E. New methods in Wiener filtering // Proceedings
of the first symposium on engineering applications of random
function theory and probability: N.Y., L., 1964.
70. Kaiman R.E., Вису R.S. New result in linear filtering and
prediction theory //J. of Basic Engineering (Trans. ASME). —
1961. - Vol. 83 D.
71. Kendall M.G. Time-series. - L.: 1973.
72. Landi D.M., Johnson B. McK. Optimal linear inventory control
and first order exponential smoothing // Oper. Res. - 1967.
- Vol. 15. - No 2.
73. Markland R.E. A comparative study of demand forecasting
techniques for military holicopter spare parts // Naval
Research Logistics Quarter. - 1970. - Vol. 17. - № 1.
74. Marquardt D.W. An algorithm for least-squares estimation
of nonlinear parameters / / J . of Soc. for Industr. and Appl.
Math. - 1963. - Vol. 11. - № 2.
75. McClain J.O. Dynamics of exponential smoothing with trends
and seasonal terms // Management Science. - 1974. - Vol.
20. - PP. 1300-1304.
76. McClain J.O., Thomas L.J. Response-variance trade-offs in
adaptive forecasting // Oper. Res. - 1973. - Vol. 21. - PP.
554-568.
77. McKenzie Ed. An analysis of general exponential smoothing
// Oper. Res. - 1976. - Vol. 24. - № 1.
78. McKenzie Ed. A comparison of standard forecasting systems
with the Box-Jenkins Approach // The Statistician. - 1974. -
Vol. 23. - № 2.
79. Montgomery D.C. An introduction to short-term forecasting
// J. of Indust. Engineering. - 1968. - Vol. 19. - № 10.
404
80. Montgomery D.C. Adaptive control of exponential smoothing
parameters by evolutionary operation // AI IE Transactions. -
1970. - Vol. 2. - № 3.
81. Montgomery D.C. A note on forecasting with adaptive
filtering // Oper. Res. Quart. - 1977. - Vol. 28. - № li.
82. Morris R.N., Glassey C.R. The dynamics and statistics of
exponential smoothing operators // Oper. Res. - 1963. -
Vol. 1 1 . - P P . 561-569.
83. Muir A. Automatic sales forecasting // Brit. Computer J. —
1958.-Vol. l . - P . 113.
84. Muth J.F. Optimal properties of exponentially weighted fore-
casts of time series with permanent and transitory components
// J. Amer. Statist. Ass. - 1960. - Vol. 55. - P. 299.
85. Nelson Ch.R. The prediction performance of the FRB-MIT-
PENN model of the U.S. economy// The American Economic
Review. - 1972. - Vol. LXII. - № 5.
86. Nelson Ch.R. Applied time series analysis for managerial
forecasting.- San Francisco, 1973.
87. Nelson Ch.R. The first order moving average process:
identification, estimation and prediction// J. of Econometrics. —
1974. - Vol. 2. - PP. 121-141.
88. Nelson Ch.R. The interpretation of R2 in autoregressive-moving
average time series models // The American Statistician. -
1976. - Vol. 30. - № 4.
89. Nerlove M., Wage S. The optimality of adaptive forecasting
// Management Science. - 1964. - Vol. 10. - № 2.
90. Newbold P., Granger C.WJ. Experience with forecasting
univariate time series and the combination of forecasts //
J. of the Royal Stat. Soc. - 1974. - Ser. A. - Vol. 137. - Part. 2.
91. Packer AM. Simulation and adaptive forecasting as applied
to inventory control // Oper. Res. - 1967. - Vol. 15. - № 4.
92. Pandit S.M., Wu S.M. Exponential smoothing as a special
case of a linear stochastic system // Oper. Res. - 1974. -
Vol. 24. - № 4.
93. Regeis C.C. Exponential forecasting: some new variations /
/ Management Science. - 1969. - Vol. 15. - № 5.
94. Quenouille M.H. Approximate tests of correlation in time
series // J. of the Royal Stat. Soc. - 1949. Ser. B. - Vol. 11.-
№68.
95. Quenouille M.H. The analysis of multiple time series. - L.:
1957.
405
96. Rao A.G., Shapiro A. Adaptive smoothing using evolutionary
spectra // Management Science. — 1970. — Vol. 17. — № 3.
96a. Letters. Management Science. - 1971. - Vol. 18. - № 1.
97. Roberts S.D., Reed R.Jr. The development of a self-adaptive
forecasting technique //AI IE Transaction. - 1969. - Vol. 1. -
№4.
98. Roberts S.W. Control chart tests based on geometric moving
averages //Technometrics. - 1959. - Vol. 1. - PP. 239-250.
99. Shone M.L Viewpoint // Oper. Res. Quart. - 1967. - Vol. 18. -
P. 318.
100. Smith T.M.F. A comparison of some models for predicting
time series subject to seasonal variation //The Statistician. -
1967. - Vol. 17. - PP. 301-305.
101. Spendley W., Hext G.R., Himsworth F.R. Sequential
application of simplex designs in optimization and evolutionary
operation // Technometrics. - 1962. - Vol. 4. - № 4.
102. Taylor C.J. A simple graphical method of exponential
smoothing with a linear trend // Oper. Res. Quart. - 1967. —
Vol. 1 8 . - № 1.
103. Theil H., Wage S. Some observations on adaptive forecasting
// Management Science. - 1964. - Vol. 10. - Mb 2.
,104. Trigg D.W. Monitoring a forecasting system // Oper. Res.
Quart. - 1964. - Vol. 15. - № 3.
105. Trigg D.W., Leach A.G. Exponential smoothing with an adaptive
response rate // Oper. Res. Quart. - 1967. - Vol. 18. - № 1.
106. Wade R.C. A technique for initializing exponential smoothing
forecasts // Management Science. - 1967. - Vol. 13. - № 7.
107. Wagle B.V. A review of two statistical aids in forecasting /
/ The Statistician. - 1965. - Vol. 15. - № 2.
108. Ward D.H. Comparison of different systems of exponentially
weighted prediction //The Statistician. L. - 1963. - Vol. 13.
-№3.
109. Wheelwright S.C., Makridakis S. Forecasting methods for
management. - N.Y.: 1973.
110. Wheelwright S.C., Makridakis S. Forecasting with adaptive
filtering. - Revue Francaise d'Automatique d' Informatique
et de Recherche Operationelle. - Paris: 1973. Ser. V. -
Vol.7.-№ 1.
111. Wheelwright S.C., Makridakis S. An examination of the use
of adaptive filtering in forecasting // Oper. Res. Quart. -
1973. - Vol. 24. - № 1.
406
112. Winer N. Extrapolation, interpolation and smoothing of
stationary time series. - N.Y.: 1949.
113. Winters P.R. Forecasting sales by exponentially weighted
moving averages //Management Science. - 1960. - Vol. 6. -
№3.
114. Zadeh L.A. On the definition of adaptivity // Proceedings of
the IRE. - 1963. - Vol. 51. - № 3.
115. Zellner A., Palm F. Time series analysis and simultaneous
equation econometric models // J. Econometrics. - 1974. -
Vol. 2. - № 1.

К главам 9-16
116. Айвазян С.А., Мхитарян B.C. Прикладная статистика и
основы эконометрики: Учебник. — М.: ЮНИТИ, 1998.
117. Алберт А. Регрессия, псевдорегрессия и рекуррентное
оценивание. — М.: Наука, 1977.
118. Доугерти К. Введение в эконометрику, университетский
учебник / Пер. с англ. - М.: Инфра-М, 1999.
119. Канторович Г.Г. Анализ временных рядов//Экономичес-
кий журнал Высшей школы экономики. — 2002. - Т. 6. -
№ 1. - С. 85-116. - № 2. - С. 251-273. - № З.-С. 379-401.
120. Кендэл М. Временные ряды. - М.: Финансы и статистика,
1981.
121. Лукашин Ю.П. Адаптивные методы краткосрочного про-
гнозирования. - М.: Статистика, 1979.
122. Лукашин Ю.П. Адаптивный корреляционный анализ эко-
номических показателей//Вестник статистики. — 1991. -
№ 9. - С. 78-79.
123. Лукашин Ю.П. Анализ распределения кассовых остатков:
адаптивная гистограмма, проблема оптимизации // Эко-
номика и математические методы. -1997. —Т. 33. - Вып. 3. -
С. 90-97.
124. Лукашин Ю.П. Линейная регрессия с переменными пара-
метрами. - М.: Финансы и статистика, 1992. - 256 с.
125. Лукашин Ю.П. Нетрадиционный корреляционный анализ
временных рядов // Экономика и математические мето-
ды.- 1992. - Т. 28. - Вып. 3. - С. 406-413.
126. Лукашин Ю.П. О возможности краткосрочного прогнозиро-
вания курсов валют с помощью простейших статистических
моделей // Вестник МГУ. -1990. - Сер. 6. Экономика. -
№ 1.-С. 75-84.
407
127. Лукашин Ю.П. Оптимизация структуры портфеля ценных
бумаг // Экономика и математические методы. — 1995. —
Т. 31. - Вып. 1.-С. 138-150.
128. Лукашин Ю.П. Проверка гипотез в эконометрике. — М.:
ИМЭМО РАН, 2002.
129. Лукашин Ю.П. Фазовый анализ временных рядов // Эко-
номика и математические методы. — 1993. —Т. 29. — Вып. 3. —
С. 503-511.
130. Лукашин Ю.П., Лушин A.C. Статистическое моделирова-
ние торгов на Московской межбанковской валютной бир-
же // Экономика и математические методы. — 1994. —
Т. 30. - Вып. 3. - С. 84-97.
131. Эконометрика: Учебник/Под ред. И.И. Елисеевой.- М.:
Финансы и статистика, 2002.
132. Akaike H. Information theory and the extension of the
maximum likelihood principle. /In 'Proceeding of the Second
International symposium on information theory', eds. B.N.
Petrov and F. Csaki, Budapest. - 1973. - PP. 267-281.
133. Akaike H. A new look at the statistical identification model /
/IEEE: Trans, auto. Control. - 1974. - V. 19. - PP. 716-723.
134. Bewley /?. The direct estimation of the equilibrium response
in a linear dynamic model //Economics letters. — 1979. —
V . 5 5 . - PP. 251-276.
135. Bollerslev T. Generalized autoregressive conditional
heteroscedasticity//Journal of econometrics. - 1986. — V. 31. -
PP. 307-327.
136. Davidson I.E.H., Hendry D.F., Srba F., Yeo S. Econometric
modelling of the aggregate time—series relationship between
consumers' expenditure and income in the United Kingdom
//Economic journal. - 1978. - V. 88 (352). - PP. 661-692.
137. Dickey D.A., Fuller W.A. Distribution of the estimators for
autoregressive time-series with a unit root //Journal of the
American statistical association. - 1979. - V. 74. - PP.
427-431.
138. Dickey D.A., Fuller W.A. Likelihood ratio statistics for
autoregressive time series with a unit root // Econometrica. —
1981. - V. 49. - №. 4. - PP. 1057-1072.
139. Dickey D.A., Bell W.R., Miller R.B. Unit roots in time series
models: Tests and applications //American statistician. -
1986. - V. 40. - PP. 12-26.
140. Enders W. Applied Econometric Time Series. - N.Y.: John
Wiley & Sons, Inc. - 1995.
408
141. Engle R.F. Autoregressive conditional heteroscedasticity with
estimates of the variance of United Kingdom inflation //
Econometrica. - 1982. - V. 50. - PP. 987-1007.
142. Engle R.F., Granger C.W.J. Co-integration and error
correction: representation, estimation and testing //
Econometrica. - 1987. - V. 55. - PP. 251-276.
143. Granger C. W.J., Newbold P. Forecasting economic time series.
nd
2 ed. - N.Y.: Academic Press, 1986.
144. Green W. H. Econometric Analysis. - 3-d ed., International
Edition.
145. Gujarati D.N. Basic Econometrics. - 2-nd ed. McGraw-Hill
Book Company, International Edition, Singapore, 1988.
146. Harvey A.C. The econometric analysis of time series. -
London: Philip Allan, 1981.
147. Klien P., Moore H. Monitoring grows cycles in market-oriented
countries. — Cambridge, 1985.
148. Lukashin Y.P. An adaptive method of regression analysis//
Statistical Analysis and Forecasting of Economic Structural
Change, Peter Hackle, Ed. - IIASA, Springer-Verlag, 1989. -
Ch.13.-PP. 209-216.
149. Lukashin Y.P. Analysis of data when constructing an adaptive
regression model // Model-Oriented Data Analysis,
Proceedings. V. Fedorov, H. Lauter, eds. - Eisenach, GDR/
Lecture Notes in Economics and Mathematical Systems. -
Springer-Verlag, 1987. - PP. 189-194.
150. Lukashin Y.P. Econometric Analysis of Managers Judgement
on the Determinants of the Financial Situation in Russia. -
Research Memorandum № 98/8 ACE Project, University of
Leicester, 1998.
151. Lukashin Y.P. Econometric Analysis of Managers'
Judgements on the Determinants of the Financial Situation
in Russia //Economics of Planning. Kluwer Academic
Publishers.- 2000. - V.33. Special issue. - PP. 85-101.
152. Mintz J. Cyclical fluctuations in the exports of the US since
1879. - N.Y., 1967.
153. Nelson C.R., Plosser C.I. Trends and random walks in
macroeconomic time series: some evidence and implications
//Journal, of monetary economics. - 1982. - V. 10. - PP.
139-162.
154. Nelson D.B. Conditional heteroscedasticity in asset returns:
a new approach //Econometrica. - 1991. — V, 59. - PP.
347-370.
409
155. Nelson C.R., Kang H. Pitfalls in the use of time as explanatory
variable in regression //Journal of business and economic
statistics. - 1984. - V. 2. - PP. 73-82.
156. Pesaran M.& Pesaran B. Working with Microfit 4.0,
Interactive Econometric Analysis. - Oxford: Oxford
University Press, 1997.
157. Raj В., UllahA. Econometrics: a varying coefficient approach. —
L.: Croom Helm, 1981.
158. Ramu Ramanathan. Introductory Econometrics with
th
Applications. — 4 ed., Harcourt, Inc. — 1998.
159. Sargan J.D. Wages and prices in the United Kingdom: A
study in econometric methodology // Econometrics analysis
for national economic planning. Eds. Hart P.E., Mills G.,
Whitaker J.K. - London: Butterworth, 1964.
160. Spriet LA, Vansteekiste G.C. Computer-aided modeling and
simulation/ L., N.Y., Paris: Academic Press, 1982.
161. Von 1. Griese, Matt G. Beschreibung des Verfahrens der
adaptiven Einflussgrossenkombination. In Prognoserechnung/
Herausgegeben von Peter Mertens. - Wurzburg-Wien:
Physica-Verlag, 1973. - PP. 160-166.
162. Wickens M.R., Breusch T.S. Dynamic specification, the long
run and the estimation of transformed regression models //
Economic journal. - 1988 (supplement). - PP. 189-205.
ОГЛАВЛЕНИЕ

Предисловие 3
Введение 6

Глава 1. ПРОСТЕЙШИЕ АДАПТИВНЫЕ МОДЕЛИ


И ИХ СВОЙСТВА 14
§ 1. Временные ряды и стохастические процессы 14
§ 2, Экспоненциальное сглаживание 17
§ 3. Начальные условия экспоненциального
сглаживания 22
§ 4. Выбор постоянной сглаживания 24
§ 5, Реакция модели на некоторые стандартные
входные потоки данных 29
§ 6. Свойство оптимальности 34
§ 7. Модели линейного роста 35
§ 8. Стохастический процесс Тейла и Вейджа 37
§ 9. Примеры 41

Глава 2. РАЗВИТИЕ МОДЕЛЕЙ С ПОСТОЯННЫМИ


ПАРАМЕТРАМИ АДАПТАЦИИ 47
§ 1. Адаптивная модель для изучения эволюциони-
рующих законов распределения вероятностей 47
§ 2. Сезонные модели 50
§ 3. Аппроксимация полиномиальных трендов
с помощью многократного сглаживания 62
§ 4. Обобщенная модель Брауна 76
§ 5. Примеры 88

Глава 3. АДАПТИВНАЯ МОДЕЛЬ ПРОГНОЗИРОВАНИЯ


ВРЕМЕННОГО РЯДА, ГЕНЕРИРУЕМОГО
АВТОРЕГРЕССИОННОЙ СХЕМОЙ
С ДРЕЙФУЮЩИМИ КОЭФФИЦИЕНТАМИ 90
§ 1. Общая схема адаптивного фильтра 90
§ 2. Адаптация коэффициентов модели авторегрессии... 93
9 6
§ 3. Примеры
411
Г л а в а 4. МОДЕЛИ С АДАПТИВНЫМИ
ПАРАМЕТРАМИ АДАПТАЦИИ 98
§ 1. Скорость реакции как функция следящего
контрольного сигнала (модель Тригга — Лича) 98
§ 2. Регулирование параметра адаптации
по изменениям спектральных характеристик 105
§ 3. Адаптация параметра методом эволюции 114
Г л а в а 5. АДАПТИВНЫЕ КОМБИНИРОВАННЫЕ
МОДЕЛ И 121
§ 1. Адаптивная селективная модель 121
§ 2. Адаптивная гибридная модель 124
§ 3. Примеры 126
Г л а в а 6. БАЙЕСОВСКИЙ ПОДХОД К КРАТКО-
СРОЧНОМУ ПРОГНОЗИРОВАНИЮ 136
§ 1. Модель с множеством состояний 136
§ 2. Байесовский подход 140
§ 3. Реализация метода 147
§ 4. Сравнение методов 155
Г л а в а 7. МОДЕЛИ АВТОРЕГРЕССИИ - СКОЛЬЗЯЩЕГО
СРЕДНЕГО (метод Бокса - Дженкинса) 160
§ 1. Общее описание моделей и их свойств 160
§ 2. Идентификация моделей.
Интерпретация R2 в моделях АРСС 172
§ 3. Оценивание моделей и прогнозирование 182
§ 4. Прогнозирование после логарифмического
преобразования 196
§ 5. Агрегирование рядов и моделей.... 198
§ 6. Примеры 200
Г л а в а 8. МОДЕЛИРОВАНИЕ ВЗАИМОСВЯЗАННЫХ
ВРЕМЕННЫХ РЯДОВ 209
§ 1. Анализ линейных динамических
эконометрических моделей 209
§ 2. Адаптивная модель множественной
регрессии ..„., 214
§ 3. Адаптивная модель производственной функции... 218
Г л а в а 9. НЕТРАДИЦИОННЫЙ КОРРЕЛЯЦИОННЫЙ
АНАЛИЗ ВРЕМЕННЫХ РЯДОВ 226
§ 1. Условия применимости традиционного
корреляционного анализа 226
§ 2. Постановка проблемы 227
§ 3. Модифицированный коэффициент корреляции 229
412
§ 4. Адаптивный коэффициент корреляции 230
§ 5. Корреляционный анализ отклонений
от заданных уровней 232
§ 6. Условный коэффициент корреляции 234
§ 7. Вероятностный коэффициент корреляции 235
§ 8. Пример 237
Гл а в а 10. ФАЗОВЫЙ АНАЛИЗ ВРЕМЕННЫХ
РЯДОВ 240
§ 1. Постановка проблемы 240
§ 2. Разбиение временного ряда на фазы 241
§ 3. Фазовый анализ инвестиционных циклов
в США и Западной Европе 247
Г л а в а 11. АДАПТИВНАЯ ГИСТОГРАММА,
ПРОБЛЕМА ОПТИМИЗАЦИИ 256
§ 1. Постановка проблемы 256
§ 2. Адаптивная процедура обновления
гистограммы , 257
§ 3. Проблемы оптимальности адаптивной
процедуры обновления гистограммы 258
§ 4. Адаптивный анализ распределения
кассовых остатков 264
Глава 12. КРИТЕРИИ ДИККИ - ФУЛЛЕРА
ДЛЯ ИДЕНТИФИКАЦИИ ХАРАКТЕРА
ТРЕНДА (обнаружение единичных корней) 268
§ 1. Детерминированный и случайный
характер тренда 268
§ 2. Ложные тренды 270
§ 3. Критерий Дикки - Фуллера для обнаружения
единичных корней 273
§ 4. Расширенный критерий Дикки — Фуллера 277
§ 5. Современные методы построения
модели АРИСС 287
Г л а в а 13. ИНТЕГРИРОВАННОСТЬ И КОИНТЕГРИ-
РОВАННОСТЬ ПЕРЕМЕННЫХ 296
§ 1. Интегрированностьи коинтегрированность
двух переменных 296
§ 2. Коинтеграция многих переменных 299
§ 3. Коинтеграция и модели корректировки ошибок 304
§ 4. Критерии коинтеграции 308
413
ГлаваН. РЕКУРРЕНТНЫЕ АЛГОРИТМЫ
ОЦЕНКИ ТРАЕКТОРИЙ ПАРАМЕТРОВ
МНОЖЕСТВЕННОЙ РЕГРЕССИИ 310
§ 1. Рекуррентное оценивание параметров
регрессии 311
§ 2. Скользящая регрессия 315
§ 3. Взвешенная регрессия 316
§ 4. Рекуррентное оценивание параметров
взвешенной регрессии 320
§ 5. Оценка траекторий параметров регрессии
методом адаптивных ковариаций 324
§ 6. Связь адаптивной регрессии с адаптивным
корреляционным анализом 328
§ 7. Модели с авторегрессионной условной
гетероскедастичностью 330
Г л а в а 15. КРАТКОСРОЧНОЕ ПРОГНОЗИРОВАНИЕ
КУРСОВ ВАЛЮТ С ПОМОЩЬЮ
СТАТИСТИЧЕСКИХ МОДЕЛЕЙ 337
§ 1. Постановка проблемы 338
§ 2. Анализ случайности движения курсов валют 340
§ 3. Адаптивная модель прогнозирования
временного ряда с неустойчивым характером
колебаний , 342
§ 4. Прогнозирование курсов валют 346
Г л а в а 16. СТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
ВАЛЮТНЫХ АУКЦИОНОВ
НА МОСКОВСКОЙ МЕЖБАНКОВСКОЙ
ВАЛЮТНОЙ БИРЖЕ 352
§ 1. Цели исследования 352
§ 2. Теоретические модели валютных торгов 353
§ 3. Анализ исходных данных 360
§ 4. Модели торгов для растущего курса 362
§ 5. Модели торгов для падающего валютного курса... 370
§ 6. Оценка качества статистических моделей 373
§ 7. Возможные способы использования моделей 376
Заключение 378

Приложения 381
Литература 400
Учебное издание

Лукашин Юрий Павлович

АДАПТИВНЫЕ МЕТОДЫ
КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ
ВРЕМЕННЫХ РЯДОВ

Ответственный за выпуск Л.А. Табакова


Младший редактор H.A. Федорова
Художественный редактор Ю.И. Артюхов
Технический редактор Т.С. Маринина
Корректор Г.В. Хлопцева
Компьютерная верстка Е.Ф. Тимохиной
Обложка художника О.В. Толмачева

И Б № 4637

Подписано в печать 30.05.2003. Формат 60x88/i6


Гарнитура «Тайме». Печать офсетная
Усл. п.л. 25,48. Уч. изд.-л. 21,03
Тираж 3000 экз. Заказ 1866. «С» 149

Издательство «Финансы и статистика»


101000, Москва, ул. Покровка, 7
Телефоны: (095) 925-47-08, 925-35-02, факс (095) 925-09-57
E-mail: mail@finstat.ru http: // www.finstat.ru

ГУЛ «Великолукскаягородскаятипография»
Комитета по средствам массовой информации Псковской области,
182100, Великие Луки, ул. Полиграфистов, 78/12
Тел./факс: (811-53) 3-62-95
E-mail: VTL@MART.RU

Вам также может понравиться