Вы находитесь на странице: 1из 316

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ


УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«МОРДОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИМ. Н. П. ОГАРЕВА»

Сажин Ю.В., Иванова И.А.

ЭКОНОМЕТРИКА
УЧЕБНИК

Рекомендован Учебно-методическим объединением по образованию в


области статистики в качестве учебника для студентов высших
учебных заведений, обучающихся по направлению «Статистика» и
другим экономическим направлениям

Саранск 2014
1
УДК 330.43

РЕЦЕНЗЕНТЫ

Кафедра статистики и эконометрики Оренбургского государственного


университета (заведующий кафедрой − доктор экономических наук, профессор
В.Н.Афанасьев)

Заведующий отделением статистики, демографии и эконометрики Московского


государственного университета «Высшая школа экономики» − доктор экономических
наук, профессор В.С. Мхитарян

Сажин Ю.В., Иванова И.А.


Эконометрика: учебник/ Ю.В. Сажин, И.А. Иванова; Мордов. гос. ун-т. –
Саранск, 2014. – 316 с.

Учебник содержит систематическое изложение основных разделов эконометрики.


Подробно изучаются модели парной и множественной регрессии. Отдельные главы
посвящены таким темам, как линейные регрессионные модели с гетероскедастичными и
автокоррелированными остатками, обобщенный метод наименьших квадратов,
регрессионные модели с переменной структурой, анализ и моделирование одномерных
временных рядов, динамические эконометрические модели, системы эконометрических
уравнений, типологическая регрессия, кластерный анализ.
Учебник предназначен для студентов, аспирантов, преподавателей, а также
специалистов в области прикладной экономики и статистики.

2
ОГЛАВЛЕНИЕ

Введение 6
1 Предмет эконометрики 9
Вопросы для самопроверки 13
2 Линейная регрессионная модель с одной объясняющей переменной 14
2.1 Метод наименьших квадратов оценки параметров регрессии 14
2.2 Матричный способ оценки параметров линейного уравнения
регрессии с одной объясняющей переменной 17
2.3 Анализ вариации зависимой переменной в регрессии.
Дисперсионный анализ. F-статистика (критерий Фишера) 23
2.4 Коэффициент детерминации (R2 – статистика) и его свойства 25
2.5 Доверительные интервалы оценок параметров уравнения
регрессии и проверка гипотез об их значимости. Критерий Стьюдента
(t-тест) 27
2.6 Средняя относительная ошибка аппроксимации 29
Лабораторная работа №1 29
Тесты 30
Вопросы для самопроверки 36
3 Нелинейные регрессионные уравнения с одной объясняющей
переменной 37
3.1 Линеаризация регрессионных моделей с одной объясняющей
переменной 37
3.2 Коэффициенты эластичности и абсолютные изменения показателя 42
Лабораторная работа №2 43
Тесты 43
3.3 Производственная функция как частный случай нелинейной
регрессионной модели 46
Лабораторная работа №3 50
Вопросы для самопроверки 51
4 Линейная регрессионная модель с несколькими объясняющими
переменными 52
4.1 Классическая линейная модель множественной регрессии
(КЛММР) 52
4.2 Мультиколлинеарность 56
4.3 Выбор функциональной формы множественной регрессионной
модели 59
4.4 Оценка параметров линейного уравнения множественной
регрессии 60
4.5 Множественная корреляция 64
4.6 Частные F-критерии 65
Лабораторная работа №4 67
Тесты 69
Вопросы для самопроверки 73
3
5 Обобщенная линейная модель множественной регрессии (ОЛММР) 74
5.1 Линейные регрессионные модели с гетероскедастичными
остатками 74
Лабораторная работа №5 87
Лабораторная работа №6 87
5.2 Обобщенный метод наименьших квадратов 88
5.3 Линейные регрессионные модели с автокоррелированными
остатками 91
Лабораторная работа №7 96
Тесты 96
Вопросы для самопроверки 98
6 Регрессионные модели с переменной структурой 99
6.1 Фиктивные переменные в регрессионном анализе 99
6.2 Моделирование динамики экономического процесса при наличии
структурных изменений 107
Лабораторная работа №8 112
Вопросы для самопроверки 112
7 Анализ и моделирование одномерных временных рядов 116
7.1 Основные элементы временного ряда. Модели стационарных и
нестационарных временных рядов 116
7.2 Автокорреляция уровней временного ряда. Выявление структуры
временного ряда с помощью анализа автокорреляционной функции 120
7.3 Процедуры предварительного анализа данных 122
7.4 Моделирование тенденции временного ряда 137
7.5 Моделирование сезонных и циклических колебаний 139
Лабораторная работа №9 144
7.6 Оценка качества построенных моделей 144
Лабораторная работа № 10 152
Тесты 152
Вопросы для самопроверки 156
8 Динамические эконометрические модели 157
8.1 Регрессионные модели с распределенным лагом 157
8.2 Распределенный лаг Ш. Алмона (модель полиноминальных лагов) 161
Лабораторная работа №11 167
8.3 Геометрическая лаговая структура Койка 167
8.4 Модель частичного приспособления 169
8.5 Модель авторегрессии 170
8.6 Модель адаптивных ожиданий 172
8.7 Автокорреляция в остатках авторегрессионной модели
Обнаружение и устранение. 174
Лабораторная работа №12 178
Вопросы для самопроверки 179
9 Системы эконометрических уравнений 180
9.1 Структурная и приведенная формы системы одновременных 181
4
уравнений (СОУ)
9.2 Проблема идентификации в системах одновременных уравнений 183
9.3 Методы оценивания параметров структурной модели СОУ 187
Лабораторная работа №13 192
Лабораторная работа №14 193
Тесты 193
Вопросы для самопроверки 196
10 Типологическая регрессия. Кластерный анализ 197
Лабораторная работа №15 218
Вопросы для самопроверки 218
Приложение 1 219
Приложение 2 227
Приложение 3 240
Приложение 4 253
Приложение 5 256
Приложение 6 260
Приложение 7 266
Приложение 8 272
Приложение 9 274
Приложение 10 281
Приложение 11 311
Приложение 12 314
Библиографический список 315

5
ВВЕДЕНИЕ

Эконометрика – дисциплина, объединяющая совокупность


теоретических результатов, методов и приемов, позволяющих на базе
экономической теории, экономической статистики и
математикостатистического инструментария получать количественное
выражение качественным закономерностям.
«Эконометрика позволяет проводить количественный анализ реальных
экономических явлений, основываясь на современном развитии теории и
наблюдениях, связанных с методами получения выводов» (Самуэльсон)1.
Современные социально-экономические процессы и явления зависят от
большого количества факторов, их определяющих. В связи с этим
квалифицированному специалисту необходимо не только иметь четкие
представления об основных направлениях развития экономики, но и уметь
учитывать сложное взаимосвязанное многообразие факторов, оказывающих
существенное влияние на изучаемый процесс. Такие исследования
невозможно проводить без знаний основ теории вероятностей,
математической статистики, многомерных статистических методов, т.е.
дисциплин, позволяющих исследователю разобраться в огромном количестве
стохастической информации и среди множества различных вероятностных
моделей выбрать единственную, наилучшим образом отражающую
изучаемый процесс или явление.
Цели изучения учебной дисциплины «Эконометрика»:
 освоение различных способов выражения связей и закономерностей
развития экономических процессов и явлений через эконометрические
модели и методы проверки их адекватности, основанные на данных
статистических наблюдений;
 освоение современного инструментария эконометрического
моделирования.
Задачи учебной дисциплины «Эконометрика»:
 обработка массивов экономических данных в соответствии с
поставленной задачей, анализ, оценка, интерпретация полученных
результатов и обоснование выводов;
 построение эконометрических моделей исследуемых процессов,
явлений и объектов, относящихся к области профессиональной деятельности,
анализ и интерпретация полученных результатов;
 прогнозирование на основе эконометрических моделей поведение
экономических агентов, развитие экономических процессов и явлений, на
микро  и макроуровне.

1
Магнус, Ян Р. Эконометрика: Начальный курс: Учеб. для студ. вузов, обуч. по экон. спец.: Рек. М-вом
общ. и проф.образов. РФ / Магнус, Ян Р., Катышев, Павел Константинович, Пересецкий, Анатолий
Абрамович. - 6-изд., перераб. и доп. - М.: Дело, 2001. – С.11.

6
«Эконометрика» относится к профессиональному циклу дисциплин
базовой части.
Для изучения «Эконометрики» студентам необходимо знание основ:
 «Математического анализа»;
 «Линейной алгебры»;
 «Теории вероятностей и математической статистики»;
 «Информатики»,
 «Информационных систем в экономике»;
 «Статистики»;
 «Макроэкономики»;
 «Микроэкономики».
Основные положения «Эконометрики» должны быть использованы в
дальнейшем при изучении следующих дисциплин:
 «Бухгалтерский учет и анализ»;
 «Комплексный экономический анализ»;
 «Учет, анализ и аудит внешнеэкономической деятельности»;
 «Макроэкономическое планирование и прогнозирование»;
 «Эконометрическое моделирование»;
 «Анализ и прогнозирование временных рядов»;
 «Сегментарный анализ бизнеса».
Знания, приобретенные студентами при изучении "Эконометрики",
могут найти применение при выполнении творческих научно-
исследовательских индивидуальных работ, курсовом и дипломном
проектировании.
В результате изучения дисциплины «Эконометрика» студент должен:
Знать:
 основные понятия, категории и инструменты эконометрики;
 методы построения эконометрических моделей объектов, явлений и
процессов;
 основные проблемы и направления развития теории и практики
эконометрического моделирования.
Уметь:
 строить на основе описания ситуаций эконометрические модели,
анализировать и содержательно интерпретировать полученные результаты;
 прогнозировать на основе эконометрических моделей поведение
экономических агентов, развитие экономических процессов и явлений, на
микро  и макроуровне.
Владеть:
 методами и приемами анализа экономических явлений и процессов
с помощью эконометрических моделей;

7
 современными методиками расчета и анализа показателей,
характеризующих экономические процессы и явления на микро  и
макроуровне.
Основные виды занятий: лекции, лабораторные работы в
компьютерных классах.
Формы активных методов обучения - использование при
выполнении самостоятельных работ табличного редактора Microsoft Excel,
специализированных эконометрических ППП Statistica, EViews.
Текущий контроль знаний студентов осуществляется путем
индивидуального и коллективного опроса студентов на практических
занятиях, оценки аудиторной и домашней работы студентов по решению
индивидуальных контрольных работ.
Формами промежуточного контроля предусмотрены аудиторные
индивидуальные контрольные работы, коллоквиум, а также проверка
выполнения отдельных этапов учебно-исследовательской работы.
Рубежный контроль проводится путем экзамена, с помощью итогового
тестирования с использованием программы компьютерного тестирования и
защиты учебно-исследовательской работы.

8
1. Предмет эконометрики

В настоящее время отсутствует единое общепринятое определение


эконометрики. Приведем некоторые используемые в литературе определения
эконометрики.
Эконометрия (эконометрика), наука, изучающая конкретные
количественные взаимосвязи экономических объектов и процессов с
помощью математических и статистических методов и моделей2.
Эконометрика (Econometrics) - совокупность методов анализа связей
между различными экономическими показателями (факторами) на основании
реальных статистических данных с использованием аппарата теории
вероятностей и математической статистики. При помощи этих методов
можно выявлять новые, ранее не известные связи, уточнять или отвергать
гипотезы о существовании определенных связей между экономическими
показателями, предлагаемые экономической теорией3.
Наиболее часто используют определение эконометрики, которое
предложил известный российский ученый С.А. Айвазян.
Эконометрика – это самостоятельная научная дисциплина,
объединяющая совокупность теоретических результатов, приемов, методов и
моделей, предназначенная для того, что бы на базе экономической теории,
экономической статистики, математико-статистического инструментария
придавать конкретное количественное выражение общим закономерностям,
обусловленным экономической теорией взаимосвязей экономических
явлений и процессов4.
«Цель эконометрики – эмпирический вывод экономических законов.
Эконометрика дополняет теорию, используя реальные данные для проверки
и уточнения постулируемых отношений» (Э. Маленво).
«Эконометрика позволяет проводить количественный анализ реальных
экономических явлений, основываясь на современном развитии теории и
наблюдениях, связанных с методами получения выводов» (Самуэльсон).
«Основная задача эконометрики состоит в том, чтобы наполнить
эмпирическим содержанием априорные экономические рассуждения» (Л.
Клейн)5
В мировой науке эконометрика занимает достойное место.
Свидетельством этого является присуждение за наиболее выдающиеся
разработки в этой области Нобелевских премий по экономике Рагнару
Фришу и Яну Тильбергену (1969), Лоуренсу Клейну (1980), Трюгве

2
Большой энциклопедический словарь – М: Изд-во "Большая Российская Энциклопедия", 1997
3
В.П. Носко Эконометрика для начинающих Основные понятия, элементарные методы, границы
применимости, интерпретация результатов. М.: Институт экономики переходного периода, 2000.
4
Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. – М.: ЮНИТИ, 1998
5
Магнус, Ян Р. Эконометрика: Начальный курс: Учеб. для студ. вузов, обуч. по экон. спец.: Рек. М-вом
общ. и проф.образов. РФ / Магнус, Ян Р., Катышев, Павел Константинович, Пересецкий, Анатолий
Абрамович. - 6-изд., перераб. и доп. - М.: Дело, 2001. – С.11.

9
Хаавельмо (1989), Роберту Лукасу (1995), Джеймсу Хекману и Даниелю
Мак-Фаддену (2000). [Орлов А.И. Эконометрика: Учеб. пособие для вузов –
М.: «Экзамен», 2002.].
Структура эконометрических исследований условно можно
представить по следующей схеме:

10
Задачи эконометрики классифицируются по трем параметрам:
˗по конечным прикладным целям:
а) прогноз экономических и социально-экономических показателей
(переменных), характеризующих состояние и развитие анализируемой
системы;
б) имитация различных возможных сценариев социально-
экономического развития анализируемой системы, когда статистически
выявленные взаимосвязи между характеристиками производства,
потребления, социальной и финансовой политики и т.п. используются для
прослеживания того, как планируемые (возможные) изменения тех или иных
поддающихся управлению параметров производства или распределения
скажутся на значениях интересующих нас «выходных» характеристик;
˗по уровню иерархии:
а) макроуровень (т.е. страны в целом),
б) мезоуровень (регионы, отрасли, корпорации),
в) микроуровень (семьи, предприятия, фирмы);
˗по профилю экономической системы (исследование может быть
сконцентрировано на проблемах рынка, инвестиционной, финансовой или
социальной политики, ценообразования, распределительных отношений,
спроса и потребления или на определенном комплексе проблем).
Методы эконометрики
 методы сводки и группировки;
 методы корреляционного анализа;
 методы регрессионного анализа;
 методы дисперсионного анализа;
 методы анализа и прогнозирования временных рядов;
 методы построения и анализа систем одновременных уравнений;
 статистические методы анализа объектов нечисловой природы;
 статистические методы классификации и снижения размерности и
др.
Основные задачи эконометрики состоят в построении моделей,
выражающей выводимые закономерности, оценка их параметров и проверка
гипотез о закономерностях изменения и связях экономических показателей.
Процессы эконометрического анализа могут характеризоваться двумя
типами обрабатываемых данных: пространственными данными и
временными рядами.
Пространственные данные – это относящиеся к одному и тому же
моменту времени данные о каком-либо экономическом показателе,
характеризующем однотипные объекты. Например, данные об объеме
производства на разных промышленных предприятиях за один и тот же
период времени или о количестве работников разных промышленных
предприятий в один и тот же момент времени.
Временные ряды – это данные о каких-либо показателях,
характеризующих одни и те же объекты в различные моменты времени. К
11
такому типу данных относятся ежемесячные статистические данные за ряд
лет по стране в целом или по отдельным регионам. Например, по объему
промышленного производства или о количестве безработных. Особенность
временных данных состоит в том, что они упорядочены во времени.
Основные этапы эконометрического моделирования
1) (постановочный) – определение конечных целей моделирования,
набора участвующих в модели факторов и показателей, их роли;
2) (априорный) – предмодельный анализ экономической сущности
изучаемого явления, формирование и формализация априорной информации,
в частности, относящейся к природе и генезису исходных статистических
данных и случайных остаточных составляющих;
3) (параметризация) – собственно моделирование, т.е. выбор общего
вида модели, в том числе состава и формы входящих в нее связей;
4) (информационный) – сбор необходимой статистической
информации, т.е. регистрация значений участвующих в модели факторов и
показателей на различных временных или пространственных тактах
функционирования изучаемого явления;
5) (идентификация модели) – статистический анализ модели,
статистическое оценивание неизвестных параметров модели;
6) (верификация модели) – сопоставление реальных и модельных
данных, проверка адекватности модели, оценка точности модельных данных.
Основные проблемы, решаемые в процессе эконометрического
исследования
 подбор и качественный анализ экономических переменных и их
связей;
 спецификация модели;
 построение эконометрической модели и оценка ее параметров (метод
наименьших квадратов);
 тестирование статистических гипотез о свойствах распределения
вероятностей для случайной компоненты (гипотезы о средней, дисперсии и
ковариации);
 анализ мультиколлинеарности объясняющих переменных, оценка ее
значимости, выявление факторных переменных, ответственных за
мультиколлинеарность;
 включение в модель фиктивных переменных;
 выявление трендовой, циклической и случайной компонент;
 выявление лагов, автокорреляции;
 проверка статистической гипотезы о гетероскедастичности остатков;
 анализ структуры связей и построение системы эконометрических
уравнений;
 идентификация системы одновременных уравнений;
 оценка параметров системы одновременных уравнений
(двухшаговый метод наименьших квадратов, трехшаговый метод
наименьших квадратов, метод максимального правдоподобия);
12
 построение динамических эконометрических моделей и др.
Предметом эконометрики являются массовые экономические явления.
Главным инструментом эконометрики служит эконометрическая
модель, которая представляет собой либо одно уравнение; либо систему
уравнений.
Эконометрика изучает массовые явления в экономике через
статистические совокупности, а последние через признаки, которыми
характеризуются единицы этой совокупности.
Признаки могут находиться в связи между собой. Связи
классифицируют по степени тесноты, направлению, форме, числу факторов.
По степени тесноты связи делятся на статистические (стохастические)
и функциональные.
Статистическая (стохастическая) связь – это такая связь между
признаками, при которой для каждого значения признака-фактора X признак-
результат Y может в определенных пределах принимать любые значения с
некоторыми вероятностями; при этом его статистические (массовые)
характеристики (например, среднее значение) изменяются по определенному
закону.
Статистическая связь обусловлена:
1) тем, что на результативный признак оказывают влияние не только
фактор (факторы), учтенные в модели, но и неучтенные или
неконтролируемые факторы;
2) неизбежностью ошибок измерения значений признаков.
Функциональной называется такая связь, когда каждому возможному
значению признака-фактора X соответствует одно или несколько строго
определенных значений результативного признака Y.
По направлению изменений статистических признаков связи делятся на
прямые и обратные.
По форме связи (виду функции f) связи делятся на прямолинейные
(линейные) и криволинейные (нелинейные).
По количеству факторов в модели связи подразделяются на
однофакторные (парные) и многофакторные.

Вопросы для самопроверки


1. Определение эконометрики.
2. Задачи эконометрики.
3. Методы эконометрики.
4. Основные этапы эконометрического моделирования.
5. Основные проблемы, решаемые в процессе эконометрического исследования.
6. Задачи корреляционного анализа. Классификация связей между признаками.
7. Задачи регрессионного анализа.

13
2. Линейная регрессионная модель с одной объясняющей
переменной

2.1 Метод наименьших квадратов оценки параметров регрессии

Уравнение регрессии с одной объясняющей переменной –


уравнение вида:

где
Y – зависимая, объясняемая, результирующая, эндогенная переменная
(показатель). Y – случайная (стохастичная) величина.
X – переменная (или признак), характеризующая результат или
эффективность функционирования анализируемой экономической системы.
Ее значения формируются в процессе и внутри функционирования этой
системы под воздействием других переменных и факторов, часть из которых
поддаются регистрации и в определенной степени, управлению и
планированию6.
X – независимая, объясняющая, факторная, экзогенная переменная
(признак- фактор, регрессор).
X – переменная, которая может задаваться извне анализируемой
системы, может быть как случайной, так и неслучайной величиной.
ε – регрессионные остатки (случайное возмущение) или стохастическая
переменная, отражающая влияние неучтенных в модели и неизвестных
факторов.
Существует две возможные причины случайности ε:
1. Модель является упрощением действительности и на самом деле
есть еще другие параметры, от которых зависит Y.
2. Трудности в измерении данных (присутствуют ошибки
измерений).7
подбирают среди некоторого числа достаточно простых функций
и затем по выборочным данным (выборочным совокупностям значений
переменных Y и X) оценивают неизвестные параметры.
Рассмотрим разнообразные виды функций , используемые при
количественной оценке регрессионных связей между Y и X, представленные в
таблице 2.1.

6
Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2 т. 2-е изд., испр. – Т.2: АйвазянС.А.
Основы эконометрики. – М.: ЮНИТИ – ДАНА, 2001. – С.43.
7
Магнус, Ян Р. Эконометрика: Начальный курс: Учеб. для студ. вузов, обуч. по экон. спец.: Рек. М-вом
общ. и проф.образов. РФ / Магнус, Ян Р., Катышев, Павел Константинович, Пересецкий, Анатолий
Абрамович. - 6-изд., перераб. и доп. - М.: Дело, 2004. – С.33.

14
Таблица 2.1 − Основные типы функций , используемые в
регрессионной модели, вида
Вид функции f Уравнение регрессии
Линейная
Гиперболическая

Параболическая
Кубическая
Степенная
Показательная
Логарифмическая

Для оценки параметров , , , уравнения регрессии используют


метод наименьших квадратов (МНК).
Метод наименьших квадратов (МНК) – метод оценивания параметров
уравнения регрессии, минимизирующий сумму квадратов отклонений
фактических значений результативной переменной от теоретических
(расчетных) минимальна:

Рассмотрим в качестве уравнения регрессии линейную модель с одной


объясняющей переменной вида

Метод наименьших квадратов сводится к решению математической


задачи нахождения экстремума функции S.
Функция S может достигнуть экстремума только в том случае если ее
частные производные по коэффициентам уравнения регрессии равны нулю:

Решая первое уравнение системы (2.3) для линейной парной регрессии,


получим:

15
или после преобразований получим систему нормальных уравнений
в виде:

Решая систему (2.7) методом Гаусса, Крамера или другим способом,


найдем неизвестные оценки параметров (коэффициентов) линейного
уравнения регрессии с одной объясняющей переменной.
Оценки параметров , можно получить также по формулам:

где
, − средние арифметические соответственно для Y и X,

Таким образом, получим следующие формулы для расчета оценок


параметров , :

Экономическая интерпретация параметров уравнения линейной


парной регрессии: параметр показывает среднее изменение
результативной переменной Y с изменением фактора X на одну единицу.
Параметр =y, когда x=0. Если x не может быть равен нулю, то не имеет
экономического смысла.

16
Интерпретировать можно только знак при : если >0, то
относительное изменение результативной переменной Y происходит
медленнее, чем изменение фактора X, то есть вариация результативной
переменной Y меньше вариации фактора X: Vy<Vx, и наоборот.
Свойства оценок параметров, полученных МНК:
 Несмещенность – математическое ожидание коэффициентов
модели должно равняться их истинному значению при любом объеме
выборки.
 Состоятельность – с ростом объема выборки численное
значение коэффициентов модели должно стремиться к соответствующему
параметру генеральной совокупности.
 Эффективность – выборки равного объема имеют минимальную
дисперсию.
Нахождение оценок параметров МНК и вида регрессионной модели
опирается на следующие предположения относительно случайной
составляющей :
 случайный характер остатков;
 нулевая средняя величина остатков, не зависящая от :

 гомоскедастичность – дисперсия каждого отклонения


одинакова для всех значений :

 любые пары значений , величины являются


некоррелированными, т.е. значения остатков распределены независимо
друг от друга:

при имеет место ,

 Величина подчиняются нормальному распределению.

2.2 Матричный способ оценки параметров линейного уравнения


регрессии с одной объясняющей переменной

Коэффициенты регрессионной зависимости можно определить


матричным способом. Для этого запишем регрессионную зависимость в виде

где
17
Из соотношения (2.16) элементы матрицы А вычисляются по формуле:

где Т означает операцию транспонирования матрицы.

Пример 2.1
Построить линейное уравнение регрессии , используя
данные таблицы 2.2, для оценки параметров применить формулу
(2.18).

Таблица 2.2 – Исходные статистические данные для решения примера 2.18



1 146,3 6,9
2 145,2 7,1
3 145,0 7,5
4 144,3 6,8
5 143,8 7,4
6 143,2 7,8
7 142,8 8,8
8 142,8 8,3
9 142,7 8,4
10 142,9 8,5
11 142,9 9,2
12 143,0 8,5

– численность населения, млн. чел.;


– число браков на 10000 чел. Населения.

Решение.

1. Построим таблицу с предварительными расчетами:

8
Источник данных:
http://www.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/population/demography/#
18
Год
2001 146,3 6,9 47,61 1009,47
2002 145,2 7,1 50,41 1030,92
2003 145,0 7,5 56,25 1087,50
2004 144,3 6,8 46,24 981,24
2005 143,8 7,4 54,76 1064,12
2006 143,2 7,8 60,84 1116,96
2007 142,8 8,8 77,44 1256,64
2008 142,8 8,3 68,89 1185,24
2009 142,7 8,4 70,56 1198,68
2010 142,9 8,5 72,25 1214,65
2011 142,9 9,2 84,64 1314,68
2012 143,0 8,5 72,25 1215,50
Сумма 1724,9 95,2 762,14 13675,60

2. Построим матрицы:

3. Построим матрицу :

4. Вычислим матрицу

5. Вычислим матрицу

19
где присоединенная матрица, т.е. матрица, составленная из
алгебраических дополнений к элементам матрицы .

6. Вычислим матрицу .

7. Вычислим матрицу :

Таким образом, уравнение регрессии имеет вид:

2. Проверим решение с помощью ППП Microsoft Excel:


1) в главном меню последовательно выберите Данные/Анализ
данных/Регрессия. Щелкните ОК;
2) заполните диалоговое окно ввода данных и параметров вывода (см.
Рисунок 2.1):
Входной интервал у – диапазон содержащий данные результативного
признака ;
Входной интервал х – диапазон содержащий данные факторного
признака ;
Метки – флажок, который указывает, содержит ли первая строка
названия столбцов или нет;
Константа - ноль – логическое значение, которое указывает на
наличие или отсутствие свободного члена в уравнении регрессии;

20
Выходной интервал – достаточно указать левую верхнюю ячейку
будущего диапазона;
Новый рабочий лист – можно создать произвольной имя нового листа.
Если необходимо получить информацию и графики остатков,
установите соответствующие флажки в диалоговом окне. Щелкните ОК.

Рисунок 2.1 – Корреляционно − регрессионный анализ по данным


примера 2.1
3. Параметры уравнения регрессии можно найти и третьим способом.
Для этого необходимо первоначально построить точечный график по
диапазону ячеек В2:С13. Выделите точки графика щелчком правой кнопки
мыши. В раскрывшемся контекстном меню выберите команду Добавить
линию тренда (Рисунок 2.2).

Рисунок 2.2 – Построение точечной диаграммы и линии тренда по


данным примера 2.1
21
В диалоговом окне Добавить линию тренда в группе Формат линии
тренда выберите параметр необходимого вида уравнения регрессии,
например Линейная (Рисунок 2.3), установите флажки Показывать
уравнение на диаграмме и Поместить на диаграмму величину
достоверности аппроксимации (R2) (Рисунок 2.3). Здесь же можно
самостоятельно ввести название построенного графика в графу Другое.

Рисунок 2.3 – Выбор линии тренда

Нажав на кнопку ОК, получим результат (Рисунок 2.4).

147
146,5
146 y = -1,2498x + 153,66
145,5 R² = 0,6856
145
144,5
144
143,5
143
142,5
142
141,5
6,5 7 7,5 8 8,5 9 9,5

Рисунок 2.4 – Построение графика и уравнения регрессионной модели

Уравнение линейной регрессии примет вид:

22
2.3 Анализ вариации зависимой переменной в регрессии.
Дисперсионный анализ. F-статистика (критерий Фишера)

Оценка значимости построенного уравнения регрессии в целом


производится с помощью F – критерия Фишера.
Оценить значимость уравнения регрессии – означает, что необходимо
установить, соответствует ли регрессионная модель, выражающая
зависимость между переменными, экспериментальным данным и достаточно
ли включенных в уравнение объясняющих переменных (одной или
нескольких) для описания результативной переменной.
Предварительно проводится дисперсионный анализ, центральное место
в котором занимает разложение общей суммы квадратов отклонений
зависимой переменной Y от ее выборочного среднего на две части (TSS –
total sum of squares)– «объясненную» (RSS –regression sum of squares) и
«необъясненную» (ESS - error sum of squares) (см. Табл.2.3).

Таблица 2.3 – Компоненты дисперсионного анализа


Число Средние
Компоненты
Суммы квадратов степеней квадраты
дисперсии
свободы (дисперсии)
Общая дисперсия
n-1
(TSS)
Факторная,
объясненная k-1
дисперсия (RSS)
Остаточная,
необъясненная n-k
дисперсия (ESS)

Средние квадраты отклонений, или, то же самое, что дисперсии на


одну степень свободы, представляют собой несмещенные оценки дисперсий
зависимой переменной, обусловленных соответственно регрессией или
объясняющих переменных (одной или нескольких) и воздействием
неучтенных случайных факторов и ошибок; k – число оцениваемых
параметров; n – число наблюдений.
Для линейной регрессионной модели с одной объясняющей
переменной k=2 (k-1=1).
Сопоставляя факторную и остаточную дисперсии в расчете на одну
степень свободы, получим величину F – отношения:

23
По критерию Фишера тестируется нулевая гипотеза H0:
(факторная и остаточная дисперсии не отличаются друг от друга).
Статистик Снедекор разработал таблицы критических значений F –
отношений для разных уровней значимости нулевой гипотезы и различном
числе степеней свободы.
Критическое (табличное) значение F – критерия – это максимальная
величина отношения дисперсий, которая может иметь место при случайном
их расхождении для данного уровня вероятности.
Если , то Нулевая гипотеза H0: при заданном
уровне значимости отклоняется и делается вывод о существенности
(достоверности) уравнения регрессии (связи между Y и X)
Если , то Нулевая гипотеза H0: при заданном
уровне значимости принимается и делается вывод о несущественности
(недостоверности, статистической незначимости) уравнения регрессии.
Фактическое значение критерия Фишера можно рассчитать с
помощью ППП Microsoft Excel, выбрав в главном меню последовательно:
Данные/Анализ данных/Регрессия (см. Рисунок 2.1).
Для вычисления критического значения в главном меню выберите
Формулы/Вставить функцию. В окне категории (Рисунок 2.4) выберите
Статистические, в окне Функция – FРАСПОБР. Щелкните по кнопке ОК.

Рисунок 2.4 − Диалоговое окно «Мастер функций»

Далее заполните аргументы функции (Рисунок 2.5). Щел ни е п


н п е ОК.

24
Рисунок 2.5 − Диалоговое окно ввода аргументов функции FРАСПОБР

2.4 Коэффициент детерминации (R2 – статистика), линейный


(парный) коэффициент корреляции и их свойства

Для оценки качества подбора регрессионной модели, адекватности ее


экспериментальным данным рассчитывается характеристика
прогностической силы анализируемой регрессионной модели – коэффициент
детерминации (R2 − статистика).
Коэффициент детерминации характеризует долю дисперсии
результативной переменной Y, объясненную регрессией, в общей дисперсии
результативной переменной Y, рассчитывается по формуле:

Соответственно величина 1- характеризует долю дисперсии


переменной Y, вызванную влиянием остальных, не учтенных в модели,
факторов.
Свойства коэффициента детерминации (R2 - статистики)

 Если , между Y и X существует функциональная


зависимость, эмпирические значения переменных лежат на линии регрессии;
 Если , то вариация зависимой переменной полностью
обусловлена воздействием неучтенных в модели переменных, линия
регрессии параллельна оси абсцисс.

25
Связь между коэффициентом детерминации и коэффициентом
корреляции

Уравнение регрессии дополняется показателем тесноты (силы) связи


между Y и X. При построении парной линейной регрессии в качестве такого
показателя выступает линейный (парный) коэффициент корреляции :

или

Свойства линейного коэффициента корреляции :

или

– Если , то – связь между Y и X – прямая;


– Если , то – связь между Y и X – обратная;
– Если , то линейная корреляционная связь отсутствует;
– Если , то корреляционная связь представляет линейную
функциональную зависимость.
В случае парной линейной регрессионной модели коэффициент
детерминации равен квадрату коэффициента корреляции:

т.к.

Качественную оценку тесноты корреляционной связи между


признаками Y и X проводят по таблице Чеддока (табл. 2.3).
Таблица 2.3 − Таблица Чеддока для оценки тесноты корреляционной
связи между признаками Y и X
Диапазон
0,1 – 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 – 0,99
изменения
Характеристика Весьма
Слабая Умеренная Заметная Высокая
связи высокая
26
2.5 Доверительные интервалы оценок параметров уравнения
регрессии и проверка гипотез об их значимости. Критерий Стьюдента (t-
тест)

Для линейной регрессионной модели с одной объясняющей


переменной оценивают статистическую значимость не только уравнения в
целом, но и отдельных его параметров. Для этого рассчитывают по каждому
параметру стандартную ошибку:

где − остаточная дисперсия на одну степень свободы.


Для оценки существенности коэффициентов уравнения регрессии
необходимо сравнить их величины с их стандартными ошибками, т.е.
определить фактические значения t – статистик (критерия Стьюдента):

Расчетные , сравнивают с критическим (табличным) значением


t−критерия Стьюдента при определенном уровне значимости α и числе
степеней свободы ( ).
Стандартные ошибки (2.27), (2.28), t – статистики (2.29) можно
рассчитать с помощью ППП Microsoft Excel, выбрав в главном меню
последовательно: Данные/Анализ данных/Регрессия (см. Рисунок 2.1).
Для вычисления критического значения в главном меню
необходимо выбрать Формулы/Вставить функцию. В окне категории
нужно выбрать Статистические, в окне Функция – СТЬЮДРАСПОБР.
Щелкните по кнопке ОК.
При этом, если и , то нулевую гипотезу о
несущественности (статистической незначимости, недостоверности)
коэффициента регрессии при заданном уровне значимости α можно
отклонить.
Таким образом, можно построить доверительный интервал по формуле:

и и

В противном случае, если и , нулевую гипотезу о


несущественности (статистической незначимости, недостоверности)
27
коэффициента регрессии при заданном уровне значимости α можно
принять.
Аналогично, если и , то нулевую гипотезу о
несущественности (статистической незначимости, недостоверности)
коэффициента регрессии при заданном уровне значимости α можно
отклонить.
Можно построить доверительный интервал оценки параметра
уравнения регрессии по формуле:

и и

По t-критерию Стьюдента можно также при заданном уровне


значимости α протестировать статистическую гипотезу о
несущественности линейного (парного) коэффициента корреляции .
Величина стандартной ошибки коэффициента корреляции
рассчитывается по формуле:

Фактическое значение t-критерию Стьюдента для коэффициента


корреляции определяется по формуле:

В парной линейной регрессии

, т.к.

Кроме того,

следовательно,

Таким образом, проверка гипотез о статистической значимости


коэффициентов регрессии и корреляции равносильна проверке
статистической гипотезы о существенности линейного уравнения регрессии.

28
2.6 Средняя относительная ошибка аппроксимации

Величина отклонений по каждому наблюдению ( ) расчетных


значений результативной переменной Y от фактических определяет ошибку
аппроксимации. Их число соответствует объему выборочной совокупности.
Чтобы иметь общее суждение о качестве модели из относительных
отклонений по каждому наблюдению, определяют среднюю ошибку
аппроксимации как среднюю арифметическую невзвешенную:

Чем меньше , тем выше качество регрессионной модели и тем более


точное приближение модели к эмпирическим данным.

Лабораторная работа №1
Задание: Используя данные (Y, X) Приложения 1 для
соответствующего № варианта:
Таблица

Таблица

Таблица

Таблица
Вариант

Вариант

Вариант

Вариант
Y X Y X Y X Y X

1 1 2 3 26 2 2 3 51 3 2 3 76 4 4 3
2 1 2 4 27 2 2 4 52 3 2 4 77 4 4 5
3 1 2 5 28 2 2 5 53 3 2 5 78 4 4 6
4 1 2 6 29 2 2 6 54 3 2 6 79 4 4 7
5 1 2 8 30 2 2 8 55 3 3 2 80 4 4 10
6 1 2 9 31 2 2 9 56 3 3 5 81 4 3 8
7 1 2 10 32 2 2 10 57 3 5 2 82 4 3 10
8 1 3 2 33 2 3 2 58 3 6 5 83 4 3 7
9 1 3 5 34 2 3 5 59 3 6 7 84 4 3 11
10 1 3 6 35 2 3 6 60 3 7 8 85 4 3 13
11 1 7 8 36 2 7 8 61 3 7 6 86 4 5 4
12 1 7 13 37 .2 7 13 62 3 7 9 87 4 5 6
13 1 9 2 38 2 9 2 63 3 8 5 88 4 5 7
14 1 9 4 39 2 9 4 64 3 9 8 89 4 5 8
15 1 9 8 40 2 9 8 65 3 9 10 90 4 5 11
16 1 10 6 41 2 10 6 66 3 9 2 91 4 6 7
17 1 11 2 42 2 11 2 67 3 10 6 92 4 6 8
18 1 11 3 43 2 11 3 68 3 11 2 93 4 6 13
19 1 11 12 44 2 11 12 69 3 11 3 94 4 7 8
20 1 13 2 45 2 13 2 70 3 11 4 95 4 7 13
21 1 13 5 46 2 13 5 71 3 11 5 96 4 8 13
22 1 13 7 47 2 13 7 72 3 11 7 97 4 9 7
23 1 13 8 48 2 13 8 73 3 4 1 98 4 10 7
24 1 14 13 49 2 14 13 74 3 4 5 99 4 11 5
25 1 15 7 50 2 15 4 75 3 4 2 100 4 12 7
29
1) Построить линейное уравнение регрессии с одной объясняющей
переменной матричным способом.
2) Дать экономическую интерпретацию коэффициента регрессии .
3) Выполнить корреляционный анализ, т.е. вычислить
 линейный коэффициент корреляции,
 корреляционное отношение,
 индекс корреляции.
Сделать вывод о тесноте и направлении связи между Y и X.
4) Вычислить коэффициент детерминации. Сделать вывод.
5) Выполнить дисперсионный анализ. Протестировать
статистическую гипотезу о достоверности уравнения регрессии при
уровнях значимости α=0,05 и α=0,01.
6) Протестировать статистические гипотезы о достоверности
коэффициента корреляции r и коэффициентов регрессии a0, a1 при уровнях
значимости α=0,05 и α=0,01.
7) Построить доверительные интервалы для статистически
значимых параметров.
8) Вычислить среднюю относительную ошибку аппроксимации.
Сделать вывод о возможности использования регрессионной модели для
прогнозирования.

Тесты по теме:
Регрессионная модель с одной объясняющей переменной

1. Парный линейный коэффициент корреляции характеризует


наличие тесной обратной связи. Он может принимать следующие значения:
 1,2;
 –0,82;
 0,92;
 –0,24.

2. Коэффициент уравнения парной регрессии показывает:


 тесноту связи между зависимой и независимой переменными;
 на сколько процентов изменится зависимая переменная, если
независимая переменная изменится на единицу;
 на сколько процентов изменится зависимая переменная, если
независимая переменная изменится на 1%;
 на сколько единиц в среднем изменится зависимая переменная,
если независимая переменная изменится на 1 ед.

30
3. Факторная дисперсия вычисляется по формуле:

 yy 
2

 n 1 ;

 yy 
2

 1 ;

 yy 
 1 ;
 2
 y  y 
 n .

4. Коэффициент детерминации показывает:


 на сколько единиц изменится зависимая переменная, если
независимая переменная изменится на 1 единицу;
 на сколько процентов изменится зависимая переменная, если
независимая переменная изменится на 1%;
 на сколько процентов изменение зависимой переменной зависит
от изменения независимой переменной;
 долю вариации независимой переменной, обусловленную
вариацией независимой переменной.

5.Дисперсионный анализ уравнения парной регрессии проверяет:


 значимость коэффициента корреляции;
 значимость уравнения регрессии;
 значимость коэффициента регрессии;
 значимость свободного члена уравнения регрессии.
6. Что минимизируется согласно методу наименьших квадратов:

31
7. Дана ковариационная матрица вектора оценок коэффициентов
регрессии:

Чему равна несмещенная оценка дисперсии элемента :


 0,306;
 0,004;
 0,152;
 -0,028.

8. Дана ковариационная матрица вектора оценок коэффициентов


регрессии:

Чему равна несмещенная оценка дисперсии элемента :


 0,306;
 0,004;
 0,152;
 -0,028.

9.В линейной регрессии Y=b0+b1X+e параметрами уравнения регрессии


являются:
 b0;
 Y;
 X;
 b1 .

10.Величина коэффициента эластичности показывает …


 во сколько раз изменится в среднем результат при изменении
фактора в два раза;
 на сколько процентов изменится в среднем результат при
изменении фактора на 1% ;
 предельно допустимое изменение варьируемого признака;
 предельно возможное значение результата .

11.Коэффициент корреляции, равный нулю, означает, что между


переменными
 линейная связь отсутствует,
32
 существует линейная связь,
 ситуация не определена,
 существует обратная связь

12.Коэффициент регрессии изменяется в пределах от


 –1 до 1,
 0 до 1,
 -1 до 0
 принимает любое значение.

13.В каких пределах изменяется коэффициент детерминации


 от 0 до 1,
 от –1 до 0,
 от –1 до 1,
 от 0 до 10.

14.Неправильный выбор функциональной формы или объясняющих


переменных называется
 ошибками спецификации,
 ошибками прогноза,
 мультиколлинеарностью,
 гетероскедастичностью.
15.Величина, рассчитанная по формуле является оценкой
 коэффициента детерминации,
 парного коэффициента корреляции,
 частного коэффициента корреляции,
 множественного коэффициента корреляции.

16.Выборочный коэффициент корреляции r по абсолютной величине


 не превосходит единицы,
 не превосходит нуля,
 равен 2
 принимает любые значения.

17.Если в уравнении регрессии имеется несущественная переменная, то


она обнаруживает себя по низкому значению
 t – статистики,
33
 F – статистики,
 коэффициента детерминации.
 - статистики

18.В каком случае модель считается адекватной?


 Fрасч  Fтабл ,
Fрасч  Fтабл
 ,
Fрасч  Fтабл

 значение коэффициента корреляции > 0,8.

19.Как интерпретируется в линейной модели коэффициент регрессии


b1?
 коэффициент эластичности,
 коэффициент относительного роста,
 коэффициент корреляции,
 коэффициент абсолютного роста.

20.Если коэффициент корреляции положителен, то в линейной модели


 с ростом х уменьшается у,
 с ростом х увеличивается у,
 с уменьшением х растёт у
 с ростом х не меняется у.

21.Если коэффициент корреляции отрицателен, то в линейной модели


 с ростом х уменьшается у,
 с ростом х увеличивается у,
 с уменьшением х уменьшается у.
 с ростом х не меняется у.
22.С помощью какого критерия оценивается значимость
коэффициентов регрессии?
 хи-квадрат,
 F – критерия,
 Дарбина-Уотсона
 t-Стьюдента.

34
23.Относительные отклонения расчётных значений результирующего
признака от его наблюдаемых значений используются при расчёте ...
 t-критерия Стьюдента
 параметров регрессии
 коэффициента эластичности
 средней ошибки аппроксимации

24. Найдите предположение, не являющееся предпосылкой


классической модели
 Случайные ошибки имеют нулевые математические ожидания.
 Случайные ошибки имеют постоянную дисперсию.
 Случайные ошибки не зависят от объясняющих переменных.
 Случайные ошибки не имеют нормального распределения.

25.Суть коэффициента детерминации состоит в следующем:


 свидетельствует о значимости коэффициентов регрессии
 показывает насколько лучше рассматриваемая модель регрессии
по сравнению с тривиальной моделью
 свидетельствует о наличии (отсутствии) автокорреляции
 является мерой сравнения качества любых двух регрессионных
моделей

26. Какое значение может принимать коэффициент детерминации:


 0,4
 –0,5
 –1,2
 1,1

27. Согласно содержанию регрессии, наблюдаемая величина зависимой


(объясняемой) переменной складывается из:
 теоретического значения зависимой переменной, найденного из
уравнения регрессии, и случайного отклонения
 теоретического значения зависимой переменной, найденного из
уравнения регрессии, скорректированного на величину стандартной ошибки
 теоретического значения зависимой переменной, найденного из
уравнения регрессии и остаточной дисперсии

35
28. С увеличением числа наблюдений дисперсии МНК-оценок
неизвестных параметров в модели регрессии:
 уменьшаются
 увеличиваются
 не изменяются

29. С увеличением объема выборки:


 увеличивается точность оценок
 увеличивается точность прогноза, построенного на основании
модели
 уменьшается коэффициент детерминации
 оценки становятся не состоятельными

Вопросы для самопроверки

1. Коэффициент детерминации и его свойства. Связь между коэффициентом


детерминации и коэффициентом корреляции.
2. Предположение о нормальном распределении случайной ошибки в рамках
классической линейной регрессии и его следствия.
3. Доверительные интервалы оценок параметров и проверка гипотез о их
значимости (t-тест).
4. Проверка адекватности регрессии (F-тест).
5. Прогнозирование по регрессионной модели и его точность.
6. Доверительный интервал для прогнозных значений.
7. Как проверяется адекватность регрессионной модели?
8. Может ли уравнение парной регрессии быть значимым, а коэффициент
регрессии не значимым?
9. Какие свойства оценок коэффициентов регрессии следуют из теоремы Гаусса-
Маркова?
10. С помощью какого критерия оценивается значимость коэффициентов
регрессии?
11. Экономическая интерпретация параметров регрессии
12. Для чего предназначен дисперсионный анализ?
13. Как вычислить среднюю относительную ошибку аппроксимации?
14. Свойства коэффициента корреляции.
15. Как построить доверительные интервалы оценок параметров уравнения
регрессии?

36
3. Нелинейные регрессионные уравнения с одной объясняющей
переменной

3.1 Линеаризация регрессионных моделей с одной объясняющей


переменной

Многие экономические зависимости не являются линейными по своей


сути, поэтому использование для их изучения линейных моделей может
привести к неадекватным результатам. Так, при исследовании зависимости
спроса от цены часто используют логарифмические модели, при анализе
издержек от объема выпуска наиболее обоснована полиномиальная
(кубическая) модель, а при рассмотрении производственных функций
обычно используются степенные модели.
Рассмотрим некоторые (наиболее часто используемые на практике)
нелинейные модели, для которых возможно преобразование их к линейному
виду. Диаграммы регрессионных моделей с одной объясняющей переменной
представлены на рисунке 3.1.

Рисунок 3.1− Диаграммы регрессионных моделей с одной


объясняющей переменной
37
Для того, чтобы свести нелинейную модель к линейному виду
(линеаризовать модель), обычно с помощью некоторых преобразований
переменных нелинейную модель представляют в виде линейного
соотношения между преобразованными переменными, оценивают
коэффициенты этого соотношения и затем с помощью обратного
преобразования находят оценки параметров исходной нелинейной модели.
Однако, в ряде случаев невозможно подобрать подходящее
преобразование. В этом случае приходится использовать методы нелинейной
оптимизации.
Говоря о нелинейных моделях, часто выделяют модели:
 нелинейные по переменным (но линейные относительно
параметров),
 модели, нелинейные по оцениваемым параметрам.
Оценка параметров моделей, нелинейных по объясняющим переменным,
но линейных по оцениваемым параметрам, не представляет особой
сложности: в этом случае обычно используют замену переменных для
сведения модели к линейной и оценки параметров с помощью обычного
МНК (примененного к модели с замененными переменными) (см. Табл.3.1).

Таблица 3.1 − Преобразование нелинейных зависимостей к линейному


виду Y=A0+A1X
Форма Уравнение Вид
связи регрессии подстановки
2 Y = y; X= (x+ a1/(2·a2))2
1 Параболическая y = a0 + a1x+ a2x
A0=a0 a12/ (4·a2); A1=a2
Y = y; X=1/x
2. Гиперболическая y = a0 + a1/x
A0=a0; A1=a1
Y = y; X= ln(x)
3.Логарифмическая y = a0 + a1ln(x)
A0=a0; A1=a1
Y= ln(y); X= x
4. Показательная y = a0a1x A0= ln(a0); A1= ln(a1)
Y= ln(y); X= ln(x)
5. Степенная y = a0xa1 A0= ln(a0); A1=a1

Параметры нелинейного уравнения регрессии можно оценить,


используя ППП Microsoft Excel. Для этого необходимо первоначально
построить точечный график (Вставка - Точечная) по диапазону ячеек,
вмещающих значения выборочных данных признаков X и Y. Выделите точки
графика щелчком правой кнопки мыши. В раскрывшемся контекстном меню
выберите команду Добавить линию тренда (Рисунок 2.2).
В диалоговом окне Добавить линию тренда в группе Формат линии
тренда выберите параметр необходимого вида уравнения регрессии,
(Рисунок 2.3), установите флажки Показывать уравнение на диаграмме и

38
Поместить на диаграмму величину достоверности аппроксимации (R2)
(Рисунок 2.3). Здесь же можно самостоятельно ввести название
построенного графика в графу Другое.
Рассмотрим нелинейное уравнение регрессии с одной объясняющей
переменной в виде:

где
F(Y), G(X) – некоторые функции
а0, а1 – коэффициенты уравнения регрессии.
Экономический смысл коэффициента регрессии а1 в зависимости от
вида функций F(Y), G(X) представлен в таблице 3.2.

Таблица 3.2 − Экономический смысл коэффициента регрессии а1 в


модели
F(Y) G(X) Экономический смысл а1 Интерпретация а1
При увеличении X на 1
Y X Наклон единицу, Y увеличится на
а1 единиц
При увеличении X на 1 %,
lnY lnX Эластичность Y по X
Y увеличится в 1,01а1 раз
При увеличении X на 1
lnY X − единицу, Y увеличится в
exp(a1) раз
Для увеличения Y на 1
Y lnX − единицу, X необходимо
изменить в exp(1/a1) раз

Правильный выбор вида зависимости является необходимым


элементом для качественного исследования. Последствия ошибки в выборе
вида зависимости (неправильной спецификации) будут весьма серьезными.
Обычно такая ошибка приводит либо к получению смещенных оценок, либо
к ухудшению статистических свойств оценок коэффициентов регрессии и
других показателей качества уравнения. В первую очередь это вызвано
нарушением условий Гаусса–Маркова для отклонений. Прогнозные качества
модели в этом случае будут невысоки.
Можно предложить несколько признаков «хорошей» модели.
Модель всегда является упрощением реальности, поэтому должна быть
достаточно проста. Из двух моделей, приблизительно одинаково
соответствующих данным, предпочтение скорее следует отдать более
простой модели, содержащей, например, меньшее число объясняющих
переменных.

39
Модель должна соответствовать теоретическим предпосылкам и
сущности рассматриваемого явления. При выборе вида модели важно иметь в
виду интерпретацию параметров зависимости.
Модель должна хорошо соответствовать данным. Уравнение тем
лучше, чем большую часть разброса зависимой переменной оно может
объяснить. Для оценки качества нелинейной регрессии аналогично линейной
зависимости используют индекс (коэффициент) детерминации. Этот
показатель можно использовать для сравнения только моделей с одной и той
же зависимой переменной. Чтобы учитывать при выборе простоту модели,
делают поправку на количество регрессоров. Это дает коэффициент
детерминации, скорректированный на количество степеней свободы:

где число параметров регрессии;


- число наблюдений.
Так как , то величину скорректированного индекса
детерминации можно представить в виде:

Чем больше величина , тем сильнее различия между и .


Для сравнения различных форм нелинейной регрессии и обнаружения
ошибок спецификации предложено несколько тестов, таких, как:
 тест Рамсея (RESET: Regression specification error test),
 тест (критерий) максимального правдоподобия,
 тест Вальда,
 тест множителей Лагранжа, тест Хаусмана,
 преобразование Бокса-Кокса (Box−Cox trasformation) и др.
Суть данных тестов состоит либо в осуществлении преобразований
случайных возмущений, либо масштаба зависимой переменной с тем, чтобы
можно было сравнить начальное и преобразованное уравнения регрессии на
основе известного статистического критерия.
В качестве показателей качества нелинейных регрессий также часто
используются такие показатели, как
 средняя относительная ошибка аппроксимации,
 среднее абсолютное отклонение,
 стандартная ошибка регрессии (среднее квадратическое
отклонение).

40
При выборе вида нелинейной регрессии могут использоваться ее
прогнозные качества – соответствие прогнозов реальным данным.
Некоторые авторы (отмечая схожесть законов распределения с
линейным случаем) предлагают оценивать существенность индекса
детерминации и всего нелинейного уравнения в целом с помощью критерия
Фишера, в котором число степеней свободы определяется по
линеаризованной форме

По крайней мере, при анализе существенности нелинейной регрессии с


помощью −критерия Фишера должна быть проверена значимость
линейной формы, к которой сводится нелинейная регрессия. Некоторые
статистические пакеты в качестве показателя качества нелинейной регрессии
приводят как раз значение коэффициента детерминации для
линеаризованной формы.
Приблизительная схема построения и оценки параметров нелинейной
зависимости может состоять в осуществлении ряда последовательных шагов:
1. подбор начальной модели (на основе экономической теории,
предыдущих знаний об объекте исследования, опыта исследователя и его
интуиции);
2. оценка параметров модели на основе имеющихся статистических
данных;
3. осуществление тестов проверки качества модели (обычно
используются -статистики для коэффициентов регрессии, -статистика для
коэффициента детерминации, статистика Дарбина–Уотсона для анализа
отклонений и ряд других тестов). При наличии хотя бы одного
неудовлетворительного ответа по какому-либо тесту модель
совершенствуется с целью устранения выявленного недостатка;
4. проверка соответствия модели теоретическим предпосылкам.

Выводы
 Проблема спецификации является особенно важной при
построении нелинейной регрессии.
 Некоторые нелинейные зависимости можно привести к линейной
форме, что позволяет оценить параметры зависимости.
 Особое значение для построения хороших оценок параметров
имеют предпосылки, касающиеся случайных возмущений.
 Оценка качества нелинейной регрессии представляет собой более
сложную проблему, чем для линейной регрессии.

41
3.2 Коэффициенты эластичности и абсолютные изменения
показателя

При анализе регрессионных моделей часто вычисляют коэффициенты


эластичности, характеризующие влияние фактора X на зависимую
переменнуюY.
Коэффициент эластичности показывает, на сколько процентов
изменится Y при изменении X на 1%.
Коэффициент эластичности, в общем случае, вычисляется по формуле

На практике часто вычисляют средний коэффициент эластичности,


показывающий, на сколько процентов изменится Y, если X изменится на 1 %
от среднего значения.

В таблице 3.3 отражены коэффициенты эластичности для наиболее


часто встречающихся зависимостей, получаемые из формулы (36).

Таблица 3.3 − Коэффициенты эластичности при парной зависимости


Форма Уравнение Коэффициент
связи регрессии эластичности
1. Линейная y = a0 + a1x a1/(a1 + a0 /x)
2 1/ (1 + a0/( a1x + a1x2) )+
2. Параболическая y = a0 + a1x+ a2x
+1/ (1+ (a0 + a1x )/(a2x2) )
3. Гиперболическая y = a0 + a1/x a1/ (a1 + a0x )
4.Логарифмическая y = a0 + a1ln(x) 1/ (ln(x) + a0/a1)
5. Показательная y = a0a1x xln(a1)
6. Степенная y = a0xa1 a1

Например, расчет коэффициентов эластичности для показательной и


степенной зависимости представлен в следующем виде:
y x x
Э   ln(a1 )a 0 a1x   x ln(a1 );
x y a 0 a1x
y x a1 x
Э   a 0 x a1   a1 .
x y x a 0 x a1

Аналитические абсолютные изменения показателя на 1 единицу


фактора, выражаются через производную (частную). Форма расчета данного
коэффициента представлена в таблице 3.4:
42
Таблица 3.4 − Коэффициенты абсолютного изменения показателя
Коэффициент
Уравнение абсолютного
Форма связи
регрессии изменения показателя
на 1 единицу фактора
1. Линейная y = a0 + a1x a1
2
2. Параболическая y = a0 + a1x+ a2x a1x + 2a2x
3. Гиперболическая y = a0 + a1/x a1/ x2
4.Логарифмическая y = a0 + a1ln(x) a1/x
x
5. Показательная y = a0a1 ln(a1) a0a1x
6. Степенная y = a0xa1 (a1/x)a0xa1

Лабораторная работа №2

Задание: Используя данные Приложения 1 для соответствующего


варианта (см. Лабораторную работу №1) построить следующие уравнения
регрессии с одной объясняющей переменной:
1) Линейное
2) Параболическое
3) Гиперболическое
4) Степенное или
5) Показательное или

Дать экономическую интерпретацию коэффициентам регрессий.


6) Вычислить коэффициент детерминации. Сделать вывод.
7) Вычислить среднюю относительную ошибку аппроксимации.
Сделать вывод о возможности использования регрессионной модели для
прогнозирования.
8) Выбрать наилучшую модель для прогнозирования, используя для
ранжирования моделей два критерия: коэффициент детерминации (
) и среднюю относительную ошибку аппроксимации ( ).

Тесты по теме:
Нелинейная регрессионная модель с одной объясняющей
переменной
1. Как в показательной модели интерпретируется коэффициент
регрессии b1?
 коэффициент эластичности,
 коэффициент относительного роста,
 коэффициент корреляции,
43
 коэффициент абсолютного роста.

2. Как в степенной модели интерпретируется коэффициент


регрессии b1?
 коэффициент эластичности,
 коэффициент относительного роста,
 коэффициент корреляции,
 коэффициент абсолютного роста.

3. Применим ли метод наименьших квадратов для расчёта


параметров нелинейных моделей?
 нет,
 да,
 применим после её специального приведения к параболическому
виду
 применим после её специального приведения к линейному виду.

4. Что показывает коэффициент регрессии показательной модели?


 на сколько единиц изменится y, если x изменился на единицу,
 на сколько процентов изменится y, если x изменился на один
процент,
 относительную величину изменения y при изменении x на
единицу.

5. Какую модель следует выбрать, если есть основания считать, что


в изучаемом периоде коэффициент относительного роста не изменяется?
 линейную,
 показательную,
 параболическую,
 степенную.

6. Какую модель следует выбрать, если есть основания считать, что


в изучаемом периоде коэффициент эластичности не изменяется?
 линейную,
 показательную,
 параболическую,
 степенную.

44
7. Линеаризовать нелинейную модель
 , где , , ,
 где , , ,
 где , , ,
 , где , , , ,

8. Линеаризовать нелинейную модель


 , где , , ,
 , где , , ,
 , где , , ,
 , где , , , ,

9. Линеаризовать нелинейную модель


 , где , , ,
 , где , , ,
 , где , , ,
 , где , , , ,

10. Линеаризовать нелинейную модель


 , где , , ,
 , где , , ,
 , где , , ,
 , где , , , ,

11. Линеаризовать нелинейную модель

 , где , , , ,
 , где , , , ,
 , где , , ,
 , где , , , ,

12. Линеаризовать нелинейную модель


 , где , , , ,
 , где , , , ,
 , где , , ,
 , где , , , ,

45
13. Линеаризовать нелинейную модель
 , где , , , ,
 , где , , , ,
 , где , , ,
 , где , , , ,

14. Линеаризация экспоненциальной зависимости Y = a0⋅Xa1⋅ε (кривой


Энгеля, отражающей зависимость спроса от уровня семейных доходов)
основана на ...
 интегрировании функции по параметрам
 дифференцировании функции по параметрам
 разложении функции в ряд
 логарифмировании и замене преобразованной переменной

3.3 Производственная функция как частный случай нелинейной


регрессионной модели

Производственная функция представляет собой математическую


модель, характеризующую зависимость объема выпускаемой продукции от
объема трудовых и материальных затрат.
Модель может быть построена как для отдельной фирмы и отрасли, так
и для всей национальной экономики.
Рассмотрим производственную функцию, включающую два фактора
производства — затраты капитала К и трудовые затраты L, определяющие
объем выпуска Q. Тогда можно записать

Определенного уровня выпуска можно достигнуть с помощью


различного сочетания капитальных и трудовых затрат.
Кривые, описываемые условиями
,
называются изоквантами.
Обычно предполагается, что по мере роста значений одной из
независимых переменных предельная норма замещения данного фактора
производства уменьшается. Поэтому при сохранении постоянного объема
производства экономия одного вида затрат, связанная с увеличением затрат
другого фактора, постепенно уменьшается.
На примере производственной функции Кобба − Дугласа рассмотрим
основные выводы, которые можно получить исходя из предложений о том
46
или ином виде производственной функции. Производственная функция
Кобба − Дугласа, включающая два фактора производства, имеет вид

где параметры модели (3.8).


Величина зависит от единиц измерения Q, К и L, а также от
эффективности производственного процесса. коэффициент, отражающий
уровень технологической производительности и в краткосрочном периоде он
не изменяется.
При фиксированных значениях К и L более высокое значение имеет та
функция Q, которая характеризуется большей величиной параметра ,
следовательно, и производственный процесс, описываемый такой функцией,
более эффективен.
Описываемая производственная функция однозначна и непрерывна
(при положительных К и L).
Параметры и называют коэффициентами эластичности. Они
показывают, на какую величину в среднем изменится Q, если или
увеличить на 1%.
Рассмотрим поведение функции Q при изменении масштабов
производства. Предположим, что затраты каждого фактора производства
увеличились в с раз. Тогда новое значение функции будет определяться
следующим образом:

При этом, если


– + = 1, то уровень эффективности производства не зависит
от его масштабов;
– + < 1, то средние издержки, рассчитанные на единицу
продукции, растут,
– + > 1 , то средние издержки, рассчитанные на единицу
продукции, убывают по мере расширения масштабов производства.
Следует отметить, что эти свойства не зависят от численных значений
К, L производственной функции.
Для определения параметров и вида производственной функции
необходимо провести дополнительные наблюдения.
Как правило, пользуются двумя видами данных:
– динамическими (временными) рядами;
– пространственной информацией.
Динамические ряды экономических показателей характеризуют
поведение одной и той же фирмы во времени, тогда как пространственные

47
данные характеризуют различные объекты (фирмы, предприятия, отрасли) за
один тот же период (момент) времени.
Если исследователь располагает статистическими данными в виде
временных рядов (например, годовыми данными, характеризующими
деятельность одной и той же фирмы), возникают трудности, с которыми не
пришлось бы столкнуться при работе с пространственными данными. Так,
относительные цены со временем становятся иными, а следовательно,
меняется и оптимальное сочетание затрат отдельных факторов производства.
Кроме того, с течением времени изменяется и уровень административного
управления.
Основные проблемы при использовании временных рядов
порождаются последствиями технического прогресса, в результате которого
меняются нормы затрат производственных факторов, соотношения, в
которых они могут замещать друг друга, и параметры эффективности.
Вследствие этого с течением времени могут меняться не только
параметры, но и формы производственной функции. Поправка на
технический прогресс может быть введена с помощью некоторого
временного тренда, включаемого в состав производственной функции.
Производственная функция Кобба − Дугласа с учетом технического
прогресса имеет вид:

В (3.10) параметр θ, с помощью которого характеризуется технический


прогресс, показывает, что объем выпускаемой продукции ежегодно
увеличивается на θ процентов независимо от изменений в затратах
производственных факторов и, в частности, от размера новых инвестиций.
Такая форма технического прогресса, не связанная с какими-либо
затратами труда или капитала, называется «нематеризованным техническим
прогрессом».
Однако подобный подход не вполне реалистичен, так как новые
открытия не могут не повлиять на функционирование старых машин, а
расширение объема производства возможно только посредством новых
инвестиций.
При другом подходе к учету технического прогресса для каждой
«возрастной группы» капитала строят свою производственную функцию.
В этом случае функция Кобба − Дугласа будет иметь вид:

где объем продукции, произведенной за период t на


оборудовании, введенном в строй в период v;
трудовые затраты в период t на обслуживание оборудования,
введенного в строй в период v,
48
основной капитал, введенный в строй в период v и
использованный в период t.
Параметр v в такой производственной функции отражает состояние
технического прогресса.
Затем для периода t строится агрегированная производственная
функция, представляющая собой зависимость совокупного объема
выпускаемой продукции от общих затрат труда , и капитала на
момент t.
При использовании для построения производственной функции
пространственной информации, т.е. данных о нескольких фирмах,
соответствующих одному и тому же моменту времени, возникают проблемы
другого рода.
Так как результаты наблюдений относятся к разным фирмам, то при их
использовании предполагается, что поведение всех фирм может быть
описано с помощью одной и той же функции. Для успешной экономической
интерпретации полученной модели желательно, чтобы все эти фирмы
принадлежали одной и той же отрасли. Кроме того, считается, что они
располагают примерно одинаковыми производственными возможностями и
уровнями административного управления. Рассмотренные выше
производственные функции носили детерминированный характер и не
учитывали влияния случайных возмущений, присущих каждому
экономическому явлению.
В каждое уравнение, параметры которого предстоит оценить,
необходимо ввести и случайную переменную ε, которая будет отражать
воздействие на процесс производства всех тех факторов, которые не вошли в
состав производственной функции в явном виде.
Таким образом, в общем виде производственную функцию Кобба —
Дугласа можно представить как

(3.12) − степенная регрессионная модель, оценки параметров


которой можно найти методом наименьших квадратов, лишь
прибегнув предварительно к логарифмическому преобразованию:

Для определения параметров методом наименьших


квадратов можно решить систему нормальных уравнений:

49
Исходя из априорных соображений, значения и должны
удовлетворять условиям 0 < < 1 и 0 < < 1.
Если предположить, что с изменением масштабов производства
уровень эффективности остается постоянным, то, приняв, что = 1 − ,
имеем

или

Аналогично

производительность труда (среднее количество продукции на


единицу отработанного времени),
фондоотдача,
капиталовооруженность.

Лабораторная работа №3
Задание: Используя данные Приложения 2 согласно № варианта:
1) построить производственную функцию Кобба-Дугласа

2) дать экономическую интерпретацию вычисленных коэффициентов


эластичности и ;
3) сделать вывод относительно масштабов производства.

50
Вопросы для самопроверки

1. Что понимается под спецификацией модели?


2. Какие предпосылки МНК должны выполняться, чтобы гарантировать
получение качественных оценок уравнения регрессии?
3. Приведите примеры использования логарифмических регрессионных моделей.
4. Приведите примеры использования степенных регрессионных моделей.
5. Приведите примеры использования показательных регрессионных моделей.
6. Приведите примеры использования полиномиальных регрессионных моделей.
7. Приведите примеры использования обратных регрессионных моделей.
8. Изменяются ли свойства случайного возмущения при линеаризации?
9. Какие модели, нелинейные относительно включенных в анализ объясняющих
переменных, но линейные по параметрам, Вы знаете?
10. Какие модели, нелинейные относительно включенных в анализ объясняющих
переменных и нелинейные по параметрам, Вы знаете?
11. Как проверить адекватность нелинейной регрессионной модели?
12. Опишите схему построения нелинейной регрессионной модели.
13. Как можно обнаружить ошибки спецификации?
14. Что такое эластичность (средняя эластичность)? Как она используется в
нелинейных регрессионных моделях?
15. Как интерпретируются коэффициенты эластичности?
16. Опишите, каким образом можно выбрать «наилучшую» нелинейную модель.
17. Опишите схему построения и оценки коэффициентов нелинейной модели.
18. Как определяются коэффициенты эластичности для различных регрессионных
моделей?
19. Чем определяется абсолютное изменение показателя?
20. Определение производственной функции.
21. Вид производственной функции Кобба-Дугласа.
22. Производственная функция Кобба-Дугласа с учетом технического прогресса.
23. Производственная функция Кобба-Дугласа как разновидность двухфакторной
нелинейной регрессии, оценка ее параметров.
24. Свойства параметров производственной функции Кобба-Дугласа.
25. Экономическая интерпретация параметров производственной функции Кобба-
Дугласа.
26. Как вычислить коэффициент детерминации, скорректированный на количество
степеней свободы?

51
4 Линейная регрессионная модель с несколькими объясняющими
переменными

4.1 Классическая линейная модель множественной регрессии


(КЛММР)

Регрессионные модели с более чем одной независимой переменной


называются моделями множественной регрессии.
Общий вид записи регрессионной модели с несколькими
объясняющими переменными:

Большинство понятий, введенных для парной линейной регрессии,


распространяется и на множественную регрессию. Однако появляются и
некоторые новые понятия, поскольку для прогноза зависимой переменной
используется более одной независимой переменной.
Линейная регрессионная модель с несколькими объясняющими
переменными (Классическая линейная модель множественной регрессии
(КЛММР)) – уравнение вида:

Множественная регрессия широко используется в решении проблем


спроса, доходности акций, изучении функции издержек производства, в
макроэкономических расчетах и целого ряда других вопросов эконометрики.
В настоящее время множественная регрессия − один из наиболее
распространенных методов в эконометрике.
Основная цель множественной регрессии − построить модель с
большим числом факторов, определив при этом влияние каждого из них в
отдельности, а также совокупное их воздействие на моделируемый
показатель.
Многофакторный корреляционный анализ состоит из нескольких
этапов:
 определяются факторы, которые оказывают воздействие на
изучаемый показатель, и отбираются наиболее существенные для
корреляционного анализа;
 собирается и оценивается исходная информация, необходимая
для корреляционного анализа;
 изучается характер и моделируется связь между факторами и
результативным показателем, то есть подбирается и обосновывается
математическое уравнение, которое наиболее точно выражает сущность
исследуемой зависимости;

52
 проводится расчет основных показателей связи корреляционного
анализа;
 дается статистическая оценка результатов корреляционного
анализа и практическое их применение.
Отбор факторов для корреляционного анализа является очень важным
моментом в экономическом анализе. От того, насколько правильно он
сделан, зависит точность выводов по итогам анализа. Главная роль при
отборе факторов принадлежит теории, а также практическому опыту анализа.
При этом необходимо придерживаться следующих правил:
 При отборе факторов в первую очередь следует учитывать
причинно − следственные связи между показателями, так как только они
раскрывают сущность изучаемых явлений. Анализ же таких факторов,
которые находятся только в математических соотношениях с
результативным показателем, не имеет практического смысла.
 При создании многофакторной регрессионной модели
необходимо отбирать самые значимые факторы, которые оказывают
решающее воздействие на результативный показатель, так как охватить все
условия и обстоятельства практически невозможно. Факторы, не
существенные по критерию Стьюдента, не рекомендуется принимать в
расчет.
 Все факторы должны быть количественно измеримы, т.е. иметь
единицу измерения, и информация о них должна содержаться в учете и
отчетности.
 В регрессионную модель линейного типа не рекомендуется
включать факторы, связь которых с результативным показателем имеет
криволинейный характер.
 Не рекомендуется включать в регрессионную модель
взаимосвязанные факторы. Если парный коэффициент корреляции между
двумя факторами не меньше 0,7, то по правилам корреляционного анализа
один из них необходимо исключить, иначе это приведет к искажению
результатов анализа.
 Нежелательно включать в регрессионную модель факторы, связь
которых с результативным показателем носит функциональный характер.
– При отборе факторов в регрессионную модель значительную
помощь оказывают аналитические группировки, способ сопоставления
параллельных и динамических рядов, линейные графики. С помощью них
можно определить наличие, направление и форму зависимости между
изучаемыми показателями. Отбор факторов можно производить также в
процессе решения задачи корреляционного анализа и на основе оценки их
значимости по критерию Стьюдента.
Анализ модели множественной регрессии требует разрешения двух
весьма важных новых вопросов.

53
Первым является вопрос разграничения эффектов различных
независимых переменных. Данная проблема носит название проблемы
мультиколлинеарности.
Вторая, не менее важная проблема заключается в оценке совместной
(объединенной) объясняющей способности независимых переменных в
противоположность влиянию их индивидуальных предельных эффектов.
С этими двумя вопросами связана проблема спецификации модели.
Дело в том, что среди нескольких объясняющих переменных имеются
оказывающие влияние на зависимую переменную и не оказывающие
такового влияния. Более того, некоторые переменные могут и вовсе не
подходить для данной модели. Поэтому необходимо решить, какие
переменные следует включать в модель (уравнение), а какие, напротив,
исключить. Так, если в уравнение не вошла переменная, которая по природе
исследуемых явлений и процессов в действительности должна была быть
включена в эту модель, то оценки коэффициентов регрессии с довольно
большой вероятностью могут оказаться смещенными. При этом
рассчитанные по простым формулам стандартные ошибки коэффициентов и
соответствующие тесты в целом становятся некорректными.
Если же включена переменная, которая не должна присутствовать в
уравнении, то оценки коэффициентов регрессии будут несмещенными, но с
высокой вероятностью окажутся неэффективными. Также в этом случае
рассчитанные стандартные ошибки окажутся, в целом, приемлемы, но из-за
неэффективности регрессионных оценок они станут чрезмерно большими.
Включаемые во множественную регрессию факторы должны
объяснить вариацию независимой переменной. Если строится модель с
набором m−факторов, то для нее рассчитывается показатель детерминации
R2, который фиксирует долю объясненной вариации результативного
признака за счет рассматриваемых в регрессии m-факторов. Влияние других,
неучтенных в модели факторов, оценивается как (1 - R2) с соответствующей
остаточной дисперсией.
При дополнительном включении в регрессию (m + 1)-го фактора
коэффициент детерминации должен возрастать, а остаточная дисперсия
уменьшаться. Если же этого не происходит и данные показатели практически
мало отличаются друг от друга, то включаемый в анализ фактор не
улучшает модель и практически является лишним фактором. Насыщение
модели лишними факторами не только не снижает величину остаточной
дисперсии и не увеличивает коэффициент детерминации, но и приводит к
статистической незначимости параметров регрессии по t-критерию
Стьюдента.
Наиболее широкое применение получили следующие методы подбора
факторов при построении множественной регрессии:
– метод исключения;
– метод включения;
– пошаговый регрессионный анализ.
54
Таким образом, хотя теоретически регрессионная модель позволяет
учесть любое число факторов, практически в этом нет необходимости. Отбор
факторов производится на основе качественного теоретико-экономического
анализа. Однако теоретический анализ часто не позволяет однозначно
ответить на вопрос о количественной взаимосвязи рассматриваемых
признаков и целесообразности включения фактора в модель. Поэтому отбор
факторов обычно осуществляется в две стадии: на первой − подбирают
факторы, исходя из сущности проблемы; на второй − на основе матрицы
показателей корреляции определяют t−статистики для параметров регрессии.
Поскольку корреляционная связь с достаточной выразительностью и
полнотой проявляется только в массе наблюдений, объем выборки данных
должен быть достаточно большим, так как только в массе наблюдений
сглаживается влияние других факторов. Чем большая совокупность объектов
исследуется, тем точнее результаты анализа.
Собранная исходная информация должна быть проверена на
достоверность, однородность и соответствие закону нормального
распределения.
В первую очередь необходимо убедиться в достоверности информации,
насколько она соответствует объективной действительности. Использование
недостоверной, неточной информации приведет к неправильным результатам
анализа и выводам.
Одно из условий корреляционного анализа − однородность
исследуемой информации относительно распределения ее около среднего
уровня. Если в совокупности имеются группы объектов, которые
значительно отличаются от среднего уровня, то это говорит о
неоднородности исходной информации.
Критерием однородности информации служит среднеквадратическое
отклонение и коэффициент вариации, которые рассчитываются по каждому
факторному и результативному показателю.
Чем больше коэффициент вариации, тем относительно больший
разброс и меньшая выравненность изучаемых объектов. Изменчивость
вариационного ряда принято считать незначительной, если вариация не
превышает 10 %, средней − если составляет 10−20 %, значительной − если
она больше 20 %, но не превышает 33 %.
Если же вариация выше 33 %, то это говорит о неоднородности
информации и необходимости исключения нетипичных наблюдений,
которые обычно бывают в первых и последних ранжированных рядах
выборки.
Следующее требование к исходной информации − соответствие ее
закону нормального распределения. Согласно этому закону, основная масса
исследуемых сведений по каждому показателю должна быть сгруппирована
около ее среднего значения, а объекты с очень маленькими значениями или с
очень большими должны встречаться как можно реже.

55
Для количественной оценки степени отклонения информации от
нормального распределения служит отношение показателя асимметрии к ее
ошибке и отношение показателя эксцесса к его ошибке.

4.2 Мультиколлинеарность

Мультиколлинеарность – тесная (сильная) корреляционная связь


между отбираемыми для анализа факторами, совместно воздействующими на
общий результат, которая затрудняет оценивание регрессионных параметров.
Если регрессоры в модели связаны строгой функциональной
зависимостью, то имеет место полная (совершенная) мультиколлинеарность.
Данный вид мультиколлинеарности может возникнуть, например, в задаче
линейной регрессии, решаемой методом наименьших квадратов, если
определитель матрицы Т в формуле (2.18) будет равен нулю.
Полная мультиколлинеарность не позволяет однозначно оценить
параметры исходной модели и разделить вклады регрессоров в
результирующую переменную по результатам наблюдений.
В задачах с реальными данными случай полной мультиколлинеарности
встречается крайне редко. Вместо этого в прикладной области часто
приходится иметь дело с частичной мультиколлинеарностью, которая
характеризуется коэффициентами парной корреляции между регрессорами.
В случае частичной мультиколлинеарности матрица Т будет иметь
полный ранг, но ее определитель будет близок к нулю. В этом случае
формально можно получить оценки параметров модели и их показатели, но
все они будут неустойчивыми.
Чем сильнее мультиколлинеарность факторов, тем менее надежна
оценка распределения суммы объясненной вариации по отдельным факторам
с помощью метода наименьших квадратов (МНК).
Последствия мультиколлинеарности:
 затрудняется интерпретация параметров множественной
регрессии как характеристик действия факторов в чистом виде, ибо факторы
коррелированы;
 параметры линейной регрессии теряют экономический смысл;
 увеличение дисперсий оценок параметров;
 уменьшение значений t-статистик для параметров, что приводит
к неправильному выводу об их статистической значимости;
 получение неустойчивых оценок параметров модели и их
дисперсий;
 оценки параметров ненадежны, обнаруживают большие
стандартные ошибки и меняются с изменением объема наблюдений (не
только по величине, но и по знаку), что делает модель непригодной для
анализа и прогнозирования;

56
 возможность получения неверного, с точки зрения теории, знака
у оценки параметра.
Одним из способов обнаружения мультиколлинеарности является
вычисление коэффициентов парной корреляции между факторами:

или

С помощью инструментов ППП Microsoft Excel Данные - Анализ


данных – Корреляция (Рисунок 4.1) можно построить матрицу парных
коэффициентов корреляции (4.5).

Рисунок 4.1 – Построение матрицы парных коэффициентов корреляции


с помощью инструментов ППП Microsoft Excel

Считается, что если коэффициент корреляции , то между


факторами и мультиколлинеарность присутствует.
Если бы факторы не коррелировали между собой, то матрица парных
коэффициентов корреляции между факторами была бы единичной матрицей,
поскольку все недиагональные элементы были бы равны нулю.
Чем ближе к нулю определитель матрицы межфакторной корреляции,
тем сильнее мультиколлинеарность факторов и ненадежнее результаты
57
множественной регрессии. И наоборот, чем ближе к единице определитель
матрицы межфакторной корреляции, тем меньше мультиколлинеарность
факторов.
Существует ряд подходов преодоления сильной межфакторной
корреляции. Самый простой путь устранения мультиколлинеарности состоит
в исключении из модели одного или нескольких факторов.
Другой подход, более сложный связан с преобразованием факторов,
когда уменьшается корреляция между ними. Например, при построении
модели на основе рядов динамики переходят от первоначальных данных к
первым разностям уровней, чтобы исключить влияние тенденции, или
используются такие методы, которые сводят к нулю межфакторную
корреляцию. Наконец, переходят от исходных переменных к их линейным
комбинациям, некоррелированным друг с другом (метод главных
компонент).
Одним из путей учета внутренней корреляции факторов является
переход к совмещенным уравнениям регрессии, т.е. к уравнениям, которые
отражают не только влияние факторов, но и их взаимодействие.
Рассматривается уравнение, включающее взаимодействие первого порядка
(взаимодействие двух факторов). Возможно включение в модель и
взаимодействий более высокого порядка (взаимодействие второго порядка).
Как правило, взаимодействия третьего и более высоких порядков
оказываются статистически незначимыми, совмещенные уравнения
регрессии ограничиваются взаимодействиями первого и второго порядков.
Но и эти взаимодействия могут оказаться несущественными, поэтому
нецелесообразно полное включение в модель взаимодействий всех факторов
и всех порядков.
Решению проблемы устранения мультиколлинеарности факторов
может помочь и переход к уравнениям приведенной формы. С этой целью в
уравнение регрессии подставляют рассматриваемый фактор через выражение
его из другого уравнения.
Если исключить один из факторов из двух факторной модели, то мы
придем к уравнению парной регрессии. Вместе с тем можно оставить
факторы в модели, но исследовать данное двухфакторное уравнение
регрессии совместно с другим уравнением, в котором фактор
рассматривается как зависимая переменная.
Отбор факторов, включаемых в регрессию, является одним из
важнейших этапов практического использования методов регрессии.
Подходы к отбору факторов на основе показателей корреляции могут быть
разные. Они приводят построение уравнения множественной регрессии
соответственно к разным методикам.
Методы устранения мультиколлинеарности:
Метод дополнительных регрессий
 Строятся уравнения регрессии, которые связывают каждый из
регрессоров со всеми остальными.
58
 Вычисляются коэффициенты детерминации для каждого
уравнения регрессии.
 Проверяется статистическая гипотеза с помощью F-
теста. Вывод: если гипотеза не отвергается, то данный регрессор не
приводит к мультиколлинеарности.
Метод последовательного присоединения
 Строится регрессионная модель с учетом всех предполагаемых
регрессоров. По признакам делается вывод о возможном присутствии
мультиколлинеарности.
 Вычисляется матрица корреляций и выбирается регрессор,
имеющий наибольшую корреляцию с выходной переменной.
 К выбранному регрессору последовательно добавляются каждый
из оставшихся регрессоров и вычисляются скорректированные
коэффициенты детерминации для каждой из моделей.
 К модели присоединяется тот регрессор, который обеспечивает
наибольшее значение скорректированного .
 Процесс присоединения регрессоров прекращается, когда
значение скорректированного становится меньше достигнутого на
предыдущем шаге.
Метод предварительного центрирования
Суть метода сводится к тому, что перед нахождением параметров
математической модели проводится центрирование исходных данных: из
каждого значения в ряде данных вычитается среднее по ряду: .В
результате этого оценки модели становятся устойчивыми. Каким бы образом
не осуществлялся отбор факторов, уменьшение их числа приводит к
улучшению обусловленности матрицы , а, следовательно, и к
повышению качества оценок параметров модели.

4.3 Выбор функциональной формы множественной регрессионной


модели

После отбора факторов и оценки исходной информации важной


задачей в корреляционном анализе является моделирование связи между
факторными и результативными показателями, т.е. подбор соответствующего
уравнения, которое наилучшим образом описывает изучаемые зависимости.
Для его обоснования используются те же приемы, что и для
установления наличия связи: аналитические группировки, линейные графики
и др. Если связь всех факторных показателей с результативным носит
прямолинейный характер, то для записи этих зависимостей можно
использовать линейную функцию:

59
В линейной модели коэффициенты (j=1,…, m)показывают, на
сколько единиц изменяется (увеличивается, если или уменьшается,
если ) результативный показатель с изменением факторного
признака на единицу в абсолютном выражении.
Параметры являются частными коэффициентами корреляции;
интерпретируется как доля дисперсии Y, объяснённая Xi, при закреплении
влияния остальных предикторов, т.е. измеряет индивидуальный вклад Xi в
объяснение Y.
В случаях, когда трудно обосновать форму зависимости, решение
задачи можно провести по разным моделям и сравнить полученные
результаты. Адекватность разных моделей фактическим зависимостям
проверяется по критерию Фишера, показателю средней ошибки
аппроксимации и величине множественного коэффициента детерминации.
Говоря о нелинейных моделях регрессионного анализа, важно
обращать внимание на то, идет ли речь о нелинейности по независимым
переменным (с формальной точки зрения легко сводящейся к линейной
регрессии), или о нелинейности по оцениваемым параметрам (вызывающей
серьезные вычислительные трудности). При нелинейности первого вида с
содержательной точки зрения важно выделять появление в модели членов
вида X1X2, X1X2X3, свидетельствующее о наличии взаимодействий между
признаками X1, X2 и т.д.
Среди нелинейных регрессионных моделей наиболее часто находят
применение следующие уравнения:
1. Степенная:
2. Показательная:
3. Экспонента:
4. Гипербола:
5. Полином:
Оценки параметров нелинейных множественных регрессий находят
после линеаризации (приведения к линейному виду).
В степенной регрессионной модели (1) коэффициенты
интерпретируются как коэффициенты эластичности. Они показывают, на
сколько процентов изменяется в среднем результативная переменная с
увеличением соответствующего фактора на 1% при неизменном действии
других факторов.

4.4 Оценка параметров линейного уравнения множественной


регрессии

Для нахождения коэффициентов регрессионной зависимости (4.6)


используется метод наименьших квадратов (МНК)

60
Скалярный метод. МНК для оценки параметров линейной
множественной регрессии приводит к построению и решению
соответствующей системы нормальных уравнений:

Решить систему (4.7) можно любым подходящим способом, например,


методом Крамера (с помощью вычисления определителей) или методом
Гаусса. При небольшом количестве определяемых параметров использование
определителей предпочтительнее.
Пример 4.1.
Построить линейное уравнение регрессии с тремя объясняющими
переменными, используя следующие исходные данные:

Y
97,25 151,25 0,04 0,70 22876,56 0,00 0,49 14709,06 3,89 68,08 6,05 0,03 105,88
114,15 195,05 0,05 0,88 38044,50 0,00 0,77 22264,96 5,71 100,45 9,75 0,04 171,64
118,36 107,46 0,07 0,69 11547,65 0,00 0,48 12718,97 8,29 81,67 7,52 0,05 74,15
123,45 182,01 0,03 0,64 33127,64 0,00 0,41 22469,13 3,70 79,01 5,46 0,02 116,49
125,24 165,98 0,04 0,65 27549,36 0,00 0,42 20787,34 5,01 81,41 6,64 0,03 107,89
114,78 170,38 0,04 0,70 29029,34 0,00 0,49 19556,22 4,59 80,35 6,82 0,03 119,27
148,56 172,14 0,06 0,73 29632,18 0,00 0,53 25573,12 8,91 108,45 10,33 0,04 125,66
133,23 167,46 0,06 0,71 28042,85 0,00 0,50 22310,70 7,99 94,59 10,05 0,04 118,90
187,54 195,79 0,07 0,63 38333,72 0,00 0,40 36718,46 13,13 118,15 13,71 0,04 123,35
214,63 199,05 0,09 0,59 39620,90 0,01 0,35 42722,10 19,32 126,63 17,91 0,05 117,44
218,68 197,56 0,06 0,63 39029,95 0,00 0,40 43202,42 13,12 137,77 11,85 0,04 124,46
157,29 203,54 0,03 0,58 41428,53 0,00 0,34 32014,81 4,72 91,23 6,11 0,02 118,05
259,87 251,23 0,07 0,51 63116,51 0,00 0,26 65287,14 18,19 132,53 17,59 0,04 128,13
274,58 249,00 0,06 0,48 62001,00 0,00 0,23 68370,42 16,47 131,80 14,94 0,03 119,52
268,34 253,18 0,09 0,50 64100,11 0,01 0,25 67938,32 24,15 134,17 22,79 0,05 126,59
258,60 242,79 0,08 0,49 58946,98 0,01 0,24 62785,49 20,69 126,71 19,42 0,04 118,97
310,47 224,99 0,07 0,43 50620,50 0,00 0,18 69852,65 21,73 133,50 15,75 0,03 96,75
305,47 313,01 0,08 0,50 97975,26 0,01 0,25 95615,16 24,44 152,74 25,04 0,04 156,51
315,78 238,20 0,06 0,46 56739,24 0,00 0,21 75218,80 18,95 145,26 14,29 0,03 109,57
310,07 311,50 0,08 0,47 97032,25 0,01 0,22 96586,81 24,81 145,73 24,92 0,04 146,41
4056,34 4191,57 1,23 11,97 928795,06 0,08 7,43 916702,06 267,81 2270,22 266,93 0,72 2425,60

При этом исследуются 20 предприятий по следующим признакам:


Y –выручка от реализации продукции в расчете на одного работника
предприятия, тыс. руб.;
Х1 –производительность труда, шт./час.
Х2 – капиталоемкость производимой продукции, руб.;
Х3 – трудоемкость производимой продукции, чел. /час.
Построим систему нормальных уравнений, состоящей из четырех
уравнений:

61
Метод Крамера предусматривает вычисление определителей
(в ППП Microsoft Excel с помощью встроенной
математической функции МОПРЕД).
По формулам Крамера:

Подставляя расчетные суммы столбцов из таблицы в (4.8), получим:

Таким образом, уравнение регрессии можно записать в виде:

Матричный метод. Представим данные наблюдений и параметры


модели в матричной форме.

мерный вектор – столбец наблюдений зависимой переменной;

прямоугольная матрица значений независимых (факторных)


переменных размерности . Каждому столбцу матрицы (4.12)
62
соответствует набор из n значений одного из факторов, а первый столбец
состоит из единиц, которые соответствуют значениям переменной при
свободном члене.

– мерный вектор – столбец параметров уравнения регрессии (4.6).


Для удобства записи столбцы записаны как строки и поэтому снабжены
символом T для обозначения операции транспонирования.
В этих обозначениях эмпирическое уравнение регрессии выглядит так:

Отсюда вектор остатков регрессии можно выразить таким образом:

Таким образом, функционал , который, собственно, и


минимизируется по МНК, можно записать:

В соответствии с МНК дифференцирование Q по вектору A приводит к


выражению:

Для нахождения экстремума следует приравнять к нулю. В


результате преобразований получаем выражение для вектора параметров
регрессии:

Пользуясь методом наименьших квадратов (МНК), необходимо


помнить о том, что он дает BLUE − оценки коэффициентов регрессии (Best
Linear Unbiased Estimater)9,только при выполнении следующих условий:
 Регрессионная модель линейна относительно коэффициентов аJ
(j=1,2,…m), случайного члена ε и правильно специфирована.
 Случайный член имеет нулевое математическое ожидание:

9
Доугерти К. Введение в эконометрику: Учебник. 2-е изд. /Пер. с англ. – М.:ИНФРА-М,2004. – С.78-81.
63
 Все независимые переменные некоррелированы со случайным
членом:

 Случайные члены в различных наблюдениях некоррелированы


друг с другом (no serial correlation):

 Случайный член имеет постоянную дисперсию (no


heteroskedasticity):

 Ни одна из объясняющих переменных не является линейной


комбинацией других объясняющих переменных (no perfect multicollinearity)
 Случайный член имеет нормальный закон распределения:

4.5 Множественная корреляция

Показатели множественной корреляции характеризуют тесноту (силу)


связи рассматриваемого набора факторов с результативным признаком, или,
иначе, оценивает тесноту совместного влияния факторов на результат.
К показателям множественной корреляции относятся:
 Множественный коэффициент корреляции;
 Корреляционное отношение;
 Индекс корреляции;
 Совокупный коэффициент корреляции.
Множественный коэффициент корреляции вычисляется по формуле:

где

Корреляционное отношение:

Индекс множественной корреляции:

64
где
- остаточная сумма квадратов;
- общая сумма квадратов,
- факторная сумма квадратов.
Совокупный коэффициент корреляции:

где
- определитель матрицы парных коэффициентов:

где , − парные коэффициенты корреляции:

4.6 Частные F-критерии

Оценку статистической значимости включения фактора в уравнении


регрессии (последовательно), оценивают с помощью частных F–критерий по
следующей формуле:
65
Оценка значимости коэффициентов чистой регрессии осуществляется с
помощью критерия Стьюдента:

Расчетные сравнивают с критическим (табличным) значением t-


критерия Стьюдента при определенном уровне значимости α и числе
степеней свободы ( ).
При этом, если и , то нулевую гипотезу о
несущественности (статистической незначимости, недостоверности)
коэффициента регрессии при заданном уровне значимости α можно
отклонить.
Таким образом, можно построить доверительный интервал по формуле:

и и

В противном случае, если и , нулевую гипотезу о


несущественности (статистической незначимости, недостоверности)
коэффициента регрессии при заданном уровне значимости α можно
принять.

66
Лабораторная работа №4
Задание: Используя данные Приложения 3 для соответствующего
варианта:
1) Построить матрицу парных коэффициентов корреляции. Сделать
вывод о парной тесноте связи между признаками, о наличии или
отсутствии мультиколлинеарности факторных признаков. Отобрать
факторы для регрессионного анализа с учетом мультиколлинеарности.
2) Построить линейное уравнение регрессии с несколькими
объясняющими переменными.
3) Дать экономическую интерпретацию коэффициентов регрессии.
4) Выполнить корреляционный анализ, т.е.
 вычислить множественный (совокупный) коэффициент
корреляции,
 вычислить корреляционное отношение,
 вычислить индекс корреляции.
Сделать вывод о тесноте связи между признаками.
5) Вычислить коэффициент детерминации. Сделать вывод.
6) Выполнить дисперсионный анализ. Протестировать
статистическую гипотезу о достоверности уравнения регрессии при
уровнях значимости α=0,05 и α=0,01.
7) Протестировать статистические гипотезы о достоверности
коэффициентов регрессии по критерию Стьюдента при уровнях значимости
α=0,05 и α=0,01.
8) Вычислить среднюю относительную ошибку аппроксимации.
Сделать вывод о возможности использования регрессионной модели для
прогнозирования.
9) Построить частные уравнения регрессии. Сделать вывод.
10) Вычислить коэффициенты эластичности. Сделать вывод.

67
Таблица

Таблица
Вариант

Вариант
Y X Y X

1 1 1 2, 3, 4, 5, 6, 7, 8 51 4 1 2, 3, 4, 5, 6, 7, 13
2 1 1 2, 3, 4, 5, 6, 7, 9 52 4 1 2, 3, 4, 5, 6, 8, 9
3 1 1 2, 3, 4, 5, 6, 7, 10 53 4 1 2, 3, 4, 5, 6, 8, 10
4 1 1 2, 3, 4, 5, 6, 7, 11 54 4 1 2, 3, 4, 5, 6, 8, 11
5 1 1 2, 3, 4, 5, 6, 8, 9 55 4 1 2, 3, 4, 5, 6, 8, 12
6 1 1 2, 3, 4, 5, 6, 8, 10 56 4 1 2, 3, 4, 5, 6, 8, 13
7 1 1 2, 3, 4, 5, 6, 8, 11 57 4 1 2, 3, 4, 5, 6, 9, 10
8 1 1 2, 3, 4, 5, 6, 9, 10 58 4 1 2, 3, 4, 5, 6, 9, 11
9 1 1 2, 3, 4, 5, 6, 9, 11 59 4 1 2, 3, 4, 5, 6, 9, 12
10 1 1 3, 4, 5, 6, 7, 8, 9 60 4 1 2, 3, 4, 5, 6, 9, 13
11 1 1 3, 4, 5, 6, 7, 8,10 61 5 1 2, 3, 4, 5, 6, 7, 13
12 1 1 3, 4, 5, 6, 7, 8, 11 62 5 1 2, 3, 4, 5, 6, 8, 9
13 1 1 4, 5, 6, 7, 8, 9,10 63 5 1 2, 3, 4, 5, 6, 8, 10
14 1 1 4, 5, 6, 7, 8, 9, 11 64 5 1 2, 3, 4, 5, 6, 8, 11
15 1 1 5, 6, 7, 8, 9,10, 11 65 5 1 2, 3, 4, 5, 6, 8, 12
16 2 1 2, 3, 4, 5, 6, 7, 8 66 5 1 2, 3, 4, 5, 6, 8, 13
17 2 1 2, 3, 4, 5, 6, 7, 9 67 5 1 2, 3, 4, 5, 6, 9, 10
18 2 1 2, 3, 4, 5, 6, 7, 10 68 5 1 2, 3, 4, 5, 6, 9, 11
19 2 1 2, 3, 4, 5, 6, 7, 11 69 5 1 2, 3, 4, 5, 6, 9, 12
20 2 1 2, 3, 4, 5, 6, 8, 9 70 5 1 2, 3, 4, 5, 6, 9, 13
21 2 1 2, 3, 4, 5, 6, 8, 10 71 5 1 3, 4, 5, 6, 7, 8, 9
22 2 1 2, 3, 4, 5, 6, 8, 12 72 5 1 3, 4, 5, 6, 7, 8,10
23 2 1 2, 3, 4, 5, 6, 9, 10 73 5 1 3, 4, 5, 6, 7, 8, 12
24 2 1 2, 3, 4, 5, 6, 9, 11 74 5 1 3, 4, 5, 6, 7, 8,11
25 2 1 3, 4, 5, 6, 7, 8, 9 75 5 1 3, 4, 5, 6, 7, 8, 13
26 2 1 3, 4, 5, 6, 7, 8,10 76 6 1 2, 3, 4, 5, 6, 7, 13
27 2 1 3, 4, 5, 6, 7, 8, 12 77 6 1 2, 3, 4, 5, 6, 8, 9
28 2 1 4, 5, 6, 7, 8, 9,10 78 6 1 2, 3, 4, 5, 6, 8, 10
29 2 1 4, 5, 6, 7, 8, 9, 11 79 6 1 2, 3, 4, 5, 6, 8, 11
30 2 1 5, 6, 7, 8, 9,10, 12 80 6 1 2, 3, 4, 5, 6, 8, 12
31 3 1 3, 4, 5, 6, 7, 8, 8 81 6 1 2, 3, 4, 5, 6, 8, 13
32 3 1 3, 4, 5, 6, 7, 8, 9 82 6 1 2, 3, 4, 5, 6, 9, 10
33 3 1 3, 4, 5, 6, 7, 8, 10 83 6 1 2, 3, 4, 5, 6, 9, 11
34 3 1 3, 4, 5, 6, 7, 8, 11 84 6 1 2, 3, 4, 5, 6, 9, 12
35 3 1 3, 4, 5, 6, 7, 8, 12 85 6 1 2, 3, 4, 5, 6, 9, 13
36 3 1 3, 4, 5, 6, 7, 8, 13 86 6 1 3, 4, 5, 6, 7, 8, 9
37 3 2 3, 4, 5, 6, 7, 8, 14 87 6 1 3, 4, 5, 6, 7, 8,10
38 3 2 3, 4, 5, 6, 7, 8, 15 88 6 1 3, 4, 5, 6, 7, 8, 12
39 3 2 4, 5, 6, 7, 8, 9,16 89 6 1 3, 4, 5, 6, 7, 8,11
40 3 2 4, 5, 6, 7, 8, 10, 17 90 6 1 3, 4, 5, 6, 7, 8, 13
41 3 2 4, 5, 6, 7, 8, 11,14 91 7 1 2, 3, 4, 5, 6, 7, 13
42 3 2 4, 5, 6, 7, 8, 12, 15 92 7 1 2, 3, 4, 5, 6, 8, 9
43 3 2 4, 5, 6, 7, 8, 13,16 93 7 1 2, 3, 4, 5, 6, 8, 10
44 3 2 4, 5, 7, 8, 9,14,17 94 7 1 2, 3, 4, 5, 6, 8, 11
45 3 2 4, 5, 6, 7, 9,10, 15 95 7 1 2, 3, 4, 5, 6, 8, 12
46 4 1 2, 3, 4, 5, 6, 7, 8 96 7 1 2, 3, 4, 5, 6, 8, 13
47 4 1 2, 3, 4, 5, 6, 7, 9 97 7 1 2, 3, 4, 5, 6, 9, 10
48 4 1 2, 3, 4, 5, 6, 7, 10 98 7 1 2, 3, 4, 5, 6, 9, 11
49 4 1 2, 3, 4, 5, 6, 7, 11 99 7 1 2, 3, 4, 5, 6, 9, 12
50 4 1 2, 3, 4, 5, 6, 7, 12 100 7 1 2, 3, 4, 5, 6, 9, 13

68
Тесты по теме
Регрессионная модель с несколькими объясняющими переменными

1.В хорошо подобранной модели остатки должны


 иметь нормальный закон распределения с нулевым
математическим ожиданием и постоянной дисперсией,
 не коррелировать друг с другом,
 иметь экспоненциальный закон распределения,
 хаотично разбросаны.

2. Отметьте основные виды ошибок спецификации

 отбрасывание значимой переменной,


 добавление незначимой переменной,
 низкое значение коэффициента детерминации,
 выбор неправильной формы модели.

3. На практике о наличии мультиколлинеарности обычно судят по


матрице парных коэффициентов корреляции. Если один из элементов
матрицы R больше…., то считают, что имеет место мультиколлинеарность и
в уравнение регрессии следует включить только один из показателей xj или
xe. Вставьте недостающее значение.

 0,3;
 -0,6;
 0,8;
 0.

4. Степень влияния неучтенных факторов в рассматриваемой модели


можно определить на основе:
 парного линейного коэффициента корреляции;
 индекса корреляции;
 коэффициента детерминации;
 коэффициента регрессии.

5. Уравнение множественной регрессии в стандартизованном виде


имеет вид: y  0,25x1  0,75x2 . Сила влияния какого фактора выше на
результативный признак?
 Сила влияния фактора х2 на результативный признак выше силы
влияния фактора х1;
 Сила влияния фактора х1 на результативный признак выше силы
влияния фактора х2;
69
 Сила влияния фактора х2 на результативный признак равна силе
влияния фактора х1.

6. Оценить значимость коэффициентов регрессии в множественной


линейной модели можно при помощи:
 коэффициента корреляции;
 коэффициента автокорреляции;
 критерия Стьюдента;
 критерия Дарбина-Уотсона.

7. Степень усредненного влияния неучтенных факторов в


рассматриваемой модели можно определить на основе:
 частного коэффициента корреляции;
 индекса корреляции;
 коэффициента детерминации;
 коэффициента регрессии.

8. Коэффициент множественной детерминации показывает


 на сколько процентов изменится зависимая переменная, если
независимая переменная изменится на 1%;
 долю вариации зависимой переменной, обусловленную
вариацией независимых переменных;
 на какую часть своего стандартного отклонения изменится
зависимая переменная, если независимая переменная изменится на величину
своего стандартного отклонения;
 насколько изменится зависимая переменная, если независимая
переменная изменится на единицу.

9. С помощью значений таблицы дисперсионного анализа


определить значимость регрессии, используя F-критерий. Критическое
значение F(α,f1,f2) = 4.3 при уровне значимости α=0.05 и степенях свободы
f1= 1 и f2= 25. Какой вывод можно сделать о качестве использованной модели
регрессии?
Число степеней Средние
Компоненты дисперсии
свободы квадраты

26 ?

1 ?

25 ?

70
 – Модель адекватна исходным данным
 – Модель адекватна исходным данным
 – Модель не адекватна исходным данным
 – Модель не адекватна исходным данным

10. Какой показатель характеризует значимость коэффициента


корреляции?
 F-статистика Фишера-Снедекора
 t-статистика Стьюдента
 коэффициент корреляции
 средняя ошибка аппроксимации

11. Метод устранения (уменьшения) мультиколлинеарности


 введение в модель фиктивных переменных
 применение пошаговых процедур отбора наиболее
информативных переменных
 сглаживание временного ряда
 упорядочение переменных по возрастанию фактора

12. Что характеризует частный коэффициент корреляции


множественной линейной регрессии?
 совокупное влияние всех факторов, включенных в модель, на
результирующую переменную
 степень взаимного влияния всех факторов, включенных в модель
 тесноту линейной между объясняемой переменной и
объясняющим фактором с учётом влияния прочих факторов, включенных в
модель
 тесноту линейной связи между объясняемой переменной и
объясняющим фактором при исключении влияния прочих факторов,
включенных в модель

13. Что является оценкой значимости уравнения регрессии в целом?


 F-статистика
 индекс корреляции
 коэффициент детерминации
 коэффициент регрессии

14. Использование в эконометрическом моделировании парной


регрессии вместо множественной является ошибкой ...
 выборки
 измерения
 линеаризации
71
 спецификации

15. Если предпосылки метода наименьших квадратов нарушены, то


 оценки параметров могут не обладать свойствами
эффективности, состоятельности и несмещенности
 коэффициент регрессии является несущественным
 коэффициент корреляции является несущественным
 полученное уравнение статистически незначимо

16. Несмещенность оценки характеризуется ...


 зависимостью от объема выборки значения математического
ожидания остатков
 максимальной дисперсией остатков
 равенством нулю математического ожидания остатков
 отсутствием накопления остатков при большом числе
выборочных оцениваний

17. Если коэффициент регрессии является несущественным, то его


значение приравнивается к ...
 к табличному значению и соответствующий фактор не
включается в модель
 нулю и соответствующий фактор не включается в модель
 к единице и не влияет на результат
 к нулю и соответствующий фактор включается в модель

18. Мульколлинеарность регрессионной модели – это


 возможность построения нескольких моделей (в том числе
нелинейных) на основе одних исходных данных
 высокая значимость характеристик регрессионной модели
высокая степень взаимной коррелированности некоторых из объясняющих
переменных
 зависимость значений объясняемой переменной от ее значений в
предшествовавшие моменты времени
 зависимость объясняемой переменной от нескольких
объясняющих факторов

72
Вопросы для самопроверки

1. Сформулируйте, в чём состоит спецификация модели множественной


регрессии.
2. Что измеряет в многомерной регрессии стандартная ошибка оценки?
3. Зачем вычисляется скорректированный коэффициент детерминации?
4. Для чего используется частный F-критерий?
5. Чем объясняется ситуация: уравнение в целом значимо по F-критерию, а
каждый коэффициент уравнения не значим по t-критерию?
6. Цели и задачи корреляционного анализа.
7. Мультиколлинеарность. Теоретические последствия мультиколлинеарности
для оценок параметров регрессионной модели.
8. Нестабильность оценок параметров регрессии и их дисперсий при малых
изменениях исходных данных в случае мультиколлинеарности.
9. Признаки наличия мультиколлинеарности. Показатели степени
мультиколлинеарности.
10. Методы борьбы с мультиколлинеарностью. Как можно смягчить влияние
мультиколлинеарности на результат моделирования?
11. По каким причинам целесообразно построение «стандартизованного»
уравнения регрессии?
12. Метод наименьших квадратов и его геометрическая интерпретация в
многомерном случае. Система нормальных уравнений.
13. Матричное выражение для вектора оценок коэффициентов регрессии
Ковариационная матрица оценок коэффициентов регрессии.
14. Теорема Гаусса-Маркова для множественной линейной регрессии.
15. Проверка значимости коэффициентов и адекватности регрессии для
множественной линейной регрессионной модели.
16. Коэффициент множественной детерминации и коэффициент множественной
детерминации, скорректированный на число степеней свободы.
17. Связь между коэффициентом множественной детерминации и F-отношением.
18. Неправильная функциональная форма модели. Смещение в оценках
коэффициентов, вызываемое невключением существенных переменных. Ухудшение
точности оценок (увеличение оценок дисперсий) при включении в модель излишних
переменных.

73
5. Обобщенная линейная модель множественной регрессии
(ОЛММР)

5.1 Линейные регрессионные модели с гетероскедастичными


остатками

При построении регрессионных моделей достаточно часто возникает


ситуация, связанная с неоднородностью выборочных совокупностей
значений статистических признаков (значения объясняющих признаков
характеризуют объекты разных масштабов). Действительно, исследуются
экономические объекты (потребители, домохозяйства, предприятия, отрасли,
регионы, страны и т.д.), различающие по доходам, прибыли, размерам,
потребностям и т.д. Значения переменных, входящих в уравнение регрессии,
часто значительно различаются в разных наблюдениях и экономические
переменные меняют свой масштаб не одновременно.
В этом случае вариации значений невключенных в уравнение
переменных и ошибки измерения, определяющие совместно значение
остатков ε, не всегда сравнительно малы при малых Yи X в (5.1) и
сравнительно велики – при больших Yи X:

Рассматривая метод наименьших квадратов, мы обратили внимание на


случаи, когда применение МНК ведет к различным негативным
последствиям при невыполнении условий его применения, одним из которых
является независимость остатков и постоянство их дисперсии.
В рамках классической линейной модели множественной регрессии
(КЛММР) предполагается выполнение всех условий теоремы Гаусса-
Маркова (см. п. 4.4).
Предположим, нарушено условие о независимости остатков и
постоянстве их дисперсии:

Если остатки имеют постоянную дисперсию, они называются


гомоскедастичными, но если они непостоянны, то гетероскедастичными
(или имеет место гетероскедастичность).
Гетероскедастичность приводит к тому, что оценки параметров по
методу наименьших квадратов будут несмещенными, состоятельными, но
неэффективными и формулу для стандартной ошибки оценки адекватно
применять нельзя (стандартные ошибки коэффициентов уравнения регрессий
смещены). Таким образом, выводы, получаемые на основе t−статистик и
F−критерия, а также интервальные оценки будут ненадежными.
Следовательно, статистические выводы, получаемые при стандартных
проверках качества оценок, могут быть ошибочными и приводить к
74
неверным заключениям по построенной модели. Вполне вероятно, что
стандартные ошибки коэффициентов будут занижены, а, следовательно,
t−статистики будут завышены. Это может привести к признанию
статистически значимыми коэффициентов, таковыми на самом деле не
являющимися.
Для КЛММР дисперсия случайной ошибки определялась на основе
условия гомоскедастичности, т.е. ковариационная матрица регрессионных
остатков может быть представлена в виде:

где =const – дисперсия случайной ошибки модели регрессии ;


– единичная матрица размерности .
Обобщённой линейной моделью множественной регрессии
(ОЛММР) называется модель, для которой нарушаются условия о
гомоскедастичности и некоррелированности случайных ошибок.
Отличие между КЛММР и ОЛММР заключается в матрице ковариаций
случайных ошибок модели.
Ковариационная матрица регрессионных остатков ОЛММР является
симметричной положительно определенной матрицей с неравными
элементами на главной диагонали:

Актуальными являются задачи, связанные с выявлением


гетероскедастичности, тестирования гипотез о ее наличии, способами
устранения и, следовательно, повышения точности оценок результата.
Использование графического представления отклонений позволяет
определиться с наличием гетероскедастичности. В этом случае по оси
абсцисс откладывается объясняющая переменная Х, либо линейная
комбинация объясняющих переменных:

По оси ординат – либо остатки, либо их квадраты. Примеры таких


графиков приведены на рис. 5.1.
На рисунке 5.1(а) все отклонения находятся внутри полосы постоянной
ширины, параллельной оси абсцисс. Это говорит о независимости дисперсий
75
от значений переменной Х и их постоянстве (гомоскедастичности остатков).
На рисунке 5.1(б−г) наблюдаются систематические изменения в
соотношениях между значениями переменной Х и квадратами остатков.
На рисунке 5.1(в) отражена – линейная; (г) – квадратичная; (д) –
гиперболическая зависимости между квадратами остатков и значениями
объясняющей переменной Х. Ситуации, представленные на рисунке (б−г)
отражают большую вероятность наличия гетероскедастичности для
рассматриваемых статистических данных.

Рисунок 5.1 − Графическое представление отклонений10

Визуальный анализ остатков регрессии можно выполнить в ППП


Microsoft Excel с помощью Данные Анализ данных Регрессия, при
этом необходимо поставить флажки Остатки, График остатков. При этом
если ярко выражена непостоянная степень разброса остатков: можно
выделить области с большими по модулю остатками (высокая дисперсия) и
области с небольшими по модулю остатками (невысокая дисперсия), то
можно предположить о нарушении предпосылки МНК о гомоскедастичности
остатков.
Графический анализ остатков является удобным и достаточно
надежным в случае парной регрессии. При множественной регрессии
графический анализ возможен для каждой из объясняющих переменных Хj
, j = 1, 2, …, m отдельно. Вместо объясняющих переменных Хj по оси абсцисс
часто откладывают значения yj, получаемые из уравнения регрессии (5.5).

10
Источник информации: www.economy.bsu.by/library/Бородич_Эконометрика%5CБЭ_Глава_8.pdf
76
Для проверки наличия гетероскедастичности используются различные
методы, в зависимости от природы исходных данных:
 критерий μ,
 параметрический тест Гольдфельда-Квандта,
 тест ранговой корреляции Спирмэна,
 тест Глейсера и др.
В каждом из них формулируется нулевая и конкурирующая
гипотезы.
При тестировании модели на гетероскедастичность нулевая гипотеза –
это предположение о гомоскедпстичности остатков (т.е. о том, что
гетероскедастичности нет и дисперсия ошибок одинакова во всех
наблюдениях):

Альтернативная гипотеза в разных методах своя.


Приведем алгоритмы каждого из методов.
Критерий μ применяется в случае значительной совокупности
исходных данных. Рассмотрим алгоритм этого метода:
Шаг 1. Значения показателя Y разбиваются на k групп в соответствии с
изменениями уровня величины Y (по возрастанию, например).
Шаг 2. По каждой группе данных вычисляем сумму квадратов
отклонений

Шаг 3. Определим сумму квадратов отклонений в целом по


совокупности наблюдений:

где − количество элементов в r−й группе.

Шаг 4. Вычислим параметр:

77
где n − количество наблюдений.
Шаг 5. Вычислим значение критерия, который приблизительно
отвечает распределению со степенью свободы k-1, если дисперсия всех
наблюдений однородна:

Если значение μ не меньше табличного значения при выбранном


уровне значимости и степени свободы k-1, то принимается гипотеза о
наличии гетероскедастичности.
Проверкой на гетероскедастичность служит также тест Гольдфельда-
Квандта.
В тесте Гольдфельда-Квандта тестируется альтернативная гипотеза о
монотонной зависимости дисперсии ошибки от какого-нибудь фактора Xj,
например, от времени t.

Алгоритм теста Гольдфельда-Квандта:


Шаг 1. По фактору Xj, от которого может зависеть дисперсия ошибок
упорядочить n наблюдений по мере возрастания или убывания переменной
Xj;
Шаг 2. Исключить из рассмотрения С центральных наблюдений
( , где n- число наблюдений в выборке;
Шаг 3. Оценить отдельно первые и последние (n–c)/2 наблюдений
регрессиями, при условии, что (n – c)/2 превосходит k (k – число
оцениваемых параметров);
Шаг 4. Вычислить остаточные суммы квадратов для каждой группы
(S1 и S2) и статистику, называемую дисперсионным отношением:

Шаг 5. При выполнении нулевой гипотезы о гомоскедастичности


отношение будет удовлетворять F –критерию с и
степенями свободы для каждой остаточной суммы квадратов.
Чем больше величина превышает критическое значение F – критерия,
тем более нарушена предпосылка о равенстве дисперсий остаточных
величин. В противном случае гипотеза о гомоскедастичности принимается.
Критическое значение F – критерия можно вычислить в ППП Microsoft
Excel с помощью функции FРАСПОБР(α; .

78
Пример5.1
Пусть исследуются 20 предприятий. Необходимо построить линейную
регрессионную модель зависимости выручки от реализации продукции в
расчете на одного работника предприятия (Y) от производительности труда
(X1) и капиталоемкости производимой продукции (X2). Протестировать
статистическую гипотезу о гетероскедастичности остатков линейной
регрессионной модели при уровне значимости α=0,05, построенной по
следующим статистическим данным:

Таблица 5.1 – Исходные данные для примера 5.1


№ Y X1 X2
1 97,25 151,25 0,04
2 114,15 195,05 0,05
3 118,36 107,46 0,07
4 123,45 182,01 0,03
5 125,24 165,98 0,04
6 114,78 170,38 0,04
7 148,56 172,14 0,06
8 133,23 167,46 0,06
9 187,54 195,79 0,07
10 214,63 199,05 0,09
11 218,68 197,56 0,06
12 157,29 203,54 0,03
13 259,87 251,23 0,07
14 274,58 249,00 0,06
15 268,34 253,18 0,09
16 258,60 242,79 0,08
17 310,47 224,99 0,07
18 305,47 313,01 0,08
19 315,78 238,20 0,06
20 310,07 311,50 0,08

Решение.
В ППП Microsoft Excel с помощью Данные Анализ данных
Регрессия получим следующие результаты регрессионного (рис.5.2) и
дисперсионного анализа (рис.5.3)и расчетные значения результативной
переменной по уравнению регрессии и остатки , поставив флажок
Остатки (Таблица 5.2).
В результате уравнение регрессии имеет вид:
79
Таблица 5.2 – Расчет остатков по примеру 5.1
№ Y X1 X2
1 97,25 151,25 0,04 111,48 -14,23
2 114,15 195,05 0,05 172,07 -57,92
3 118,36 107,46 0,07 102,96 15,40
4 123,45 182,01 0,03 131,88 -8,43
5 125,24 165,98 0,04 127,48 -2,24
6 114,78 170,38 0,04 132,26 -17,48
7 148,56 172,14 0,06 160,20 -11,64
8 133,23 167,46 0,06 155,12 -21,89
9 187,54 195,79 0,07 198,90 -11,36
10 214,63 199,05 0,09 228,47 -13,84
11 218,68 197,56 0,06 187,81 30,87
12 157,29 203,54 0,03 155,26 2,03
13 259,87 251,23 0,07 259,12 0,75
14 274,58 249 0,06 243,68 30,90
15 268,34 253,18 0,09 287,27 -18,93
16 258,6 242,79 0,08 262,97 -4,37
17 310,47 224,99 0,07 230,62 79,85
18 305,47 313,01 0,08 339,24 -33,77
19 315,78 238,2 0,06 231,95 83,83
20 310,07 311,5 0,08 337,60 -27,53

Регрессионная статистика
Множественный R 0,90
R-квадрат 0,81
Нормированный R-квадрат 0,79
Стандартная ошибка 36,54
Наблюдения 20
Рисунок 5.2 −Результаты регрессионного анализа
по данным примера 5.1

80
Дисперсионный анализ
Значимость
df SS MS F F
Регрессия 2 96189,12 48094,56 36,01 0,00
Остаток 17 22702,00 1335,41
Итого 19 118891,12
Коэффици- Стандартная t- P- Нижние Верхние
енты ошибка статистика Значение 95% 95%
Y-пересечение -104,87 37,21 -2,82 0,01 -183,38 -26,36
Переменная X 1 1,09 0,19 5,75 0,00 0,69 1,49
Переменная X 2 1301,44 527,94 2,47 0,02 187,59 2415,30
Рисунок 5.3 − Результаты дисперсионного анализа
по данным примера 5.1

Согласно методу Гольдфельда-Квандта, упорядочим ряд остатков


сначала по фактору X1, а потом по фактору X2 (Таблица 5.3), отметим цветом
данные, не участвующие в дальнейшем исследовании (С=6).

Таблица 5.3 – Упорядочивание остатков по возрастанию факторов


Остатки, упорядоченные по X1 Остатки, упорядоченные по X2
X1 X2 X1 X2
118,36 107,46 0,07 15,40 123,45 182,01 0,03 -8,43
97,25 151,25 0,04 -14,23 157,29 203,54 0,03 2,03
125,24 165,98 0,04 -2,24 97,25 151,25 0,04 -14,23
133,23 167,46 0,06 -21,89 125,24 165,98 0,04 -2,24
114,78 170,38 0,04 -17,48 114,78 170,38 0,04 -17,48
148,56 172,14 0,06 -11,64 114,15 195,05 0,05 -57,92
123,45 182,01 0,03 -8,43 133,23 167,46 0,06 -21,89
114,15 195,05 0,05 -57,92 148,56 172,14 0,06 -11,64
187,54 195,79 0,07 -11,36 218,68 197,56 0,06 30,87
218,68 197,56 0,06 30,87 315,78 238,20 0,06 83,83
214,63 199,05 0,09 -13,84 274,58 249,00 0,06 30,90
157,29 203,54 0,03 2,03 118,36 107,46 0,07 15,40
310,47 224,99 0,07 79,85 187,54 195,79 0,07 -11,36
315,78 238,2 0,06 83,83 310,47 224,99 0,07 79,85
258,60 242,79 0,08 -4,37 259,87 251,23 0,07 0,75
274,58 249 0,06 30,90 258,60 242,79 0,08 -4,37
259,87 251,23 0,07 0,75 310,07 311,50 0,08 -27,53
268,34 253,18 0,09 -18,93 305,47 313,01 0,08 -33,77
310,07 311,5 0,08 -27,53 214,63 199,05 0,09 -13,84
305,47 313,01 0,08 -33,77 268,34 253,18 0,09 -18,93
81
В ППП Microsoft Excel с помощью Данные Анализ данных
Регрессия получим результаты дисперсионного анализа для верхней и
нижней выборок таблицы 5.3 при упорядочении остатков по X1 (рис.5.4),
вычислим остаточные суммы квадратов (S1 и S2) для каждой группы (5.13)и
дисперсионное отношение (5.14):

Критическое значение F – критерия вычислим в ППП Microsoft Excel с


помощью функции FРАСПОБР(α; , где

α; .

Так как кр , то при уровне значимости α=0,05 можно утверждать,


что нарушена предпосылка о равенстве дисперсий остаточных величин, т.е.
можно утверждать о гетероскедастичности остатков регрессии по
переменной X1.

Дисперсионный анализ для верхней выборки


Значимость
df SS MS F F
Регрессия 2 1157,84 578,92 6,48 0,06
Остаток 4 357,51 89,38
Итого 6 1515,34
Дисперсионный анализ для нижней выборки
Значимость
df SS MS F F
Регрессия 2 1884,40 942,20 2,07 0,24
Остаток 4 1824,40 456,10
Итого 6 3708,79
Рисунок 5.4 – Результаты дисперсионного анализа для верхней и нижней
выборок таблицы 5.3 при упорядочении остатков по X1

Получим оценки дисперсионного анализа для верхней и нижней


выборок таблицы 5.3 при упорядочении остатков по X2 (рис.5.5), вычислим
остаточные суммы квадратов (S1 и S2) для каждой группы (5.15) и
дисперсионное отношение (5.16):

82
Так как кр , то при уровне значимости α=0,05 можно утверждать,
что не нарушена предпосылка о равенстве дисперсий остаточных величин,
т.е. можно утверждать о гомоскедастичности остатков регрессии по
переменной X2.

Дисперсионный анализ для верхней выборки


Значимость
df SS MS F F
Регрессия 2 924,02 462,01 1,58 0,31
Остаток 4 1167,86 291,96
Итого 6 2091,88
Дисперсионный анализ для нижней выборки
Значимость
df SS MS F F
Регрессия 2 5087,85 2543,93 4,05 0,11
Остаток 4 2514,51 628,63
Итого 6 7602,36
Рисунок 5.5 – Результаты дисперсионного анализа для верхней и нижней
выборок таблицы 5.3 при упорядочении остатков по X2

Алгоритм теста ранговой корреляции Спирмэна

ошибка коррелирует с фактором (t).

Шаг 1. Вычисляется выборочный коэффициент ранговой корреляции


Спирмэна:

где − разность между рангами значений фактора и модуля остатка


. Для нахождения рангов в ППП Microsoft Excel можно воспользоваться
функцией Ранг(…), для нахождения абсолютного значения – ABS(…).
Шаг 2. Вычисляется статистика:

83
Данная статистика имеет распределение Стьюдента, если корреляция
между ошибкой и фактором равна нулю.
Шаг 3. Вычисляется критическое значение критерия Стьюдента ,в
ППП Microsoft Excel можно воспользоваться функцией СТЬЮДРАСПОБР
(α; n−k), сравнивается с ним фактическое значение критерия Стьюдента
(5.18).
Шаг 4. Если

то нулевая гипотеза отклоняется в пользу альтернативной, и наоборот.

Пример 5.2
Исследуется зависимость между расходами домохозяйств (n=28) на
продукты питания, тыс. руб. (Y) и доходами, тыс. руб. (X):
№ 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Y 14,5 11,3 14,7 10,2 13,5 10,9 12,3 8,7 10,4 13,8 15,0 11,6 21,6 10,7
X 25,5 26,5 27,2 29,6 35,7 38,6 39,0 39,3 40,0 41,9 42,5 44,2 44,8 45,5
№ 15 16 17 18 19 20 21 22 23 24 25 26 27 28
Y 13,8 15,9 18,0 19,2 16,0 17,6 11,0 16,2 10,6 10,8 29,0 18,0 13,9 21,3
X 45,6 48,2 49,6 52,2 55,8 58,9 61,1 61,8 62,4 64,3 69,2 71,1 74,0 74,5
Задание:
1. Построить уравнение регрессии .
2. Вычислить остатки .
3. Выполнить графический анализ остатков и выдвинуть гипотезу о
зависимости дисперсии остатков от значений Х.
4. Провести анализ модели на гетероскедастичность по тесту
ранговой корреляции Спирмена.
Решение.
В ППП Microsoft Excel с помощью Данные Анализ данных
Регрессия получим оценки регрессионной модели ,
расчетные значения по линейной регрессии ,остатки (табл. 5.4) и
график остатков (Рис.5.6).
Уравнение регрессии можно записать в виде:

Анализ графика 5.6 позволяет сделать предположение о зависимости


дисперсии остатков от значений фактора Х.

84
14,000
12,000
10,000
8,000
6,000
Остатки

4,000
2,000
0,000
-2,000 20 30 40 50 60 70
-4,000
-6,000
-8,000

Рисунок 5.6 −График зависимости остатков от значений фактора Х по


данным примера 5.2

В таблице 5.4 в шестом столбце рассчитаны остатки по абсолютной


величине в ППП Microsoft Excel с помощью математической функции
ABS(…), в седьмом и восьмом столбцах рассчитаны ранги значений ( ) и
значений ( ) с помощью статистической функции РАНГ(…). В девятом
столбце вычислена статистика:

Подставив сумму последнего столбца табл.5.4 в (5.17), получим:

Для вычисления критического значения критерия Стьюдента , в


ППП Microsoft Excel воспользуемся функцией СТЬЮДРАСПОБР (α; n−k):

Так как , то при заданном уровне значимости α=0,05 нулевая


гипотеза о гомоскедастичности остатков модели отклоняется.

85
Таблица 5.4
№ Y
1 2 3 4 5 6 7 8 9
1 14,5 25,5 11,468 3,032 3,032 1 16 225
2 11,3 26,5 11,604 -0,304 0,304 2 3 1
3 14,7 27,2 11,700 3,000 3,000 3 15 144
4 10,2 29,6 12,027 -1,827 1,827 4 12 64
5 13,5 35,7 12,860 0,640 0,640 5 7 4
6 10,9 38,6 13,256 -2,356 2,356 6 13 49
7 12,3 39 13,310 -1,010 1,010 7 8 1
8 8,7 39,3 13,351 -4,651 4,651 8 23 225
9 10,4 40 13,447 -3,047 3,047 9 17 64
10 13,8 41,9 13,706 0,094 0,094 10 1 81
11 15 42,5 13,788 1,212 1,212 11 9 4
12 11,6 44,2 14,020 -2,420 2,420 12 14 4
13 21,6 44,8 14,102 7,498 7,498 13 27 196
14 10,7 45,5 14,198 -3,498 3,498 14 20 36
15 13,8 45,6 14,211 -0,411 0,411 15 6 81
16 15,9 48,2 14,566 1,334 1,334 16 10 36
17 18 49,6 14,757 3,243 3,243 17 19 4
18 19,2 52,2 15,112 4,088 4,088 18 21 9
19 16 55,8 15,604 0,396 0,396 19 5 196
20 17,6 58,9 16,027 1,573 1,573 20 11 81
21 11 61,1 16,327 -5,327 5,327 21 24 9
22 16,2 61,8 16,422 -0,222 0,222 22 2 400
23 10,6 62,4 16,504 -5,904 5,904 23 25 4
24 10,8 64,3 16,764 -5,964 5,964 24 26 4
25 29 69,2 17,433 11,567 11,567 25 28 9
26 18 71,1 17,692 0,308 0,308 26 4 484
27 13,9 74 18,088 -4,188 4,188 27 22 25
28 21,3 74,5 18,15597 3,14403 3,144 28 18 100
Сумма 410,50 1369,00 410,50 0,00 2540

Алгоритм теста Глейзера


По данному методу оценивается регрессионная зависимость модулей
остатков от Х:

Изменяя значения k, можно построить различные регрессии.


Обычно

86
Статистическая значимость коэффициента в каждом конкретном
случае фактически означает наличие гетероскедастичности. Если для
нескольких регрессий (5.18) коэффициент оказывается статистически
значимым, то при определении характера зависимости обычно
ориентируются на лучшую из них.
В тесте Глейзера для остатков может нарушаться условие
гомоскедастичности. Однако во многих случаях предложенные модели
являются достаточно хорошими для определения гетероскедастичности.
Таким образом, можно сделать вывод, что обнаружение
гетероскедастичности − достаточно трудоемкая проблема и для ее решения
разработано несколько методов (тестов). В случае установления наличия
гетероскедастичности, ее корректировка также представляет довольно
серьезную проблему. Одним из возможных решений является метод
взвешенных наименьших квадратов (при этом необходима определенная
информация либо обоснованные предположения о величинах дисперсий
отклонений). На практике имеет смысл попробовать несколько методов
определения гетероскедастичности и способов ее корректировки
(преобразований, стабилизирующих дисперсию).

Лабораторная работа №5
Задание. Используя данные приложения 3и решение лабораторной
работы № 4 согласно № варианта:
1) Построить линейное уравнение регрессии с несколькими
объясняющими переменными (с исключением мультиколлинеарности и
статически незначимых факторов по критерию Стьюдента).
2) Вычислить остатки .
3) Выполнить графический анализ остатков и выдвинуть гипотезу
о зависимости дисперсии остатков от значений t.
4) Протестировать гипотезу о гетероскедастичности остатков
методом Гольдфельда-Квандта при уровне значимости α=0,05;
5) Протестировать гипотезу о гетероскедастичности остатков
методом ранговой корреляции Спирмена при уровне значимости α=0,05.

Лабораторная работа №6
Задание. Используя данные приложения 4 согласно № варианта:
6) Построить уравнение регрессии .
7) Вычислить остатки .
8) Выполнить графический анализ остатков и выдвинуть гипотезу
о зависимости дисперсии остатков от значений t.
9) Протестировать гипотезу о гетероскедастичности остатков
методом Гольдфельда-Квандта при уровне значимости α=0,05;

87
10) Протестировать гипотезу о гетероскедастичности остатков
методом ранговой корреляции Спирмена при уровне значимости α=0,05.

5.2 Обобщенный метод наименьших квадратов

Невозможность или нецелесообразность использования традиционного


метода наименьших квадратов (МНН − OLS (Ordinary Least Squares)) по
причине проявляющейся в той или иной степени гетероскедастичности
привели к разработке обобщенного метода наименьших квадратов
(ОМНК − GLS (Generalized Least Squares)).
Фактически при этом корректируется модель, изменяется ее
спецификация, преобразуются исходные данные для обеспечения
несмещенности, эффективности и состоятельности оценок коэффициентов
регрессии.
Обобщенный метод наименьших квадратов применяется к
преобразованным данным и позволяет получать оценки, которые обладают
не только свойством несмещенности, но и имеют меньшие выборочные
дисперсии. Остановимся на использовании ОМНК для корректировки
гетероскедастичности.
Теорема Айткена11. В классе линейных несмещённых оценок вектора
A для ОЛММР оценка

О К

имеет наименьшую ковариационную матрицу.


Общая формула для расчёта матрицы ковариаций ОМНК-оценок
коэффициентов ОЛММР имеет вид:

В классе линейных несмещенных оценок оценка (5.3), получаемая


обобщенным методом наименьших квадратов, является эффективной.
Дисперсия остатков при гетероскедастичности не является постоянной
для различных значений фактора, допустим, что она пропорциональна
величине , :

где

дисперсия ошибки при i−ом конкретном значении фактора;

11
Sudenmund A.H. Using Econometrics:a Practical Gide. 2 nd ed. N.Y/, 1992.
88
постоянная дисперсия ошибки при соблюдении предпосылки о
гомоскедастичности остатков;
коэффициент пропорциональности, меняющийся с изменением
величины фактора, что и обусловливает неоднородность дисперсии.
При этом предполагается, что неизвестна, в отношении величины
выдвигаются определенные гипотезы, характеризующие структуру
гетероскедастичности.
Рассмотрим регрессионную модель вида:

где остатки гетероскедастичны.


Для того, чтобы получить уравнение регрессии с гомоскедастичными
остатками, перейдем к новым преобразованным переменным, разделив все
члены исходного уравнения на коэффициент пропорциональности .
Уравнение с преобразованными переменными имеет вид:

Это уравнение не содержит свободного члена. Вместе с тем, найдя


переменные в новом преобразованном виде и применяя обычный МНК к
ним, получим иную спецификацию модели:

Параметры такой модели зависят от концепции, принятой для


коэффициента пропорциональности .
В эконометрических исследованиях довольно часто выдвигается
гипотеза, что остатки пропорциональны значениям фактора. Так, если в
уравнении (5.29) предположить, что , то

В этом случае обобщенный МНК предполагает оценку параметров


следующего трансформированного уравнения:

Применение в этом случае обобщенного МНК приводит к тому, что


наблюдения с меньшими значениями преобразованных переменных имеют
при определении параметров регрессии относительно больший вес, чем с
первоначальными переменными. Вместе с тем, следует иметь в виду, что

89
новые преобразованные переменные получают новое экономическое
содержание и их регрессия имеет иной смысл, чем регрессия по исходным
данным.
Пример 5.3. Пусть – издержки производства, – объем
продукции, – основные производственные фонды, – численность
работников, тогда уравнение

является моделью издержек производства с объемными факторами.


Предполагая, что , мы получим в качестве результативного
признака затраты на одного работника, а в качестве факторов следующие
показатели: производительность труда; фондовооруженность труда.
Соответственно трансформированная модель примет вид:

е
где параметры численно не совпадают с аналогичными
параметрами модели (5.34). Кроме этого, коэффициенты регрессии меняют
экономическое содержание:
‒ показатели силы связи, характеризующих среднее
абсолютное изменение издержек производства с изменением абсолютной
величины соответствующего фактора на единицу,
‒ фиксирует при обобщенном МНК среднее изменение затрат
на одного работника; с изменением производительности труда на одну
единицу при неизменном уровне фондовооруженности труда;
‒ определяет среднее изменение затрат на одного работника с
изменением фондовооруженности труда на одну единицу при неизменном
уровне производительности труда.
Предполагая, что в модели (5.30) дисперсия остатков пропорциональна
квадрату объема продукции , то мы получим в качестве
результативного признака затраты на единицу (или на 1 руб.
продукции), а в качестве факторов следующие показатели:
фондоемкость продукции; трудоемкость продукции.
Гипотеза о пропорциональности остатков величине фактора может
иметь реальное обоснование: при обработке недостаточно однородной
совокупности, включающей как крупные, так и мелкие предприятия,
большим объемным значениям фактора может соответствовать большая
дисперсия результативного признака и большая дисперсия остаточных
величин.
90
5.3 Линейные регрессионные модели с автокоррелированными
остатками

Одно из условий (см. п.4.4), которое учитывается при построении


КЛММР, заключается в некоррелированности случайных ошибок модели
регрессии, т. е. ковариация случайных ошибок любых двух разных
наблюдений равна нулю:

Если в модели регрессии случайные ошибки коррелированны между


собой, то данное условие нарушается.
При анализе временных рядов следует учитывать, что, как правило,
остатки коррелированны во времени, что требует корректировки обычного
МНК.
Автокорреляцией называется корреляция, возникающая между
уровнями изучаемой переменной. Это корреляция, проявляющаяся во
времени. Наличие автокорреляции чаще всего характерно для данных,
представленных в виде временных рядов.
Автокорреляцией остатков модели регрессии называется
корреляционная зависимость между настоящими и прошлыми значениями
остатков.
Временным лагом называется величина сдвига между рядами
остатков модели регрессии.
Величина временного лага определяет порядок коэффициента
автокорреляции. Например, если между остатками и существует
корреляционная зависимость, то временной лаг равен единице.
Следовательно, данную корреляционную зависимость можно
охарактеризовать с помощью коэффициента автокорреляции первого порядка
между рядами остатков и .
Последствия, к которым может привести наличие в модели регрессии
автокорреляции остатков, совпадают с последствиями, к которым может
привести наличие в модели регрессии гетероскедастичности:
1) оценки неизвестных коэффициентов линейной модели регрессии
являются несмещёнными и состоятельными, но при этом теряется свойство
эффективности;
2) существует большая вероятность того, что оценки стандартных
ошибок коэффициентов модели регрессии будут рассчитаны неверно, что
конечном итоге может привести к утверждению неверной гипотезы о
значимости коэффициентов регрессии и значимости модели регрессии в
целом.
Наиболее наглядным способом обнаружения автокорреляции
случайных остатков регрессионной модели является графический метод. При

91
этом осуществляется построение графиков автокорреляционной и частной
автокорреляционной функций.
Автокорреляционной функцией называется функция оценки
коэффициента автокорреляции в зависимости от величины временного лага
между исследуемыми рядами.
Автокорреляция остатков порядка s равна коэффициенту корреляции,
рассчитанному между исходными остатками модели и лаговыми остатками
порядка s.
Коэффициент автокорреляции остатков определяется по формуле
линейного коэффициента корреляции для парной зависимости между
величинами ( и ):

где l=1,2,… − лаг (число периодов, по которым рассчитывается


коэффициент автокорреляции).
Для расчета коэффициента автокорреляции по формуле (5.33) в
Microsoft Excel можно воспользоваться статистической функцией КОРРЕЛ.
Желательно для обеспечения статистической достоверности
коэффициентов автокорреляции , где - длина временного ряда.
Последовательность коэффициентов автокорреляции уровней первого,
второго и т.д. порядков называют автокорреляционной функцией. График
зависимости ее значений от величины лага (порядка коэффициента
автокорреляции)называется коррелограммой.
При этом по оси абсцисс откладываются значения ( ) – величины
сдвига между рядами остатков, которые совпадают с порядком
автокорреляционного коэффициента (5.37). Также на коррелограмме
отмечается диапазон в размере двух стандартных ошибок коэффициентов
автокорреляции на каждом лаге.
Частная автокорреляционная функция является более углублённой
версией обычной автокорреляционной функции. Её отличительной
особенностью является исключение корреляционной зависимости между
наблюдениями внутри лагов, т. е. частная автокорреляционная функция на
каждом лаге отличается от обычной автокорреляционной функции на
величину удалённых автокорреляций с меньшими временными лагами.
Следовательно, частная автокорреляционная функция более точно
характеризует автокорреляционные зависимости внутри временного ряда.
втокорреляция остатков может быть вызвана несколькими
причинами, имеющими различную природу:
1) наличие ошибок измерения в значениях результативного признака;
2) модель может не включать фактор, оказывающий существенное
воздействие на результат, влияние которого отражается в остатках,
92
вследствие чего в дальнейшем могут оказаться автокоррелированными.
Очень часто этим фактором является фактор времени t. Кроме того, в
качестве таких существенных факторов могут выступать лаговые значения
переменных, включенных в модель;
3) модель не учитывает несколько второстепенных факторов,
совместное влияние которых на результат существенно ввиду совпадения
тенденций их изменения или фаз циклических колебаний;
4) неправильная спецификация функциональной формы модели. В этом
случае, следует изменить форму связи факторных и результативного
признаков, а не использовать специальные методы расчета параметров
уравнения регрессии при наличии автокорреляции остатков.
Один из наиболее простых способов учета коррелированности остатков
(в разные моменты времени) состоит в предположении, что
последовательность образует авторегрессионный процесс
первого порядка:

называется коэффициентов авторегрессии ( ).


Если коэффициент авторегрессии известен, то ОМНК сводится к
преобразованию и, в дальнейшем, применению МНК:

При неизвестном коэффициенте авторегрессии существуют


процедуры доступного ОМНК, суть которых состоит в оценивании этого
коэффициента, а затем в применении преобразования (5.39).
Для проверки автокорреляции в остаточных величинах используют
критерий Дарбина-Уотсона , фактическое значение которого
вычисляется по формуле:

С помощью критерия Дарбина-Уотсона тестируется нулевая гипотеза


H0 : , тогда конкурирующая гипотеза H1 : .

Так как , то

Поэтому содержательный смысл статистики :

93
‒ если между и имеется достаточно высокая положительная
корреляция ( ), то величина статистики мала ( ;
‒ если между и имеется достаточно слабая положительная
корреляция ( ), то величина статистики мала ( ;
‒ если между и имеется достаточно высокая отрицательная
корреляция( ), то величина статистики мала ( ;
Дарбин и Уотсон (Durbin, Watson, 1951), доказали, что существуют две
границы и , (l – low − нижняя; u − upper – верхняя)
Исходя из расчетного значения (5.40) необходимо принять или
отвергнуть гипотезу о наличие автокорреляции в остаточных величинах
(t=1,2,…,n), для этого необходимо воспользоваться в зависимости от длины
ряда n критическими значениями и из Приложения 12.
Если , то тестируется гипотеза о наличии положительной
корреляции между и , причем:
‒ если < dl, то гипотеза H0: об отсутствии автокорреляции
отклоняется в пользу конкурирующей;
‒ если dl du, то достаточных оснований для принятия
единственно правильного решения нет, необходимы дополнительные
исследования;
‒ если du то гипотеза H0: об отсутствии автокорреляции
принимается.
Если , то тестируется гипотеза о наличии отрицательной
корреляции между и , причем:
‒ если < 4−du то гипотеза H0: об отсутствии
отрицательной корреляции между и отклоняется в пользу
конкурирующей;
‒ если 4−du 4−dl, то достаточных оснований для принятия
единственно правильного решения нет, необходимы дополнительные
исследования;
‒ если 4−dl то гипотеза H0: об отсутствии отрицательной
автокорреляции принимается.
Недостатки метода Дарбина-Уотсона:
 неприменим к моделям авторегрессии;
 не способен выявлять автокорреляцию второго и более высоких
порядков;
 даёт достоверные результаты только для больших выборок.
Эффективные оценки коэффициентов уравнения регрессии при
автокорреляции остатков может быть получены с помощью обобщенного
метода наименьших квадратов12. Иногда этотметод называют оценкой
йткена.13

12
Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: Учеб. – 5-е изд., испр. – М.:
Дело. 2001. –С.152-164.
13
Аистов, А. В.Эконометрика : шаг за шагом : учеб. пособие для студ. вузов, обуч. по напр. подгот.
"Экономика" : доп. Минобразования и науки России. - М. : ГУ ВШЭ, 2006. – С. 73.
94
Если в уравнении

остатки подчиняются авторегрессионной схеме первого порядка


(5.38), то реализация обычного МНК сводится к ОМНК− коэффициентов
уравнения:

где

Оценивание параметров уравнения (5.44) требует знания значения


коэффициента авторегрессии . Простой (грубый) способ ее получения
заключается в использовании наблюдаемого значения критерия
Дарбина−Уотсона . Из (5.41) следует:

Более точную оценку , а следовательно, и коэффициентов уравнения


(5.44) можно получить, воспользовавшись итерационным методом
Кохрейна−Оркатта (Cochran−Orcutt iterative method):
1. Методом наименьших квадратов оцениваем параметры модели
(5.43) и находим остатки
2. Полученные остатки используются для нахождения МНК-оценки
уравнения (5.38).
3. Полученная оценка используется для вычисления новых
переменных (5.45).
4. Методом наименьших квадратов оцениваем параметры модели
(5.44).
5. Вычисляем остатки .
6. Возврат к п.2.
Процедура повторяется до тех пор, пока оценка не перестанет
изменяться в пределах заданной точности измерений. Процедура
Кохрейна−Оркатта реализована в большинстве эконометрических
компьютерных программ.
Процедура Хилдрета−Лу (Hildreth−Lu):
Из интервала (−1; 1) возможного изменения коэффициента берутся
последовательно некоторые значения с определенным шагом (например, 0,1
95
или 0,05) и для каждого из них проводится оценивание преобразованной
модели (5.44). В результате выбирается то значение , для которого в (5.44)
. Затем в некоторой окрестности этого значения строится более
мелкая сетка и процесс повторяется. Итерация повторяется до тех пор, пока
оценка не перестанет изменяться в пределах заданной точности измерений.

Лабораторная работа №7
Используя данные приложения 4 согласно № варианта и решение
лабораторной работы№ 6:
1) Построить уравнение
2) Вычислить остатки .
3) Выполнить графический анализ остатков и выдвинуть гипотезу
о наличии автокорреляции в остатках.
4) Протестировать статистическую гипотезу о наличии
автокорреляции в остатках регрессии методом Дарбина−Уотсона.

Тесты по теме
Обобщенная линейная модель множественной регрессии

1. Наличие гетероскедастичности можно определить используя:


 критерий Стьюдента;
 критерий Фишера;
 критерий Чоу;
 критерий Энгеля-Грангера.

2. Гетероскедастичность регрессионной модели – это


 высокая степень взаимной коррелированности объясняющих
переменных
 немонотонность графика регрессионной зависимости
 непостоянство дисперсий ошибок регрессии для различных
значений объясняющей переменной
 непостоянство математического ожидания объясняемой
переменной

3. Какой из приведенных тестов является тестом на


гетероскедастичность?
 Гаусса-Маркова
 Голдфелда-Квандта
 Дарбина-Уотсона
 Льюинга-Бокса
 Чоу

96
4. Обобщенный МНК применяется в случае...
 наличия в остатках гетероскедастичности или автокорреляции
 наличия в модели фиктивных переменных
 наличия в модели мультиколлинеарности
 наличия в модели незначимых оценок

5. Установить соответствие:
Классификация регрессионных Автоковариационная матрица вектора
моделей возмущений
1) обобщенная модель А) симметричная положительно
определенная, с произвольными
элементами
2) модель с Б) диагональная, с различными
гетероскедастичностью элементами
3) модель с автокорреляцией В) диагональная, с равными
элементами
4) классическая модель Г) симметричная положительно
определенная, с равными
диагональными элементами
 1-Б, 2-Г, 3-А, 4-В
 1-А, 2-Б, 3-Г, 4-В
 1-А, 2-Г, 3-В, 4-Б

6. МНК- оценки параметров обобщенной регрессионной модели


 смещенные
 несмещенные

7. ОМНК- оценки параметров обобщенной регрессионной модели


 смещенные
 несмещенные

8. Причины гетероскедастичности:
 исследование неоднородных объектов
 ошибки спецификации
 ошибки измерений

9. Причины автокорреляции:
 исследование неоднородных объектов, ошибки спецификации
 характер наблюдений, ошибки спецификации, ошибки измерений
 ошибки спецификации, ошибки измерений, исследование
неоднородных объектов

97
10. Установить соответствие:
Типы нарушений предпосылок Тест на обнаружение
Гаусса-Маркова
1) гетероскедастичность А) Дарбина- Уотсона
2) автокорреляция Б) Глейзера
В) Спирмена
Г) Голдфельда- Квандта
 1-Б, В, Г; 2-А
 1-Б, Г, 2-А, В
 1-А, В, Г, 2-Б

Вопросы для самопроверки


1. К чему приводит нарушение предпосылок теоремы Гаусса-Маркова?
2. Приведите аргументы в пользу графического теста, теста Голдфелда−Квандта
и теста Глейзера.
3. Приведите схему теста Голдфелда−Квандта.
4. Какое из следующих утверждений верно, ложно или не определено:
а) вследствие гетероскедастичности оценки перестают быть эффективными и
состоятельными;
б) оценки и дисперсии оценок остаются несмещенными;
в) выводы по t- и F-статистикам являются ненадежными;
г) при наличии гетероскедастичности стандартные ошибки оценок будут
заниженными;
д) гетероскедастичность проявляется через низкое значение статистики
Дарбина−Уотсона DW;
е) не существует общего теста для анализа гетероскедастичности;
ж) тест ранговой корреляции Спирмена основан на использовании t-статистики;
з) тест Парка является частным случаем теста Глейзера;
и) использование метода взвешенных наименьших квадратов носит ограниченный
характер, т. к. для его использования необходимо знать дисперсии отклонений;
к) если в парной регрессии дисперсия случайных отклонений пропорциональна
величине объясняющей переменной (Х), то для получения эффективных оценок
необходимо все наблюдаемые значения поделить на х.
6. Дайте определение ОЛММР с автокоррелированными остатками.
7. Укажите свойства МНК-оценок ОЛММР с автокоррелированными
остатками.
8. Ковариационная матрица регрессионных остатков в ОЛММР с
автокоррелированными остатками первого порядка.
9. Укажите признаки автокорреляции.
10. Укажите последствия автокорреляции.
11. Тест Дарбина-Уотсона на наличие автокорреляции в остатках.
12. Процедура Кохрейна−Оркатта.
13. Процедура Хилдрета−Лу.
14. Исследование статистических свойств ОМНК-оценок параметров модели с
автокоррелированными остатками.

98
6. Регрессионные модели с переменной структурой

6.1 Фиктивные переменные в регрессионном анализе

Экономические величины складываются под влиянием множества


различных факторов, как количественных, так и качественных по своей
природе, поэтому при построении регрессионной модели часто возникает
необходимость включить в исследование не только количественные, но и
качественные переменные (например, должность, образование, пол, место
проживания, национальность и др.) и исследование их влияния на
результирующую переменную.
Регрессионные модели могут содержать одновременно как
количественные, так и качественные переменные, и даже только
качественные.
Фиктивной переменной (dummy variable) называется атрибутивный
или качественный фактор, представленный посредством определённого
цифрового кода. Чтобы ввести качественные факторы в регрессионную
модель, им должны быть присвоены те или иные цифровые метки14, т.е.
качественные переменные преобразованы в количественные.
Существует два способа учета качественных признаков в
регрессионных моделях:
1. Разбиение исходной статистической информации на заведомо
однородные группы и строить модели для каждой однородной выборки с
последующим выяснением различия в моделях.
2. Построение и оценивание одной модели для всей совокупности
наблюдений и измерение влияния фактора, явившегося причиной появления
неоднородной выборки посредством введения фиктивной переменной.
Второй способ обладает двумя следующими преимуществами:
 имеется простой способ проверки, является ли воздействие
качественного фактора значимым (путем проверки на статистическую
значимость коэффициента перед фиктивной переменной);
 при условии выполнения определенных предположений оценки
модели оказываются более эффективными (при исследовании совокупности
небольшой выборки).
Наиболее наглядными примерами применения фиктивных переменных
являются модели регрессии, отражающие:
 проблему разрыва в заработной плате у мужчин и женщин;
 зависимость размера заработной платы от переменной стажа
работников с различным образованием;
 зависимость стоимости квартиры от места расположения дома
(удаленности от центра) в городе, наличия балкона, лифта и др.;
14
Эконометрика: учеб. для студ. вузов, обуч. по спец. 061700 "Статистика": рек. Минобразования России /
под ред. И. И. Елисеевой. - 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2006. - 576 с.

99
 влияние на спрос того или иного продукта вкусов потребителей,
их ожиданий, пола, национальных и религиозных предпочтений и т.д.
 зависимость потребление определенного продукта в зависимости
от пола, региона проживания и др.
Предположим, что на основе собранных данных была построена
модель регрессии, отражающая зависимость заработной платы рабочих Y от
их возраста :

Однако данная модель регрессии не может в полной мере


охарактеризовать вариацию результативной переменной. Поэтому в модель
необходимо ввести дополнительный фактор, например пол, на основании
предположения о том, что у мужчин в среднем заработная плата выше, чем у
женщин. В связи с тем, что переменная пола является качественной, её
необходимо представить в виде фиктивной переменной следующим образом:

е ли ин
е ли ен ин

С учётом новой фиктивной переменной модель регрессии примет вид:

где δ1 – это коэффициент, который характеризует в среднем разницу в


заработной плате у мужчин и женщин.
Моделью регрессии с переменной структурой называется модель
регрессии, которая включает в качестве факторной переменной фиктивную
переменную.
Рассмотрим модель регрессии, характеризующую зависимость
переменной размера заработной платы Y от переменной стажа работников
с различным образованием. Качественная переменная «образование» может
принимать три значения: «среднее», «среднее специальное» и «высшее». Для
включения факторной переменной «образование» в модель регрессии,
необходимо ввести две новых фиктивных переменных, потому что
количество бинарных фиктивных переменных в регрессии должно быть на
единицу меньше, чем число градаций качественного признака.
Следовательно, качественная переменная «образование» может быть
представлена в виде:

среднее
среднее пе и л н е
высшее

100
среднее
среднее пе и л н е
высшее

Модель регрессии, характеризующая зависимость переменной размера


заработной платы Y от переменной стажа работников с различным
образованием, примет вид:

Данное уравнение равносильно трем регрессионным уравнениям с


одной объясняющей переменной :
1) регрессия, характеризующая зависимость переменной размера
заработной платы Y от переменной стажа работников со средним
образованием (D1=0, D2=0):

2) регрессия, характеризующая зависимость переменной размера


заработной платы Y от переменной стажа работников со средним
специальным образованием (D1=1, D2=0):

3) регрессия, характеризующая зависимость переменной размера


заработной платы Y от переменной стажа работников с высшим
образованием (D1=0, D2=1):

Моделью регрессии без ограничений (unrestricted regression)


называется модель регрессии, в которую включены все фиктивные
переменные.
Базисной моделью или регрессией с ограничениями (restricted
regression) называется модель регрессии, в которой все значения фиктивных
переменных равны нулю.
Для нашего примера модель регрессии вида (6.6) будет являться
моделью регрессии без ограничений, а модель регрессии вида (6.7) при D1=
D2=0 будет являться моделью регрессии с ограничениями. Базисная модель
регрессии соответствует регрессионной зависимости заработной платы
рабочих со средним образованием от стажа работы.
Частная модель регрессии переменной заработной платы работников со
средним специальным образованием от переменной стажа является модель
(6.8), где δ1 характеризует то, насколько большую заработную плату
101
получают рабочие со средним специальным образованием по сравнению с
работниками со средним образованием при одинаковом стаже работы.
Частная модель регрессии переменной заработной платы работников с
высшим образованием от переменной стажа является модель (6.9), где δ2
характеризует то, насколько большую заработную плату получают рабочие с
высшим образованием по сравнению с рабочими со средним образованием
при одинаковом стаже работы.
Коэффициенты δ1 и δ2 показывают сдвиг в объеме заработной платы
работника в зависимости от роста уровня образования.
Оценки неизвестных коэффициентов моделей регрессии с переменной
структурой рассчитываются с помощью классического метода наименьших
квадратов.
Методика построения модели с фиктивными переменными:
1. Статистическая совокупность данных разбивается на категории,
число которых определяется числом градаций качественного признака. Одну
из категорий принимаем за эталонную (выбирается произвольно).
2. Вводятся фиктивные переменные для всех категорий, кроме
эталонной. Каждая из введенных фиктивных переменных принимает
значение, равное единице для данных рассматриваемой категории и нуль для
остальных категорий.
3. Фиктивные переменные вводятся в уравнение с коэффициентом
, где k - число категорий. Каждый из коэффициентов δi
характеризует сдвиг значения результативного показателя для данных i - ой
категории относительно эталонной. Если δi оказывается статистически
значимым, то фактор (событие), выражаемое этой фиктивной переменной
оказывает существенное влияние на результативный показатель.
Модель может содержать несколько качественных признаков. В этом
случае фиктивные переменные для каждого признака вводятся в
соответствии с вышеприведенной методикой.

Пример 6.1
Предположим, что изучается результативный признак Y - стоимость
квартиры (тыс. руб.) в зависимости от следующих факторов:
Х1 − общая площадь, м2,
Х2 – число комнат в квартире,
Х3 – площадь кухни, м2,
Х4 – района города (Ленинский, Пролетарский и Октябрьский),
Х5 – тип строения (кирпичный, панельный).
Статистические данные приведены в таблице 6.1.

102
Таблица 6.1− Статистические данные для построения множественной
регрессии зависимости стоимости квартиры от заданных факторов
№ Y X1 X2 X3 D41 D42 D5 № Y X1 X2 X3 D41 D42 D5
1 1590 39,0 1 8,0 0 1 0 26 2440 48,7 1 12,4 1 0 1
2 2700 68,4 3 10,7 0 1 0 27 2130 39,8 1 8,1 0 1 1
3 1350 34,8 1 10,7 0 0 0 28 3670 68,6 2 17,0 1 0 1
4 1510 39,0 1 8,5 0 0 0 29 2150 39,0 1 9,2 0 1 1
5 2110 54,7 2 10,7 0 0 0 30 2640 48,6 2 8,0 0 0 1
6 2870 74,7 3 10,7 0 0 0 31 5390 98,0 3 22,0 0 1 1
7 3100 71,7 3 10,7 0 1 0 32 3420 68,5 2 8,3 0 1 1
8 2830 74,5 3 10,4 0 0 0 33 3560 71,1 2 13,3 1 0 1
9 5230 137,7 4 14,6 0 1 0 34 3400 68,0 3 8,0 0 0 1
10 2200 40,0 1 11,0 1 0 1 35 1900 38,0 1 7,4 0 0 1
11 2800 53,0 2 10,0 0 1 1 36 4660 93,2 2 14,0 1 0 1
12 4500 86,0 3 14,0 0 1 1 37 5850 117,0 3 25,0 1 0 1
13 5100 98,0 4 13,0 0 0 1 38 2420 42,0 2 10,2 0 0 1
14 3440 62,6 2 11,0 1 0 1 39 3570 62,0 2 11,0 1 0 1
15 2470 45,3 1 10,4 1 0 1 40 5320 89,0 3 11,6 0 1 1
16 3080 56,4 2 9,4 1 0 1 41 7590 132,0 4 11,0 1 0 1
17 1590 37,0 1 8,3 0 1 0 42 2120 40,8 2 10,1 0 0 1
18 2900 67,5 3 8,3 0 1 0 43 3080 59,2 2 11,2 0 1 1
19 1540 37,0 1 8,3 0 0 0 44 3400 65,4 3 9,3 0 0 1
20 2860 69,0 3 8,3 0 0 0 45 3190 60,2 2 10,9 0 1 1
21 1560 40,0 1 8,3 0 0 0 46 4360 82,2 3 13,8 0 1 1
22 2770 69,1 3 8,3 0 0 0 47 5320 98,4 3 15,3 1 0 1
23 3410 68,1 2 13,0 0 1 1 48 4310 76,7 3 8,0 0 1 1
24 3770 75,3 2 12,1 1 0 1 49 2500 38,7 1 10,2 1 0 1
25 4190 83,7 3 12,1 1 0 1 50 3520 56,4 2 10,1 0 1 1

В данной таблице введены фиктивная бинарная переменная D5 для


признака «тип строения» и две бинарные переменные D41 и D42 для признака
«район города»:
кирпичное строение
другое

Ленинский район
Октябрьский район
Пролетарский район

Ленинский район
Октябрьский район
Пролетарский район

103
Построим матрицу парных коэффициентов корреляции:

Таблица 6.2 – Матрица парных линейных коэффициентов корреляции


Y X1 X2 X3 D41 D42 D5
Y 1
X1 0,93 1
X2 0,76 0,85 1
X3 0,62 0,61 0,35 1
D41 0,31 0,19 -0,10 0,37 1
D42 0,08 0,08 0,10 -0,01 -0,51 1
D5 0,42 0,13 0,00 0,29 0,43 -0,03 1

Так как , то между факторами 1 и 2 –


мультиколлинеарность. Исключим из рассмотрения фактор 2 (число комнат
в квартире) и построим линейную множественную регрессионную модель
вида:

Коэффициент показывает сдвиг в стоимости квартиры в кирпичном


доме относительно стоимости квартиры в панельном доме, а коэффициенты
1 и  2 соответственно показывают сдвиг в стоимости квартиры в домах,
находящихся в Ленинском и Октябрьском районах города относительно
Пролетарского района.
Найдем параметры модели на основе «Пакета анализа» Microsoft
Excel.
Уравнение регрессии:

Следовательно, уравнение статистически значимо в целом с


вероятностью 95%.
Можно построить отдельные регрессионные уравнения зависимости
стоимости квартиры от района города и типа строения дома.
В этих уравнениях различны только свободные члены, коэффициенты
при количественных факторах 1 и 3 одинаковы для всех уравнений. Анализ
построенных уравнений позволяет сделать вывод о том, что при равных
значениях общей площади квартиры и площади кухни, квартиры в домах

104
Ленинского района стоят дороже, а в домах Пролетарского района −
дешевле, чем в домах Октябрьского и Ленинского районов.

Таблица 6.3 – Регрессионные модели зависимости стоимости квартиры


от общей площади, площади кухни, места расположения дома и типа
строения
Тип категории Уравнение
Пролетарский район
(панельный дом)
Пролетарский район
(кирпичный дом)
Октябрьский район
(панельный дом)
Октябрьский район
(кирпичный дом)
Ленинский район
(панельный дом)
Ленинский район
(кирпичный дом)

Пример 6.2
Построим регрессионную модель с фиктивными переменными вида:

где
потребление чая в квартал, кг;
средняя цена 1 кг чая, тыс. руб.,
пол (мужчина или женщина);
регион проживания (северный, центральный или южный)
Вводим фиктивную бинарную переменную для признака «пол» и две
бинарные переменные и для регионов проживания.

мужчина
женщина

Северный регион
ентральный регион
жный регион

Северный регион
ентральный регион
жный регион

Статистические данные приведены в таблице 6.4.


105
Таблица 6.4
№ №
1 0,2 1 1 0 0 16 0,6 0,6 0 1 0
2 0,4 1 0 0 0 17 0,6 0,5 0 1 0
3 0,4 0,8 1 0 0 18 0,65 0,5 1 1 0
4 0,6 0,8 0 0 0 19 0,6 0,3 1 1 0
5 0,6 0,6 1 0 0 20 0,7 0,3 0 1 0
6 0,8 0,6 0 0 0 21 0,5 1 1 0 1
7 0,75 0,5 0 0 0 22 0,6 1 0 0 1
8 0,9 0,5 1 0 0 23 0,7 0,8 1 0 1
9 0,9 0,3 1 0 0 24 0,9 0,8 0 0 1
10 1,1 0,3 0 0 0 25 0,9 0,6 1 0 1
11 0,2 1 1 1 0 26 1,1 0,6 0 0 1
12 0,45 1 0 1 0 27 1 0,5 0 0 1
13 0,45 0,8 1 1 0 28 1,2 0,5 1 0 1
14 0,6 0,8 0 1 0 29 1,2 0,3 1 0 1
15 0,5 0,6 1 1 0 30 1,4 0,3 0 0 1

Коэффициент в модели (6.16) показывает сдвиг в потреблении чая


мужчинами относительно женщин, а коэффициенты и соответственно
показывают сдвиг в объеме потребления чая в северных и центральных
регионах относительно южного региона
Найдем параметры модели с помощью ППП Microsoft Excel Данные
Анализ данных Регрессия.
Уравнение регрессии:

Следовательно, уравнение статистически значимо в целом с


вероятностью 95%.

Таблица 6.5 – Тестирование гипотезы о статистической значимости


параметров (6.20)
Стандартная t-
Коэффициенты ошибка статистика P-Значение
1,259 0,065 19,262 0,000
-0,839 0,081 -10,298 0,000
-0,113 0,039 -2,878 0,008
-0,130 0,048 -2,695 0,012
0,285 0,048 5,909 0,000
106
Так как P-Значение (столбец №5 таблицы 6.5) для всех параметров
менее , то можно сделать вывод о статистической значимости
параметров регрессии (6.20) по критерию Стьюдента при уровне значимости
. Следовательно, потребление чая существенно зависит от цены,
пола и проживания в определенном регионе.
Можно построить отдельные уравнения для мужчин и женщин и
каждого региона.

6.2 Моделирование динамики экономического процесса при


наличии структурных изменений

При моделировании динамики некоторого экономического процесса,


заданного временным рядом Yt следует учитывать единовременные
изменения его характера, вызванные структурными изменениями в
экономике или иными факторами.
Схематично такая ситуация изображена на рисунке 6.1:

Рисунок 6.1 – Структурные изменения в динамике временного ряда

На рисунке 6.1 видно, что, начиная с некоторого момента t*=12,


происходят изменения характера динамики изучаемого показателя.
Момент времени t* сопровождается значительными изменениями ряда
факторов, которые оказывают сильное воздействие на изучаемый показатель
Y t.
Причины структурных изменений:
 изменения в общеэкономической ситуации;
 начало крупных экономических реформ;
 изменение экономического курса страны;
 нефтяные кризисы и др.
107
Если исследуемый временной ряд включает в себя соответствующий
момент (период) времени t*, то необходимо выяснить, значимо или нет,
повлияли общие структурные изменения на характер этой тенденции.
Если влияние значимо, то для моделирования динамика временного
ряда используют кусочно-линейные модели регрессии:

п и
п и

Если структурные изменения незначительно повлияли на характер


тенденции временного ряда Yt., то находят единое для всей совокупности
данных уравнение регрессии .
Выбор одной из двух моделей (кусочно-линейной или единого
уравнения регрессии) будет зависеть от соотношения между снижением
остаточной дисперсии и потерей числа степеней свободы при переходе от
единого уравнения регрессии к кусочно-линейной модели.
Формальный статистический тест для оценки этого соотношения был
предложен Грегори Чоу15.
Проверяется гипотеза H0 о структурной стабильности временного ряда
Y t.
Введем условные обозначения для алгоритма теста Г. Чоу (см. Таблицу
6.6)

Таблица 6.6 − Условные обозначения некоторых характеристик


алгоритма теста Г. Чоу
Число
Число Число
Остаточная степеней
наблюдений параметров
№ Вид уравнения сумма свободы
в в
квадратов остаточной
совокупности уравнении
дисперсии
Кусочно-линейная модель тренда
1
2
Единая модель тренда для всей совокупности
3

15
Грегори Чоу, первопроходец в эконометрике, родился в 1929 году на юге Китая. В конце 40-х годов
эмигрировал в США, работал в Корнельском, Чикагском, Массачусетском университетах, в 1962 году
переехал в Нью-Йорк на службу в исследовательский центр фирмы IBM. В 1970 году становится
профессором экономики и директором эконометрической исследовательской программы в Принстонском
университете. В последнее время Чоу уделяет много внимания экономическим проблемам КНР. Он является
председателем Комитета по экономическим реформам КНР Американской экономической ассоциации.
108
лгоритм теста Г. Чоу:
1. Выдвигается гипотеза H0 о структурной стабильности тенденции
изучаемого временного ряда.
2. Вычисляется остаточная сумма квадратов по кусочно-линейной
модели:
л

л
3. Определяется число степеней свободы, соответствующее :

4. Вычисляется сокращение остаточной дисперсии за счет перехода


от единого уравнения к кусочно-линейной модели:
л

5. Определяется число степеней свободы, соответствующее :

6. Вычисляется фактическое значение критерия Фишера:

л л
л

7. Определяется критическое (табличное) значение критерия


Фишера:

8. Сравнивается найденное значение с критическим


(табличным) значением критерия Фишера:
 если , то гипотеза H0 отклоняется при уровне
значимости α и влияние структурных изменений на динамику изучаемого
показателя признается статистически значимыми. Таким образом, различия
численных оценок параметров уравнений и
являются статистически значимыми и, следовательно, моделирование
тенденции временного ряда осуществляется с помощью кусочно-линейной
модели;
 если , то нулевая гипотеза H0 не отклоняется
(уравнения и описывают одну и ту же

109
тенденцию и различия численных оценок их параметров статистически
незначимы) и, следовательно, строится единое уравнение регрессии
для всей совокупности.

Рисунок 6.2 –Различные варианты структурных изменений в динамике


экономического процесса16

Особенности применения теста Чоу:


1. Если число параметров во всех уравнения одинаково и равно k, то
(7.12) запишется в виде:

л
.
2. Применение теста Чоу предполагает соблюдение предпосылок о
нормальности распределения остатков в уравнениях и
и независимость их распределений.
3. Возможны следующие сочетания изменения численных оценок
параметров этих уравнений (Рисунок 6.2):

16
Эконометрика: учеб. для студ. вузов, обуч. по спец. 061700 "Статистика": рек. Минобразования
России / под ред. И. И. Елисеевой. - 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2006. – С.
260.

110
 a1 и a2 имеют существенные различия, различия между b1 и b2 и
статистически незначимы (скачкообразное изменение уровней ряда Yt в
момент времени t* при неизменном среднем абсолютном приросте за период)
((а) Рисунок 6.2);
 b1 и b2 различаются значимо, а различия между a1 и a2
статистически незначимы (изменение тенденции связано с изменением
среднего абсолютного прироста временного ряда Yt, начиная с момента
времени t*, при неизменном начальном уровне ряда в момент времени t0) ((б)
Рисунок 6.2);
 статистически значимо различаются параметры a1 и a2 , а также
b1 и b2 (изменение характера тенденции сопровождается изменением, как
начального уровня, так и среднего за период абсолютного прироста) ((в)
Рисунок 6.2).
Для проверки гипотезы о структурной стабильности тенденции
изучаемого временного ряда кроме теста Г. Чоу используется метод,
предложенный американским экономистом Д. Гуйарати.
По методу Д. Гуйарати нужно строить не три уравнения, а только одно
с фиктивной переменной

е ли
е ли

Уравнение регрессии имеет вид:

Тогда

е ли
е ли

Таким образом, исходя из (6.22), получим:

Следовательно,

Таким образом, если в уравнении (6.33):


1) Параметр статистически значим по критерию Стьюдента, а
параметр статистически незначим, то a1 и a2 имеют существенные
различия, а различия между b1 и b2 и статистически незначимы
111
(скачкообразное изменение уровней ряда Yt в момент времени t* при
неизменном среднем абсолютном приросте за период) ((а) Рисунок 6.2);
2) Параметр статистически незначим по критерию Стьюдента, а
параметр статистически значим, то b1 и b2 различаются значимо, а различия
между a1 и a2 статистически незначимы. Таким образом, изменение
тенденции связано с изменением среднего абсолютного прироста временного
ряда Yt, начиная с момента времени t*, при неизменном начальном уровне
ряда в момент времени t0 ((б) Рисунок 6.2);
3) Параметр статистически значим по критерию Стьюдента и
параметр статистически значим, то статистически значимо различаются
параметры a1 и a2 , а также b1 и b2. Изменение характера тенденции
сопровождается изменением, как начального уровня, так и среднего за
период абсолютного прироста ((в) Рисунок 6.2);
4) Параметры и статистически незначимы по критерию
Стьюдента и, следовательно, нет структурной нестабильности в динамике
изучаемого процесса и для моделирования ее можно использовать единое
уравнение регрессии вида .

Лабораторная работа № 8
Задание. Используя данные приложения 5 согласно с № варианта
необходимо:
1. Построить точечную диаграмму временного ряда ;
2. С помощью диаграммы выявить возможный момент t*
структурных изменений;
3. С помощью теста Чоу протестировать статистическую
гипотезу о структурной стабильности временного ряда ;
4. С помощью метода Гуйарати выявить характер структурных
изменений.

Тест по теме
Фиктивные переменные

1. Какую статистику использует тест Чоу?


 F-статистику
 t-статистику
 R2 – статистику

2. Какому тесту эквивалентно использование теста Чоу?


 F-тесту
 t-тесту
 DW-тесту

112
3. Как определяется значимость коэффициента при фиктивной
переменной?
 с помощью F-теста
 с помощью t-теста
 с помощью МНК
4. Исходные значения фиктивных переменных предполагают
значения
 качественные
 количественные

5. Тест Чоу проводится для выяснения


 автокорреляции остатков временного ряда
 наличия гетероскедастичности в выборке
 структурной стабильности тенденции временного ряда
стационарности временного ряда

6. В эконометрике фиктивной переменной принято считать …


 переменную, принимающую значения 0 и 1
 описывающую количественным образом качественный признак
 переменную, которая может равняться только целому числу
 несущественную переменную

7. При исследовании зависимости потребления мяса от уровня


дохода и пола потребителя можно рекомендовать …
 использовать фиктивную переменную – пол потребителя
 разделить совокупность на две: для потребителей женского пола
и для потребителей мужского пола
 использовать фиктивную переменную – уровень дохода
 исключить из рассмотрения пол потребителя, так как данный
фактор нельзя измерить количественно
8. Изучается зависимость цены квартиры (у) от ее жилой площади
(х) и типа дома. В модель включены фиктивные переменные, отражающие
рассматриваемые типы домов: монолитный, панельный, кирпичный.
Получено уравнение регрессии:

113
,
Частными уравнениями регрессии для кирпичного и монолитного
являются…

для типа дома кирпичный

для типа дома кирпичный

для типа дома монолитный

9. Дана таблица исходных данных для построения


эконометрической регрессионной модели:

Фиктивными переменными не являются …


 стаж работы
 уровень образования
 уровень квалификации работника

10. При анализе промышленных предприятий в трех регионах


(Республика Марий Эл, Республика Чувашия, Республика Татарстан) были
построены три частных уравнения регрессии:

для Республики Марий Эл;

для Республики Чувашия;

для Республики Татарстан.


Укажите вид фиктивных переменных и уравнение с фиктивными
переменными, обобщающее три частных уравнения регрессии.

114
11. Оцененная зависимость почасовой оплаты труда индивида Y
(измеряется в долларах в час) от результатов выпускного теста X (измеряется
в баллах) и пола (D – фиктивная переменная, равная 1 для мужчин и 0 для
женщин) имеет вид:

Все коэффициенты являются значимыми при уровне значимости 1%.


При одинаковых результатах теста почасовая оплата мужчин выше
почасовой оплаты женщин на .
 0,024 $
 2,4 $
 0,024 $
 2,4%

Вопросы для самопроверки

1. Что такое фиктивные переменные и каковы возможные причины


использования их в регрессионных моделях?
2. Какова интерпретация коэффициентов при фиктивных переменных?
3. Каковы возможные причины структурной нестабильности в динамике
временного ряда?
4. Для чего предназначен тест Г. Чоу и в чём его суть?
5. Какую статистику использует тест Чоу? Как определяется число степеней
свободы для этой статистики?
6. В чем заключается методика Д. Гуйарати?
7. В каком количестве и как нужно ввести фиктивные переменные для выражения
различий внутри группы с несколькими категориями?
8. Как интерпретируется константа при использовании фиктивных переменных
сдвига?
9. Как определяется значимость коэффициента при фиктивной переменной?
10. Как определяется значимость одновременно группы фиктивных переменных
сдвига и наклона?
11. Почему использование фиктивных переменных эквивалентно расчету
регрессии на отдельных частях выборки?

115
7. Анализ и моделирование одномерных временных рядов

7.1 Основные элементы временного ряда. Модели стационарных и


нестационарных временных рядов

Эконометрическую модель можно построить, используя два вида


данных:
 пространственная информация (данные, характеризующие
совокупность различных объектов за один и тот же период (на один и тот же
момент) времени);
 временные ряды (данные, характеризующие один и тот же объект
за ряд последовательных периодов (моментов) времени).
Модели, построенные по данным первого типа, называются
пространственными моделями.
Модели, построенные по данным второго типа, называются моделями
временных рядов.
Временной ряд (или ряд динамики) − это упорядоченная по времени
последовательность значений некоторой произвольной случайной величины.
Каждое отдельное значение данной переменной называется уровнем
(отсчётом, элементом) временного ряда.
Анализ временных рядов совокупность математико-статистических
методов анализа, предназначенных для выявления структуры временных
рядов и для их прогнозирования. Выявление структуры временного ряда
необходимо для того, чтобы построить математическую модель того явления,
которое является источником анализируемого временного ряда. Прогноз
будущих значений временного ряда используется для эффективного
принятия решений.
Анализ временных рядов базируется на том, что результирующая
переменная формируется под влиянием очень большого числа факторов,
многие из которых не поддаются идентификации и непосредственному
наблюдению и измерению. Поэтому лучшим источником информации о
совокупном влиянии всех этих факторов являются значения самой
исследуемой переменной в прошлые моменты времени, а также текущие и
прошлые значения случайных ошибок.
Временной ряд состоят из двух элементов:
 периода времени, за который или по состоянию на который
приводятся числовые значения;
 числовых значений того или иного показателя, называемых
уровнями ряда.
Временные ряды классифицируются по следующим признакам:
по форме представления уровней:
 ряды абсолютных показателей;
 относительных показателей;
 средних величин;
116
по количеству показателей, для которых определяются уровни в каждый
момент времени:
 одномерные;
 многомерные;
по характеру временного параметра:
 моментные (по состоянию на определенные моменты времени);
 интервальные уровни (характеризуют значение показателя за
определенные периоды времени);
по расстоянию между датами и интервалами времени:
 равноотстоящие (даты регистрации или окончания периодов
следуют друг за другом с равными интервалами);
 неравноотстоящие (принцип равных интервалов не соблюдается);
по наличию пропущенных значений:
 полные;
 неполные;
в зависимости от наличия основной тенденции:
 стационарные (среднее значение и дисперсия постоянны);
 нестационарные (содержащие основную тенденцию развития);
в зависимости от случайности значений:
 детерминированными (получают на основе значений некоторой
неслучайной функции);
 случайными (результат реализации некоторой случайной
величины).
Значения (уровни) временного ряда формируются под действием
большого числа факторов, которые условно можно разбить на 4 группы:
 долговременные (формирующие общую тенденцию
анализируемого показателя в длительной перспективе);
 сезонные (формирующие периодически повторяющиеся в
определенное время года колебания анализируемого показателя);
 циклические (формирующие изменения анализируемого
показателя под влиянием долговременных циклов экономической и другой
природы);
 случайные (не поддающие учету и регистрации, т.к. имеют
стохастическую природу).
Фактический уровень временного ряда чаще всего содержит все четыре
компоненты и формируется под воздействием тенденции, сезонных
(циклических) колебаний и случайной компоненты.
Модели временных рядов бывают двух типов:
 аддитивная (каждый уровень временного ряда представлен в
виде суммы трендовой (Т), сезонной (S) и случайной (Е) компонент):

117
 мультипликативная (каждый уровень временного ряда
представлен в виде произведения трендовой (Т), сезонной (S) и случайной (Е)
компонент) :

Выбор одной из двух моделей осуществляется на основе анализа


структуры циклических колебаний.
Аддитивную модель строят, если амплитуда колебаний постоянна
(значения сезонной компоненты предполагаются постоянными для
различных циклов).
Мультипликативную модель строят, когда амплитуда циклических
(сезонных) колебаний не постоянна (увеличивается или уменьшается).
лгоритм построения модели:
1) Выравнивание исходного ряда методом скользящей средней.
2) Расчет значений сезонной компоненты .
3) Устранение сезонной компоненты из исходных уровней ряда и
получение выровненных данных ) для аддитивной модели (( )
для мультипликативной модели).
4) Определение общей тенденции анализируемого показателя в
длительной перспективе, построение соответствующего уравнения тренда.
5) Аналитическое выравнивание с использованием построенного
уравнения тренда уровней ) для аддитивной модели (( ) для
мультипликативной модели).
6) Расчет полученных по модели значений ) для аддитивной
модели (( ) для мультипликативной модели).
7) Расчет абсолютных (относительных) ошибок.
Стационарным процессом в узком смысле называется такой слу-
чайный процесс, вероятностные свойства которого с течением времени не
изменяются. Он протекает в приблизительно однородных условиях и имеет
вид непрерывных случайных колебаний вокруг некоторого среднего
значения. Причем ни средняя амплитуда, ни его частота не обнаруживают с
течением времени существенных изменений.
Однако на практике чаще встречаются процессы, вероятностные
характеристики которых подчиняются определенным закономерностям и не
являются постоянными величинами. Поэтому в прикладном
эконометрическом анализе используется понятие слабой стационарности
(или стационарности в широком смысле), которое предполагает
неизменность во времени среднего значения, дисперсии и ковариации
временного ряда17 . Случайный процесс называется стационарным в
широком смысле, если его математическое ожидание постоянно и авто-

17
Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. – М.: ЮНИТИ, 1998
118
корреляционная функция r ( ) зависит только от длины временного интервала
.
Применяемые при обработке временных рядов методы во многом
опираются на методы математической статистикой, которые базируются на
достаточно жестких требованиях к исходным данным (таким как
однородность данных, сопоставимость, предположения о типе их
распределения и т. д.).
Сопоставимость достигается в результате одинакового подхода к
наблюдениям на разных этапах формирования динамического ряда. Уровни
во временных рядах должны иметь одинаковые:
– единицы измерения;
– шаг наблюдений;
– интервал времени;
– методику расчета;
– элементы, относящиеся к неизменной совокупности.
Однородность данных означает отсутствие сильных изломов
тенденций, а также аномальных (т.е. резко выделяющихся, нетипичных для
данного ряда) наблюдений. Аномальные наблюдения проявляются в виде
сильного изменения уровня – скачка или спада – с последующим
приблизительным восстановлением предыдущего уровня. Наличие аномалии
резко искажает результаты моделирования. Поэтому аномальные
наблюдения необходимо исключить из временного ряда, заменив их
расчетными значениями
Устойчивость характеризуется преобладанием закономерности над
случайностью в изменении уровней ряда. На графиках устойчивых
временных рядов закономерность прослеживается визуально, на графиках
неустойчивых рядов изменения последовательных уровней представляются
хаотичными, и поэтому поиск закономерностей в формировании значений
уровней таких рядов лишен смысла.
Требование полноты данных обусловливается тем, что закономерность
может обнаружиться лишь при наличии минимально допустимого объема
наблюдений.
Следует иметь в виду, что при исследовании временных рядов
экономических данных проверка выполнимости перечисленных требований в
должной мере зачастую невозможна. Поэтому выводы, полученные на базе
формально-статистического инструментария, должны восприниматься с
осторожностью и дополняться содержательным анализом.

119
7.2 Автокорреляция уровней временного ряда. Выявление
структуры временного ряда с помощью анализа автокорреляционной
функции

Наличие корреляционной зависимости между последующими и


предшествующими уровнями динамического ряда называют
автокорреляцией.
Коэффициент автокорреляции уровней временного ряда Xt
определяется по формуле линейного коэффициента корреляции для парной
зависимости между величинами (xi и xi-l):

(n  l ) xi xi l  xi  xi l
Rxi xii l  (7.3)
((n  l ) x  ( xi ) )  ((n  l ) x
2
i
2 2
i l  ( xi l ) )
2

где l=1,2,… − лаг (число периодов, по которым рассчитывается


коэффициент автокорреляции).
Для расчета коэффициента автокорреляции по формуле (7.3) в
Microsoft Excel можно воспользоваться статистической функцией КОРРЕЛ.
Желательно для обеспечения статистической достоверности
коэффициентов автокорреляции , где - длина временного ряда.
Последовательность коэффициентов автокорреляции уровней первого,
второго и т.д. порядков называют автокорреляционной функцией временного
ряда. График зависимости ее значений от величины лага (порядка
коэффициента автокорреляции)называется коррелограммой.
Исследуемый ряд содержит ярко выраженную линейную трендовую
компоненту, если наиболее высоким является коэффициент автокорреляции
первого порядка.
Исследуемый ряд содержит циклические (сезонные) колебания с
периодичностью в моментов времени, если наиболее высоким является
коэффициент автокорреляции порядка ( ).
Если ни один из коэффициентов автокорреляции не является
значимым, то либо ряд не содержит тенденции и циклических колебаний,
либо ряд содержит сильную нелинейную тенденцию.

Пример 7.1
Используя данные о динамике средних цен на первичном рынке жилья
по Российской Федерации с 1998 по 2012 гг. ( руб. за 1 м2 общей площади)18
вычислить коэффициенты автокорреляции первого, второго, третьего и
четвертого порядков, построить коррелограмму и сделать вывод о структуре
временного ряда.
Решение.

18
Источник данных: http://www.gks.ru/free_doc/new_site/prices/housing/tab7.htm
120
Для расчета коэффициентов автокорреляции по формуле (7.3) в
Microsoft Excel воспользуемся статистической функцией КОРРЕЛ (рисунок
7.1)

Рисунок 7.1 – Расчет коэффициента автокорреляции первого порядка

Вычислим коэффициенты автокорреляции (табл. 7.1).

Таблица 7.1 − Коэффициенты автокорреляции первого, второго,


третьего и четвертого порядков
Автокорреляционная функция

Лаг Коэффициенты автокорреляции.


1 0,914
2 0,811
3 0,717
4 0,651

Исследуемый ряд содержит ярко выраженную линейную трендовую


компоненту, т.к. наиболее высоким является коэффициент автокорреляции
первого порядка.
Построим график автокорреляционной функции (коррелограмму)
временного ряда (рисунок 7.2)

121
1,000
0,967
0,950

0,900 0,897

0,850

0,800 0,798

0,750

0,700 0,701

0,650

0,600
1 2 3 4
Рисунок 7.2 – График автокорреляционной функции (коррелограмма)
временного ряда

7.3 Процедуры предварительного анализа данных

Экстраполяция − это распространение выявленных при анализе рядов


динамики закономерностей развития изучаемого объекта на будущее (при
предположении, что выявленная закономерность, выступающая в качестве
базы прогнозирования, сохраняется и в дальнейшем).
Прогнозирование экономических процессов, представленных
одномерными временными рядами, сводится к выполнению следующих
основных этапов:
1. предварительный анализ данных;
2. построение моделей: формирование набора аппроксимирующих
функций (кривых роста) и численное оценивание параметров моделей;
3. проверка адекватности моделей и оценка их точности;
4. выбор лучшей модели;
5. расчет точечного и интервального прогнозов.
В ходе предварительного анализа определяют соответствие имеющихся
данных требованиям, предъявляемым к ним математическими методами
(объективности, сопоставимости, полноты, однородности и устойчивости);
строится график динамики и, рассчитываются основные динамические
характеристики (приросты, темпы роста, темпы прироста, коэффициенты
автокорреляции).
Для получения общего представления о динамике исследуемого пока-
зателя целесообразно построить его график. При графическом отображении
динамики показателя во времени по оси абсцисс откладываются значения
переменной t, а по оси ординат − соответствующие значения показателя .
К процедурам предварительного анализа относятся:
122
– выявление аномальных наблюдений;
– проверка наличия тренда;
– сглаживание временных рядов;
– расчет показателей развития динамики экономических процессов.
Наличие аномальных наблюдений приводит к искажению результатов
моделирования, следовательно, необходимо убедиться в отсутствии
аномалий данных. Для диагностики аномальных наблюдений разработаны
различные критерии, например, метод Ирвина19
Для всех или только для подозреваемых наблюдений в аномальности
вычисляется величина :

где

Если рассчитанная величина превышает табличный (критический)


уровень (см. Таблицу 7.2), то уровень считается аномальным.
Аномальные наблюдения необходимо исключить из временного ряда и
заменить их расчетными значениями (самый простой способ замены – в
качестве нового значения принять среднее из двух соседних значений).

Таблица 7.2 − Критические значения параметра  .



Количество наблюдений n
P=0,95 P=0,99
2 2,8 3,7
3 2,2 2,9
10 1,5 2,0
15 1,4 1,9
20 1,3 1,8
30 1,2 1,7
50 1,1 1,6
100 1,0 1,5
400 0,9 1.3
1000 0,8 1.2

19
Федосеев В.В., Гармаш А.Н., Дайитбегов Д.М., Орлова И.В., Половников В.А. Экономико-
математические методы и прикладные модели: Учеб. пособие для вузов / Под ред. В.В.Федосеева. М.:
ЮНИТИ, 1999.
123
Пример 7.2
На основании данных об изменении индекса цен на первичном рынке
жилья по Российской Федеpации20, приведенных в табл. 7.3 проверить
наличие аномальных наблюдений.

Таблица 7.3 − Индексы цен на первичном рынке жилья по РФ


Дата 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
156,9 146,3 113,1 125,1 122,5 118,8 118,5 117,5 147,7 123,4 110,3 92,4 100,3 106,7 110,7

Решение
Результаты расчетов по методу Ирвина приведены в табл. 7.4.

Таблица 7.4 − Расчеты параметра л


Дата 1998 1999 2000 2001 2002 2003 2004 2005
1 2 3 4 5 6 7 8
156,9 146,3 113,1 125,1 122,5 118,8 118,5 117,5
1311,9 656,4 57,5 19,5 3,3 3,5 4,8 10,1
− 0,6 1,9 0,7 0,1 0,2 0,0 0,1
Дата 2006 2007 2008 2009 2010 2011 2012
9 10 11 12 13 14 15 −
147,7 123,4 110,3 92,4 100,3 106,7 110,7 −
730,1 7,4 107,7 799,8 415,3 195,4 99,6 −
1,7 1,4 0,7 1,0 0,4 0,4 0,2 −

С вероятностью P=0,95 аномальными являются наблюдения с номером


3 и 9.
На рис. 7.3 приведен график динамики временного ряда индекса цен
на первичном рынке жилья по РФ, на котором третьему и девятому
наблюдениям соответствуют резкие выбросы.

20
Источник - http://www.gks.ru/free_doc/new_site/prices/housing/tab9.htm)

124
160
156,9
150
146,3 147,7
140

130
125,1 123,4
122,5
120 118,8 118,5 117,5
113,1
110 110,3 110,7
106,7
100 100,3

90 92,4

80
1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

Рисунок 7.3 − График динамики индекса цен


на первичном рынке жилья по РФ

Следующая процедура этапа предварительного анализа данных –


выявление наличия тенденций в развитии исследуемого показателя.
Отметим, что тенденция прослеживается не только в увеличении или
уменьшении среднего текущего значения временного ряда, но она присуща и
другим его характеристикам: дисперсии, автокорреляции, корреляции с
другими показателями и т.д.
Тенденцию среднего визуально можно определить из графика
исходных данных.
Процедура проверки наличия или отсутствия неслучайной (и
зависящей от времени t) составляющей по существу, состоит в
статистической проверке гипотезы о неизменности среднего значения
временного ряда:
Эта процедура может быть осуществлена с помощью различных
критериев.21
Критерий серий, основанный на медиане
Члены анализируемого временного ряда необходимо расположить в
порядке возрастания.
Определяется выборочная медиана по формуле:

е ли не е н

е ли е н
Образуются «серии» из плюсов и минусов, на статистическом анализе
которых основана процедура проверки гипотезы о неизменности среднего
значения временного ряда.
21
Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. – М.: ЮНИТИ, 1998

125
По исходному временному ряду, построим последовательность из
плюсов и минусов следующим образом:

е ли
е ли

Уровни временного ряда, равные , в полученной таким образом


последовательности плюсов и минусов не учитываются.
Образованная последовательность плюсов и минусов характеризуется
общим числом серий и протяженностью самой длинной серии .
При этом под «серией» понимается последовательность подряд идущих
плюсов и подряд идущих минусов.
Если исследуемый ряд состоит из статистически независимых
наблюдений, случайно варьирующих около некоторого постоянного уровня
(т.е. справедлива гипотеза о неизменности среднего значения временного
ряда), то чередование «+» и «» в построенной последовательности должно
быть случайным. Эта последовательность не должна содержать слишком
длинных серий подряд идущих «+» или «», и, соответственно, общее число
серий не должно быть слишком малым.
В данном критерии целесообразно рассматривать одновременно пару
критических статистик ( ; ).
Справедлив следующий приближенный статистический критерий
проверки гипотезы о неизменности среднего значения временного ряда:
если хотя бы одно из неравенств

окажется нарушенным, то гипотеза о неизменности среднего значения


временного ряда отвергается с заданным уровнем значимости , таким, что
0,05 <  < 0,0975 и, тем самым, подтверждается наличие зависящей от
времени неслучайной составляющей в структуре временного ряда.
Критерий «восходящих» и «нисходящих» серий
Этот критерий фиксирует постепенное смещение среднего значения в
исследуемом распределении не только монотонного, но и более общего,
например, периодического характера.
Так же, как и в предыдущем критерии, исследуется последовательность
плюсов и минусов, однако правило образования этой последовательности в
данном критерии иное.

е ли
е ли

126
Если два или несколько следующих друг за другом наблюдений равны
между собой, то принимается во внимание только одно из них.
Последовательность подряд идущих «+» (восходящая серия) будет
соответствовать возрастанию результатов наблюдения, а последовательность
«» (нисходящая серия)  их убыванию.
Критерий основан на том же соображении, что и предыдущий: если
выборка случайна, то в образованной последовательности знаков общее
число серий не может быть слишком малым, а их протяженность  слишком
большой.
При уровне значимости 0,05 <  < 0,0975 критерий вид:

где величина 0(n) определяется следующим образом (см. Табл. 7.5):

Таблица 7.5 – Определение параметра в зависимости от


численности выборки
n
5 6 7

Если хотя бы одно из неравенств (7.10) окажется нарушенным, то


гипотезу о неизменности среднего значения временного ряда следует
отвергнуть.
Один из способов проверки обнаружения тренда основан на
сравнении средних уровней ряда: временной ряд разбивают на две примерно
равные по числу уровней части, каждая из которых рассматривается как
некоторая самостоятельная выборочная совокупность, имеющая нормальное
распределение.
Если временной ряд имеет тенденцию к тренду, то средние,
вычисленные для каждой совокупности, должны существенно (значимо)
различаться между собой.
Если же расхождение незначительно, несущественно (случайно), то
временной ряд не имеет тенденции. Таким образом, проверка наличия тренда
в исследуемом ряду сводится к проверке гипотезы о равенстве средних двух
нормально распределенных совокупностей.
Пример 7.3
На основании данных примера 7.2 определим наличие (или
отсутствие) основной тенденции (тренда).
Решение.
1. Делим исходный временной ряд на две примерно равные по
числу уровней части: n1=7, n2 =8 (n1+n2=n =15).
127
2. Для каждой из этих частей вычисляем средние значения:

3. Для каждой из этих частей вычисляем дисперсии:

4. Проверяем гипотезу о равенстве (однородности) дисперсий обеих


частей ряда с помощью F-критерия Фишера. Для вычисления F-критерия
большую дисперсию делят на меньшую:

кр

Так как F < Fкр , то c вероятностью 95% можно сделать вывод о том,
что нет оснований отвергать нулевую гипотезу. По данным наблюдения
дисперсии генеральных совокупностей равны 2y1 = 2y 2 , исправленные
выборочные дисперсии ( и ) различаются незначимо (расхождение
между и − величина случайная).
5. Проверим основную гипотезу о равенстве средних значений с
использованием t-критерия Стьюдента:

128
Подставляя в (7.15) числовые значения, получим:

Так как

то нет оснований отвергать нулевую гипотезу о равенстве средних, т.е.


расхождение между средними незначимо.
Следовательно, можно сделать вывод об отсутствии линейного тренда
для исходного временного ряда.
Решение примера 7.2 с помощью Пакета анализа данных Microsoft
Excel.
1. Проверим гипотезу о равенстве дисперсий с помощью критерия
Фишера, который можно найти среди инструментов Анализа данных как
Двухвыборочный F−тест для дисперсии (рис. 7.4).

Рисунок 7.4 − Вызов надстройки Microsoft Excel «Анализ данных»

2. Вводим данные для выполнения F-теста, указывая интервал для


первой и второй переменных (рис. 7.5).

129
Рисунок 7.5 − Ввод данных для двухвыборочного F-теста

Результат выполнения теста приведен в таблице 7.6.

Таблица 7.6 − Результат выполнения двухвыборочного F-теста для


дисперсии
Переменная 1 Переменная 2
Среднее 128,74 113,63
Дисперсия 266,97 281,04
Наблюдения 7 8
df 6 7
F 0,95
P(F<=f) одностороннее 0,48
F критическое одностороннее 0,24

Анализируя результаты выполнения двухвыборочного F-теста для


проверки гипотезы о равенстве дисперсий, приходим к выводу, что
исправленные выборочные дисперсии (S 2y1 и S 2y 2 ) различаются незначимо.

3. Выбираем инструмент анализа Двухвыборочный t-тест с


одинаковыми дисперсиями (рис. 7.6). Вводим данные.

130
Рисунок 7.6 − Ввод данных для двухвыборочного t-теста с
одинаковыми дисперсиями

Таблица 7.7 − Результат выполнения двухвыборочного t-теста с


одинаковыми дисперсиями
Переменная 1 Переменная 2
Среднее 128,74 113,63
Дисперсия 266,97 281,04
Наблюдения 7 8
Объединенная дисперсия 274,55
Гипотетическая разность средних 0
df 13
t-статистика 1,76
P(T<=t) одностороннее 0,05
t критическое одностороннее 1,77
P(T<=t) двухстороннее 0,10
t критическое двухстороннее 2,16

Сглаживание временного ряда (замена фактических уровней


расчетными значениями, имеющими меньшую вариативность, чем исходные
данные) является простым методом выявления тенденции развития.
Соответствующее преобразование называется фильтрованием.
Сглаживание временных рядов проводится по следующим причинам:
 В ряде случаев при графическом изображении временного ряда
тренд прослеживается недостаточно отчетливо. Поэтому ряд сглаживают, на
131
график наносят сглаженные значения и, как правило, тенденция проявляется
более четко.
 Некоторые методы анализа и прогнозирования требуют в
качестве предварительного условия сглаживание временного ряда.
 Сглаживание временных рядов используется при устранении
аномальных наблюдений.
 Методы сглаживания в настоящее время применяются для
непосредственного прогнозирования экономических показателей.
Существующие методы сглаживания делят на две группы:
1. Методы механического сглаживания. При использовании этих
методов производится сглаживание каждого отдельного уровня ряда с
использованием фактических значений соседних с ним уровней. Для
сглаживания временных рядов часто используются методы простой и
взвешенной скользящей средней, экспоненциального сглаживания.
2. налитические методы сглаживания. Сглаживание с
использованием кривой, проведенной относительно фактических значений
ряда так, чтобы эта кривая отображала тенденцию, присущую ряду и
одновременно освобождала его от мелких незначительных колебаний. Такие
кривые называют еще кривыми роста, и они используются главным образом
для прогнозирования экономических показателей.
Метод скользящей средней основан на свойстве средней погашать
случайные отклонения от общей закономерности. Расчет скользящей средней
осуществляется по средней арифметической простой из заданного числа
уровней ряда, с отбрасыванием, при вычислении каждой новой средней,
предыдущего уровня и присоединением следующего.
Сглаживание заключается в том, что вычисляется средний уровень из
3, 5, 7и т.д. уровней.
В результате, расчет средней, как бы, скользит от начала ряда
динамики к его концу.
При нечетном шаге каждая вычисленная скользящая средняя
соответствует реальному интервалу (моменту) времени, находящемуся в
середине шага (интервала), а число сглаженных уровней, меньше
первоначального числа уровней на величину шага скользящей средней,
уменьшенного на единицу.
Вычисляется среднее значение наблюдений, образующих интервал
сглаживания, которое одновременно является сглаживающим значением
уровня, находящегося в центре интервала сглаживания, при условии, что m -
нечетное число, по формуле:

где m − количество наблюдений, входящих в интервал сглаживания.

132
При нечетном m значение параметра значение параметра p вычисляют
следующим образом:

среднее значение наблюдения , которое одновременно является


сглаженным значением наблюдения, находящегося в центре интервала
сглаживания при нечетном m.
количество наблюдений, стоящих по разные стороны от
сглаживаемого.
Например, формула для расчета 5-месячной скользящей средней
будет выглядеть следующим образом:

Число уровней сглаженного ряда будет меньше на величину шага


скользящей средней.
Согласно методу простой скользящей средней определяется
количество наблюдений, входящих в интервал сглаживания. При этом
используют правило:
 если необходимо сгладить мелкие, беспорядочные колебания, то
интервал сглаживания берут по возможности наибольшим,
 если необходимо сохранить более мелкие волны и освободиться
от периодически повторяющихся колебаний, возникающих, например, из-за
автокорреляций уровней, то интервал сглаживания уменьшают.
Интервал сглаживания сдвигается на один член вправо и по формуле
(7.19) находится сглаженное значение для t+1 наблюдения. Затем снова
производят сдвиг и т.д.
Процедура продолжается до тех пор, пока в интервал сглаживания не
войдет последнее наблюдение временного ряда.
Недостатком метода является невключение в процедуру сглаживания
первых и последних p наблюдений временного ряда.
Метод простой скользящей средней возможно использовать, если
графическое изображение ряда напоминает прямую линию. В этом случае не
искажается динамика развития исследуемого процесса.
Если тренд выравниваемого ряда имеет изгибы и к тому же желательно
сохранить мелкие волны, использовать для сглаживания ряда метод простой
скользящей средней нецелесообразно, т.к. при этом:
 выравниваются и выпуклые, и вогнутые линии;

133
 происходит сдвиг волны вдоль ряда;
 изменяется знак волны, т.е. на кривой, соединяющей сглаженные
точки, вместо выпуклого участка образуется вогнутый и наоборот.

Пример 7.4

Таблица 7.8 − Динамика рентабельности проданных товаров,


продукции, работ, услуг организаций РФ22 и рассчитанные скользящие
средние
Год Трехлетние скользящие
средние Пятилетние скользящие средние
1995 15,8 - -
1996 4,8
-
1997 6,3

1998 8,1
11,0
1999 18,5 15,2 13,2
2000 18,9 17,3 14,2
2001 14,4 14,7 14,6
2002 10,9 11,8 13,5
2003 10,2 11,4 12,4
2004 13,2 12,3 12,2
2005 13,5 13,3 12,6
2006 13,2 13,3 13,2
2007 13,1 13,1 12,7
2008 13,0 12,3 12,0
2009 10,8 11,3 11,3
2010 10,0 10,1 -
2011 9,6 - -

Если развитие процесса носит нелинейный характер, то применение


метода простой скользящей средней может привести к значительным
искажениям исследуемого процесса.

22
Источник данных: http://www.gks.ru/free_doc/new_site/finans/dinrent.htm
134
18,0

16,0

14,0

12,0

10,0

8,0

6,0

4,0
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

Исходные данные Трехлетние скользящие средние


Пятилетние скользящие средние

Рисунок 7.5 – Сглаживание временного ряда методом трехлетней и


пятилетней скользящей средней (по данным примера 7.4)

Значение прогноза, полученного методом простого скользящего


среднего, всегда меньше фактического значения − если исходные данные
монотонно возрастают, и наоборот больше фактического значения − если
исходные данные монотонно убывают. Поэтому с помощью простого
скользящего среднего нельзя получить точных прогнозов. Этот метод лучше
всего подходит для данных с небольшими случайными отклонениями от
некоторого постоянного или медленно меняющегося значения.
В таких случаях более надежным является использование других
методов сглаживания, например, метода взвешенной скользящей средней.
Метод взвешенной скользящей средней отличается от предыдущего
тем, что сглаживание внутри интервала производится не по прямой, а по
кривой более высокого порядка. Это обусловлено тем, что суммирование
членов ряда, входящих в интервал сглаживания, производится с
определенными весами, рассчитанными по методу наименьших квадратов.
Если сглаживание производится с помощью полинома (многочлена)
второго или третьего порядка, то веса берутся следующие:
1
для m=5 – веса: (-3; 12; 17; 12; -3);
35
1
для m=7 – веса: (-2; 3; 6; 7; 6; 3; -2) .
21
Особенности весов:
1) симметричны относительно центрального члена;
2) сумма весов с учетом общего множителя равна 1.

135
Недостаток метода: первые и последние p наблюдений ряда остаются
не сглаженными.
Рассмотренные методы простой и взвешенной скользящей средней не
дают возможности сгладить первые и последние p наблюдений временного
ряда. Отсутствие сглаженных первых наблюдений не так важно по
сравнению с последними наблюдениями, особенно если целью исследования
является прогнозирование развития процесса. Есть методы, позволяющие
получить сглаженные значения последних уровней так же, как и всех
остальных. К их числу относится метод экспоненциального сглаживания.
Особенность этого метода заключена в том, что в процедуре
выравнивания каждого наблюдения используются только значения
предыдущих уровней, взятых с определенным весом. Вес каждого
наблюдения уменьшается по мере его удаления от момента, для которого
определяется сглаживаемое значение. Сглаженное значение наблюдения ряда
St на момент времени t определяется по формуле:

где  − сглаживающий параметр, характеризующий вес


выравниваемого наблюдения, причем 01.
Величину в формуле (7.22) можно представить в виде суммы
фактического значения уровня и сглаженного значения
предшествующего ему наблюдения , взятых с соответствующими
весами. Процесс такого разложения можно продолжить для членов ,
и т.д.
В результате получится следующее выражение:

в котором среднее сглаженное значение является комбинацией всех


предшествующих уровней ряда.
Величина характеризует начало условия процесса.
Формулу (7.23) можно переписать в виде:

где k − число периодов отставания от момента t.

136
Относительный вес каждого предшествующего уровня снижается по
экспоненте по мере его удаления от момента, для которого вычисляется
сглаженное значение.
Выбор сглаживающего параметра и определение начального условия
зависит от численного значения параметра настолько, насколько быстро
будет уменьшаться вес предшествующих наблюдений и в соответствии с
этим степень их влияния на сглаживаемый уровень.
Чем больше значение параметра , тем меньше сказывается влияние
предшествующих уровней и, соответственно, меньшим оказывается
сглаживающее воздействие экспоненциальной средней.
Задачу выбора параметра , определяющего начальные условия,
предлагается решать следующим образом: если есть данные о развитии
процесса в прошлом, то их среднее значение можно принять в качестве y0,
если таких сведений нет, то в качестве используют исходное (первое)
наблюдение временного ряда .

7.4 Моделирование тенденции временного ряда

Формирование уровней ряда определяется закономерностями трех


основных типов: инерцией тенденции, инерцией взаимосвязи между
последовательными уровнями ряда и инерцией взаимосвязи между
исследуемым показателем и показателями-факторами, оказывающими на
него причинное воздействие.
Различают задачи:
– анализа и моделирования тенденций временного ряда,
– взаимосвязи между последовательными уровнями ряда;
– причинных взаимодействий между исследуемым показателем и
показателями - факторами.
Первая из них решается с помощью моделей кривых роста, вторая − с
помощью адаптивных методов и моделей, а третья − с помощью
регрессионных моделей
Одним из наиболее распространенных способов моделирования
тенденции временного ряда является построение аналитической функции,
характеризующей зависимость уровней ряда от времени (тренда). Этот метод
называется аналитическим выравниванием временного ряда.
Кривую, аппроксимирующую временной ряд принято называть кривой
роста.
Аналитические методы оценки неслучайной составляющей временного
ряда с помощью кривых роста реализуются в рамках моделей регрессии, в
которых в роли зависимой переменной выступает переменная Yt, а в роли
объясняющей переменной  время t.
Параметры большинства кривых роста, как правило, оцениваются
методом наименьших квадратов, т.е. подбираются таким образом, чтобы
137
график функции кривой роста располагался на минимальном удалении от
точек исходных данных.
Предпочтение, как правило, отдается простым моделям, допускающим
содержательную интерпретацию (см. Табл.7.9).

Таблица 7.9 − Виды моделей трендов (кривых роста)и оценка их


параметров методом наименьших квадратов
Вид модели Система
Уравнение
тренда нормальных уравнений для оценки
тренда
(кривой роста) параметров тренда (кривой роста)

Линейная

Параболическая

Гиперболическая

Логарифмическая

Степенная

Показательная

Для оценки параметров нелинейных трендов методом наименьших


квадратов необходимо предварительно провести стандартную процедуру их
линеаризации.
Способы выявления наилучшего уравнения тренда:
1. качественный анализ изучаемого процесса, построение и
визуальный анализ графика зависимости уровней ряда динамики от времени
(подбирают кривую роста, форма которой соответствует реальному
процессу, при этом если на графике ВР недостаточно просматривается
тенденция развития, то целесообразно провести сглаживание ряда и затем
подобрать кривую, соответствующую новому ряду);

138
2. расчет основных показателей динамики (если примерно
постоянными оказываются темпы роста, то тенденция моделируется
показательной функцией; если первые разности имеют тенденцию
уменьшаться с постоянным темпом, то следует остановиться на
модифицируемой экспоненте yˆ t  k  a  bt ; если первые разности обратных
значений средних уровней изменяются на один и тот же процент, то следует
1 k
остановиться на логистической кривой  k  a  b t или yˆ t  );
yˆ t 1  be at
3. анализ автокорреляционной функции;
4. расчет по каждому уравнению тренда скорректированного
коэффициента детерминации и выбор уравнения тренда с максимальным
значением скорректированного коэффициента детерминации;
5. расчет по каждому уравнению тренда средней относительной
ошибки аппроксимации и выбор уравнения тренда с минимальным ее
значением.
Если уравнение тренда выбрано неверно, то при больших значениях t
результаты анализа и прогнозирования динамики ВР с использованием
выбранного уравнения тренда будут недостоверными вследствие ошибки
спецификации.
Экономическая интерпретация параметров тренда:
1) Линейный тренд

Параметр a0 – начальный уровень временного ряда в момент времени


t=0.
Параметр a1 – средний за период абсолютный прирост уровней
временного ряда.
2) Экспоненциальный тренд

Параметр a0 – начальный уровень временного ряда в момент времени


t=0.
Величина - средний за единицу времени коэффициент роста
уровней ряда.

7.5 Моделирование сезонных и циклических колебаний

Для построения адекватной модели временного ряда необходимо


охарактеризовать сезонные и циклические компоненты временного ряда. К

139
основным методам моделирования сезонных и циклических колебаний
относятся:
1) метод вычисления сезонной компоненты и построение аддитивной
или мультипликативной модели временного ряда;
2) метод применения сезонных фиктивных переменных;
3) метод анализа сезонных колебаний с помощью автокорреляционной
функции;
4) метод, основанный на использовании одномерных рядов Фурье
(гармонический анализ).
Простейший подход к моделированию сезонных колебаний – это
расчет значений сезонной компоненты методом скользящей средней и
построение аддитивной (7.1) или мультипликативной (7.2) модели
временного ряда.
Выбор одной из двух моделей осуществляется на основе анализа
структуры сезонных колебаний. Если амплитуда колебаний приблизительно
постоянна, строят аддитивную модель временного ряда, в которой значения
сезонной компоненты предполагаются постоянными для различных циклов.
Если амплитуда сезонных колебаний возрастает или уменьшается, строят
мультипликативную модель временного ряда, при которой уровни ряда
зависят от значений сезонной компоненты.
Прежде чем рассчитывать сезонную компоненту, исходный временной
ряд необходимо выровнять.
Для этого применяются методы механического выравнивания, к
которым относятся:
1) метод скользящих средних;
2) метод экспоненциального сглаживания;
3) метод медианного сглаживания и др.
Результатом процедуры сглаживания будет временной ряд
выровненных значений , не содержащих сезонной компоненты.
Если временной ряд представлен аддитивной моделью, то в качестве
сезонной компоненты используется показатель абсолютного отклонения.
Показатель абсолютного отклонения в i-том сезоне рассчитывается как
среднее арифметическое из отклонений фактического и выровненного
уровней временного ряда:

Сумма всех сезонных компонент, т.е. показателей абсолютных


отклонений должна быть равна нулю.
Если при построении аддитивной модели временного ряда сумма всех
абсолютных отклонений не равна нулю (равно l), то рассчитываются
скорректированные значения сезонных компонент по формуле:

140
Если временной ряд представлен мультипликативной моделью, то в
качестве сезонной компоненты используется индекс сезонности, который
рассчитывается как среднее арифметическое из отношений фактического
уровня временного ряда к выровненному:

Произведение всех сезонных компонент, т. е. индексов сезонности Isi,


должно быть равно единице.
На следующем этапе построения модели временного ряда
осуществляется расчёт трендовой компоненты с помощью метода
аналитического выравнивания кривыми роста. Данный метод выравнивания
применяют не к исходному временному ряду, а к временному ряду с
исключённой сезонной компонентой. При этом уровни исходного
временного ряда корректируются на величину сезонной компоненты
следующим образом:
1) для аддитивной модели из исходных уровней вычитаются
показатели абсолютных отклонений ;
2) для мультипликативной модели уровни исходного временного ряда
делятся на индексы сезонности .
Рассмотрим еще один из методов моделирования временного ряда,
содержащего сезонные колебания - построение модели регрессии с
включением фактора времени и фиктивных переменных.
Количество фиктивных переменных в такой модели должно быть на
единицу меньше числа моментов (периодов) времени внутри одного цикла
колебания. Например, при моделировании поквартальных данных модель
должна включать четыре независимые переменные – фактор времени и три
фиктивные переменные.
Каждая фиктивная переменная равна единице для данного периода и
нулю для всех остальных периодов.
Пусть имеется временной ряд, содержащий циклические колебания
периодичностью k. Модель регрессии с фиктивными переменными для этого
ряда будет иметь вид:

где

л н и и л
е л н л
141
Например, при моделировании сезонных колебаний на основе
поквартальных данных за несколько лет число кварталов внутри одного года
k=4, а общий вид модели следующий:

где

л пе л
е л н л

л л
е л н л

л е е л
е л н л

Уравнение тренда для каждого квартала будет иметь следующий вид:

Для первого квартала:

Для второго квартала:

Для третьего квартала:

Для четвертого квартала:

Таким образом, фиктивные переменные позволяют определить


величину свободного члена уравнения регрессии для каждого квартала.
Параметр b в модели (7.32) характеризуют среднее абсолютное
изменение уровней ряда под воздействием тенденции. В сущности, модель
(7.32) есть аналог аддитивной модели временного ряда, поскольку
фактический уровень временного ряда есть сумма трендовой, сезонной и
случайной компонент.
Метод анализа сезонных колебаний с помощью автокорреляционной
функции представлен в пункте 7.2.
Одним из основных методов моделирования сезонных и циклических
колебаний является метод, основанный на применении одномерных рядов
Фурье. В свою очередь, ряды Фурье являются одной из разновидностей
спектрального (гармонического) анализа.

142
С помощью спектрального анализа в структуре временного ряда
определяется пик отклонений от тренда, что позволяет рассчитать
длительность периодической компоненты ряда.
Для того, чтобы к временному ряду можно было применять методы
спектрального анализа, его необходимо привести к стационарному виду.
Суть спектрального анализа заключается в том, что случайный
стационарный процесс представляется как сумма гармонических колебаний
различных частот, называемых гармониками.
Спектром называется функция, которая описывает распределение
амплитуд случайного стационарного процесса по различным частотам.
Сезонная компонента временного ряда может быть разложена в ряд
Фурье.
Сезонные колебания, разложенные рядом Фурье, представляют собой
сумму нескольких синусоидальных и косинусоидальных гармоник с
различными периодами:

Результативной переменной в данной модели будут являться значения


временного ряда, а независимыми переменными – функции синусов и
косинусов всех возможных частот. Коэффициенты при косинусах и при
синусах будут представлять собой коэффициенты модели регрессии, которые
показывают степень коррелированности соответствующих функций с
исходными данными. Если рассчитанное значение коэффициента при
определённом синусе или косинусе достаточно велико, то на
соответствующей частоте в исходных данных существует строгая
периодичность.
Количество параметров модели (7.41) m=2k+1, где число
гармоник.
Если k=1, то (7.41):

Если k=2, то(7.41):

Параметры модели (7.41) оцениваются методом


наименьших квадратов с помощью формул:

143
Лабораторная работа№9
Задание. Используя данные приложения №6 построить модели
гармонического анализа при k=2, k=3 и k=4. Построить графики исходного
ряда и выровненных с помощью одновременных рядов Фурье. Сделать вывод
о наилучшей модели аппроксимации.

7.6 Оценка качества построенной модели для прогнозирования

Модель считается хорошей со статистической точки зрения, если она


адекватна и достаточно точна.
Проверка адекватности модели реальному явлению является важным
этапом прогнозирования социально - экономических процессов. Для этого
исследуют ряд остатков , т.е. отклонения расчетных значений от
фактических данных.
Наиболее важными свойствами остаточной компоненты являются
‒ независимость уровней ряда остатков,
‒ случайность уровней ряда остатков
‒ соответствие уровней ряда остатков нормальному закону
распределения.

Проверка равенства математического ожидания уровней ряда


остатков нулю осуществляется в ходе проверки соответствующей нулевой
гипотезы

С этой целью строится t-статистика:

где - среднее арифметическое значение уровней ряда остатков ;а

144
S − среднеквадратическое отклонение для этой последовательности
, рассчитанное по формуле для малой выборки.
На уровне значимости  гипотеза отклоняется, если

где – критическое значение критерия Стьюдента с


доверительной вероятностью (1 –  ) и степенью свободы .
Для проверки случайности уровней ряда могут быть использованы
критерий серий и критерий поворотных точек.
Критерий “восходящих” и “нисходящих” серий был описан ранее (см.
Предварительный анализ данных)
Критерий «пиков», или критерий поворотных точек. Значение
случайной переменной считается поворотной точкой, если оно одновременно
больше (меньше) соседних с ним элементов. Если остатки случайны, то
поворотная точка приходится примерно на каждые 1,5 наблюдения. Если их
больше, то возмущения быстро меняются и это не может быть объяснено
только случайностью. Если же их меньше, то последовательные значения
случайного компонента положительно коррелированны.
Критерий случайности отклонений от тренда при уровне вероятности
0,95 можно представить как

где р – фактическое количество поворотных точек в случайном ряду;


1,96 – квантиль нормального распределения для 5%-го уровня значимости.
Квадратные скобки здесь так же означают, что от результата вычисления
следует взять целую часть.
Если неравенство не соблюдается, то ряд остатков нельзя считать
случайным (т.е. он содержит регулярную компоненту) и, стало быть, модель
не является адекватной.
Наличие (отсутствие) автокорреляции в отклонениях от модели
роста проверяют с помощью критерия Дарбина – Уотсона (см. 5.3).
Соответствие ряда остатков нормальному закону распределения
необходимо с точки зрения правомерности построения доверительных
интервалов прогноза.

145
Наиболее существенными свойствами ряда отклонений являются их
симметричность относительно модели и преобладание малых по абсолютной
величине ошибок над большими ошибками.
В этой связи определяется близость к соответствующим параметрам
нормального закона распределения коэффициентам асимметрии и эксцесса.
Используется RS-критерий:

где

– несмещённое среднеквадратичное отклонение.


Если значения R/S согласно таблице критерия (7.10) попадает между
критическими значениями , то гипотезу о нормальном
распределении принимают, в противном случае ряд из остатков нельзя
считать нормально распределённым, а модель – адекватной.

Таблица 7.10 – Критические значения R/S –критерия при уровне


значимости α=0,05
Число наблюдений Нижняя граница Верхняя граница

3 1,758 1,999
4 1,98 2,439
5 2,15 2,753
6 2,28 3,012
7 2,40 3,222
8 2,50 3,399
9 2,59 3,552
10 2,76 3,685
11 2,74 3,80
12 2,80 3,91
13 2,86 4,00
14 2,92 4,09
15 2,96 4,17
20 3,18 4,49
25 3,34 4,71
30 3,47 4,89

146
Если все пункты проверки дают положительный результат, то
выбранная трендовая модель является адекватной реальному ряду
экономической динамики, и, следовательно, ее можно использовать для
построения прогнозных оценок. В противном случае – модель надо
улучшать.
В статистическом анализе известно большое число характеристик
точности модели:
‒ среднеквадратическое отклонение (7.47);
‒ максимальная по абсолютной величине ошибка:

‒ относительная максимальная ошибка:

‒ средняя по модулю ошибка:

‒ средняя относительная по модулю ошибка:

Эти показатели дают представление об абсолютной величине ошибки


модели и о доле ошибки в процентном отношении к среднему значению
результативного признака.
Лучшей по точности считается та модель, у которой все перечисленные
характеристики имеют меньшую величину. Однако эти показатели по-
разному отражают степень точности модели и потому нередко дают
противоречивые выводы. Для однозначного выбора лучшей модели
исследователь должен воспользоваться либо одним основным показателем,
либо обобщенным критерием.

Пример 7.5
Рассмотрим основные методы анализа временных рядов на примере
анализа данных об урожайности зерновых РФ по данным (ц/га) за 1981-2010
гг.:
1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995
12,7 13,1 13,0 14,0 15,5 18,1 18,4 15,1 16,1 18,5 14,4 17,2 16,3 15,3 12,6
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
14,7 17,1 12,5 12,3 14,7 18,1 18,9 18,3 17,8 18,1 18,9 19,7 23,3 22,7 15,9

147
Решение.
Проверим этот ряд на наличие тренда. Построим график динамики
урожайности зерновых в РФ по данным за 1981-2010 гг. по исходным
данным:

24,0

22,0

20,0

18,0

16,0

14,0

12,0

2001

2008
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000

2002
2003
2004
2005
2006
2007

2009
2010
Рисунок 7.5 – Динамика урожайности зерновых в РФ по данным за
1981-2010 гг.

Визуальный анализ позволяет предположить отсутствие тренда.


Проведем соответствующий тест, который состоит в том, что сравниваются
средние уровни ряда. Разобьем ряд на две части, и проверим гипотезу о
равенстве дисперсий с помощью F-критерия Фишера. Воспользуемся
средствами анализа данных в Microsoft Excel, выбирая инструмент анализа
Двухвыборочный F-тест для дисперсии. Получим следующие результаты:

Таблица 7.11 – Результаты двухвыборочного F-теста для дисперсии по


данным примера 7.5
Переменная Переменная
1 2
Среднее 15,35 17,53
Дисперсия 4,28 10,09
Наблюдения 15 15
df 14 14
F 0,42
P(F<=f) одностороннее 0,06
F критическое одностороннее 0,40

Так как расчетное значение F-теста (0,42) больше критического (0,40)


при уровне значимости 0.05, то есть основания отвергать гипотезу о
равенстве средних, и на основании этого критерия делаем вывод о том, что
тренд в данном ряду есть.
148
Построим линейную однопараметрическую модель регрессии
зависимости данного временного ряда от t. Для этого снова воспользуемся
надстройкой Анализ данных, инструментом Регрессия.
Регрессионная статистика
Множественный
R 0,57
R-квадрат 0,33
Нормированный
R-квадрат 0,31
Стандартная
ошибка 2,38
Наблюдения 30
Дисперсионный анализ
df SS MS F
Регрессия 1 78,02 78,02 13,77
Остаток 28 158,67 5,67
Итого 29 236,69
t- P-
Коэффициенты Стандартная ошибка статистика Значение
Y-пересечение 13,55 0,89 15,20 0,00
Переменная X 1 0,19 0,05 3,71 0,00
Рисунок 7.6 – Корреляционно-регрессионного анализа
по данным примера 7.5

Уравнение регрессии зависимости уровня безработицы Yt от времени


имеет вид

График линии тренда представлен на рисунке 7.6


24,0

22,0

20,0

18,0

16,0 y = 0,1863t + 13,552


R² = 0,3296
14,0

12,0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Рисунок 7.6 – Динамика урожайности зерновых в РФ с определением


модели тренда по данным за 1981-2010 гг.
149
Оценим качество построенной модели. Для этого проверим остатки
регрессии на равенство математического ожидания нулю, отсутствие
автокорреляции и соответствие нормальному закону.

Таблица 7.12 –Вычисление остатков регрессии и статистики Дарбина-


Уотсона (7.28)
№ Год Y
1 1981 12,7 13,74 -1,04 1,08
2 1982 13,1 13,93 -0,83 0,68 0,05
3 1983 13,0 14,11 -1,11 1,24 0,08
4 1984 14,0 14,30 -0,30 0,09 0,66
5 1985 15,5 14,48 0,97 0,94 1,61
6 1986 18,1 14,67 3,43 11,80 6,06
7 1987 18,4 14,86 3,58 12,80 0,02
8 1988 15,1 15,04 0,04 0,00 12,48
9 1989 16,1 15,23 0,87 0,76 0,68
10 1990 18,5 15,42 3,08 9,51 4,90
11 1991 14,4 15,60 -1,20 1,44 18,37
12 1992 17,2 15,79 1,41 1,99 6,83
13 1993 16,3 15,97 0,33 0,11 1,18
14 1994 15,3 16,16 -0,86 0,74 1,41
15 1995 12,6 16,35 -3,74 14,01 8,30
16 1996 14,7 16,53 -1,86 3,47 3,53
17 1997 17,1 16,72 0,41 0,17 5,17
18 1998 12,5 16,91 -4,40 19,37 23,15
19 1999 12,3 17,09 -4,76 22,68 0,13
20 2000 14,7 17,28 -2,58 6,65 4,77
21 2001 18,1 17,47 0,60 0,36 10,09
22 2002 18,9 17,65 1,21 1,47 0,38
23 2003 18,3 17,84 0,44 0,19 0,60
24 2004 17,8 18,02 -0,21 0,04 0,41
25 2005 18,1 18,21 -0,11 0,01 0,01
26 2006 18,9 18,40 0,51 0,26 0,38
27 2007 19,7 18,58 1,09 1,18 0,34
28 2008 23,3 18,77 4,57 20,91 12,15
29 2009 22,7 18,96 3,73 13,93 0,71
30 2010 15,9 19,14 -3,28 10,78 49,23
0,00 158,67 173,69

Критические значения критерия Дарбина-Уотсона находим из таблицы


5.5 при n=30 Так как , то при уровне

150
значимости α=0,05 гипотеза о наличии автокорреляции в остатках регрессии
принимается.
График остатков регрессии имеет вид:
6

2
Остатки

0
0 5 10 15 20 25 30 35
-2

-4

-6

Рисунок 7.7 – График остатков регрессии (7.28)

Таким образом, по данному критерию модель нельзя считать


адекватной.
Проверим соответствие ряда остатков нормальному распределению. По
таблице 7.10 RS-критерия находим , что для данного объема выборки n=30
значение критерия должно принадлежать интервалу (3.47-4.89).
Так как значение

где

RS=3,88 находится внутри интервала (3.47-4.89), то модель по этому


критерию можно считать адекватной, а ряд остатков - соответствующим
нормальному закону.
Вычисление среднего значения для ряда остатков дало результат
e  0.0 (значащие цифры появляются в 15 разряде). Таким образом, гипотеза
о равенстве математического ожидания нулю выполняется.

151
В итоге, приходим к выводу, что модель нельзя считать статистически
адекватной по критерию DW, что означает, что точечные и интервальные
оценки, полученные с ее помощью будут недостаточно надежны.

Лабораторная работа №10


Задание. Используя данные приложения №5 согласно варианту:
1) Построить график , сделать предположение о наличии или
отсутствии тренда в динамике.
2) Вычислить коэффициенты автокорреляции первого, второго,
третьего и четвертого порядков. Построить график автокорреляционной
функции временного ряда (коррелограмму) Сделать вывод о структуре
временного ряда.
3) Выполнить двухвыборочный F-тест для дисперсии для
тестирования гипотезы о равенстве средних. Сделать вывод о наличии или
отсутствии тренда в динамике.
4) Построить линейную однопараметрическую модель регрессии
зависимости данного временного ряда от t.
5) Вычислить остатки регрессии .
6) Построить график остатков регрессии.
7) Проверить остатки регрессии на равенство математического
ожидания нулю, отсутствие автокорреляции и соответствие нормальному
закону.
Тесты по теме
Анализ и моделирование одновременных временных рядов

1. Факторы, описывающие трендовую компоненту временного ряда,


характеризуются ...
 периодическим воздействием на величину экономического
показателя
 случайным воздействием на уровень временного ряда
 долговременным воздействием на экономический показатель
 возможностью расчета значения компоненты с помощью
аналитической функции от времени

2. Область значений автокорреляционной функции представляет


собой промежуток ... :
 [-1,0]
 [-1,1]
 (-1,1)
 [0,1]

152
3. Построение модели временного ряда может быть осуществлено с
использованием ... :
 критерия Дарбина–Уотсона
 метода последовательных разностей
 мультипликативной модели
 аддитивной модели

4. При моделировании временных рядов экономических показателей


необходимо учитывать характер уровней исследуемых показателей ...
 конструктивный
 независящий от времени
 стохастический
 аналитический

5. Если в модели присутствуют лаговые переменные, то это:


 линейная модель;
 нелинейная модель;
 модель со случайными возмущениями;
 динамическая модель.

6. Установить соответствие:
Вывод о наличии (отсутствии) Попадание статистики Дарбина-
автокорреляции Уотсона DW на интервал, границы
которого определяются нижним - d L и
верхним - dU значениями критической
точки
А) 0  DW  d L
1) неопределенность
2) существует отрицательная Б) d L  DW  dU или
автокорреляция 4  dU  DW  4  d L
3) автокорреляция отсутствует В) dU  DW  4  dU
4) существует положительная Г) 4  d L  DW ≤ 4
автокорреляция
 1-Б, 2-Г, 3-В, 4-А
 1-А, 2-В, 3-Б, 4-Г
 1-В, 2-А, 3-Г, 4-Б
 1-Г, 2-Б, 3-А, 4-В

7. Установить последовательность алгоритма теста Дарбина-


Уотсона:
1) вычисление остатков
2) оценка регрессии
153
3) определение интервала попадания статистики Дарбина- Уотсона
4) вычисление статистики Дарбина- Уотсона:
 2143
 1234
 3412
 4321

8. Аддитивная модель содержит компоненты в виде …


 комбинации слагаемых и сомножителей
 сомножителей
 отношений
 слагаемых

9. В стационарном временном ряде трендовая компонента …


 имеет линейную зависимость от времени
 отсутствует
 имеет нелинейную зависимость от времени
 присутствует

10. Какие точки исключаются из временного ряда процедурой


сглаживания
 расположенные в начале временного ряда,
 никакие не исключаются
 расположенные в конце временного ряда,
 расположенные и в начале, и в конце временного ряда.

11. Какие временные ряды называются интервальными?


 уровни, которых характеризуют изучаемое явление за
определённые интервалы времени,
 уровни, которых отражают величину изучаемого явления на
определённый момент времени,
 уровни, которых характеризуют изучаемое явление с помощью
относительных величин,
 уровни, которых характеризуют изучаемое явление с помощью
средних величин.

12. Какие временные ряды называются моментными?


 уровни, которых характеризуют изучаемое явление за
определённые интервалы времени,
 уровни, которых отражают величину изучаемого явления на
определённый момент времени,
 уровни, которых характеризуют изучаемое явление с помощью
относительных величин,
154
 уровни, которых характеризуют изучаемое явление с помощью
средних величин.
13. Какая функция используется при моделировании показателей с
постоянным ростом?
 линейная,
 показательная,
 степенная,
 параболическая.

14. Если значения цепных абсолютных приростов временного ряда


примерно одинаковы, то для вычисления прогнозного значения в следующей
точке корректно использовать
 средний абсолютный прирост,
 средний темп роста,
 средний темп прироста,
 среднее квадратическое отклонение.

15. Временной ряд, в котором ошибки некоррелированы и их


математическое ожидание равно 0, называется
 "белый шум"
 парная линейная регрессия
 простейший ряд
 трендовый ряд

16. Какая составляющая временного ряда отражает влияние


долговременных факторов?
 коррелограмма
 лаг
 случайная компонента
 тренд

17. Какая составляющая временного ряда отражает влияние


факторов, не поддающихся учёту и регистрации?
 коррелограмма
 лаг
 случайная компонента
 тренд

18. Какая составляющая временного ряда отражает влияние факторов,


повторяющихся через некоторые промежутки времени?
 коррелограмма
 лаг
 случайная компонента
155
 циклическая компонента

19. Какой из приведенных тестов является тестом на автокорреляцию?


 Гаусса-Маркова
 Голдфелда-Квандта
 Дарбина-Уотсона
 Чоу

20. Коррелограмма - это ...


 временной ряд, в котором ошибки некоррелированы, и их
математическое ожидание равно 0
 график автокорреляционной функции
 общая тенденция изменения корреляционной зависимости
 сдвиг во временном ряде относительно начального момента

21. Случайная компонента временного ряда отражает ...


 влияние глобальных долговременных факторов
 влияние факторов, не поддающихся учёту и регистрации
 влияние факторов, периодически повторяющихся через некоторые
промежутки времени
 общую тенденцию изменения корреляционной зависимости

Вопросы для самопроверки

1. Дайте определение ВР. Назовите его основные элементы. Приведите примеры ВР.
2. Перечислите основные компоненты ВР.
3. Дайте определение автокорреляции уровней ВР.
4. Поясните, как можно оценить количественно автокорреляцию уровней ВР.
5. Дайте определение автокорреляционной функции ВР и коррелограммы.
6. Дайте понятие тренда ВР и перечислите основные виды трендов.
7. Запишите общий вид аддитивной и мультипликативной моделей ВР.
8. Перечислите этапы построения мультипликативной и аддитивной моделей ВР.
9. С какими целями проводятся выявление и устранение сезонного эффекта?
10. Как структурные изменения влияют на тенденцию ВР?
11. Зачем выполняется аналитическое выравнивание?
12. Перечислите основные этапы построения аналитической модели тренда.
13. Какой метод используется для оценивания коэффициентов тренда?
14. Объясните что означают отклонения от тренда.
15. Как отбирается наилучшая форма тренда?
16. Сформулируйте задачи эконометрического исследования временного ряда.
17. Поясните, в чём состоят характерные отличия временных рядов от
пространственных выборок.
18. Под воздействием каких групп факторов формируются значения уровней
временного ряда?
19. Как на стадии графического анализа динамики временного ряда можно
определить характер сезонности (аддитивный или мультипликативный)?
20. Какие основные типы воздействий оказывают наибольшее влияние на
сезонную компоненту?
156
8. Динамические эконометрические модели

В эконометрическом анализе исследуются воздействия ряда


экономических факторов на результативную переменную, осуществляющих
как мгновенно, так и с некоторым запаздыванием.
В качестве причин запаздывания рассматриваются следующие:
‒ Психологические факторы, выражающиеся в инертности
поведения людей;
‒ Технологические факторы;
‒ Институциональные факторы;
‒ Механизмы формирования экономических показателей.
Эконометрическую модель называют динамической, если эта модель
отражает динамику последующих переменных в каждый момент времени,
т.е. если в данный момент времени t она учитывает значения входящих в нее
переменных, относящихся, как к текущему, так и к предыдущим, моментам
времени.
Динамические модели используются при изучении зависимостей
между показателями, для анализа развития во времени которых, в качестве
объясняющих переменных используются как текущие значения переменных,
так и предыдущие во времени, а также само время t.
Динамические модели подразделяются на 2 группы:
1. Модели с распределенным лагом − модели, содержащие в
качестве лаговых переменных независимые (экзогенные) переменные.
2. Авторегрессионные модели − модели, содержащие в качестве
лаговых переменных зависимые (эндогенные) переменные.
Динамические модели имеют свои особенности:
‒ оценка параметров динамических моделей не может быть
произведена с помощью обычного МНК, т.к. нарушаются его предпосылки,
требует специальных методов параметризации;
‒ необходимо знать структуру и оптимальную величину лага;
‒ между двумя видами динамических моделей существует
взаимосвязь, которую необходимо определить.

8.1 Регрессионные модели с распределенным лагом

Пусть Y  зависимая переменная (эндогенная), X − независимая или


объясняющая (экзогенная) переменная.
Если переменная (эндогенная или экзогенная) участвует в записи
анализируемой модели, будучи в один из прошлых (по отношению к
текущему моменту времени ) временных t-k периодов (k>0), то эту
переменную называют лаговой или запаздывающей, а число единиц времени
запаздывания k- лагом (запаздыванием).
Временной лаг – временная задержка между причиной и следствием.
157
Причинами появления временного лага между экономическими
явлениями являются: инерционность экономической системы и
инерционность во времени действия причины. Если возникла причина,
которая может привести к некоторым последствиям в экономической
системе, то необходимо время, для того чтобы причина вызвала следствие у
экономического объекта или явления.
Временной лаг может состоять из следующих составляющих:
– время передачи информации от источника причины к
экономическому объекту;
– время обработки информации;
– время для принятия решения;
– время для выполнения принятого решения;
– время для получения видимого эффекта от принятого решения.
Инерционность действия причины проявляется в том, что прошлые
события продолжают оказывать воздействие на текущие и будущие явления.
Примерами временных лагов могут служить инвестиции в науку,
строительство и т.п. Время задержки может измеряться десятками лет
(строительство гидро- или атомных электростанций, реализация
национальных проектов в образование и в медицину).
Анализ причинно-следственных явлений позволил сделать вывод о
существовании двух видов лагов:
– сосредоточенный;
– распределенный.
Сосредоточенный лаг характеризует время задержки между причиной
и следствием.
Распределенный лаг характеризует переходный процесс воздействия
причины на следствие.
Уравнение вида

называется моделью распределенных лагов.


Последовательность весовых коэффициентов называют
структурой лага (конечной или бесконечной в зависимости от конечности
или бесконечности их числа T )
Коэффициент при переменной характеризует среднее абсолютное
изменение результата при изменении фактора на 1единицу в некоторый
фиксированный момент времени t, без учета воздействия лаговых значений
. Этот коэффициент называется краткосрочным мультипликатором.
В момент t+1 совокупное воздействие переменной на результат
составит , а в момент t+2 соответственно и т.д.
Следовательно, любую сумму коэффициентов

158
называют промежуточным мультипликатором.
Сумму всех коэффициентов

называют долгосрочным мультипликатором, т.к. она характеризует


изменение под воздействием единичного изменения в каждом из
рассматриваемых периодов времени.
Если все , то последовательность коэффициентов
называют нормированной структурой лага модели, где

Очевидно, что

Функция (8.4) называется также распределением лагов, показывает


вклад отдельного лага k.
Для того, чтобы измерить скорость реакции на изменение , вводят
понятие среднего лага, равного

Малые значения среднего лага соответствуют быстрой реакции Y на


изменение X, и, наоборот, большим значениям среднего лага соответствует
замедленная реакция.
Нашей целью является построение линейной регрессионной модели,
позволяющей с наименьшими ошибками восстановить и прогнозировать
значения Yt по значениям для .
В этом уравнении значение зависимой переменной в момент времени t
является линейной функцией переменной X, измеренной в моменты t, t-1, t-2
и т.д.

159
Таким образом, зависимая переменная представляет собой линейные
функции X и X, сдвинутых на 1, 2, и т.д. временные периоды.
Если коэффициент переменной с определенным запаздыванием (лагом)
значим, то можно заключить, что переменная Y предсказывается (или
объясняется) с запаздыванием.
Анализ распределенных лагов - это специальный метод оценки
запаздывающей зависимости между рядами.
Например, предположим, вы производите компьютерные программы и
хотите установить зависимость между числом запросов, поступивших от
покупателей, и числом реальных заказов. Вы могли бы записывать эти
данные ежемесячно в течение года и затем рассмотреть зависимость между
двумя переменными: число запросов и число заказов зависит от запросов, но
зависит с запаздыванием. Однако очевидно, что запросы предшествуют
заказам, поэтому можно ожидать, что число заказов. Иными словами, в
зависимости между числом запросов и числом продаж имеется временной
сдвиг (лаг).
Такого рода зависимости с запаздыванием особенно часто возникают в
экономике.
Например, доход от инвестиций в новое оборудование отчетливо
проявится не сразу, а только через определенное время. Более высокий доход
изменяет выбор жилья людьми; однако эта зависимость, очевидно, тоже
проявляется с запаздыванием. Подобные задачи возникают в страховании,
где временной ряд клиентов и ряд денежных поступлений сдвинуты друг
относительно друга.
Пример 1. Модель зависимости общих расходов населения Yt от его
наблюдаемых доходов Xt., доля дохода, которая тратится через k лет
после его приобретения.
Пример 2. Модель зависимости объемов введенных основных
фондов от капитальных вложений.
В данном случае значения коэффициентов регрессии
показывают, какими долями реализуются капитальные вложения
xt соответственно в году
При оценке параметров моделей с распределенными лагами
возникают следующие трудности:
1. Может оказаться, что количество коэффициентов модели (8.1)
слишком велико, если по смыслу задачи ожидается влияние с большим
запаздыванием. Величина T, определяющая число включенных в модель
объясняющих переменных, как правило, относится к неизвестным
параметрам модели. Чтобы определить значение Т, приходится, выбрав
вначале его достаточно большим, исследовать статистическую значимость
получающихся при этом оценок коэффициентов регрессии для различных
k.
2. Снижается число степеней свободы (увеличивается число
регрессоров и уменьшается число наблюдений).
160
3. Велика вероятность мультиколлинеарности лаговых значений X,
что снижает точность оценок коэффициентов.
4. Высокая корреляция между объясняющими переменными и,
следовательно, высокая степень мультиколлинеарности.
Мультиколлинеарность часто приводит к тому, что оценки
коэффициентов ведут себя совершенно случайным образом. Не наблюдается
ожидаемое уменьшение их абсолютных значений с ростом длины лага.
С целью устранения этих сложностей стимулируется поиск некоторых
специальных подходов к анализу моделей с распределенными лагами.
Общая специфика данных моделей заключается в том, что из их
содержательной сущности, как правило, вытекают определенные априорные
сведения о значениях и взаимосвязях, существующих между весовыми
коэффициентами , или, иначе говоря, об их структуре.
Так, например, в некоторых ситуациях коэффициенты
экспоненциально убывают по мере роста k,т.е.

где

Cледовательно, вместо Т+1 неизвестных параметров придется


оценивать всего два: с и β0.
Таким образом, главная идея, на которой базируется общий подход к
анализу и построению моделей с распределенными лагами может быть
сформулирована следующим образом:
Отправляясь от содержательной сущности моделируемых
зависимостей и смысла весовых коэффициентов βk, определить их
структурные связи с помощью введения небольшого числа параметров

по значениям которых можно восстановить значения всех неизвестных


коэффициентов регрессии βk. После этого задача сводится к оценке
параметров

8.2 Распределенный лаг Алмона (модель полиноминальных лагов)

Распределенные лаги Алмон (Almon,1965) обладают достаточной


гибкостью для моделирования, используя при этом минимальное число
параметров.

161
В основе модели лежит предположение о том, что если Y зависит от
текущих и лаговых значений X , то веса в этой зависимости подчиняются
полиномиальному распределению.
По этой причине лаги Алмон также часто описываются как
полиномиально распределенные лаги. Выбор функции остается за
исследователем, и он, конечно, может быть сделан на основе экспериментов.
Рассмотрим общую модель с распределенным лагом, имеющую
конечную максимальную величину лага l:

Предположим, было установлено, что в исследуемой модели имеет


место полиномиальная структура лага, т.е. зависимость коэффициентов
регрессии от величины лага j описывается полиномом k-й степени. Лаги,
структуру которых можно описать с помощью полиномов, называют лагами
Алмон.
Формально модель зависимости коэффициентов от величины лага j в
форме полинома можно записать в следующем виде:
‒ для полинома 1-й степени: ;
‒ для полинома 2-й степени: ;
‒ для полинома 3-й степени: и т.д.

В наиболее общем виде для полинома k-й степени имеем:

Каждый из коэффициентов модели (8.10) можно выразить


следующим образом:

…………….………….……….

Подставив (8.12) в (8.10), получим:

+( )

Перегруппируем слагаемые в (8.13):

162
+
+l +

Обозначим слагаемые в скобках при сi как новые переменные:

+ ;
+l ;
+
…………………………………………..

Перепишем модель (8.10) с учетом соотношений (8.14) и (8.15):

Процедура применения метода Алмон для расчета параметров


модели с распределенным лагом (8.10) выглядит следующим образом:
1. Определяется максимальная величина лага l.
2. Определяется степень полинома k описывающего структуру лага.
3. По соотношениям (8.15) рассчитываются значения переменных
и .
4. Определяются параметры уравнения линейной регрессии (8.16).
5. С помощью соотношений (8.12) рассчитываются параметры
исходной модели (8.10) с распределенным лагом.
Применение модели Алмон сопряжено с рядом проблем.
Во-первых, величина лага l должна быть известна заранее. При ее
определении лучше исходить из максимально возможного лага, чем
ограничиваться лагами небольшой длины.
Выбор меньшего лага, чем его реальное значение, приведет к тому, что
в модели регрессии не будет учтен фактор, оказывающий значительное
влияние на результат, т.е. неверной спецификации модели. Влияние этого
фактора в такой модели будет выражено в остатках. Тем самым в модели не
будут соблюдаться предпосылки МНК о случайности остатков, а полученные
оценки ее параметров окажутся неэффективными и смещенными.
Выбор большей величины лага по сравнению с ее реальным значением
будет означать включение в модель статистически незначимого фактора и
снижение эффективности полученных оценок, однако эти оценки все же
будут несмещенными.
Существует несколько практических подходов к определению
реальной величины лага, например построение нескольких уравнений
регрессии и выбор наилучшего из этих уравнений или применение
формальных критериев. Однако наиболее простым способом является
измерение тесноты связи между результатом и лаговыми значениями
163
фактора. Кроме того, оптимальную величину лага можно приближенно
определить на основе априорной информации экономической теории или
проведенных ранее эмпирических исследований.
Во-вторых, необходимо установить степень полинома k. Обычно на
практике ограничиваются рассмотрением полиномов 2-й и 3-й степени,
применяя следующее простое правило: выбранная степень полинома k
должна быть на единицу больше числа экстремумов в структуре лага. Если
априорную информацию о структуре лага получить невозможно, величину k
проще всего определить путем сравнения моделей, построенных для
различных значений k, и выбора наилучшей модели.
В-третьих, переменные , которые определяются как линейные
комбинации исходных переменных X, будут коррелировать между собой в
случаях, когда наблюдается высокая связь между самими исходными
переменными.
Поэтому оценку параметров модели (8.10) приходится проводить в
условиях мультиколлинеарности факторов.
Однако мультиколлинеаность факторов и в модели (8.16)
сказывается на оценках параметров в несколько меньшей
степени, чем если бы эти оценки были получены путем применения
обычного МНК непосредственно к модели (8.10).
Мультиколлинеарность ведет к снижению эффективности оценок
. поэтому каждый из параметров ,которые
определяются как линейные комбинации оценок , будет
представлять собой более точную оценку, а стандартные ошибки этих
параметров не будут превышать стандартные ошибки параметров,
полученных по модели (8.10) обычным МНК.
Метод Алман имеет два неоспоримых преимущества:
‒ достаточно универсален и может быть применен для
моделирования процессов, которые характеризуются разнообразными
структурами лагов;
‒ при относительно небольшом количестве переменных в (8.10)
(обычно выбирают k = 2 или k = 3), которое не приводит к потере
значительного числа степеней свободы, с помощью метода Алмон можно
построить модели с распределенным лагом любой длины.
Пример 8.1
Используя данные (см. таблицу 8.1) построить методом Ш. Алмона
регрессионную модель с распределенным лагом вида

в предположении, что структура лага описывается полиномом второй


степени

164
Таблица 8.1 –Динамика объемов ВВп и валовых внутренних
инвестиций США (в ценах 1987 г., млрд долл. США)23
Год 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969
1931,3 1973,2 2025,6 2129,8 2218,0 2343,3 2473,5 2622,3 2690,3 2801,0 2877,1
296,4 290,8 289,4 321,2 343,3 371,8 413,0 438,0 418,6 440,1 461,3
Год 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980
2875,8 2965,1 3107,1 3268,5 3248,1 3221,7 3380,8 3533,2 3703,5 3796,8 3776,3
429,7 481,5 532,2 591,7 543,0 437,6 520,6 600,4 664,6 669,7 594,4
Год 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991
3843,1 3760,3 3906,6 4148,5 4279,8 4404,5 4540,0 4781,6 4836,9 4884,9 4848,4
631,1 540,5 599,5 757,5 745,9 735,1 749,3 773,4 789,2 744,5 672,6
− ВВП США,
объем валовых внутренних инвестиций в экономику США.
Решение.
Вычислим значения переменных по формулам:
;
; (8.19)
.
Таблица 8.2 – Вычисление лаговых переменных и переменных
по данным примера 8.1
Год
1963 2218,0 343,3 321,2 289,4 290,8 296,4 1541,1 2958,0 8838,4
1964 2343,3 371,8 343,3 321,2 289,4 290,8 1616,5 3017,1 8885,5
1965 2473,5 413,0 371,8 343,3 321,2 289,4 1738,7 3179,6 9266,2
1966 2622,3 438,0 413,0 371,8 343,3 321,2 1887,3 3471,3 10129,1
1967 2690,3 418,6 438,0 413,0 371,8 343,3 1984,7 3752,6 10929,0
1968 2801,0 440,1 418,6 438,0 413,0 371,8 2081,5 4020,8 11836,4
1969 2877,1 461,3 440,1 418,6 438,0 413,0 2171,0 4243,3 12664,5
1970 2875,8 429,7 461,3 440,1 418,6 438,0 2187,7 4349,3 12997,1
1971 2965,1 481,5 429,7 461,3 440,1 418,6 2231,2 4347,0 12933,4
1972 3107,1 532,2 481,5 429,7 461,3 440,1 2344,8 4485,2 13393,6
1973 3268,5 591,7 532,2 481,5 429,7 461,3 2496,4 4629,5 13706,3
1974 3248,1 543,0 591,7 532,2 481,5 429,7 2578,1 4819,4 13929,2
1975 3221,7 437,6 543,0 591,7 532,2 481,5 2586,0 5249,0 15403,6
1976 3380,8 520,6 437,6 543,0 591,7 532,2 2625,1 5427,5 16450,1
1977 3533,2 600,4 520,6 437,6 543,0 591,7 2693,3 5391,6 16625,2
1978 3703,5 664,6 600,4 520,6 437,6 543,0 2766,2 5126,4 15309,2
1979 3796,8 669,7 664,6 600,4 520,6 437,6 2892,9 5177,6 14753,2
1980 3776,3 594,4 669,7 664,6 600,4 520,6 3049,7 5882,5 17061,3
1981 3843,1 631,1 594,4 669,7 664,6 600,4 3160,2 6329,2 18861,0
1982 3760,3 540,5 631,1 594,4 669,7 664,6 3100,3 6487,4 19669,6
1983 3906,6 599,5 540,5 631,1 594,4 669,7 3035,2 6264,7 19129,7
1984 4148,5 757,5 599,5 540,5 631,1 594,4 3123,0 5951,4 17951,8
1985 4279,8 745,9 757,5 599,5 540,5 631,1 3274,5 6102,4 18117,6
1986 4404,5 735,1 745,9 757,5 599,5 540,5 3378,5 6221,4 17819,4
1987 4540,0 749,3 735,1 745,9 757,5 599,5 3587,3 6897,4 20128,2
1988 4781,6 773,4 749,3 735,1 745,9 757,5 3761,2 7487,2 22522,8
1989 4836,9 789,2 773,4 749,3 735,1 745,9 3792,9 7460,9 22320,9
1990 4884,9 744,5 789,2 773,4 749,3 735,1 3791,5 7524,3 22388,1
1991 4848,4 672,6 744,5 789,2 773,4 749,3 3729,0 7640,3 22850,7

23
Источник данных: http://www.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/population/level/#
165
Методом наименьших квадратов оценим параметры уравнения
линейной регрессии (Рис. 8.1):

Регрессионная статистика
Множественный
R 0,995
R-квадрат 0,991
Нормированный
R-квадрат 0,989
Стандартная
ошибка 82,121
Наблюдения 29

Дисперсионный анализ
Значимость
df SS MS F F
Регрессия 3 17767611,31 5922537,10 878,22 0,00
Остаток 25 168595,20 6743,81
Итого 28 17936206,51

Стандартная t- Нижние
Коэффициенты ошибка статистика P-Значение 95%
288,53 67,41 4,28 0,00 149,70
1,93 0,20 9,50 0,00 1,52
-0,95 0,30 -3,21 0,00 -1,56
0,19 0,07 2,63 0,01 0,04

Рисунок 8.1 – Результаты корреляционно-регрессионного анализа по


данным таблицы 8.1

Анализ данных рисунка 8.1 позволяет записать регрессионную модель


вида:

С помощью соотношений

рассчитываются параметры исходной модели с распределенным лагом:

166
Таким образом, модель с распределенным лагом имеет вид:

Анализ построенной модели позволяет сделать вывод о том, что рост


инвестиций в экономику США на 1 млрд. долл. в текущем периоде приведет
через 3 года в среднем к росту ВВП на (1,93 + 1,18 + 0,80 + 0,81) 4,73 млрд.
долл. США.

Лабораторная работа №11


Задание. По исходным данным Приложения 7 согласно № варианта
построить методом Ш. лмона модель с распределенным лагом вида:

в предположении, что структура лага описывается полиномом второй


степени

8.3 Геометрическая лаговая структура Койка

В данном подходе рассматривается бесконечная лаговая структура


(полагается Т   ), поэтому он применим лишь к достаточно длинным
временным рядам .
Общим допущением при анализе бесконечных лаговых структур
является требование сходимости ряда, т.е.

и, следовательно,

Это означает, что влияние на уменьшается до нуля по мере


неограниченного увеличения временного интервала j, что естественно, т.к.
текущее значение практически не должно зависеть от поведения в
бесконечно далеком прошлом. Койк в своем подходе конкретизировал и
усилил это допущение. В частности, он постулировал, что все
нормированные веса, являясь положительными, убывают с ростом i по
геометрической прогрессии, т.е.

167
где 0< λ<1.
Тогда

Для момента времени t  1 имеем:

Умножив (8.30) на  и вычтя полученный результат из (8.29),


приходим к виду:

или

В результате мы получили уравнение регрессии по объясняющим


переменным и всего с двумя неизвестными коэффициентами и (не
считая свободного члена  ).
Однако т.к. в правой части (8.32) остаточная случайная величина
зависит от оцениваемого параметра  и, вообще говоря,
коррелирована, по крайней мере, с объясняющей переменной , метод
оценивания параметров  и  нестандартен и зависит от дополнительных
предположений относительно природы остатков е .
Для получения состоятельных оценок можно применить метод
инструментальных переменных или воспользоваться методом максимального
правдоподобия.

8.4 Модель частичного приспособления

Предположим, что оптимальное (целевое) значение некоторого


экономического показателя определяется уравнением

168
где переменная, выполняющая роль объясняющей, не
коррелирована с .
Оптимальное значение исследуемой результирующей переменной не
всегда является наблюдаемым. Экономический объект, характеризуемый
этой переменной, может не иметь возможности в точности к моменту
времени t «выходить» на желаемое значение .
Таким образом, фактическое (наблюдаемое) значение этого
показателя будет со временем как бы подтягиваться к желаемому в
соответствии с правилом, формализуемым отношением:

где  t удовлетворяют условиям:


1) математическое ожидание (среднее значение) случайных остатков
равно 0:

2)

п и
п и

Тогда из (8.34) следует, что на каждом следующем временном такте


наблюдаемое значение будет «подправляться» в направлении целевого
значения на величину, пропорциональной разнице между оптимальным и
текущим уровнями результирующего показателя.
Соотношение (8.34) может быть переписано в виде:

Откуда следует, что наблюдаемое значение исследуемой


результирующей переменной есть взвешенное среднее желаемого уровня (на
данный момент времени) и фактического значения в предыдущем такте
времени.
Подставляя модельное оптимальное значение (8.33) в (8.37), получим

169
Сравнивая (8.38) с (8.32), замечаем, что исследуемая зависимость
относится по своему типу к геометрической структуре Койка.
Схема «частичного приспособления» имеет довольно широкий спектр
экономических приложений.

8.5 Модель авторегрессии

Моделью авторегрессии называется динамическая эконометрическая


модель, в которой в качестве факторных переменных содержатся лаговые
значения результативной переменной.
Пример модели авторегрессии:

где
α0 – коэффициент, характеризующий краткосрочное изменение
переменной под влиянием изменения переменной на единицу своего
измерения;
β1 – коэффициент, характеризующий изменение переменной в
текущий момент времени t под влиянием своего изменения в предыдущий
момент времени (t–1).
Промежуточным мультипликатором называется произведение
коэффициентов модели авторегрессии .
Промежуточный мультипликатор отражает общее абсолютное
изменение результативной переменной в момент времени (t+1).
Долгосрочным мультипликатором называется показатель α,
рассчитываемый как

Долгосрочный мультипликатор отражает общее абсолютное изменение


результативной переменной в долгосрочном периоде.
Если для модели авторегрессии выполняется условие | β1|<1, то при
наличии бесконечного лага будет справедливым равенство:

В линейной регрессионной модели факторные переменные не


коррелируют со случайными остатками модели.
Данное условие для моделей авторегрессии нарушается, т.к.
переменная коррелирует с .

170
Следовательно, при оценке неизвестных коэффициентов
традиционным методом наименьших квадратов получим смещённую оценку
коэффициента при переменной .
При определении оценок неизвестных коэффициентов модели
авторегрессии используется метод инструментальных переменных
(Instrumental variables).
Суть метода инструментальных переменных заключается в том, что
переменная , для которой нарушается предпосылка МНК, заменяется на
новую переменную Zt, удовлетворяющую двум требованиям:
1. Zt должна тесно коррелировать с :

2. данная переменная не должна коррелировать с остатками модели εt:

Предположим, что на основе некоторых статистических данных была


построена модель авторегрессии вида (8.39).
Рассчитаем оценки неизвестных коэффициентов данной модели с
помощью метода инструментальных переменных.
В модели авторегрессии (8.39) переменная коррелирует с
переменной , следовательно, переменная зависит от переменной :

где – неизвестные коэффициенты модели регрессии;


– случайная ошибка модели регрессии (8.44).
Обозначим выражение через переменную . Тогда
модель (8.44) примет вид:

Новая переменная удовлетворяет свойствам, предъявляемым к


инструментальным переменным (8.42) и (8.43).
Таким образом, исходная модель авторегрессии (8.39) может быть
представлена следующим образом:

где

171
На следующем этапе оценки неизвестных коэффициентов
преобразованной модели рассчитываются с помощью традиционного метода
наименьших квадратов. Эти оценки будут являться оценками неизвестных
коэффициентов исходной модели авторегрессии (8.39).

8.6 Модель адаптивных ожиданий

Модель адаптивных ожиданий (МАО) учитывает желаемое (или


предполагаемое) значение факторной переменной в момент времени
(t+1). В качестве примера модели адаптивных ожиданий можно привести
влияние размера предполагаемой в будущем периоде индексации заработных
плат и пенсий на текущие цены или зависимость объема текущих инвестиций
в момент времени от ожидаемого курса валюты в момент времени (t+1).
В общем виде МАО можно записать в следующим виде:

Предполагаемое (ожидаемое) значение переменной в момент


времени t определяется по фактическим значениям переменной и
переменной в предшествующий момент времени t-1.
Выдвигается предположение, что эти значения связаны следующим
соотношением:

где 0 < λ< 1.

Модель (8.49) называют моделью обучения на ошибках, т.к. ожидания


экономических объектов в этом случае складываются из прошлых ожиданий
, скорректированных на величину ошибки в ожиданиях, допущенных в
предыдущем периоде времени.
Модель (8.49) можно записать в виде

Таким образом, ожидаемое значение переменной в момент времени


t является средним арифметическим взвешенным значением ее фактического
и ожидаемого значений в предыдущем периоде. Величина
называется параметром адаптации.
Чем больше его величина, тем быстрее ожидаемое значение
адаптируется к фактическим событиям . Чем меньше величина , тем
ближе ожидаемое в будущем значение к ожидаемому значению

172
предшествующего периода , что характеризует сохранение тенденций в
ожиданиях.
Если λ=0, то ожидания являются неизменными (статичными):

Если λ=1, то , что означает мгновенно реализуемые ожидания.


Применение традиционного метода наименьших квадратов к
оцениванию параметров МАО невозможно, так как модель содержит
предполагаемые значения факторной переменной, которые нельзя получить
эмпирическим путем. В связи с этим исходную модель адаптивных ожиданий
вида (8.48) преобразуют.
Подставим выражение (8.50) в исходную модель (8.48):

Модель адаптивных ожиданий вида (8.48) верна для момента времени


(t-1):

Умножим данное выражение на (1-λ) и получим:

Далее вычтем (8.53) из модели (8.51):

Где

Преобразованная модель (8.54) является обычной моделью


авторегрессии.
После расчета оценок модели авторегрессии (8.54):

можно, определив значение параметра перейти к оценке


параметров исходной модели адаптивных ожиданий (8.48):

173
Модель адаптивных ожиданий вида (8.48) характеризует зависимость
результативной переменной от предполагаемых значений факторной
переменной и называется долгосрочной функцией модели адаптивных
ожиданий.
Модель вида (8.54), полученная в результате преобразований,
характеризует зависимость результативной переменной от фактических
значений факторной переменной и называется краткосрочной функцией
модели адаптивных ожиданий.
МАО может использоваться при анализе зависимости потребления от
дохода, спроса на деньги либо инвестиций от процентной ставки и в других
ситуациях, где экономические показатели оказываются чувствительными к
ожиданиям относительно будущего.

8.7 Автокорреляция в остатках авторегрессионной модели.


Обнаружение и устранение

В авторегрессионных моделях автокорреляцию в остатках практически


невозможно определить с помощью критерия Дарбина − Уотсона, т. к. для
них значение DW близко к 2 даже при наличии автокорреляции.
Для обнаружения автокорреляции в авторегрессионных моделях
необходимо использовать h−статистику:

где
фактическое значение критерия Дарбина−Уотсона для модели
авторегрессии (8.39);
квадрат стандартной ошибки при лаговой результативной
переменной переменной ;
n – объем выборки (длина временного ряда ).
Распределение h−статистики аппроксимируется стандартным
нормальным распределением. Поэтому для тестирования гипотезы о наличии
автокорреляции в остатках модели необходимо сравнить фактическое
значение h−статистики сравнить с табличным, или действовать по
следующему правилу24:
– если h>1,96 (2,58), то при уровне значимости α=0,05 (0,01) нулевая
гипотеза об отсутствии положительной автокорреляции в остатках модели
отклоняется;

24
Доугерти К. Введение в эконометрику: Учебник. 2-е изд./ Пер. с англ. – М.:ИНФРА-М, 2004. – С.355-357.
174
– если h<-1,96 (2,58), то при уровне значимости α=0,05 (0,01) нулевая
гипотеза об отсутствии отрицательной автокорреляции в остатках модели
отклоняется;
– если -1,96 <h<1,96 (-2,58<h<2,58), то при уровне значимости α=0,05
(0,01) нет оснований отклонить нулевую гипотезу об отсутствии
автокорреляции в остатках модели.
Особенности использования h−статистики:
– h−статистика не вычисляется, если >1;
– применение h−статистики целесообразно лишь при достаточно
большом объеме выборки n.
Как отмечалось ранее (см. п.7.2), автокорреляция в остатках приводит к
получению смещенных и несостоятельных оценок параметров модели.
Автокорреляция может указывать либо на неверную спецификацию
равнения, либо на наличие важных неучтенных факторов. Но чаще всего
автокорреляция вызывается наличием регрессионной зависимости между
остатками, т.е. внутренними свойствами ряда.
Существует несколько способов устранения данной проблемы:
– авторегрессионное преобразование модели AR(1);
– преобразование модели методом скользящих средних,
– построение модели ARMA;
– построение модели ARIMA.
В линейной регрессионной модели либо в моделях, сводящихся к
линейной, наиболее целесообразным и простым преобразованием является
авторегрессионная схема первого порядка AR(1).
Для простоты изложения AR(1) рассмотрим модель парной линейной
регрессии:

Тогда наблюдениям при t-1:

Пусть остатки подвержены воздействию авторегрессии первого


порядка:

где — случайные отклонения, удовлетворяющие всем условиям


Гаусса-Марка, а коэффициент  известен.
Вычтем из (8.60) соотношение (8.59), умноженное на :

Сделаем замену переменных, положив:


175
Получим

В силу того что случайные отклонения удовлетворяют условиям


Гаусса-Маркова оценки и будут обладать свойствами наилучших
линейных несмещенных оценок и автокорреляция не будет присутствовать.
Однако вычисление и приводит к потере первого наблюдения
(число степеней свободы уменьшится на единицу, что при больших выборках
не так существенно, но при малых выборках может привести к потере
эффективности). Эта проблема обычно преодолевается с помощью поправки
Прайса—Винстена:

Отметим, что авторегрессионное преобразование может быть


обобщено на произвольное число объясняющих переменных, т.е.
использовано для уравнения множественной регрессии.
Авторегрессионное преобразование первого порядка AR(1) может быть
обобщено на преобразования более высоких порядков/
Авторегрессионное преобразование второго порядка AR(2):

Однако на практике значение коэффициента  обычно неизвестно и


его необходимо оценивать. Существует целый ряд методов оценивания.
Приведем наиболее употребляемые.
Метод Кохрана—Оркатта оценивания коэффициента представляет
иттеративный процесс.
Опишем его на примере парной регрессии (8.59) и авторегрессионной
схемы первого порядка(8.61).
1. Оценивается МНК регрессия (8.59) и для нее определяются остатки
.
2. Оценивается регрессионная зависимость (8.61), и в качестве
приближенного значения берется его МНК−оценка .
3. На основе этой оценки и формул (8.63) строится уравнение (8.64).
4. Значения подставляются в (8.59)и вновь вычисляются оценки
отклонений и процесс возвращается к этапу 2.

176
Чередование этапов осуществляется до тех пор, пока не будет
достигнута требуемая точность, т.е. пока разность между предыдущей и
последующей оценками не станет меньше заданной точности.
Метод Хилдрета−Лу оценки параметра представляет собой
итерационный метод, широко используется в пакетах прикладных программ.
По данному методу регрессия оценивается для каждого возможного
значения из отрезка [-1, 1] с любым шагом (например, 0,001; 0,01 и т.д.).
Величина , дающая наименьшую стандартную ошибку регрессии,
принимается в качестве оценки коэффициента . Значения
и оцениваются из уравнения регрессии именно с данным значением .
При преобразовании методом скользящих средних в момент
времени t заменяется на сумму константы и скользящей средней между
текущим и предыдущим значениями случайного отклонения (белого шума).
Преобразование методом скользящих средних первого порядка MA(1):

Преобразование методом скользящих средних второго порядка MA(2):

Преобразование методом скользящих средних порядка q MA(q):

Сочетание преобразований AR и MA называется авторегрессионным


преобразованием со скользящей средней ARMA.
ARMA(1,1):

ARMA(p,q):

Преобразование ARMA в сочетании с переходом от объемных величин


к приростным называется преобразованием ARIMA.
В некоторых случаях такой переход позволяет получить более точную
модель зависимости.
Приращением (конечной разностью) первого порядка переменной
называется разность .
Приращением порядка d называется разность

177
Преобразование ARIMA(p, d, q):

Преобразования AR, MA и ARIMA целесообразно использовать тогда,


когда достаточно определен набор объясняющих переменных и общий вид
уравнения регрессии, но, в то же время, сохраняется автокорреляция
остатков.

Лабораторная работа №12

Задание. По исходным данным Приложения 8 согласно № варианта:


Вариант

Вариант

Вариант

Вариант
Y X Y X Y X Y X

1 1 2 26 6 4 51 10 4 76 14 11
2 1 4 27 6 7 52 10 5 77 14 15
3 1 5 28 6 8 53 10 6 78 14 18
4 1 11 29 6 9 54 10 9 79 15 8
5 1 12 30 6 11 55 10 11 80 15 5
6 2 8 31 6 13 56 10 13 81 15 6
7 2 9 32 6 14 57 10 14 82 15 9
8 2 10 33 6 15 58 10 18 83 15 10
9 2 11 34 6 17 59 11 6 84 15 18
10 2 12 35 6 18 60 11 9 85 16 2
11 2 15 36 6 19 61 11 5 86 16 17
12 2 16 37 7 9 62 11 13 87 16 19
13 2 18 38 7 11 63 11 18 88 16 20
14 3 2 39 7 16 64 12 8 89 17 11
15 3 8 40 7 19 65 12 5 90 17 14
16 3 10 41 8 11 66 12 2 91 17 19
17 3 11 42 8 15 67 12 11 92 17 20
18 3 12 43 8 18 68 13 5 93 18 4
19 5 2 44 9 2 69 13 11 94 18 15
20 5 6 45 9 5 70 13 18 95 19 7
21 5 7 46 9 8 71 13 19 96 19 11
22 5 8 47 9 11 72 13 20 97 19 14
23 5 10 48 9 12 73 14 2 98 20 7
24 5 12 49 9 14 74 14 5 99 20 14
25 6 3 50 10 3 75 14 9 100 20 18

1) Построить модель авторегрессии

178
2) Оценить значимость уравнения и отдельных его коэффициентов.
3) Протестировать статистическую гипотезу об отсутствии
автокорреляции в остатках модели.
4) Оценить целесообразность включения в модель фактора t.

Вопросы для самопроверки

1. Виды динамических эконометрических моделей.


2. Особенности построения динамических эконометрических моделей.
3. Приведите вид моделей с распределённым лагом и моделей авторегрессии.
4. Приведите примеры экономических задач, для которых требуется
использование моделей авторегрессии и с распределённым лагом.
5. Какие трудности возникают при оценке параметров уравнения регрессии с
распределенным лагом?
6. Сформулируйте основное предположение метода Алмон. Когда имеет смысл
его применять?
7. Дайте описание метода Койка для построения модели с распределённым лагом.
8. Методы оценки параметров модели авторегрессии.
9. Интерпретация параметром модели с распределенным лагом.
10. Использование инструментальных переменных для оценки параметров модели
авторегрессии.
11. Методика тестирования гипотезы о наличии автокорреляции в остатках модели
авторегрессии.
12. Способы устранения автокорреляции в остатках модели авторегрессии.
13. В чем суть авторегрессионного преобразования модели?
14. В чем суть преобразования модели методом скользящих средних?
15. Особенности построение модели ARMA.
16. Особенности построение модели ARIMA.
17. Общий вид модели частичной корректировки. Экономическая интерпретация
параметров модели частичной корректировки.
18. Общий вид модели адаптивных ожиданий. Экономическая интерпретация
параметров модели адаптивных ожиданий.

179
9. Системы эконометрических уравнений

Объектом статистического изучения в экономике являются сложные


системы. Построение изолированных уравнений регрессии недостаточно для
описания таких систем и объяснения механизма их функционирования.
При использовании отдельных уравнений регрессии, например для
экономических расчетов, в большинстве случаев предполагается, что
аргументы (факторы) можно изменять независимо друг от друга. Однако это
предположение является очень грубым: практически изменение одной
переменной, как правило, не может происходить при абсолютной
неизменности других. Ее изменение повлечет за собой изменения во всей
системе взаимосвязанных признаков. Следовательно, отдельно взятое
уравнение множественной регрессии не достаточно характеризует истинные
влияния отдельных признаков на вариацию результирующей переменной.
Именно поэтому возникла проблема описания структуры связей между
переменными в виде системы так называемых одновременных уравнений.
Система уравнений в эконометрических исследованиях может быть
построена по-разному.
1. Система независимых уравнений, когда каждая зависимая
переменная (Y) рассматривается как функция одного и то го же набора
факторов (X):



Набор факторов Х в каждом уравнении может варьировать. Отсутствие


того или иного фактора в уравнении системы может быть следствием как
экономической нецелесообразности его включения в модель, так и
несущественности его воздействия на результативный признак
(незначимость значения t-критерия или частного F-критерия для данного
фактора).
Каждое уравнение системы независимых уравнений может
рассматриваться самостоятельно. Для нахождения его параметров
используется обычный метод наименьших квадратов. По существу, каждое
уравнение этой системы является уравнением регрессии. Поскольку никогда
нет уверенности, что факторы полностью объясняют зависимые переменные,
то в уравнениях может присутствовать свободный член а0. Так как
фактические значения зависимой переменной отличаются от теоретических
на величину случайной ошибки, то в каждом уравнении присутствует
величина случайной ошибки.
2. Система рекурсивных уравнений, когда зависимая переменная
Y одного уравнения выступает в виде фактора в другом уравнении:

180
е
е
е

Как и в системе независимых уравнений, каждое рекурсивное


уравнение может рассматриваться самостоятельно, и его параметры
определяются методом наименьших квадратов (МНК).
3. Система взаимозависимых (совместных, одновременных)
уравнений (одни и те же зависимые переменные в одних уравнениях входят
в левую часть, а в других уравнениях - в правую часть системы):

е
е

В отличие от предыдущих систем каждое уравнение системы


одновременных уравнений не может рассматриваться самостоятельно, и для
нахождения его параметров традиционный МНК неприменим. С этой целью
используются специальные приемы оценивания.

9.1 Структурная и приведенная формы системы одновременных


уравнений (СОУ)

Структурная форма системы совместных (одновременных)


уравнений (9.3) обычно содержит эндогенные и экзогенные
(предопределенные) переменные:
- экзогенные, т.е. задаваемые как бы «извне», автономно, в
определенной степени управляемые (планируемые), могут быть «привязаны»
к прошлым, текущему или будущим моментам времени;
- эндогенные, т.е. такие переменные, значения которых
формируются в процессе и внутри функционирования анализируемой
социально-экономической системы в существенной мере под воздействием
экзогенных переменных и, конечно, во взаимодействии друг с другом; в
эконометрической модели они являются предметом объяснения;
- предопределенные, т.е. выступающие в системе в роли
факторов-аргументов, или объясняющих переменных.
Лаговые эндогенные переменные, т.е. такие эндогенные переменные,
значения которых входят в уравнения анализируемой эконометрической
системы измеренными в прошлые (по отношению к текущему) моменты
времени, а ,следовательно, являются уже известными, заданными.

181
Множество предопределенных переменных формируется на базе
экзогенных и лаговых эндогенных переменных.
Эконометрическая модель служит для объяснения поведения
эндогенных переменных в зависимости от значений экзогенных.
Классификация переменных на эндогенные и экзогенные зависит от
теоретической концепции принятой модели. Экономические переменные
могут выступать в одних моделях как эндогенные, а в других как экзогенные
переменные. Внеэкономические переменные (например, климатические
условия) входят в систему как экзогенныё переменные. В качестве
экзогенных переменных могут рассматриваться значения эндогенных
переменных за предшествующий период времени (лаговые переменные).
Например, потребление текущего года Yt может зависеть не только от ряда
экономических факторов, но и от уровня потребления в предыдущем
году Yt-1.
Свойства эндогенных переменных:
 Эндогенные переменные имеют обратные связи, которые
порождают проблему устойчивости экономической системы.
 Если экономическая система находится в устойчивом состоянии,
то изменение эндогенной переменной не способно изменить средние
динамические равновесные значения эндогенных переменных.
 Экзогенные переменные не зависят от деятельности системы, но
могут влиять на эндогенные переменные.
Свойства экзогенных переменных:
 Изменение одной или нескольких экзогенных переменных
приводит через несколько циклов к изменению средних динамических
значений эндогенных переменных (при условии нахождение экономической
системы в устойчивом состоянии).
 Прогнозные значения эндогенных переменных можно получить
только с помощью экзогенных переменных.
Структурная форма модели (9.3) позволяет увидеть влияние изменений
любой экзогенной переменной на значения эндогенной переменной.
Целесообразно в качестве экзогенных переменных выбирать такие
переменные, которые могут быть объектом регулирования. Меняя их и
управляя ими, можно заранее иметь целевые значения эндогенных
переменных.
Использование МНК для оценивания структурных коэффициентов
модели дает, как принято считать в теории, смещенные и несостоятельные
оценки. Поэтому обычно для определения структурных коэффициентов
модели (9.3) необходимо преобразовать ее в приведенную форму модели.
Приведенная форма модели представляет собой систему линейных
функций, связывающих эндогенные переменные с экзогенными:

182
где — коэффициенты приведенной формы модели.
По своему виду приведенная форма модели (9.4) ничем не отличается
от системы независимых уравнений (9.1), параметры которой оцениваются
традиционным МНК. Применяя МНК, можно оценить , а затем оценить
значения эндогенных переменных через элементарные преобразования
экзогенных.
Коэффициенты приведенной формы модели представляют собой
нелинейные функции коэффициентов структурной формы модели.
Эконометрические модели обычно включают в систему не только
уравнения, отражающие взаимосвязи между отдельными переменными, но и
выражения тенденции развития явления, а также разного рода тождества.

9.2 Проблема идентификации в системах одновременных


уравнений

Идентификация − это единственность соответствия между


приведенной (9.4) и структурной (9.3) формами модели.
С проблемой идентификации исследователь сталкивается при переходе
от приведенной формы модели к структурной.
С позиции идентифицируемости структурные модели можно
подразделить на три вида:
 идентифицируемые
 неидентифицируемые;
 сверхидентифицируемые.
Модель идентифицируема, если все структурные ее коэффициенты
определяются однозначно, единственным образом по коэффициентам
приведенной формы модели, т. е. если число параметров структурной модели
равно числу параметров приведенной формы модели. В этом случае
структурные коэффициенты модели оцениваются через параметры
приведенной формы модели и модель идентифицируема.
Модель неидентифицируема, если число приведенных коэффициентов
меньше числа структурных коэффициентов, и в результате структурные
коэффициенты не могут быть оценены через коэффициенты приведенной
формы модели.
Модель сверхидентифицируема, если число приведенных
коэффициентов больше числа структурных коэффициентов. В этом случае на
основе коэффициентов приведенной формы можно получить более одного
значений структурного коэффициента.
183
Структурная модель всегда представляет собой систему совместных
уравнений, каждое из которых требуется проверять на идентификацию.
Модель считается идентифицируемой, если каждое уравнение системы
идентифицируемо. Если хотя бы одно из уравнений системы
неидентифицируемо, то и вся модель считается неидентифицируемой.
Сверхидентифицируемая модель содержит хотя бы одно
сверхидентифицируемое уравнение.
Если обозначить число эндогенных переменных в j-м (j=1,…n)
уравнении системы через K, а число предопределенных переменных, которые
содержатся в системе, но не входят в данное уравнение, - через G, то
необходимое условие идентифицируемости уравнения модели (9.3) может
быть записано в виде следующего правила:
 Если G + 1 = K, то выполняется необходимое условие
идентифицируемости уравнения;
 Если, G + 1 < K , то не выполняется необходимое условие
идентифицируемости уравнения и, следовательно, уравнение
неидентифицируемо;
 Если, G + 1 > K , то выполняется необходимое условие
сверхидентифицируемости уравнения.
Рассмотренное правило отражает необходимое, но недостаточное
условие идентификации.
Более точно условия идентификации определяются, если накладывать
ограничения на коэффициенты матриц параметров структурной модели.
Достаточное условие идентифицируемости уравнения модели
(9.3): уравнение идентифицируемо, если по отсутствующим в нем
переменным (эндогенным и экзогенным) можно из коэффициентов при них в
других уравнениях системы получить матрицу, определитель которой не
равен нулю, а ранг матрицы не меньше, чем число эндогенных переменных в
системе без одного:

где n − число эндогенных переменных в системе.


Целесообразность проверки условия идентификации модели через
определитель матрицы коэффициентов, отсутствующих в данном уравнении,
но присутствующих в других, объясняется тем, что возможна ситуация когда
для каждого уравнения системы выполнено счетное правило, а определитель
матрицы названных коэффициентов равен нулю. В этом случае соблюдается
лишь необходимое, но недостаточное условие идентификации.
Пример9.1 Оценить структурную модель СОУ (Модель денежного
рынка) на идентификацию.

184
где
– процентная ставка;
− ВВП;
– денежная масса;
внутренние инвестиции,
– потребление,
– текущий период времени.
Решение.
Для преобразования и решения системы регрессионных уравнений
(9.6), необходимо произвести идентификацию трех уравнений.
Модель (9.6) имеет три эндогенных ( , , ) и две экзогенные ( )
переменные.
Проверим каждое уравнение модели на выполнение необходимого и
достаточного условий идентификации. Составим коэффициентов при
переменных модели:

Таблица 9.1 – Матрица коэффициентов при переменных модели (9.6)


Уравнение Переменные модели

–1 0 0
–1 0 0
0 –1 0 2

1−е уравнение.
Небходимое условие. Число эндогенных переменных K1 = 2 ( , ),
отсутствующих экзогенных G1 =1( ), откуда следует G1+1=1+1=K1=2,
следовательно, выполняется необходимое условие идентифицируемости
первого уравнения системы (9.6).
Достаточное условие. Построим матрицу коэффициентов при
переменных It , Ct , отсутствующих в первом уравнении, но присутствующих
во втором и третьем уравнениях:

Ранг матрицы rang A1=2, так как определитель матрицы

Следовательно, достаточное условие идентифицируемости первого


уравнения выполнено.

185
Таким образом, так как выполняются необходимое и достаточное
условия идентифицируемости, то первое уравнение – идентифицируемо.
2−е уравнение.
Необходимое условие. Число эндогенных переменных K2 = 3 ( , , ),
отсутствующих экзогенных переменных G2 =2 ( ), откуда следует
G2+1=2+1=K2=3, следовательно, выполняется необходимое условие
идентифицируемости второго уравнения системы (9.6).
Достаточное условие. Построим матрицу коэффициентов при
переменных , Ct , отсутствующих во втором уравнении, но
присутствующих в первом и третьем уравнениях:

Ранг матрицы rang A2=2, так как определитель матрицы

Следовательно, достаточное условие идентифицируемости второго


уравнения выполнено.
Таким образом, так как выполняются необходимое и достаточное
условия идентифицируемости, то второе уравнение – идентифицируемо.
3−е уравнение.
Небходимое условие. Число эндогенных переменных K1 = 2 ( , ),
отсутствующих экзогенных G1 =1( ), откуда следует G1+1=1+1=K1=2,
следовательно, выполняется необходимое условие идентифицируемости
третьего уравнения системы (9.6).
Достаточное условие. Построим матрицу коэффициентов при
переменных It , Rt , отсутствующих в третьем уравнении, но присутствующих
в первом и втором уравнениях:

Ранг матрицы rang A3=2, так как определитель матрицы

Следовательно, достаточное условие идентифицируемости третьего


уравнения выполнено.
Таким образом, так как выполняются необходимое и достаточное
условия идентифицируемости, то третье уравнение – идентифицируемо.

186
Таким образом, в модели все три уравнения идентифицируемы,
следовательно, система (9.6) идентифицируема.
Идентификация уравнений достаточно сложна и не ограничивается
только вышеизложенным. На структурные коэффициенты модели могут
накладываться и другие ограничения, например, в производственной
функции – сумма эластичностей может быть равна по предположению 1.
Могут накладываться ограничения на дисперсии и ковариации остаточных
величин.

9.3 Методы оценивания параметров структурной модели СОУ

Для оценки параметров модели (9.3) традиционный МНК неприменим.


С этой целью используются специальные приемы оценивания:
1. косвенный метод наименьших квадратов (КМНК);
2. двухшаговый метод наименьших квадратов (ДМНК);
3. трехшаговый метод наименьших квадратов (ТМНК);
4. метод максимального правдоподобия (ММП).
Косвенный метод наименьших квадратов применим для оценки
коэффициентов идентифицируемой структурной формы СОУ.
лгоритм (КМНК):
Составляют приведенную форму модели и определяют численные
значения параметров каждого ее уравнения методом наименьших квадратов.
Путем алгебраических преобразований переходят от приведенной
формы записи к уравнениям структурной формы модели.
Оценки полученные косвенным методом, будут несмещенными и
эффективными, так как в основе лежит МНК.
Двухшаговый метод наименьших квадратов применим для оценки
коэффициентов сверхидентифицируемой структурной формы СОУ.
лгоритм двухшагового МНК:
1. Составляют приведенную форму модели и оценивают ее параметры
обычным МНК.
2. Выявляют эндогенные переменные, находящиеся в правой части
структурной модели. Подставляют в каждое уравнение приведенной формы
соответствующее значение предопределенных переменных.
3. В исходных структурных уравнениях, заменить эндогенные
переменные, выступающие в качестве факторных признаков, их расчетными
значениями и применяя к каждому из полученных уравнений регрессии в
отдельности обычный МНК, определяют структурные параметры модели.
Трехшаговый метод наименьших квадратов используется в качестве
метода статистического оценивания параметров всех уравнений структурной
системы одновременных уравнений с учетом возможной взаимной
коррелированности регрессионных остатков различных уравнений этой
системы.
187
Таким образом, в первой части используется двухшаговый метод
наименьших квадратов для определения коэффициентов,вычисляют остатки.
Эти остатки используются для получения ковариационной матрицы
случайных остатков, которая в свою очередь, используется для вычисления
всех структурных коэффициентов с помощью обобщенного метода
наименьших квадратов.
Метод максимального правдоподобия – универсальный метод
оценивания, результаты которого при нормальном распределении признаков
совпадают с МНК. С точки зрения вычислений он гораздо более трудоемок
по сравнению со всеми рассмотренными выше методами оценивания.
Пример 9.2 Двухшаговым методом наименьших квадратов по данным,
представленным в таблице 9.2 оценить параметры системы одновременных
уравнений:

Таблица 9.2 – Данные к примеру 9.2


№ Y1 Y2 Y3 X1 X2 X3
1 510 35 110 230 45 85
2 500 23 104 220 40 90
3 490 14 95 200 36 75
4 480 12 90 240 45 95
5 550 65 120 220 28 64
6 560 70 125 270 50 90
7 530 24 170 250 55 104
8 580 90 186 240 52 108
9 590 96 193 200 36 80
10 575 83 165 210 44 89
11 545 57 187 235 48 100
12 530 34 156 243 52 110
13 520 28 110 265 54 100
14 530 33 120 277 58 115
15 550 67 115 280 60 130
16 565 77 145 290 64 125
17 587 96 179 300 66 137
18 594 100 190 320 67 140
19 600 110 196 330 68 147
20 610 105 200 335 70 150
Решение.
1) Проверяем каждое уравнение на идентификацию. Для первого и
второго уравнений системы выполняется необходимое условие

188
идентифицируемости, а для третьего выполняется необходимое условие
сверхидентифицируемости. Поэтому система одновременных уравнений
(СОУ) сверхидентифицируема.
2) Для оценки параметров уравнений системы применяем
двухшаговый метод наименьших квадратов (ДМНК):
- Составим приведенную форму СОУ:

3) Определим методом наименьших квадратов параметры


первого уравнения приведенной модели:

Коэффициенты Стандартная ошибка t-статистика P-Значение


430,20 55,79 7,71 0,00
0,33 0,51 0,65 0,52
-2,33 2,69 -0,87 0,40
1,46 1,22 1,19 0,25
Рисунок 9.1 – Результаты корреляционно-регрессионного анализа

Анализ результатов корреляционно-регрессионного анализа (рисунок


9.1) позволяет записать уравнение регрессии с найденными оценками:

4) Определим методом наименьших квадратов параметры


второго уравнения приведенной модели:

Коэффициенты Стандартная ошибка t-статистика P-Значение


-41,72 48,41 -0,86 0,40
0,36 0,44 0,83 0,42
-3,14 2,33 -1,35 0,20
1,61 1,06 1,52 0,15
Рисунок 9.2 – Результаты корреляционно-регрессионного анализа

Анализ результатов корреляционно-регрессионного анализа (рисунок


9.2) позволяет записать уравнение регрессии с найденными оценками:

189
5) Определим методом наименьших квадратов параметры
второго уравнения приведенной модели:

Коэффициенты Стандартная ошибка t-статистика P-Значение


104,01 57,44 1,81 0,09
-0,44 0,52 -0,85 0,41
-1,00 2,77 -0,36 0,72
1,97 1,26 1,57 0,14
Рисунок 9.3 – Результаты корреляционно-регрессионного анализа
в Microsoft Excel с помощью Данные→ нализ данных→Регрессия

Анализ результатов корреляционно-регрессионного анализа (рисунок


9.3) позволяет записать уравнение регрессии с найденными оценками:

6) По формулам (9.15), (9.17) и (9.19) вычислим расчетные значения


эндогенных переменных: и (см. Таблицу 9.3):

Таблица 9.3 – Вычисление эндогенных переменных: и по


данным примера 9.2 и формулам (9.15), (9.17) и (9.19)
Y1 Y2 Y3 X1 X2 X3
510 35 110 230 45 85 525,106 37,566 124,297
500 23 104 220 40 90 540,727 57,676 143,587
490 14 95 200 36 75 521,596 38,800 126,931
480 12 90 240 45 95 542,967 57,308 139,553
550 65 120 220 28 64 530,792 53,461 104,438
560 70 125 270 50 90 533,941 44,469 111,400
530 24 170 250 55 104 536,097 44,055 142,809
580 90 186 240 52 108 545,607 56,277 158,124
590 96 193 200 36 80 528,878 46,853 136,775
575 83 165 210 44 89 526,663 39,876 142,037
545 57 187 235 48 100 541,617 54,128 148,603
530 34 156 243 52 110 549,509 60,589 160,732
520 28 110 265 54 100 537,546 46,204 129,290
530 33 120 277 58 115 554,038 62,172 149,491
550 67 115 280 60 130 572,218 81,145 175,687
565 77 145 290 64 125 558,924 64,174 157,399
587 96 179 300 66 137 575,043 80,860 174,587
594 100 190 320 67 140 583,680 89,824 170,628
600 110 196 330 68 147 594,845 101,596 178,974
610 105 200 335 70 150 596,208 101,968 180,659
190
7) Определим структурные коэффициенты первого уравнения
структурной модели СОУ (9.13):

но в качестве теоретических значений факторных переменных и ,


находящихся в правой части уравнения, будем использовать расчетные
значения и (см. Рисунок 9.4):

Коэффициенты Стандартная ошибка t-статистика P-Значение


440,01 84,58 5,20 0,00
0,68 0,97 0,71 0,49
0,18 0,62 0,29 0,78
0,16 0,36 0,45 0,66
Рисунок 9.4 – Результаты корреляционно-регрессионного анализа

Анализ результатов корреляционно-регрессионного анализа (рисунок


9.4) позволяет записать уравнение регрессии с найденными оценками:

8) Определим структурные коэффициенты второго уравнения модели


(9.13):

но в качестве теоретических значений факторных переменных и ,


находящихся в правой части уравнения, будем использовать расчетные
значения и (см. Рисунок 9.5):

Коэффициенты Стандартная ошибка t-статистика P-Значение


-516,88 294,32 -1,76 0,10
1,10 0,68 1,62 0,12
0,001 0,62 0,00 1,00
-0,57 1,14 -0,50 0,63
Рисунок 9.5 – Результаты корреляционно-регрессионного анализа

Анализ результатов корреляционно-регрессионного анализа (рисунок


9.5) позволяет записать уравнение регрессии с найденными оценками:

191
9) Определим структурные коэффициенты третьего уравнения модели
(9.13):

но в качестве теоретических значений переменной , находящейся в


правой части уравнения (9.24), будем использовать расчетные значения
(см. Рисунок 9.6):

Коэффициенты Стандартная ошибка t-статистика P-Значение


62,09 37,44 1,66 0,12
0,09 0,86 0,10 0,92
0,75 0,70 1,08 0,30
Рисунок 9.6 – Результаты корреляционно-регрессионного анализа

Анализ результатов корреляционно-регрессионного анализа (рисунок


9.6) позволяет записать уравнение регрессии с найденными оценками:

10) Объединяя три полученных регрессионных уравнения (9.21), (9.23)


и (9.25) в одну систему, получим систему одновременных уравнений с
найденными оценками параметров:

Лабораторная работа №13


Задание. Используя исходные данные Приложения 9 согласно №
варианта:
1) определить множество эндогенных, предопределенных и
экзогенных переменных модели;
2) проверить выполнение необходимого и достаточного условия
идентификации для каждого регрессионного уравнения системы;
3) определить возможный метод оценки параметров структурной
формы системы одновременных уравнений;
4) построить приведенную форму системы одновременных
уравнений и методом наименьших квадратов оценить ее параметры;
5) двухшаговым (для сверхидентифицированной СОУ) или
косвенным (для идентифицированной СОУ) методом наименьших
квадратов найти оценки параметров структурной формы системы
одновременных уравнений;

192
6) оценить статистическую значимость каждого регрессионного
уравнения структурной формы системы одновременных уравнений и их
параметров.

Лабораторная работа №14


Используя исходные данные Приложения 10 согласно № варианта, оценить
двухшаговым методом наименьших квадратов параметры структурной
формы системы одновременных уравнений

Тесты по теме
Системы эконометрических уравнений

1. Эндогенные переменные ...


 могут коррелировать с ошибками регрессии
 не зависят от экзогенных переменных
 влияют на экзогенные переменные
 могут быть объектом регулирования

2. Для оценки коэффициентов структурной формы модели не


применяют метод наименьших квадратов...
 косвенный
 трехшаговый
 обычный
 двухшаговый

3. Идентификация модели – это:


 единственность соответствия между приведенной и структурной
формами модели
 преобладание эндогенных переменных над экзогенными
 преобладание экзогенных переменных над эндогенными

4. Модель идентифицируема, если:


 число коэффициентов структурной модели равно числу
коэффициентов приведенной формы модели
 число приведенных коэффициентов меньше числа структурных
коэффициентов
 число приведенных коэффициентов больше числа структурных
коэффициентов

5. Модель неидентифицируема, если:


 число коэффициентов структурной модели равно числу
коэффициентов приведенной формы модели

193
 число приведенных коэффициентов меньше числа структурных
коэффициентов
 число приведенных коэффициентов больше числа структурных
коэффициентов
6. Модель сверхидентифицируема, если:
 число коэффициентов структурной модели равно числу
коэффициентов приведенной формы модели
 число приведенных коэффициентов меньше числа структурных
коэффициентов
 число приведенных коэффициентов больше числа структурных
коэффициентов

7. Структурные коэффициенты модели можно оценить тогда, когда:


 модель идентифицируема
 модель неидентифицируема
 модель сверхидентифицируема
 модель идентифицируема или сверхидентифицируема

8. Методы оценивания коэффициентов структурной модели:


 косвенный метод наименьших квадратов (МНК)
 двухшаговый и трехшаговый МНК
 метод максимального правдоподобия
 метод максимального правдоподобия, косвенный МНК,
двухшаговый и трехшаговый МНК

9. Предопределенные переменные включают в себя:


 экзогенные переменные, определенные внешними для данной
модели факторами
 экзогенные переменные и лаговые эндогенные переменные
 эндогенные переменные
 эндогенные переменные и лаговые экзогенные переменные

10. Для точно идентифицированных уравнений двухшаговый метод


наименьших квадратов (МНК) дает оценки:
 одинаковые с косвенным МНК
 лучше, чем косвенный МНК
 хуже, чем косвенный МНК

11. Необходимым условием идентифицируемости системы


взаимозависимых регрессионных уравнений является:
 число априорных ограничений должно быть больше числа
уравнений модели

194
 число априорных ограничений должно быть не меньше числа
уравнений модели, уменьшенного на единицу
 число априорных ограничений должно быть равно числу
уравнений модели, уменьшенного на единицу
 число априорных ограничений должно быть равно числу
неизвестных параметров в модели

12. Количество уравнений системы эконометрических уравнений


равно:
 числу экзогенных переменных;
 числу предопределённых переменных;
 числу эндогенных переменных;
 числу случайных возмущений.

13. Если все текущие эндогенные переменные выражены через


предопределенные переменные, то СОУ представлена
 в приведённой форме;
 в структурной форме;
 в форме открытой модели;
 в форме закрытой модели.

14. Cистема независимых эконометрических уравнений


 решается двухшаговым МНК
 решается косвенным МНК
 решается обычным МНК
 решается трехшаговым МНК

15. В правой части приведенной формы системы одновременных


уравнений, построенной по перекрестным данным (cross-section data) без
учета временных факторов, могут стоять _______ переменные.
 лаговые
 зависимые
 эндогенные
 экзогенные

16. Методы оценки идентифицированной системы одновременных


уравнений
 косвенный МНК
 обычный МНК
 обобщенный МНК
 метод моментов
17. Методы оценки сверхидентифицированной системы
одновременных уравнений
195
 косвенный МНК
 обычный МНК
 обобщенный МНК
 двухшаговый МНК

18. Экзогенные переменные - это


 взаимозависимые переменные системы одновременных
уравнений, определяемые внутри модели
 независимые переменные системы одновременных уравнений,
определяемые вне модели
 переменные системы одновременных уравнений, известные к
расчетному моменту времени

19. Эндогенные переменные в предшествовавшие моменты времени


называются
 лаговыми переменными
 предопределенными переменными
 тождественными переменными
 экзогенными переменными

Вопросы для самопроверки

1. В чем заключается необходимость использования систем эконометрических


уравнений, а не отдельных уравнений?
2. Назовите возможные формы представления систем эконометрических уравнений.
3. Методы оценки параметров системы независимых эконометрических уравнений.
4. Методы оценки параметров системы рекурсивных эконометрических уравнений.
5. Какие переменные в системах одновременных уравнений называются
эндогенными?
6. Какие переменные в системах одновременных уравнений называются
экзогенными?
7. Какие переменные в системах одновременных уравнений называются
предопределенными?
8. Сформулируйте методы оценки параметров эконометрических систем уравнений.
9. Как связаны между собой структурная и приведённая формы системы
одновременных уравнений?
10. Сформулируйте необходимое условие идентификации структурной формы
системы одновременных уравнений.
11. Сформулируйте достаточное условие идентификации структурной формы системы
одновременных уравнений.
12. В чём суть косвенного метода наименьших квадратов?
13. В какой ситуации применяется двухшаговый метод наименьших квадратов?
14. Каков алгоритм двухшагового метода наименьших квадратов?
15. Как определить идентифицируемость системы одновременных уравнений в целом
на основе информации об идентифицируемости ее отдельных уравнений?
16. В чем сущность трехшагового МНК при идентификации системы одновременных
уравнений?
17. В чем сущность метода максимального правдоподобия?
196
10. Типологическая регрессия. Кластерный анализ

При анализе и прогнозировании социально-экономических явлений


исследователь довольно часто сталкивается с многомерностью их описания.
Это происходит при решении задачи сегментирования рынка, построении
типологии стран по достаточно большому числу показателей,
прогнозирования конъюнктуры рынка отдельных товаров, изучении и
прогнозировании экономической депрессии и многих других проблем.
Методы многомерного анализа - наиболее действенный
количественный инструмент исследования социально-экономических
процессов, описываемых большим числом характеристик.
При построении эконометрических моделей необходимо
предварительно провести качественный анализ статистической информации,
так как регрессионные модели адекватно отражают реальные взаимосвязи
лишь при условии однородности исходных данных.
Предположим, что в качестве исходной информации используются
данные по нескольким объектам (предприятиям, регионам, областям, фирмам
и т.д.) за один и тот же период (на один и тот же момент) времени. Для
получения содержательной интерпретации оценок параметров регрессии
корректно еще до проведения корреляционно-регрессионного анализа
выделить однородные группы (классы, типы) данных и затем решать
поставленные задачи для каждого отдельного класса. Например, в качестве
типологических групп можно определить кластеры крупных, средних и
мелких объектов по своим масштабам.
Типологическая группировка необходима, т.к. в различных
однородных группах объектов одни и те же факторы влияют на
результативный признак в разной степени и возможно даже в разных
направлениях.
Аналогичные трудности возникают при построении единой регрессии
на временных рядах по неоднородной информации, т.к. в этом случае не
учитываются инфляционные процессы, технический прогресс, структурные
сдвиги и т.д.
Уравнения регрессии, построенные по отдельным однородным
подгруппам наблюдений, называют типологическими регрессиями25.
Кластерный анализ — это совокупность методов, позволяющих
классифицировать многомерные наблюдения, каждое из которых
описывается набором признаков (параметров) 1, 2, ..., k.
елью кластерного анализа является образование групп схожих между
собой объектов, которые принято называть кластерами (класс, таксон,
сгущение).

25
Мхитарян В.С. Эконометрика: учебно-практическое пособие/ В.С. Мхитарян, М.Ю. Архипова, В.П.
Сиротин. – М.: ЕАОИ, 2012. – С.148.
197
Кластерный анализ — одно из направлений статистического
исследования. Особо важное место он занимает в тех отраслях науки,
которые связаны с изучением массовых явлений и процессов.
Первое применение кластерный анализ нашел в социологии. Название
кластерный анализ происходит от английского слова cluster – гроздь,
скопление. Впервые в 1939 был определен предмет кластерного анализа и
сделано его описание исследователем Трионом.26 Главное назначение
кластерного анализа – разбиение множества исследуемых объектов и
признаков на однородные в соответствующем понимании группы или
кластеры. Это означает, что решается задача классификации данных и
выявления соответствующей структуры в ней.
Необходимость развития методов кластерного анализа и их
использования продиктована тем, что они помогают построить научно
обоснованные классификации, выявить внутренние связи между единицами
наблюдаемой совокупности. Кроме того, методы кластерного анализа
позволяют рассматривать достаточно большой объем информации и резко
сокращать, сжимать большие массивы социально-экономической
информации, делать их компактными и наглядными.
Методы кластерного анализа позволяют решать следующие задачи:
– проведение классификации объектов с учетом признаков,
отражающих сущность, природу объектов с целью углубления знаний о
совокупности классифицируемых объектов;
– проверка выдвигаемых предположений о наличии некоторой
структуры в изучаемой совокупности объектов;
– построение новых классификаций для слабоизученных явлений с
целью установления наличия связей внутри совокупности.
Кластерный анализ имеет определенные недостатки и ограничения: В
частности, состав и количество кластеров зависит от выбираемых критериев
разбиения. При сведении исходного массива данных к более компактному
виду могут возникать определенные искажения, а также могут теряться
индивидуальные черты отдельных объектов за счет замены их
характеристиками обобщенных значений параметров кластера. При
проведении классификации объектов игнорируется очень часто возможность
отсутствия в рассматриваемой совокупности каких-либо значений
кластеров.
ель кластерного анализа − на основании данных, содержащихся во
множестве , разбить множество объектов G на m (m – целое) кластеров
(подмножеств) Q1, Q2, …, Qm, так, чтобы каждый объект Gj принадлежал
одному и только одному подмножеству разбиения и чтобы объекты,
принадлежащие одному и тому же кластеру, были сходными, в то время, как
объекты, принадлежащие разным кластерам были разнородными.
Решением кластерного анализа являются разбиения, удовлетворяющие
некоторому критерию оптимальности. Этот критерий может представлять
26
Tryon R.C. Cluster analysis. — London: Ann Arbor Edwards Bros, 1939.
198
собой некоторый функционал (целевая функция), выражающий уровни
желательности различных разбиений и группировок.
Для решения задачи кластерного анализа необходимо определить
понятия сходства и разнородности.
Попадание в один или разные кластеры объектов определяется
понятием расстояния между  и j из р-мерного евклидова пространства.
Наиболее часто в кластерном анализе используются следующие
расстояния и меры близости:
– обобщенное («взвешенное») расстояние Махаланобиса:

е
Σ – ковариационная матрица, соответствующая вектору ;
∆ − симметричная неотрицательно-определенная матрица «весовых
коэффициентов» (диагональная);
– обычное Евклидово расстояние:

– «взвешенное» Евклидово расстояние:

– Хеммингово расстояние:

Евклидова метрика является наиболее популярной.


Пусть n измерений 1, 2,..., n представлены в виде матрицы данных
размером p  n:

199
Тогда расстояние между парами векторов ρ( , j) могут быть
представлены в виде симметричной матрицы расстояний:

Понятием, противоположным расстоянию, является понятие сходства


между объектами G. и Gj. Неотрицательная вещественная функция S(  ; j)
= Sj называется мерой сходства, если :
1) 0 S( i , j)1 для   j
2) S( i , i) = 1
3) S( i , j) = S( j , )
Пары значений мер сходства можно объединить в матрицу сходства:

Величину Sij называют коэффициентом сходства.


Наиболее известный метод представления матрицы расстояний или
сходства основан на идее дендрограммы или диаграммы дерева.
Дендрограмму можно определить как графическое изображение результатов
процесса последовательной кластеризации, которая осуществляется в
терминах матрицы расстояний. С помощью дендрограммы можно
графически или геометрически изобразить процедуру кластеризации при
условии, что эта процедура оперирует только с элементами матрицы
расстояний или сходства.
Значения расстояний или сходства, отвечающие строению новых
кластеров, изображаются по горизонтальной прямой поверх дендрограмм
(см. Рисунок 1.1 – 1.4).
Способы построения (sorting strategies) дендрограмм27:
1. Метод одиночной связи (single linkage) (метод «ближайшего
соседа»):

27
Классификация и кластер. Под ред. Дж. Вэн Райзина. М.: Мир, 1980. 390 с.
200
2. Метод полной связи (complete linkage) (метод «дальнего
соседа»:

3. Метод средней связи (pair-group method using arithmetic


averages):

4. Центроидный метод (pair-group method using the centroid


average) (метод «центра тяжести»):

5. Метод Уорда (Ward’s method).


В методе Уорда в качестве целевой функции применяют
внутригрупповую сумму квадратов отклонений, которая есть ни что иное,
как сумма квадратов расстояний между каждой точкой (объектом) и средней
по кластеру, содержащему этот объект. На каждом шаге объединяются такие
два кластера, которые приводят к минимальному увеличению целевой
функции, т.е. внутригрупповой суммы квадратов. Этот метод направлен на
объединение близко расположенных кластеров.
По методу «центра тяжести» расстояние между двумя кластерами
определяется как евклидово расстояние между центрами (средними) этих
кластеров. Кластеризация идет поэтапно на каждом из n–1 шагов объединяют
два кластера имеющие минимальное значение расстояния между классами.
Иногда этот метод иногда называют еще методом взвешенных групп.
Колмогоров А.Н. предложил «обобщенное расстояние» между
классами, которое включает в себя в качестве частных случаев все
рассмотренные виды расстояний (10.8 – 10.11).
При этом расстояние между классами и ( – объединение
двух других классов и ) определяется по формуле:

где
– , , − расстояния
между классами , и .
– α, β, δ, – числовые коэффициенты, значения которых
определяют специфику процедуры, ее алгоритм.
201
По принципу «ближайшего соседа»: α=β=-δ=1/2, =0:

По принципу «дальнего соседа»: α=β=δ=1/2, =0:

Важным вопросом является проблема выбора необходимого числа


кластеров m. Можно число кластеров выбирать априорно. Однако в общем
случае это число определяется в процессе разбиения множества на кластеры.
Проводились исследования Фортьером и Соломоном, и было
установлено, что число кластеров должно быть принято для достижения
вероятности  того, что найдено наилучшее разбиение. Таким образом,
оптимальное число разбиений является функцией заданной доли 
наилучших или в некотором смысле допустимых разбиений во множестве
всех возможных. Общее рассеяние будет тем больше, чем выше доля 
допустимых разбиений.
Фортьер и Соломон разработали таблицу, по которой можно найти
число необходимых разбиений. S( в зависимости от  и  (где  -
вероятность того, что найдено наилучшее разбиение,  - доля наилучших
разбиений в общем числе разбиений)
Причем в качестве меры разнородности используется не мера
рассеяния, а мера принадлежности, введенная Хользенгером и Харманом.
Таблица значений S( ) приводится ниже.

Таблица 10.1 −Значения числа необходимых разбиений S( )


\ 0.20 0.10 0.05 0.01 0.001 0.0001
0.20 8 11 14 21 31 42
0.10 16 22 29 44 66 88
0.05 32 45 59 90 135 180
0.01 161 230 299 459 689 918
0.001 1626 2326 3026 4652 6977 9303
0.0001 17475 25000 32526 55000 75000 100000

Довольно часто критерием объединения (числа кластеров) становится


изменение соответствующей функции. Например, суммы квадратов
отклонений:
202
Процессу группировки должно соответствовать здесь
последовательное минимальное возрастание значения критерия E. Наличие
резкого скачка в значении E можно интерпретировать как характеристику
числа кластеров, объективно существующих в исследуемой совокупности.
Итак, второй способ определения наилучшего числа кластеров
сводится к выявлению скачков, определяемых фазовым переходом от сильно
связанного к слабосвязанному состоянию объектов.
Иерархические (древообразные) процедуры являются наиболее
распространенными для реализации на ЭВМ алгоритмами кластерного
анализа.
Иерархические процедуры бывают:
– агломеративные (начальным является разбиение, состоящее из n
одноэлементных классов, а конечным – из одного класса);
– дивизимные (начальным является разбиение, состоящее из одного
класса, а конечным – из n одноэлементных классов).
Принцип работы иерархических агломеративных (дивизимных)
процедур состоит в последовательном объединении (разделении) групп
элементов сначала самых близких (далеких), а затем все более отдаленных
(близких) друг от друга. Большинство иерархических процедур исходит из
матрицы расстояний (сходств).
В качестве примера рассмотрим агломеративный иерархический
алгоритм. На первом шаге алгоритма каждый объект рассматривается как
отдельный кластер. В дальнейшем на каждом шаге работы алгоритма
объединяем самые близкие кластеры, с учетом принятого расстояния
пересчитываем матрицу расстояний с размерностью на единицу ниже.
Пример10.1 По данным, представленным в таблице 10.2 провести
классификацию областей Южного Федерального округа в 2000 г. по
иерархическому агломеративному алгоритму с использованием обычного
евклидова расстояния и принципов:
– «ближайшего соседа»
– «дальнего соседа»;
– «центра тяжести»;
– «средней связи»,
по двум показателям:
потребительские расходы в среднем на душу населения в месяц,
руб.
среднедушевые денежные доходы населения в месяц, руб.

203
Таблица 10.2− Исходные данные для классификации
№ 1 2 3 4 5 6
Республика Республика Волгоградская Астраханская Краснодарский Ростовская
Область Калмыкия Адыгея область область край область
502 761 949 1157 1362 1390
979 1185 1300 1779 1563 1653
Сравнить полученные результаты и обосновать окончательный вариант
классификации.
Решение.
1. Проведем предварительный анализ, построив точечную диаграмму:

1800

1700

1600

1500

1400

1300

1200

1100

1000

900

800
400 500 600 700 800 900 1000 1100 1200 1300 1400

Рисунок 10.1 – Точечная диаграмма по данным примера 10.1

Анализ рисунка 10.1 позволяет сделать предположение о том, что


первые три области принадлежат одной типологической группе, а другие три
области – другой.

2. Проведем классификацию, выбрав при обычном евклидовом


расстоянии принцип «ближайшего соседа».
Вычислим евклидовы расстояния между объектами с номерами 1 и 2:

Аналогично находим расстояния между всеми объектами:

204
.

Строим матрицу расстояний (см. Таблицу 10.2):


Таблица 10.3 – Матрица расстояний между шестью объектами
(областями ЮФО)
1 2 3 4 5 6
1 0 330,93 550,32 1033,94 1039,55 1114,82
2 330,93 0 220,38 713,90 709,99 784,01
3 550,32 220,38 0 522,21 489,63 564,88
4 1033,94 713,90 522,21 0 297,79 264,89
5 1039,55 709,99 489,63 297,79 0 94,25
6 1114,82 784,01 564,88 264,89 94,25 0

Из анализа значений таблицы10.3 можно сделать вывод о том, что


наиболее близкими объектами являются объекты с номерами 5 и 6, т.к.
– наименьшее. Поэтому можно объединить объекты с номерами
5 и 6 в один кластер . После объединения получим пять кластеров (см.
Таблицу 10.4).

Таблица 10.4 – Состав кластеров после первого объединения


Кластер 1 2 3 4 5

Объекты 1 2 3 4 5, 6

Расстояние между кластерами определим по принципу «ближайшего


соседа»:

205
Таблица 10.5 – Матрица расстояний между пятью кластерами после
первого объединения
1 2 3 4 5
1 0 330,93 550,32 1033,94 1039,55
2 330,93 0 220,38 713,90 709,99
3 550,32 220,38 0 522,21 489,63
4 1033,94 713,90 522,21 0 264,89
5 1039,55 709,99 489,63 264,89 0

Из анализа значений таблицы10.5 можно сделать вывод о том, что


наиболее близкими кластерами являются кластеры с номерами 2 и 3, т.к.
– наименьшее. Поэтому можно объединить кластеры с
номерами 2 и 3 в один кластер .
После второго объединения получим четыре кластера (см. Таблицу
10.6).

Таблица 10.6 – Состав кластеров после второго объединения


Кластер 1 2 3 4

Объекты 1 2, 3 4 5, 6

Расстояние между кластерами определим по принципу «ближайшего


соседа»:

3(5,6)=709,992+489,632 12 709,99 489,63=489,63.

Таблица 10.7 – Матрица расстояний между четырьмя кластерами


после второго объединения
1 2 3 4
1 0 1033,94
2 0
3 1033,94 0
4 0

206
Из анализа значений таблицы10.7 можно сделать вывод о том, что
наиболее близкими кластерами являются кластеры с номерами 3 и 4, т.к.
– наименьшее. Поэтому можно объединить кластеры с
номерами 3 и 4 в один кластер .
После третьего объединения получим три кластера (см. Таблицу 10.8).

Таблица 10.8 – Состав кластеров после третьего объединения


Кластер 1 2 3

Объекты 1 2,3 4, 5, 6

Расстояние между кластерами определим по принципу «ближайшего


соседа»:

2,3,(5,6)=522,212+489,632 12 522,21 489,63=489,63.

Таблица 10.9 – Матрица расстояний между тремя кластерами после


третьего объединения
1 2 3
1 0
2 0
3 0

Из анализа значений таблицы10.9 можно сделать вывод о том, что


наиболее близкими кластерами являются кластеры с номерами 1 и 2, т.к.
– наименьшее. Поэтому можно объединить кластеры с
номерами 1 и 2 в один кластер .
После четвертого объединения останется окончательно два кластера
(см. Таблицу 10.10).

Таблица 10.10 – Состав кластеров после четвертого объединения


Кластер 1 2

Объекты 1, 2, 3 4, 5, 6

Расстояние между кластерами определим по принципу «ближайшего


соседа»:

207
.

Таблица 10.11 – Матрица расстояний между двумя кластерами после


четвертого объединения
1 2
1 0
2 0
Из матрицы следует, что на расстоянии шесть
объектов (областей) объединяются в один кластер.
Результат кластерного анализа представим графически в виде
дендрограммы:

Рисунок 10.2 – Дендрограмма кластерного анализа при


обычном евклидовом расстоянии по принципу «ближайшего соседа»

3. Проведем классификацию, выбрав при обычном евклидовом


расстоянии принцип «дальнего соседа».
Как в предыдущем решении используется обычное евклидово
расстояние, поэтому матрица расстояний остается прежней (см. Таблицу
10.3). Наиболее близкими кластерами являются объекты с номерами 5 и 6,
т.к. – наименьшее. Поэтому объединяем объекты с номерами 5 и
6 в один кластер . После объединения получаем пять кластеров (см.
Таблицу 10.4).
Расстояние между кластерами определим по принципу «дальнего
соседа»:

;
208
;

Таблица 10.12 – Матрица расстояний между пятью кластерами


после первого объединения
1 2 3 4 5
1 0 330,93 550,32 1033,94
2 330,93 0 220,38 713,90
3 550,32 220,38 0 522,21
4 1033,94 713,90 522,21 0
5 0

Из анализа значений таблицы10.12 можно сделать вывод о том, что


наиболее близкими кластерами являются кластеры с номерами 2 и 3, т.к.
– наименьшее. Поэтому можно объединить кластеры с
номерами 2 и 3 в один кластер .
После второго объединения получим четыре кластера (см. Таблицу
10.13).

Таблица 10.13 – Состав кластеров после второго объединения


Кластер 1 2 3 4

Объекты 1 2, 3 4 5, 6

Расстояние между кластерами определим по принципу «дальнего


соседа»:

;
209
3(5,6)=784,012+564,882+12 784,01 564,88=784,01.

Таблица 10.14 – Матрица расстояний между четырьмя кластерами


после второго объединения
1 2 3 4
1 0 1033,94
2 0
3 1033,94 0
4 0

Из анализа значений таблицы10.14 можно сделать вывод о том, что


наиболее близкими кластерами являются кластеры с номерами 3 и 4, т.к.
– наименьшее. Поэтому можно объединить кластеры с
номерами 3 и 4 в один кластер .
После третьего объединения получим три кластера (см. Таблицу 10.8).
Расстояние между кластерами определим по принципу «дальнего
соседа»:

2,3,(5,6)=713,902+489,632 12 713,90 784,01=784,01.

Таблица 10.15 – Матрица расстояний между тремя кластерами после


третьего объединения
1 2 3
1 0
2 0
3 0

Из анализа значений таблицы10.15 можно сделать вывод о том, что


наиболее близкими кластерами являются кластеры с номерами 1 и 2, т.к.
– наименьшее. Поэтому можно объединить кластеры с
номерами 1 и 2 в один кластер .
После четвертого объединения останется окончательно два кластера
(см. Таблицу 10.10).
Расстояние между кластерами определим по принципу «дальнего
соседа»:

210
Таблица 10.16 – Матрица расстояний между двумя кластерами после
четвертого объединения
1 2
1 0
2 0

Из матрицы следует, что на расстоянии


шесть объектов (областей) объединяются в один кластер.
Результат кластерного анализа представим графически в виде
дендрограммы:

Рисунок 10.3 – Дендрограмма кластерного анализа при


обычном евклидовом расстоянии по принципу «дальнего соседа»

4. Проведем классификацию, выбрав при обычном евклидовом


расстоянии принцип «центра тяжести».
Так как используется обычное евклидово расстояние, то матрица
расстояний остается без изменения (см. Таблицу 10.3). Наиболее
близкими кластерами являются объекты с номерами 5 и 6, т.к. –

211
наименьшее. Поэтому объединяем объекты с номерами 5 и 6 в один кластер
. После объединения получаем пять кластеров (см. Таблицу 10.4).
Расстояние между кластерами определим по принципу «центра
тяжести». Кластер характеризуется далее его «центром тяжести»

Расстояние от этого кластера до первого объекта:

Аналогично находим расстояния от этого кластера до других объектов:

Тогда матрица расстояний между кластерами будет иметь вид (см.


Таблицу 10.17):

Таблица 10.17 – Матрица расстояний между пятью кластерами


после первого объединения
1 2 3 4 5
1 0 330,93 550,32 1033,94
2 330,93 0 220,38 713,90
3 550,32 220,38 0 522,21
4 1033,94 713,90 522,21 0
5 0

Из анализа значений таблицы10.17 можно сделать вывод о том, что


наиболее близкими кластерами являются кластеры с номерами 2 и 3, т.к.
– наименьшее. Поэтому можно объединить кластеры с
номерами 2 и 3 в один кластер .
Кластер характеризуется далее его «центром тяжести»:

212
После второго объединения получим четыре кластера (см. Таблицу
10.6).Расстояние между кластерами определим по принципу «центра
тяжести»:
;

Таблица 10.18 – Матрица расстояний между четырьмя кластерами


после второго объединения
1 2 3 4
1 0 1033,94
2 0
3 1033,94 0
4 0

Из анализа значений таблицы10.18 можно сделать вывод о том, что


наиболее близкими кластерами являются кластеры с номерами 3 и 4, т.к.
– наименьшее. Поэтому можно объединить кластеры с
номерами 3 и 4 в один кластер .
После третьего объединения получим три кластера (см. Таблицу 10.19).
Кластер характеризуется далее его «центром тяжести»:

Таблица 10.19 – Состав кластеров после третьего объединения


Кластер 1 2 3

Объекты 1 2, 3 4, 5, 6

213
Расстояние между кластерами определим по принципу «центра
тяжести»:

Таблица 10.20 – Матрица расстояний между тремя кластерами после


третьего объединения
1 2 3
1 0
2 0
3 0

Из анализа значений таблицы10.20 можно сделать вывод о том, что


наиболее близкими кластерами являются кластеры с номерами 1 и 2, т.к.
– наименьшее. Поэтому можно объединить кластеры с
номерами 1 и 2 в один кластер .
Кластер характеризуется далее его «центром тяжести»:

Таблица 10.21 – Состав кластеров после третьего объединения


Кластер 1 2

Объекты 1, 2, 3 4, 5, 6

Расстояние между кластерами определим по принципу «центра


тяжести»:

Таблица 10.22 – Матрица расстояний между двумя кластерами после


четвертого объединения
1 2
1 0
2 0
214
Из матрицы следует, что на расстоянии
шесть объектов (областей) объединяются в один кластер.
Результат кластерного анализа представим графически в виде
дендрограммы:

Рисунок 10.3 – Дендрограмма кластерного анализа при


обычном евклидовом расстоянии по принципу «центра тяжести»

5. Проведем классификацию, выбрав при обычном евклидовом


расстоянии принцип «средней связи».
Используя матрицу расстояний (см. Таблицу 10.3) согласно
агломеративному алгоритму объединим объекты с номерами 5 и 6 в кластер
, т.к. – наименьшее. После объединения получим пять
кластеров (см. Таблицу 10.4).
Расстояние от кластера до остальных кластеров определим,
используя принцип «средней связи»:

215
.

Таблица 10.23 – Матрица расстояний между пятью кластерами


после первого объединения
1 2 3 4 5
1 0 330,93 550,32 1033,94
2 330,93 0 220,38 713,90 ,00
3 550,32 220,38 0 522,21
4 1033,94 713,90 522,21 0
5 ,00 0

Из анализа значений таблицы10.23 можно сделать вывод о том, что


наиболее близкими кластерами являются кластеры с номерами 2 и 3, т.к.
– наименьшее. Поэтому можно объединить кластеры с
номерами 2 и 3 в один кластер .
После второго объединения получим четыре кластера (см. Таблицу
10.6).
Расстояние между кластерами определим по принципу «средней
связи»:

Таблица 10.24 – Матрица расстояний между четырьмя кластерами


после второго объединения
1 2 3 4
1 0 1033,94
2 0
3 1033,94 0
4 0

Из анализа значений таблицы10.24 можно сделать вывод о том, что


наиболее близкими кластерами являются кластеры с номерами 3 и 4, т.к.
– наименьшее. Поэтому можно объединить кластеры с
номерами 3 и 4 в один кластер .
После третьего объединения получим три кластера (см. Таблицу 10.8).

216
Расстояние между кластерами определим по принципу «средней
связи»:

Таблица 10.25 – Матрица расстояний между тремя кластерами после


третьего объединения
1 2 3
1 0
2 0
3 0

Из анализа значений таблицы10.25 можно сделать вывод о том, что


наиболее близкими кластерами являются кластеры с номерами 1 и 2, т.к.
– наименьшее. Поэтому можно объединить кластеры с
номерами 1 и 2 в один кластер .
После четвертого объединения останется окончательно два кластера
(см. Таблицу 10.10).
Расстояние между кластерами определим по принципу «средней
связи»:

Таблица 10.26 – Матрица расстояний между двумя кластерами после


четвертого объединения
1 2
1 0
2 0

Из матрицы следует, что на расстоянии шесть


объектов (областей) объединяются в один кластер.
Результат кластерного анализа представим графически в виде
дендрограммы:

217
Рисунок 10.4 – Дендрограмма кластерного анализа при
обычном евклидовом расстоянии по принципу «средней связи»

Сравнивая результаты четырех разбиений на однородные группы


шести областей по анализируемым показателям, можно сделать вывод о том,
что наиболее устойчивым является разбиение на два кластера
Республика Калмыкия Республика дыгея Волгоградская область и
( страханская область, Краснодарский край, Ростовская область).

Лабораторная работа №15


Задание. По данным, представленным в Приложении 11, согласно с
номером варианта провести классификацию областей жного
Федерального округа в 2000 г. по иерархическому агломеративному
алгоритму с использованием обычного евклидова расстояния и принципов:
– «ближайшего соседа»
– «дальнего соседа»;
– «центра тяжести»;
– «средней связи».
Сравнить полученные результаты и обосновать окончательный
вариант классификации.

Вопросы для самопроверки

1. Цели, задачи кластерного анализа.


2. Меры расстояния между объектами (кластерами).
3. Сущность иерархического агломеративного кластерного анализа.
4. Способ построения дендрограммы.
5. Способы оценки качества многомерной классификации.

218
ПРИЛОЖЕНИЕ 1
Таблица1
Области 1 2 3 4 5 6 7
Белгородская
304343 90945 1532,5 671563 22302 10428 16839
область
Брянская
126199,3 40149 1275,2 384939 12875 9669 13298
область
Владимирская
188466,3 47734 1442 421136 21859 7902 12424
область
Воронежская
302510,1 122963 2335,2 788059 40705 9822 13580
область
Ивановская
86572,8 28381 1061,1 350925 23429 7508 10980
область
Калужская
156646,2 67292 1009,9 449711 13589 10635 15342
область
Костромская
78700,7 13515 666,3 295091 24700 7625 12656
область
Курская
161473,3 44836 1125,1 435966 54028 9615 14694
область
Липецкая
226464 94387 1171,3 635096 22390 10789 15804
область
Московская
1530623 345301 7104 4442527 240669 15393 22324
область
Орловская
89733,5 20717 785,8 258382 9530 8653 13017
область
Рязанская
152805,8 36644 1152 577233 28950 9076 13663
область
Смоленская
125237,3 47222 982,9 477280 53366 10605 14770
область
Тамбовская
133587 50019 1090,1 467691 10570 9715 13592
область
Тверская
197892 80501 1350,3 729864 58292 10168 13925
область
Тульская
213621,7 66028 1550,3 562328 34110 10483 15358
область
Ярославская
212801,7 63595 1271 821370 27283 9571 14548
область
1 - Валовой региональный продукт ,млн. руб.
2 - Инвестиции в основной капитал, млн. руб.
3 - Численность населения, тыс. чел.
4 - Основные фонды в экономике, млн. руб.
5 - Производство и распределение электроэнергии, газа и воды, млн. руб.
6 - Потребительские расходы в среднем на душу населения (в месяц), руб.
7 - Среднедушевые денежные доходы (в месяц), руб.

219
ПРОДОЛЖЕНИЕ 1 ПРИЛОЖЕНИЯ 1
Продолжение таблицы 1
Области 8 9 10 11 12 13 14 15
Белгородская
16839 143302 100867 1100,4 77244 4777 474,1 213,2
область
Брянская
13298 110850 27134 390,9 22189 4933 372,9 125,1
область
Владимирская
12424 97293 19282 480,9 15972 5774 374,6 206,4
область
Воронежская
13580 193277 69305 1049,7 2830 5594 589,8 232,4
область
Ивановская
10980 71001 10693 190,7 -1927 5440 272 175,8
область
Калужская
15342 98857 21576 500,7 13885 5256 365,4 229,4
область
Костромская
12656 46092 13607 151,4 3250 5668 184,7 205,5
область
Курская
14694 97695 40496 381,2 15307 5120 400,7 203,5
область
Липецкая
15804 117750 35710 736,8 45647 5276 372 245,5
область
Московская
22324 1016780 78148 7939 157323 6585 1922,1 293,3
область
Орловская
13017 62813 27312 249,1 5947 4813 242,5 213,1
область
Рязанская
13663 97030 26774 466,3 13803 5669 333,8 272,4
область
Смоленская
14770 101861 15117 348 6383 5817 301,6 246
область
Тамбовская
13592 98311 36950 569,1 3054 4199 337 209,3
область
Тверская
13925 126770 18145 452,3 2924 5633 385,9 218,7
область
Тульская
15358 151331 26271 394,8 16878 5374 416,8 252,7
область
Ярославская
14548 105411 18568 291,5 8210 5386 322,2 184,1
область
8 - Среднедушевые денежные доходы (в месяц), руб.;
9 - Оборот розничной торговли, млн. руб.;
10 - Продукция сельского хозяйства, млн. руб.;
11 – Ввод в действие общей площади жилых домов, тыс. м2
12 - Сальдированный финансовый результат деятельности организаций, млн.
руб.
13 - Величина прожиточного минимума (в среднем на душу населения),руб.
в месяц
14 - Численность граждан, пользующихся социальной поддержкой по оплате
жилого помещения и коммунальных услуг, тыс. человек
15 - Число собственных легковых автомобилей на 1000 человек населения

220
ПРОДОЛЖЕНИЕ 2 ПРИЛОЖЕНИЯ 1
Таблица 2
Области 1 2 3 4 5 6 7
Республика
Башкортостан 645526,3 139570 4071,9 1604725 71174 14173 17677
Республика
Марий Эл 68768 21244 695,4 225000 8563 7196 10195
Республика
Мордовия 92855,1 38395 833,3 353809 9628 6481 11055
Республика
Татарстан 884232,9 306020 3787,4 2526863 91672 13820 18158
Удмуртская
Республика 229369,1 42346 1521,7 650857 24217 8216 12423
Чувашская
Республика 139481,8 43751 1250,5 493286 21341 7627 10885
Пермский край 544541,3 129943 2634,1 1837184 79251 13240 19422
Кировская
область 144989,1 30552 1338,7 541725 25338 8494 13385
Нижегородская
область 545940,1 172320 3307,6 1578659 77198 11443 16358
Оренбургская
область 414537,2 97483 2031,3 1047515 78513 8939 13398
Пензенская
область 150851 46273 1384 579673 14283 8790 12700
Самарская
область 579023,2 132568 3215,5 1775376 87023 14611 20279
Саратовская
область 327181,1 78073 2519,1 1108845 81611 8117 11961
Ульяновская
область 152627,4 44848 1289,9 469472 23488 8692 12905

1 - Валовой региональный продукт ,млн. руб.;


2 - Инвестиции в основной капитал, млн. руб.;
3 - Численность населения, тыс. чел.;
4 - Основные фонды в экономике, млн. руб.;
5 - Производство и распределение электроэнергии, газа и воды, млн. руб.;
6 - Потребительские расходы в среднем на душу населения (в месяц), руб.;
7 - Среднедушевые денежные доходы (в месяц), руб.;

221
ПРОДОЛЖЕНИЕ 3 ПРИЛОЖЕНИЯ 1
Продолжение таблицы 2
Области 8 9 10 11 12 13 14 15
Республика
Башкортостан 512129 90098 2007 133600 5255 947 1771 512129
Республика
Марий Эл 43626 18642 303,6 2655 5098 152,7 247 43626
Республика
Мордовия 48410 28052 289 189 5007 219,5 231 48410
Республика
Татарстан 454394 104154 2027,3 140791 4733 838,7 1858 454394
Удмуртская
Республика 110263 34876 482 31561 5090 504,8 752 110263
Чувашская
Республика 82240 21949 874,7 3972 5007 286,8 438 82240
Пермский
край 316149 30056 761,4 132597 6101 767,2 833 316149
Кировская
область 95622 23090 378,3 10243 5437 350,7 486 95622
Нижегородска
я область 350748 39017 1453,4 70429 5688 976,6 1341 350748
Оренбургская
область 157682 50866 586,6 72204 5132 532,1 779 157682
Пензенская
область 113519 29017 624,8 3162 5163 343,3 354 113519
Самарская
область 423534 38133 1041,1 83068 6191 715,8 641 423534
Саратовская
область 183984 69720 1144,3 16373 5059 969,9 1033 183984
Ульяновская
область 103684 17533 466,8 6771 5164 439 386 103684
8 - Среднедушевые денежные доходы (в месяц), руб.;
9 - Оборот розничной торговли, млн. руб.;
10 - Продукция сельского хозяйства, млн. руб.;
11 – Ввод в действие общей площади жилых домов, тыс. м2;
12 - Сальдированный финансовый результат деятельности организаций, млн.
руб.;
13 - Величина прожиточного минимума (в среднем на душу населения),руб.
в месяц;
14 - Численность граждан, пользующихся социальной поддержкой по оплате
жилого помещения и коммунальных услуг, тыс. человек;
15 - Число дошкольных образовательных учреждений.

222
ПРОДОЛЖЕНИЕ 4 ПРИЛОЖЕНИЯ 1
Таблица 3
Области 1 2 3 4 5
Республика
Карелия 127733,8 29698 316,1 408974 17977
Республика Коми 352334,5 192720 461,1 1365693 35958
Архангельская
область 355884,2 133189 605,9 1161604 30895
Вологодская
область 252063,2 118031 589,9 1018443 27596
Калининградская
область 195063,2 68958 471,7 447257 25112
Ленинградская
область 502126,1 304770 747,6 1506817 103228
Мурманская
область 234649,1 55765 427,4 1163343 48568
Новгородская
область 127270,8 39098 315,6 316982 11682
Псковская
область 84344,7 23909 329,8 272812 10460

1 - Валовой региональный продукт ,млн. руб.;


2 - Инвестиции в основной капитал, млн. руб.;
3 - Численность населения, тыс. чел.;
4 - Основные фонды в экономике, млн. руб.;
5 - Производство и распределение электроэнергии, газа и воды, млн. руб.;

223
ПРОДОЛЖЕНИЕ 5 ПРИЛОЖЕНИЯ 1
Продолжение таблицы 3
Области 6 7 8 9 10 11
Республика
Карелия 12264,1 17542,7 69920 4693 177,8 18135
Республика Коми 16071,9 23897,4 126605 8629 115,6 94169
Архангельская
область 14107,9 21454,8 144731 11613 283,2 -12070
Вологодская
область 10050,2 15637,9 100024 23278 434,4 28604
Калининградская
область 12523,4 16880,5 100895 18196 544,9 19205
Ленинградская
область 12672,3 15931,8 209684 57733 1075,9 65879
Мурманская
область 17261,7 25303,5 112750 3245 23,2 40796
Новгородская
область 12501,2 16980,9 67746 18005 277,8 23197
Псковская
область 11301,9 14185,3 68962 11706 177,7 986
6 - Потребительские расходы в среднем на душу населения (в месяц), руб.;
7 - Среднедушевые денежные доходы (в месяц), руб.;
8 - Оборот розничной торговли, млн. руб.;
9 - Продукция сельского хозяйства, млн. руб.;
10 - Ввод в действие общей площади жилых домов, тыс. м2;
11 - Сальдированный финансовый результат деятельности организаций, млн.
руб.

224
ПРОДОЛЖЕНИЕ 6 ПРИЛОЖЕНИЯ 1
Таблица 4
Области 1 2 3 4 5 6
Республика Алтай 208,4 91,7 13836,9 7179,0 15632,4 21635,8
Республика
Бурятия 971,4 417,4 15715,5 11340,0 19924,0 136374,0
Республика Тыва 309,4 106,0 10962,8 4944,6 19163,1 30601,0
Республика
Хакасия 532,2 239,2 14222,8 9680,5 20689,5 93709,0
Алтайский край 2407,2 1075,6 12499,9 9765,7 13822,6 299715,3
Забайкальский
край 1099,4 489,4 15968,8 10572,7 21099,6 162100,2
Красноярский
край 2838,4 1437,5 20145,5 14105,7 25658,6 1050158,5
Иркутская
область 2424,4 1121,7 16017,2 10580,2 22647,7 539245,6
Кемеровская
область 2750,8 1302,0 16666,0 11237,2 20478,8 622513,0
Новосибирская
область 2686,9 1305,1 18244,1 14898,1 20308,5 482026,5
Омская область 1974,8 945,5 17247,9 12663,1 19087,8 371218,1
Томская область 1057,7 487,5 16516,0 11199,4 24001,0 284292,0

1 - Численность населения, тыс. чел.;


2 - Среднегодовая численность занятых в экономике, тыс. человек;
3 – Среднедушевые денежные доходы (в месяц), руб.;
4 - Потребительские расходы в среднем на душу населения (в месяц), руб.;
5 - Среднемесячная номинальная начисленная заработная плата работников
организаций, руб.
6 - Валовой региональный продукт ,млн. руб.

225
ПРОДОЛЖЕНИЕ 7 ПРИЛОЖЕНИЯ 1
Продолжение таблицы 4
Области 7 8 9 10 11 12
Республика Алтай 61628 8020 76,6 14312 785 11802
Республика
Бурятия 430210 13044 304,4 100938 19336 41017
Республика Тыва 47409 4648 52,4 13742 -1010 7033
Республика
Хакасия 292915 9371 156,2 46034 7954 38064
Алтайский край 757632 93784 663,2 218077 18492 70833
Забайкальский
край 650405 15154 276,9 106366 3331 51557
Красноярский
край 1815754 68598 1047,1 361607 321626 303885
Иркутская
область 1975486 43610 755,2 225846 103655 137995
Кемеровская
область 1406912 38044 1082,6 287279 154591 225131
Новосибирская
область 1229181 60425 1505,2 368292 35817 142078
Омская область 725451 66911 836,7 228595 23138 83342
Томская область 863117 19420 457,6 93050 29782 101927

7 - Основные фонды в экономике, млн. руб.;


8 - Продукция сельского хозяйства, млн. руб.;
9 - Ввод в действие общей площади жилых домов, тыс. м2;
10 - Оборот розничной торговли, млн. руб.;
11 - Сальдированный финансовый результат деятельности организаций, млн.
руб.;
12 - Инвестиции в основной капитал, млн. руб.;

226
ПРИЛОЖЕНИЕ 2

Варианты лабораторной работы №3


№ Год 1 2 3 4
Y L K Y L K Y L K Y L K
1 1984 20 30 22 25 31 25 31 30 42 70 34 29
2 1985 18 15 28 34 14 23 29 14 48 68 19 24
3 1986 15 20 40 20 20 40 24 23 55 65 25 45
4 1987 30 18 15 35 38 15 41 18 35 80 16 18
5 1988 35 25 50 42 25 50 44 27 72 85 25 52
6 1989 22 28 45 27 29 42 26 28 65 72 28 47
7 1990 25 30 25 30 33 25 25 32 45 75 32 23
8 1991 28 40 35 34 45 35 29 40 56 73 40 35
9 1992 40 45 70 45 48 73 40 43 92 62 45 74
10 1993 45 38 60 49 38 60 54 38 73 65 36 60
11 1994 42 48 65 48 48 65 42 49 75 67 48 65
12 1995 48 35 63 53 41 63 57 35 63 68 38 68
13 1996 50 30 77 54 31 81 50 35 97 70 30 79
14 1997 54 28 80 59 27 80 63 28 80 74 28 83
15 1998 60 25 84 66 29 84 60 24 98 80 23 88
16 1999 62 26 87 68 26 92 62 26 87 62 26 93
17 2000 65 30 89 70 31 89 74 38 99 95 36 95
18 2001 70 35 94 74 34 94 81 35 94 70 35 94
19 2002 78 40 95 83 40 98 78 50 105 98 42 103
20 2003 80 44 98 85 46 103 92 64 110 90 45 108
№ Год 5 6 7 8
Y L K Y L K Y L K Y L K
1 1984 120 40 70 130 45 75 100 35 60 90 30 60
2 1985 110 50 75 120 55 80 95 45 70 85 40 65
3 1986 100 60 77 105 65 97 80 54 73 70 50 57
4 1987 140 55 85 150 75 95 120 50 80 110 35 65
5 1988 150 70 90 165 75 110 135 66 84 125 62 70
6 1989 130 60 95 135 66 105 115 55 90 115 50 75
7 1990 180 90 100 190 95 110 155 84 95 150 84 82
8 1991 160 80 110 175 86 115 140 76 103 130 77 94
9 1992 150 70 112 160 75 120 130 65 106 118 62 92
10 1993 135 60 120 145 66 124 120 57 110 110 55 104
11 1994 155 75 124 165 82 130 135 70 114 125 68 115
12 1995 170 85 115 180 93 125 155 80 110 150 79 106
13 1996 175 80 125 184 86 135 160 76 120 145 73 112
14 1997 180 90 130 188 95 143 152 87 120 148 84 120
15 1998 200 95 135 210 102 145 176 90 125 174 85 126
16 1999 190 92 140 196 98 150 170 85 130 160 82 130
17 2000 195 96 144 200 104 164 175 91 137 165 85 136
18 2001 210 104 150 215 110 170 196 99 144 184 95 140
19 2002 205 100 155 207 105 165 190 93 148 175 90 138
20 2003 208 102 152 210 109 172 195 95 150 180 88 146

227
ПРОДОЛЖЕНИЕ 1 ПРИЛОЖЕНИЯ 2
Варианты лабораторной работы №3
№ Год 9 10 11 12
Y L K Y L K Y L K Y L K
1 1984 900 26 130 800 36 140 700 56 150 950 20 110
2 1985 850 30 140 750 40 150 650 50 160 900 25 120
3 1986 910 35 150 810 45 165 700 55 175 960 30 135
4 1987 920 55 160 750 65 170 710 70 180 980 50 145
5 1988 930 40 120 850 52 135 750 60 145 970 36 100
6 1989 940 50 110 840 60 120 740 72 130 990 45 95
7 1990 950 45 130 850 65 140 755 65 150 985 41 110
8 1991 960 60 140 860 75 155 750 80 160 1020 55 120
9 1992 940 65 125 850 78 135 740 85 150 994 60 105
10 1993 930 80 145 830 94 155 730 100 155 980 75 125
11 1994 920 55 155 820 65 170 715 75 165 975 50 135
12 1995 950 58 130 850 68 140 750 72 150 1000 52 110
13 1996 955 62 145 860 75 160 780 80 165 1010 56 120
14 1997 970 70 155 870 80 165 740 95 175 1015 65 135
15 1998 980 50 160 880 60 170 780 70 185 1030 45 140
16 1999 990 55 170 870 65 180 795 78 190 1045 50 150
17 2000 950 68 165 850 80 190 750 82 185 990 62 155
18 2001 960 75 175 860 85 195 760 95 200 1025 70 155
19 2002 950 80 180 850 92 190 754 105 205 995 74 160
20 2003 970 82 185 870 95 195 760 102 202 1030 76 165
№ Год 13 14 15 16
Y L K Y L K Y L K Y L K
1 1984 450 45 120 460 55 130 470 65 140 430 40 100
2 1985 470 50 115 480 60 125 490 70 135 460 45 105
3 1986 480 55 130 480 65 145 505 75 150 470 48 125
4 1987 500 60 165 520 75 175 520 84 195 490 54 145
5 1988 440 52 120 455 64 135 465 75 140 420 48 105
6 1989 450 58 124 465 68 134 470 75 146 440 52 114
7 1990 460 60 128 470 72 140 480 80 148 445 55 118
8 1991 510 65 170 520 75 180 530 85 190 500 60 150
9 1992 500 68 164 515 78 175 520 90 185 495 63 154
10 1993 520 90 175 530 104 185 535 110 195 515 86 160
11 1994 530 95 180 542 105 192 550 120 200 520 90 173
12 1995 540 110 185 550 120 195 560 135 205 530 103 175
13 1996 525 100 172 535 115 184 546 120 195 510 90 160
14 1997 550 115 178 565 125 190 570 135 200 540 105 165
15 1998 570 140 190 580 155 200 595 160 220 560 130 180
16 1999 580 145 195 590 150 206 598 164 215 565 135 183
17 2000 600 160 200 605 170 210 620 185 225 590 155 194
18 2001 565 130 168 575 145 180 585 155 190 550 137 160
19 2002 585 145 184 595 155 195 605 165 208 575 139 175
20 2003 610 170 205 615 180 213 630 192 234 600 160 190
228
ПРОДОЛЖЕНИЕ 2 ПРИЛОЖЕНИЯ 2
Варианты лабораторной работы №3
№ Год 17 18 19 20
Y L K Y L K Y L K Y L K
1 1984 700 130 340 800 150 360 900 170 380 600 110 320
2 1985 720 120 350 820 140 370 920 160 390 620 100 330
3 1986 740 150 360 850 170 385 940 195 410 640 135 335
4 1987 710 140 330 840 165 350 900 184 3750 610 120 315
5 1988 730 145 355 830 170 360 930 180 395 630 126 335
6 1989 750 155 370 850 165 395 950 190 410 650 137 350
7 1990 770 160 385 870 183 410 980 200 435 670 140 365
8 1991 740 148 345 860 165 375 950 192 390 640 130 325
9 1992 755 160 355 850 185 365 970 204 395 655 120 345
10 1993 780 170 380 880 195 390 980 208 420 680 150 360
11 1994 800 190 400 910 205 415 1000 240 445 720 174 390
12 1995 770 156 370 880 170 390 980 198 410 670 140 340
13 1996 795 185 385 895 194 400 995 235 425 695 165 375
14 1997 780 182 395 880 204 420 980 230 445 680 160 385
15 1998 805 194 410 915 205 430 990 235 454 715 175 402
16 1999 810 200 412 910 214 435 1010 245 455 710 180 398
17 2000 800 196 405 905 205 425 1020 234 442 705 165 386
18 2001 820 205 420 920 226 445 1015 250 465 720 195 400
19 2002 830 214 440 940 235 460 1030 260 470 735 200 432
20 2003 850 220 450 950 240 475 1045 265 490 760 190 444
№ Год 21 22 23 24
Y L K Y L K Y L K Y L K
1 1984 560 60 340 610 70 350 660 80 360 500 50 320
2 1985 550 55 320 600 66 335 650 76 343 510 45 300
3 1986 540 50 310 590 62 325 660 71 330 520 42 292
4 1987 520 46 300 580 56 310 620 66 325 470 36 280
5 1988 530 48 308 590 58 317 630 68 328 475 38 297
6 1989 550 58 322 595 67 332 670 79 341 500 46 302
7 1990 540 56 315 580 65 325 640 76 335 495 45 295
8 1991 535 55 312 585 64 323 635 73 330 485 43 297
9 1992 560 62 345 610 72 355 670 82 365 510 52 325
10 1993 570 65 350 625 75 362 670 85 374 515 55 320
11 1994 550 63 348 600 74 358 650 84 368 500 54 328
12 1995 560 66 349 610 77 360 680 87 363 520 56 324
13 1996 580 70 360 620 80 372 685 91 380 530 62 346
14 1997 570 68 355 640 78 365 675 88 375 515 57 335
15 1998 590 75 390 650 85 402 690 95 411 535 65 375
16 1999 600 80 400 655 94 410 700 102 420 550 72 380
17 2000 610 86 406 670 96 415 710 105 427 565 76 387
18 2001 620 90 410 680 100 420 725 110 434 580 80 390
19 2002 650 94 430 690 105 444 770 115 456 600 84 410
20 2003 680 100 445 735 110 460 780 120 466 635 95 430
229
ПРОДОЛЖЕНИЕ 3 ПРИЛОЖЕНИЯ 2
Варианты лабораторной работы №3
№ Год 25 26 27 28
Y L K Y L K Y L K Y L K
1 1984 390 45 800 490 65 820 590 85 850 300 40 770
2 1985 420 55 810 530 75 830 620 90 860 400 51 785
3 1986 440 60 820 540 82 842 640 100 875 410 56 780
4 1987 470 67 840 560 88 860 690 110 890 420 60 810
5 1988 450 64 830 550 85 855 640 114 884 450 58 800
6 1989 460 66 835 560 86 854 650 105 885 410 62 812
7 1990 480 70 855 590 90 874 680 112 935 420 67 825
8 1991 490 80 860 595 103 880 690 124 910 430 76 830
9 1992 500 90 870 600 110 890 720 130 920 460 85 845
10 1993 510 110 880 610 134 905 730 150 935 470 105 850
11 1994 480 75 850 585 95 870 690 115 900 430 70 830
12 1995 470 70 860 565 90 880 670 110 910 420 64 820
13 1996 435 58 805 535 80 830 635 97 860 400 53 765
14 1997 445 60 810 550 84 835 645 100 864 395 57 790
15 1998 450 63 812 555 83 828 660 103 865 405 58 793
16 1999 465 70 834 565 90 855 665 110 886 415 62 805
17 2000 485 80 855 585 99 875 685 121 915 435 73 825
18 2001 500 96 873 610 120 896 720 138 933 460 90 845
19 2002 515 114 880 615 140 900 715 155 940 485 108 856
20 2003 520 120 895 630 150 925 725 160 950 490 115 865
№ Год 29 30 31 32
Y L K Y L K Y L K Y L K
1 1984 200 90 700 300 110 800 400 134 910 100 60 500
2 1985 240 96 740 340 115 840 450 135 950 140 62 550
3 1986 250 98 770 360 120 880 455 140 980 125 75 560
4 1987 290 130 790 390 150 850 495 170 990 190 104 598
5 1988 260 120 770 370 142 890 460 165 970 165 95 560
6 1989 270 124 780 375 144 820 475 164 985 180 96 570
7 1990 245 116 750 350 136 870 425 158 956 140 85 540
8 1991 265 122 790 365 144 895 460 165 990 160 94 595
9 1992 275 128 740 375 148 850 475 168 960 175 90 540
10 1993 280 130 730 380 150 840 490 171 940 185 100 540
11 1994 300 145 800 400 166 906 505 187 1000 210 111 610
12 1995 310 152 810 410 170 915 420 190 1010 220 120 620
13 1996 295 141 815 395 165 910 495 184 1020 190 115 615
14 1997 315 160 795 424 180 890 410 200 990 210 130 598
15 1998 300 142 790 400 165 890 530 185 970 200 115 580
16 1999 320 146 830 420 167 930 520 188 1040 220 118 620
17 2000 325 170 845 425 190 940 528 210 1050 230 140 650
18 2001 330 173 860 435 194 930 535 223 1065 240 144 660
19 2002 315 145 832 420 168 945 516 190 1040 215 116 640
20 2003 350 180 900 440 200 980 560 230 1100 255 150 720
230
ПРОДОЛЖЕНИЕ 3 ПРИЛОЖЕНИЯ 2
Варианты лабораторной работы №3
№ Год 33 34 35 36
Y L K Y L K Y L K Y L K
1 1984 450 350 780 550 370 830 660 390 890 340 335 580
2 1985 460 360 790 565 385 845 670 410 880 360 340 540
3 1986 440 355 740 520 375 780 630 390 840 320 330 530
4 1987 430 320 750 530 345 795 645 360 860 310 302 550
5 1988 410 300 720 525 330 760 620 340 830 300 285 520
6 1989 415 340 780 510 350 820 615 375 890 315 320 585
7 1990 420 330 795 520 355 835 620 370 895 320 315 595
8 1991 425 350 850 530 370 894 630 395 855 335 334 660
9 1992 445 355 840 545 380 880 650 410 950 345 325 640
10 1993 460 380 850 560 385 882 660 430 950 365 350 670
11 1994 470 360 820 580 380 860 675 400 930 370 335 630
12 1995 480 370 810 595 390 870 680 415 920 380 350 615
13 1996 510 400 900 615 415 940 730 440 990 420 370 710
14 1997 520 420 850 620 430 895 720 465 950 430 400 650
15 1998 540 450 860 645 470 905 750 490 965 445 435 640
16 1999 550 440 880 660 465 930 765 475 980 420 420 680
17 2000 570 470 890 670 490 945 780 520 995 480 450 670
18 2001 600 460 900 730 484 940 830 510 980 500 443 710
19 2002 620 480 920 720 510 960 825 535 970 520 460 730
20 2003 650 490 950 760 530 980 870 540 999 540 475 790
№ Год 37 38 39 40
Y L K Y L K Y L K Y L K
1 1984 50 10 170 65 20 190 80 30 270 30 5 120
2 1985 60 15 180 75 25 200 90 36 280 40 10 130
3 1986 70 22 200 80 26 230 85 40 3200 50 16 160
4 1987 55 12 160 75 14 175 75 35 370 45 7 120
5 1988 65 20 200 85 32 224 79 42 310 55 14 160
6 1989 80 26 220 95 35 240 65 45 330 70 20 180
7 1990 40 18 120 65 26 145 60 36 240 25 12 70
8 1991 45 8 130 70 18 150 75 29 230 35 4 80
9 1992 50 12 145 65 24 170 70 33 240 40 8 95
10 1993 35 5 135 55 18 156 60 25 230 25 3 90
11 1994 45 13 138 70 25 160 65 34 238 55 7 75
12 1995 55 18 174 76 28 195 45 38 280 35 15 120
13 1996 60 30 167 72 45 185 80 50 270 45 26 110
14 1997 65 35 172 80 48 197 75 45 275 60 30 115
15 1998 70 39 195 95 50 215 90 60 295 55 33 135
16 1999 75 44 200 100 52 228 100 65 315 66 38 145
17 2000 65 28 190 85 38 216 80 48 290 35 22 150
18 2001 80 45 230 95 55 250 95 65 340 60 40 195
19 2002 55 33 163 75 44 190 85 55 270 45 30 120
20 2003 60 32 170 98 46 195 70 54 280 55 27 110

231
ПРОДОЛЖЕНИЕ 4 ПРИЛОЖЕНИЯ 2
Варианты лабораторной работы №3
№ Год 41 42 43 44
Y L K Y L K Y L K Y L K
1 1984 150 50 400 250 60 500 350 70 650 50 40 320
2 1985 160 55 410 265 66 520 360 74 670 60 46 300
3 1986 180 60 430 270 72 540 380 85 650 90 55 330
4 1987 200 40 420 300 53 550 300 60 680 100 34 315
5 1988 170 50 405 280 60 500 370 72 645 80 40 300
6 1989 175 55 425 265 64 530 385 78 680 75 43 320
7 1990 220 60 440 310 72 550 325 80 650 130 50 330
8 1991 230 70 480 330 74 580 430 94 730 135 60 360
9 1992 240 65 470 350 75 566 460 85 710 140 50 350
10 1993 220 55 475 330 60 575 420 80 725 120 45 380
11 1994 215 75 465 315 85 585 435 95 715 125 65 360
12 1995 235 85 490 340 95 590 440 110 730 135 70 370
13 1996 300 80 470 410 88 550 500 100 710 210 60 365
14 1997 310 90 430 415 100 540 520 106 700 220 70 330
15 1998 330 60 445 430 75 560 555 84 720 230 50 325
16 1999 320 55 465 420 60 570 510 70 715 240 44 345
17 2000 340 50 480 445 64 580 520 75 820 250 30 360
18 2001 355 75 485 465 86 590 545 96 745 235 55 355
19 2002 360 85 430 460 98 540 550 120 700 250 70 320
20 2003 380 90 490 490 104 600 590 110 730 275 80 360
№ Год 45 46 47 48
Y L K Y L K Y L K Y L K
1 1984 370 200 650 470 300 740 70 150 540 100 54 78
2 1985 350 210 700 460 320 810 50 170 600 110 55 79
3 1986 340 220 750 430 310 850 45 180 660 110 60 75
4 1987 350 190 730 450 290 840 60 130 630 120 55 80
5 1988 360 260 720 475 350 820 80 215 610 140 53 86
6 1989 330 230 710 430 320 830 40 185 600 130 64 84
7 1990 345 240 780 450 345 885 55 190 630 160 68 88
8 1991 355 225 770 455 335 865 65 175 620 140 70 93
9 1992 375 235 640 475 325 850 70 195 520 150 65 95
10 1993 380 265 620 490 360 720 85 215 500 170 60 99
11 1994 360 280 690 460 390 795 70 220 560 177 80 101
12 1995 390 300 730 495 420 850 90 245 620 185 74 106
13 1996 380 270 740 470 375 840 85 220 650 190 75 104
14 1997 400 275 725 510 380 830 100 235 635 175 82 110
15 1998 410 280 735 540 390 840 120 226 640 182 86 112
16 1999 420 295 745 520 395 850 135 255 645 188 88 118
17 2000 405 310 760 515 415 860 115 270 670 200 94 121
18 2001 410 260 790 510 370 895 130 230 695 203 95 125
19 2002 430 270 770 540 380 870 140 245 678 207 100 128
20 2003 440 290 780 550 400 860 165 260 690 200 102 132
232
ПРОДОЛЖЕНИЕ 5 ПРИЛОЖЕНИЯ 2
Варианты лабораторной работы №3
№ Год 49 50 51 52
Y L K Y L K Y L K Y L K
1 1984 320 18 44 500 110 200 720 30 90 610 15 110
2 1985 330 19 45 510 115 210 740 50 110 640 50 145
3 1986 340 20 48 505 105 195 700 10 75 620 30 130
4 1987 320 19 44 540 120 220 760 75 130 630 38 140
5 1988 310 19 47 530 115 205 790 95 160 660 70 150
6 1989 300 18 40 520 112 212 810 25 90 640 48 155
7 1990 360 21 52 540 124 224 800 15 70 615 12 120
8 1991 340 20 33 550 130 230 830 45 100 626 35 130
9 1992 360 21 55 500 111 208 840 55 120 645 50 150
10 1993 370 23 58 480 100 192 820 35 100 650 65 140
11 1994 395 24 62 530 140 243 850 65 130 670 82 180
12 1995 385 24 65 570 155 260 830 46 110 660 70 165
13 1996 390 26 68 590 170 270 845 60 125 640 55 150
14 1997 410 28 70 600 180 280 855 70 135 670 80 180
15 1998 400 27 65 610 185 290 860 74 135 690 90 185
16 1999 420 25 62 620 190 302 870 88 150 720 92 240
17 2000 410 26 64 625 210 310 890 110 174 700 95 200
18 2001 400 26 67 640 225 350 880 100 155 740 97 250
19 2002 415 27 70 650 245 340 875 90 158 730 99 225
20 2003 420 29 72 645 240 315 885 100 155 735 100 210
№ Год 53 54 55 56
Y L K Y L K Y L K Y L K
1 1984 430 60 90 600 10 180 630 35 140 200 20 75
2 1985 420 45 65 620 25 190 660 70 170 210 25 80
3 1986 440 85 110 630 28 190 620 30 130 220 45 130
4 1987 450 95 160 650 55 200 700 110 210 180 10 33
5 1988 445 90 140 660 62 210 730 120 240 190 15 50
6 1989 435 75 110 640 44 190 740 140 250 200 16 48
7 1990 460 120 190 620 26 175 770 180 260 230 33 100
8 1991 470 130 200 610 14 170 780 170 290 250 55 160
9 1992 450 90 160 600 5 160 790 175 280 255 60 170
10 1993 440 80 115 670 65 220 775 180 260 235 40 110
11 1994 465 125 195 680 85 225 760 150 250 245 50 160
12 1995 470 135 220 675 80 200 790 200 280 264 70 220
13 1996 480 150 250 665 60 220 800 210 310 270 85 250
14 1997 485 160 260 690 90 210 810 220 320 275 94 272
15 1998 490 185 275 700 110 215 805 210 300 258 62 180
16 1999 475 155 230 730 140 235 830 240 335 266 75 205
17 2000 470 150 205 740 155 248 840 255 350 248 55 155
18 2001 490 190 260 750 160 256 830 220 320 250 65 190
19 2002 500 195 290 760 170 266 800 205 315 270 77 210
20 2003 510 200 295 785 190 280 815 220 335 280 88 260
233
ПРОДОЛЖЕНИЕ 6 ПРИЛОЖЕНИЯ 2
Варианты лабораторной работы №3
№ Год 57 58 59 60
Y L K Y L K Y L K Y L K
1 1984 420 35 74 650 65 100 510 35 110 230 45 85
2 1985 400 15 40 650 60 110 500 23 104 220 40 90
3 1986 410 14 30 630 45 70 490 14 95 200 36 75
4 1987 430 38 70 660 65 130 480 12 90 240 45 95
5 1988 450 55 100 670 68 145 550 65 120 220 28 64
6 1989 450 47 90 700 110 214 560 70 125 270 50 90
7 1990 465 68 120 690 85 190 530 24 170 250 55 104
8 1991 470 80 150 710 115 230 580 90 186 240 52 108
9 1992 480 85 180 700 104 205 590 96 193 200 36 80
10 1993 490 75 155 730 134 270 575 83 165 210 44 89
11 1994 510 100 210 750 155 315 545 57 187 235 48 100
12 1995 520 105 215 770 175 350 530 34 156 243 52 110
13 1996 510 106 220 760 162 334 520 28 110 265 54 100
14 1997 515 120 245 765 168 348 530 33 120 277 58 115
15 1998 520 124 250 785 190 378 550 67 115 280 60 130
16 1999 530 135 265 780 200 357 565 77 145 290 64 125
17 2000 535 140 290 790 196 390 587 96 179 300 66 137
18 2001 545 155 300 750 146 326 594 100 190 320 67 140
19 2002 565 174 330 746 158 290 600 110 196 330 68 147
20 2003 570 185 350 780 184 345 610 105 200 335 70 150
№ Год 61 62 63 64
Y L K Y L K Y L K Y L K
1 1984 1200 240 600 720 120 820 90 10 40 330 70 430
2 1985 1300 250 640 700 110 800 95 10 45 310 60 400
3 1986 1100 200 520 690 95 700 96 12 50 340 90 450
4 1987 1000 190 490 650 45 760 90 14 55 350 110 460
5 1988 900 175 465 640 37 730 100 13 56 360 130 460
6 1989 1010 200 510 690 85 810 110 15 60 320 135 430
7 1990 1200 235 590 720 110 835 130 20 65 310 90 425
8 1991 1150 228 536 740 135 850 140 30 80 360 105 475
9 1992 1230 240 620 760 145 880 110 6 60 345 120 456
10 1993 1280 248 634 770 160 840 135 27 70 356 104 470
11 1994 1310 255 670 730 123 855 125 16 55 326 90 435
12 1995 1370 260 680 760 155 880 116 9 64 329 85 433
13 1996 1270 246 660 800 200 900 98 4 50 335 97 460
14 1997 1290 250 645 765 175 870 95 5 58 347 110 465
15 1998 1300 245 636 774 180 850 110 12 70 390 120 510
16 1999 1100 215 540 785 190 890 130 18 60 380 132 500
17 2000 1180 210 545 810 220 900 135 25 80 375 145 550
18 2001 1150 213 542 820 240 910 145 30 90 386 165 400
19 2002 1140 210 546 840 250 950 130 33 85 375 168 480
20 2003 1190 212 542 835 233 970 137 38 100 368 120 490
234
ПРОДОЛЖЕНИЕ 7 ПРИЛОЖЕНИЯ 2
Варианты лабораторной работы №3
№ Год 65 66 67 68
Y L K Y L K Y L K Y L K
1 1984 154 55 310 320 110 430 500 110 210 700 90 820
2 1985 100 15 240 330 120 440 520 150 230 600 10 740
3 1986 140 35 270 350 160 430 560 140 270 500 5 630
4 1987 130 26 255 340 130 420 550 180 245 550 8 660
5 1988 125 30 247 310 105 425 530 120 236 540 9 660
6 1989 126 20 246 320 125 415 500 97 196 580 10 690
7 1990 138 45 280 360 155 476 560 155 265 680 70 790
8 1991 135 44 270 370 164 480 575 197 297 670 56 775
9 1992 155 63 320 330 120 454 545 135 240 640 33 755
10 1993 160 75 330 345 155 468 532 125 230 630 25 720
11 1994 154 63 290 365 145 460 547 140 256 620 15 710
12 1995 142 45 270 325 140 420 556 167 270 610 8 700
13 1996 137 48 255 376 160 460 570 195 285 600 12 690
14 1997 136 40 230 380 190 495 590 200 297 590 6 675
15 1998 138 35 245 400 210 515 620 240 330 550 7 640
16 1999 145 49 286 405 225 530 630 250 335 545 8 634
17 2000 170 80 330 396 190 486 625 210 322 535 8 630
18 2001 180 65 355 360 185 470 610 205 315 570 9 660
19 2002 210 120 390 400 220 518 600 210 297 560 10 630
20 2003 200 140 410 390 198 485 590 176 285 550 11 645
№ Год 69 70 71 72
Y L K Y L K Y L K Y L K
1 1984 280 50 370 340 130 500 440 50 330 650 140 810
2 1985 250 45 340 360 150 540 450 55 340 620 120 700
3 1986 240 44 330 380 170 560 480 54 375 640 130 750
4 1987 250 53 370 330 135 550 470 56 380 660 135 780
5 1988 260 55 380 320 145 510 430 40 320 670 140 815
6 1989 270 60 390 310 100 500 455 38 345 630 133 785
7 1990 245 50 325 300 96 520 476 58 360 645 130 760
8 1991 254 45 345 380 190 560 486 60 370 675 144 830
9 1992 265 57 386 400 215 620 495 65 387 660 128 795
10 1993 278 58 365 430 245 625 440 40 335 655 135 760
11 1994 280 55 395 450 265 660 420 38 336 610 118 740
12 1995 295 60 315 460 280 640 390 33 280 635 137 755
13 1996 310 65 420 430 220 640 385 36 290 620 120 730
14 1997 320 68 410 480 290 675 379 35 260 640 145 790
15 1998 315 70 435 470 265 685 354 33 240 645 166 830
16 1999 325 78 440 450 245 685 320 30 215 679 155 856
17 2000 330 80 450 445 220 650 360 43 270 670 150 800
18 2001 355 71 470 420 210 630 360 41 275 650 136 790
19 2002 340 73 465 410 200 615 380 37 290 680 140 845
20 2003 315 65 430 400 190 590 400 45 310 700 154 870
235
ПРОДОЛЖЕНИЕ 8 ПРИЛОЖЕНИЯ 2
Варианты лабораторной работы №3
№ Год 73 74 75 76
Y L K Y L K Y L K Y L K
1 1984 1300 25 5400 620 30 1000 400 90 200 280 160 300
2 1985 1200 22 5250 600 28 990 430 95 210 260 130 310
3 1986 1100 20 5090 590 29 960 400 82 190 220 100 280
4 1987 1170 23 5200 550 26 940 390 75 170 240 120 310
5 1988 1230 25 5210 560 27 980 420 80 215 235 130 285
6 1989 1340 27 5300 530 25 920 480 90 235 240 115 295
7 1990 1500 32 5450 500 24 895 490 100 250 250 130 305
8 1991 1620 35 5555 490 23 886 500 110 260 275 140 315
9 1992 1300 25 5280 520 25 910 530 120 270 280 145 245
10 1993 1270 23 5240 540 28 935 560 140 275 296 150 265
11 1994 1010 18 5000 570 29 980 520 120 280 300 165 370
12 1995 1000 16 4990 580 31 990 470 99 245 310 170 375
13 1996 1120 20 5120 560 30 955 485 95 255 315 165 380
14 1997 1130 22 5145 575 28 950 490 90 260 325 170 390
15 1998 1150 24 5150 580 27 986 495 88 270 330 180 385
16 1999 1260 26 5200 590 29 992 510 115 280 340 186 400
17 2000 1400 28 5300 610 32 1030 520 135 290 335 176 386
18 2001 1420 30 5350 600 30 1010 530 124 300 350 190 410
19 2002 1460 32 5420 605 36 1020 545 130 310 375 200 430
20 2003 1570 35 5480 620 38 1300 550 150 325 384 210 440
№ Год 77 78 79 80
Y L K Y L K Y L K Y L K
1 1984 870 170 1080 500 90 610 220 50 450 360 18 450
2 1985 850 162 1040 510 110 630 210 40 400 320 15 430
3 1986 800 158 990 530 113 655 200 38 390 330 16 430
4 1987 840 164 1025 510 105 610 190 35 385 340 18 450
5 1988 860 175 1050 545 115 660 185 38 350 360 17 455
6 1989 870 184 1085 535 111 640 200 42 420 340 15 430
7 1990 830 160 1024 520 100 610 215 45 430 375 18 460
8 1991 850 175 1055 540 109 655 230 48 470 320 12 430
9 1992 875 184 1090 550 114 675 245 50 500 330 13 440
10 1993 864 150 1055 530 125 660 235 48 455 355 18 470
11 1994 880 175 1085 560 135 690 220 47 430 380 20 487
12 1995 900 190 1140 570 180 745 218 43 415 390 22 500
13 1996 915 210 1147 584 185 764 210 40 425 410 24 515
14 1997 922 220 1150 595 190 790 200 38 410 400 20 490
15 1998 930 235 1167 580 174 748 190 37 375 386 18 476
16 1999 935 250 1180 573 164 725 185 35 365 395 19 505
17 2000 945 264 1200 568 178 730 210 44 433 370 17 468
18 2001 920 245 1074 552 160 700 220 45 456 400 21 515
19 2002 900 210 1020 570 165 690 224 47 440 405 23 520
20 2003 890 176 1060 580 190 756 255 52 510 415 24 550
236
ПРОДОЛЖЕНИЕ 9 ПРИЛОЖЕНИЯ 2
Варианты лабораторной работы №3
№ Год 81 82 83 84
Y L K Y L K Y L K Y L K
1 1984 340 135 450 650 170 520 260 50 420 530 110 750
2 1985 320 133 430 640 167 510 240 50 400 510 105 700
3 1986 330 130 430 630 160 500 230 45 390 500 100 710
4 1987 360 160 450 600 155 490 256 48 395 550 120 740
5 1988 370 180 460 620 165 530 255 51 400 540 125 735
6 1989 390 185 485 660 170 550 243 49 380 520 110 715
7 1990 380 175 470 670 187 565 240 47 385 535 130 755
8 1991 400 210 510 650 185 540 235 40 370 560 140 750
9 1992 420 230 540 640 150 550 260 55 420 550 130 740
10 1993 410 220 535 635 139 520 274 57 425 520 125 710
11 1994 440 250 560 670 165 580 280 60 460 500 90 690
12 1995 450 255 570 690 180 595 290 65 480 490 80 710
13 1996 460 270 585 700 210 610 265 54 420 550 115 760
14 1997 440 245 535 710 220 615 270 58 415 570 140 780
15 1998 430 240 532 730 245 645 265 51 425 580 180 785
16 1999 410 215 525 720 235 640 245 50 400 500 90 685
17 2000 400 200 497 700 190 598 280 60 440 530 120 720
18 2001 390 185 486 690 185 587 295 70 435 520 110 725
19 2002 380 175 475 695 190 580 300 80 440 500 96 705
20 2003 420 230 520 680 170 570 310 85 470 520 112 735
№ Год 85 86 87 88
Y L K Y L K Y L K Y L K
1 1984 300 60 720 500 240 650 450 15 910 125 50 240
2 1985 330 66 800 510 260 675 440 14 990 130 65 270
3 1986 320 60 750 520 265 690 400 10 830 144 90 290
4 1987 340 70 820 550 280 635 420 12 850 160 110 300
5 1988 350 75 840 560 290 640 430 14 880 180 150 350
6 1989 360 73 860 580 280 650 455 16 910 140 85 290
7 1990 310 58 780 600 310 700 475 18 940 155 120 320
8 1991 300 59 720 640 315 750 460 15 930 165 140 330
9 1992 290 55 640 660 340 810 440 13 890 180 165 370
10 1993 280 57 650 620 310 720 435 14 880 190 190 390
11 1994 285 60 680 640 315 750 415 10 800 210 230 400
12 1995 265 55 620 660 320 760 420 12 810 220 250 430
13 1996 270 53 615 620 300 700 440 15 870 230 260 470
14 1997 286 61 690 660 340 820 448 16 880 260 310 500
15 1998 290 57 690 600 290 780 450 15 890 250 290 490
16 1999 295 56 375 580 285 755 470 17 920 245 285 475
17 2000 310 65 750 620 320 730 486 19 950 230 255 450
18 2001 320 68 810 640 325 765 490 20 970 210 215 410
19 2002 325 70 800 660 345 815 500 22 1000 200 197 390
20 2003 330 74 820 680 350 845 510 24 1050 190 185 385
237
ПРОДОЛЖЕНИЕ 10 ПРИЛОЖЕНИЯ 2
Варианты лабораторной работы №3
№ Год 89 90 91 92
Y L K Y L K Y L K Y L K
1 1984 1400 270 4200 50 6 160 380 20 560 140 30 470
2 1985 1300 260 4000 60 7 170 390 21 580 120 25 450
3 1986 1200 230 3700 70 8 200 420 24 610 110 20 430
4 1987 1500 300 4600 50 3 140 440 21 630 190 40 570
5 1988 1200 240 3750 60 4 160 400 20 610 150 32 510
6 1989 1000 210 3100 80 6 230 396 19 590 170 36 520
7 1990 1100 230 3300 90 8 260 420 22 625 160 33 490
8 1991 1200 250 3650 75 7 220 440 25 630 180 38 460
9 1992 1350 260 3800 87 6 250 470 28 680 190 39 495
10 1993 1250 250 3600 95 8 300 440 24 650 210 43 525
11 1994 1050 210 3200 86 7 240 420 20 610 220 45 530
12 1995 1400 290 4150 80 7 230 410 20 600 200 39 500
13 1996 1500 320 4400 75 8 200 415 21 620 190 38 460
14 1997 1600 340 4750 70 5 190 445 23 635 186 37 440
15 1998 1450 270 4200 65 5 190 460 25 675 195 40 420
16 1999 1320 250 4000 60 6 175 455 27 660 210 43 535
17 2000 1640 300 4500 66 7 160 440 22 630 215 44 540
18 2001 1780 350 5080 77 8 240 420 22 640 220 46 570
19 2002 1700 330 5010 85 9 260 450 23 665 200 41 510
20 2003 1650 320 4890 90 9 310 440 24 655 190 39 480
№ Год 93 94 95 96
Y L K Y L K Y L K Y L K
1 1984 500 40 630 330 100 1000 220 11 430 700 140 1000
2 1985 550 44 690 310 95 990 200 10 410 710 142 1050
3 1986 540 42 665 300 90 900 190 9 390 690 135 800
4 1987 530 48 690 290 85 850 210 10 400 750 160 1100
5 1988 500 45 645 270 80 800 270 13 520 745 150 1080
6 1989 560 48 680 250 74 740 290 15 560 730 140 1050
7 1990 550 45 685 220 60 600 280 14 550 720 145 1020
8 1991 565 44 720 270 84 830 275 13 555 780 165 1200
9 1992 545 43 700 280 88 850 265 12 545 770 155 1180
10 1993 530 43 685 300 90 920 278 12 530 755 150 1110
11 1994 530 42 680 320 95 940 285 15 560 735 140 1160
12 1995 540 48 695 330 100 970 294 16 580 775 160 1195
13 1996 570 48 710 340 110 1010 270 17 550 785 170 1200
14 1997 580 50 735 350 115 1040 260 14 545 770 165 1190
15 1998 590 52 750 350 12 1020 290 15 590 794 200 1210
16 1999 550 55 720 345 130 1010 300 16 620 766 160 1095
17 2000 540 58 700 365 110 1080 310 18 635 782 180 1210
18 2001 545 54 690 380 120 1060 300 15 590 800 210 1240
19 2002 564 57 725 390 125 1090 315 19 640 810 220 1255
20 2003 570 55 730 400 130 1180 320 22 655 840 250 1270
238
ПРОДОЛЖЕНИЕ 11 ПРИЛОЖЕНИЯ 2
Варианты лабораторной работы №2
№ Год 97 98 99 100
Y L K Y L K Y L K Y L K
1 1984 100 9 310 330 25 420 500 110 1200 700 75 350
2 1985 110 12 330 310 27 400 520 120 1240 720 77 340
3 1986 120 13 350 340 28 450 540 125 1260 740 79 370
4 1987 140 15 400 360 30 470 550 140 1300 750 75 335
5 1988 160 15 460 330 27 435 520 124 1340 770 74 380
6 1989 170 18 500 345 29 450 510 112 1220 780 80 395
7 1990 150 14 450 355 31 465 500 100 1210 680 65 350
8 1991 140 15 410 365 33 470 490 90 960 670 60 340
9 1992 180 19 530 370 35 480 480 85 940 700 72 355
10 1993 190 22 610 340 32 455 520 130 1240 720 74 370
11 1994 210 23 600 345 33 465 530 145 1260 730 75 360
12 1995 220 25 630 370 36 485 550 160 1300 750 77 370
13 1996 240 27 700 385 36 490 570 180 1330 760 78 390
14 1997 250 23 740 375 38 465 550 155 1400 780 80 400
15 1998 255 28 765 360 32 450 520 115 1320 790 84 410
16 1999 265 24 760 400 37 510 510 105 1000 740 76 380
17 2000 230 21 620 410 38 515 500 85 960 720 75 350
18 2001 210 20 600 415 39 535 490 80 920 710 74 350
19 2002 200 23 590 420 40 550 480 70 900 700 72 340
20 2003 210 24 620 410 38 540 450 60 880 730 76 360

239
ПРИЛОЖЕНИЕ 3
Таблица1 – Варианты № 1-15 Лабораторной работы№ 4
№ Область РФ 1 2 3 4 5 6 7 8 9 10 11
1 Белгородская область 943,5 16 1283 835,3 1030 2136,6 3,7 39,9 134313 132289 105,5
2 Брянская область 273 23 649 249,6 1066 1368,4 6 44,6 59835 48617 105,8
3 Владимирская область 2792,9 24 680 383,4 3239 3314,9 7,4 42,4 25012 57987 105,7
4 Воронежская область 5044,8 59 2617 613,9 1755 8995,3 6,3 44,5 25948 152210 104,1
5 Костромская область 55,5 6 493 125,7 1069 459,9 3,5 41,5 5346 15201 105,7
6 Курская область 1533,7 18 1253 297,1 1588 1878,9 2,5 49,1 46717 58244 105,5
7 Липецкая область 111,5 12 598 520,1 2265 33983,4 9,9 50,3 51915 117790 104,7
8 Орловская область 315,6 16 1112 146,6 1471 602,9 7,7 46,2 10392 35470 105,8
9 Рязанская область 1109,3 17 825 267,9 1076 3318,5 3,6 50,4 15294 53078 105,8
10 Тамбовская область 918,5 34 1166 153,5 2248 1187,3 5,3 57,5 5679 65601 105,5
11 Тверская область 3294,1 28 743 296,1 2394 3537,6 9,5 44,2 10637 84478 105,3
12 Тульская область 1715,1 21 899 541,4 4898 4447,4 11,6 45,9 28009 72579 105,7
13 Ярославская область 4075,1 32 1140 494,9 2642 14498,3 11,4 46 16242 69894 106
14 Республика Карелия 704,9 19 353 163,8 1191 954,6 0,3 37,9 25093 29698 105,3
15 Республика Коми 1704,5 21 470 545,5 609 15430,2 7,8 55,3 99694 192720 106,3
16 Архангельская область 898,6 33 556 327,9 1414 3209 0,2 38,4 17752 133189 105,4
17 Вологодская область 310,9 18 684 617,9 2228 9653,6 3,7 47,1 35769 118031 105,7
18 Мурманская область 2077,8 27 462 298,5 1557 826,9 0,2 42,8 49390 55765 106
19 Новгородская область 857,1 13 273 193,2 1944 845,9 4,8 45,3 28302 39098 104,9
20 Псковская область 67,4 12 249 116,8 1594 235,9 2,3 39,2 3474 23909 105,6
21 Республика Адыгея 151,6 8 418 37,3 128 88,8 6,4 46,5 1368 16708 106,2
22 Астраханская область 612 36 793 118 591 1241,4 2,8 47,5 5147 68744 105,2
23 Волгоградская область 3229,7 42 2037 739,8 1989 5231,7 5,2 51,1 65766 100789 105,3
24 Карачаево-Черкесская 310,4 5 224 57 87 220,8 24,1 33,5 1320 14001 105,1
Республика
25 Республика Северная 293,1 17 796 24,9 19 118,3 0,3 40,6 537 21104 105,6
Осетия - Алания
26 Ставропольский край 2006,5 28 2528 552,7 920 1397,1 9,9 49,8 39243 106664 104
27 Республика 5413,7 70 3259 1633,6 6207 13754,3 5,6 51 120982 184883 106,4
Башкортостан
28 Республика Марий эл 140,1 8 439 105,9 758 549,1 4,9 60,3 5369 26628 106
29 Республика Мордовия 601,3 16 966 168,5 2626 16107,7 22 57,2 4526 46570 105,1
30 Удмуртская республика 787,5 30 822 500,8 4565 4163 3,5 60,8 51372 60899 106,7
31 Чувашская республика 849,9 18 784 194,4 2497 2187,6 6,1 54,4 12348 55522 106,2
32 Пермский край 8245,4 56 1482 1396,7 4510 17033,5 7,7 59,2 186817 133921 106,7
33 Кировская область 901 23 678 217,8 2249 1983 7,2 51,1 20200 37800 106,7
34 Оренбургская область 539,8 18 848 674,4 734 6063,4 2,6 58,2 112655 113004 105,7
35 Пензенская область 3730,7 26 1080 202,7 1134 4377 7 55,1 7931 57125 105,6
36 Саратовская область 2693,2 50 2839 561,6 4359 5632,5 2,7 52,8 31327 100686 105,3
37 Ульяновская область 7830,2 21 1078 268 1685 1497,2 19,8 46,2 12125 61768 106,7
38 Курганская область 218,7 14 343 126,8 835 1019,9 3,2 62,8 5948 27955 107
39 Алтайский край 990,9 39 1583 435,8 1511 2852,2 2,5 37,2 23273 70833 104,8
40 Новосибирская область 14581,5 111 4187 1008,5 2457 5563,1 5,4 41,3 50280 142078 106,2
41 Омская область 2526 38 2139 405,7 2632 21128,1 3 39,6 30403 83342 105
42 Томская область 7319,5 57 2349 466,7 1902 4094,3 4,2 46,4 40848 101927 106,1
1 -Внутренние затраты на научные исследования и разработки (млн. руб.);
2 - Число организаций, выполнявших научные исследования и разработки;
3 - Численность аспирантов, чел.;
4 - Оборот организаций (млрд. руб);
5 - Число используемых передовых производственных технологий;
6 - Затраты на технологические инновации (млн. руб.);
7 - Объем инновационных товаров, работ, услуг (в % от общего объема отгруженных
товаров, выполненных работ, услуг);
8 - Степень износа основных фондов (на конец года; в %);
9 - Сумма прибыли организаций (млн. руб.);
10 - Инвестиции в основной капитал (млн. руб.);
11 - Индексы потребительских цен.

240
ПРОДОЛЖЕНИЕ 1 ПРИЛОЖЕНИЯ 3
Таблица 2– Варианты № 16-30 Лабораторной работы№ 4
№ Области 1 2 3 4 5 6 7 8 9 10 11 12
1 Белгородская область 5,1 46 6,2 232,3 81,3 116,1 4,2 63,69 7,553277 6,5 86,3 0,1
2 Брянская область 7,7 89 4,6 243,1 92,2 113,8 3,1 16,02 4,4743844 8,1 89,9 0,1
3 Владимирская область 7 79 4,8 314,7 77,2 94,5 3,5 18,53 4,6346545 9,7 87,9 0,1
4 Воронежская область 7,1 63 12,3 241,2 91,1 115,6 4,4 35,02 13,127965 10,1 83,3 0,1
5 Ивановская область 6,7 88 5,5 275,7 103,9 103,7 3,1 19,42 5,0239715 9,2 85,9 0,1
6 Калужская область 7 73 4 257,4 99,7 100,9 4,1 6,36 5,6616632 13 82,6 0,2
7 Костромская область 6,4 82 2,3 234,2 96,6 116,4 3,1 27,25 2,2656191 9,7 91,7 0,1
8 Курская область 7,9 68 6,5 241,5 94 119,2 3,1 15,94 5,7368408 7,8 89,8 0,2
9 Липецкая область 6 71 4,7 321 100 120,3 3,1 179,7 6,0688019 8,8 92,5 0,1
10 Московская область 6,7 60 25,5 219,9 75,2 72,6 4,7 115,18 55,285148 8,5 79,1 0,2
11 Орловская область 7,2 79 3,1 254,2 102 114,7 3,9 8,19 3,393032 10,5 85,1 0,1
12 Рязанская область 8,3 62 6,5 236,5 99,2 113,9 3,6 61 8,3921534 10,5 83,9 0,1
13 Смоленская область 5,5 81 5,9 262 110,3 105,6 3,6 21,51 3,5953463 8,1 86,4 0
14 Тамбовская область 4,2 77 3,7 250,4 100,3 107,3 2,6 24,05 3,2943849 11,8 81,5 0,2
15 Тверская область 7,8 92 7,2 209,9 108,4 104,5 3,5 28,31 7,7046362 9,1 87,7 0,1
16 Тульская область 7,1 81 5,1 244,2 106,2 102,8 2,5 81,77 8,0445041 7,2 81,9 0,1
17 Ярославская область 6,9 80 8 273,3 115,2 109 3,9 38,35 8,0827832 8,3 79,4 0,1
18 Республика Карелия 4,9 87 3,2 248,3 105,8 127,7 3,2 55,81 6,9357916 6,5 74,8 0,1
19 Республика Коми 5 80 4,3 367,7 111,6 145,5 3,4 309,62 6,6613118 9,9 87,2 0,1
20 Архангельская область 6,8 96 6,9 355,1 102,6 138,6 2,4 287,87 8,7001431 10,2 89,9 0,1
21 Вологодская область 7,4 99 0,2 259,1 120,8 112,6 3,1 236,76 7,6560657 9,9 89,6 0,1
22 Калининградская 4,5 79 4,2 287,4 89,5 115,9 2,9 13,36 3,5450187 9,1 80,7 0,2
область
23 Ленинградская область 6,1 78 3,2 218,4 78 77,6 3,2 110,61 7,1558021 7,8 68 0,2
24 Мурманская область 5,3 58 5,9 242,1 73,9 76 3,1 146,87 6,4817139 9,6 76,1 0,1
25 Новгородская область 7,2 99 4,6 301,9 124,6 152 3,2 20,52 3,3124576 10,2 84,8 0,1
26 Псковская область 7,9 104 2,6 320,5 98,6 114,6 3,4 11,95 3,4929341 11,8 83,7 0,1
27 Республика Адыгея 7,3 59 41,5 316,7 89,9 100 3,7 1,42 2,018374 12,7 94,6 0,3
28 Республика Калмыкия 9,5 42 1,7 244 95,9 108,3 2,5 1,25 1,5044303 8,7 110,7 0,3
29 Краснодарский край 5,2 52 1,4 241,2 95 118,4 3,2 71,94 38,014508 19,7 96,4 0,2
30 Астраханская область 7,7 48 21,9 219,9 81,7 90,8 3,4 61,39 6,3633625 13,8 104,4 0,1
31 Волгоградская область 9,8 87 6,9 281,2 101,8 115,1 4,1 97,94 12,737016 8 90,4 0,2
32 Ростовская область 7,6 57 13,2 255 108,9 99,8 4,9 92,25 14,51417 15,1 85,3 0,1
33 Республика Дагестан 14,3 28 16,5 231 87,2 91,7 1 8,85 7,8871207 11,7 133,2 0,4
34 Республика Ингушетия 12,8 15 11,4 116,2 66,2 79,8 0,6 0,38 1,9928964 10,9 95,1 4,6
35 Кабардино-Балкарская 6 27 1,4 138,8 49,6 70 3,1 1,23 3,0928236 18,9 103,4 0,3
Республика
36 Карачаево-Черкесская 10,4 28 3,8 183,9 97,3 108,9 3,8 9,15 1,604709 7,5 101,5 0,2
Республика
37 Республика Северная 7,5 41 1,6 178,7 85,9 105 3,7 3,5 2,5638194 11,5 96,2 0,6
Осетия - Алания
38 Чеченская Республика 15,1 0 5 218,1 100,1 103,8 1 11,51 10,416677 10,4 199,1 1,6
39 Ставропольский край 8,3 12 3,6 191,4 82,5 73,3 4,5 33,16 9,0627275 12 88,8 0,2
40 Республика 6,9 50 17,2 239,9 86,2 110,9 4,6 203,84 19,421421 11,3 95,5 0,2
Башкортостан
41 Республика Марий Эл 6,5 86 2,3 292,4 111,5 119,5 2,2 16,47 2,9336831 9,4 90,1 0,1
42 Республика Мордовия 6,3 85 4,3 213,6 105,9 119,1 2,3 9,39 7,2600969 9,6 80,1 0,1
43 Республика Татарстан 5,6 71 16,7 223,9 77,6 106,5 3,2 119,03 22,864404 8,4 84,7 0,2
44 Удмуртская 6,6 62 8,9 278,3 101,9 122,1 3,8 49,17 6,2747559 7,3 96,2 0,2
Республика
45 Чувашская Республика 5,4 92 5,9 300,8 89,4 114,9 2,6 15,18 4,7890258 9,2 87,3 0,2
46 Пермский край 8,1 63 14,3 210,6 87,2 109,7 3 153,32 15,249881 8,9 93,6 0,3
47 Кировская область 7,6 72 6,5 254,1 111,1 130 2,9 53,33 6,9743216 10,7 84,1 0,1
48 Нижегородская область 7,9 73 15,7 255,6 102,9 109,8 3 75,81 16,168202 7,9 82,8 0,1
49 Оренбургская область 7,1 78 10,6 270 103,1 130,5 2,3 279,45 13,055047 10,3 103 0,1
50 Пензенская область 7,8 110 5,4 217,3 91,4 111,6 2,8 9,09 5,7348327 9,8 87,4 0,1
51 Самарская область 6,4 69 15,3 239 82,1 93,2 3,7 144,27 14,041894 7,7 81,9 0,1
52 Саратовская область 6 100 13,1 250,7 91,3 110,8 2,7 39,89 10,05083 8,9 85,1 0,1
53 Ульяновская область 6,4 84 4,7 251,4 91,6 127,8 3,4 13,76 6,2325862 8,4 82,9 0
54 Курганская область 8,7 73 2,7 237 97,7 123,6 3,1 30 4,3704661 13,4 99,3 0,2
55 Свердловская область 6,1 72 19,6 279,2 101,6 112,2 4,8 614,67 25,576947 8,4 88 0,2
56 Тюменская область 6,2 82 18,4 267,1 83,5 129,5 2,6 1 538,99 18,500088 8,4 100,8 0,2
57 Челябинская область 7,6 77 14,9 288,4 93,9 106,6 3,1 424,66 15,98258 10,4 93,8 0,2
58 Республика Алтай 9,5 75 0,9 301,4 92,5 139,3 2,7 6,98 1,8225859 12,9 143,7 0,2

241
ПРОДОЛЖЕНИЕ 2 ПРИЛОЖЕНИЯ 3
Продолжение таблицы 2– Варианты № 16-30 Лабораторной работы № 4
№ Области 1 2 3 4 5 6 7 8 9 10 11 12
59 Республика Бурятия 7,2 73 4 328,6 108,1 125,1 2,2 52,46 6,1156154 12,1 121 0,3
60 Республика Тыва 13 56 1,4 329,1 143,9 138,9 2 12,38 1,9794674 22 167,9 0,6
61 Республика Хакасия 8,5 76 2 322,4 90,6 112,2 3,4 53,14 2,9375737 11,1 107,7 0
62 Алтайский край 9,4 66 11,8 347,9 112,1 109,2 2,9 102,58 10,177715 11,5 93,3 0,1
63 Забайкальский край 7,4 68 6,2 247,8 116,7 117,2 2,4 72,43 8,867567 9,2 119,7 0,2
64 Красноярский край 9,2 91 15,2 301,6 102,1 121 2,9 1 244,41 23,861919 12,7 90,1 0,1
65 Иркутская область 9,8 79 12,1 282,4 108,7 111,5 2,6 312,41 14,716107 12,6 110,8 0,2
66 Кемеровская область 8,3 88 13,2 248,9 92,7 106,9 3,4 665,51 18,031828 10,9 102,4 0,1
67 Новосибирская область 7,4 105 15,5 254,1 109,1 106,7 2,8 120,48 13,214815 10,4 87,9 0,2
68 Омская область 6,5 56 10,7 237,1 99,2 113,8 3,3 111,21 12,176887 9,2 86,9 0,2
69 Томская область 6,5 90 7,3 266,7 113,7 102 3,4 153,21 4,8097342 12,6 77,7 0,1
70 Республика Саха 6,5 80 5,5 270,1 114,9 132,6 3 83,22 12,672758 11,3 128,8 0,3
(Якутия)
71 Камчатский край 7,2 103 1,6 274,7 128,1 118,7 2,3 128,22 5,1365496 14,3 91,6 0,3
72 Приморский край 9,4 74 10,3 224,9 91,7 82,5 2,9 63,43 10,361957 12,8 83,6 0,1
73 Хабаровский край 9,6 103 8,2 272,7 97,3 103,7 3,8 60,31 12,290971 12,3 86,8 0,1
74 Амурская область 10,5 106 5,2 280,5 114,8 125,7 2,6 20,07 8,0063506 15,9 97,6 0,1
75 Магаданская область 12,8 129 0,9 389,5 148,8 154,6 2,3 13,49 4,4383644 15 81 0,1
76 Сахалинская область 9,3 115 2,4 257,6 142,2 132,8 3,5 50,06 11,934537 10,8 89,2 0,1
77 Еврейская автономная 5,9 102 0,6 236,2 141,1 122,1 3,2 10,41 1,7589548 17,6 97,6 0
область
78 Чукотский автономный 21,8 75 0,4 504,3 171,2 160,9 1,8 10,92 0,8267025 23 101,9 0
округ

1- Коэффициент младенческой смертности, %;


2 - Число прерывания абортов;
3 - Численность врачей всех специальностей, чел.;
4 - Мощность амбулаторно-поликнических учреждений на 10000чел.;
5 - Число больничных коек на10000чел;
6 - Численность среднего медицинского персонала на10000чел;
7 - Доля потребительских расходов домашних хозяйств на здравоохранение (по
материалам выборочного обследования бюджетов домашних хозяйств; %;
8 - Выбросы загрязняющих атмосферу веществ, отходящих от стационарных источников;
9 - Доля расходов консолидированных бюджетов субъекта Российской Федерации на
здравоохранение, физическую культуру и спорт, %;
10 - Вероятность смерти от момента рождения до 5 лет(мальчики и девочки);
11 - Родившиеся живыми на 1000 жен в возрасте 20-24;
12 - Родившиеся живыми на 1000 жен в возрасте 45-49.

242
ПРОДОЛЖЕНИЕ 3 ПРИЛОЖЕНИЯ 3
Таблица 3– Варианты № 31-45 Лабораторной работы№ 4
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Белгородская область 11,1 14,1 24,5 1172 66,4 8,6 4,2 18800 17667,6 311,2 80,3 239,5 40,1 777,6 134 72 1036
Брянская область 10,9 16,1 24,8 1193 69,2 12,6 3,1 15348 13912 323 91,4 251,1 36,1 855,9 37 75 1533
Владимирская область 10,9 17,1 26,4 1219 77,6 17,5 3,5 14312 16313,9 318,3 83,9 324,4 34,8 931,4 35 126 1659
Воронежская область 10,2 15,9 26,5 1189 65,9 17,3 4,4 15871 16054,7 312,9 94 253,6 54 553,3 72 135 1158
Ивановская область 10,4 16,9 26,5 1235 81 19 3,1 13006 14436,2 310,6 101,4 214,7 54,5 941,7 37 99 1628
Калужская область 10,9 15,4 25,5 1174 75,9 11,1 4,1 17557 20000,8 297,5 102,6 262,2 39,9 716 13 88 1496
Костромская область 12,3 16,6 25 1193 70,2 16,2 3,1 14823 14890,5 314,1 99,5 247,1 35,7 796,1 50 46 1394
Курская область 11,5 16,8 26 1207 65,9 10,4 3,1 16387 16240,8 339,6 91,1 244,8 57,1 618,5 42 50 1504
Липецкая область 10,7 15,2 25,4 1193 63,9 10,6 3,1 16811 17010,4 323,3 94,1 325,5 41,5 715,8 345 82 1315
Московская область 11 14,1 23,9 1168 80,1 9,6 4,7 25605 28585,6 261 82,4 226,3 40,8 686,5 192 1220 1592
Орловская область 10,5 16,3 26,1 1217 65,7 14,5 3,9 14824 14528,6 338,3 101,9 257,2 40,4 891,2 23 54 1610
Рязанская область 10,2 16,4 27,6 1199 71 16 3,6 14788 16717,7 336,9 98,3 224,5 57,3 703,5 122 84 845
Смоленская область 10,4 16,8 25,2 1189 72,6 17,3 3,6 15969 16189,4 305,7 109,2 270,4 60 756,9 48 68 1856
Тамбовская область 9,3 16,4 27,2 1176 58,8 10,7 2,6 15151 14292,9 324,2 92,8 257,4 33,9 673,9 48 9,2 1247
Тверская область 11 18,7 26,9 1211 74,9 13,5 3,5 14943 17747,3 317,1 106,7 218,3 54,6 875,4 67 93 2150
Тульская область 9,4 17,7 28,1 1223 79 10,9 2,5 16975 17225,1 356,9 95,4 246,4 33,8 712,8 193 187 949
Ярославская область 11,1 15,8 26,6 1238 81,9 13,4 3,9 15509 18111 318,3 109,4 274,2 65,8 896,8 78 218 1454
Республика Карелия 12 14,8 23,5 1195 78,4 15,7 3,2 17543 22173,9 365,5 101,1 256,3 50,4 1100,9 96 175 2224
Республика Коми 13,1 12,4 18,4 1117 77,2 16,4 3,4 23897 28897,3 329,5 111,5 374,2 47,8 1047,2 712 129 1928
Архангельская область 12,2 13,9 22,5 1140 76,2 14,4 2,4 21455 24611,4 349,5 101,9 346,7 56,6 1061,1 373 375 2033
Ненецкий автономный 15,2 10,5 14,9 1054 69,1 7,7 1,9 54632 50035,8 292,8 121,4 259,9 46,9 158 0,2 1826
округ
Вологодская область 13 15,7 23,2 1172 71,2 17,1 3,1 15638 20250,3 297,8 89,5 293,6 34,8 882,4 469 157 2108
Калининградская область 11,8 13,3 22,6 1130 77,5 12,7 2,9 16880 19911,1 260,5 77,2 227,5 35,4 811,8 25 91 1609
Ленинградская область 8,6 14,7 25,2 1146 65,4 13 3,2 15932 23302,6 268,6 70,2 241,5 34,2 553,4 216 231 1429
Мурманская область 11,5 11,5 19 1093 92,7 13,6 3,1 25303 32341,6 315,7 123,7 297 57,9 851,2 263 334 2019
Новгородская область 11,3 18,4 26,5 1227 70,6 15 3,2 16981 18636,5 319,9 98,4 310,3 41,1 897,1 42 92 1773
Псковская область 10,5 19,4 27 1178 70,2 16,7 3,4 14185 15721,2 314,7 103,4 259,6 35,5 676 28 45 1689
Республика Адыгея 12,6 13,8 23,5 1149 46,9 14,6 3,7 14272 14344,9 275,5 90,5 246,7 38,4 690 4 28 1035
Республика Калмыкия 14,6 10,1 16,9 1083 44,4 35,8 2,5 8829 12559,1 247 95,8 248,8 50,1 667,9 4 33 1320
Краснодарский край 12,2 13,5 24,1 1156 53,3 13,5 3,2 18796 18416 278 83,3 223,7 41,9 621,3 161 920 1262
Астраханская область 14,2 13 21,4 1123 66,7 14,2 3,4 16032 17022,8 241,9 106,6 283,9 70,3 739 132 71 2241
Волгоградская область 11,2 13,8 24,5 1161 76,1 15,1 4,1 14519 16191,5 284,6 106,7 255,9 50,5 708,6 178 150 1538
Ростовская область 10,9 14,3 24,5 1158 67,5 15,2 4,9 16010 16949,5 291,9 90,8 233,1 39,8 816,9 154 235 1319
Республика Дагестан 18,7 5,8 11,1 1079 45,1 8,3 1 18278 11235,8 187,9 69,4 113,9 39,5 806,1 17 78 429
Республика Ингушетия 27 4 9,1 1233 39,2 18,5 0,6 11562 14513,2 192,6 47,8 133,8 34,1 943,5 0,1 4,3 458
Кабардино-Балкарская 15 9,4 17 1141 54,3 15,3 3,1 12636 13011,5 213,6 96,9 198,5 46,4 405,8 2 32 964
Республика
Карачаево-Черкесская 13,2 9,9 18,5 1164 43,1 18,8 3,8 11742 12446,9 241,5 83,6 178,7 35,4 495,1 25 47 832
Республика
Республика Северная 14,6 10,9 20,9 1157 63,9 12,6 3,7 13757 13376 297,1 105 236,3 74,5 685,5 4 97 931
Осетия - Алания
Чеченская Республика 29 5,3 8,3 1036 34,9 … 1 14026 14431,4 265,9 74 200,2 26,8 571,4 20 0 330
Ставропольский край 11,8 12,3 21,9 1150 57,4 18,3 4,5 14440 15588,7 256,5 76,4 192,2 44,7 579,2 68 138 1246
Республика Башкортостан 13,8 13,4 20,6 1139 60,8 12,6 4,6 19030 18397 264 84,8 241,7 43,1 860,6 406 321 1683
Республика Марий Эл 13,1 14,2 21,3 1149 63,8 24,2 2,2 11328 14001,2 278,2 101 306,9 34,6 863,5 29 57 1562
Республика Мордовия 9,5 14,8 24,1 1175 61 20,2 2,3 11948 13305,1 301,1 106,5 218,2 51,8 710,3 34 42 937
Республика Татарстан 13,4 12,4 21,8 1164 75,7 8,1 3,2 20223 20009,4 274,5 76,7 241,6 44,2 849,8 278 498 1458
Удмуртская Республика 14,4 13,4 20,9 1174 68,9 14 3,8 14452 15843,3 274,2 97,9 273,5 58,2 947,7 104 127 1841
Чувашская Республика 12,9 13,6 21,7 1149 59,4 19,3 2,6 12083 14896,3 275,4 88,6 305,9 48,9 996,9 28 10 1441
Пермский край 14,1 14,7 22,2 1183 74,9 14,4 3 21307 18773,3 290,5 86,8 213 54,6 937,3 375 397 2218
Кировская область 11,9 15,8 25,1 1176 74,5 15 2,9 14675 14579 319,5 105,7 258,1 49,1 788,5 99 176 1521
Нижегородская область 11 16,4 25,4 1211 79 12,5 3 18337 18492,4 307,3 105,5 261,7 50,2 881,9 142 461 1987
Оренбургская область 13,9 14,3 21,8 1151 59,6 14,4 2,3 14892 17024,9 289,7 101,8 266,9 52,2 851,9 658 132 1530
Пензенская область 10,1 15,2 26,3 1191 67,6 15,4 2,8 14171 16362,2 310 93,3 221,2 40,4 760,9 37 108 1084
Самарская область 11,5 14,4 24,3 1186 80,3 15,2 3,7 21756 18600,3 289,9 89,7 256,4 49,4 1019,1 292 395 1942
Саратовская область 10,7 14,5 24,9 1189 74,8 17,3 2,7 13097 16204,7 287,3 98,5 259,7 53 756,4 109 18 1302
Ульяновская область 10,8 14,8 24,8 1183 73,8 16,8 3,4 14312 15008,6 306,8 92,1 249,8 36,8 946,1 42 115 1288
Курганская область 12,8 15,7 25,3 1178 60,4 18,5 3,1 14353 14833,1 318,3 100,1 236,6 30,2 868,8 47 46 2392
Свердловская область 13,5 14,1 23,4 1182 84 10,5 4,8 24893 22179,2 294,8 100,1 281,1 45,4 739,7 1091 770 1798
Тюменская область 16,1 8,5 13,9 1071 78,7 13 2,6 29754 42289 233,2 82 271,1 53,8 848 3293 183 2205
Ханты-Мансийский 16,4 6,5 11,1 1045 91,6 11,6 2,5 32530 45498,1 224 81,9 263,2 54,6 2353 31 2011
автономный округ - Югра
Ямало-Ненецкий 15,6 5,4 8,1 987 85 7,5 1,4 46670 59095,3 216,7 96,1 209,1 48,7 834 27 1770
автономный округ
Челябинская область 13,6 14,2 23,2 1185 82,1 10,8 3,1 18460 20015 287,7 97,8 293,2 43,9 890 694 836 2216
Республика Алтай 22,7 12,2 15,4 1114 28,7 18,6 2,7 13837 15632,4 259,1 88,7 292,6 41,7 919,2 9 0,3 2372
Республика Бурятия 17 12,7 17,3 1103 58,8 20,1 2,2 15715 19924 253,4 93,6 229,3 46 644,6 90 8 2485
Республика Тыва 27,5 11 9,9 1102 53,6 30,6 2 10963 19163,1 252,8 142,6 331,6 37,9 615,2 19 9 1799
Республика Хакасия 15,1 13,4 20,3 1157 67,5 18,6 3,4 14223 20689,5 269,9 85,5 324,5 50,4 820,8 90 36 2029
Алтайский край 12,7 14,6 23,5 1165 55,2 22,6 2,9 12500 13822,6 296,8 108,1 285,5 57,2 1052,4 204 12 1863
Забайкальский край 15,5 13,3 17,6 1091 66,4 18,9 2,4 15969 21099,6 252,5 111,3 258,8 52,9 725,1 131 95 2764
Красноярский край 13,5 13 20,3 1145 76,5 18,1 2,9 20145 25658,6 277,1 95,9 318,8 50,9 831,3 2517 448 2226
Иркутская область 15,3 14 20,1 1162 79,6 19,2 2,6 16017 22647,7 299,4 111,9 279,1 48,4 920,5 621 583 2411
Кемеровская область 12,7 15,5 22,3 1181 85,4 11,6 3,4 16666 20478,8 304,8 94,3 253,5 58,5 840,8 1390 661 2444
Новосибирская область 13,1 13,6 22,7 1149 77,6 16,5 2,8 18244 20308,5 278,9 103,5 253,7 58,8 767,7 234 94 2112
Омская область 13,6 13,5 21,6 1165 71,6 12,7 3,3 17248 19087,8 277,8 97,6 240,6 70,1 849,2 236 170 1511
Томская область 13 12,2 20,1 1130 70,9 17,8 3,4 16516 24001 261,5 114,5 259,2 58,1 813,6 379 26 2166
Республика Саха (Якутия) 17,1 9,4 13,4 1057 64,6 18,6 3 25617 34051,5 261,3 114,1 281,2 53,8 1047,4 157 87 1578
Камчатский край 12,5 12,1 17,9 1014 77,5 19,2 2,3 28965 39325,9 286,6 135,8 273,3 56,1 897,2 31 38 1662
Приморский край 12 14,1 22 1085 76,3 15,7 2,9 19160 24423 270,2 107,2 233 63,5 812,4 225 336 2338
Хабаровский край 12,9 14,5 21,1 1101 81,5 15,8 3,8 23766 26155,7 285,5 102,6 283,1 65,6 732 113 188 2048
Амурская область 13,6 14,8 20,2 1112 67 20,4 2,6 17790 24202,1 280,4 126,9 305,3 55,7 794 134 79 2193
Магаданская область 11,6 13 17,6 1060 95,7 13,9 2,3 30452 41933,7 302,9 138,8 446,6 50,9 758,8 25 26 2071
Сахалинская область 11,8 14,2 20,3 1077 80,3 11,9 3,5 32268 38770,7 326,6 144,1 265,1 36,6 885,2 92 46 2021
Еврейская автономная 14,2 15,5 20 1103 68,1 20,1 3,2 16525 22927,5 267,9 146,1 242,7 76,5 712,2 25 16 2121
область
Чукотский автономный 13,6 11,1 10,8 971 66 9 1,8 43049 53369,3 278,5 147,7 495,6 48,1 1246,8 22 5 1437
округ

243
ПРОДОЛЖЕНИЕ 4 ПРИЛОЖЕНИЯ 3

Наименование признаков в таблице 3 – Варианты № 31-45


Лабораторной работы№ 4

1 - общий коэффициент рождаемости (число родившихся на 1000 человек населения)


2 - общий коэффициент смертности (число умерших на 1000 человек населения)
3 - население старше трудоспособного возраста (оценка на конец года; в процентах от
общей численности населения)
4 - Cоотношение мужчин и женщин (оценка на конец года; на 1000 мужчин приходится
женщин)
5 - Удельный вес городского населения в общей численности населения (оценка на конец
года; в процентах)
6 - Численность населения с денежными доходами ниже величины прожиточного
минимума (в процентах от общей численности населения субъекта)
7 - Доля потребительских расходов домашних хозяйств на здравоохранение (по
материалам выборочного обследования бюджетов домашних хозяйств; в процентах)
8 - Среднедушевые денежные доходы населения (в месяц; рублей)
9 - Среднемесячная номинальная начисленная заработная плата работников организаций
(рублей)
10 - Численность пенсионеров на 1000 человек населения
11 - Число больничных коек на 10 000 человек населения
12 - Мощность амбулаторно-поликлинических учреждений на 10 000 человек населения
(на конец года; посещений в смену)
13 - Численность врачей на 10 000 человек населения (на конец года; человек)
14 - Заболеваемость на 1000 человек населения (зарегистрировано заболеваний у больных
с диагнозом, установленным впервые в жизни)
15 - Выбросы загрязняющих веществ в атмосферный воздух, отходящих от стационарных
источников (тысяч тонн)
16 - Сброс загрязненных сточных вод в поверхностные водные объекты (миллионов
кубических метров)
17 - Число зарегистрированных преступлений на 100 000 человек населения

244
ПРОДОЛЖЕНИЕ 5 ПРИЛОЖЕНИЯ 3
Таблица 4– Варианты № 46-60 Лабораторной работы№ 4
Область 1 2 3 4 5 6 7 8 9 10 11 12 13
Белгородская область 18800 106,8 397069,9 134620 797428 40383 4959 9,8 698,1 33462 29,5 166558 1148,2
Брянская область 15348 111,7 144264 33192 431052 29219 5128 13 561,2 21807 38 135801 421,4
Владимирская область 14312 108,2 218712,3 24181 506112 38648 5983 11,9 704,2 35422 34,1 122487 437,6
Воронежская область 15871 108,3 328770,8 101470 1019463 35134 5662 11,4 1054,9 54221 35 264359 996,2
Ивановская область 13006 117,1 98209 13102 564135 33088 5738 15,2 491 30890 39 90945 216,6
Калужская область 17557 125,6 184580,5 24625 513811 49924 5412 11,2 480,1 26761 32,6 119066 598,4

Костромская область 14823 107,9 92291,4 15264 312406 31840 5962 10,2 315 17552 33,6 59579 156,4
Курская область 16387 105,3 192442,2 56531 494722 27909 5180 11,1 579,7 23089 34 115979 394,4
Липецкая область 16811 104,2 254738,1 47418 717970 37429 5356 12,2 544,5 21074 32,6 138577 761,7
Московская область 25605 110,6 1796535,6 100414 5012245 69119 6801 14,9 2911,3 236263 26,5 1207783 8244,2
Орловская область 14824 107,6 102450,1 36618 298079 28770 4966 11,3 392,8 16231 32 73855 333,5
Рязанская область 14788 108,9 173526 31021 673713 35221 5901 13,8 502,4 33594 35,4 112883 478,1

Смоленская область 15969 101,7 149091,4 18621 543205 35690 6574 14,5 495,8 25728 32,2 109596 370,7

Тамбовская область 15151 116,4 139017,4 51962 521673 27961 4593 11,7 504,1 17926 32,5 115035 603,3
Тверская область 14943 110,1 218643,6 23933 825225 43422 5837 11,1 586,8 37768 37,7 142302 421,9
Тульская область 16975 112,9 237208,1 29769 635993 42152 5493 11,2 770,8 37591 36,7 171442 262,7
Ярославская область 15509 124,3 234246,3 21824 934472 41873 5518 12,3 638 45599 30,9 128071 411,2
Республика Карелия 17543 99,7 127733,8 4693 408974 45889 7228 12,3 316,1 23110 30,6 69920 177,8

Республика Коми 23897 104,7 352334,5 8629 1365693 43859 8226 13,3 461,1 22513 33 126605 115,6
Архангельская область 21455 87,1 355884,2 11613 1161604 49148 7722 9,6 605,9 26121 26,5 144731 283,2
Вологодская область 15638 104,8 252063,2 23278 1018443 39450 6346 12,4 589,9 39375 33,1 100024 434,4
Калининградская
область 16880 121,8 195063,2 18196 447257 40087 5955 9,8 471,7 52004 34,8 100895 544,9
Ленинградская область 15932 107 502126,1 57733 1506817 50331 5775 14,1 747,6 39772 33,8 209684 1075,9
Мурманская область 25303 99,3 234649,1 3245 1163343 45000 8737 12,8 427,4 21418 26,1 112750 23,2
Новгородская область 16981 110,6 127270,8 18005 316982 36190 5801 11,3 315,6 15178 29,2 67746 277,8

Псковская область 14185 109,9 84344,7 11706 272812 33970 6113 10,8 329,8 15329 34 68962 177,7
г. Санкт-Петербург 25995 113,3 1673684,4 3243788 78851 6221 9,9 2500,9 367457 28,6 742104 2705,7
Республика Адыгея 14272 107,9 46149 12337 118216 30064 5100 8,9 151,9 6969 28,4 44977 122,3
Республика Калмыкия 8829 88,9 24343,5 13874 113426 23753 5331 10,8 113,6 8003 38,3 12362 103,9
Краснодарский край2) 18796 107,1 1008152,5 239235 2471453 39215 5976 11,4 2288,5 132681 35,7 731408 3691,7
Астраханская область 16032 115,3 145430 20930 747640 33687 5378 10,4 448,5 17880 30,9 116786 504,3

Волгоградская область 14519 104,8 437414,2 76111 1346669 37620 5742 11,6 1226,1 52909 30,7 254394 628,7
Ростовская область 16010 113,8 632196,9 149048 1751414 45664 5824 11,9 1902,2 91802 36,1 542502 1880,3
Республика Дагестан 18278 105,2 285278,9 57182 821966 27695 4871 6,6 966,6 29837 54,1 358216 1212,4
Республика
Ингушетия2) 11562 113,3 21536,7 4476 40918 27000 4959 7,3 68,7 4106 65,3 13274 81,8
Кабардино-Балкарская
Республика 12636 100,3 76056,5 27737 185443 32231 4918 10,1 308,8 12295 38,3 73111 273
Карачаево-Черкесская
Республика 11742 109,8 43324,1 19197 126319 18206 5081 12 172,8 6632 40,2 31036 82,4

Республика Северная
Осетия – Алания 13757 110,6 74844,8 21464 182119 28630 4984 10,4 299,2 11541 34,9 67363 200,1
Чеченская
Республика2) 14026 92 69675,7 12897 300776 37206 6600 3,5 312,9 10430 56,9 73083 76
Ставропольский край2) 14440 105,1 316888,9 103470 980437 29606 5802 11,5 1245,3 56566 32,5 332365 1267

245
ПРОДОЛЖЕНИЕ 6 ПРИЛОЖЕНИЯ 3

Наименование признаков в таблице 4 – Варианты № 46-60


Лабораторной работы№ 4

1 - Величина среднедушевых доходов (в месяц, рублей);


2 - Индексы промышленного производства (в процентах к предыдущему году );
3 – Валовой региональный продукт, млн. руб.;
4 - Продукция сельского хозяйства, млн. руб.;
5 - Основные фонды в экономике по полной учетной стоимости, млн. руб.;
6 - Средние цены на первичном рынке жилья (на конец года; рублей за квадратный метр
общей площади);
7 - Величина прожиточного минимума (в среднем на душу населения), рублей в месяц;
8 - Удельный вес расходов домашних хозяйств на оплату жилищно-коммунальных услуг
(в процентах от общей суммы потребительских расходов);
9 - Среднегодовая численность занятых в экономике, тыс. человек;
10 - Число предприятий и организаций;
11 - Удельный вес расходов домашних хозяйств на продукты питания и безалкогольные
напитки (в процентах от общей суммы потребительских расходов);
12 - Оборот розничной торговли, млн. руб.;
13 - Ввод в действие общей площади жилых домов, тыс. м2.

246
ПРОДОЛЖЕНИЕ 7 ПРИЛОЖЕНИЯ 3
Таблица 5– Варианты № 61-75 Лабораторной работы№ 4
Область 1 2 3 4 5 6 7 8 9 10 11 12 13
Республика
Башкортостан 19030 109,6 757569,6 108922 1703359 38238 5407 10,3 1760,7 80970 30,5 577987 2109,3
Республика Марий Эл 11328 107,9 82425,9 21911 264186 37314 5114 10,9 317,5 15422 28,3 50283 314,8
Республика Мордовия 11948 100,6 104327,3 37817 390900 35020 5352 13,8 382,6 15973 31,9 52995 298,1
Республика Татарстан 20223 106,4 1004690 150441 3461464 35750 5001 11,8 1819,9 103545 29,9 534877 2396,1
Удмуртская
Республика 14452 108,6 264464,1 45466 753970 35603 5277 10 757 34664 25,2 140015 504,9
Чувашская Республика 12083 112,4 152489,6 32122 561249 34740 5247 10 572 23115 29,9 97045 886,4

Пермский край 21307 114,5 630755,5 40557 2078245 44834 6690 9,7 1324,5 77304 25,4 365876 748,8
Кировская область 14675 106,4 166218,6 27809 602726 31741 5718 10,3 655,9 37398 29,1 116617 405,4
Нижегородская
область 18337 109,5 646676,5 49085 1731930 45972 5950 14 1700,6 89825 27,6 421499 1470,7
Оренбургская область 14892 100,8 454993,1 72390 1259018 34062 5345 11,8 1069 41174 28,3 187099 743,3
Пензенская область 14171 119,2 158213,8 38598 613333 31428 5338 11,2 666,8 27542 38,1 131017 671,1
Самарская область 21756 106 692927,6 50982 2005380 36405 6420 10,6 1504,8 101930 27,8 463930 1331

Саратовская область 13097 109,5 369630,4 89475 1215058 34206 5271 13,3 1206,6 49881 42,6 214476 1169,6

Ульяновская область 14312 109,6 174747,9 29541 525557 33030 5432 12,3 605,3 28529 36,1 115442 553,8
Курганская область 14353 110,3 115222,8 31727 521738 33597 5570 10,7 395,1 17451 28,7 80002 182,6
Свердловская область 24893 106,3 1033747,7 56587 3285624 42011 6513 9,6 2047,4 195670 29,1 764558 1822,2
Тюменская область 29754 99,2 3292882,9 60902 13758304 45111 6325 11 1943,4 96747 23,9 550699 2147,6
Челябинская область 18460 106,3 645932 84385 1869475 32332 5552 12,4 1678,6 105182 28,6 421350 1314,3

Республика Алтай 13837 104 21635,8 8020 61628 33157 5870 10,7 91,7 8262 37,9 14312 76,6
Республика Бурятия 15715 113,7 136374 13044 430210 32797 6229 14 417,4 18953 28 100938 304,4
Республика Тыва 10963 97,3 30601 4648 47409 35250 5994 9,2 106 3696 34,1 13742 52,4
Республика Хакасия 14223 107,7 93709 9371 292915 32018 5895 10,6 239,2 10653 30,8 46034 156,2
Алтайский край2) 12500 107,9 299715,3 93784 757632 32237 5943 13,9 1075,6 56770 32,5 218077 663,2
Забайкальский край 15969 106,3 162100,2 15154 650405 37807 6368 13,3 489,4 15746 38,7 106366 276,9
Красноярский край 2)
20145 102,8 1050158,5 68598 1815754 43906 7028 11,2 1437,5 71435 26,4 361607 1047,1

Иркутская область 16017 112,3 539245,6 43610 1975486 45218 6086 9,8 1121,7 61591 28,8 225846 755,2
Кемеровская область 16666 105,1 622513 38044 1406912 36219 5151 10,3 1302 51212 24,8 287279 1082,6
Новосибирская область 18244 106,5 482026,5 60425 1229181 34129 6482 11,4 1305,1 159034 41,3 368292 1505,2
Омская область