Вы находитесь на странице: 1из 17

Геращенко Ярослав Юрьевич 1

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ


ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ
УЧРЕЖДЕНИЕ
ВЫСШЕГО ОБРАЗОВАНИЯ
НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ЯДЕРНЫЙ УНИВЕРСИТЕТ
«МИФИ»

КАФЕДРА «ФИНАНСОВЫЙ МОНИТОРИНГ»

ОТЧЕТ
по лабораторной работе №3
по курсу «Эконометрика»

(подпись) (Фамилия И.О.)

Выполнил: студент группы С17-703 Геращенко Я. Ю.

Проверил: Домашова Д. В.

(оценка) (подпись) (Фамилия И.О.)

Москва 2020 г
Геращенко Ярослав Юрьевич 2
Оглавление
1. Введение ............................................................................................................................. 3
2. Постановка задачи ............................................................................................................. 4
3. Построение МНК-оценок коэффициентов ЛММР ........................................................... 5
4. Исследование регрессионных остатков на наличие/отсутствие автокорреляции ........... 7
Критерий Дарбина – Уотсона ................................................................................................... 9
5. Построение обобщенной линейной модели множественной регрессии ........................ 10
Приложение А (исходные данные) .......................................... Error! Bookmark not defined.
Геращенко Ярослав Юрьевич 3

1. Введение
Предположение классической линейной модели множественной
регрессии, касающееся некоррелированности регрессионных остатков может
нарушаться в случаях неверной спецификации (параметризации) модели и,
как правило, нарушается при анализе данных, имеющих характер временных
рядов.
Линейные модели множественной регрессии с коррелированными
остатками классифицируются, как обобщенные линейные модели
множественной регрессии (ОЛММР). МНК-оценки такой модели
несмещены, состоятельны, но неэффективны.
ОМНК-оценки параметров ОЛММР эффективны, но для их построения
требуется оценка ковариационной матрицы вектора регрессионных остатков.
В лабораторной работе рассмотрены примеры построения параметров
ОЛММР в случае автокорреляционной зависимости первого порядка между
регрессионными остатками.
Цель работы заключается в формировании навыков исследования
регрессионных моделей с коррелированными остатками.
Геращенко Ярослав Юрьевич 4

2. Постановка задачи
Рассмотрим процедуру исследования линейной модели множественной
регрессии на наличие или отсутствие явления автокорреляции на основе
информации Приложения А. Для этого необходимо:
1. Построить МНК-оценки коэффициентов линейной модели
множественной регрессии;
2. Исследовать регрессионные остатки на наличие автокорреляции;
3. Используя процедуру Кохрейна-Оркатта, построить ОМНК-
оценки параметров ОЛММР с автокоррелированными остатками.
Геращенко Ярослав Юрьевич 5

3. Построение МНК-оценок коэффициентов ЛММР


Для оценки параметров регрессионной модели воспользуемся методом
пошаговой регрессии (методом включения переменных). Процедура
построения уравнения множественной регрессии более подробно
рассмотрена в лабораторной работе №1.

Результаты оценки коэффициентов уравнения регрессии, с


использованием пакета STATISTICA, представлены на Рисунке 1.

Рисунок 1 - Результаты оценивания параметров регрессионной модели


(Statistica)

В результате проведения пошаговой регрессии получили следующую


оценку уравнения регрессии:
Оценка уравнения регрессии выглядит следующим образом:

Y=63.9838-0.611*X2-0.021*X7+1.090*X3

(4.075) (0.101) (0.01) (0.537)

Далее можно приступить к исследованию остатков регрессионной


модели. Формально проверим тест на нормальный характер распределения
регрессионных остатков.

Результаты исследования регрессионных остатков представлены на


рисунке 2.
Геращенко Ярослав Юрьевич 6

Рисунок 2 – Гистограмма распределения регрессионных остатков (Statistica)

Результаты формальной проверки гипотезы о нормальном характере


распределения регрессионных остатков позволяют ее не отвергнуть, и есть
смыл проводить дальнейший анализ построенного уравнения множественной
регрессии.
Как видно из отчета, коэффициенты при переменных Х 2 , Х3 и Х7
значимо отличается от нуля, т.к. нулевая гипотеза (Н0: 2/3/7=0 при
альтернативной Н1: 2/3/70) отклонена. Регрессионная модель адекватна
экспериментальным данным.
Исследуем регрессионные остатки на наличие/отсутствие
автокорреляции.
Геращенко Ярослав Юрьевич 7
4. Исследование регрессионных остатков на наличие/отсутствие
автокорреляции
Линейная модель множественной регрессии Y  X   , для которой
нарушено 5 условие Гаусса-Маркова называется обобщенной линейной
моделью множественной регрессии (ОЛММР) с автокоррелированными
остатками, а именно:
1. х1,…,хк – детерминированные переменные;
2. ранг матрицы Х равен "к+1" – среди признаков нет линейно
зависимых;
3. M i  0 , i  1, n - нет систематических ошибок в измерении у;

4. D i  M i2   2 , i  1, n

5. cov( i ,  j )  M ( i   j )  0 , i  j , i  1, n j  1, n
Автокорреляция 1 порядка: , где – коэффициент
автокорреляции первого порядка( ≤1), – случайная величина,
удовлетворяющая условиям Гаусса-Маркова.

В условии автокорреляции первого порядка делается предположение,


что зависимость между остатками ослабевает по мере их взаимного удаления
друг от друга, поэтому коэффициент корреляции .
Наличие автокорреляции можно проверить по графику зависимости
регрессионных остатков от номера наблюдения.
Геращенко Ярослав Юрьевич 8

Рисунок 3 – График зависимости значений регрессионных остатков от


номера наблюдения

По графику регрессионных остатков можно предположить наличие в


регрессионных остатках отрицательной автокорреляции.
Кроме визуального анализа, существует критерий Дарбина-Уотсона, с
помощью которого выявляется автокорреляции первого порядка.
Геращенко Ярослав Юрьевич 9

Критерий Дарбина – Уотсона


Критерий Дарбина-Уотсона позволяет выявить автокорреляцию
первого порядка.
Выдвигаем следующие гипотезы:
: Нет автокорреляции первого порядка, то есть ;
: Есть автокорреляция первого порядка, то есть .

Воспользуемся статистикой Дарбина-Уотсона .

Рисунок 5 – Значение критерия Дарбина-Уотсона и оценка


коэффициента корреляции регрессионных остатков

DW=2, 6139
Так как DW > 2, то наше предположение о возможном наличии
отрицательной автокорреляции допустимо. Для расчета критического
значения воспользуемся таблицей значений статистики Дарбина-Уотсона. В
нашем случае для n=50, k=3 получаем dн=1,42 и dв=1,67.
Так как 4-dв<DW<4-dн, то есть DW попадает в зону неопределенности,
то мы не можем сделать однозначный вывод по поводу принятия или
отклонения нулевой гипотезы об отсутствии автокорреляции первого
порядка ( H 0 :   0 ).
Геращенко Ярослав Юрьевич 10

5. Построение обобщенной линейной модели множественной


регрессии
Для построения обобщённой линейной модели множественной
регрессии нам нужно рассчитать ОМНК-оценки коэффициентов уравнения
регрессии:
bомнк=(ХТ∑-1 0Х)-1(ХТ∑-10Y)
При наличии автокорреляции первого порядка матрица (∑ -10) имеет
вид:
1  ... 0
  1   2 ... 0 
1 1 
0 
1   2  ... ... ... ...
 
0 0 ... 1
Таким образом, задача сводится к оценке параметра ρ. Для решения этой
  Кохрейна-Оркатта:
задачи воспользуемся процедурой
1) находим оценку модели регрессии: Y  X мнк ;
1) Находим
2) используя построенную оценку оценку
модели модели регрессии
регрессии, находим оценку вектора
регрессионных остатков:
2) Используя построенную оценку модели регрессии, вычисляем
  
e    Y  Y  Y  X мнк
регрессионные остатки первой итерации . Это было сделано ранее.
3) находим оценку3) Находим оценку
неизвестного неизвестного
параметра  изпараметра
оценки ρмодели с
автокоррелированными остатками:
еi  еi 1   i , i  2,3,...n
1
  е1  Т  е1    е1 
Т
 е2 
 
n


 
  е2   е 2  
 
 е2 
 
 е3 
е e i i 1
 1       ...   ...  
i2
n 1
  ...   ...  
 е   е 
 
е 
 
е  e 2
i

  п 1   п 1    п1   п i 1

Получаем ̂ ( 1 ) = - 0,32

4. Вычисляются ОМНК-оценки bОМНК (r (1) )  b ( 2 )


bОМНК  ( X T  01 X ) 1 ( X T  01Y ) , с матрицей
Геращенко Ярослав Юрьевич 11

 1
   2 ...  n 1 
  1  ...  n  2 
0    2  1 ...  n 3 
,

 ... ... ... ... ... 
 n 1 
  n  2  n 3 ... 1 
  
0

в которой вместо  подставлены r (1) :

Рисунок 6 – Матрица Ʃ0

Рисунок 7 – Значения оценок коэффициентов ОМНК bомнк после первой


итерации

4) Далее необходимо вычислить регрессионные остатки для второй


итерации:

Рисунок 8– Вектор регрессионных остатков для второй итерации


5) На этом шаге надо оценить неизвестный параметр модели
регрессии второй итерации .
Геращенко Ярослав Юрьевич 12
( k 1 )
Повторим процедуру до тех пор, пока соседние ̂ и ˆ
(k )
6)
не окажутся между собой приблизительно равны.

Оценивая параметр 𝜌, получаем:

Для первой итерации:


Для второй итерации:
Для третьей итерации:

Таким образом, оценка регрессии, полученная по результатам 3


итерации, выглядит следующим образом:

Y=38.9243-0.2562*X2-0.032*X7+4.090*X3
Геращенко Ярослав Юрьевич 13

Выводы
В лабораторной работе было проведено исследование значимой
регрессионной модели на наличие (отсутствие) автокорреляции, т. к.
предположение КЛММР, касающееся некоррелированности регрессионных
остатков может нарушаться в случаях неверной спецификации
(параметризации) модели и, как правило, нарушается при анализе данных,
имеющих характер временных рядов.

Для обнаружения данного явления был использован визуальный анализ


(графический), а также статистика Дарбина-Уотсона.

По построенному на этапе визуального анализа графику было сделано


предположение о наличии в регрессионных остатках автокорреляции. В
дальнейшем это предположение было также подтверждено статистикой
Дарбина-Уотсона.

Для устранения автокорреляции была проведена процедура Кохрейна-


Оркатта в трех итерациях. С помощью MS Excel были найдены ОМНК-
оценки коэффициентов уравнения регрессии и в результате получена
следующая его оценка:
Y=38.9243-0.2562*X2-0.032*X7+4.090*X3

Согласно полученной модели, можно сделать вывод о том, что:


- увеличение смертности населения (на 1000 человек) на 1 единицу
приводит к снижению ожидаемой продолжительности жизни мужчин при
рождении в среднем на 0,2562 года;
- увеличение браков (на 1000 населения) на 1 единицу приводит к
увеличению ожидаемой продолжительности жизни мужчин при рождении
в среднем на 4,090 года;
- увеличение соотношения средней оплаты труда с учетом выплат
социального характера и прожиточного минимума трудоспособного
Геращенко Ярослав Юрьевич 14
населения на 1 единицу приводит к снижению ожидаемой
продолжительности жизни мужчин при рождении в среднем на 0,032 года;
Геращенко Ярослав Юрьевич 15

Приложение А (исходные данные)

Часть А

Y х1 х2 х3 х4 х5 х6 x7 x8 x9
Республика
54,7 8,5 16,3 6,8 5,6 17,4 163 151 23,6 2344
Карелия
Республика Коми 57 9,3 12,6 7,2 5,5 25,3 194 239 9,2 1809
Архангельская
71 8,7 4,6 6,5 4,2 16,2 152 192 26,9 2406
область
Вологодская
57,6 8,6 6,2 6,1 4 17,4 190 205 20,1 2023
область
Мурманская
57,7 8,1 11,4 7,7 6,4 5,9 183 198 22 1419
область
г. Санкт-
59,9 7 15,9 8,2 5,1 13,8 229 172 20 2104
Петербург
Ленинградская
55,5 7,2 18,2 7,4 6,1 14,3 146 167 29,1 2489
область
Новгородская
55,3 7,9 19,7 6,4 4,7 19,8 174 144 22,8 2428
область
Псковская
55,8 7,7 20,8 6,9 5,2 17,1 128 111 42,7 2494
область
Брянская область 60,1 9,2 15,9 7,8 5,3 16,7 169 148 22,7 2094
Владимирская
58,5 7,6 16,4 6,7 4,7 15,5 144 150 27,9 1768
область
Ивановская
57,4 7,3 18,3 6,3 4,9 19,6 138 133 33,7 1982
область
Калужская
58,5 7,9 16,4 6,8 5 17,6 197 155 26,6 1621
область
Костромская
58,3 7,9 17 6,3 4,4 20,1 182 159 30,5 1631
область
г.Москва 58,2 8 16,9 8,2 4,6 15,5 520 197 19,1 1066
Московская
56,5 7,2 17,6 8,1 5,2 16,1 143 165 31,2 1183
область
Орловская
59,2 8,7 16 7,6 4,4 18,9 214 161 22,7 1308
область
Рязанская
58,1 7,8 17,9 7,2 4,3 15,7 158 163 24,4 1475
область
Смоленская
58,8 8 16,9 6,9 4,7 16,8 185 146 19,8 2081
область
Тверская область 56,5 7,5 19,4 6,7 4,6 19,3 153 165 28,6 2109
Тульская область 57,1 7,3 19,4 7,4 5 20,1 200 175 16,2 1757
Ярославская
58,3 7,6 17,3 7,1 5,3 12 180 154 21,3 2111
область
Белгородская
61,9 9,4 14,8 8,1 5 14,7 200 195 19,9 1128
область
Воронежская
61 8,3 16,6 7,7 4,4 15,4 182 157 23,1 1295
область
Курская область 60,2 8,5 16,7 8 4,1 17,1 179 177 20,2 1803
Липецкая 59,5 8,4 16,1 7,6 4,6 16,7 181 191 18,6 1358
Геращенко Ярослав Юрьевич 16
область
Тамбовская
59,3 8,4 17,3 7,3 4,1 19,4 183 170 22 1549
область
Республика
59,8 13,5 10,5 7,1 3,4 15,8 100 120 60,3 1417
Калмыкия
Республика
60,2 10,4 12,9 7 3,9 18,5 194 225 22,1 1581
Татарстан
Астраханская
60 10,1 13,5 7,1 4,6 18,6 143 137 32,1 1938
область
Волгоградская
60,7 9,1 14,6 7,5 5,1 19,1 141 160 33,2 1443
область
Пензенская
60,9 8,2 15 7,1 4 14,7 148 121 30,2 1121
область
Самарская
59,1 8,6 14,8 7,3 4,8 14 188 207 21,2 1511
область
Саратовская
60,3 8,9 14,5 6,9 4,2 23,6 138 117 35,3 1601
область
Ульяновская
60,7 8,9 13,4 6,7 3,9 21,8 198 206 16,3 1193
область
Республика
60,6 10,7 14,4 8 4 18,7 129 130 46,3 1344
Адыгея
Республика
65,9 21,8 7,5 6,9 1,3 17,6 86 79 41,5 673
Дагестан
Кабардино-
Балкаркая 62,6 13,7 10,4 7,1 3,4 14,5 128 102 42,5 859
Республика
Карачаево-
63,9 12,9 10,3 7 3,3 16,3 123 107 45,7 925
Черкесская
Северная Осетия 59,5 13,3 13 6,6 2,6 17,8 128 101 42,8 968
Красноярский
59,4 10 15,3 8,8 5 19,2 175 160 32,4 1565
край
Ставропольский
61 10,7 13,5 8,1 4,5 21,7 151 154 39,6 1325
край
Ростовская
59,4 9,2 15,8 8 4,8 18,7 146 140 33,4 1497
область
Республика
60,2 11,2 12,7 7,3 3,7 18,3 158 191 32,4 1059
Башкортостан
Удмуртская
57,5 9,4 13,7 6,7 3,4 18,4 158 144 26,1 1915
республика
Курганская
68,9 9 14,6 7,3 4,3 22,6 113 132 50,4 2660
область
Оренбургская
59 10,3 13,5 7,5 4 19,7 115 145 49,3 1534
область
Пермская
56,9 9,2 15,8 5,9 3,8 18,9 184 175 25,7 2654
область
Свердловская
57,7 8,5 15,6 6,7 4,7 17,5 163 169 29,5 2508
область
Челябинская
58 9 14,8 7 4,7 16,6 171 182 27,9 1987
область
Геращенко Ярослав Юрьевич 17

Часть В

Наименование показателей Обозначение


1 Ожидаемая продолжительность жизни мужчин при
У
рождении (число лет)
2 Рождаемость населения (на 1000человек) x1
3 Смертность населения (на 1000человек) x2
4 Браки на 1000 населения x3
5 Разводы на 1000 населения x4
6 Коэффициент младенческой смертности ( число детей,
x5
умерших в возрасте до 1 года, на 1000 родившихся)
7 Соотношение денежного дохода и прожиточного минимума
x6
(%)
8 Соотношение средней оплаты труда с учетом выплат
социального характера и прожиточного минимума x7
трудоспособного населения (%)
9 Численность населения с денежными доходами ниже
прожиточного минимума в % от численности населения x8
региона
10 Число зарегистрированных преступлений по регионам РФ
x9
(на 100000 населения)