Вы находитесь на странице: 1из 63

Министерство образования РФ

Воронежский государственный университет

КОМПЬЮТЕРНЫЙ ПРАКТИКУМ
ПО
ЭКОНОМЕТРИЧЕСКОМУ МОДЕЛИРОВАНИЮ

Для студентов, обучающихся по специальностям


060200 «Экономика труда»,
060600 «Мировая экономика»,
061800 «Математические методы в экономике»

Воронеж-2003
Утверждено научно-методическим советом экономического факультета
протокол № 6 от 26 июня 2003г.

Составители:
Давнис Валерий Владимирович
Тинякова Виктория Ивановна

Редактор Бунина Т.Д.

Компьютерный практикум подготовлен на кафедре информацион-


ных технологий и математических методов в экономике экономического
факультета Воронежского государственного университета. Рекоменду-
ется для студентов 3 курса дневного и вечернего отделений экономиче-
ского факультета.
ПРЕДИСЛОВИЕ

Овладение знаниями по компьютерному моделированию является обяза-


тельным элементом изучения эконометрики. Целевое назначение данного по-
собия заключается в формировании у студентов навыков практического ис-
пользования теоретических основ эконометрического моделирования в зада-
чах анализа ситуаций экономической реальности, а также обоснования про-
гнозных решений.
В пособие включены компьютерные задания по базовым темам универ-
ситетского курса «Эконометрика». Материал каждой темы содержит спра-
вочную информацию по расчетным формулам, используемым при выполне-
нии заданий. Сами задания предусматривают не только оценку параметров
модели, но и содержательную интерпретацию результатов эконометрического
моделирования. Для лучшего понимания и усвоения студентами теоретиче-
ских положений изучаемого курса в практикуме приведены примеры выпол-
нения типовых задач, а также контрольные задания для самостоятельной ра-
боты.
Задания практикума могут выполняться как с использованием Excel, так
и любого статистического (STATISTIKA, SPSS) или эконометрического паке-
та (EVeiws, STATA). Однако авторы предусмотрели выполнение компьютер-
ных типовых задач в среде табличного процессора Excel. По их мнению, это
позволяет, с одной стороны, «прочувствовать» все детали и тонкости изучае-
мых методов, что естественным образом повышает уровень усваиваемости
учебного материала, а с другой – совершенствует навыки работы в пакете Ex-
cel, являющемся тем программным продуктом, в котором современный эко-
номист проводит основную массу своих расчетов.
1. ОДНОФАКТОРНЫЕ РЕГРЕССИОННЫЕ МОДЕЛИ
И МЕТОД ИХ ПОСТРОЕНИЯ

1.1. Расчетные формулы


1.1.1. Оценки коэффициентов однофакторной регрессионной модели:
xy − x y
bˆ1 = , bˆ0 = y − bˆ1x ,
x2 − x 2
где
1 N 1 N 1 N 1 N 2
x= ∑ xi ,
N i =1
∑ i
y=
N i =1
y , xy = ∑ i i
N i =1
x y , x 2
= ∑ xi ,
N i =1
x - независимая переменная, y - зависимая переменная, N - число элементов
выборочной совокупности.
1.1.2. Коэффициент корреляции:
σ x xy − x y
rxy = b1 = ,
σy σ xσ y
где σ x , σ y - среднеквадратические ошибки, вычисляемые по формулам

1 1
σx =
n
∑ x i2 − x 2 , σy =
n
∑ yi2 − y 2 .

1.1.3. Коэффициент детерминации:


D = r2.
1.1.4. Дисперсионное отношение Фишера (F-критерий):

∑ ( yˆ − y ) 2 / m rxy2
Fрасч = = ( n − 2) ,
∑ ( y − yˆ ) 2 / (n − m − 1) 1 − rxy2
где ŷ – расчетное значение зависимой переменной ( yˆ = bˆ0 + bˆ1x ), n – число
элементов выборочной совокупности, m – число факторов.
1.1.5. Стандартные ошибки параметров линейной регрессии:

sb1 = ∑ ( y − yˆ ) 2 / (n − 2) = 2
Sост
=
S ост
,
∑ ( x − x )2 ∑ (x − x)2 σx n

sb0 = ∑ x 2 ⋅ ∑ ( y − yˆ ) 2 = 2
Sост ∑ x2 = Sост
∑ x2 ,
n∑ ( x − x ) 2 (n − 2) n 2σ x2 nσ x
2
где Sост – остаточная дисперсия, рассчитываемая по формуле
2
Sост = ∑ ( y − yˆ )2
.
n − m −1
1.1.6. t-статистики Стьюдента:
b0 b1
tb0 = , tb1 = .
sb0 sb1
1.1.7. Доверительные интервалы:
bˆ0 − ∆ b0 ≤ b0 ≤ bˆ0 + ∆ b0 , bˆ1 − ∆ b1 ≤ b1 ≤ bˆ1 + ∆ b1 ,
где ∆ b0 , ∆ b1 – предельные ошибки, рассчитываемые по формулам
∆ b0 = tтабл sb0 , ∆ b1 = tтаблsb1 ,
t табл – табличное значение t-статистики.
1.1.8. Индекс корреляции:

p xy = 1 − ∑
( y − yˆ ) 2
.
∑ ( y − y) 2

1.1.9. Усредненное значение коэффициента эластичности:


x
E = bˆ1 ⋅ .
y

1.2. Решение типовых задач


Задание 1.2.1. По данным табл. 1.2.1 построить линейное уравнение рег-
рессии, отражающее зависимость стоимости квартиры от ее жилой площади.
Таблица 1.2.1
Жилая Жилая
№ Стоимость № Стоимость
площадь площадь
п.п. (долл.) п.п (долл.)
(кв. м.) (кв. м.)
1. 5000 30,2 9. 5740 33
2. 5200 32 10. 5570 31
3. 5350 32 11. 5530 30
4. 5880 37 12. 6020 34
5. 5430 30 13. 7010 38
6. 5430 30 14. 6420 31
7. 5430 30 15. 7150 39
8. 5350 29 16. 7190 39,5

Для построенного уравнения вычислить


1) коэффициент корреляции;
2) коэффициент детерминации;
3) дисперсионное отношение Фишера;
4) стандартные ошибки коэффициентов регрессии;
5) t-статистики Стьюдента;
6) доверительные границы коэффициентов регрессии.
Дать содержательную интерпретацию коэффициента регрессии постро-
енной модели. Все расчеты провести в Excel с использованием выше приве-
денных формул и «Пакета анализа». Результаты, полученные по формулам
и с помощью «Пакета анализа», сравнить между собой.
Решение с помощью табличного процессора Excel.
1. Ввод исходных данных.
2. Подготовка данных и оформление их в виде табл. 1.2.2 для расчета
оценок коэффициентов регрессии.
Таблица 1.2.2

№ п.п. y x x2 xy y2
1. 5000 30,2 912,04 151000 25000000
2. 5200 32 1024 166400 27040000
3. 5350 32 1024 171200 28622500
4. 5880 37 1369 217560 34574400
5. 5430 30 900 162900 29484900
6. 5430 30 900 162900 29484900
7. 5430 30 900 162900 29484900
8. 5350 29 841 155150 28622500
9. 5740 33 1089 189420 32947600
10. 5570 31 961 172670 31024900
11. 5530 30 900 165900 30580900
12. 6020 34 1156 204680 36240400
13. 7010 38 1444 266380 49140100
14. 6420 31 961 199020 41216400
15. 7150 39 1521 278850 51122500
16. 7190 39,5 1560,3 284005 51696100
Среднее
значение 5856,25 32,86 1091,39 194433,44 34767688,50

3. Расчет коэффициентов регрессии:


194433,44 − 32,86 ⋅ 5856,25
b1 = = 170,239 ;
1091,39 − 32,86 2
b0 = 5856,25 − 170,239 ⋅ 32,86 = 262,847 .
Построенная модель может быть записана в следующем виде:
y = 262,847 + 170,239 x .
Коэффициент регрессии b1 этой модели показывает, что в среднем уве-
личение полезной площади на 1 кв. м. приводит к увеличению ее стоимости
на 170,24 долл.
4. Расчет коэффициента корреляции и детерминации
σ x = 1091,39 − 32,862 = 3,444 ; σ y = 34767688,50 − 5856,252 = 687,040 ;

3,444
r = 170,239 ⋅ = 0,853 ; D = 0,8532 ⋅ 100% = 72,818% .
687,040
Коэффициент корреляции достаточно высокий, что свидетельствует о
существенной зависимости стоимости квартир от полезной площади. Коэф-
фициент детерминации показывает, что величина стоимости квартиры объяс-
няется величиной полезной площади только на 72,82 %.
5. Расчет дисперсионного отношения Фишера
0,8532
Fрасч = ⋅ 14 = 37,504 .
(1 − 0,8532 )
Сравнение расчетного значения F-критерия с табличным F1; 14 = 4,60 для
95%-ного уровня значимости позволяет сделать вывод об адекватности по-
строенной модели.
6. Расчет стандартных ошибок по формулам (1.1.5), в которых использу-
ется средняя квадратическая ошибка S ост , вычисленная в соответствии с
данными табл. 1.2.3.
382,933 ⋅ 17462,29 382,933
sb0 = = 918,356 ; sb1 = = 27,798 .
3,444 ⋅ 16 3,444 ⋅ 16
7. Расчет доверительных границ для коэффициентов уравнения регрессии
∆ b0 = 2,1448 ⋅ 918,356 = 1969,691;
∆ b1 = 2,1448 ⋅ 27,798 = 59,622 ;
262,847 − 1969,691 ≤ b0 ≤ 262,847 + 1969,691 ;
− 1706,691 ≤ b0 ≤ 2232,538 ;
170,239 − 59,622 ≤ b1 ≤ 170,239 + 59,622 ;
110,616 ≤ b1 ≤ 229,861 .
8. Построение линейного уравнения регрессии и расчет всех его характе-
ристик с помощью «Пакета анализа» табличного процессора Excel. Сравне-
ние результатов, полученных с помощью расчетных формул, с результатами
применения инструментальных средств Excel (см. Вывод итогов к заданию
1.2.1) показывает их полную идентичность, что свидетельствует о правиль-
ном понимании метода построения линейных регрессионных уравнений и ме-
тодики оценки его качества.
Таблица 1.2.3

№ п/п y x ŷ ( y − ŷ )2
1. 5000 30,2 5404,054 163259
2. 5200 32 5710,483 260593
3. 5350 32 5710,483 129948
4. 5880 37 6561,676 464683
5. 5430 30 5370,006 3599
6. 5430 30 5370,006 3599
7. 5430 30 5370,006 3599
8. 5350 29 5199,767 22570
9. 5740 33 5880,722 19803
10. 5570 31 5540,245 885
11. 5530 30 5370,006 25598
12. 6020 34 6050,96 959
13. 7010 38 6731,915 77331
14. 6420 31 5540,245 773970
15. 7150 39 6902,154 61428
16. 7190 39,5 6987,273 41098

∑ ( y − yˆ )
2
2052923
Sост 382,933

ВЫВОД ИТОГОВ к заданию 1.2.1

Регрессионная статистика
Множественный R 0,853
R-квадрат 0,728
Нормированный R-квадрат 0,709
Стандартная ошибка 382,933
Наблюдения 16

Дисперсионный анализ
Значи-
df SS MS F мость F
Регрессия 1 5499452,368 5499452,368 37,504 0,00003
Остаток 14 2052922,632 146637,331
Итого 15 7552375

P-
Коэффи- Стандартная t- Нижние Верхние
Значе-
циенты ошибка статистика 95% 95%
ние
Y-пересечение 262,847 918,356 0,286 0,779 -1706,833 2232,528
Переменная X 1 170,239 27,798 6,124 0,000 110,617 229,860
Задание 1.2.2. По данным табл. 1.2.1 построить нелинейное уравнение
регрессии в виде показательной функции, отражающее зависимость стоимости
квартиры от ее полезной площади. Для построенного уравнения вычислить:
1) индекс корреляции;
2) коэффициент детерминации;
3) дисперсионное отношение Фишера.
Дать содержательную интерпретацию коэффициента регрессии постро-
енной модели. Все расчеты провести в Excel с использованием выше приве-
денных формул.
Решение с помощью табличного процессора Excel.
1. Ввод исходных данных.
2. Подготовка данных и оформление их в виде табл. 1.2.4 для расчета ко-
эффициентов регрессии.
285,151 − 33 ⋅ 8,669
Lnb1 = = 0,028 ; Lnb0 = 8,669 − 0,028 ⋅ 33 = 7,761 ;
1091 − 332
b1 = e Lnb1 = 2,7180,028 = 1,028 ; b0 = e Lnb0 = 2,7187,761 = 2347,862 .
Таблица 1.2.4
№ п/п y ln y x x 2
x ln y
1. 5000 8,517 30,2 912,04 257,2192
2. 5200 8,556 32 1024 273,8052
3. 5350 8,585 32 1024 274,7153
4. 5880 8,679 37 1369 321,1345
5. 5430 8,600 30 900 257,9908
6. 5430 8,600 30 900 257,9908
7. 5430 8,600 30 900 257,9908
8. 5350 8,585 29 841 248,9607
9. 5740 8,655 33 1089 285,6221
10. 5570 8,625 31 961 267,3797
11. 5530 8,618 30 900 258,5383
12. 6020 8,703 34 1156 295,8966
13. 7010 8,855 38 1444 336,4935
14. 6420 8,767 31 961 271,7824
15. 7150 8,875 39 1521 346,1198
16. 7190 8,880 39,5 1560,25 350,7776
Среднее
значение 5856 8,669 33 1091 285,151

3. Расчет индекса корреляции и коэффициента детерминации с оформле-


нием промежуточных вычислений в виде табл. 1.2.5.
1975343
p xy = 1 − = 0,859 ; D = 0,8592 ⋅ 100% = 73,84% .
7552375
Таблица 1.2.5
№ п/п y (y − y)
2
x ŷ ( y − ŷ )2
1. 5000 733164,1 30,2 5406,783 165472
2. 5200 430664,1 32 5682,389 232699
3. 5350 256289,1 32 5682,389 110482
4. 5880 564,0625 37 6523,923 414636
5. 5430 181689,1 30 5376,997 2809
6. 5430 181689,1 30 5376,997 2809
7. 5430 181689,1 30 5376,997 2809
8. 5350 256289,1 29 5230,512 14277
9. 5740 13514,06 33 5841,529 10308
10. 5570 81939,06 31 5527,584 1799
11. 5530 106439,1 30 5376,997 23410
12. 6020 26814,06 34 6005,125 221
13. 7010 1331139 38 6706,63 92033
14. 6420 317814,1 31 5527,584 796406
15. 7150 1673789 39 6894,455 65303
16. 7190 1778889 39,5 6990,331 39868

∑ ( y − y )2 ∑ ( y − yˆ )
2
7552375 1975343

При использовании показательной зависимости изменения стоимости


квартиры объясняются соответствующими изменениями полезной площади
на 73,84%.
4. Расчет дисперсионного отношения Фишера
7552375 − 1975343
Fрасч = ⋅ 14 = 39,527 .
1975343
Сравнение расчетного значения F-критерия с табличным F1; 14 = 4,60 для
95%-ного уровня значимости позволяет сделать вывод об адекватности по-
строенной модели.
5. Построенная регрессионная модель в виде показательной функции
y = 2347,862 ⋅ 1,028 x ,
позволяет утверждать, что в среднем увеличение полезной площади на 1
кв.м. повышает стоимость квартиры в 1,028 раза.

1.3. Контрольные задания


Задание 1.3.1. По данным табл. 1.3.1 построить линейные уравнения рег-
рессии, отражающие зависимость стоимости подержанных автомобилей мо-
делей ВАЗ 2105 и ВАЗ 2107 от срока их эксплуатации. Для построенных
уравнений вычислить:
1) коэффициент корреляции;
2) коэффициент детерминации;
3) дисперсионное отношение Фишера;
4) стандартные ошибки коэффициентов регрессии;
5) t-статистики Стьюдента;
6) доверительные границы коэффициентов регрессии;
7) усредненное значение коэффициента эластичности.
Дать содержательную интерпретацию коэффициентов регрессии и эла-
стичности построенных моделей.
Все расчеты провести в Excel с использованием выше приведенных фор-
мул и «Пакета анализа». Результаты, полученные по формулам и с помо-
щью «Пакета анализа», сравнить между собой.
Задание 1.3.2. По данным табл. 1.3.1 построить степенные уравнения
регрессии, отражающие зависимость стоимости подержанных автомобилей
моделей ВАЗ 2109 и ВАЗ 21099 от срока их эксплуатации. Для построенных
уравнений вычислить:
1) индекс корреляции;
2) коэффициент детерминации;
3) дисперсионное отношение Фишера.
Дать содержательную интерпретацию коэффициента регрессии, постро-
енных моделей. Все расчеты провести в Excel с использованием выше приве-
денных формул.
Таблица 1.3.1
Стоимость подержанных автомобилей, руб. Срок эксплуатации,
ВАЗ 2105 ВАЗ 2107 ВАЗ 2109 ВАЗ 21099 лет
83000 99000 112000 130000 1
86000 95000 101000 121000 2
84000 88000 91000 107000 3
79000 79000 82000 96000 4
66000 82000 73000 87000 5
69000 70000 66000 79000 6
53000 72000 59000 72000 7
46000 67000 53000 66000 8
47000 59000 48000 59000 9
41000 55000 43000 54000 10
44000 44000 39000 49000 11
24000 40000 35000 45000 12
20000 32000 32000 41000 13
19000 27000 30000 39000 14
2. МОДЕЛЬ МНОЖЕСТВЕННОЙ РЕГРЕССИИ
И МЕТОДЫ ЕЕ ПОСТРОЕНИЯ

2.1. Расчетные формулы


2.1.1 Оценки вектора коэффициентов регрессии:
bˆ = (X′X )−1 X′Y .
2.1.2. Стандартная ошибка Sbk k-го коэффициента регрессии, равная
корню квадратному из соответствующего диагонального элемента ковариа-
ционной матрицы векторной оценки
Sb2ˆ = σˆ 2 (X′X )−1 ,
2 e′e
где σˆ = рассчитывается по остаткам e = Y − Xbˆ
n − m −1
2.1.3. Множественный индекс корреляции:

∑ ( yi − yˆi )2 .
R yx1 x2 ,K , x m = 1−
∑ ( yi − y )2
2.1.4. Бетта-коэффициенты:
σ xi
β i = bi .
σy
2.1.5. Парные коэффициенты корреляции:
σ x xy − x y ∑ (xi − x )( yi − y )
rxy = b1 = = .
σy σ xσ y σ xσ y (n − 1)
2.1.6. Множественный коэффициент корреляции:
R yx1 x2 ,K , xm = ∑ β i ryxi .
2.1.7. Дисперсионное отношение Фишера:
R2 n − m −1 ∑ ( yi − yˆ i )2 / m
F= = .
1 − R2 m (
∑ i i
y − yˆ )2
/ ( n − m − 1)
2.1.8. Скорректированный коэффициент множественной детерминации:
 (n − 1) 
D = Rˆ 2 ⋅ 100 = 1 − (1 − R 2 )  ⋅100 .
 ( n − m − 1) 
2.1.9. Частный F-критерий:
2 2
R yx1 x2 ,K , xm
− R yx1 ,K , xi −1 xi +1,K , x n − m −1
Fxi = 2
m
⋅ .
1 − R yx1 x2 ,K , xm
1
2.2. Решение типовой задачи
Задание 2.2.1. По данным табл. 2.2.1, используя матричную форму мето-
да наименьших квадратов, рассчитать:
1) коэффициенты регрессии;
2) стандартные ошибки коэффициентов регрессии;
3) множественный индекс корреляции;
4) бетта - коэффициенты;
5) парные коэффициенты корреляции;
6) множественный коэффициент корреляции;
5) дисперсионное отношение Фишера.
Построить уравнение регрессии, используя «Пакет анализа» табличного
процессора Excel, и полученные результаты сравнить с расчетами по методу
наименьших квадратов.
Таблица 2.2.1

№ п/п y x1 x2 № п/п y x1 x2
1. 131 110 106 8. 54 132 41
2. 70 35 66 9. 79 111 48
3. 31 16 61 10. 242 168 102
4. 106 46 53 11. 170 105 91
5. 109 50 23 12. 80 110 45
6. 75 99 48 13. 96 108 48
7. 111 114 52 14. 138 109 62

Решение с помощью табличного процессора Excel


1. Ввод исходных данных с включением в модель дополнительной пере-
менной x0 , принимающей единственное значение, равное 1.
2. Расчет коэффициентов регрессии с использованием матричных функ-
ций Excel.
2.1. Формирование матрицы системы нормальных уравнений (X ′X ) с
помощью функций ТРАНСП () и МУМНОЖ ().
14 1313 846
1313 145633 83537
846 83537 58502
2.2. Формирование вектора правой части системы нормальных урав-
нений ( X′Y ) с помощью функций, указанных в п. 2.1.
1492
156374
100818
2.3. Нахождение обратной матрицы к матрице системы нормальных
уравнений с помощью функции МОБР ().
0,741966 -0,002955955 -0,006509
-0,002956 4,97304E-05 -2,83E-05
-0,006509 -2,82655E-05 0,000152
2.4. Получение вектора оценок коэффициентов регрессии путем ум-
ножения обратной матрицы на правую часть системы нормальных уравнений
-11,4148
0,516582
1,15075
3. Расчет стандартных ошибок с использованием функций Excel.
3.1. Вычисление расчетных значений ŷ по полученному уравнению
регрессии.
3.2. Нахождение отклонений расчетных значений от фактических.
3.3. Подсчет суммы квадратов отклонений.
3.4. Вычисление остаточной дисперсии и оформление промежуточных
результатов в виде табл. 2.2.2.
Таблица 2.2.2
y ŷ y − yˆ ( y − ŷ )2
131 167,3888 -36,3888 1324,143
70 82,61513 -12,6151 159,1416
31 67,04633 -36,0463 1299,338
106 73,33778 32,66222 1066,821
109 40,88159 68,11841 4640,118
75 94,96285 -19,9628 398,5153
111 107,3146 3,685425 13,58236
54 103,9548 -49,9548 2495,481
79 101,1618 -22,1618 491,1466
242 192,7475 49,2525 2425,808
170 147,5446 22,45539 504,2447
80 97,193 -17,193 295,5991
96 99,61208 -3,61208 13,04715
138 116,2392 21,76083 473,5337
Сумма квадратов отклонений 15600,52
Остаточная дисперсия 1418,229
3.5. Получение стандартных ошибок в виде корня квадратного из про-
изведения диагональных элементов обратной матрицы на остаточную диспер-
сию
32,43883
0,265573
0,46365
4. Вычисление множественного индекса корреляции.
4.1. Проведение промежуточных расчетов и оформление их в виде
табл. 2.2.3.
Таблица 2.2.3

Y X1 X2 (Y − Y )
2
(X 1− X1 )
2
(X − X2)
2
2

131 110 106 596,7551 262,9031 2076,76


70 35 66 1337,469 3455,76 31,0408
31 16 61 5711,041 6050,617 0,32653
106 46 53 0,326531 2283,474 55,1837
109 50 23 5,897959 1917,189 1400,9
75 99 48 996,7551 27,18878 154,469
111 114 52 19,61224 408,6173 71,0408
54 132 41 2763,755 1460,332 377,469
79 111 48 760,1837 296,3316 154,469
242 168 102 18340,9 5507,76 1728,18
170 105 91 4023,184 125,7602 934,612
80 110 45 706,0408 262,9031 238,041
96 108 48 111,7551 202,0459 154,469
138 109 62 987,7551 231,4745 2,46939
106,5714 93,78571 60,42857 36361,43 22492,36 7379,43
Дисперсия 2797,033 1730,181 567,648
Среднее квадратическое
52,88698 41,59545 23,8254
отклонение

4.2. Расчет множественного индекса корреляции


15600,52
R = 1− = 0,755619 .
36361,43
4.3. Расчет скорректированного множественного индекса корреляции

Rскор = 1 − (1 − 0,7556192 )
13
= 0,702106 .
11
5. Расчет бетта-коэффициентов
β 1 = 0,516582 ⋅ 41,59545 / 52,88698 = 0,40629 ;
β 2 = 1,15075 ⋅ 23,8254 / 52,88698 = 0,518408 .
6. Расчет парных коэффициентов корреляции и оформление расчетов в
виде табл. 2.2.4.
7. Вычисление множественного коэффициента корреляции
R = 0,575062 ⋅ 0,40629 + 0,65068 ⋅ 0,518408 = 0,755619 .
8. Вычисление дисперсионного отношения Фишера
0,7556192 11
Fрасч = ⋅ = 7,319308 .
1 − 0,7556192 2
Таблица 2.2.4
Y X1 X2 (Y − Y )(X − X 1 ) (Y − Y )( X 2 − X 2 )
1

131 110 106 396,0918 1113,245


70 35 66 2149,878 -203,755
31 16 61 5878,378 -43,1837
106 46 53 27,30612 4,244898
109 50 23 -106,337 -90,898
75 99 48 -164,622 392,3878
111 114 52 89,52041 -37,3265
54 132 41 -2008,98 1021,388
79 111 48 -474,622 342,6735
242 168 102 10050,73 5629,959
170 105 91 711,3061 1939,102
80 110 45 -430,837 409,9592
96 108 48 -150,265 131,3878
138 109 62 478,1633 49,38776
106,5714 93,7857 60,42857 16445,71 10658,57
Парные коэффициенты корреляции 0,575062 0,65068
9. Построение регрессионного уравнения с использованием «Пакета ана-
лиза» Excel. Идентичность результатов, полученных с помощью расчетных
формул и инструментальных средств Excel (см. Вывод итогов к заданию
2.2.1), свидетельствует о правильном понимании алгоритма метода наимень-
ших квадратов в матричной форме.
ВЫВОД ИТОГОВ к заданию 2.2.1

Регрессионная статистика
Множественный R 0,755619
R-квадрат 0,57096
Нормированный R-
квадрат 0,492952
Стандартная ошибка 37,65938
Наблюдения 14

Дисперсионный анализ
Значи-
df SS MS F мость F
Регрессия 2 20760,90924 10380,45 7,319308 0,0095222
Остаток 11 15600,51933 1418,229
Итого 13 36361,42857

Коэффици- Стандарт- P- Нижние Верхние


енты ная ошибка t-статистика Значение 95% 95%
Y-пересечение -11,41475 32,43883158 -0,35189 0,731573 -82,812174 59,982671
Переменная X 1 0,516582 0,265573124 1,945158 0,077756 -0,0679411 1,1011044
Переменная X 2 1,15075 0,463649975 2,481938 0,030469 0,130263 2,1712376
2.3. Контрольные задания
Задание 2.3.1. В табл. 2.3.1 представлены данные о производительности
труда, фондоотдаче и уровне рентабельности предприятия «Рождественская
звезда».
Таблица 2.3.1

Производительность Фондоот- Уровень рентабель-


№ п.п.
труда, руб. дача, руб. ности, %
1. 7343 1,08 20,1
2. 3991 1,05 12,9
3. 5760 0,99 18,0
4. 3000 1,02 11,7
5. 5241 0,98 17,9
6. 4500 1,04 16,8
7. 4300 1,03 15,6
8. 3212 1,10 14,3
9. 6743 1,03 18,1
10. 5234 0,89 17,8
11. 2500 0,78 13,0
12. 3930 0,99 14,2
13. 14333 1,43 24,2
14. 6980 1,03 20,0
15. 6740 1,05 19,3

Используя матричную форму метода наименьших квадратов, по данным


этой таблицы рассчитать:
1) коэффициенты регрессии;
2) стандартные ошибки коэффициентов регрессии;
3) множественный индекс корреляции;
4) скорректированное значение множественного коэффициента детерми-
нации;
5) бетта - коэффициенты;
6) парные коэффициенты корреляции;
7) множественный коэффициент корреляции через бетта – коэффициенты
и парные коэффициенты корреляции;
8) дисперсионное отношение Фишера;
9) частные F-критерии для каждого фактора.
Построить уравнение регрессии, используя «Пакет анализа» табличного
процессора Excel, и полученные результаты сравнить с расчетами по методу
наименьших квадратов.
Задание 2.3.2. Данные о деятельности крупнейших компаний США пред-
ставлены в табл. 2.3.2.
Таблица 2.3.2
№ Чистый доход, Оборот капитала, Использованный ка- Численность
п/п млрд. долл. США млрд. долл. США питал, млрд. долл. служащих,
США тыс. чел.
1. 6,6 6,9 83,6 222
2. 3 18 6,5 32
3. 6,5 107,9 50,4 82
4. 3,3 16,7 15,4 45,2
5. 0,1 79,6 29,6 299,3
6. 3,6 16,2 13,3 41,5
7. 1,5 5,9 5,9 17,8
8. 5,5 53,1 27,1 151
9. 2,4 18,8 11,2 82,3
10. 3 35,3 16,4 103
11. 4,2 71,9 32,5 225,4
12. 2,7 93,6 25,4 675
13. 1,6 10 6,4 43,8
14. 2,4 31,5 12,5 102,3
15. 3,3 36,7 14,3 105
16. 1,8 13,8 6,5 49,1
17. 2,4 64,8 22,7 50,4
18. 1,6 30,4 15,8 480
19. 1,4 12,1 9,3 71
20. 0,9 31,3 18,9 43
Применяя матричную форму метода наименьших квадратов, по данным
этой таблицы рассчитать:
1) коэффициенты регрессии;
2) коэффициенты эластичности;
3) стандартные ошибки коэффициентов регрессии;
4) множественный индекс корреляции;
5) скорректированное значение множественного коэффициента детерми-
нации;
6) бетта - коэффициенты;
7) парные коэффициенты корреляции;
8) множественный коэффициент корреляции через бетта – коэффициенты
и парные коэффициенты корреляции;
9) дисперсионное отношение Фишера;
10)частные F-критерии для каждого фактора.
Построить уравнение регрессии, используя «Пакет анализа» табличного
процессора Excel, и полученные результаты сравнить с расчетами по методу
наименьших квадратов.
3. СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ И ИХ ПРОВЕРКА

3.1. Расчетные формулы


3.1.1. Нормально распределенная значение статистики:
~z = x − µ0 n.
σ
3.1.2. Статистика с распределением t -Стьюдента:
(
ˆ ˆ ) 2
bˆi − bˆi 0 bi − bi 0 / σ bˆi
t= = 2
= t (n − m ) .
Sbˆ
i
S bˆ
/ σ bˆ
i i
3.1.3. Статистика с распределением F-Фишера:
n − m − 1 ∑ ( yˆ t − y ) / m
2 2
R2 S воспр
F= ⋅ = = 2 ,
1 − R2 m ∑ et2 / (n − m − 1) S ост
2
где ∑ et2 - сумма квадратов остатков ( ∑ et2 = ∑ ( yt − yˆ t ) )
3.1.4. F-статистика для проверки общей линейной гипотезы:

Hbˆ − r ) [H (X ′X )−1 H ′] (Hbˆ − r )/ q



F=
( −1
.
e′e / (n − m − 1)
где Hbˆ = r , H - матрица, r - вектор, q - размерность вектора r.
3.1.5. Статистика с распределением F-Фишера, применяемая в тесте Чоу:

F=
(Sост
2
− S32ост )/ (k + 1)
,
S32ост / (n + m − 2k − 2)
где k - количество факторов в регрессионной модели; n - объем первой вы-
борочной совокупности; m - объем второй выборочной совокупности;
2
Sост - сумма квадратов остатков регрессии, построенной по объединенной
выборочной совокупности;
2
S1ост - сумма квадратов остатков регрессии, построенной по первой выбо-
рочной совокупности;
2
S 2ост - сумма квадратов остатков регрессии, построенной по второй вы-
борочной совокупности;
S32ост = S12ост + S 22ост .
3.2. Решение типовых задач
Задание 3.2.1. Требуется проверить нуль-гипотезу, состоящую в том, что
значение генеральной совокупности, оцененное по случайной выборке отли-
чается от предполагаемого значения µ 0 . Данные для проверки гипотезы:
µ0 =25,0; σ 0 = 6,0; n =36; x =23,2.
Гипотеза H 0 : µ = µ 0
H A : µ ≠ µA .
Решение с помощью табличного процессора Excel
1. Ввод данных для проверки гипотезы.
2. Расчет абсолютного значения нормально распределенной статистики
~ 23,2 − 25,0
z = 36 = 1,8 .
6
3. Сравнение полученного значения статистики с критическим значени-
~
ем z = 1,8 < 1,96 = z0,95 .
Так как расчетное значение статистики меньше критического значения,
то нуль-гипотеза не отвергается (Р>0,05). Неотклоненная нуль-гипотеза при-
нимается в качестве рабочей гипотезы, так как она не противоречит выбороч-
ным наблюдениям. Однако нужно помнить, что правильность нуль-гипотезы,
возможно, была подтверждена только потому, что не оказалось достаточного
для ее отклонения статистического материала.
4. Ввод данных для перепроверки гипотезы:
µ0 =25,0; σ 0 = 6,0; n =49; x =23,1.
5. Расчет статистики

~z = 23,1 − 25,0 49 = 2,22


6 .
6. Сравнение полученного значения статистики с критическим значением:
~
z =2,22>1,96 = z0,95 ,
Так как расчетное значение больше критического значения, то нуль-
гипотеза отклоняется на 5%-ном уровне значимости (Р<0,05).
Задание 3.2.2. Используя формулы матричной формы МНК, по данным
табл. 3.2.1 построить модель множественной регрессии и проверить гипотезы:
H 0 : bi = 0 ( i = 1, m ) и H 0 : b1 = b2 = L = bm = 0 . Если в результате проверки пер-
вой гипотезы окажется, что не все факторы значимы, то заново построить мо-
дель, исключив незначимые факторы.
Таблица 3.2.1
№ X1 X2 X3 Y № X1 X2 X3 Y
1. 32,0 14,1 235,0 605,8 7. 13,2 60,6 261,6 628,4
2. 22,2 46,9 278,3 677,3 8. 32,7 40,4 291,1 682,8
3. 37,4 44,2 214,2 572,3 9. 46,0 65,0 218,6 581,9
4. 47,8 59,4 256,6 627,4 10. 24,1 42,0 269,0 643,0
5. 47,0 51,7 190,9 567,7 11. 28,1 74,6 250,4 612,6
6. 52,3 35,6 205,6 566,2 12. 18,1 45,6 286,4 666,5

Решение с помощью табличного процессора Excel


1. Получение вектора оценок коэффициентов регрессии по формуле
(2.1.1) согласно алгоритму, изложенному при выполнении задания 2.2.1.
303,11
0,19
-0,18
1,29
2. Расчет стандартных ошибок с использованием функций Excel по фор-
муле (2.1.2) согласно алгоритму, изложенному при выполнении задания 2.2.1.
45,45
0,36
0,21
0,14
3. Вычисление расчетных значений t-статистики путем деления коэффи-
циентов регрессии на стандартные ошибки
6,67
0,52
-0,85
9,18
Сравнение расчетных значений t-статистики с табличным t S (8) = 2,306
позволяет отвергнуть нулевую гипотезу только для третьего фактора.
4. Вычисление дисперсионного отношения Фишера
4.1. Расчет воспроизведенной дисперсии и оформление результатов в
виде табл. 3.2.2.
4.2. Расчет F-статистики путем деления воспроизведенной дисперсии
на остаточную
6242,27
Fрасч = = 54,11
115,36
и сравнение ее с критическим значением Fc (8) = 4,07 . Так как F расч > Fc , то
модель считается адекватной.
Таблица 3.2.2

Y Ŷ (Yˆ − Y ) (Yˆ − Y )
2

605,8 610,2 -9,1 82,5


677,3 658,6 39,3 1544,4
572,3 579,1 -40,2 1614,4
627,4 633,2 13,9 193,1
567,7 549,5 -69,8 4868,8
566,2 572,3 -47,0 2209,4
628,4 632,8 13,5 182,9
682,8 678,2 58,9 3464,5
581,9 582,7 -36,6 1342,2
643,0 647,8 28,4 808,7
612,6 618,8 -0,5 0,2
666,5 668,5 49,2 2415,7
Сумма квадратов отклонений 18726,81
Воспроизведенная дисперсия 6242,27

5. Построение модели y = b0 + b3 x3 с использованием «Пакет анализа» Excel.


Окончательно модель, отражающая зависимость y от x3 , имеет вид
y = 314,33 + 1,24 x3 .
Расчетное значение F-статистики равно 179,12, что свидетельствует о ее
адекватности.
Задание 3.2.3. По данным табл. 3.2.3 построить множественное уравне-
ние регрессии и проверить гипотезу, удовлетворяют ли ее коэффициенты ли-
нейному ограничению общего вида, т.е. H 0 : Hb = r , где
1 0 0 0   5 
   
H =  0 2 −1 0 , r = 0 .
0 0 0 1  − 1,2 
   
Таблица 3.2.3
№ X1 X2 X3 Y № X1 X2 X3 Y
1. 24,5 32,6 53,1 74,5 7. 34,0 15,4 53,1 39,9
2. 25,8 27,5 50,9 65,7 8. 31,6 23,2 69,0 39,2
3. 36,0 27,1 68,6 58,1 9. 45,6 25,6 37,0 104,4
4. 24,6 35,8 53,9 86,3 10. 40,6 23,7 56,8 68,3
5. 37,0 14,3 34,4 61,5 11. 46,7 21,4 58,7 70,7
6. 15,4 21,6 54,7 25,5 12. 37,3 21,0 68,5 40,4

Решение с помощью табличного процессора Excel


1. Получение вектора оценок коэффициентов регрессии по формуле
(2.1.1) согласно алгоритму, изложенному при выполнении задания 2.2.1.
2,2
1,5
3,0
-1,2
2. Вычисление F -статистики для проверки гипотезы о линейном ограни-
чении общего вида.
2.1. Вычисление остаточной дисперсии
2
Sост = 2,06 .
2.2. Вычисление значения числителя F-статистики.
2.2.1. Расчет вектора Hb̂ − r
-2,77
0,04
0,02
2.2.2. Расчет матрицы H(X′X ) H′
−1

5,8540 -0,0384 -0,0380


-0,0384 0,0050 0,0003
-0,0380 0,0003 0,0008
и обратной к ней
0,26 1,30 12,59
1,30 208,97 -10,88
12,59 -10,88 1952,01
2.2.3. Окончательный расчет числителя F-статистики
1,44
3. Деление результата п.2.2.3 на остаточную дисперсию (окончательный
расчет значения F-статистики)
Fрасч = 0,70 .
4. Сравнение полученного результата с критическим значением
Fc (3,8) = 4,07 . Нуль-гипотеза не отвергается, так как Fрасч < Fc .

3.3. Контрольные задания


Задание 3.3.1. По данным табл. 3.3.1, используя формулы матричного
метода МНК, рассчитать коэффициенты линейного регрессионного уравне-
ния, отражающего зависимость количества еженедельно продаваемых чиз-
бургеров бистро «Вкусноед» от их цены и расходов на рекламу.
Для построенного уравнения регрессии проверить две гипотезы:
1) H 0 : bi = 0 ( i = 1, m ) ;
2) H 0 : b1 = b2 = L = bm = 0 .
Если окажется, что среди факторов есть незначимый, то построить мо-
дель, исключив этот фактор. Провести сравнение построенных моделей.
Таблица 3.3.1
Количество Количество
Цена чиз- Расходы на Цена Расходы на
№ проданных № проданных
бургера, рекламу, чизбургера, рекламу,
п.п. чизбургеров, п.п. чизбургеров,
руб. руб. руб. руб.
шт. шт.
1. 525 15,92 579 8. 789 15,02 439
2. 567 16,50 461 9. 513 16,77 474
3. 396 16,54 649 10. 661 15,57 459
4. 726 16,11 378 11. 407 16,67 619
5. 265 16,62 674 12. 608 16,92 427
6. 615 15,15 234 13. 399 16,97 469
7. 370 15,02 681 14. 631 16,59 479

Задание 3.3.2. По данным табл. 3.3.2 построить зависимость, объясняю-


щую число сделок в день ведущими онлайновскими брокерами США в зави-
симости от факторов, определяемых с помощью рейтинговых оценок.
Таблица 3.3.2
Число Удобство Доверие Объем пред- Качество об-
Онлайновский
№ сделок в пользова- потребите- лагаемых служивания,
брокер
день ния, балл лей, балл услуг, балл балл
1. Charles Schwab 177400 7,39 6,91 8,54 8,84
2. E*Trade 123250 8,10 6,15 8,90 7,67
3. Waterhouse Securities 107146 7,46 8,35 8,35 5,62
4. Fidelity 92354 5,63 5,71 8,94 8,23
5. Datek Online 81040 7,18 6,40 7,72 5,82
6. Ameritrade 71269 5,44 8,10 6,49 4,90
7. DLJdirect 30500 6,14 6,55 6,41 4,91
8. Scottrade 22050 5,04 6,15 6,06 6,62
9. CyBerCorp 14213 4,92 6,84 6,59 4,44
10. Suretrade 13200 7,56 5,63 6,46 5,35
11. Morgan Stanley Online 12500 1,60 7,16 7,26 5,43
12. National Discount Brokers 17703 6,49 7,32 4,32 4,18
13. Dreyfus 10125 3,35 7,69 5,65 4,30
14. Web Street Securities 4535 5,10 7,42 6,40 3,40
15. Quik & Reilly 3300 4,47 6,80 5,76 4,33
Для построенной модели проверить гипотезы:
1) H 0 : bi = 0 ( i = 1, m ) ;
2) H 0 : b1 = b2 = L = bm = 0 .
Если окажется, что среди факторов есть незначимые, то построить мо-
дель, исключив эти факторы. Для вновь построенной модели проверить гипо-
тезу: H 0 : Hb̂ = r , где
1 0 0 0   − 405000
   
H =  0 3 −1 0 , r =  0 .
0 0 1−1  0 
   
Задание 3.3.3. Применяя тест Чоу, установить, является ли существенным
различие в оплате труда работников государственных и коммерческих органи-
заций. Данные об оплате труда в зависимости от стажа, возраста и образова-
ния работников государственных организаций приведены в табл. 3.3.3, а ком-
мерческих организаций – в табл. 3.3.4.
Таблица 3.3.3
Образование
Зарплата, Стаж, Возраст,
(1-высшее;
руб. лет лет
0-среднее)
2596 16 42 1
2524 7 30 0
2610 17 48 1
2756 32 55 1
2811 27 50 1
2750 23 46 1
2484 29 51 0
2623 14 44 0
2789 26 47 1
2768 19 50 1
2641 33 55 1
1951 2 24 0
Таблица 3.3.4
Образование
Зарплата, Стаж, Возраст,
(1-высшее;
руб. лет лет
0-среднее)
3480 20 46 1
2667 19 42 0
2890 1 23 1
2340 12 46 0
3288 31 57 1
3213 14 35 1
3354 29 51 1
2434 19 41 0
3147 4 31 1
3512 24 47 1
2698 22 46 0
2697 32 57 0
3280 18 42 1
2553 6 30 0
4. ОБОБЩЕННЫЙ МЕТОД НАИМЕНЬШИХ КВАДРАТОВ
И ЕГО ВАРИАНТЫ В СЛУЧАЕ ГЕТЕРОСКЕДАСТИЧНОСТИ

4.1. Расчетные формулы


4.1.1. Оценка коэффициентов обобщенной регрессии:
( )
−1
bˆ ∗ = X′Ω −1 X X′Ω −1y .
4.1.2. Стандартные ошибки в форме Уайта:
−1  1 
()
n
V b = n(X′X )  ∑ es2 x s x′s (X′X)−1 .
ˆ ˆ
 n s =1 
4.1.3. F-статистика, используемая в тесте Голдфелда-Куандта:
F = e1′ e1 / e′2e 2 ,
где e1 - вектор остатков регрессии, построенной по первым n / 2 − d / 2 на-
блюдениям; e 2 - вектор остатков регрессии, построенной по последним
n / 2 − d / 2 наблюдениям.

4.2. Решение типовой задачи


Задание 4.2.1. По данным табл. 4.2.1 построить линейную регрессионную
модель, характеризующую зависимость показателя y от факторов x1 и x2 .
Построение модели начать с тестирования на гетероскедастичность. Считая
наиболее вероятной ситуацию с двухуровневой дисперсией, использовать для
проверки тест Голдфелда-Куандта. Если проверкой будет установлена неод-
нородность данных, то при построении модели применить многоэтапную
процедуру оценивания ее коэффициентов с помощью доступного МНК.
Таблица 4.2.1
№ x1 x2 y № x1 x2 y
1. 13 43 79 11. 58 161 207
2. 28 56 110 12. 23 108 152
3. 33 24 97 13. 69 86 199
4. 42 98 171 14. 8 143 144
5. 12 176 204 15. 60 42 140
6. 44 124 174 16. 11 199 183
7. 36 130 184 17. 26 145 178
8. 33 291 311 18. 61 115 185
9. 34 141 206 19. 18 111 152
10. 21 95 128 20. 30 192 204
Решение с помощью табличного процессора Excel
1. Ввод исходных данных.
2. Проверка данных с помощью теста Голдфелда-Куандта.
2.1. Упорядочивание исходных данных по переменной x2 в предпо-
ложении, что уровень дисперсии зависит от этой переменной, и удаление
шести наблюдений, оказавшихся в середине выборки. Представление резуль-
татов в виде табл. 4.2.2.
Таблица 4.2.2
№ x1 x2 y № x1 x2 y
1. 33 291 311 14. 42 98 171
2. 11 199 183 15. 21 95 128
3. 30 192 204 16. 69 86 199
4. 12 176 204 17. 28 56 110
5. 58 161 207 18. 13 43 79
6. 26 145 178 19. 60 42 140
7. 8 143 144 20. 33 24 97

2.2. Построение по упорядоченным данным двух регрессионных урав-


нений по первым семи наблюдениям (первое регрессионное уравнение, см.
Вывод итогов 1) и по последним семи наблюдениям (второе регрессионное
уравнение, см. Вывод итогов 2).
ВЫВОД ИТОГОВ 1

Регрессионная статистика
Множественный R 0,965091
R-квадрат 0,931401
Нормированный R-
квадрат 0,897101
Стандартная ошибка 16,65463
Наблюдения 7

Дисперсионный анализ
Значи-
df SS MS F мость F
Регрессия 2 15064,2081 7532,104 27,1548 0,0047059
Остаток 4 1109,50616 277,3765
Итого 6 16173,7143

Стан-
Коэффици- дартная P- Нижние Верхние
енты ошибка t-статистика Значение 95% 95%
Y-пересечение 13,86422 26,6435024 0,52036 0,630286 -60,11015 87,838598
Переменная X 1 0,889493 0,39236032 2,267031 0,086009 -0,199876 1,978862
Переменная X 2 0,89948 0,13496104 6,66474 0,002633 0,5247676 1,274193

2.3. Получение расчетных значений и вычисление остатков e1 и e 2 , с


помощью которых составляется статистика Fрасч = e′1e1 / e′2e 2 . Оформление ре-
зультатов в виде табл. 4.2.3.
ВЫВОД ИТОГОВ 2

Регрессионная статистика
Множественный R 0,99412
R-квадрат 0,988274
Нормированный R-
квадрат 0,982411
Стандартная ошибка 5,576546
Наблюдения 7

Дисперсионный анализ
Значи-
df SS MS F мость F
Регрессия 2 10483,6085 5241,804 168,5583 0,000138
Остаток 4 124,391476 31,09787
Итого 6 10608

Коэффициен- Стандарт- P- Нижние Верхние


ты ная ошибка t-статистика Значение 95% 95%
Y-пересечение 23,49446 6,3630766 3,692312 0,020976 5,827693 41,161232
Переменная X 1 1,476582 0,11317714 13,04665 0,000199 1,162351 1,7908128
Переменная X 2 0,826054 0,07856709 10,51399 0,000463 0,607916 1,0441916

Таблица 4.2.3

№ x1 x2 y y расч ( y − y расч ) 2

1. 33 291 311 304,97 36,41


2. 11 199 183 202,65 385,93
3. 30 192 204 213,25 85,55
4. 12 176 204 182,85 447,46
5. 58 161 207 210,27 10,70
6. 26 145 178 167,42 112,03
7. 8 143 144 149,61 31,43

e 1e1 =1109,51
14. 42 98 171 166,46 20,57
15. 21 95 128 132,98 24,78
16. 69 86 199 196,42 6,66
17. 28 56 110 111,10 1,21
18. 13 43 79 78,21 0,62
19. 60 42 140 146,78 46,02
20. 33 24 97 92,05 24,53
e′2 e 2 =124,39

Fрасч = e′1e1 / e′2 e 2 = 1109,51/ 124,39 = 8,92 ; Fc (4, 4) = 6,39 .


Так как Fрасч > Fc , то гипотеза H 0 отвергается и, следовательно, в данных на-
блюдается гетероскедастичность с двухуровневой дисперсией. Поэтому для
построения регрессии по данным табл. 4.2.1 необходимо применить
многоэтапную процедуру доступного МНК.
3. Построение регрессии с помощью доступного взвешенного МНК.
3.1. Построение регрессии обычным МНК по данным табл. 4.2.1 (см.
Вывод итогов 3).
ВЫВОД ИТОГОВ 3

Регрессионная статистика
Множественный R 0,968969836
R-квадрат 0,938902544
Нормированный R-квадрат 0,931714608
Стандартная ошибка 13,07464604
Наблюдения 20

Дисперсионный анализ
Значи-
df SS MS F мость F
Регрессия 2 44658,7117 22329,36 130,622 4,8E-11
Остаток 17 2906,08827 170,9464
Итого 19 47564,8

Коэффици- Стандарт- t- P- Нижние Верхние


енты ная ошибка статистика Значение 95% 95%
Y-пересечение 36,78068243 9,43676522 3,897594 0,001158 16,87082 56,690545
Переменная X 1 1,191842832 0,16975113 7,021119 2,06E-06 0,833699 1,5499869
Переменная X 2 0,760391162 0,04869436 15,61559 1,63E-11 0,657655 0,8631274
3.2. Получение расчетных оценок ŷ i и вычисление абсолютных зна-
чений отклонений. Оформление результатов в виде табл. 4.2.4.
Таблица 4.2.4

№ x1 x2 y y расч y − y расч y − y расч


1. 13 43 79 84,971 -5,971 5,971
2. 28 56 110 112,734 -2,734 2,734
3. 33 24 97 94,361 2,639 2,639
4. 42 98 171 161,356 9,644 9,644
5. 12 176 204 184,912 19,088 19,088
6. 44 124 174 183,510 -9,510 9,510
7. 36 130 184 178,538 5,462 5,462
8. 33 291 311 297,385 13,615 13,615
9. 34 141 206 184,518 21,482 21,482
10. 21 95 128 134,047 -6,047 6,047
11. 58 161 207 228,331 -21,331 21,331
12. 23 108 152 146,315 5,685 5,685
13. 69 86 199 184,411 14,589 14,589
14. 8 143 144 155,051 -11,051 11,051
15. 60 42 140 140,228 -0,228 0,228
16. 11 199 183 201,209 -18,209 18,209
17. 26 145 178 178,025 -0,025 0,025
18. 61 115 185 196,928 -11,928 11,928
19. 18 111 152 142,637 9,363 9,363
20. 30 192 204 218,531 -14,531 14,531
3.3. Деление наблюдений с помощью Автофильтра на две группы I 1
и I 2 со значениями остатков, по абсолютной величине превосходящих и не
превосходящих заданный уровень. (Анализ последнего столбца табл. 4.2.4
позволил в качестве такого уровня выбрать 7.)
3.4. Расчет среднеквадратических ошибок по остаткам, не превосхо-
дящих заданный уровень, и среднеквадратических ошибок по остаткам, пре-
восходящих заданный уровень.
1/ 2 1/ 2
1  1 
S1 =  ∑ ei2  = 4,31 ; S 2 =  ∑ ei2  = 15,16 .
 n1 i∈I 
1  n2 i∈I  2

3.5. Преобразование исходных данных путем деления зависимой и не-


зависимых переменных каждого наблюдения первой группы на S1 , а второй
группы - на S 2 и оформление результатов в виде табл. 4.2.5.
3.6. Построение регрессионной модели по преобразованным данным
табл. 4.2.5. Использование преобразованных данных для построения регрес-
сионной модели эквивалентно применению взвешенного МНК к исходным
данным (см. Вывод итогов 4).
Таким образом, уравнение регрессии, построенное с учетом гетероскеда-
стичности, имеет вид
y = 0,148 + 1,818 x1 + 0,916 x 2 .
Таблица 4.2.5
№ x1 x2 y x1 / S • x2 / S • y / S•
1. 13 43 79 3,014 9,968 18,314
2. 28 56 110 6,491 12,982 25,500
3. 33 24 97 7,650 5,564 22,487
4. 42 98 171 2,771 6,465 11,281
5. 12 176 204 0,792 11,611 13,458
6. 44 124 174 2,903 8,180 11,479
7. 36 130 184 8,346 30,137 42,655
8. 33 291 311 2,177 19,198 20,517
9. 34 141 206 2,243 9,302 13,590
10. 21 95 128 4,868 22,023 29,673
11. 58 161 207 3,826 10,621 13,656
12. 23 108 152 5,332 25,037 35,237
13. 69 86 199 4,552 5,674 13,128
14. 8 143 144 0,528 9,434 9,500
15. 60 42 140 13,909 9,736 32,455
16. 11 199 183 0,726 13,128 12,073
17. 26 145 178 6,027 33,614 41,264
18. 61 115 185 4,024 7,587 12,205
19. 18 111 152 1,187 7,323 10,028
20. 30 192 204 1,979 12,666 13,458
ВЫВОД ИТОГОВ 4

Регрессионная статистика
Множественный R 0,985102
R-квадрат 0,970425
Нормированный R-
квадрат 0,966946
Стандартная ошибка 1,948194
Наблюдения 20

Дисперсионный анализ
Значи-
df SS MS F мость F
Регрессия 2 2117,1754 1058,588 278,9088 1,01E-13
Остаток 17 64,5228463 3,795462
Итого 19 2181,69825

t-
Коэффи- Стандартная статисти- P- Нижние Верхние
циенты ошибка ка Значение 95% 95%
Y-пересечение 0,148364 0,95183574 0,155871 0,877971 -1,85984 2,1565644
Переменная X 1 1,818385 0,14250896 12,75979 3,91E-10 1,517717 2,1190528
Переменная X 2 0,915585 0,05632975 16,25403 8,6E-12 0,79674 1,034431

4.3. Контрольное задание


Задание 4.3.1. По данным табл. 4.3.1 построить линейную регрессион-
ную модель, характеризующую зависимость показателя y от факторов x1 ,
x2 и x3 . Построение модели начать с тестирования на гетероскедастичность.
Считая наиболее вероятной ситуацию зависимости дисперсии ошибки от не-
зависимых переменных x1 и x2 , использовать для проверки тест Бреуша-
Пагана. Если проверкой будет установлена неоднородность данных, то при
построении модели применить многоэтапную процедуру оценивания ее ко-
эффициентов с помощью доступного МНК.
Таблица 4.3.1
№ x1 x2 x3 y № x1 x2 x3 y
1. 123 53 538 1882 9. 153 25 782 2565
2. 122 83 734 2006 10. 164 23 627 1757
3. 143 48 605 2083 11. 193 93 945 3055
4. 159 29 864 2388 12. 151 119 590 1636
5. 133 42 703 2334 13. 148 33 770 2529
6. 183 69 457 1310 14. 103 88 574 1563
7. 139 141 565 1983 15. 140 114 344 1389
8. 162 51 390 1117 16. 129 31 449 1254
5. СГЛАЖИВАНИЕ И ЭКСТРАПОЛЯЦИЯ ВРЕМЕННЫХ РЯДОВ

5.1. Расчетные формулы


5.1.1. Абсолютный прирост:
∆y t = y t − y t −1 ,
где y t - уровень временного ряда в момент t (t=1, 2, . . .).
5.1.2. Средний абсолютный прирост:
y n − y0
∆y = .
n
5.1.3. Темп роста:
yt
Tt p = ⋅100% .
yt −1
5.1.4. Темп прироста:
y t − y t −1
Tt пр = ⋅100% = Tt p − 100% .
yt −1
5.1.5. Средний темп роста:
yn
T = n T1p ⋅ Tnp ⋅⋅⋅Tnp ⋅ 100% = n ⋅ 100% ,
y0
p p p
где T1 , T2 , . . . , Tn - темпы роста за отдельные интервалы времени.
5.1.6. Скользящая средняя:
1 t+ p
yt = ⋅ ∑ yi ,
m i =t − p
где yt - значение скользящей средней для момента t ( t = p + 1, ..., n − p );
y i - фактическое значение уровня в момент i.
5.1.7. Взвешенная скользящая средняя для p=2:
1
yt = ⋅ ( −3 yt − 2 + 12 yt −1 + 17 yt + 12 yt +1 − 3 yt + 2 ) .
35
5.1.8. Взвешенная скользящая средняя для p=3:
1
yt = ⋅ (−2 y t −3 + 3 yt −2 + 6 yt −1 + 7 yt + 6 yt +1 + 3 yt + 2 − 2 yt −3 ) .
21
5.1.9. Модели:
- постоянный рост: yt = b0 + b1t - линейная;
- увеличивающийся рост:
yt = b0 + b1t + b2t 2 - парабола,
yt = b0b1t - показательная;
- уменьшающийся рост:
yt = b0 + b1 ln t - линейная логарифмическая;
yt = b0t b1 при b1 < 1 - степенная;
b
yt = b0 − 1 - модифицированная гипербола;
t
yt = b0 − b1е − t модифицированная экспонента;
- комбинированный рост:
yt = b0 + b1 ln t + b2 (ln t ) 2 с b2 < 0 - логарифмическая парабола;
yt = b0 + b1t + b2t 2 + b3t 3 с b3 < 0 - полином третьей степени.
5.1.10. Критерий Дарбина-Уотсона:
n
∑ (еt − еt −1 ) 2
d = t =2 n
.
∑ еt2
t =1
5.1.11. Ошибка прогноза:
∆ t = yt − yˆ t .
5.1.12. Относительная ошибка прогноза:
yˆ t − yt
δt = ⋅100 .
yt
5.1.13. Средняя абсолютная ошибка прогноза:
n
∑ yt − yˆ t
∆ = t =1 ,
n
5.1.14. Средняя относительная ошибка прогноза:
1 n yt − yˆ t
δ = ∑ ⋅ 100 .
n t =1 yt
5.1.15. Средняя квадратическая ошибка прогноза:
1
n 2 2
 ∑ ( yt − ˆ
y t ) 
S=  t =1  .
 n 
 
 
5.2. Решения типовых задач
Задание 5.2.1. По данным табл. 5.2.1 сгладить временной ряд, характери-
зующий внешнеторговый оборот Австрии за 1980-1995гг. Сглаживание про-
вести с использованием скользящей средней (р=1) и взвешенной скользящей
средней (р=2). Построить совмещенный график по исходным и сглаженным
данным. Сравнить между собой сглаженные кривые, сделать вывод относи-
тельно методов сглаживания. Вычислить абсолютные приросты и относи-
тельные темпы роста для исходных и сглаженных данных. Построить для них
диаграммы и сравнить между собой. Рассчитать по исходным и сглаженным
данным средний абсолютный прирост и средний относительный рост за рас-
сматриваемый период. Результаты расчетов сравнить между собой и в случае
их несовпадения объяснить причины этого.
Таблица 5.2.1

Внешнеторговый оборот, Внешнеторговый оборот,


Год Год
млн. шиллингов млн. шиллингов
1980 752 1988 1174
1981 824 1989 1330
1982 843 1990 1457
1983 884 1991 1533
1984 994 1992 1564
1985 1096 1993 1560
1986 1033 1994 1677
1987 1047 1995 1798

Решение с помощью табличного процессора Excel.


1. Ввод исходных данных.
2. Расчет сглаженных значений. Расчетные формулы располагаются с
учетом исключаемых крайних наблюдений. Оформление результатов расче-
тов в виде табл. 5.2.2.
3. Построение для исходных и сглаженных данных табл. 5.2.2 «Точечно-
го» графика, используя для этого «Мастер диаграмм».
Сглаживание

1800
1600
Оборот, млн.

Внешнеторговый оборот,
шиллингов

1400
1200
млн. шиллингов
1000 Данные, сглаженные по 1-
800
му методу
600
400 Данные, сглаженные по 2-
200 му методу
0
1980 1982 1984 1986 1988 1990 1992 1994

Время, год
Таблица 5.2.2
Номер Внешнеторговый Данные, Данные,
Год сглаженного оборот, сглаженные по сглаженные по
значения млн. шиллингов 1-му методу (р=1) 2-му методу (р=2)
1980 752
1981 824 806,333
1982 1 843 850,333 845,400
1983 2 884 907,000 894,628
1984 3 994 991,333 1000,857
1985 4 1096 1041,000 1061,800
1986 5 1033 1058,667 1050,657
1987 6 1047 1084,667 1057,285
1988 7 1174 1183,667 1171,771
1989 8 1330 1320,333 1326,914
1990 9 1457 1440,000 1454,600
1991 10 1533 1518,000 1532,657
1992 11 1564 1552,333 1551,485
1993 12 1560 1600,333 1583,400
1994 1677 1678,333
1995 1798
Вывод: построенный совмещенный график показывает, что данные,
сглаженные по второму методу, более точно повторяют конфигурацию траек-
тории кривой исходного динамического ряда, чем данные, сглаженные по
первому методу. Следовательно, второй метод следует рекомендовать в тех
случаях, когда дисперсия случайных составляющих исходных данных невы-
сока. Однако нужно помнить, что его применение приводит к потере четырех
наблюдений, в то время как при сглаживании по первому методу исключают-
ся только два наблюдения.
4. Графический анализ абсолютных приростов и темпов роста.
4.1. Расчет абсолютных приростов для исходных и сглаженных данных
по формуле 5.1.1. Оформление результатов расчетов в виде табл. 5.2.3.
Таблица 5.2.3
Абсолютный прирост Абсолютный прирост Абсолютные приросты
Год внешнеторгового обо- данных, сглаженных данных, сглаженных
рота, млн. шиллингов по 1-му методу по 2-му методу
1983 41 56,667
1984 110 84,333 106,229
1985 102 49,667 60,943
1986 -63 17,667 -11,143
1987 14 26,000 6,629
1988 127 99,000 114,486
1989 156 136,667 155,143
1990 127 119,667 127,686
1991 76 78,000 78,057
1992 31 34,333 18,829
1993 -4 48,000 31,914
4.2. Используя «Мастер диаграмм», построить «Линейчатую» диа-
грамму для абсолютных приростов исходных и сглаженных данных.

Абсолютные приросты
Абсолютные приросты
15
данных, сглаженных по
13
Время, год 2-му методу
11

9
Абсолютный прирост
данных, сглаженных по
7
1-му методу
5

3 Абсолютный прирост
1
внешнеторгового
-100 -50 0 50 100 150 200 оборота, млн. шиллингов
Абсолютные приросты оборота, млн.
шиллингов

4.3. Рассчитать темпы роста исходных и сглаженных данных по фор-


муле 5.1.3. Результаты оформить в виде табл. 5.2.4.
Таблица 5.2.4

Темп роста внешне- Темп роста данных, Темп роста данных,


Год торгового оборота, сглаженных по 1-му сглаженных по 2-му
% методу, % методу, %

1983 104,863 106,664 105,823


1984 112,443 109,298 111,874
1985 110,261 105,010 106,089
1986 94,251 101,697 98,951
1987 101,355 102,456 100,631
1988 112,129 109,127 110,828
1989 113,287 111,546 113,240
1990 109,548 109,063 109,623
1991 105,216 105,417 105,366
1992 102,022 102,262 101,228
1993 99,744 103,092 102,057

4.4. Построить «Линейчатую» диаграмму для темпов роста, используя


для этого «Мастер диаграмм».
Темпы роста

15 Темп роста данных,


14
13
сглаженных по 2-му методу,
12 %
Время, год

11
10
Темп роста данных,
9
8
сглаженных по 1-му методу,
7 %
6
5
Темп роста
4 внешнеторгового оборота,
3
2 %
1

0 20 40 60 80 100 120

Темпы роста оборота, %

Диаграммы еще раз позволяют убедиться в том, что второй метод следует
применять в тех случаях, когда дисперсия случайной составляющей уровней
временного ряда невелика.
5. Расчет по исходным и сглаженным данным среднего абсолютного
прироста и среднего относительного роста за рассматриваемый период по
формулам (5.1.2) и (5.1.5).
1560 − 843 1600,333 − 850,333
∆y = = 65,181; ∆y1 = = 68,182 ;
11 11
1583,400 − 845,400 1560
∆y 2 = = 67,091 ; T = 11 ⋅ 100% = 105,75% ;
11 843

1600,333 1583,400
T1 = 11 ⋅ 100% = 105,92% ; T2 = 11 ⋅ 100% = 105,87% .
850,333 845,400

Средние характеристики, рассчитанные по сглаженным данным, отли-


чаются от средних характеристик, рассчитанных по исходным данным. Это
объясняется тем, что присутствие случайной компоненты в уровнях сглажен-
ных временных рядов сведено к минимуму.
Задание 5.2.2. Торговая компания определяет поквартальный плановый
ФОТ на 2002 г. Для этого ей необходимо знать объем продаж на этот период
времени. Подобрать кривую роста (трендовую модель) к временному ряду,
данные которого приведены в табл. 5.2.5, и рассчитать с помощью построен-
ной модели прогнозные оценки продаж.
Таблица 5.2.5
Номер Объем продаж, Номер Объем продаж,
Год Год
квартала тыс. руб. квартала тыс. руб.
1 386,700 11 469,037
1999
2 431,222 12 468,726
1997 3 447,911 13 469,153
4 456,526 14 470,522
2000
5 460,998 15 471,160
6 464,566 16 470,195
1998
7 462,816 17 472,079
8 466,391 18 472,540
2001
9 468,984 19 473,345
1999
10 467,813 20 473,085

Решение с помощью табличного процессора Excel


1. Ввод исходных данных по объему продаж.
2. Сглаживание данных.
3. Расчет абсолютных приростов по сглаженным данным.
Исходные данные и расчетные характеристики оформить в виде сводной
табл. 5.2.6.
Таблица 5.2.6
Объем продаж Абсолютный
№ Объем продаж,
№ п.п. (сглаженный), прирост
квартала тыс. руб.
тыс. руб. сглаженных данных
1 386,700
2 431,222 1 421,944
3 447,911 2 445,220 23,276
4 456,526 3 455,145 9,925
5 460,998 4 460,697 5,552
6 464,566 5 462,794 2,097
7 462,816 6 464,591 1,797
8 466,391 7 466,064 1,472
9 468,984 8 467,729 1,666
10 467,813 9 468,611 0,882
11 469,037 10 468,526 -0,086
12 468,726 11 468,972 0,447
13 469,153 12 469,467 0,495
14 470,522 13 470,278 0,811
15 471,160 14 470,626 0,347
16 470,195 15 471,145 0,519
17 472,079 16 471,605 0,460
18 472,540 17 472,655 1,050
19 473,345 18 472,990 0,335
20 473,085

4. Определение типа роста по «Линейчатой» диаграмме, построенной для


приростов.
Прирост продаж

17

15
Время, квартал

13

11

-5,000 0,000 5,000 10,000 15,000 20,000 25,000

Прирост объема продаж, тыс. руб.

Как показывает анализ диаграммы, временной ряд, характеризующий


объем продаж, имеет тенденцию уменьшающегося роста. Для моделирования
такого типа роста используются следующие модели:
b
y t = b0 + b1 ln t ; yt = b0 t b ; yt = b0 + b1t − b2 t 2 ;
1
yt = b0 − 1 .
t
5. Подготовка исходных данных для построения указанных моделей и
оформление их в виде табл. 5.2.7.
Таблица 5.2.7
y ln y t t2 ln t 1/t
386,700 5,958 1 1 0,000 1,000
431,222 6,067 2 4 0,693 0,500
447,911 6,105 3 9 1,099 0,333
456,526 6,124 4 16 1,386 0,250
460,998 6,133 5 25 1,609 0,200
464,566 6,141 6 36 1,792 0,167
462,816 6,137 7 49 1,946 0,143
466,391 6,145 8 64 2,079 0,125
468,984 6,151 9 81 2,197 0,111
467,813 6,148 10 100 2,303 0,100
469,037 6,151 11 121 2,398 0,091
468,726 6,150 12 144 2,485 0,083
469,153 6,151 13 169 2,565 0,077
470,522 6,154 14 196 2,639 0,071
471,160 6,155 15 225 2,708 0,067
470,195 6,153 16 256 2,773 0,063
472,079 6,157 17 289 2,833 0,059
472,540 6,158 18 324 2,890 0,056
473,345 6,160 19 361 2,944 0,053
473,085 6,159 20 400 2,996 0,050

6. Используя «Пакет анализа» табличного процессора Excel, вычислим


коэффициенты трендовых моделей.
y1 = 413,964+22,309Lnt,
y 2 = 413,573 ⋅ t 0, 051 ,
y3 = 409,990 + 9,538t − 0,341t 2 ,
90,384
y 4 = 477,447 − .
t
7. Вычисление расчетных значений и оформление их в виде табл. 5.2.8.
8. Расчет отклонений расчетных значений от фактических и их квадра-
тов. Вычисление критерия для каждой из построенных функций и выбор наи-
лучшей по минимальному значению критерия. Оформление результатов в ви-
де табл. 5.2.9.
Минимальное среднее квадратическое отклонение дает модифицирован-
ная гипербола, поэтому она выбирается в качестве тренда.
9. Расчет критерия Дарбина-Уотсона.
36,920
d= = 1,525 .
24,214
Для n=20 и единственной переменной в модели нижняя граница критерия
d 1 = 1,20 , а верхняя - d 2 = 1,41 . Следовательно, случайные отклонения незави-
симы и построенная модель адекватна.
Таблица 5.2.8
y ln y t t2 ln t 1/t y1 y2 y3 y4
386,700 5,958 1 1 0,000 1,000 413,964 413,573 419,187 387,063
431,222 6,067 2 4 0,693 0,500 429,427 428,454 427,702 432,255
447,911 6,105 3 9 1,099 0,333 438,473 437,407 435,535 447,319
456,526 6,124 4 16 1,386 0,250 444,891 443,871 442,686 454,851
460,998 6,133 5 25 1,609 0,200 449,869 448,952 449,155 459,370
464,566 6,141 6 36 1,792 0,167 453,936 453,146 454,942 462,383
462,816 6,137 7 49 1,946 0,143 457,375 456,722 460,047 464,535
466,391 6,145 8 64 2,079 0,125 460,354 459,843 464,470 466,149
468,984 6,151 9 81 2,197 0,111 462,982 462,614 468,211 467,404
467,813 6,148 10 100 2,303 0,100 465,332 465,106 471,270 468,409
469,037 6,151 11 121 2,398 0,091 467,459 467,373 473,647 469,230
468,726 6,150 12 144 2,485 0,083 469,400 469,451 475,342 469,915
469,153 6,151 13 169 2,565 0,077 471,185 471,371 476,355 470,494
470,522 6,154 14 196 2,639 0,071 472,839 473,156 476,686 470,991
471,160 6,155 15 225 2,708 0,067 474,378 474,824 476,335 471,421
470,195 6,153 16 256 2,773 0,063 475,818 476,390 475,302 471,798
472,079 6,157 17 289 2,833 0,059 477,170 477,865 473,587 472,130
472,540 6,158 18 324 2,890 0,056 478,445 479,260 471,190 472,426
473,345 6,160 19 361 2,944 0,053 479,651 480,583 468,111 472,690
473,085 6,159 20 400 2,996 0,050 480,796 481,842 464,350 472,928

10. Расчет прогнозных оценок и их доверительных границ. Оформление


результатов в виде табл. 5.2.10.

5.3. Контрольные задания


Задание 5.3.1. Для каждого временного ряда табл. 5.3.1 определить тип
роста. Применяя среднеквадратический критерий, среди функций, исполь-
зуемых для моделирования данного типа роста, выбрать наиболее подходя-
щую для прогнозных расчетов и получить точечные и интервальные прогно-
зы на пять периодов (l=5). С помощью критерия Дарбина – Уотсона прове-
рить адекватность прогнозной модели. Построить «Точечный» график для
фактических и расчетных значений, включая прогнозные.
Задание 5.3.2. Для каждого региона, данные о регистрации новых авто-
мобилей по которому представлены в табл. 5.3.2, выбрать наиболее подходя-
щую прогнозную функцию и с ее помощью осуществить точечный и интер-
вальный прогноз на три периода. С помощью критерия Дарбина – Уотсона
проверить адекватность прогнозной модели. Для каждого региона построить
«Точечный» график для фактических и расчетных значений, включая про-
гнозные.
Таблица 5.2.9

y t y − y1 y − y 2 y − y3 y − y 4 ( y − y1 ) 2 ( y − y2 )2 ( y − y3 ) 2 ( y − y4 )2
386,700 1 -27,264 -26,873 -32,487 -0,363 743,338 722,171 1055,420 0,132
431,222 2 1,795 2,768 3,520 -1,033 3,222 7,661 12,393 1,066
447,911 3 9,438 10,504 12,376 0,592 89,076 110,340 153,163 0,350
456,526 4 11,636 12,655 13,840 1,675 135,388 160,149 191,559 2,807
460,998 5 11,129 12,047 11,843 1,628 123,864 145,121 140,265 2,651
464,566 6 10,630 11,421 9,624 2,183 112,999 130,433 92,630 4,768
462,816 7 5,441 6,094 2,769 -1,719 29,606 37,139 7,670 2,954
466,391 8 6,037 6,548 1,921 0,242 36,440 42,871 3,690 0,058
468,984 9 6,002 6,370 0,773 1,580 36,024 40,579 0,597 2,495
467,813 10 2,481 2,707 -3,457 -0,595 6,155 7,328 11,949 0,354
469,037 11 1,578 1,665 -4,610 -0,193 2,491 2,771 21,251 0,037
468,726 12 -0,674 -0,725 -6,616 -1,189 0,454 0,526 43,768 1,413
469,153 13 -2,032 -2,218 -7,202 -1,341 4,131 4,921 51,868 1,799
470,522 14 -2,316 -2,634 -6,164 -0,469 5,366 6,938 37,990 0,220
471,160 15 -3,218 -3,664 -5,175 -0,262 10,356 13,428 26,782 0,068
470,195 16 -5,623 -6,195 -5,107 -1,603 31,619 38,379 26,086 2,571
472,079 17 -5,091 -5,786 -1,508 -0,051 25,919 33,474 2,274 0,003
472,540 18 -5,905 -6,719 1,350 0,115 34,868 45,151 1,824 0,013
473,345 19 -6,306 -7,238 5,234 0,655 39,767 52,386 27,399 0,430
473,085 20 -7,711 -8,758 8,735 0,157 59,464 76,695 76,292 0,025
Сумма квадратов отклонений 1530,545 1678,461 1984,869 24,214
Средний квадрат отклонений 76,527 83,923 99,243 1,211
Среднее квадратическое отклонение 8,748 9,161 9,962 1,100
Таблица 5.2.10
Номер Прогнозные оценки Нижняя граница Верхняя граница
Год квар- объема продаж, тыс. прогнозной прогнозной
тала руб. оценки оценки
21 473,143 470,652 475,634
22 473,339 470,847 475,830
2002
23 473,517 471,026 476,009
24 473,681 471,190 476,172

Таблица 5.3.1
Y1 Y2 Y3 Y4 Y5 Y6 Y7
14,652 149,380 115,375 390,380 349,230 44,135 114,436
20,290 156,632 116,931 394,032 369,857 47,111 141,824
23,144 163,320 118,675 396,378 376,918 51,095 160,770
26,521 169,996 120,370 398,037 380,475 55,850 175,837
32,480 175,747 121,997 399,237 382,540 61,357 188,398
40,664 181,602 123,696 400,277 383,975 67,756 199,460
47,349 186,649 125,571 400,719 384,570 75,151 209,218
58,324 191,433 127,060 401,636 385,505 82,980 218,084
65,820 195,882 129,000 402,406 386,214 92,080 226,070
78,206 199,736 130,604 402,758 386,456 101,664 233,673
94,934 203,304 132,391 403,314 386,873 112,251 240,637
111,293 206,241 134,204 403,684 387,087 123,684 247,254
137,607 208,931 135,803 404,102 387,337 135,723 253,473
162,762 211,148 137,369 404,590 387,652 148,549 259,350

Таблица 5.3.2
Регион / Год 1993 1994 1995 1996 1997 1998 1999 2000
Западная
Европа 11451 11934 12021 12790 13408 14341 13800 12700
Североамери-
канское согла-
шение о сво- 9650 10154 9424 9390 9333 9358 8930 8335
бодной торгов-
ле
Южная Аме-
рика 1485 1737 1898 1938 1703 1703 1120 1460
Япония 4200 4210 4444 4669 4093 4093 4200 4450
Азия (исклю-
чая Японию) 2700 2972 3267 3533 2468 2468 2743 3098
Восточная
Европа 1879 1560 1533 1729 1820 1820 1534 1580
6. АВТОРЕГРЕССИОННЫЕ ПРОЦЕССЫ И ИХ МОДЕЛИ

6.1. Расчетные формулы


6.1.1. Модель авторегрессии первого порядка AR(1):
Yt = a0 + a1Yt −1 + ε t .
6.1.2. Модель скользящей средней MA(1) (самостоятельно обычно не ис-
пользуется):
Yˆt = b0 + b1ε t −1 + ε t ,
где ε t = Yt − Yˆt .
6.1.3. Авторегрессионная модель скользящей средней ARMA(1,1):
Yt = a0 + a1Yt −1 + b1ε t −1 + u t ,
где u t - ненаблюдаемая ошибка в данном уравнении.
6.1.4. Коэффициент автокорреляции:
n−k
∑ (Yt − Y )(Yt + k − Y )
t =1
rk = n
.
∑ (Yt − Y )
2

t =1
6.1.5. Доверительный интервал для k-го коэффициента автокорреляции:
1 1
− 1,96 ⋅ ≤ rk ≤ 1,96 ⋅ .
n n
6.1.6. Статистика для проверки по χ 2 - критерию значимости m коэффи-
циентов автокорреляции:
m
Q = n ∑ ri2 ,
i =1
где n – объем выборочной совокупности; m – максимальный рассматривае-
мый лаг.
6.1.7. Статистика для проверки значимости единичного корня по крите-
рию Дики-Фуллера:
DF расч = β1 / S β1 ,
где β1 = α1 − 1 , а S β1 - стандартная ошибка β1 .
6.1.8. В случае автокорреляции остатков для проверки значимости еди-
ничного корня применяется расширенный критерий Дики-Фуллера. В расши-
ренном критерии статистика DF расч сравнивается с критическим значением,
рассчитываемым по следующей формуле:
ϕ1 ϕ 2
EDF = ϕ 0 + + .
T T2
Значения составляющих EDF в зависимости от уровня значимости сле-
дующие:
ϕ 0 = −2,57 (1%) или − 1,94 (5%) ;
ϕ1 = −1,96 (1%) или − 0,398 (5%) ;
ϕ 2 = −10,04 (1%) или 0 (5%) .
Если нулевая гипотеза проверяется для модели со свободным членом
Yt = α 0 + α1Yt −1 + ε t ,
то строится уравнение
∆Yt = α 0 + β Yt −1 + ε t
и расчетное значение DF расч = β1 / S β1 сравнивается с критическим значени-
ем EDF, рассчитываемым при:
ϕ 0 = −3,43 (1%) или − 2,86 (5%) ;
ϕ1 = −6,00 (1%) или − 2,74 (5%) ;
ϕ 2 = −29,25(1%) или − 8,36 (5%) .
В тех случаях, когда модель содержит и свободный член, и тренд
Yt = α 0 + α1Yt −1 + γt + ε t ,
то коэффициент β1 определяется по уравнению
∆Yt = α 0 + β Yt −1 + γ t + ε t ,
а критическое значение для проверки нулевой гипотезы рассчитывается при:
ϕ 0 = −3,96 (1%) или − 3,41 (5%) ;
ϕ1 = −8,35 (1%) или − 4,04 (5%) ;
ϕ 2 = −47,44 (1%) или − 17,83 (5%) .

6.2. Решение типовой задачи


Задание 6.2.1. По данным табл. 6.2.1, характеризующим объем продаж в
США спортивного оборудования для футбола, построить модель ARIMA(p,
q, 0), предварительно убедившись на 95%-ном уровне значимости в интегра-
ции данного временного ряда и определив порядок авторегрессии. С помо-
щью построенной модели осуществить прогнозные расчеты на два после-
дующих периода.
Таблица 6.2.1
Тип оборудования
Год
Физ.упр-ния Гольф Кэмпинг Бейсбол Футбол Теннис
1986 680 740 695 580 88 255
1987 839 891 860 621 103 262
1988 1115 987 1008 665 104 271
1989 1290 1102 1130 697 118 283
1990 1434 1139 1234 707 117 294
1991 1546 1276 1340 738 126 310
1992 1654 1324 1419 742 140 367
1993 1755 1490 1490 769 151 380
1994 1825 1793 1555 778 147 259
1995 2510 2130 1612 783 159 235
1996 2890 2463 1660 789 162 240
1997 3180 2749 1700 792 171 235
1998 3400 2800 1738 796 168 215
1999 3635 2770 1765 802 174 220

Решение с помощью табличного процессора Excel.


1. Ввод исходных данных и оформление их в виде табл. 6.2.2.
Таблица 6.2.2
Yt Yt −1
103 88
104 103
118 104
117 118
126 117
140 126
151 140
147 151
159 147
162 159
171 162
168 171
174 168

2. Проверка временного ряда на стационарность с помощью критерия


Дики-Фуллера, т.е. проверка гипотезы
H 0 : β1 = 0 ,
H A : β 1 значительно меньше нуля.
2.1.Оценка с помощью метода наименьших квадратов (пакета анализа
Excel) параметров модели Yt = α 0 + α 1Yt −1 + ε t
Yt = 20,034 + 0,900Yt −1 .
(9,349) (0,068)
2.2. Расчет статистики
β 0,900 − 1
DFрасч = = = −1,462
Sβ 0,068
и сравнение ее с критическим значением расширенного критерия Дики-
Фуллера на 95%-ном уровне значимости, равным
− 2,74 − 8,36
EDF = −2,86 + + = −3,120 .
13 132
Для данного уровня значимости ряд нестационарен, так как DFрасч > EDF .
2.3. Разностное представление временного ряда
∆Yt = Yt − Yt −1
и оформление результатов в виде табл. 6.2.3.
Таблица 6.2.3
∆Yt ∆Yt −1
1 15
14 1
-1 14
9 -1
14 9
11 14
-4 11
12 -4
3 12
9 3
-3 9
6 -3

2.4. Оценка с помощью метода наименьших квадратов («Пакета ана-


лиза» Excel) параметров модели ∆Yt = α 0 + α 1 ∆Yt −1 + ε t
∆Yt = 9,104 − 0,478∆Yt −1 .
(2,387) (0,252)
2.5. Расчет статистики
β − 0,478 − 1
DFрасч = = = −5,875
Sβ 0,252
и сравнение ее с критическим значением расширенного критерия Дики-
Фуллера на 95%-ном уровне значимости
− 2,74 − 8,36
EDF = −2,86 + + = −3,146
12 12 2
Для данного уровня значимости ряд стационарен, так как DFрасч < EDF и,
следовательно, мы имеем дело с процессом I(1).
3. Определение порядка авторегрессии для преобразованного ряда.
3.1. Расчет частных коэффициентов автокорреляции.
Частный коэффициент автокорреляции первого порядка равен коэффициенту
автокорреляции первого порядка, т.е. ρ1 = r1 = −0,478 . Частный коэффициент
автокорреляции второго порядка равен последнему коэффициенту авторег-
рессионного уравнения второго порядка, т.е. для его получения необходимо
построить авторегрессионное уравнение второго порядка с помощью «Пакета
анализа» Excel по данным табл. 6.2.4
Таблица 6.2.4
∆Yt ∆Yt −1 ∆Yt − 2
14 1 15
-1 14 1
9 -1 14
14 9 -1
11 14 9
-4 11 14
12 -4 11
3 12 -4
9 3 12
-3 9 3
6 -3 9

Yt = 9,478 − 0,480Yt −1 − 0,036Y t − 2 .


Получили, что значение частного коэффициента автокорреляции резко пада-
ет, следовательно, для преобразованного временного ряда имеет смысл стро-
ить модель ARMA(1,1,0).
3.2. Осуществление прогнозных расчетов по авторегрессионной мо-
дели первого порядка, построенной в п. 2.4:
∆Yt = 9,104 − 0,478∆Yt −1 ,
Yt − Yt −1 = 9,104 − 0,478(Yt −1 − Yt − 2 ) ,
Yt = 9,104 + (1 − 0,478)Yt −1 + 0,478Yt − 2 ,
Yˆt +1 = 9,104 + 0,522Yt + 0,478Yt −1 = 180 ,
Yˆt + 2 = 9,104 + 0,522Yˆt +1 + 0,478Yt = 186 .

6.3. Контрольное задание


Задание 6.3.1. По данным таблицы 6.2.1, характеризующим объем про-
даж в США спортивного оборудования для
1) физического оборудования;
2) гольфа;
3) кэмпинга;
4) бейсбола;
5) тенниса
построить модели ARIMA(p, q, 0), предварительно убедившись в степени ин-
теграции данного временного ряда и определив порядок авторегрессии. С по-
мощью построенной модели осуществить прогнозные расчеты на два после-
дующих периода.

7. ПРОСТЕЙШИЕ АДАПТИВНЫЕ МОДЕЛИ


ВРЕМЕННЫХ РЯДОВ

7.1. Расчетные формулы:


7.1.1. Рекуррентные формулы для расчета текущих значений коэффици-
ентов модели Хольта:
aˆ1t = α1 xt + (1 − α1 )(aˆ1t −1 + aˆ 2t −1 )
aˆ 2t = α 2 (aˆ1t − aˆ1t −1 ) + (1 − α 2 )aˆ 2t −1 ,
где α1 ,α 2 − параметры экспоненциального сглаживания (0 < α1 , α 2 < 1) .
7.1.2. Рекуррентные формулы для расчета текущих значений коэффици-
ентов модели Брауна:
aˆ1t = aˆ1t −1 + aˆ 2t −1 + (1 − β 2 )ε t
aˆ 2t = aˆ 2t −1 + (1 − β ) 2 ε t .
7.1.3. Формулы для расчета текущих коэффициентов адаптивного поли-
нома первого порядка:
aˆ 0,0 , aˆ 1,0 - оценки МНК;
Начальные значения:
(1 − α )
S [01]= aˆ 0,0 − aˆ 1,0 ;
α
2(1 − α )
S [02]= aˆ 0,0 − aˆ 1,0 .
α
Рекуррентные соотношения для вычисления экспоненциальных средних:
S t[1] = αxt + (1 − α ) S t[1−]1 ;
S t[2] = αS t[1] + (1 − α ) S t[−21] .
Коэффициенты адаптивного полинома:
aˆ 0,t = 2S t[1] − S t[2] ;
α
aˆ1,t = ( S t[1] − S t[ 2] ) .
1−α
Адаптивный полином:
xˆt +τ = aˆ 0,t + τaˆ1,t =
α α
= (2 + τ ) S t[1] − (1 − τ ) St[ 2] .
1−α 1−α

7.1.4. Формулы для расчета текущих коэффициентов адаптивного поли-


нома второго порядка:
aˆ 0,0 , aˆ1,0 , aˆ 2,0 - оценки МНК;
Начальные значения:
1−α (1 − α )(2 − α )
S 0[1] = aˆ 0,0 − aˆ1,0 + aˆ 2,0 ;
α 2α 2
2(1 − α ) (1 − α )(3 − 2α )
S 0[ 2] = aˆ 0,0 − aˆ 1,0 + aˆ 2,0 ;
α α 2

3(1 − α ) 3(1 − α )(4 − 3α )


S 0[3] = aˆ 0,0 − aˆ 1,0 + aˆ 2,0 .
α 2α 2
Рекуррентные соотношения для вычисления экспоненциальных средних:
S t[1] = αxt + (1 − α ) St[1−]1 ;
S t[ 2] = αS t[1] + (1 − α ) S t[−21] ;
S t[3] = αS t[2] + (1 − α ) S t[−31] .
Коэффициенты адаптивного полинома:
aˆ 0,t = 3S t[1] − 3S t[ 2] + S t[3] ;
α
aˆ1,t = [(6 − 5α ) St[1] − 2(5 − 4α )St[ 2 ] + (4 − 3α )St[3] ];
2(1 − α ) 2

aˆ 2,t =
α2
(1 − α ) 2
[S [1]
t ]
− 2S t[2] + St[3] .

Адаптивный полином:
1
xˆt +τ = aˆ 0,t + τaˆ1,t + τaˆ 2,t =
2
[ 2
= 6(1 − α ) + 2(6 − 5α )ατ + α τ 2 2
] St[1]
2(1 − α )

[ 2
− 6(1 − α ) + 2(5 − 4α )ατ + 2α τ 2 2
]2(1 − α )
S t[2]
2
+

[ 2
+ 2(1 − α ) + (4 − 3α )ατ + α τ 2 2
]2(1 − α )
St[3]
2
.

7.2. Решение типовых задач


Задание 7.2.1. По данным табл. 7.2.1, отражающим объем продаж новых
автомобилей марки Toyota в США, построить модель в виде полинома пер-
вого порядка с адаптивным механизмом Хольта. Осуществить оптимальную
настройку параметров адаптации α 1 , α 2 по критерию суммы квадратов про-
гнозных ошибок, используя для этого контрольную выборку из трех послед-
них наблюдений. Провести прогнозные расчеты для упреждения τ = 3 .
Таблица 7.2.1

Год Объем про- Год Объем продаж,


даж, шт. шт.
1988 936000 1994 1088100
1989 945400 1995 1083400
1990 1058000 1996 1159700
1991 1010500 1997 1230100
1992 1023600 1998 1361000
1993 1033200 1999 1523000

Решение с помощью табличного процессора Excel.


1. Ввод исходных данных и оформление их в виде таблицы, удобной для
проведения расчетов.
2. Расчет коэффициентов модели.
2.1. Определение начальных значений коэффициентов модели
aˆ11 = x1 , aˆ 21 = x 2 − aˆ11
и параметров адаптации
α1 = 0,1 , α 2 = 0,1 .
2.2. Расчет текущих значений коэффициентов регрессии
aˆ1t = α1 xt + (1 − α 1 )(aˆ1t −1 + aˆ 2t −1 ) ;
aˆ 2 t = α 2 (aˆ1t − aˆ1t −1 ) + (1 − α 2 ) aˆ 2t −1 , t = 2, 9 .
2.3. Настройка параметров адаптации путем минимизации критерия
1

1 2
S (α1 , α 2 ) =  ∑ ( yt − yˆ t )  ,
2

3 
где yt - фактические значения, принадлежащие контрольной выборки (t=10;
11; 12); ŷt - прогнозные значения для моментов времени t=10; 11; 12,
рассчитанные по модели с коэффициентами â19 и â29 .
Минимизация S (α1 ,α 2 ) осуществляется последовательным изменением
параметров адаптации α1 и α 2 в интервале (0; 1) с шагом 0,1.
Все выше описанные расчеты сведены в табл. 7.2.2.
Таблица 7.2.2
Период y a1 a2 Прогноз ( y − ŷ )2
1 936000 936000 9400,00
2 945400 945400 9400,00
3 1058000 1037360 83704,00
4 1010500 1032613 4097,92
5 1023600 1026222 -5341,80
6 1033200 1030736 3528,35
7 1088100 1077333 42289,97
8 1083400 1090645 16209,51
9 1159700 1149131 54258,57
Контрольная выборка
10 1230100 1203389 713456674
11 1361000 1257648 10681643462
12 1523000 1311907 44560450279
Средний квадрат ошибки 55955550415
Стандартная ошибка 136578

В первой строке столбцов a1 и a2 находятся начальные значения коэф-


фициентов модели, определенные в соответствии с п. 2.1. В остальных стро-
ках этих столбцов стоят значения текущих значений коэффициентов адаптив-
ной модели, рассчитываемые по формулам п. 2.2.
Оптимальные значения параметров адаптации α1∗ = 0,8 ; α 2∗ = 0,9 .
3. Расчет прогнозных значений по адаптивной модели.
3.1. Последовательный расчет текущих коэффициентов модели
( t = 2, 12 ) с использованием оптимально настроенных параметров адаптации.
3.2. Расчет прогнозных значений ŷ t , (t=13; 14; 15) по модели с теку-
щими коэффициентами для момента t=12.
3.3. Оформление результатов расчетов в виде табл. 7.2.3.
Таблица 7.2.3
Период y a1 a2 Прогноз
1 936000 936000 9400,00
2 945400 945400 9400,00
3 1058000 1037360 83704,00
4 1010500 1032613 4097,92
5 1023600 1026222 -5341,80
6 1033200 1030736 3528,35
7 1088100 1077333 42289,97
8 1083400 1090645 16209,51
9 1159700 1149131 54258,57
10 1230100 1224758 73490,21
11 1361000 1348450 118671,6
12 1523000 1511824 158904,3
13 1670729
14 1829633
15 1988537

Задание 7.2.2. По данным табл. 7.2.4, отражающим объем продаж новых


автомобилей марки Volkswagen в США, построить модель Брауна в виде по-
линома первого порядка. Приняв параметр адаптации α = 0,25 , осуществить
прогнозные расчеты для τ = 3 .
Таблица 7.2.4
Объем продаж, Объем продаж,
Год Год
шт. шт.
1988 197200 1994 109600
1989 154900 1995 106600
1990 157500 1996 163200
1991 109000 1997 172000
1992 90500 1998 267200
1993 62100 1999 260286

Решение с помощью табличного процессора Excel.


1. Ввод исходных данных и оформление их в виде таблицы, удобной для
проведения расчетов.
2. Расчет коэффициентов модели.
2.1. Вычисление коэффициентов полинома первой степени
y = a0 + a1t с помощью МНК
a 0 = 104788,76 ; a1 = 7597,70 .
2.2. Определение начальных значений экспоненциальных средних S 0[1] ,
S 0[2 ]
S 0[1] = 104788,76 + 7597,70(1 − 0,25) / 0,25 = 127581,86 ;
S 0[2 ] = 104788,76 + 7597,70 ⋅ 2(1 − 0,25) / 0,25 = 150374,95 .
2.3. Вычисление текущих значений экспоненциальных средних S t[1] , S t[2 ]
S1[1] = 0,25 ⋅ 197200 + (1 − 0,25) ⋅ 127581,86 = 144986,39
. . . . . . . . . . . . . . . . . . . . . . . . . .
[1]
S12 = 0,25 ⋅ 260286 + (1 − 0,25) ⋅ 168275,15 = 191277,77 ;

S1[2 ] = 0,25 ⋅ 144986,39 + (1 − 0,25) ⋅ 127581,86 = 149027,81


. . . . . . . . . . . . . . . . . . . . . . . . . .
[2 ]
S12 = 0,25 ⋅ 191277,77 + (1 − 0,25) ⋅ 136907,85 = 150500,33 .
2.4. Расчет коэффициентов прогнозного полинома по формулам
aˆ 0, 12 = 2 ⋅ 191277,77 − 150500,33 = 232055,21;
0,25
aˆ1, 12 = (191277,77 − 150500,33) = 13592,48 .
1 − 0,25
3. Получение прогнозных оценок с помощью полинома
yˆ t +τ = 232055,21 + 13592,48 ⋅ τ , τ = 1, 2, 3 ;
yˆ 13 = 259240 ; yˆ 14 = 272833 ; yˆ 15 = 286425 .
4. Оформление результатов в виде табл. 7.2.5, 7.2.6
Таблица 7.2.5
Параметр Значение
α 0,25
a0 104788,76
a1 7597,70
S 0[1] 127581,86
[2]
S0 150374,95

7. 3. Контрольные задания
Задание 7.3.1. По данным табл. 7.2.4 построить модель Брауна в виде по-
линома второго порядка. Приняв параметр адаптации α = 0,25 , осуществить
прогнозные расчеты для τ = 3 . Сравнить результаты расчетов по моделям
первого и второго порядка.
Задание 7.3.2. По данным табл. 7.3.1 для автомобиля марки Ford постро-
ить две модели: модель Хольта и модель Брауна. Для обеих моделей провести
оптимальную настройку параметров адаптации. Сравнить на контрольной
выборке из последних трех наблюдений точность предсказания по этим мо-
делям. Осуществить прогнозные расчеты ( τ = 3 ), используя более точную
модель.
Таблица 7.2.6

Период y S t[1] S t[2 ]


1 197200 144986,4 149027,8
2 154900 147464,8 148637,1
3 157500 149973,6 148971,2
4 109000 139730,2 146660,9
5 90500 127422,6 141851,4
6 62100 111092 134161,5
7 109600 110719 128300,9
8 106600 109689,2 123648
9 163200 123066,9 123502,7
10 172000 135300,2 126452,1
11 267200 168275,1 136907,9
12 260286 191277,8 150500,3
259240
Прогноз 272833
286425

Задание 7.3.3. По данным табл. 7.3.1 для автомобилей Nissan построить


прогнозную модель Хольта с адаптивным механизмом Брауна и сравнить ее
по точности предсказания на контрольной выборке из пяти последних наблю-
дений с моделью в виде адаптивного полинома Брауна первого порядка. Пре-
дусмотреть оптимальную настройку параметров сглаживания. По лучшей мо-
дели осуществить прогноз объема продаж автомобилей этой марки для τ = 5 .
Задание 7.3.4. Для автомобилей марок Chrysler и Honda, используя дан-
ные табл. 7.3.1, подобрать наилучшую адаптивную модель (модель Хольта,
модель Хольта с адаптивным механизмом Брауна и адаптивный полином
Брауна первого порядка) и осуществить прогнозный расчет для τ = 2 . Преду-
смотреть оптимальную настройку параметров сглаживания.
Задание 7.3.5. Для автомобилей всех марок, динамика объема продаж ко-
торых представлена в табл. 7.3.1, выбрать наилучшую модель (адаптивный
полином Брауна первого порядка и второго порядка) с оптимально настроен-
ным параметром экспоненциального сглаживания и осуществить прогнозные
расчеты для τ = 5 .
Таблица 7.3.1
Объем продаж новых автомобилей в США
Марки автомобилей
Год
Chrysler Ford Honda Nissan
1988 2208100 3751900 769000 642500
1989 2004000 3579900 783100 664200
1990 1698100 3317100 854900 621600
1991 1507700 2867400 803400 583400
1992 1713000 3192500 768800 585500
1993 2014800 3562400 717400 687700
1994 2204000 3818100 788200 774300
1995 2164300 3801000 794600 770300
1996 2450800 3843400 843900 749800
1997 2303800 3807100 940400 728400
1998 2510000 3860200 1009600 624600

8. СИСТЕМЫ РЕГРЕССИОННЫХ УРАВНЕНИЙ

8.1. Расчетные формулы


8.1.1. Необходимое условие идентификации (порядковое условие) фор-
мулируется следующим образом:
если d + 1 = p , то уравнение идентифицируемо;
если d + 1 < p , то уравнение неидентифицируемо;
если d + 1 > p , то уравнение сверхидентифицируемо,
где d - число предопределенных переменных отсутствующих в уравнении, но
присутствующих в системе;
p - число эндогенных переменных в рассматриваемом уравнении.
8.1.2. Достаточное условие идентификации (ранговое условие): ранг мат-
рицы, составленной из коэффициентов при переменных, отсутствующих в
рассматриваемом уравнении, не менее числа эндогенных переменных систе-
мы без единицы.
8.1.3. Оценки коэффициентов внешне не связанной системы регрессион-
ных уравнений:

( )−1
bˆ = X′Ω −1X X′Ω −1y =

= (X′(Σ ⊗ I )X ) X′(Σ )
−1 −1 −1
m ⊗ Im y ,
где Σ - ковариационная матрица между случайными составляющими регрес-
сионных моделей, входящих в систему. В практических расчетах заменяется
оценкой Σ̂ , получаемой для случайных остатков.
8.1.4. Оценки коэффициентов рекурсивной системы регрессионных урав-
нений получаются с помощью МНК.
8.1.5. Процедура построения структурной модели с помощью косвенного
МНК предполагает выполнение следующих трех этапов:
1. Преобразование структурной модели в приведенную форму.
2. Оценивание коэффициентов каждого уравнения приведенной
формы с помощью обычного МНК.
3. Трансформирование полученных коэффициентов приведенной
формы в параметры структурной модели.
8.1.6. Процедура применения двухшагового метода осуществляется в не-
сколько этапов:
1. Преобразование структурной модели в приведенную форму.
2. Оценивание коэффициентов каждого уравнения приведенной
формы с помощью обычного МНК.
3. Если уравнение точно идентифицируемо, то оценки коэффициен-
тов приведенной формы, полученные на втором этапе, принима-
ются за структурные коэффициенты.
Если же уравнение сверхидентифицируемо, то в структурной
форме его эндогенные переменные заменяются расчетными зна-
чениями, полученными из соответствующих уравнений приве-
денной формы, а затем применяется обычный метод наименьших
квадратов.

8.2. Решение типовых задач


Задание 8.2.1. Провести идентификацию ниже приведенной модели и по
данным табл. 8.2.1 построить ее структурную форму:
 y = a1 + b1 (C + D ) + ε 1 ,

C = a2 + b2 y + b3 y−1 + ε 2 ,
где
y - валовой национальный доход;
y−1 - валовой национальный доход предшествующего года;
C - личное потребление;
D - конечный спрос (помимо личного потребления);
ε 1 и ε 2 - случайные составляющие.
Таблица 8.2.1
Год D y −1 y C Год D y −1 y C
1 -6,8 46,7 3,1 7,4 6 44,7 17,8 37,2 8,6
2 22,4 3,1 22,8 30,4 7 23,1 37,2 35,7 30,0
3 -17,3 22,8 7,8 1,3 8 51,2 35,7 46,6 31,4
4 12,0 7,8 21,4 8,7 9 32,3 46,6 56,0 39,1
5 5,9 21,4 17,8 25,8 Σ 167,5 239,1 248,4 182,7

Решение с помощью табличного процессора Excel.


1. Ввод исходных данных и оформление их в виде удобной для расчетов
табл. 8.2.2.
Таблица 8.2.2
Год D y −1 y C
1 -6,8 46,7 3,1 7,4
2 22,4 3,1 22,8 30,4
3 -17,3 22,8 7,8 1,3
4 12,0 7,8 21,4 8,7
5 5,9 21,4 17,8 25,8
6 44,7 17,8 37,2 8,6
7 23,1 37,2 35,7 30,0
8 51,2 35,7 46,6 31,4
9 32,3 46,6 56,0 39,1
Σ 167,5 239,1 248,4 182,7

2. Определение идентифицируемости уравнений модели. В данной моде-


ли две эндогенные переменные y и C , две экзогенные переменные y −1 и D .
Второе уравнение модели точно идентифировано, так как для него выполня-
ется порядковое условие d + 1 = p ( d = 1 , p = 2 ).
Первое уравнение сверхидентифировано, так как в нем в силу того, что
на параметры при переменных C и D наложены ограничения (они равны
между собой) и, фактически, переменная C не рассматривается как эндоген-
ная, выполняется условие d + 1 > p ( d = 1 , p = 1 ).
Достаточное условие идентификации (ранговое условие) для каждого
уравнение очевидным образом выполняется.
Следовательно, второе уравнение можно построить с помощью МНК, а
первое уравнение – с помощью двухшагового МНК.
3. Расчет коэффициентов уравнений приведенной формы:
y = d10 + d11 D + d12 y−1 ,
C = d 20 + d 21 D + d 22 y −1 .
с помощью пакета «Анализ данных» Excel и оформление результатов в виде
табл. 8.2.3.
Таблица 8.2.3
1-ое урав- 2-ое уравне-
Показатели
нение ние
Константа 8,218 8,636
Коэффициенты рег- d1 0,669 0,338
рессии d2 0,261 0,202
s1 0,137 0,195
Стандартная ошибка
s2 0,195 0,277
Множественный R 0,902 0,615
Число наблюдений 9 9
Число степеней свободы 6 6
F - критерий 13,120 1,827

4. Получение расчетных значений эндогенной переменной Ĉ по второму


уравнению построенной приведенной формы и расчет значений Cˆ + D .
Оформление результатов в виде табл. 8.2.4.
Таблица 8.2.4
Год D Ĉ D + Cˆ y
1 -6,8 15,767 8,967 3,1
2 22,4 16,842 39,242 22,8
3 -17,3 7,386 -9,914 7,8
4 12,0 14,272 26,272 21,4
5 5,9 14,955 20,855 17,8
6 44,7 27,358 72,058 37,2
7 23,1 23,967 47,067 35,7
8 51,2 33,173 84,373 46,6
9 32,3 28,979 61,279 56,0
Σ 167,5 182,7 350,2 248,4

5. Построение первого уравнения структурной формы по данным табл.


8.2.4 с помощью пакета «Анализ данных» и оформление результатов расчета
в виде табл. 8.2.5.
Таблица 8.2.5
Показатели Значения
Константа 7,688
Коэффициент регрессии 0,512
Стандартная ошибка 0,099
Множественный R 0,891
Число наблюдений 9
Число степеней свободы 6
F - критерий 26,879
Таким образом, первое уравнение структурной формы записывается в виде:
y = 7,688 + 0,512(C + D ).
6. Получение второго уравнения структурной формы по коэффициентам
приведенной формы.
Определим D из первого уравнения приведенной формы:
y − 8,218 − 0,261y −1
D=
0,669
и подставим его в первое уравнение приведенной формы. Получим:
0,338 ⋅ 8,218 0,338  0,338 ⋅ 0,261 
C = 8,636 − + y +  0,202 −  y−1 =
0,669 0,669  0,669 
= 4,484 + 0,505 y + 0,070 y −1 .

Таким образом, окончательную структурную модель можно записать в виде


 y = 7,688 + 0,512(C + D ),

C = 4,484 + 0,505 y + 0,070 y−1 .

8.3. Контрольные задания


Задание 8.3.1. Применяя необходимое и достаточное условие идентифи-
кации, определите идентифицируемость каждого уравнения записанных ниже
моделей. Определите, какой метод применим для оценки параметров каждой
модели. Запишите приведенную форму этих моделей.
Задание 8.3.1.1. Упрощенная макроэкономическая модель:
функция потребления: ct = α 0 + α 1 y t + α 2 ct −1 + ε t1 ,
функция инвестиций: it = β 0 + β 1rt + β 2 ( y t − yt −1 ) + et 2 ,
тождество дохода: y t = ct + it + g t ,
где
ct - потребление в момент времени t;
it - инвестиции в момент времени t;
y t - доход в момент времени t;
rt - процентная ставка в момент времени t;
g t - государственный расход в момент времени t.
Задание 8.3.1.2. Модель Клейна:
Ct = α 0 + α 1 Pt + α 2 Pt −1 + α 3 (Wt p + Wt g ) + ε 1t (функция потребления);
I t = β 0 + β 1 Pt + β 2 Pt −1 + β 3 K t −1 + ε 2 t (функция инвестиций);
Wt p = γ 0 + γ 1 X t + γ 2 X t −1 + γ 3 At + ε 3t (функция заработной платы в
частном секторе экономики);
X t = Ct + I t + Gt (тождество дохода);
Pt = X t − Tt − Wt p (тождество дохода частного
сектора экономики);
K t = K t −1 + I t (тождество запаса капитала),
где
C t - потребление в момент времени t;
I t - инвестиции в момент времени t;
Wt p - заработная плата частного сектора экономики в момент времени t;
Wt g - заработная плата государственного сектора экономики в момент
времени t;
At - количество лет, прошедших с 1931 года, на момент t;
X t - доход в момент времени t;
Pt - доход частного сектора экономики в момент времени t;
K t - запас капитала в момент времени t;
Tt - косвенный налог на предпринимателей плюс чистый экспорт в мо-
мент времени t;
Gt - государственные расходы, исключая расходы на заработную плату в
момент времени t.
Задание 8.3.1.3. Модель Кейнса:
Ct = a1 + b11Yt + b12Yt −1 + ε 1t (функция потребления);
I t = a 2 + b21Yt + ε 2 t (функция инвестиций);
Yt = Ct + I t + Gt (тождество дохода),
где
C t - потребление в момент времени t;
I t - валовые инвестиции в момент времени t;
Yt - ВВП в момент времени t;
Gt - государственные расходы в момент времени t.
Задание 8.3.2. Применяя косвенный метод наименьших квадратов, по
данным табл. 8.3.1 построить описывающую потребление модель,
C t = α + βYt + u t ;
Yt = Ct + Z t ,
где
C t - потребление в момент времени t;
Yt - доход в момент времени t;
Z t - другие расходы (налоги, сбережения и т.п.) в момент времени t.
Таблица 8.3.1
Пе
Период Yt Ct Zt ри- Yt Ct Zt
од
1 906 798 108 6 1362 1090 248
2 973 846 131 7 1422 1167 286
3 1085 910 160 8 1525 1206 314
4 1174 966 196 9 1618 1258 337
5 1266 1039 231 10 1698 1316 376

Задание 8.3.3. По данным табл. 8.3.2 построить структурную форму мо-


дели:
Qt = a1 + b1 Pt + c1Yt + u (функция спроса);
Qt = a 2 + b2 Pt + c 2 Z t + u (функция предложения),
где
Qt -потребление свинины (фунтов на душу населения);
Pt - розничная цена свинины (центов за фунт);
Yt - реально располагаемый личный доход (долларов на душу населения);
Z t - «предопределенные элементы в производстве свинины»;
t - время.
Примечание: эндогенными переменными являются Pt и Qt .
Таблица 8.3.2
Спрос и предложение на свинину в США в 1922-1941гг.
Год Pt Qt Yt Zt Год Pt Qt Yt Zt
1922 26,8 65,7 541,0 74,0 1932 15,6 70,7 390,0 74,8
1923 25,3 74,2 616,0 84,7 1933 13,9 69,6 364,0 73,6
1924 25,3 74,0 610,0 80,2 1934 18,8 63,1 411,0 70,2
1925 31,1 66,8 636,0 69,9 1935 27,4 48,4 459,0 46,5
1926 33,3 64,1 651,0 66,8 1936 26,9 55,1 517,0 57,6
1927 31,2 67,7 645,0 71,6 1937 27,7 55,8 551,0 58,7
1928 29,5 70,9 653,0 73,6 1938 24,5 58,3 506,0 58,0
1929 30,3 69,6 682,0 71,2 1939 22,2 64,7 538,0 67,2
1930 29,1 67,0 604,0 69,6 1940 19,3 73,5 576,0 73,7
1931 23,7 68,4 515,0 68,0 1941 24,7 68,4 697,0 66,5
ЛИТЕРАТУРА
1. Бородич С.А. Эконометрика: Учеб. пособие / С.А. Бородич. – Мн.: Но-
вое знание, 2001. – 408 с.
2. Доугерти К. Введение в эконометрику: Пер. с англ. / К. Доугерти. – М.:
ИНФА-М, 1997. – 402 с.
3. Магнус Я.Р. Эконометрика. Начальный курс / Я.Р. Магнус, П.К. Ка-
тышев, А.А. Пересецкий. – М.: Дело, 2000. – 400 с.
4. Прикладная статистика. Основы эконометрика: Учебник для вузов: В 2
т. 2-е изд., испр. - Т.2: Айвазян С.А. Основы эконометрики / С.А. Айвазян. –
М.: ЮНИТИ-ДАНА, 2001. – 432 с.
5. Эконометрика: Учебник / Под ред. И.И. Елисеевой. – М.: Финансы и
статистика, 2002. – 344 с.

СОДЕРЖАНИЕ

Предисловие 3
1. Однофакторные регрессионные модели
и метод их построения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2. Модель множественной регрессии
и методы ее построения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3. Статистические гипотезы
и их проверка . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4. Обобщенный метод наименьших квадратов
и его варианты в случае гетероскедастичности . . . . . . . . . . . 26
5. Сглаживание и экстраполяция
временных рядов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
6. Авторегрессионные процессы
и их модели . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
7. Простейшие адаптивные модели
временных рядов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
8. Системы регрессионных уравнений . . . . . . . . . . . . . . . . . . . . 55
Литература 62
Рецензент: Доктор физико-математических наук, профессор, заведующий ка-
федрой математического моделирования Воронежского государ-
ственного университета В.А. Костин

Воронежский государственный университет


Лицензия ИД №00437 от 10.11.99.
Заказ №241 от 11.09.2003. Тираж 100 экз.
Отпечатано на множительной технике
экономического факультета ВГУ.
394068 г. Воронеж, ул. Хользунова, 40.