Вы находитесь на странице: 1из 39

Средняяожидаемаяпрод Суточнаякалорийность

Страна олжительностьжизни,ле ВВП,миллионов$ питания,ккалнадушунас


т еления
Y X1 X2
Австралия 80.13 525500.00 3001.00
Австрия 78.17 227700.00 3343.00
Аргентина 75.48 403800.00 3336.00
Бразилия 71.13 1376000.00 2938.00
Бельгия 78.29 299700.00 3543.00
Великобритания 78.16 1528000.00 3237.00
Венгрия 72.17 134000.00 3402.00
Германия 78.42 2160000.00 3330.00
Греция 78.89 203300.00 3575.00
Дания 77.1 155300.00 3808.00
Египет 70.41 289800.00 3289.00
Израиль 79.02 117400.00 3272.00
Испания 79.23 850700.00 3295.00
Италия 79.4 1455000.00 3504.00
Канада 79.83 934100.00 3056.00
Латвия 69.31 20990.00 2861.00
Нидерланды 78.74 437800.00 3259.00
Норвегия 79.09 149100.00 3350.00
Польша 73.91 373200.00 3344.00
РеспубликаКорея 75.36 941500.00 3336.00
Россия 67.66 1409300.00 2704.00
Румыния 70.62 149300.00 2943.00
США 77.14 10450000.00 3642.00
Турция 71.8 489700.00 3568.00
Финляндия 77.92 133800.00 2916.00
Франция 79.28 1558000.00 3551.00
Чехия 75.18 157100.00 3177.00
Швейцария 79.99 233400.00 3280.00
Швеция 79.97 230700.00 3160.00
Япония 80.93 3651000.00 2905.00
Коэффициентмладенчес Численностьнаселения,
койсмертности чел.

X3 X4
4.83 38740807.00
4.33 8188207.00
16.16 38740807.00
31.74 182032604.00
4.57 10289088.00
5.28 60094648.00
8.58 10045407.00
4.23 82398326.00
6.12 10665989.00
4.90 5384384.00
35.26 74718797.00
7.37 6116533.00
4.54 40217413.00
6.19 57998353.00
4.88 32207113.00
14.59 2348784.00
4.26 16150511.00
3.87 4546123.00
8.95 38622660.00
7.31 48289037.00
19.51 144526378.00
18.40 22271839.00
6.75 290342554.00
44.20 68109469.00
3.73 5190785.00
4.37 60180529.00
5.37 10249216.00
4.36 7318638.00
3.42 8878085.00
3.30 127214499.00
Подозрением наличия мультиколлинеарности служат:
– большое количество незначимых факторов в модели;
– большие стандартные ошибки параметров регрессии;
– неустойчивость оценок (небольшое изменение исходных данных приводит к их существенному изменению).
Один из подходов для определения наличия или отсутствия мультиколлинеарности заключается в анализе коррел

Чем ближе определитель матрицы межфакторной корреляции к 0, тем сильнее мультиколлинеарность, и наоборо
определитель к 1, тем меньше мультиколлинеарность.
Статистическая значимость мультиколлинеарности факторов определяется проверкой нулевой гипотезы Н0: det=0
Для проверки нулевой гипотезы используется распределение Пирсона с 0,5*m*(m-1) степ.св. для статистики

n-1-(2*m+5)*ln(det)/(6*ln(10)),

где n- число наблюдений, m- число факторов.


Если вычисленная статистика больше критической квантили , то гипотеза Н0 отклоняется и считается, что в модел
мультиколлинеарность факторов.

ВВП,миллионов$
Суточнаякалорийностьпитания,ккалнадушунаселения
ВВП,миллионов$ 1 0.1641256709
Суточнаякалорийностьпи 0.1641256709 1
Коэффициентмладенческ -0.0870197082 -0.110654357
Численностьнаселения,ч 0.8591145465 -0.0526331577

Определитель= 0.0955215265

n= 30
m= 4
Значимость критерия Пирсона= 0.05
Число степеней свободы распр. Пирсона= 6
Критическая квантиль= 12.5915872437
Статистика= 31.2097806164 _>
Гипотеза Н0 отклоняется, присутствует мультиколлинеарность.

Если присутствует мультиколлериарность то необходимо определить, вектор который к этой мультиколле

Выбор факторов, влияющих на мультитколлинеарность.

Коэффициенты детерминации в зависимостях


х1(x2,x3,x4) 0.8941753588 3;1 - означает что здесь мы находим коэф детерминации
x2(x1,x3,x4) 0.5835549381
x3(x1,x2,x4) 0.560561695
x4(x1,x2,x3) 0.9001245758 Близок к 1, рекомендации к удалению.

Простейшим методом устранения мультиколлинеарности является исключение из модели одной или ряда коррел
Поскольку мультиколлинеарность напрямую зависит от выборки, то, возможно, при другой выборке мультиколлин
она не будет настолько серьезной. Поэтому для уменьшения мультиколлинеарности в ряде случаев достаточно уве
Иногда проблема мультиколлинеарности может быть решена путем изменения спецификации модели: либо изме
добавляются факторы, не учтенные в первоначальной модели, но существенно влияющие на зависимую переменн
В ряде случаев минимизировать либо совсем устранить мультиколлинеарность можно с помощью преобразовани
этом наиболее распространены следующие преобразования:
1. Линейная комбинация мультиколлинеарных переменных .
2. Замена мультиколлинеарной переменной ее приращением .
3. Деление одной коллинеарной переменной на другую.
ественному изменению). ВВП,миллионов$
аключается в анализе корреляционной матрицы

иколлинеарность, и наоборот, чем ближе


525500.00
й нулевой гипотезы Н0: det=0
) степ.св. для статистики 227700.00
403800.00
1376000.00
299700.00
ется и считается, что в модели присутствует 1528000.00
134000.00
2160000.00
203300.00
155300.00
289800.00
117400.00
850700.00
1455000.00
934100.00
20990.00
Коэффициентмладенческойсмертности
Численностьнаселения,чел. 437800.00
-0.0870197082 0.8591145465 149100.00
-0.110654357 -0.0526331577 373200.00
1 0.2928424593 941500.00
0.2928424593 1 1409300.00
149300.00
10450000.00
489700.00
133800.00
1558000.00
157100.00
233400.00
230700.00
3651000.00
x1
12.5915872437
т мультиколлинеарность.
0.8941753588
который к этой мультиколлериарности приводит

оэф детерминации
дели одной или ряда коррелированных переменных.
ругой выборке мультиколлинеарности не будет вообще либо
в ряде случаев достаточно увеличить объем выборки.
ификации модели: либо изменяется форма модели, либо
ющие на зависимую переменную.
о с помощью преобразования факторных переменных. При
Суточнаяк
алорийнос Коэффици
тьпитания ентмладен Численностьнас
,ккалнаду ческойсме еления,чел.
шунаселе ртности
ния
3001.00 4.83 38740807.00 525500 4.83 38740807 525500
3343.00 4.33 8188207.00 227700 4.33 8188207 227700
3336.00 16.16 38740807.00 403800 16.16 38740807 403800
2938.00 31.74 182032604.00 1376000 31.74 1.82E+08 1376000
3543.00 4.57 10289088.00 299700 4.57 10289088 299700
3237.00 5.28 60094648.00 1528000 5.28 60094648 1528000
3402.00 8.58 10045407.00 134000 8.58 10045407 134000
3330.00 4.23 82398326.00 2160000 4.23 82398326 2160000
3575.00 6.12 10665989.00 203300 6.12 10665989 203300
3808.00 4.90 5384384.00 155300 4.9 5384384 155300
3289.00 35.26 74718797.00 289800 35.26 74718797 289800
3272.00 7.37 6116533.00 117400 7.37 6116533 117400
3295.00 4.54 40217413.00 850700 4.54 40217413 850700
3504.00 6.19 57998353.00 1455000 6.19 57998353 1455000
3056.00 4.88 32207113.00 934100 4.88 32207113 934100
2861.00 14.59 2348784.00 20990 14.59 2348784 20990
3259.00 4.26 16150511.00 437800 4.26 16150511 437800
3350.00 3.87 4546123.00 149100 3.87 4546123 149100
3344.00 8.95 38622660.00 373200 8.95 38622660 373200
3336.00 7.31 48289037.00 941500 7.31 48289037 941500
2704.00 19.51 144526378.00 1409300 19.51 1.45E+08 1409300
2943.00 18.40 22271839.00 149300 18.4 22271839 149300
3642.00 6.75 290342554.00 10450000 6.75 2.9E+08 10450000
3568.00 44.20 68109469.00 489700 44.2 68109469 489700
2916.00 3.73 5190785.00 133800 3.73 5190785 133800
3551.00 4.37 60180529.00 1558000 4.37 60180529 1558000
3177.00 5.37 10249216.00 157100 5.37 10249216 157100
3280.00 4.36 7318638.00 233400 4.36 7318638 233400
3160.00 3.42 8878085.00 230700 3.42 8878085 230700
2905.00 3.30 127214499.00 3651000 3.3 1.27E+08 3651000
x2 x3 x4 x1 x3 x4 x1
3001 38740807
3343 8188207
3336 38740807
2938 1.82E+08
3543 10289088
3237 60094648
3402 10045407
3330 82398326
3575 10665989
3808 5384384
3289 74718797
3272 6116533
3295 40217413
3504 57998353
3056 32207113
2861 2348784
3259 16150511
3350 4546123
3344 38622660
3336 48289037
2704 1.45E+08
2943 22271839
3642 2.9E+08
3568 68109469
2916 5190785
3551 60180529
3177 10249216
3280 7318638
3160 8878085
2905 1.27E+08
x2 x4
Подозрением наличия мультиколлинеарности служат:
– большое количество незначимых факторов в модели;
– большие стандартные ошибки параметров регрессии;
– неустойчивость оценок (небольшое изменение исходных данных приводит к их существенному изменению).
Один из подходов для определения наличия или отсутствия мультиколлинеарности заключается в анализе коррел

Чем ближе определитель матрицы межфакторной корреляции к 0, тем сильнее мультиколлинеарность, и наоборо
определитель к 1, тем меньше мультиколлинеарность.
Статистическая значимость мультиколлинеарности факторов определяется проверкой нулевой гипотезы Н0: det=0
Для проверки нулевой гипотезы используется распределение Пирсона с 0,5*m*(m-1) степ.св. для статистики

n-1-(2*m+5)*ln(det)/(6*ln(10)),

где n- число наблюдений, m- число факторов.


Если вычисленная статистика больше критической квантили , то гипотеза Н0 отклоняется и считается, что в модел
мультиколлинеарность факторов.

ВВП,миллионов$
Суточнаякалорийностьпитания,ккалнадушунаселения
ВВП,миллионов$ 1 0.1641256709
Суточнаякалорийностьпи 0.1641256709 1
Коэффициентмладенческ -0.0870197082 -0.110654357

Определитель= 0.956406716

n= 30
m= 3
Значимость критерия Пирсона= 0.05
Число степеней свободы распр. Пирсона= 3
Критическая квантиль= 7.8147279033
Статистика= 29.0354885352 _>
Гипотеза Н0 отклоняется, присутствует мультиколлинеарность.

Если присутствует мультиколлериарность то необходимо определить, вектор который к этой мультиколле

Выбор факторов, влияющих на мультитколлинеарность.

Коэффициенты детерминации в зависимостях


х1(x2,x3) 0.0317375035 3;1 - означает что здесь мы находим коэф детерминации
x2(x1,x3) 0.036295701
x3(x1,x2) 0.0171171365

Простейшим методом устранения мультиколлинеарности является исключение из модели одной или ряда коррел
Поскольку мультиколлинеарность напрямую зависит от выборки, то, возможно, при другой выборке мультиколлин
она не будет настолько серьезной. Поэтому для уменьшения мультиколлинеарности в ряде случаев достаточно уве
Иногда проблема мультиколлинеарности может быть решена путем изменения спецификации модели: либо изме
добавляются факторы, не учтенные в первоначальной модели, но существенно влияющие на зависимую переменн
В ряде случаев минимизировать либо совсем устранить мультиколлинеарность можно с помощью преобразовани
этом наиболее распространены следующие преобразования:
1. Линейная комбинация мультиколлинеарных переменных .
2. Замена мультиколлинеарной переменной ее приращением .
3. Деление одной коллинеарной переменной на другую.
ественному изменению). ВВП,миллионов$
аключается в анализе корреляционной матрицы

иколлинеарность, и наоборот, чем ближе

й нулевой гипотезы Н0: det=0 525500.00


) степ.св. для статистики
227700.00
403800.00
1376000.00
ется и считается, что в модели присутствует 299700.00
1528000.00
134000.00
2160000.00
203300.00
155300.00
289800.00
117400.00
850700.00
1455000.00
934100.00
20990.00
Коэффициентмладенческойсмертности 437800.00
-0.0870197082 149100.00
-0.110654357 373200.00
1 941500.00
1409300.00
149300.00
10450000.00
489700.00
133800.00
1558000.00
157100.00
233400.00
230700.00
3651000.00
x1
7.8147279033
т мультиколлинеарность.

который к этой мультиколлериарности приводит

оэф детерминации
дели одной или ряда коррелированных переменных.
ругой выборке мультиколлинеарности не будет вообще либо
в ряде случаев достаточно увеличить объем выборки.
ификации модели: либо изменяется форма модели, либо
ющие на зависимую переменную.
о с помощью преобразования факторных переменных. При
Суточнаяк
алорийнос Коэффици Суточная
тьпитания ентмладен Коэффиц калорийн
,ккалнаду ческойсме иентмлад остьпита
шунаселе ртности енческой ния,ккал
ния ВВП,мил смертнос ВВП,мил надушун
лионов$ ти лионов$ аселения
3001.00 4.83 525500 4.83 525500 3001
3343.00 4.33 227700 4.33 227700 3343
3336.00 16.16 403800 16.16 403800 3336
2938.00 31.74 1376000 31.74 1376000 2938
3543.00 4.57 299700 4.57 299700 3543
3237.00 5.28 1528000 5.28 1528000 3237
3402.00 8.58 134000 8.58 134000 3402
3330.00 4.23 2160000 4.23 2160000 3330
3575.00 6.12 203300 6.12 203300 3575
3808.00 4.90 155300 4.9 155300 3808
3289.00 35.26 289800 35.26 289800 3289
3272.00 7.37 117400 7.37 117400 3272
3295.00 4.54 850700 4.54 850700 3295
3504.00 6.19 1455000 6.19 1455000 3504
3056.00 4.88 934100 4.88 934100 3056
2861.00 14.59 20990 14.59 20990 2861
3259.00 4.26 437800 4.26 437800 3259
3350.00 3.87 149100 3.87 149100 3350
3344.00 8.95 373200 8.95 373200 3344
3336.00 7.31 941500 7.31 941500 3336
2704.00 19.51 1409300 19.51 1409300 2704
2943.00 18.40 149300 18.4 149300 2943
3642.00 6.75 10450000 6.75 10450000 3642
3568.00 44.20 489700 44.2 489700 3568
2916.00 3.73 133800 3.73 133800 2916
3551.00 4.37 1558000 4.37 1558000 3551
3177.00 5.37 157100 5.37 157100 3177
3280.00 4.36 233400 4.36 233400 3280
3160.00 3.42 230700 3.42 230700 3160
2905.00 3.30 3651000 3.3 3651000 2905
x2 x3 x1 x3 x1 x2
В данном случае предполагается, что стандартное отклонение σi = σ(εi) пропорционально значению
xi переменной X в этом наблюдении
Тест Голдфелда-Квандта состоит в следующем:
Все n наблюдений упорядочиваются по величине Xi.
Вся упорядоченная выборка после этого разбивается на три подвыборки размерностей k,(n-
2k),k соответственно.
Оцениваются отдельные регрессии для первой подвыборки (k первых наблюдений) и для третьей подвыборки
(k последних наблюдений)
Если F=Smax/Smin>Fкр (где Fкр = Fα,v1,v2, определяется из таблиц, α– выбранный уровень значимости, v 1 = v2 = n –
m - 1), то гипотеза об отсутствии гетероскедастичности отклоняется.

y=a4*x4+a3*x3+a2x2+a1x1+a0
1. Упорядочим по x1.
2. k=10
3. Находим коэффициенты регрессии для первы\ой и третьей моделей
"Синяя" "Зеленая"
a4 -1.12E-07 -5.0881E-08
a3 -0.427908 -0.132506836
a2 -0.000196 0.000561422
a1 2.655E-05 1.260744E-06
a0 76.80471 78.47459679

4. Вычисляем суммы
29.42103 44.74514749

5.Вычисляем статистику F

F= 1.52085599
6.Квантиль F 5.05032906
Гипотеза об отсутствии гетероскедастичности принимается.
Y X1 X2 X3 X4
значению 69.31 20990.00 2861.00 14.59 2348784.00
79.02 117400.00 3272.00 7.37 6116533.00
77.92 133800.00 2916.00 3.73 5190785.00
n- 72.17 134000.00 3402.00 8.58 10045407.00
третьей подвыборки 79.09 149100.00 3350.00 3.87 4546123.00
70.62 149300.00 2943.00 18.40 22271839.00
ачимости, v 1 = v2 = n –
77.1 155300.00 3808.00 4.90 5384384.00
75.18 157100.00 3177.00 5.37 10249216.00
78.89 203300.00 3575.00 6.12 10665989.00
78.17 227700.00 3343.00 4.33 8188207.00
79.97 230700.00 3160.00 3.42 8878085.00
79.99 233400.00 3280.00 4.36 7318638.00
70.41 289800.00 3289.00 35.26 74718797.00
78.29 299700.00 3543.00 4.57 10289088.00
73.91 373200.00 3344.00 8.95 38622660.00
75.48 403800.00 3336.00 16.16 38740807.00
78.74 437800.00 3259.00 4.26 16150511.00
71.8 489700.00 3568.00 44.20 68109469.00
80.13 525500.00 3001.00 4.83 38740807.00
79.23 850700.00 3295.00 4.54 40217413.00
79.83 934100.00 3056.00 4.88 32207113.00
75.36 941500.00 3336.00 7.31 48289037.00
71.13 1376000.00 2938.00 31.74 182032604.00
67.66 1409300.00 2704.00 19.51 144526378.00
79.4 1455000.00 3504.00 6.19 57998353.00
78.16 1528000.00 3237.00 5.28 60094648.00
79.28 1558000.00 3551.00 4.37 60180529.00
78.42 2160000.00 3330.00 4.23 82398326.00
80.93 3651000.00 2905.00 3.30 127214499.00
77.14 10450000.00 3642.00 6.75 290342554.00
Y(x) (Y-Y(x))^2
70.29401 0.96828
75.43867 12.82589
77.60551 0.098903
74.89425 7.421528
77.93925 1.324227
69.81322 0.650898
77.47908 0.143702
76.90225 2.966133
77.68296 1.456955
79.4208 1.56451

79.0826 0.558604
78.10887 7.556307
68.39108 7.501706
71.8306 17.39389
78.50497 0.801073
78.46103 0.090617
78.79135 0.238781
78.31433 0.011166
77.79843 9.8067
78.02674 0.786306
В данном случае предполагается, что стандартное отклонение σi = σ(εi) пропорционально значению
xi переменной X в этом наблюдении
Тест Голдфелда-Квандта состоит в следующем:
Все n наблюдений упорядочиваются по величине Xi.
Вся упорядоченная выборка после этого разбивается на три подвыборки размерностей k,(n-2k),k соответственно.
Оцениваются отдельные регрессии для первой подвыборки (k первых наблюдений) и для третьей подвыборки
(k последних наблюдений)
Если F=Smax/Smin>Fкр (где Fкр = Fα,v1,v2, определяется из таблиц, α– выбранный уровень значимости, v 1 = v2 = n – m -
1), то гипотеза об отсутствии гетероскедастичности отклоняется.

y=a4*x4+a3*x3+a2x2+a1x1+a0
1. Упорядочим по x2.
2. k=10
3. Находим коэффициенты регрессии для первы\ой и третьей моделей
"Синяя" "Зеленая"
a4 3.105323E-08 0.000000037
a3 -0.456685898 -0.211825999
a2 0.0148115415 0.005782838
a1 3.665808E-07 -0.000001027
a0 34.252315935 57.90042174

4. Вычисляем суммы
37.892964115 39.04121364

5.Вычисляем статистику F

F= 1.03030245
6.Квантиль F 5.05032906
Гипотеза об отсутствии гетероскедастичности принимается.
Y X1 X2 X3 X4
льно значению 67.66 1409300.00 2704.00 19.51 144526378.00
69.31 20990.00 2861.00 14.59 2348784.00
80.93 3651000.00 2905.00 3.30 127214499.00
тей k,(n-2k),k соответственно. 77.92 133800.00 2916.00 3.73 5190785.00
и для третьей подвыборки
71.13 1376000.00 2938.00 31.74 182032604.00
нь значимости, v 1 = v2 = n – m - 70.62 149300.00 2943.00 18.40 22271839.00
80.13 525500.00 3001.00 4.83 38740807.00
79.83 934100.00 3056.00 4.88 32207113.00
79.97 230700.00 3160.00 3.42 8878085.00
75.18 157100.00 3177.00 5.37 10249216.00
78.16 1528000.00 3237.00 5.28 60094648.00
78.74 437800.00 3259.00 4.26 16150511.00
79.02 117400.00 3272.00 7.37 6116533.00
79.99 233400.00 3280.00 4.36 7318638.00
70.41 289800.00 3289.00 35.26 74718797.00
79.23 850700.00 3295.00 4.54 40217413.00
78.42 2160000.00 3330.00 4.23 82398326.00
75.48 403800.00 3336.00 16.16 38740807.00
75.36 941500.00 3336.00 7.31 48289037.00
78.17 227700.00 3343.00 4.33 8188207.00
73.91 373200.00 3344.00 8.95 38622660.00
79.09 149100.00 3350.00 3.87 4546123.00
72.17 134000.00 3402.00 8.58 10045407.00
79.4 1455000.00 3504.00 6.19 57998353.00
78.29 299700.00 3543.00 4.57 10289088.00
79.28 1558000.00 3551.00 4.37 60180529.00
71.8 489700.00 3568.00 44.20 68109469.00
78.89 203300.00 3575.00 6.12 10665989.00
77.14 10450000.00 3642.00 6.75 290342554.00
77.1 155300.00 3808.00 4.90 5384384.00
Y(x) (Y-Y(x))^2
70.39742 7.493444
70.04572 0.541285
81.06159 0.017315
75.94957 3.882587
69.43053 2.888198
70.18601 0.188351
77.89162 5.010324
78.63032 1.439238
79.85518 0.013183
79.23204 16.41904

76.38624 6.131779
76.46802 6.874796
75.98973 14.59037
77.50105 3.605995
77.49336 0.634628
78.13322 1.315102
71.18464 0.378662
77.46302 2.036283
77.52772 0.150328
78.92298 3.323266
В данном случае предполагается, что стандартное отклонение σi = σ(εi) пропорционально значению
xi переменной X в этом наблюдении
Тест Голдфелда-Квандта состоит в следующем:
Все n наблюдений упорядочиваются по величине Xi.
Вся упорядоченная выборка после этого разбивается на три подвыборки размерностей k,(n-2k),k соответственно.
Оцениваются отдельные регрессии для первой подвыборки (k первых наблюдений) и для третьей подвыборки
(k последних наблюдений)
Если F=Smax/Smin>Fкр (где Fкр = Fα,v1,v2, определяется из таблиц, α– выбранный уровень значимости, v 1 = v2 = n – m -
1), то гипотеза об отсутствии гетероскедастичности отклоняется.

y=a4*x4+a3*x3+a2x2+a1x1+a0
1. Упорядочим по x3.
2. k=10
3. Находим коэффициенты регрессии для первы\ой и третьей моделей
"Синяя" "Зеленая"
a4 -4.131452E-08 2.226931E-08
a3 -0.858769336 -0.168632867
a2 0.0012004343 0.008453245
a1 1.817881E-06 -1.45832E-06
a0 78.493673223 48.22976417

4. Вычисляем суммы
4.7820938366 40.16235916

5.Вычисляем статистику F

F= 8.39848831
6.Квантиль F 5.05032906
Гипотеза об отсутствии гетероскедастичности принимается.
Y X1 X2 X3 X4
льно значению 80.93 3651000.00 2905.00 3.30 127214499.00
79.97 230700.00 3160.00 3.42 8878085.00
77.92 133800.00 2916.00 3.73 5190785.00
тей k,(n-2k),k соответственно. 79.09 149100.00 3350.00 3.87 4546123.00
и для третьей подвыборки
78.42 2160000.00 3330.00 4.23 82398326.00
нь значимости, v 1 = v2 = n – m - 78.74 437800.00 3259.00 4.26 16150511.00
78.17 227700.00 3343.00 4.33 8188207.00
79.99 233400.00 3280.00 4.36 7318638.00
79.28 1558000.00 3551.00 4.37 60180529.00
79.23 850700.00 3295.00 4.54 40217413.00
78.29 299700.00 3543.00 4.57 10289088.00
80.13 525500.00 3001.00 4.83 38740807.00
79.83 934100.00 3056.00 4.88 32207113.00
77.1 155300.00 3808.00 4.90 5384384.00
78.16 1528000.00 3237.00 5.28 60094648.00
75.18 157100.00 3177.00 5.37 10249216.00
78.89 203300.00 3575.00 6.12 10665989.00
79.4 1455000.00 3504.00 6.19 57998353.00
77.14 10450000.00 3642.00 6.75 290342554.00
75.36 941500.00 3336.00 7.31 48289037.00
79.02 117400.00 3272.00 7.37 6116533.00
72.17 134000.00 3402.00 8.58 10045407.00
73.91 373200.00 3344.00 8.95 38622660.00
69.31 20990.00 2861.00 14.59 2348784.00
75.48 403800.00 3336.00 16.16 38740807.00
70.62 149300.00 2943.00 18.40 22271839.00
67.66 1409300.00 2704.00 19.51 144526378.00
71.13 1376000.00 2938.00 31.74 182032604.00
70.41 289800.00 3289.00 35.26 74718797.00
71.8 489700.00 3568.00 44.20 68109469.00
Y(x) (Y-Y(x))^2
80.52827 0.161384
79.40265 0.321891
78.81971 0.809474
79.27492 0.034194
79.3809 0.923331
78.87615 0.018537
78.86389 0.481488
78.80879 1.395255
79.34952 0.004833
78.4352 0.631707

74.61096 19.43963
75.56912 11.55403
75.304 1.943248
69.97584 0.443342
73.97854 2.254377
70.28307 0.113522
68.9606 1.691561
69.76008 1.876682
71.32781 0.842367
71.73998 0.003603
В данном случае предполагается, что стандартное отклонение σi = σ(εi) пропорционально значению
xi переменной X в этом наблюдении
Тест Голдфелда-Квандта состоит в следующем:
Все n наблюдений упорядочиваются по величине Xi.
Вся упорядоченная выборка после этого разбивается на три подвыборки размерностей k,(n-2k),k соответственно.
Оцениваются отдельные регрессии для первой подвыборки (k первых наблюдений) и для третьей подвыборки
(k последних наблюдений)
Если F=Smax/Smin>Fкр (где Fкр = Fα,v1,v2, определяется из таблиц, α– выбранный уровень значимости, v 1 = v2 = n – m -
1), то гипотеза об отсутствии гетероскедастичности отклоняется.

y=a4*x4+a3*x3+a2x2+a1x1+a0
1. Упорядочим по x4.
2. k=10
3. Находим коэффициенты регрессии для первы\ой и третьей моделей
"Синяя" "Зеленая"
a4 -4.94061E-07 -3.74154E-08
a3 -0.686157255 -0.184676672
a2 -0.00055365 0.002158313
a1 2.452137E-05 8.252416E-07
a0 82.29649015 73.63538231

4. Вычисляем суммы
17.91472629 37.82181329

5.Вычисляем статистику F

F= 2.11121357
6.Квантиль F 5.05032906
Гипотеза об отсутствии гетероскедастичности принимается.
Y X1 X2 X3 X4
ально значению 69.31 20990.00 2861.00 14.59 2348784.00
79.09 149100.00 3350.00 3.87 4546123.00
77.92 133800.00 2916.00 3.73 5190785.00
стей k,(n-2k),k соответственно. 77.1 155300.00 3808.00 4.90 5384384.00
) и для третьей подвыборки
79.02 117400.00 3272.00 7.37 6116533.00
ень значимости, v 1 = v2 = n – m - 79.99 233400.00 3280.00 4.36 7318638.00
78.17 227700.00 3343.00 4.33 8188207.00
79.97 230700.00 3160.00 3.42 8878085.00
72.17 134000.00 3402.00 8.58 10045407.00
75.18 157100.00 3177.00 5.37 10249216.00
78.29 299700.00 3543.00 4.57 10289088.00
78.89 203300.00 3575.00 6.12 10665989.00
78.74 437800.00 3259.00 4.26 16150511.00
70.62 149300.00 2943.00 18.40 22271839.00
79.83 934100.00 3056.00 4.88 32207113.00
73.91 373200.00 3344.00 8.95 38622660.00
75.48 403800.00 3336.00 16.16 38740807.00
80.13 525500.00 3001.00 4.83 38740807.00
79.23 850700.00 3295.00 4.54 40217413.00
75.36 941500.00 3336.00 7.31 48289037.00
79.4 1455000.00 3504.00 6.19 57998353.00
78.16 1528000.00 3237.00 5.28 60094648.00
79.28 1558000.00 3551.00 4.37 60180529.00
71.8 489700.00 3568.00 44.20 68109469.00
70.41 289800.00 3289.00 35.26 74718797.00
78.42 2160000.00 3330.00 4.23 82398326.00
80.93 3651000.00 2905.00 3.30 127214499.00
67.66 1409300.00 2704.00 19.51 144526378.00
71.13 1376000.00 2938.00 31.74 182032604.00
77.14 10450000.00 3642.00 6.75 290342554.00
Y(x) (Y-Y(x))^2
70.05572 0.556103
79.19641 0.011322
78.83907 0.844696
77.97397 0.763829
75.28483 13.95146
79.5963 0.154996
79.01262 0.710004
79.47106 0.248941
72.84856 0.460445
75.64145 0.212933

79.08566 0.098812
78.65925 0.249251
79.52656 0.060792
71.02931 0.593963
71.66589 1.577269
78.74094 0.103
77.54902 11.43101
71.62392 15.71264
68.43958 7.238386
78.00988 0.756688
1. Определим остатки для вычисления статистики DW

ВЫВОД ИТОГОВ

Регрессионная статистика
Множеств 0.775226585
R-квадрат 0.600976258
Нормирова0.537132459
Стандартн 2.565943552
Наблюден 30

Дисперсионный анализ
df SS MS F Значимость F
Регрессия 4 247.9092789 61.9773197 9.41322836 8.76E-05
Остаток 25 164.6016577 6.58406631
Итого 29 412.5109367

Коэффициенты
Стандартная ошибка
t-статистикаP-ЗначениеНижние 95% Верхние 95%
Нижние 95,0%
Верхние 95,0%
Y-пересеч 68.03371515 6.840473423 9.9457612 3.57799E-10 53.9455 82.12193 53.9455 82.12193
Переменна-4.39641E-09 7.526143E-07 -0.00584152 0.99538553 -1.55E-06 1.546E-06 -1.55E-06 1.546E-06
Переменна0.003366871 0.002090568 1.61050563 0.11984314 -0.000939 0.007672 -0.000939 0.007672
Переменна-0.264148886 0.069898452 -3.77903772 0.00087191 -0.408107 -0.12019 -0.408107 -0.12019
Переменна 1.16446E-09 2.374882E-08 0.04903234 0.96128316 -4.77E-08 5.008E-08 -4.77E-08 5.008E-08

ВЫВОД ОСТАТКА
ei (ei-ei-1)^2 ei^2
Наблюдение
Предсказанное Y Остатки
1 76.90465728 3.22534272 ----- ------
2 78.15393351 0.016066487 10.2994539 0.00025813
3 75.04028718 0.439712818 0.17947621 0.19334736
4 69.74741637 1.382583628 0.88900537 1.91153749
5 78.7660418 -0.476041802 3.45448849 0.2266158
6 77.6008301 0.559169898 1.07166327 0.31267098
7 77.23252071 -5.062520708 31.6034053 25.6291159
8 78.21449864 0.205501361 27.7520565 0.04223081
9 78.4652136 0.424786403 0.04808593 0.18044349
10 79.56601695 -2.466016954 8.35674405 6.08123962
11 69.87919667 0.530803332 8.98093183 0.28175218
12 77.10994561 1.910054388 1.90233348 3.64830777
13 77.97141022 1.258589776 0.42440614 1.58404823
14 78.25728902 1.142710981 0.0134279 1.30578839
15 77.06722313 2.762776869 2.62461348 7.63293603
16 73.8150432 -4.505043199 52.8212085 20.2954142
17 77.89795489 0.842045115 28.5913534 0.70903998
18 78.29511459 0.794885408 0.00222404 0.63184281
19 76.97173257 -3.061732569 14.8735022 9.37420632
20 77.38675941 -2.026759407 1.07116945 4.10775369
21 72.14628855 -4.486288551 6.04928361 20.126785
22 73.10735486 -2.487354859 3.99573591 6.18693419
23 78.80500372 -1.665003716 0.6762614 2.77223737
24 68.44848745 3.351512547 25.1654354 11.2326364
25 76.87169143 1.048308565 5.30474858 1.09895085
26 78.89837115 0.381628852 0.44446184 0.14564058
27 77.32302846 -2.143028461 6.37389454 4.59257098
28 77.93285854 2.057141455 17.6414273 4.23183097
29 77.77896178 2.19103822 0.01792834 4.80064848
30 77.0748686 3.855131402 2.76920612 14.8620381
SUM= 263.397933 154.198822

DW= 1.708170848

2. Зададим альфа -уровень значимости, найдем по таблицам dl и du. У нас n=30 наблюдений, k=4 фактора.
альфа= 0.05
dl= 1.14
du= 1.74

Интервалы

0_____________dl__________du_________2__________4-du______4-dl________4
0 1.14 1.74 2 2.26 2.86 4
1.708170848
ОБЛАСТЬ НЕОПРЕДЕЛЕННОСТИ
Y X1
80.13 525500.00
78.17 227700.00
75.48 403800.00
71.13 1376000.00
78.29 299700.00
78.16 1528000.00
72.17 134000.00
78.42 2160000.00
78.89 203300.00
77.1 155300.00
70.41 289800.00
79.02 117400.00
79.23 850700.00
79.4 1455000.00
79.83 934100.00
69.31 20990.00
78.74 437800.00
79.09 149100.00
73.91 373200.00
75.36 941500.00
ерхние 95,0% 67.66 1409300.00
70.62 149300.00
77.14 10450000.00
71.8 489700.00
77.92 133800.00
79.28 1558000.00
75.18 157100.00
79.99 233400.00
79.97 230700.00
80.93 3651000.00
, k=4 фактора. http://helpstat.ru/statisticheskie-tablitsyi/statistika-darbina-uotsona-dl-i-du/
X2 X3 X4
3001.00 4.83 38740807.00
3343.00 4.33 8188207.00
3336.00 16.16 38740807.00
2938.00 31.74 182032604.00
3543.00 4.57 10289088.00
3237.00 5.28 60094648.00
3402.00 8.58 10045407.00
3330.00 4.23 82398326.00
3575.00 6.12 10665989.00
3808.00 4.90 5384384.00
3289.00 35.26 74718797.00
3272.00 7.37 6116533.00
3295.00 4.54 40217413.00
3504.00 6.19 57998353.00
3056.00 4.88 32207113.00
2861.00 14.59 2348784.00
3259.00 4.26 16150511.00
3350.00 3.87 4546123.00
3344.00 8.95 38622660.00
3336.00 7.31 48289037.00
2704.00 19.51 144526378.00
2943.00 18.40 22271839.00
3642.00 6.75 290342554.00
3568.00 44.20 68109469.00
2916.00 3.73 5190785.00
3551.00 4.37 60180529.00
3177.00 5.37 10249216.00
3280.00 4.36 7318638.00
3160.00 3.42 8878085.00
2905.00 3.30 127214499.00
1. Определим остатки для вычисления статистики DW

ВЫВОД ИТОГОВ

Регрессионная статистика
Множеств 0.775226585
R-квадрат 0.600976258
Нормирова0.537132459
Стандартн 2.565943552
Наблюден 30

Дисперсионный анализ
df SS MS F Значимость F
Регрессия 4 247.9092789 61.9773197 9.41322836 8.76E-05
Остаток 25 164.6016577 6.58406631
Итого 29 412.5109367

Коэффициенты
Стандартная ошибка
t-статистикаP-ЗначениеНижние 95% Верхние 95%
Нижние 95,0%
Верхние 95,0%
Y-пересеч 68.03371515 6.840473423 9.9457612 3.57799E-10 53.9455 82.12193 53.9455 82.12193
Переменна-4.39641E-09 7.526143E-07 -0.00584152 0.99538553 -1.55E-06 1.546E-06 -1.55E-06 1.546E-06
Переменна0.003366871 0.002090568 1.61050563 0.11984314 -0.000939 0.007672 -0.000939 0.007672
Переменна-0.264148886 0.069898452 -3.77903772 0.00087191 -0.408107 -0.12019 -0.408107 -0.12019
Переменна 1.16446E-09 2.374882E-08 0.04903234 0.96128316 -4.77E-08 5.008E-08 -4.77E-08 5.008E-08

ВЫВОД ОСТАТКА
ei (ei-ei-1)^2 ei^2
Наблюдение
Предсказанное Y Остатки
1 76.90465728 3.22534272 ----- ------
2 78.15393351 0.016066487 10.2994539 0.00025813
3 75.04028718 0.439712818 0.17947621 0.19334736
4 69.74741637 1.382583628 0.88900537 1.91153749
5 78.7660418 -0.476041802 3.45448849 0.2266158
6 77.6008301 0.559169898 1.07166327 0.31267098
7 77.23252071 -5.062520708 31.6034053 25.6291159
8 78.21449864 0.205501361 27.7520565 0.04223081
9 78.4652136 0.424786403 0.04808593 0.18044349
10 79.56601695 -2.466016954 8.35674405 6.08123962
11 69.87919667 0.530803332 8.98093183 0.28175218
12 77.10994561 1.910054388 1.90233348 3.64830777
13 77.97141022 1.258589776 0.42440614 1.58404823
14 78.25728902 1.142710981 0.0134279 1.30578839
15 77.06722313 2.762776869 2.62461348 7.63293603
16 73.8150432 -4.505043199 52.8212085 20.2954142
17 77.89795489 0.842045115 28.5913534 0.70903998
18 78.29511459 0.794885408 0.00222404 0.63184281
19 76.97173257 -3.061732569 14.8735022 9.37420632
20 77.38675941 -2.026759407 1.07116945 4.10775369
21 72.14628855 -4.486288551 6.04928361 20.126785
22 73.10735486 -2.487354859 3.99573591 6.18693419
23 78.80500372 -1.665003716 0.6762614 2.77223737
24 68.44848745 3.351512547 25.1654354 11.2326364
25 76.87169143 1.048308565 5.30474858 1.09895085
26 78.89837115 0.381628852 0.44446184 0.14564058
27 77.32302846 -2.143028461 6.37389454 4.59257098
28 77.93285854 2.057141455 17.6414273 4.23183097
29 77.77896178 2.19103822 0.01792834 4.80064848
30 77.0748686 3.855131402 2.76920612 14.8620381
SUM= 263.397933 154.198822

DW= 1.708170848

2. Зададим альфа -уровень значимости, найдем по таблицам dl и du. У нас n=30 наблюдений, k=4 фактора.
альфа= 0.05
dl= 1.14
du= 1.74

Интервалы

0_____________dl__________du_________2__________4-du______4-dl________4
0 1.14 1.74 2 2.26 2.86 4
1.708170848
ОБЛАСТЬ НЕОПРЕДЕЛЕННОСТИ
Y X3
80.13 4.83
78.17 4.33
75.48 16.16
71.13 31.74
78.29 4.57
78.16 5.28
72.17 8.58
78.42 4.23
78.89 6.12
77.1 4.90
70.41 35.26
79.02 7.37
79.23 4.54
79.4 6.19
79.83 4.88
69.31 14.59
78.74 4.26
79.09 3.87
73.91 8.95
75.36 7.31
ерхние 95,0% 67.66 19.51
70.62 18.40
77.14 6.75
71.8 44.20
77.92 3.73
79.28 4.37
75.18 5.37
79.99 4.36
79.97 3.42
80.93 3.30
, k=4 фактора. http://helpstat.ru/statisticheskie-tablitsyi/statistika-darbina-uotsona-dl-i-du/
X4
38740807.00
8188207.00
38740807.00
182032604.00
10289088.00
60094648.00
10045407.00
82398326.00
10665989.00
5384384.00
74718797.00
6116533.00
40217413.00
57998353.00
32207113.00
2348784.00
16150511.00
4546123.00
38622660.00
48289037.00
144526378.00
22271839.00
290342554.00
68109469.00
5190785.00
60180529.00
10249216.00
7318638.00
8878085.00
127214499.00