Lecture 8.6

Лекция 8.
Что делать в случае

гетероскедастичности?
Что делать в случае гетероскедастичности?
Y  1   2 X  u
Предположим, что нам известны дисперсии возмущений i2 для

всех наблюдений i = 1,…,n.
1
Y  1   2 X  u
дисперсия u i   i2
Yi 1 X i ui
 1   2 
i i i i
Разделим обе части равенства на i для каждого наблюдения.
2
Y  1   2 X  u
Yi 1 X i ui
 1   2 
i i i i
 ui  1
дисперсия новых возмущений    дисперсии ui
 i   i
2
 i2
 2 1
i
Тогда дисперсии возмущений в новой регрессии станут

одинаковыми и равными 1.
3
Преобразование переменных
Y  1   2 X  u
Yi 1 X i ui
 1   2 
i i i i
Yi 1 Xi ui
Y '   1 H   2 X ' u' Y '  , H  , X ' , u' 
i i i i
Все сводится к оценке новой регрессии с преобразованными

факторами, оцениваем регрессию Y' на X' и H, которые
определенны выше. Отметим, что в новой регрессии нет
константы. 1 становится коэффициентом наклона перед
переменной 1/i.
4
Взвешенный метод наименьших квадратов
Y  1   2 X  u
Yi 1 X i ui
 1   2 
i i i i
Y '   1 H   2 X ' u' Yi 1 Xi ui

Y ' , H  , X ' , u' 
i i i i
Указанный метод называется взвешенным методом

наименьших квадратов. Наибольший вес 1/i получают
наблюдения с наименьшей дисперсией возмущений i.
5
Y  1   2 X  u
variance of ui   i2
 i  Z i
Однако на практике стандартные отклонения возмущений

обычно неизвестны. Но, оказывается, достаточно знать эти
стандартные отклонения с точностью до постоянного
множителя. Предположим, что стандартные отклонения
возмущений пропорциональны некоторой известной
переменной Zi.
6
Y  1   2 X  u
 i  Z i
Yi 1 X i ui
 1   2 
Zi Zi Zi Zi
В этом случае мы достигаем гомоскедастичности остатков,

разделив все переменные на Zi.
7
Y  1   2 X  u
 i  Z i
Yi 1 X i ui
 1   2 
Zi Zi Zi Zi
 ui  1 2  i2
   2 i  2 2  
2
дисперсия
 Zi  Zi i /
Yi 1 X u
Y '   1 H   2 X ' u' Y ' , H  , X '  i , u'  i
Zi Zi Zi Zi
Действительно, как показано выше, дисперсии новых остатков
одинаковы и равны 2. Нам нет необходимости знать 2. Достаточно
того, что это константа (т.е. одинаковые дисперсии для всех
возмущений, гомоскедастичность) .
8
Y  1   2 X  u
 i  Z i
Yi 1 X i ui
 1   2 
Zi Zi Zi Zi
Yi 1 X u
Y '   1 H   2 X ' u' Y ' , H  , X '  i , u'  i
Zi Zi Zi Zi
Если после выполнении теста Голдфелда – Квандта гипотеза о

гомоскедастичности отвергается, то в качестве Z может быть
использована переменная Xj.
9
Y  1   2 X  u
Yi 1 X i ui
 1   2 
i i i i
Y '   1 H   2 X ' u' Yi 1 Xi ui

Y ' , H  , X ' , u' 
i i i i
На практике вместо i часто используют их оценки. Например,

если после проведения теста Глейзера гипотеза о
гомоскедастичности была отвергнута, поскольку в регрессии
ei    X i  u i , i  1,..., n
^ ^
коэффициент β значим, то σi = |ei|, i = 1,..,n
10
Пример
9000
Промышленное производство на
8000
7000
душу населения
6000
5000
4000
3000
2000
1000
0
0 5000 10000 15000 20000 25000 30000 35000 40000
ВВП на душу населения
Пример зависимости производства на душу населения от ВВП

на душу населения (диаграмма рассеивания).
11
Пример
9000
8000
7000 RSS1 = 5,378,000

6000
5000
4000
3000
2000
1000
RSS2 = 17,362,000
0
0 5000 10000 15000 20000 25000 30000 35000 40000
Упорядочив страны по возрастанию ВВП на душу населения,

разбивает их на три группы, средние наблюдения выкидывает,
а для первой и последней группы наблюдений оцениваем
регрессии и находим RSS.
12
Пример
9000
8000
7000 RSS1 = 5,378,000

6000
RSS 2 / n2  k 17,362,000 / 9
F ( n2  k , n1  k ) 
5000   3.23
RSS1 / n1  k 5,378,000 / 9
4000
F (9,9)crit , 5%  3.18
3000
2000
1000
RSS2 = 17,362,000
0
0 5000 10000 15000 20000 25000 30000 35000 40000
Проводим тест Голфелда - Квандта. Поскольку тестовая

статистика больше критической при 5% уровне значимости,
нулевая гипотеза о гомоскедастичности отвергается.
13
Пример
Y  1   2 X  u
 i  X i
Альтернативная гипотеза в тесте Голфелда – Квандта

предполагает пропорциональность стандартного отклонения
возмущений объясняющей переменной (в данном примере X =
GDP) .
14
Пример
Y  1   2 X  u
дисперсия   i2
 i  X i
Yi 1 ui
 1  2 
Xi Xi Xi
Напомним, что для получения эффективных оценок требуется

преобразовать переменные, разделив их на ту переменную,
которой пропорционально стандартное отклонение
возмущений.
15
Пример
0.40
Manufacturing/GDP
0.30
0.20
0.10
0.00
0 10 20 30 40 50 60 70 80
1/GDP x 1,000,000
Диаграмма рассеяния в преобразованных переменных.
16
Пример
0.40
RSS1 = 0.065
Manufacturing/GDP
0.30
0.20
0.10
RSS2 = 0.070
0.00
0 10 20 30 40 50 60 70 80
1/GDP x 1,000,000
Снова проводим тест Голдфелда - Квандта.
17
Пример
0.40
RSS1 = 0.065
Manufacturing/GDP
0.30 RSS 2 / n2  k 0.070 / 9

F ( n2  k , n1  k )    1.08
RSS1 / n1  k 0.065 / 9
0.20
F (9,9)crit , 5%  3.18
0.10
RSS2 = 0.070
0.00
0 10 20 30 40 50 60 70 80
1/GDP x 1,000,000
На этот раз гипотеза о гомоскедастичности не отвергается. С

помощью преобразования гетероскедастичность была устранена.
18
Второй способ борьбы с гетероскедастичностью
300000
250000
200000
Выпуск
150000
100000
50000
0
0 200000 400000 600000 800000 1000000 1200000 1400000
ВВП
Существует другой способ борьбы с гетероскедастичностью,

связанный с выбором другой функциональной формы модели,
а именно, линейной в логарифмах.
19
Логарифмическое преобразование данных
13
12
log Manufacturing
11
10
7
9 10 11 12 13 14 15
log GDP
Диаграмма рассеяния для переменных в логарифмическом

масштабе.
20
Линейная в логарифмах модель
13
12 RSS1 = 2.140
log Manufacturing
11
10
8
RSS2 = 1.037
7
9 10 11 12 13 14 15
log GDP
Проведем снова тест Голдфелда – Квандта для линейной в

логарифмах модели..
21
HETEROSCEDASTICITY: WEIGHTED AND LOGARITHMIC REGRESSIONS
13
12 RSS1 = 2.140
log Manufacturing
11
RSS 2 / n 2  k 1.037 / 9
F (n2  k , n1  k )    0.48
10
RSS1 / n1  k 2.14 / 9
F (9,9)crit , 5%  3.18
9
8
RSS2 = 1.037
7
9 10 11 12 13 14 15
log GDP
Нулевая гипотеза о гомоскедастичности не отвергается.
22
Логарифмический масштаб
13
South Korea
12
log Manufacturing
11
Mexico
Singapore
10
9
Greece
7
9 10 11 12 13 14 15
log GDP
В логарифмическом масштабе разнице между Южной Кореей и Мексикой не так

сильно отличается от разницы для Сингапура и Греции, как при линейном
масштабе.
23
Линейный масштаб
300000
250000
200000
Manufacturing
South Korea
150000
100000
Singapore
50000
Mexico
Greece
0
0 200000 400000 600000 800000 1000000 1200000 1400000
GDP
24
Различные спецификации
MANˆ U  604  0.194GDP R 2  0.89

(5700) (0.013)
MANˆ U 1 R 2  0.02
 0.189  533
GDP GDP
(0.019)(841)
log MAˆ NU  1.694  0.999 log GDP R 2  0.90

(0.785) (0.066)
По одним и тем же данным оценено несколько моделей.
25

Lecture 8.6

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Lecture 8.6

Загружено:

Авторское право:

Доступные форматы

Лекция 8.

Что делать в случае

Предположим, что нам известны дисперсии возмущений i2 для

Разделим обе части равенства на i для каждого наблюдения.

Тогда дисперсии возмущений в новой регрессии станут

Все сводится к оценке новой регрессии с преобразованными

Y '   1 H   2 X ' u' Yi 1 Xi ui

Указанный метод называется взвешенным методом

Однако на практике стандартные отклонения возмущений

В этом случае мы достигаем гомоскедастичности остатков,

Если после выполнении теста Голдфелда – Квандта гипотеза о

Y '   1 H   2 X ' u' Yi 1 Xi ui

На практике вместо i часто используют их оценки. Например,

Пример зависимости производства на душу населения от ВВП

7000 RSS1 = 5,378,000

Упорядочив страны по возрастанию ВВП на душу населения,

7000 RSS1 = 5,378,000

ВВП на душу населения

Проводим тест Голфелда - Квандта. Поскольку тестовая

Альтернативная гипотеза в тесте Голфелда – Квандта

Напомним, что для получения эффективных оценок требуется

Диаграмма рассеяния в преобразованных переменных.

Снова проводим тест Голдфелда - Квандта.

0.30 RSS 2 / n2  k 0.070 / 9

На этот раз гипотеза о гомоскедастичности не отвергается. С

Существует другой способ борьбы с гетероскедастичностью,

Диаграмма рассеяния для переменных в логарифмическом

Проведем снова тест Голдфелда – Квандта для линейной в

Нулевая гипотеза о гомоскедастичности не отвергается.

В логарифмическом масштабе разнице между Южной Кореей и Мексикой не так

MANˆ U  604  0.194GDP R 2  0.89

log MAˆ NU  1.694  0.999 log GDP R 2  0.90

По одним и тем же данным оценено несколько моделей.

Вам также может понравиться