Вы находитесь на странице: 1из 35

Гетероскедастичность

Эконометрика. Лекция 5

Эконометрика. Лекция 5 Гетероскедастичность 1 / 35


Гомоскедастичность

Для проверки гипотез мы предполагали условную


гомоскедастичность ошибок:
Var (εi |X ) = E (ε2i |X ) = σ 2
Что произойдет если эта предпосылка будет нарушена?

Эконометрика. Лекция 5 Гетероскедастичность 2 / 35


Четыре разных понятия

Условная гомоскедастичность Var (εi |X ) = E (ε2i |X ) = σ 2


Условная гетероскедастичность Var (εi |X ) = E (ε2i |X ) 6= const
Безусловная гомоскедастичность Var (εi ) = E (ε2i ) = σ 2
Безусловная гетероскедастичность Var (εi ) = E (ε2i ) 6= σ 2

Эконометрика. Лекция 5 Гетероскедастичность 3 / 35


Примеры [доска]
Имеет ли место условная/безусловная гетероскедастичность в
каждом из случаев?
Случай А: εi независимы и одинаково распределены

Вероятности εi = −10 εi = −1 εi = 1 εi = 10
xi = 1 0 1/4 1/4 0
xi = 10 0 1/4 1/4 0

Случай B: εi независимы и одинаково распределены

Вероятности εi = −10 εi = −1 εi = 1 εi = 10
xi = 1 0 1/4 1/4 0
xi = 10 1/4 0 0 1/4

Эконометрика. Лекция 5 Гетероскедастичность 4 / 35


Примеры [доска]

Имеет ли место условная/безусловная гетероскедастичность в


каждом из случаев?
Случай C: εi независимы

Вероятности ε1 = −10 ε1 = −1 ε1 = 1 ε1 = 10
x1 = 1 0 1/4 1/4 0
x1 = 10 0 1/4 1/4 0

Вероятности ε2 = −10 ε2 = −1 ε2 = 1 ε2 = 10
x2 = 1 1/4 0 0 1/4
x2 = 10 1/4 0 0 1/4

Эконометрика. Лекция 5 Гетероскедастичность 5 / 35


Когда логично ожидать гетероскедастичность?

безусловной в случайной выборке не бывает


условная возникает при наличии “размера” объекта
условная присутствует почти всегда

Эконометрика. Лекция 5 Гетероскедастичность 6 / 35


В остальном всё ок

Предпосылка об условной гомоскедастичности нарушена.


Все остальные предпосылки классической модели со
стохастическими регрессорами для случайной выборки выполнены.

Эконометрика. Лекция 5 Гетероскедастичность 7 / 35


Мы используем прежние формулы:

Для оценок коэффициентов:


β̂ = (X 0 X )−1 X 0 y
Для оценки ковариационной матрицы оценок коэффициентов:
d (β̂|X ) = RSS (X 0 X )−1
Var n−k
В частности: q
d (β̂j |X ) = σ̂2 и se(β̂j ) = Var
Var d (β̂j |X )
RSSj

Эконометрика. Лекция 5 Гетероскедастичность 8 / 35


Три группы свойств:

конечная выборка без предположения о нормальности ε


конечная выборка с предположением о нормальности ε
асимптотические свойства без предположения о нормальности ε
Что происходит в каждом случае?

Эконометрика. Лекция 5 Гетероскедастичность 9 / 35


Малая выборка без нормальности ε

(+) Линейность по y
(+) Несмещенность, E (β̂|X ) = β, E (β̂) = β
(—) Оценки β̂ эффективны

Эконометрика. Лекция 5 Гетероскедастичность 10 / 35


Малая выборка с нормальными ε

β̂j −βj
(—) se(β̂j )
|X ∼ tn−k
RSS
(—) σ2
|X ∼ χ2n−k
(RSSR −RSSUR )/r
(—) RSSUR /(n−k) ∼ Fr ,n−k

Эконометрика. Лекция 5 Гетероскедастичность 11 / 35


Асимптотические свойства

(+) β̂ → β
RSS
(+) n−k → σ 2 = Var (εi )
β̂j −βj
(—) se(β̂j )
→ N(0, 1)
RSSR −RSSUR 2
(—) RSSUR /(n−k) → χr

Эконометрика. Лекция 5 Гетероскедастичность 12 / 35


Мораль:

Сами β̂ можно интерпретировать и использовать


Стандартные ошибки se(β̂j ) несостоятельны
Не можем строить доверительные интервалы для βj и проверять
гипотезы

Эконометрика. Лекция 5 Гетероскедастичность 13 / 35


Что делать?

Исправить стандартные ошибки!


Другая формула для оценки Var
d (β̂|X )
HC
Следовательно, другие seHC (β̂j )

Эконометрика. Лекция 5 Гетероскедастичность 14 / 35


Робастная (устойчивая) к гетероскедастичности
оценка ковариационной матрицы

Вместо
d (β̂|X ) = RSS (X 0 X )−1
Var n−k
использовать
d (β̂|X ) = (X 0 X )−1 X 0 Ω̂X (X 0 X )−1
Var HC

Уайт, 1980, HC0:


Ω̂ = diag(ε̂21 , . . . , ε̂2n )
Современный вариант, HC3:
 
ε̂21 ε̂2n
Ω̂ = diag (1−h11 )2
, . . . , (1−h nn )
2

Эконометрика. Лекция 5 Гетероскедастичность 15 / 35


Суть корректировки:

Мы меняем se(β̂j ) на seHC (β̂j )


Какие проблемы решены?
β̂j −βj
(+) seHC (β̂j )
→ N(0, 1) (УРА!)

Эконометрика. Лекция 5 Гетероскедастичность 16 / 35


Какие проблемы не решены?

(—) эффективность
Оценки β̂ не меняются и остаются неэффективными!
Даже при предположении о нормальности ε:
β̂j −βj
(—) seHC (β̂j )
|X ∼ tn−k
RSS
(—) σ2
|X ∼ χ2n−k
(RSSR −RSSUR )/r
(—) RSSUR /(n−k) ∼ Fr ,n−k

Эконометрика. Лекция 5 Гетероскедастичность 17 / 35


С практической точки зрения:

Новая формула для Var


d (β̂|X ), и, следовательно, для se (β̂j )
HC HC
робастная ковариационная матрица в R (по умолчанию HC3):

model <- lm(y~x, data=data)


vcovHC(model)

С ней жизнь прекрасна!


β̂j −βj
(+) seHC (β̂j )
→ N(0, 1)

Эконометрика. Лекция 5 Гетероскедастичность 18 / 35


Когда следует использовать робастные стандартные
ошибки?

Как только есть случайная выборка и объекты могут быть


разного “размера”, использовать seHC (β̂j ) для проверки гипотез!

Эконометрика. Лекция 5 Гетероскедастичность 19 / 35


Обнаружение гетероскедастичности

Оцениваем интересующую нас модель с помощью МНК


Строим график квадратов (или модулей) остатков в
зависимости от регрессора

Эконометрика. Лекция 5 Гетероскедастичность 20 / 35


Условная гомоскедастичность

Эконометрика. Лекция 5 Гетероскедастичность 21 / 35


Условная гетероскедастичность

Эконометрика. Лекция 5 Гетероскедастичность 22 / 35


Формальные тесты на гетероскедастичность

Тест Уайта (White)


Тест Голдфельда-Квандта (Goldfeld-Quandt)

Эконометрика. Лекция 5 Гетероскедастичность 23 / 35


Тест Уайта

асимптотический
не требуется нормальность остатков

Эконометрика. Лекция 5 Гетероскедастичность 24 / 35


Тест Уайта, алгоритм

1 Оценить основную регрессию, получить ε̂i


2 Оценить вспомогательную регрессию:
ε̂2i = γ1 + γ2 zi2 + . . . + γm zim + ui
zi2 , . . . , zim — факторы, определяющие форму гетероскедастичности.
По умолчанию во вспомогательной регрессии берут исходные
регрессоры, их квадраты и попарные произведения
3 2
Посчитать LM = nRaux

Эконометрика. Лекция 5 Гетероскедастичность 25 / 35


Тест Уайта

При верной H0 об условной гомоскедастичности:


H0 : Var (εi |X ) = E (ε2i |X ) = σ 2
LM ∼ χ2m−1 , где m — число параметров во вспомогательной регрессии
Если наблюдаемое значение статистики LM больше критического χ2cr ,
то H0 отвергается.

Эконометрика. Лекция 5 Гетероскедастичность 26 / 35


Тест Уайта [доска]

По 200 киоскам мороженого и исследователь оценил зависимость


спроса (q) от цены (p), разнообразия ассортимента (a) и удаленности
от метро (d).
Какой регрессор скорее всего влияет на условную дисперсию
ошибок?
2 = 0.2.
Исследователь провел классический тест Уайта и получил Raux
Как выглядит вспомогательная регрессия для теста Уайта?
Имеет ли место условная гетероскедастичность?

Эконометрика. Лекция 5 Гетероскедастичность 27 / 35


Тест Голдфельда-Квандта (Goldfeld-Quandt)

Есть переменная, от которой условная дисперсия ошибок


предположительно зависит монотонно
Требуется нормальность ошибок
Тест подходит для малых выборок

Эконометрика. Лекция 5 Гетероскедастичность 28 / 35


Процедура теста Голдфельда-Квандта

1 Сортируем наблюдения по предполагаемому убыванию условной


дисперсии
2 Выкидываем часть наблюдений посередине (например, 20%)
3 Оцениваем исходную модель отдельно по первым и по
последним наблюдениям
RSS1 /(n1 −k)
4 Считаем F = RSS2 /(n2 −k)

Эконометрика. Лекция 5 Гетероскедастичность 29 / 35


Тест Голдфельда-Квандта продолжение

При верной H0 об условной гомоскедастичности:


H0 : Var (εi |X ) = E (ε2i |X ) = σ 2
F ∼ Fn1 −k,n2 −k
Если наблюдаемое значение статистики F больше критического Fcr ,
то H0 отвергается.

Эконометрика. Лекция 5 Гетероскедастичность 30 / 35


Тест Голдфельда-Квандта [доска]

По 200 киоскам мороженого и исследователь оценил зависимость


спроса (q) от цены (p), разнообразия ассортимента (a) и удаленности
от метро (d).
Чтобы проверить наличие гетероскедастичности исследователь
оценил эту модель отдельно по 80 самым удаленным от метро
киоскам, получил, RSS2 = 120. По 80 самым близки к метро киоскам,
получил, RSS1 = 210.
Проведите тест Голдфельда-Квандта

Эконометрика. Лекция 5 Гетероскедастичность 31 / 35


Эффективность оценок?

Да, надо смириться с тем, что оценки неэффективны


Мы довольны несмещенностью, состоятельностью и
возможностью проверять гипотезы
Для получения эффективных оценок нужно точно понимать как
устроена гетероскедастичность. Это большая редкость.

Эконометрика. Лекция 5 Гетероскедастичность 32 / 35


Получение эффективных оценок [доска]

Модель mi = β1 + β2 ri + β3 ti + εi :
mi — средний результат класса по математике
ri — количество учеников
ti — среднее время, потраченное на занятия математикой
Какую структуру гетероскедастичности логично ожидать?
Как при такой структуре гетероскедастичности получить
эффективные оценки?

Эконометрика. Лекция 5 Гетероскедастичность 33 / 35


Мораль

Нарушение предпосылки об условной гомоскедастичности


Почти всегда имеет место в случайной выборке
Неприятность небольшая, мы используем робастные
стандартные ошибки
Если нужны эффективные оценки, то надо знать структуру
гетероскедастичности

Эконометрика. Лекция 5 Гетероскедастичность 34 / 35


Источники мудрости:

Артамонов Н.В., Введение в эконометрику: глава 3.3


Борзых Д.А., Демешев Б.Б. Эконометрика в задачах и
упражнениях: глава 8
Катышев П.К., Пересецкий А. А. Эконометрика. Начальный
курс: глава 6.1
Себер Дж., Линейный регрессионный анализ: глава 6.2

Эконометрика. Лекция 5 Гетероскедастичность 35 / 35

Вам также может понравиться