Академический Документы
Профессиональный Документы
Культура Документы
лекция 13
Цели лекции
2
ГЕТЕРОСКЕДАСТИЧНОСТЬ
• Ортогональность – ошибки некоррелированы с регрессорами
2 . D[ ] const
0 2
5
ГЕТЕРОСКЕДАСТИЧНОСТЬ ОШИБОК
x
7
Примеры моделей с гетероскедастичным
случайным членом
а) б) в)
а) Дисперсия 2 растет по мере увеличения значений
объясняющей переменной X
б) Дисперсия 2 имеет наибольшие значения при средних
значениях X, уменьшаясь по мере приближения к крайним
значениям
в) Дисперсия ошибки наибольшая при малых значениях X,
быстро уменьшается и становится однородной по мере 8
увеличения X
ИСТИННАЯ И ЛОЖНАЯ
ГЕТЕРОСКЕДАСТИЧНОСТЬ
1. Истинная гетероскедастичность
Вызывается непостоянством дисперсии случайного
члена, ее зависимостью от различных факторов.
2. Ложная гетероскедастичность
Вызывается ошибочной спецификацией
модели регрессии.
9
Источники гетероскедастичности – 1
10
Источники гетероскедастичности – 1
11
Источники гетероскедастичности – 2
12
Гетероскедастичность как следствие
ошибки спецификации модели. Пример
m
используется линейная модель Yi 0 j X ij ,i
j 1
12
log Manufacturing
11
10
7
9 10 11 12 13 14 15
log GDP
20
Гетероскедастичность простейшего вида
Var ( i ) Z i
2
i
2
15
СЛЕДСТВИЯ ГЕТЕРОСКЕДАСТИЧНОСТИ
Не существует какого-либо
однозначного метода определения
гетероскедастичности.
17
ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
Предварительная работа:
1. Нет ли очевидных ошибок спецификации?
2. Можно ли содержательно предполагать какой-то
вид гетероскедастичности?
3. Рассмотрение графиков остатков:
e(Y ), e( X j ), j 1, m
18
ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
1800000
1600000
1000000
800000
600000
400000
200000
0
0 1000000 2000000 3000000 4000000 5000000 6000000 7000000 8000000
GDP
In the scatter diagram manufacturing output is plotted against GDP, both measured in U.S. $
millions, for 30 countries for 1997. (Data are from the UNIDO Yearbook. The sample is restricted to
countries with GDP at least $10 billion and GDP per capita at least $2000.)
The scatter diagram is dominated by the observations for Japan and the USA and it is difficult to
detect any kind of pattern.
17
ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
300000
250000
150000
100000
50000
Mexico
0
0 200000 400000 600000 800000 1000000 1200000 1400000
GDP
However it those two countries are dropped and the scatter diagram rescaled, a clear picture of
heteroscedasticity emerges.
The reason for the heteroscedasticity is that variations in the size of the manufacturing
sector around the trend relationship increase with the size of GDP.
19
ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
300000
250000
Manufacturing
200000
150000
Singapore
100000
50000
Greece
0
0 200000 400000 600000 800000 1000000 1200000 1400000
GDP
Singapore and Greece are another pair of countries with relatively large and small
manufacturing sectors. However, because the GDP of both countries is small, their
variations from the trend relationship are also small.
21
ОБНАРУЖЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ
Тесты:
1. Тест ранговой корреляции Спирмена.
2. Тест Парка.
3. Тест Глейзера.
4. Тест Голдфелда-Квандта.
5. Тест Уайта.
6. Тест Бреуша-Пагана.
22
ТЕСТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА
z / e 1 i
, Di – разность рангов z и e.
n( n 1)
2
5. Рассчитывают статистику u z / e n , 1
распределенную нормально N(0,1) при отсутствии
гетероскедастичности.
25
ТЕСТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА
3000
2000
1000
0
0 5000 10000 15000 20000 25000 30000 35000 40000
GDP per capita
ТЕСТ ПАРКА
ln
2 i
z e
2
i i ln ln ln zi i
2
i
2
ln(e ) 0 1 ln zi i , i 1, n
2
i
i z i i
31
ТЕСТ БРЕУШ-ПАГАНА
p
0 j Z ij , i 1, n
2
i
j 1
32
ТЕСТ БРЕУШ-ПАГАНА.
Алгоритм применения
m
и вычисляются остатки: ei yi y i , i 1, n
2. Вычисляют оценку дисперсии остатков:
~e2 i
e 2
n
3. Строят вспомогательное уравнение регрессии:
ei2 p
~ 0 j z ji i , i 1, n
e2
j 1
33
ТЕСТ БРЕУШ-ПАГАНА.
Алгоритм применения
m b0 m xij
y i b0 b j xij yi bj
j 1 zi1 j 1 zi1
35
ТЕСТ БРЕУШ-ПАГАНА
var(y) = s^2 exp( b1z1 + b2z2 + ... + bkzk)
9000
5.870285
5000 Chi-sq( 3) P-value = .1181
4000
3000
2000
1000
0
0 5000 10000 15000 20000 25000 30000 35000 40000
GDP per capita
ТЕСТ ГОЛДФЕЛДА-КВАНДТА
GQ F ; l m 1; l m 1
то гипотеза гомоскедастичности остатков отвергается на
уровне значимости .
39
ТЕСТ ГОЛДФЕЛДА-КВАНДТА.
Замечание
2
2 , i 1, n
2
i
zi
При этом используется та же процедура, но тестовая
статистика равна:
RSS1
GQ
RSS3
40
ТЕСТ ГОЛДФЕЛДА-КВАНДТА
Пример.
300000
RSS1 = 157,000,000
250000
Manufacturing
200000
150000
RSS2 = 13,518,000,000
100000
50000
0
0 200000 400000 600000 800000 1000000 1200000 1400000
GDP
13
ТЕСТ ГОЛДФЕЛДА-КВАНДТА
Пример.
300000
RSS1 = 157,000,000
250000
RSS 2 / n2 13,518,000,000 / 9
200000
F ( n2 , n1 ) 86.1
RSS1 / n1 157,000,000 / 9
Manufacturing
50000
0
0 200000 400000 600000 800000 1000000 1200000 1400000
GDP
11
ТЕСТ УАЙТА
f ( X i1 , X i 2 , , X im ) i , i 1, n
2
i
U 2
; k
то гипотеза гомоскедастичности отвергается. Число
степеней свободы k равно числу объясняющих
Переменных вспомогательного уравнения. В частности,
Для рассматриваемого случая k = 9.
45
ТЕСТ УАЙТА.
Замечания
H0 : ,
2
1
2
2
2
n
9000
8000
7000
. white
Manufacturing per capita
6000
White's test for
5000
Ho: homoscedasticity
4000
3000
against Ha: unrestricted heteroscedasticity
2000
test statistic W = 3.616674
1000 Pr(chi2(2) > W) = 0.1639
0
---------------------------------------------------
0 5000 10000 15000 20000 25000 30000 35000 40000
GDP per capita
КОРРЕКЦИЯ
ГЕТЕРОСКЕДАСТИЧНОСТИ
2. Переопределить переменные.
48
ОБОБЩЕННЫЙ
МЕТОД НАИМЕНЬШИХ КВАДРАТОВ
49
МЕТОД
ВЗВЕШЕННЫХ НАИМЕНЬШИХ КВАДРАТОВ.
Случай парной регрессии
i Yi 1 X i i
Yi 0 1 X i i 0 1
i i i i
Yi 1 Xi i
Yi , Zi , Xi , i Yi 0 Z i 1 X i
i i i i i
Дисперсии 2
i пропорциональны Xi2: 2i 2 xi2 , i 1, n
51
Конец лекции
52