Вы находитесь на странице: 1из 53

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРА3ОВАНИЮ

ГОСУДАРСТВЕННОЕ ОБРА3ОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРА3ОВАНИЯ «САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ЭКОНОМИКИ И ФИНАНСОВ»

КАФЕДРА СТАТИСТИКИ И ЭКОНОМЕТРИКИ

МЕТОДИЧЕСКИЕ УКА3АНИЯ ПО ВЫПОЛНЕНИЮ ЛАБОРАТОРНЫХ РАБОТ

ПО ЭКОНОМЕТРИКЕ

(КОМПЬЮТЕРНЫЙ ПРАКТИКУМ В EXCEL И EVIEWS)

И3ДАТЕЛЬСТВО

2

САНКТ-ПЕТЕРБУРГСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА ЭКОНОМИКИ И ФИНАНСОВ

2009

Рекомендовано научно-методическим советом университета

Методические указания по выполнению лабораторных работ по эко- нометрике (компьютерный практикум в Excel и EViews).– СПб.: Изд-во СПбГУЭФ, 2009.– 52 с.

Издание содержит подробные указания по выполнению лабораторных работ по вводному курсу эконометрики с разъяснением получаемых резуль- татов. Может быть использовано как при проведении семинарских занятий по эконометрике, так и при самостоятельном изучении предмета. Предназначено для студентов экономических факультетов и всех начи- нающих изучать эконометрику.

Автор-составитель ассист. Л.М. Галиуллина

Рецензент канд. экон. наук, доц. Ю.В. Нерадовская

3

© Издательство СПбГУЭФ, 2009

4

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

5

ЛАБОРАТОРНАЯ РАБОТА № 1. ПАРНАЯ РЕГРЕССИЯ

6

Часть 1. Excel

6

Часть 2. EViews

9

ЛАБОРАТОРНАЯ РАБОТА № 2. МНОЖЕСТВЕННАЯ РЕГРЕССИЯ. ФИКТИВНЫЕ ПЕРЕМЕННЫЕ

17

Часть 1. Excel

17

Часть 2. EViews

24

ЛАБОРАТОРНАЯ РАБОТА № 3. ГЕТЕРОСКЕДАСТИЧНОСТЬ

И

АВТОКОРРЕЛЯЦИЯ

30

Часть 1. Excel

30

Часть 2. EViews

34

ЛАБОРАТОРНАЯ РАБОТА № 4. МУЛЬТИКОЛЛИНЕАРНОСТЬ

И

СТРУКТУРНЫЕ ИЗМЕНЕНИЯ

37

Часть 1. Мультиколлинеарность. EViews

37

Часть 2. Структурные изменения. EViews или Excel

42

ЛАБОРАТОРНАЯ РАБОТА № 5. ВРЕМЕННЫЕ РЯДЫ

43

Часть 1. Моделирование сезонности. Excel

43

Часть 2. Выявление причинно-следственных связей. EViews

46

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

52

5

ВВЕДЕНИЕ

На основе личного опыта изучения и преподавания эконометрики автор считает необходимым условием хорошего усвоения предмета вы- полнение лабораторных работ на компьютере: обучающийся должен по- лучить хотя бы минимальный опыт обработки данных. Данный компьютерный практикум составлен из лабораторных работ, предлагавшихся студентам экономических специальностей СПбГУЭФ на семинарских занятиях. Автор не отдает предпочтение какой-либо одной компьютерной про- грамме. Excel выбран по причине широкой распространенности и востре- бованности в экономической практике. EViews же достаточно прост в ос- воении и способен значительно облегчить эконометрические расчеты. Кроме того, автор выражает надежду, что студентам будет полезно зна- комство с современным промышленным программным обеспечением. Главной заботой автора при подготовке текста было обеспечение максимальной доступности изложения без большого ущерба для матема- тической строгости, поэтому более подготовленному читателю стиль из- ложения может показаться излишне подробным. По этой же причине для лучшего усвоения материала первые три темы предлагается изучить два- жды средствами Excel и EViews. Пособие рассчитано на 28 ч аудиторной нагрузки. Поэтому выбор тем был ограничен началами регрессионного анализа и введением в ана- лиз временных рядов. Студентам рекомендуется выполнять работы последовательно и от- вечать (или хотя бы предпринимать попытки отвечать) на все появляю- щиеся в тексте вопросы. Файлы с данными доступны на сервере СПбГУЭФ по адресу:

\Common\Кафедра статистики\Галиуллина\Данные. Автор выражает благодарность канд. экон. наук, старшему препода- вателю кафедры статистики и эконометрики СПбГУЭФ М.В. Соколову, любезно предоставившему текст своих лекций, данные, методические ма- териалы и ценные рекомендации, которые легли в основу настоящего практикума. Автор также благодарен рецензенту канд. экон. наук, доценту кафедры статистики и эконометрики СПбГУЭФ Ю.В. Нерадовской за конструктивные замечания.

6

ЛАБОРАТОРНАЯ РАБОТА № 1 ПАРНАЯ РЕГРЕССИЯ

Часть 1. Excel

Изучается зависимость между двумя величинами ценой квартиры

и размером ее жилой площади. Данные находятся в файле Книга1.xls. Задание. Используя приведенные исходные данные:

1. Постройте точечную диаграмму (по оси абсцисс х, по оси орди-

нат у). Для этого воспользуйтесь командой меню Excel Вставка → Диа- грамма Точечная. На основе визуального анализа предположите вид зависимости между изучаемыми переменными (функциональная или сто- хастическая; линейная или нелинейная и т. п.). 2. Оцените параметры уравнения парной линейной регрессии

y = b 0 + b 1 ·x + e 1 без привлечения встроенных статистических функций Excel. Для этого воспользуйтесь формулами

ˆ

b

1

yx − y ⋅ x = = 2 2 x − x
yx
y
x
=
=
2
2
x
− x

cov

[

]

 

,

y x

ˆ

b

=

ˆ

b x .

 

ˆ

2

,

0

y

1

σ

x

3. Выпишите оцененное уравнение регрессии. Дайте экономическую

интерпретацию коэффициента b 1 если рассматривать две квартиры, та- кие, что площадь одной из них на 1 кв. м больше, чем другой, то цена этой квартиры будет выше в среднем на…»). Можете ли вы как-то проинтер- претировать коэффициент b 0 ?

4. Оцените параметры уравнения парной линейной регрессии

y = b 0 + b 1 ·x + e, решив задачу минимизации суммы квадратов остатков. Воспользуйтесь надстройкой Поиск решения/Solver:

4.1. Добавьте новый лист, скопируйте в него исходные данные. Вы- делите ячейки для искомых параметров (оставьте их пустыми) и добавьте ряд остатков е:

) и добавьте ряд остатков е : 1 Здесь и далее символ е в

1 Здесь и далее символ е в зависимости от контекста обозначает ошибку или остаток. Случаи, когда символ е используется для обозначения основания натурального лога- рифма, оговариваются особо.

7

4.2. Сумму квадратов остатков необходимо минимизировать:

Q b

(

0

,

b

1

) =

n

i =

1

n

()(ˆ

y

i

y

i

=

2

i

=

1

y

i

f

(

x

i

;

b

0

,

b

1

n

))(

=

2

i

=

1

y

i

b

0

b x

1

i

)

2

=

n

i

= 1

e

2

i

→ min

b

0

,

b

1

Поэтому добавьте столбец е 2 и рассчитайте сумму квадратов остат- ков. Далее выберите в главном меню Сервис Поиск решения/Solver (если этот пункт меню отсутствует, нужно выбрать в главном меню ко- манду Сервис Надстройки и отметить флажок Поиск решения), ука- жите целевую ячейку, которую программа будет минимизировать, и ячей- ки, которые при этом будут изменяться (это значения коэффициентов регрессии); задача не предполагает никаких ограничений на параметры:

ограничений на параметры : Нажмите Выполнить /Solve , затем

Нажмите Выполнить/Solve, затем ОК. Оценки коэффициентов должны совпасть с полученными в п. 2. 5. Оцените параметры уравнения парной линейной регрессии

y = b 0 + b 1 ·x + e посредством встроенных функций Excel ОТРЕЗОК() и

НАКЛОН(). Сравните результаты с предыдущими. 6. Оцените параметры уравнения парной линейной регрессии

y = b 0 + b 1 ·x + e посредством надстройки Сервис → Анализ данных Регрессия (если этот пункт меню отсутствует, выберите в главном меню Сервис Надстройки, отметьте флажок Пакет анализа). Это наиболее удобный способ решения задачи, позволяющий получить не только оцен- ки коэффициентов, но и много других полезных показателей. Ознакомь- тесь с таблицей выводимых итогов с помощью файла Таблица итогов.xls (обратите внимание на примечания). 7. Рассчитайте показатель средней эластичности цены квартиры по размеру ее жилой площади. Как он интерпретируется?

8

8. Найдите коэффициент детерминации и дайте его интерпретацию. 8.1. Воспользуйтесь формулой

где

ˆ

y

i

=

b ˆ

0

+

b ˆ x

1

i

, i = 1,

R

2 = 1

,

n.

n

( y

i

y ˆ )

i

2

i = 1

n

(

y

i y

)

2

i = 1

,

8.2. Найдите его среди показателей, полученных в п. 6. 9. Используя линейное уравнение парной регрессии, постройте то- чечный и интервальный (с вероятностью 0,95) прогнозы цены квартиры с жилой площадью 33 кв. м. Точечный прогноз у в точке х:

 

[

y

 

]

 

[

b ˆ

y ˆ(

x

) = E

x

=

E

0

ˆ

+ b x

1

+

ε

x ]

= b ˆ

0

+

b ˆ x

1

+ E

[

ε

x

]

=

b ˆ

0

+

ˆ

b

1

x .

Доверительный интервал для прогноза: с вероятностью 1-α истинное значение у(х) будет лежать в интервале

где

s

y

(

x

) =

y(x)

(

yˆ(x)

s (x)t

y

табл

, yˆ(x)

+

s (x)t

y

табл

)

,

n   2 ∑ ( y − y ) ˆ   i i
n
2
( y
y )
ˆ
i
i
2
1
(
x
x
)
i = 1
1 +
+
n
n
− 2
n
2
(
x
x
)
i
i = 1

стандартная ошибка прогноза.

Для нахождения критического, или табличного значения t табл можно воспользоваться функцией =СТЬЮДРАСПОБР(0,05;n-p-1), где вместо n нужно подставить число наблюдений (10), а вместо p число объясняю- щих переменных (1). 10. Оцените статистическую значимость уравнения регрессии в це- лом (по F-критерию Фишера) и отдельных его параметров (по t-критерию Стьюдента). (См. файл Таблица итогов.xls.) 11. Постройте 90%-е доверительные интервалы для коэффициен- тов b 0 и b 1 . (См. примечания к ячейкам в файле Таблица итогов.xls.) Зна- чимы ли эти коэффициенты на 10%-м уровне значимости? (Если в доверительный интервал попадает 0, то нет оснований отвергнуть гипо- тезу о том, что коэффициент равен нулю, поэтому он считается стати- стически незначимым на данном уровне значимости. Если же 0 не попа-

9

дает в доверительный интервал, то гипотеза о равенстве коэффициента нулю отвергается; при этом вероятность ошибиться не превышает уров- ня значимости, т. е. в данном случае 10%.) 12. Оцените параметры степенного уравнения парной регрессии y = b 0 ·x b1 ·e. Для этого:

12.1. Нужно прологарифмировать обе части уравнения:

lny = lnb 0 + b 1 lnx + e

и провести замену переменных так, чтобы регрессия приняла линейный вид: lny = z, lnb 0 = a, lnx = t, откуда z = a + b 1 ·t + e.

12.2. Добавьте столбцы z = lny и t = lnx. Оцените регрессию z на кон-

станту и t (удобнее всего как в п. 6), получите оценки а и b 1 . Значимо ли

оказалось уравнение регрессии? Значимы ли коэффициенты а и b 1 ?

12.3. Вычислите оценку b 0 = e a (воспользуйтесь функцией =EXP()) 2 .

Выпишите оцененное степенное уравнение регрессии.

12.4. Коэффициент b 1 в регрессии y = b 0 ·x b1 ·e совпадает с коэффици-

ентом эластичности. Как он интерпретируется? 13. Выделите диаграмму. В главном меню выберите команду Диа- грамма Добавить линию тренда, в диалоговом окне на вкладке Па- раметры отметьте флажки «Показывать уравнение…» и «Поместить R 2 …», на вкладке Тип поочередно отметьте все предлагаемые типы зави- симости (постройте несколько диаграмм). Сравните построенные диа- граммы. Какой тип зависимости у от х вы считаете более адекватным, учитывая критерии наибольшего коэффициента детерминации и возмож- ности экономической интерпретации (в показательном уравнении регрес- сии y = b 0 ·b 1 x ·e коэффициент b 1 означает, что если х увеличить на 1, то ма- тематическое ожидание у возрастет в b 1 раз; для интерпретации параболы нужно найти ее экстремум (минимум или максимум) и решить, адекватна ли эта зависимость рассматриваемым данным; логарифмическая регрессия y = b 0 + b 1 lnx + e означает, что с увеличением х на 1% у возрастает прибли- зительно на b 1 /100 ед.)?

Часть 2. EViews

Для запуска EViews дважды щелкните соответствующий ярлык на рабочем столе. 1. Начало работы с EViews 5.1 3 . Познакомьтесь с элементами глав- ного окна EViews:

2 Здесь символ е используется для обозначения основания натурального логарифма. 3 Вводные упражнения в значительной степени заимствованы из неопубликованного компьютерного практикума по эконометрике канд. физ.-мат. наук С.Б. Макаровой.

10

10 ← строка заголовка ← главное меню ← командная строка ←

строка заголовка

главное меню

командная строка

рабочая область

строка состояния

2. Откройте файл для просмотра примера: File Open Workfile, выберите файл …\Лабораторная работа 1\spdat.wf1. Он содержит 118 на- блюдений за четырьмя переменными (div, p, ppi, r). Щелкните кнопку De- tails+/- в меню открытого файла, чтобы получить описание данных. 3. Откройте (двойным щелчком) ряд цен р, выберите View в меню активного окна и по очереди выберите следующие пункты:

Graph (программа построит различные виды графиков ряда р); Descriptive Statistics Histogram and Stats (построение гисто- граммы распределения):

гисто - граммы распределения ): ← название ряда ← выборка : с 1-

← название ряда

выборка: с 1-го по 118-е на- блюдение

← число наблюдений

11

Descriptive Statistics Stats Table (описательная статистика):

Mean

36.56407

среднее

Median

10.31500

медиана

Maximum

264.5100

максимум

Minimum

3.250000

минимум

Std. Dev.

51.57463

стандартное отклонение (корень из дисперсии)

Skewness

2.203818

асимметрия (0 у нормального распределения)

Kurtosis

8.211635

эксцесс (3 у нормального распределения)

   

статистика Жака-Бера (для проверки гипотезы о том,

Jarque-Bera

229.0596

что выборка из нормального распределения)

   

вероятность ошибиться, отвергнув гипотезу о том, что выборка из нормального распределения (в дан- ном случае вероятность нулевая, так что мы не оши- бемся, если скажем, что выборка получена не из

Probability

0.000000

нормального распределения)

Sum

4314.560

сумма значений всех наблюдений

   

сумма квадратов отклонений уровней ряда от сред-

Sum Sq. Dev.

311213.2

него

Observations

118

число наблюдений

Для возврата к отображению данных в виде таблицы значений выбе- рите View SpreadSheet. 4. Ознакомьтесь с некоторыми командами преобразования данных (для выполнения команды набирают ее в командной строке и нажимают ENTER):

Команда

Описание

genr y=log(x)

генерирует ряд y по формуле y t = ln(x t )

genr y=d(x)

генерирует ряд y по формуле y t = x t – x t-1 (т. е. ряд первых раз- ностей, или абсолютных приростов)

genr y=@trend

генерирует ряд y по формуле y t = t, начиная с нуля

genr y=x(-1)

генерирует ряд y по формуле y t = x t-1

Создайте четыре ряда:

1) p_real = ln(p/ppi) 2) d_real = ln(div/ppi) 3) ln_r = ln(1+r/100) 4) t номер наблюдения. Просмотрите созданные ряды. Дважды щелкните ряд t. Это должен быть ряд чисел 1, 2,…, 118. 5. Для редактирования данных дважды щелкните по имени перемен- ной, выберите View SpreadSheet в меню объекта и затем Edit+/-. По- пробуйте изменить какие-нибудь данные.

12

6. Для создания группы переменных выделите переменную p_real, удерживая клавишу CTRL, выделите переменную d_real. Поместите кур- сор в выделенную область и щелкните правой кнопкой мыши. Выберите Open as Group. Чтобы сохранить группу, выберите Name в соответст- вующем меню. Повторите процедуру создания группы, выбрав сначала d_real, а за- тем p_real. Сравните результаты. 7. Предварительное изучение данных. Откройте созданную вами группу, выберите View из меню активного окна и по очереди выберите следующие пункты меню:

Graph Line Graph Scatter Simple Scatter (диаграмма рассеяния, или поле корреляции) Graph Scatter Scatter with Regression (то же самое, но с до- бавлением линии регрессии) Multiple Graphs Line Descriptive Stats Common Sample Correlations (таблица коэффициентов корреляции между перемен- ными) Covariances (таблица ковариаций) 8. Импорт данных. В этом примере создается пустой файл на 118 на-

блюдений, а затем он заполняется данными, взятыми из файла spdat.xls.

8.1. Создание нового рабочего файла: File New Workfile.

Заполните диалоговое окно:

данные не привязаны ко времени →

данные не привязаны ко времени → ← число наблюдений Таким

← число

наблюдений

Таким образом создается новый (пустой) рабочий файл на 118 на- блюдений.

8.2. Откройте в Excel файл spdat.xls. Он содержит те же самые дан-

ные, что и файл spdat.wf1, с которым мы уже работали. Обратите внима-

ние на организацию данных: имеются 118 наблюдений по 4 переменным;

13

данные располагаются в 4-х столбцах и начинаются с ячейки A2 (заголо- вок не считается). Закройте файл spdat.xls. Для импортирования данных из книги Excel, выберите в главном меню Proc Import Read Text- Lotus-Excel…, выберите файл spdat.xls. Заполните диалоговое окно:

ряды в столбцах → ряды в строках

названия рядов через пробел (если их нет в импортируемом фай- ле) или число рядов данных

импортируемый диапазон (номера наблюдений)

левая верхняя ячей- ка с данными

верхняя ячей - ка с данными ↓ Замечание . Названия листов в

Замечание. Названия листов в импортируемом файле не должны со- держать кириллических символов.

Кривая Филлипса 4

9. Так называемая кривая Филлипса описывает обратную зависи- мость между темпом прироста зарплаты и уровнем безработицы. Кривая Филлипса может быть представлена в виде уравнения dw t = b 0 + b 1 /u t + e t , где w t уровень заработной платы в периоде t,

dw

t

= 100

w

t

w

t 1

w

t

1

темп прироста зарплаты в периоде t (в %),

u t процент безработных на момент времени t.

Экономическая теория предполагает, что b 0 < 0 и b 1 > 0. Данные для страны приведены в файле Книга2.xls.

4 Пример основан на задаче 2.16, взятой из учебника: Магнус Я.Р., Катышев П.К., Пе- ресецкий А.А. Эконометрика. Начальный курс.– М.: Дело, 2000.– С. 57.

W

14

9.1. Оценим параметры b 0 и b 1 . Для этого сначала создайте в EViews новый файл для 18 наблюдений без привязки данных ко времени. Введите данные, изучив два способа:

1) в меню Object выберите пункт New Object, тип объекта (Type of object) – ряд (Series), имя объекта (Name of object) – w. Таким образом создан ряд w. Дважды щелкните на нем, чтобы его открыть. Вместо дан- ных во всех ячейках стоит NA, т. е. нет данных (not available). Щелкните кнопку Edit+/-. Теперь содержимое ячеек можно изменять. Скопируйте исходные данные по ряду w из файла Книга2.xls, щелкните правой кноп- кой по первой ячейке, содержащей NA, выберите Paste (Вставить). Анало- гичным образом добавьте ряд u; 2) сначала удалите созданные ряды w и u (щелкните по ряду правой кнопкой и выберите Delete). Создайте книгу Excel и скопируйте в нее ис- ходные данные. Сохраните этот файл, предварительно убедившись, что он содержит один лист и в названии листа нет кириллических букв. Закройте файл. Импортируйте данные как в п. 8.2. Откройте созданные ряды и убе- дитесь, что данные импортировались корректно. Посмотрите на данные: являются ли они однородными (нет ли резко отличающихся наблюдений т.н. выбросов), нет ли пропущенных дан- ных. Для этого выделите ряды u и w и откройте группу (см. п. 6). Выбери- те в меню View Graph Scatter Simple Scatter. Как видно из диаграммы рассеяния, данные достаточно однородны и никакой зависимости между ними пока не выявляется:

3.6

3.2

2.8

2.4

2.0

1.6

0.8 1.0 1.2 1.4 1.6 1.8 2.0
0.8
1.0
1.2
1.4
1.6
1.8
2.0

U

Постройте ряд dw. Для этого введите в командной строке genr dw=100*(w-w(-1))/w(-1) и нажмите ENTER. Прежде чем оценивать регрессию dw t = b 0 + b 1 /u t + e t , еще раз по- смотрите на данные. Похожа ли эта зависимость на гиперболическую:

15

9 8 7 6 5 4 3 2 1 0.8 1.0 1.2 1.4 1.6 1.8
9
8
7
6
5
4
3
2
1
0.8
1.0
1.2
1.4
1.6
1.8
2.0
DW

U

Оцените регрессию dw t = b 0 + b 1 /u t + e t . Для этого разберите два спо-

соба:

1) наберите в командной строке ls dw c 1/u и нажмите ENTER. Это означает, что оценивается регрессия dw на кон- станту с (т. е. ищется b 0 ) и переменную 1/u (т. е. ищется b 1 ). Для оценива- ния применяется метод наименьших квадратов (ls – least squares); 2) выберите в главном меню Quick Estimate Equation и в от- крывшемся окне наберите dw c 1/u Нажмите ОК. Программа спросит, удалить ли предыдущее уравне- ние регрессии. Нажмите Yes. Вы получите такую же итоговую таблицу, как и в п. 1). Изучите таблицу выводимых итогов с помощью файла Equa- tion.xls (обратите внимание на все примечания). Выпишите уравнение регрессии dw t = b 0 + b 1 /u t + e t , подставив в него оцененные параметры. Сделайте вывод о значимости отдельных коэффициентов и уравнения в целом. (См. примечания к ячейкам в файле Equation.xls.) Выполняются ли ограничения, налагаемые эконо- мической теорией? Подтверждается ли, по-вашему, наличие кривой Филлипса? Закройте окно Equation. Программа спросит, удалить ли уравнение регрессии. Нажмите Name, затем ОК. Уравнение сохранится под именем eq01 (или под тем именем, которое вы зададите). 9.2. На основе кривой Филлипса спрогнозируем темп прироста зара- ботной платы в 19-м периоде, если известно, что уровень безработицы со- ставит 1,6%. Построим точечный и интервальный (с вероятностью 95%) прогнозы. Для этого сначала нужно добавить еще одно наблюдение: в ок-

16

не Workfile дважды щелкните на надписи Range; в открывшемся окне из- мените число наблюдений на 19; нажмите ОК, затем Yes. Откройте ряд u, введите значение 19-го наблюдения: 1.6. В окне Equation нажмите кнопку Forecast и заполните диалоговое

окно:

имя для ряда прогнозных значений → имя для ряда стандартных ошибок прогноза

диапазон наблюдений, для которых строится прогноз

которых строится прогноз → Вы получите график прогнозных

Вы получите график прогнозных значений и доверительных интер- валов прогноза для всех 19 наблюдений. Прогнозные значения сохранены в виде ряда dwf. Откройте этот ряд. 19-е значение это точечный прогноз темпа прироста заработной платы при уровне безработицы 1,6%:

при уровне безработицы 1,6%: Доверительный интервал

Доверительный интервал прогноза:

y(x)

(

yˆ(x)

s (x)t

y

табл

, yˆ(x)

+

s (x)t

y

табл

)

.

Вместо s y (x) подставьте 19-е значение ряда sef, за t табл для 95%-го прогноза почти всегда достаточно брать 2. Рассчитайте доверительный интервал прогноза. Ожидается ли увеличение заработной платы в 19-м пе- риоде?

9.3. Построенная регрессия может быть пригодна также для отыска-

ния «естественного уровня безработицы», т. е. такого уровня, при котором dw = 0. Найдите его.

9.4. Сохраните файл. Для этого сделайте активным окно Workfile и

выберите в главном меню File Save As…

17

ЛАБОРАТОРНАЯ РАБОТА № 2 МНОЖЕСТВЕННАЯ РЕГРЕССИЯ. ФИКТИВНЫЕ ПЕРЕМЕННЫЕ

Часть 1. Excel

Изучается зависимость цены квартиры от размера ее общей площади и района города. Откройте файл Flats_SPb.xls. 1. Добавьте фиктивные переменные (т. е. переменные, численно вы- ражающие качественные признаки) для каждого из трех рассматриваемых районов: vyb, kln и prm. Если квартира расположена в Выборгском районе, то переменная vyb принимает значение 1, в противном случае – 0. Если квартира расположена в Калининском районе, то переменная kln прини- мает значение 1, в противном случае – 0. Если квартира расположена в Приморском районе, то переменная prm принимает значение 1, в про- тивном случае – 0. Здесь удобно использовать функцию =ЕСЛИ():

использовать функцию = ЕСЛИ (): В результате таблица должна

В результате таблица должна принять следующий вид:

= ЕСЛИ (): В результате таблица должна принять следующий вид :

18

2. Выведите описательную статистику по всем переменным. Для этого выберите в меню Сервис → Анализ данных Описательная ста- тистика (если этот пункт меню отсутствует, нужно выбрать в главном меню Сервис Надстройки и отметить флажок Пакет анализа) и за- полните диалоговое окно:

и за - полните диалоговое окно : Получив описательную статистику

Получив описательную статистику по всем переменным, поста- райтесь извлечь из нее максимум полезной информации. Здесь вы, к примеру, можете посмотреть, какой была средняя или наиболее часто встречающаяся цена, максимальная или минимальная площадь прода- ваемой квартиры и т. п. По этим характеристикам также можно обна- ружить выбросы (т. е. наблюдения, слишком отличающиеся от осталь- ных) и затем удалить их из выборки (есть ли выбросы в данном примере?). 3. Рассчитайте выборочные коэффициенты парной корреляции меж- ду переменными:

r

yx

=

yx − y ⋅ x 2 2 2 2 ( y − y )( x
yx
y
x
2
2
2
2
(
y
y
)(
x
x
)

=

cov

[

y

,

x

]

σ σ

y

ˆ

ˆ

x

.

Для этого выберите в меню Сервис Анализ данных Корре- ляция. Заполните диалоговое окно:

19

19 Выборочный коэффициент корреляции принимает значения на от -

Выборочный коэффициент корреляции принимает значения на от-

резке [-1; 1]. Чем ближе он по модулю к единице, тем (предположительно) сильнее линейная связь между парой переменных. Если же он близок к нулю, то линейной связи (предположительно) нет (хотя может присутст- вовать нелинейная зависимость).

В данном примере наблюдается сильная линейная связь между це-

ной квартиры и ее площадью (чему равен коэффициент корреляции?). Фиктивные переменные тоже попарно коррелируют между собой, но не так сильно (они связаны тождеством vyb + kln + prm = 1).

Благоприятной при построении регрессии является ситуация, когда объясняемая переменная (в данном случае цена квартиры) хорошо корре- лирует с объясняющими переменными, а объясняющие переменные меж- ду собой коррелируют слабо.

В данном примере настораживает то, что не все объясняющие пере-

менные (или регрессоры, факторы) имеют высокий (по модулю) коэффи- циент корреляции с объясняемой переменной. Так, фиктивные перемен- ные слабо коррелируют с ценой квартиры. Это позволяет высказать предположение, что цена на квартиру может не зависеть от района (т. е., что в данном случае все три района эквивалентны по престижности). 4. Построим множественную линейную регрессию цены квартиры на размер ее общей площади и район города. Обозначим цену через p, площадь через s. Тогда регрессия имеет вид

p = b 0 + b 1 s + b 2 vyb + b 3 kln + b 4 prm + е.

Однако в таком виде она оценена быть не может, т.к. имеется линей- ная функциональная зависимость между факторами: vyb + kln + prm = 1 = const. Поэтому из уравнения регрессии нужно исключить либо одну из фиктивных переменных, либо константу. Рассмотрим эти два случая в от- дельности:

20

4.1. Исключим из уравнения одну фиктивную переменную, напри- мер, prm:

(*)

Оценим уравнение регрессии: Сервис Анализ данных Рег- рессия:

p = b 0 + b 1 s + b 2 vyb + b 3 kln + е.

p = b 0 + b 1 s + b 2 vyb + b 3 kln

Выпишите оцененное уравнение регрессии, подставив в него полу- ченные коэффициенты. Проинтерпретируйте коэффициент b 1 если рассматриваются две квартиры, расположенные в одном районе, и площадь первой больше на 1 кв. м, то ее цена будет выше в среднем на…»). Рассчитайте коэффициент частной эластичности цены по общей площади, дайте его экономическую интерпретацию. Дайте интерпретацию коэффициенту детерминации вариация за- висимой переменной на …% объясняется вариацией факторов, включен- ных в регрессию»). Достаточно ли он высок, по-вашему? Выпишите уравнения регрессии отдельно для каждого района (под- ставив соответствующие оценки коэффициентов):

- для Выборгского vyb = 1, kln