Вы находитесь на странице: 1из 5

Индивидуальное домашнее задание

(без устной защиты баллы за ИДЗ не выставляются)

Часть I (выполняется в MS Excel)


На основании официальной статистической информации,
представленной в ежегодниках «Регионы России. Социально-экономические
показатели» (https://www.gks.ru/folder/210/document/13204) необходимо:
1. По последним опубликованным статистическим данным (2017, или
2018, или 2019 выбрать четыре показателя для анализа на Ваше усмотрение
(например, в качестве результативного ВРП субъекта, в качестве факторов –
инвестиции в основной капитал, уровень безработицы, численность
населения, индекс потребительских цен). Ваши показатели должны
отличаться и не повторяться с однокурсниками. Две одинаковые работы –
незачет!!!
2. Данные представить в таблице:

Таблица 1 – Исходные данные для анализа


Результативный Показатель I, Показатель II, Показатель III,
показатель, единица единица единица
Субъект единица измерения измерения измерения
измерения
Y X1 X2 X3
Белгородская область
Брянская область
Владимирская
область
Воронежская область
Ивановская область
Калужская область
Костромская область
Курская область
Липецкая область
Московская область
Орловская область
Рязанская область
Смоленская область
Тамбовская область
Тверская область
Тульская область
Ярославская область
г. Москва
Республика Карелия
Республика Коми
Архангельская
область
Вологодская область
Калининградская
область
Ленинградская
область
Мурманская область
Новгородская
область
Псковская область
г. Санкт-Петербург
Республика Адыгея
Республика
Калмыкия
Краснодарский край
Астраханская
область
Волгоградская
область
Ростовская область
Республика Дагестан
Республика
Ингушетия
Кабардино-
Балкарская
Республика
Карачаево-
Черкесская
Республика
Республика Северная
Осетия – Алания
Чеченская
Республика
Ставропольский край
Республика
Башкортостан
Республика Марий
Эл
Республика
Мордовия
Республика
Татарстан
Удмуртская
Республика
Чувашская
Республика
Пермский край
Кировская область
Нижегородская
область
Оренбургская
область
Пензенская область
Самарская область
Саратовская область
Ульяновская область
Курганская область
Свердловская
область
Тюменская область
Челябинская область
Республика Алтай
Республика Бурятия
Республика Тыва
Республика Хакасия
Алтайский край
Забайкальский край
Красноярский край
Иркутская область
Кемеровская область
Новосибирская
область
Омская область
Томская область
Республика Саха
(Якутия)
Камчатский край
Приморский край
Хабаровский край
Амурская область
Магаданская область
Сахалинская область
Еврейская
автономная область
Чукотский
автономный округ

3. Графически изобразить зависимость результативного показателя и


факторов. Выдвинуть гипотезу о направлении связи (прямая или обратная).
4. Рассчитать коэффициенты корреляции и дать интерпретацию
результата (по шкале Чеддока). Проверить его значимость.
5. Выделить фактор, который оказывает наибольшее влияние на
результативный показатель. С помощью регрессионного анализа построить
уравнение парной линейной регрессии, характеризующее зависимость
результативного показателя от выделенного фактора.
6. Дать экономическую интерпретацию параметров уравнения
регрессии.
7. С помощью t-критерия Стьюдента проверить значимость
параметров уравнения регрессии.
8. Рассчитать коэффициент детерминации R2. Охарактеризовать
полученный результат.
9. С помощью F-критерия Фишера проверить на значимость всё
уравнение регрессии.
10. Рассчитать, чему будет равно прогнозное значение
результативного показателя, если фактор будет равен 1,2 относительно
своего среднего значения по имеющимся данным.
11. Построить уравнение парной линейной регрессии из п.5 в
логарифмах. Дать экономическую интерпретацию параметрам уравнения
регрессии.

Часть II (выполнятся в R-studio)

На основании официальной статистической информации (собранной


для Части I) провести исследование с построением эконометрических
моделей по выбранной теме по следующему плану:
1. Сформулировать исследовательский вопрос (например, в данной
работе я хочу оценить влияние объема инвестиций в основной капитал на
ВРП региона (т.е. нужно выбрать одну независимую переменную и в работе
оценить её влияние зависимую; остальные переменные будут являться
контрольными). В подобных исследованиях инвестиции желательно брать с
лагом, т.к эффект от инвестиций обычно проявляется не сразу, а с
запаздыванием –через год-два. Например, данные по ВРП берем за 2018г., а
по инвестициям – за 2017 или 2016г.
2. Сформулировать гипотезу исследования (например, инвестиции
положительно влияют на ВРП)
3. Добавить в таблицу из Части 1 одну бинарную (факторную)
объясняющую переменную (например, Западные регионы =1, Восточные
регионы=0). Для выгрузки в R-studio и последующего построения
регрессионных моделей данные должны быть представлены за один период в
формате xlsx в следующем виде:

Y Х1 Х2 Х3 Х4
7777 4558 88885 7855 0
778 441 5555 115323 1
111 1454 22222 45888 0
…. …. …… …. …..

4. Написать скрипт, содержащий этапы анализа данных, их


визуализацию и результаты регрессионного анализа: загрузка данных из
файла xls; расчет описательных статистик; гистограммы распределения
переменных; корреляционную матрицу переменных; диаграммы рассеивания
для зависимой и объясняющей переменных; оценку моделей: а) парной
регрессии из части I, б) множественной регрессии без бинарной
объясняющей переменной, в) множественной регрессии с бинарной
переменной, г) множественной регрессии с бинарной переменной в
логарифмах и вывод результатов в итоговую таблицу (команда mtable из
пакета memisc); проведение анализа факторов на наличие
мультиколлинеарности (корреляционная матрица, VIF); вывод о
наличии/отсутствии мультиколлинеарности; проведение тестов на
гетероскедастичность (Бройша-Пагана, Уайта); вывод об отсутствии/наличии
гетероскедастичности (при наличии гетроскедастичности – обязательно
использовать робастные стандартные ошибки).
Замечание: Если мы исследуем влияние инвестиций на ВРП, то все
остальные зависимые переменные (включая бинарную) будут являться
контрольными, т.е. с их помощью нужно отследить, как менялся с
добавлением факторов коэффициент при инвестициях.
5. Подготовка письменного отчета (4-5 страниц), включающего:
исследовательский вопрос, гипотезу исследования, описание используемых
данных и их источников, гистограммы распределения зависимых
переменных, спецификацию модели, ее описание, результаты оценки
четырех моделей (в одной таблице, значимые коэффициенты должны быть
отмечены звездочками), обсуждение результатов оценивания и
интерпретация коэффициентов, в т.ч. коэффициентов при бинарной
переменной; общие выводы по исследовательскому проекту, как полученные
результаты соотносятся с исследовательским вопросом. В приложение к
отчету по исследовательскому проекту должны быть включены code-book
(файл с исходными данными) и скрипт.