8)
РОССИЙСКОЙ ФЕДЕРАЦИИ ББК 65.вб.я73
САНКТ-ПЕТЕРБУРГСКАЯ АКАДЕМИЯ УПРАВЛЕНИЯ И
ЭКОНОМИКИ
НОВОСИБИРСКИЙ ФИЛИАЛ
Печатается по решению учебно-методического совета
Новосибирского филиала Академии управления и экономики,
г. Санкт-Петербург.
Ю.Е.Воскобойников
Рецензент:
Т.Н. Воскобойникова заведующий кафедрой инвестиции и экономики НГАСУ,
к.э.н., доцент
Т.А. Ивашенцева
МЕТОДИЧЕСКИЕ УКАЗАНИЯ
к лабораторным и контрольным работам Методические указания содержат описание лабораторных
работ и необходимые расчетные соотношения для их выполне-
курса «Эконометрика» ния. Основное внимание уделяется реализации этих соотноше-
ний в табличном процессоре Excel. Также приводятся две кон-
Парный и множественный трольные работы и даются рекомендации по их выполнению.
регрессионный анализ
Методические указания рекомендуются студентам экономи-
ческих специальностей вузов, изучающих дисциплину «Эконо-
метрика», а также будут полезны аспирантам и преподавателям
по прикладной экономике и финансам.
1 2
СОДЕРЖАНИЕ ВВЕДЕНИЕ
3 4
Хотя методические указания и содержат необходимые рас- Тема 1. ЛИНЕЙНАЯ ПАРНАЯ РЕГРЕССИЯ
четные соотношения, но они не заменяет учебник по экономет-
рике, а является своеобразным справочником по численному ре- Эта тема включает выполнение шести лабораторных работ,
шению некоторых задач эконометрике в Excel XP. посвященных построению и исследованию уравнения линейной
регрессии вида
Замечание 1. В тексте при описании той или иной функции в yˆ( x) = b0 + b1 x. (1.1)
качестве формальных параметров используются имена перемен-
ных, определенные в тексте пособия. При обращении к функции в Пространственная выборка для построения этого уравнения взята
качестве фактических параметров могут использоваться кон- из следующего примера.
станты, адреса ячеек, диапазоны адресов и арифметические вы- Пример 1.1. Для определения зависимости между сменной
ражения. Например, описание функции для вычисления среднего добычей угля на одного рабочего (переменная Y, измеряемая в
арифметического значения (выборочного среднего) имеет вид: тоннах) и мощностью угольного пласта (переменная X, измеряе-
СРЗНАЧ( x1 ; x2 ; ...; xm ) , мая в метрах) на 10 шахтах были проведены исследования, ре-
зультаты которых представлены таблицей 1.1.
где x1 , x2 ,..., xm – формальные параметры, число которых не пре-
вышает 30 ( m ≤ 30 ). Для вычисления среднего значения величин, Таблица 1.1
находящихся в ячейках B3, B4, B5, B6, C3, C4, C5, C6, обращение i 1 2 3 4 5 6 7 8 9 10
к функции в соответствующей ячейке имеет вид
= СРЗНАЧ(B3:B6;С3:C6), xi 8 11 12 9 8 8 9 9 8 12
т.е. в качестве фактических параметров используются два диапа-
зона ячеек. yi 5 10 10 7 5 6 6 5 6 8
5 6
Решая эту систему уравнений, получаем
xy − x ⋅ y m XY
b1 = = 2 ; (1.4)
x 2 − ( x )2 sX
b0 = y − b1 ⋅ x , (1.5)
где mXY – выборочное значение корреляционного момента, опре-
деленного по формуле:
m XY = xy − x ⋅ y , (1.6)
s 2X – выборочное значение дисперсии величины X, определяемой
по формуле:
s 2X = x 2 − ( x )2 . (1.7)
Решение. Вычислим эти коэффициенты b0 , b1 , используя
табличный процессор Excel (версия XP). На рис. 1.1 показан
фрагмент документа Excel, в котором: а) размещены данные таб-
лицы 1; б) запрограммировано вычисление коэффициентов x , y ,
x 2 , xy системы (1.2); в) запрограммировано вычисление b0, b1 по
формулам (1.4), (1.5) соответственно. Рис. 1.1. Вычисление коэффициентов линейной регрессии
Заметим, что для вычисления средних значений использует-
Лабораторная работа № 1.2
ся функция Excel СРЗНАЧ(диапазон ячеек).
Вычисление выборочного коэффициента корреляции
В результате выполнения запрограммированных вычислений
получаем b0 = –2.75; b1 = 1.016, а само уравнение регрессии (1.1) Цель работы. Вычисление выборочного коэффициента кор-
примет вид реляции по пространственной выборке таб. 1.1.
yˆ( x) = −2.75 + 1.016 x . (1.8) Расчетные соотношения. Выборочный коэффициент кор-
реляции определяется соотношением
Задание. Используя уравнение (1.8), определите производи-
тельность труда шахтера, если толщина угольного слоя равна: а) x⋅ y − x⋅ y
rXY = , (1.9)
8.5 метров (интерполяция данных); б) 14 метров (экстраполяция s X ⋅ sY
данных). 1 n 2
где s X = x 2 − ( x )2 , sY = ∑ yi .
y 2 − ( y )2 ,
n i =1
y2 = (1.10)
∑ ( yˆi − yi )2 ∑e 2
i
где s 2 = i =1
= i =1
- оценка дисперсии σ 2 .
n−2 n−2
∑ ( x − x)
i =1
i
2
∑ ( x − x)
i =1
i
2
n n
∑ ( yˆ i − yi ) 2 ∑e 2
i
где s 2 = i =1
= i =1
- оценка дисперсии σ 2 . Таким обра-
n−2 n−2 Рис.1.5. Построение интервальной оценки для f ( x ) = M (Y | x )
зом, в (1.12) входят две величины s yˆ ( x) = s yˆ ( x) (зависит от x ) 2
10
13 14
Лабораторная работа № 1.6 уравнение регрессии yˆ(x) =−2.75 +1.016⋅ x значимо с уровнем зна-
Проверка значимости уравнения линейной регрессии чимости α = 0.05.
по критерию Фишера
15 16
Тема 2. НЕЛИНЕЙНАЯ ПАРНАЯ РЕГРЕССИЯ bx
• экспоненциальную yˆ = b0 e 1 .
Эта тема включает выполнение двух лабораторных работ, Для построения одной из перечисленных регрессий необхо-
посвященных построению уравнения нелинейной парной регрес- димо выполнить следующие шаги:
сии. Пространственная выборка для построения регрессии взята Шаг 1. В выбранном листе Excel ввести по столбцам исход-
из следующего примера. ные данные {xi , y i }, i = 1,2, K , n (см. рис. 2.1).
Пример 2.1. В таблице 2.1 приведены значения независимой Шаг 2. По этим данным построить график в декартовый
переменной X (доход американской семьи в тысяч долларов) и системе координат (см. рис 2.1).
значения зависимой переменной Y (доля расходов на товары дли- Шаг 3. Установить курсор на построенном графике, сделать
тельного пользования в процентах от общей суммы расходов). щелчок правой кнопкой и в появившемся контекстном меню
выполнить команду Добавить линию тренда (см. рис. 2.1).
Таблица 2.1 Шаг 4. В появившемся диалоговом окне (см. рис. 2.2) акти-
xi 1 2 3 4 5 6 визировать закладку «Тип» и выбрать нужное уравнение регрес-
yi 10 13.4 15.4 16.5 18.6 19.1 сии.
19 20
рессии необходимо выполнить прогноз, то нужно указать число Лабораторная работа № 2.2
периодов прогноза (см. рис. 2.3). Выбор наилучшей нелинейной регрессии
Назначение других опций понятны из своих названий. по приведенному коэффициенту детерминации
Шаг 6. После задания всех перечисленных опций щелкнуть
на кнопке «OK» и на диаграмме появиться формула построенного Цель работы. Используя пространственную выборку табли-
цы 2.1 и команду «Добавить линию тренда» построить шесть
уравнения регрессии и значение индекса детерминации R 2 (выде- уравнений нелинейной регрессии (полиномиальное уравнение
лено на рис. 2.4 затемнением). строится при m = 2 и m = 3 ), определить для каждого уравнения
коэффициент детерминации R 2 (значение выводится), приведен-
ный коэффициент детерминации R̂ 2 (значение вычисляется) и по
максимальному значению R̂ 2 найти наилучшее уравнение нели-
нейной регрессии.
21 22
Решение. Для построения каждого уравнения выполняем Задание. Определить по величине R̂ 2 «наихудшее» уравне-
шаги 2 – 6 (для первого уравнения еще и шаг 1) и размещаем в ние регрессии.
одном документе шесть окон, в которых выводятся найденные
уравнения регрессии уравнения и величина R 2 . Затем формулу Тема 3. ЛИНЕЙНАЯ МНОЖЕСТВЕННАЯ РЕГРЕССИЯ
уравнения и R 2 заносим в таблицу 2.2. Далее по формуле (2.1)
вычисляем приведенный коэффициент детерминации R̂ 2 и зано- Эта тема включает выполнение лабораторных работ, посвя-
сим эти значения также в таблицу (см. таб. 2.2). щенных построению и исследованию уравнения линейной мно-
жественной регрессии вида
Таблица 2.2
yˆ( x1 , x2 ) = b0 + b1 ⋅ x1 + b2 ⋅ x2 (3.1)
№ Уравнение R2 R̂ 2
Пространственная выборка для построения этого уравнения взята
1 yˆ = 9.28 + 1.777 x 0.949 0.938 из следующего примера.
Пример 3.1. Данные о сменной добыче угля на одного рабо-
2 yˆ = 9.8759 + 5.1289 ⋅ ln x 0.9916 0.9895 чего (переменная Y – измеряется в тоннах), мощности пласта (пе-
ременная X1 – измеряется в метрах) и уровнем механизации работ
yˆ = 6.93 + 3.5396 x − 0.2518 x 2 в шахте (переменная X2 – измеряется в процентах), характери-
3
(полиноминальная, m = 2 ) 0.9896 0.9827 зующие процесс добычи угля в 10 шахтах приведены в таблице
3.1.
yˆ = 5.8333 + 4.9192 ⋅ x − 0.7087 ⋅ x 2 − Предполагая, что между переменными Y, X1, X2 существует
линейная зависимость, необходимо найти аналитическое выра-
4 − 0.0435 ⋅ x 3
0.9917 0.9792 жение для этой зависимости, т.е. построить уравнение линейной
(полиноминальная, m = 3 ) регрессии.
Таблица 3.1
5 yˆ = 10.18 x 0.3626 0.9921 0.9901
Номер шахты
i
xi1 xi2 yi
6 yˆ = 9.8675 ⋅ e0.1225 x 0.9029 0,8786
1 8 5 5
2 11 8 10
В качестве «наилучшего» уравнения регрессии выбираем 3 12 8 10
уравнение, имеющее наибольшую величину приведенный коэф- 4 9 5 7
фициент детерминации R̂ 2 . Из таб. 2.2 видно, что таким уравне- 5 8 7 5
нием является степенная функции (в таблице строка с этой функ- 6 8 8 6
цией выделена серым цветом) 7 9 6 6
8 9 4 5
yˆ = 10.18 x 0.3626 , 9 8 5 6
имеющая величину R̂ 2 = 0.9901. 10 12 7 8
23 24
Лабораторная работа № 3.1 Матричные функции Excel. Для реализации этой матрич-
Вычисление коэффициентов линейной множественной ной формулы в необходимо выполнить следующие операции:
регрессии транспонирование; умножение матриц (частный случай – умно-
жение матрицы на вектор); вычисление обратной матрицы. Все
Цель работы. Используя пространственную выборку табли- эти операции можно реализовать с помощью следующих мат-
b0 ричных функций Excel. Для работы с этими функциями можно
цы 3.1 необходимо вычислить вектор коэффициентов b = b1 или а) обратиться к Мастеру функций и выбрать нужную кате-
горию функций, затем указать имя функции и задать соответст-
b2
вующие диапазоны ячеек, или б) ввести с клавиатуры имя функ-
уравнения регрессии (3.1). ции задать соответствующие диапазоны ячеек.
Расчетные соотношения. Вектор коэффициентов, найден- Транспонирование матрицы осуществляется с помощью
ный методом наименьших квадратов является решением сле- функции ТРАНСП (категория функций – Ссылки и массивы).
дующей системы уравнений: Обращение к функции имеет вид:
X T Xb = X T y , ТРАНСП (диапазон ячеек),
где параметр диапазон ячеек задает все элементы транспонируе-
где X - матрица размера 10 × 3 , первый столбец которой состав-
мой матрицы (или вектора).
лен из 1, а другие два столбца составлены из значений xi1 , xi 2 ,т.е. Умножение матриц осуществляется с помощью функции
матрица X имеет следующую структуру (символы … означают МУМНОЖ (категория функций – Математические). Обращение
не отображенные элементы) к функции имеет вид:
1 8 5 МУМНОЖ(диапазон_1;диапазон_2),
1 11 8 где параметр диапазон_1 задает элементы первой из перемно-
X= , жаемых матриц, а параметр диапазон_2 – элементы второй мат-
L L L
рицы. При этом перемножаемые матрицы должны иметь соответ-
1 12 7 ствующие размеры (если первая матрица n × k , вторая - k × m , то
а y - вектор, составленный из 10 значений yi , т.е. результатом будет матрица n × m ).
Обращение матрицы (вычисление обратной матрицы) осуще-
5 ствляется с помощью функции МОБР (категория функций – Ма-
10 тематические). Обращение к функции имеет вид:
y= .
M МОБР (диапазон ячеек),
8 где параметр диапазон ячеек задает все элементы обращаемой
матрицы, которая должна быть квадратной и невырожденной.
Матрица X T X имеет обратную матрицу ( X T X )
−1
и тогда вектор При использовании этих функций необходимо соблюдать
коэффициентов вычисляется в виде: следующий порядок действий:
b = A−1 ( X T y ) . (3.2)
25 26
• выделить фрагмент ячеек, в которые будет занесен резуль- Затем выполним формирование матрицы X T X , вектора X T y и
тат выполнения матричных функций (при этом надо учитывать T
размеры исходных матриц); вычисление вектора b = b0 , b1 , b2 по формуле (3.2). Все эти вы-
• ввести арифметическое выражение, содержащее обраще- числения показаны на рис. 3.1.
ние к матричным функциям Excel; −3.5393
• одновременно нажать клавиши [Ctrl], [Shift], [Enter]. Если
Получен вектор коэффициентов b = 0.8539 и тогда урав-
этого не сделать, то вычислится только один элемент результи-
рующей матрицы или вектора. 0.3670
Решение. Сформируем матрицу X и вектор y (см. рис. 3.1). нение регрессии (3.1) примет вид:
yˆ ( x1 , x2 ) = −3.54 + 0.854 x1 + 0.367 x2 . (3.3)
31 32
SSr Столбец t − статистика – значения статистик Tb j .
kr
Fc = . Столбец Р – значение – содержит вероятности случайных
SSe
ke событий P (t ( n − m ) ≥ Tb j ) , где t ( n − m ) − случайная величина,
Столбец значимость F - значение уровня значимости, соот- подчиняющаяся распределению Стьюдента с n − m степенями
ветствующее вычисленной величине F − критерия и равное ве- свободы.
роятности P( F ( kr , ke ) ≥ Fc ) , где F ( kr , ke ) - случайная величина, Если эта вероятность меньше уровня значимости α , то
подчиняющаяся распределению Фишера с kr , ke степенями сво- принимается гипотеза о значимости соответствующего коэф-
фициента регрессии.
боды. Эту вероятность можно также определить с помощью
Из рис. 3.4 видно, что значимым коэффициентом является
функции FРАСП( Fc ; k r ; ke ). Если вероятность меньше уровня
только коэффициент b1 .
значимости α (обычно α = 0.05 ), то построенная регрессия яв-
Столбцы Нижние 95% и Верхние 95% - соответственно
ляется значимой.. нижние и верхние интервалы для оцениваемых коэффициентов
Перейдем к следующей группе показателей, объединенных в βj.
таблице, показанной на рис. 3.4.
Перейдем к следующей группе показателей, объединенных в
таблице, показанной на рис. 3.5.
вычисленные по формуле sb j = s 2 ⋅ X T X {( )
−1
} j, j
.
Рис. 3.5. Продолжение результатов работы режима Регрессия
33 34
Столбец Наблюдение – содержит номера наблюдений. Тема 4. НЕЛИНЕЙНАЯ МНОЖЕСТВЕННАЯ
Столбец Предсказанное У – значения yˆi , вычисленные по РЕГРЕССИЯ
построенному уравнению регрессии. Эта тема включает выполнение лабораторной работы, по-
Столбец Остатки – значения невязок yi − yˆi священных построению нелинейной множественной регрессии на
В заключении рассмотрения результатов работы режима примере производственная функция Кобба-Дугласа.
Регрессия приведем график невязок (на рисунке 3.6 невязки на-
званы остатками) yi − yˆi при заданных значениях только второй Лабораторная работа № 4.1.
переменной. Наличие чередующихся положительных и отрица- Вычисление коэффициентов нелинейной множественной
регрессии для производственная функция Кобба-Дугласа
тельных значений невязок является косвенным признаком от-
сутствия систематической ошибки (неучтенной независимой
Цель работы. Используя пространственную выборку таб-
переменной) в построенном уравнении регрессии.
лицы 4.1 и команду Поиск решения, построить нелинейную
множественную регрессию для производственная функция Коб-
ба-Дугласа.
Таблица 4.2
Q 657 1200 2427 4257 8095 9849
L 162 245 452 714 1083 1564
K 279 1167 3069 5585 9119 13989
35 36
⎡ n 2⎤ 6
⎢⎣ i =1
(
min ⎢ ∑ Qi − B ⋅ Kib1 ⋅ Lbi 2 ) ⎥
⎥⎦
(4.2) F ( B, b1 , b2 ) = ∑ (Qi − Qˆ i ) 2 .
i =1
(4.4)
БИБЛИОГРАФИЧЕСКИЙ СПИСОК