Вы находитесь на странице: 1из 103

«Эконометрика-2»

Код и наименование направления подготовки (специальности) 38.03.01


Экономика
Профиль
Экономика и управление инновациями
Форма обучения очно-заочная

Перечень вопросов к экзамену


2019/2010 учебный год
1. Предмет и задачи эконометрического моделирования.
Классификация моделей.

Эконометрика — наука, изучающая количественные и качественные


экономические взаимосвязи с помощью математических и статистических методов и
моделей. Определение предмета эконометрики было выработано в уставе
Эконометрического общества (основано в 1930 г.), который в качестве главных целей
выдвигает использование статистики и математики для развития экономической теории.
Эконометрика может рассматриваться как наука, состоящая из двух разделов:
теоретическая эконометрика и прикладная эконометрика. Теоретическая эконометрика
изучает статистические свойства оценок и проверки гипотез, в то время как прикладная
эконометрика занимается применением эконометрических методов для оценки тех или
иных положений экономической теории. Эконометрика дает инструментарий для
экономических измерений, а также методологию оценки параметров моделей микро- и
макроэкономики. Кроме того, эконометрика активно используется для прогнозирования
экономических процессов как в масштабах экономики в целом или отдельных ее отраслей,
так и на уровне предприятий. При этом эконометрика является частью экономической
теории, наряду с макро- и микроэкономикой. Цель эконометрики– разработка способов
моделирования и количественного анализа реальных экономических объектов
Задачи эконометрики
1. Спецификация модели (построение эконометрических моделей для
эмпирического анализа)
2. Параметризация модели (оценка параметров модели)
3. Верификация модели (оценка качества модели – адекватности и точности)
4. Прогнозирование (составление прогноза и рекомендаций для конкретного
экономического явления по результатам эконометрического моделирования)
Термин «эконометрика» состоит из двух частей: «эконо» — от слова «экономика»
и «метрика» — от слова «измерение». Эконометрика – это самостоятельная научная
дисциплина, объединяющая совокупность теоретических результатов, приемов, методов и
моделей, предназначенных для того, чтобы на базе экономической теории, экономической
статистики и математико-статистического инструментария придавать конкретное
количественное выражение общим (качественным) закономерностям, обусловленным
экономической теорией.
Основой механизма эконометрического моделирования является
эконометрическая модель. Экономический объект в такой модели описывается и
изучается с помощью эмпирических (статистических) данных. Эконометрическая модель
учитывает реальные условия существования объекта и не противоречит общим законам
экономики. Ошибка предсказаний по такой модели не превосходит заданной величины.
Задачи эконометрического моделирования
1. Определить объяснённую часть, пользуясь экспериментальными данными.
2. Получить оценки параметров случайной составляющей, рассматривая её как случайную
величину
Эконометрическая модель является главным инструментом эконометрики и
предназначена для анализа и прогноза экономических явлений и объектов. В связи с этим
все эконометрические модели условно делят на три класса:
1. Регрессионные модели с одним уравнением (модель цены от объёма поставки;
модель зависимости объёма производства от производственных факторов).
2. Системы одновременных уравнений (модель спроса и предложения, Кейнсианская
модель формирования доходов).
3. Модели временных рядов(модели, описывающие зависимость результативного
признака от времени).
2. Этапы эконометрического моделирования.

Основой механизма эконометрического моделирования является эконометрическая


модель. Эконометрическая модель является главным инструментом эконометрики и
предназначена для анализа и прогноза экономических явлений и объектов.
Экономический объект в такой модели описывается и изучается с помощью эмпирических
(статистических) данных. Эконометрическая модель учитывает реальные условия
существования объекта и не противоречит общим законам экономики.

Эконометрическая модель каждого класса направлена на объяснение значений


текущих эндогенных переменных в зависимости от значений предопределенных
переменных.
Точность моделирования зависит в том числе и от объема совокупности (выборки).
В связи с этим количество значений переменной или объем выборки должен быть в 6 — 7
раз больше количества факторов модели.
Эконометрическое моделирование представляет собой комплексное решение
целого ряда задач, поэтому весь процесс разделен на этапы. Такое разделение условно,
однако позволяет понять сущность действий эконометриста.

Этапы эконометрического моделирования


1. Постановочный. Формулируется цель исследования (анализ, прогноз,
управленческое решение), определяются экономические переменные модели).
2. Априорный. Анализируется изучаемое явление, формируется и формализуется
информация известная до начала исследования.
3. Параметризация. Определяется вид модели, выражается в математической
форме взаимосвязь между её переменными, формулируются исходные предпосылки и
ограничения модели.
4. Информационный. Собирается необходимая статистическая информация.
5. Идентификация модели. Проводится статистический анализ модели,
оценивается точность, значимость её параметров и модели в целом.
6. Верификация модели. Оцениваем адекватность модели, т.е. соответствие
реальному экономическому процессу.
Цели эконометрического моделирования:
1) прогноз экономических и социально-экономических показателей, характеризующих
состояние и развитие анализируемой системы;
2) имитацию различных возможных сценариев социально-экономического развития
анализируемой системы (многовариантные сценарные расчеты, ситуационное
моделирование).
3. Свойства экономической системы, учитываемые в
эконометрических моделях.

Специфика экономических данных.

1. Многие экономические показатели неотрицательны. Значит, их надо


описывать неотрицательными случайными величинами.

В экономике доля нечисловых данных существенно выше, чем в технике и,


соответственно больше применений для статистики объектов нечисловой природы.
3. Количество изучаемых объектов в экономическом исследовании часто
ограничено в принципе, поэтому обоснование вероятностных моделей в ряде случаев
затруднено.
4. Экономические процессы развиваются во времени, поэтому большое место в
эконометрике занимают вопросы анализа и прогнозирования временных рядов, в том
числе многомерных.
 последовательные по времени уровни временных рядов являются
взаимозависимыми, особенно это относится к близко расположенным наблюдениям;
 в зависимости от момента наблюдения уровни во временных рядах
обладают разной информативностью: информационная ценность наблюдений
убывает по мере их удаления от текущего момента времени;
 с увеличением количества уровней временного ряда точность
статистических характеристик не будет увеличиваться пропорционально числу
наблюдений, а при появлении новых закономерностей развития она может даже
уменьшаться.

В любой эконометрической модели, в зависимости от конечных прикладных целей


ее использования все участвующие в ней переменные подразделяются на:
- экзогенные переменные, задаваемые как бы извне, автономно, в
определенной степени управляемые (планируемые);
- эндогенные переменные, значения которых формируются в процессе и
внутри функционирования анализируемой социально-экономической системы под
воздействием экзогенных переменных и во взаимодействии друг с другом, являются
предметом объяснения в эконометрической модели;
- предопределенные переменные выступают в роли факторов-аргументов или
объясняющих переменных;
- лаговые эндогенные переменные входят в уравнения анализируемой
эконометрической системы, но измерены в прошлые моменты, а, следовательно, являются
уже известными, заданными.
4. Сферы применения эконометрического моделирования в
экономическом анализе.

В рамках экономического анализа, как правило, выдвигаются какие-либо гипотезы,


строятся теории, объясняющие явление или процесс. Узкое место заключается в
подтверждении теоретических гипотез фактическими данными. Поэтому в
количественном экономическом анализе главную роль играет формирование гипотезы и
ее проверка. Интуитивные утверждения должны приобрести форму предположений,
которые могут быть либо приняты, либо отвергнуты после сопоставления с
наблюдаемыми фактами.
Области применения эконометрических моделей напрямую связаны с целями
эконометрического моделирования, основными из которых являются:
1) прогноз экономических и социально-экономических показателей,
характеризующих состояние и развитие анализируемой системы;
2) имитация различных возможных сценариев социально-экономического
развития анализируемой системы.
В качестве анализируемой экономической системы могут выступать страна в
целом (макроэкономические системы), регионы, отрасли и корпорации (мезосистемы), а
также предприятия, фирмы и домохозяйства (микроэкономические системы).
Кроме того, исследователь должен сформулировать профиль эконометрического
моделирования, которое может быть сконцентрировано на проблемах финансового рынка,
инвестиционных и социальных проблемах, или же на целом комплексе проблем
одновременно. Понятно, что, чем конкретнее сформулирован профиль исследования, тем
более эффективны его результаты.
Например, исследователь изучает проблемы доходов домохозяйств страны.
Целесообразнее было бы разделить эту большую задачу на исследование доходов
городских и сельских домохозяйств, так как механизм их формирования существенно
различен. Эконометрические модели, построенные отдельно для городских и сельских
домохозяйств, будут гораздо более адекватны действительности, чем общая модель.
5. Проверка значимости регрессионной модели и ее
параметров

В линейной регрессии обычно оценивается значимость не только уравнения в


целом, но и отдельных его параметров. С этой целью по каждому из параметров
определяется его стандартная ошибка: тb и та.
Стандартная ошибка коэффициента регрессии параметра b рассчитывается по
формуле:
∑ ( y− ^y x )2 /(n−2)=
m b=
√ ∑ (x−x́)2
S2

∑ (x −x́)2
Где S2−¿ остаточная дисперсия на одну степень свободы.
Отношение коэффициента регрессии к его стандартной ошибке дает t-статистику,
которая подчиняется статистике Стьюдента при (n−2) степенях свободы. Эта статистика
применяется для проверки статистической значимости коэффициента регрессии и для
расчета его доверительных интервалов.
Для оценки значимости коэффициента регрессии его величину сравнивают с его
стандартной ошибкой, т.е. определяют фактическое значение t-критерия Стьюдента:
b
t b= , которое затем сравнивают с табличным значением при определенном уровне
mb
значимости α и числе степеней свободы (n−2).
Справедливо равенство t 2b=F
Доверительный интервал для коэффициента регрессии определяется как b ± t ∙ m b
. Стандартная ошибка параметра а определяется по формуле

∑ ( y − ^y x )2 ∙ ∑ x2 = ∑ x2
m a=
√ n−2 n ∙ ∑ ( x−x́ )2 √ 2
s ∙
n ∙ ∑ ( x−x́ )2

Процедура оценивания значимости данного параметра не отличается от


рассмотренной выше для коэффициента регрессии: вычисляется t-критерий:
a
t a=
ma
Его величина сравнивается с табличным значением при df =n−2 степенях свободы.
Значимость линейного коэффициента корреляции проверяется на основе
величины ошибки коэффициента корреляции mr:

1−r 2
mr =
√ n−2

Фактическое значение t-критерия Стьюдента определяется как


r
t r= ∙ √ n−2
√ 1−r 2
Данная формула свидетельствует, что в парной линейной регрессии t 2r =F, ибо как
r2
уже указывалось, F= 2
∙(n−2). Кроме того, t 2b=F, следовательно, t 2r =t 2b.
1−r
Таким образом, проверка гипотез о значимости коэффициентов регрессии и
корреляции равносильна проверке гипотезы о значимости линейного уравнения
регрессии.
Рассмотренную формулу оценки коэффициента корреляции рекомендуется
применять при большом числе наблюдений, а также если r не близко к +1 или –1.
6. Дисперсионный анализ результатов регрессии.

Центральное место в нем занимает разложение общей суммы квадратов


отклонений переменной у от среднего значения у́ (т. е. дисперсии или вариации y) на две
части — «объясненную» уравнением регрессии и «остаточную» («необъясненную»):

∑ ( y− ý )2=∑ ( ^y x − ý)2 + ∑ ( y− ^y x )2
Общая сумма Сумма квадратов Остаточная сумма
квадратов отклонений, квадратов
отклонений объясненная отклонений
регрессией
Общая сумма квадратов отклонений индивидуальных значений результативного
признака у от среднего значения у́ условно делится на две группы: влияние изучаемого
фактора х и влияние прочих факторов.
Если фактор не оказывает влияния на результат, то линия регрессии на
графике параллельна оси ох и у = у́. Тогда вся дисперсия результативного признака
обусловлена воздействием прочих факторов и общая сумма квадратов отклонений
совпадет с остаточной.
Если же прочие факторы не влияют на результат, то у связан с х
функционально и остаточная сумма квадратов равна нулю. В этом случае сумма квадратов
отклонений, объясненная регрессией, совпадает с общей суммой квадратов.
Поскольку не все точки поля корреляции лежат на линии регрессии, то всегда
имеет место их разброс, как обусловленный влиянием фактора х, т. е. регрессией у по х,
так и вызванный действием прочих причин (необъясненная вариация).
Пригодность линии регрессии для прогноза зависит от того, какая часть общей
вариации признака у приходится на объясненную вариацию. Очевидно, что если сумма
квадратов отклонений, обусловленная регрессией, будет больше остаточной суммы
квадратов, то уравнение регрессии статистически значимо и фактор х оказывает
существенное влияние на результат у. Это равносильно тому, что коэффициент
детерминации r2 будет приближаться к единице.
Любая сумма квадратов отклонений связана с числом степеней свободы df
(degrees of freedom), т.е. с числом свободы независимого варьирования признака. Число
степеней свободы связано с числом единиц совокупности п и с числом определяемых по
ней констант. Применительно к исследуемой проблеме число степеней свободы должно
показать, сколько независимых отклонений из п возможных [ ( y 1 −ý ) , ( y2 − ý ) , ⋯ , ( y n− ý ) ]
требуется для образования данной суммы квадратов.
Для общей суммы квадратов ∑ ( y− ý )2необходимо (n−1) независимых
отклонений, ибо по совокупности из п единиц после расчета среднего уровня свободно
варьируют лишь (n−1) число отклонений.
Например, имеем ряд значений у: 1,2, 3, 4, 5. Среднее из них равно 3, и тогда п
отклонений от среднего составят: - 2; - 1; 0; 1; 2.
Поскольку ∑ ( y − ý )=0 , то свободно варьируют лишь четыре отклонения, а пятое
отклонение может быть определено, если четыре предыдущие известны.
Для объясненной или факторной, суммы квадратов ∑ ( ^y x − ý)2 используются
теоретические (расчетные) значения результативного признака ^y x, найденные по линии
регрессии: ^y x =a+b ∙ x . В линейной регрессии сумма квадратов отклонений,
обусловленных линейной регрессией, составит:
∑ ( ^y x − ý)2=b2 ∙ ∑ ( x− x́)2.
Поскольку при заданном объеме наблюдений по х и у факторная сумма квадратов
при линейной регрессии зависит только от одной константы коэффициента регрессии b, то
данная сумма квадратов имеет одну степень свободы.
Отсюда видно, что при заданном наборе переменных у и х расчетное значение ^y x
является функцией лишь одного параметра — коэффициента регрессии. Соответственно и
факторная сумма квадратов отклонений имеет число степеней свободы, равное 1.
Существует равенство между числом степеней свободы общей, факторной и
остаточной суммами квадратов. Число степеней свободы остаточной суммы квадратов
при линейной регрессии составляет (n−2). Итак, имеем два равенства:
1 ¿ ∑ ( y − ý)2=∑ ( ^y x − ý)2 + ∑ ( y− ^y x )2
2) n−1=1+(n−2).
Разделив каждую сумму квадратов на соответствующее ей число степеней
свободы, получим средний квадрат отклонений или дисперсию на одну степень свободы
D.

Dобщ=
∑ ( y− ý )2
n−1
Dфакт =∑ ¿ ¿ ¿

D ост =
∑ ( y− ^y x )2
n−2
Определение дисперсии на одну степень свободы приводит дисперсии к
сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну
степень свободы, получим величину F-отношения, т. е. критерий F.
D
F= факт
Dост
F-статистика используется для проверки нулевой гипотезы об отсутствии связи
признаков H0: Dфакт =Dост
Если нулевая гипотеза Н0 справедлива, то факторная и остаточная дисперсии не
отличаются друг от друга. Если Н0 несправедлива, то факторная дисперсия превышает
остаточную в несколько раз. Английским статистиком Снедекором разработаны таблицы
критических значений F - отношений при разных уровнях значимости нулевой гипотезы и
различном числе степеней свободы. Табличное значение F-критерия - это максимальная
величина отношения дисперсий, которая может иметь место при случайном расхождении
их для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F-
отношения признается достоверным (отличным от единицы), если оно больше
табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и
делается вывод о существенности этой связи:
F факт > Fтабл , Но отклоняется и уравнение регрессии статистически значимо.
Если же величина F окажется меньше табличной, то вероятность нулевой гипотезы
выше заданного уровня (например, 0,05) и она не может быть отклонена без риска сделать
неправильный вывод о наличии связи. В этом случае уравнение регрессии считается
статистически незначимым:
F факт < Fтабл , Ho не отклоняется.

Величина F-критерия связана с коэффициентом детерминации r2:


r2
F= ∙(n−2)
1−r 2
7. Запись уравнения регрессии в матричной форме

где X = (X1, X2, ..., Xm) − вектор независимых (объясняющих) переменных; β −


вектор параметров (подлежащих определению); ε − случайная ошибка (отклонение); Y-
зависимая (объясняемая) переменная.
Теоретическое линейное уравнение регрессии (для индивидуальных наблюдений)

Эмпирическое уравнение регрессии:

Отклонение еi эмпирического значения yi от рассчитанного с пом. МНК значения


yi:

По МНК:
Условие минимума функции - равенство нулю всех ее частных производных по bj.
Частные производные квадратичной функции являются линейными функциями.
Система нормальных уравнений МНК:

Матричная форма:

Y − вектор-столбец размерности n наблюдений зависимой переменной Y;


Х − матрица размерности n × (m + 1), в которой i-я строка (i = 1, 2, … , n)
представляет наблюдение вектора значений независимых переменных X1, X2, …, Xm;
единица соответствует переменной при свободном члене b0;
B − вектор-столбец размерности (m+ 1) параметров уравнения регрессии;
e − вектор-столбец размерности n отклонений выборочных (реальных) значений yi
зависимой переменной Y от значений yi
~(
e = Y – XB β МНК )=( X T X )−1 X T Y
8. Метод наименьших квадратов и его свойства.

Метод наименьших квадратов — один из методов регрессионного анализа для оценки


неизвестных величин по результатам измерений, содержащим случайные ошибки.
При оценивании пар-ров регр.моделей наиболее часто применяется МНК. Его
оценки обладают такими стат. св-вами: несмещенность, состоятельность, эффективность.
Достоинство МНК: простота мат.выводов и вычислит-х процедур.

Пусть имеем выборку из 4-х точек (n=4):

P1 =(x1, y1),P2 =(x2, y2), P3 =(x3, y3), P4 =(x4, y4)

Предполагаем, что существует теоретическая прямая, которая наилучшим образом


проходит через них. Задача: оценить с некоторой точностью, как может проходить эта
прямая

Итак, оценки параметров модели парной регрессии согласно МНК будем искать из
условия: n 2
S=∑
2
ui = ∑ ( yi −
~
a0 − ~
a 1 x i ) ⇒ min
i=1

Задача оценки параметров парной регр.модели МНК сводится к задаче определения


экстремума (минимума) ф-ии 2х аргументов

¿
∂S
=∑ 2 ( y i −~
a 0 −~
a 1 x i ) (−1 )=0
∂~
a0

∂S
= 2 y −~
a −~
a x i −x =0
a 1 ∑ ( i 0 1 )( i )
∂~

Система называется системой нормальных уравнений для вычисления оценок


параметров уравнения парной регрессии. Упростим систему нормальных уравнений.

{n~a0+~a1 ∑ xi=∑ yi ¿¿¿¿


Убеждаемся, что решение системы уравнений будет соответствовать минимуму
функции.
Для этого вычисляем значения вторых частных производных функции

∂2 S
2
x >0
{n~a0+~a1 ∑ xi=∑ yi ¿¿¿¿
∂2 S ∑
=n> 0 = i
a 20
∂~ a 21
∂~

Для решения системы выразим из первого уравнения ã 0, подставим его во второе


уравнение. Получим:

n ∑ x i y i−∑ x i ∑ y i
~
a 1=
( n ∑ x 2i −∑ xi ∑ x i )

Проанализируем выражение. Для этого вычислим COV(x,y) и σ2(x).Получим:

~ Cov( x , y )
a 1= 2
σ ( x)
Проверим выполнение условия несмещенности для оценки. Для этого вычислим

~ Cov( x, u)
a1  a1 
 ( x)
2
числитель выражения .Получаем:

Вычислим дисперсии параметров уравнения регрессии и дисперсию


прогнозирования эндогенной переменной.

С помощью МНК получили

1)Оценки параметров уравнения регрессии, по крайней мере, состоятельными

2)Если случайное возмущение подчиняется нормальному закону распределения,


то оценки параметров модели несмещенные и эффективные

3)Нет необходимости в знании закона распределения случайных возмущений.


9. Классическая модель регрессии, её предпосылки.

Функция f (x 1 , x 2 , ⋯ , x k ), описывающая зависимость условного среднего значения


результативного признака y от заданных значений аргументов, называется функцией
(уравнением) регрессии.
Термин "регрессия" (лат. - "regression" - отступление, возврат к чему-либо) введен
английским психологом и антропологом Ф. Гальтоном и связан только со спецификой
одного из первых конкретных примеров, в котором это понятие было использовано.
Обрабатывая статистические данные в связи с вопросом о наследственности роста,
Ф. Гальтон нашел, что если отцы отклоняются от среднего роста всех отцов на х дюймов,
то их сыновья отклоняются от среднего роста всех сыновей меньше, чем на x дюймов.
Выявленная тенденция была названа «регрессией к среднему состоянию».
В обобщенном виде можно записать следующим образом:
y=f ( x 1 , x 2 , ⋯ , x k ) +¿ ,
где f ( x 1 , x 2 , ⋯ , x k )−¿ детерминированная составляющая, обусловленная влиянием и
изменением факторов x 1 , x 2 , ⋯ , x k ; ε − случайная составляющая, обусловленная
действием случайных неконтролируемых факторов.
Составляющая ε считается случайной величиной, имеющей нормальное
распределение с нулевым математическим ожиданием. В этом случае детерминированная
составляющая f ( x 1 , x 2 , ⋯ , x k ) представляет собой условное математическое ожидание

значения у при данных значениях факторов x 1 ,x 2 ,…, x k , т. е.


f ( x 1 , x 2 , ⋯ , x k )=M ( y |x 1 , x2 , ⋯ , x k )=M ( X).
Т
Здесь
X=( x1 ,x2 ,…, xk )
представляет собой вектор значений входных
переменных, который может рассматриваться как точка в k− мерном пространстве

переменных x 1 ,x 2 ,…, x k , называемом далее факторным пространством.


Задача регрессионного анализа состоит в экспериментальном определении коэффи-
циентов регрессии путем наблюдения за характером изменения входных переменных
x 1 ,x 2 ,…, xk
и выходной переменной у.
Предпосылки
1. Математическое ожидание случайной ошибки в любом наблюдении должно
быть равно нулю, т.е.

2. Дисперсия случайной ошибки должна быть постоянной для всех


наблюдений, т. е.

3. Случайные ошибки должны быть статистически независимы


(некоррелированы) между собой, т.е.

4. Объясняющая переменная xi есть величина неслучайная


При выполнении условий Гаусса-Маркова модель называется классической
нормальной линейной регрессионной моделью. Наряду с условиями Гаусса-Маркова
обычно предполагается, что случайная ошибка распределена нормально
10.Парная линейная регрессия. Проверка значимости
параметров. Расчет доверительных интервалов для
параметров

Проверка значимости параметров (того, что они не равны нулю):


критерий Стьюдента:

где P - значение параметра;


Sp - стандартное отклонение параметра.
Рассчитанное значение сравнивают с табличным при выбранной доверительной
вероятности (0.95) и числе степеней свободы N-k-1, где N-число точек, k-число
переменных в регрессионном уравнении (например, для линейной модели Y=A*X+B
подставляем k=1).
Если вычисленное значение tp выше, чем табличное, то коэффициент регрессии является
значимым
Проверка адекватности регрессионной модели - проверка обоснованности выбора
принятой в соответствии с моделью регрессии взаимосвязи y и x.
коэффициент детерминации:

2∑ ( ~y t − ȳ )2 ∑ e2t
R= =1−
∑ ( y t − ȳ ) 2 ∑ ( y t − ȳ ) 2 .
Справедливость правой части формулы основана на тождестве (Равенство
дисперсионного анализа):

∑ ( yt − ȳ )2=∑ (~yt − ȳ )2+ ∑ ( yt −~y t )2 ,


TSS=ESS+RSS
Общая сумма квадратов отклонения от среднего= сумма квадратов, обусловленных
регрессией+ ост. сумма квадратов
R2=r 2xy (в случае парной линейной регрессии)

2
а) если R =1 , то говорят, что ПЛР полностью отражает зависимость x от y
2
б) если R =0, то делают вывод о том, что информация о значениях переменной x не
влияет на изменение результирующего показателя y:
1) модель абсолютно адекватна,2) следует вывод о непригодности ПЛР
в) чем ближе R2 к 1, тем точнее пр-з
Однако, значение возрастает с ростом числа переменных в регрессии, что не означает
улучшения качества предсказания, и потому вводится скорректированный коэффициент
детерминации
Скорректированный коэффициент детерминации (с учётом степеней свободы):

2 ∑ (~y t − ȳ )2 /m
R̄ = .
∑ ( y t − ȳ )2 / ( T −m−1 )
ESS R SS
R 2= = 1-
TSS TSS
где m – число экзогенных переменных, T – число наблюдений.
По модели регрессии можно осуществить прогноз зависимой переменной вида:
~
y T + K =~
a 0 ( МНК ) + ~
a 1 ( МНК ) x T +K , где k ≥1 – параметр, указывающий на

глубину прогноза,
x
T+ K – планируемое в будущем моменте времени T + k
значение факторной переменной.
Критерий Фишера отражает, насколько хорошо эта модель объясняет общую дисперсию
зависимой переменной:

где R - коэффициент корреляции; f1 и f2 - число степеней свободы.


Число степеней свободы объясненной дисперсии f1 равно количеству объясняющих
переменных (например, для линейной модели вида Y=A*X+B получаем f1=1). Число
степеней свободы необъясненной дисперсии f2 = N-k-1, где N-количество
экспериментальных точек, k-количество объясняющих переменных (например, для
модели Y=A*X+B подставляем k=1).
Доверительный интервал для коэффициентов корреляции
Доверительный интервал прогноза переменной может быть представлен в виде

x 2T +K x 2T +K

√ √
~ 1 1
y T + K −t γ ⋅ S ⋅ + T
< y T +K <~
y T +K +t γ ⋅ S ⋅ + T
T 2
T
∑ ( x t − x̄ ) ∑ ( x t − x̄ )2
t=1 t=1

по мере увеличения горизонта прогнозирования (к >>1) увеличивается ширина


доверительного интервала, что соответствует уменьшению точности прогнозируемого
значения.
11.Парная линейная регрессия. Прогноз по уравнению
регрессии

В прогнозных расчетах по уравнению регрессии определяется предсказываемое


( y p ) значение как точечный прогноз ^y x при x p=x k , т. е. путем подстановки в уравнение
регрессии ^y x =a0 +a 1 ∙ x соответствующего значения х. Однако точечный прогноз явно не
реален. Поэтому он дополняется расчетом стандартной ошибки ^y x , т. е m ^y , и
i x

соответственно интервальной оценкой прогнозного значения (у*)


^y x −S ^y ≤ у*≤ ^y x + S ^y .
x i x

Чтобы понять, как строится формула для определения величин


среднеквадратической ошибки ^y x, обратимся к уравнению линейной парной регрессии:
^y x =a0 +a 1 ∙ x.

Известным образом найдем дисперсию модели парной линейной регрессии:


S2^y =S 2a +S 2a ∙ x 2 .
0 1

С учетом выражении (3.24) и (3.25) предварительно запишем:


2 S2e ∙ ∑ x 2i n ∙ S 2e ∙ x 2
S ^y = 2
+ 2
.
n ∙ ∑ x 2i −( ∑ x i ) n ∙ ∑ x 2i −( ∑ x i )
После несложных преобразовании окончательно получим:

2 2
S ^y =S e ∙
∑ x 2i + n∙ x 2 .
2
n ∙ ∑ x 2i −( ∑ x i )
Отсюда перейдем среднеквадратической ошибке модели парной линейной
регрессии:
∑ x 2i +n ∙ x2 =S ∙
x́ 2+ x 2
S ^y =S e ∙
√ 2 e

n ∙ x́ 2−x́ ∙ ∑ x i
n ∙ ∑ x2i −( ∑ x i )
.

Рассмотренная формула среднеквадратическая ошибки предсказываемого среднего


значения y при заданном значении x k характеризует ошибку положения линии регрессии.
Величина стандартной ошибки S ^y , как видно из формулы, достигает минимума при x k =x́
x

, и возрастает по мере того, как «удаляется» от x́ в любом направлении. Иными словами,


чем больше разность между x k и x, тем больше ошибка m ^y с которой предсказывается
x

среднее значение y для заданного значения x k . Можно ожидать наилучшие результаты


прогноза, если признак-фактор х находится в центре области наблюдений х и нельзя
ожидать хороших результатов прогноза при удалении x k от x́. Если же значение x k
оказывается за пределами наблюдаемых значений х, используемых при построении
линейной регрессии, то результаты прогноза ухудшаются в зависимости от того, насколько
x k отклоняется от области наблюдаемых значений фактора x.
12.Нелинейные регрессионные модели. Моделирование произ-
водственных функций.

Соотношения между социально-экономическими явлениями и процессами далеко


не всегда можно выразить линейными функциями, так как при этом могут возникать
неоправданно большие ошибки. В таких случаях используют нелинейную регрессию.
Таким образом, если между экономическими явлениями существуют нелинейные
соотношения, то они выражаются с помощью соответствующих нелинейных функций:
a
например, равносторонней гиперболы y=a0 + 1 + ε, параболы второй степени
x
y=a0 +a1 ∙ x +a 2 ∙ x2 + ε и др.
Нелинейность по параметрам является более серьезной проблемой. Однако если
имеет место показательная, либо степенная зависимость и случайная составляющая
входит в модель мультипликативно, то модель может быть линеаризована посредством
логарифмирования обеих ее частей. Например, функция спроса: y=a·xb·pc·u, где y-объем
потребления товара; x-доход; p-цена; u –случайная составляющая, может быть
преобразована в форму, которая является линейной по параметрам:
ln y= ln a+b·ln x+c·ln p+ln u.
При этом коэффициент при ln x будет непосредственной оценкой b- эластичности
спроса по доходу, коэффициент при ln p будет оценкой c- эластичности спроса по цене.
Производственная функция.
Производственная функция представляет собой математическую модель,
характеризующую зависимость объема выпускаемой продукции от факторов
производства. При этом, модель может быть построена как для отдельной фирмы и
отрасли, так и для всей национальной экономики. Рассмотрим производственную
функцию, включающую два фактора производства: затраты капитала (К) и трудовые
затраты (L), определяющих объем выпуска - Q. Тогда можно записать: Q=f(K,L).
Определенного уровня выпуска можно достигнуть с помощью различного
сочетания капитальных и трудовых затрат. Кривые, описываемые условиями f(K,L)=const,
называют изоквантами. Предполагается, что по мере роста значений одного из факторов,
предельная норма замещения данного фактора производства уменьшается. Поэтому при
сохранении постоянного объема производства, экономия (сокращение) одного вида
затрат, связанная с увеличением затрат другого фактора постепенно уменьшается.
Рассмотрим подробно производственную функцию Кобба-Дугласа, которая для
двух факторов производства имеет вид: Q=A·K·L, где А, ,  -параметры модели.
Величина А зависит от единиц измерения Q, K, L, а также от эффективности
производственного процесса. При фиксированных значениях K и L функции,
характеризующейся большей величиной параметра А, соответствует большее значение Q,
следовательно, и производственный процесс, описываемый такой функцией, более
эффективен.
Параметры  и называют коэффициентами эластичности. Они показывают на
сколько процентов в среднем изменится Q, если  и  увеличить соответственно на 1%.
Можно предположить, что обе величины  и  находятся между нулем и единицей. Они
должны быть положительными, так как увеличение затрат производственных факторов
должно вызвать рост объема выпуска. Скорее всего они будут меньше единицы, так как
разумно предположить, что рост объема выпуска происходит медленнее чем рост
производственных затрат, если другие факторы остаются постоянными.
Эффект от масштаба производства.
Рассмотрим поведение производственной функции при изменении масштабов
производства. Предположим для этого, что затраты каждого фактора производства
увеличились в С раз. Тогда, новое значение будет определяться следующим образом:
Q1=A·(C·K) ·(C·L)=C+·Q.
Если ( + ) > 1, то говорят, что функция имеет возрастающий эффект от
масштабов производства. Это значит, что если К и L увеличиваются в некоторой
пропорции (С раз), то Q растет в большей пропорции (C+ раз, что больше С).
Если ( + )=1, то говорят, что функция имеет постоянный эффект от масштабов
производства. Это значит, что Q увеличивается в той же пропорции, что и К и L.
Если ( + )<1, то говорят, что функция имеет убывающий эффект от масштабов
производства. Это значит, что Q увеличивается в меньшей пропорции, чем К и (т.к. C+
< С).
13.Нелинейные регрессионные модели. Классы моделей.
Выбор наилучшей модели. Линеаризация модели.

Различают два класса нелинейных регрессий: регрессии, нелинейные


относительно включенных в анализ объясняющих переменных, но линейные по
оцениваемым параметрам и • регрессии, нелинейные по оцениваемым параметрам.
Примером нелинейной регрессии по включаемым в нее объясняющим переменным могут
служить следующие функции:
• полином второй степеней− y=a0 +a1 ∙ x +a 2 ∙ x2 + ε ,
• полином третьей - y=a0 +a1 ∙ x +a 2 ∙ x2 +a 3 ∙ x 3+ ε;
b
• равносторонняя гипербола − y=a+ +ε .
x
К нелинейным регрессиям по оцениваемым параметрам относятся функции:
• степенная − y=a0 ∙ x a ∙ ε;1

• показательная − y=a0 ∙a x1 ∙ ε;
• экспоненциальная − y=ea +a x ∙ ε .
0 1

Нелинейная регрессия по включенным переменным не таит каких-либо


сложностей в оценке ее параметров. Она определяется, как и в линейной регрессии,
методом наименьших квадратов (МНК), ибо эти функции линейны по параметрам. Так. в
параболе второй степени
y=α 0 +α 1 ∙ x+ α 2 ∙ x 2 +ε.
заменяя переменные x=x 1, x 2 ¿ x 2, получим двухфакторное уравнение линейной
регрессии:
y=α 0 +α 1 ∙ x+ α 2 ∙ x 2 +ε.
для оценки параметров используется МНК.
Соответственно для полинома третьего порядка
y=α 0 +α 1 ∙ x+ α 2 ∙ x 2 +α 3 ∙ x 3+ ε,
при замене x=x 1, x 2 ¿ x 2 , x 3=x 3 получим трехфакторную модель линейной
регрессии:
y=α 0 +α 1 ∙ x 1+ α 2 ∙ x 2 +α 3 ∙ x3 + ε ,
а для полинома k −¿го порядка
y=α 0 +α 1 ∙ x+ α 2 ∙ x 2 +α 3 ∙ x 3+ ⋯+α k ∙ x k +ε,
получим линейную модель множественной регрессии с k объясняющими
переменными:
y=α 0 +α 1 ∙ x 1+ α 2 ∙ x 2 +α 3 ∙ x3 + ⋯+α k ∙ x k +ε .
Следовательно, полином любого порядка сводится к линейной регрессии с ее
методами оценивания параметров и проверки гипотез. Как показывает опыт большинства
исследователей, среди нелинейной полиномиальной регрессии чаще всего используется
парабола второй степени; в отдельных случаях — полином третьего порядка.
Ограничения в использовании полиномов более высоких степеней связаны с
требованием однородности исследуемой совокупности: чем выше порядок полинома, тем
больше изгибов имеет кривая и соответственно менее однородна совокупность по
результативному признаку.
Парабола второй степени целесообразна к применению, если для определенного
интервала значений фактора меняется характер связи рассматриваемых признаков: прямая
связь меняется на обратную или обратная на прямую. В этом случае определяется
значение фактора, при котором достигается максимальное (или минимальное) значение
результативного признака: приравниваем к нулю первую производную параболы второй
степени:
y^ x ¿ a+ b∙ x +c ∙ x 2, т. е. b+ 2∙ x=0 и x= −b .
2∙ c
Рассмотрим как оценивают параметры в случае равносторонней гиперболы:
b
y i=a+ +ui
xi . Для этого заменим 1/х на z, получим линейное уравнение регрессии:
y i=a+b⋅z i +u i, параметры которого оценивают обычным МНК.
Равносторонняя регрессия может быть использована, например, для
характеристики связи удельных расходов сырья, материалов и топлива с объемом
выпускаемой продукции.

Если же исходные данные не обнаруживают изменения направленности связи, то


параметры параболы второго порядка становятся трудно интерпретируемыми, а форма
связи часто заменяется другими нелинейными моделями.
Применение МНК для оценки параметров параболы второй степени приводит к
следующей системе нормальных уравнений:

∑ y i=n ∙ a0 +a 1 ∙ ∑ x i+ a2 ∙ ∑ x 2i
∑ y i ∙ x i=a0 ∙ ∑ x i +a1 ∙ ∑ x 2i +a2 ∙ ∑ x3i
∑ y i ∙ x 2i =a 0 ∙ ∑ x 2i + a1 ∙ ∑ x 3i + a2 ∙ ∑ x 4i } .

Решают эту систему тем или другим способами получают числовые значения
неизвестных параметров ( a 0 ,a 1 , a2 ).
14.Индекс корреляции и индекс детерминации для
нелинейных регрессионных моделей

Уравнение нелинейной регрессии, так же как и в линейной зависимости,


дополняется показателями корреляции:
n ∑ ( y i − y ' i )2
i=1
1− n

2 *2 2 *2 2
∑ ( y i− y )2
R =δ / ==(1- / )= i=1 ; R=(δ*2/2)1/2,
где  - общая дисперсия результативного признака y;
2

δ*2- объясненная уравнением регрессии y=f(x) дисперсия y;


*2- остаточная (необъясненная уравнением) дисперсия признака y.
Величину R2 (равную отношению объясненной уравнением регрессии дисперсии
результата- y, к общей дисперсии y) для нелинейных связей называют индексом
детерминации, а корень из данной величины - R называют индексом корреляции.
Величина индекса корреляции - R находится в границах от 0 до 1. Чем ближе к
единице, тем теснее связь рассматриваемых признаков, тем более надежно уравнение
регрессии.
Индекс корреляции служит хорошим показателем тесноты связи фактора и
результата в случае нелинейной регрессии 1-ого типа.
В случае нелинейной регрессии 2-ого типа линейный коэффициент корреляции
преобразованных значений переменных дает лишь приближенную оценку тесноты связи
и численно не совпадает с индексом корреляции.
Индекс детерминации служит показателем качества уравнения регрессии. Однако в
случае нелинейной регрессии 2-ого типа его нужно использовать очень осторожно. При
сравнении данной нелинейной регрессии с линейной вывод о форме связи может быть
сделан, если индекс детерминации существенно отличается от коэффициента
детерминации.
15.Регрессионные модели с фиктивными переменными.
Моделирование сезонных влияний на экономические
переменные.

Термин “фиктивные переменные” используется как противоположность


“значащим” переменным, показывающим уровень количественного показателя,
принимающего значения из непрерывного интервала. Как правило, фиктивная переменная
— это индикаторная переменная, отражающая качественную характеристику. Чаще всего
применяются бинарные фиктивные переменные, принимающие два значения, 0 и 1, в
зависимости от определенного условия. Например, в результате опроса группы людей 0
может означать, что опрашиваемый - мужчина, а 1 - женщина. Могут быть разного рода
атрибутивные признаки, такие, например, как профессия, пол, образование,
климатические условия, принадлежность к определенному региону.
Регрессионная модель, включающая в качестве фактора (факторов) фиктивную
переменную, называется регрессионной моделью с переменной структурой.
Рассмотрим временной ряд Xi j,
где i — это номер сезона (периода времени внутри года, напри мер, месяца или
квартала);
(L — число сезонов в году);

j — номер года, j = 1,m (m — общее количество лет).


Количество уровней исходного ряда равно L × m = n. Число сезонных фиктивных
переменных в регрессионной модели всегда должно быть на единицу меньше сезонов
внутри года, т. е. должно быть равно величине L − 1. При моделировании годовых данных
регрессионная модель, помимо фактора времени, должна содержать одиннадцать
фиктивных компонент (12 − 1).
Каждому из сезонов соответствует определенное сочетание фиктивных
переменных. Сезон, для которого значения всех фиктивных переменных равны нулю,
принимается за базу сравнения. Для остальных сезонов одна из фиктивных переменных
принимает значение, равное единице. Если имеются поквартальные данные, то значения
фиктивных переменных D1, D2, D3 будут принимать следующие значения для каждого из
кварталов

Квартал D2 D3 D4
1 0 0 0
2 1 0 0
3 0 1 0
4 0 0 1

Общий вид регрессионной модели с переменной структурой в данном случае будет


иметь вид:
yt =β0 +β1 ×t+δ2 ×D2 +δ3 ×D3 +δ4 ×D4 +εt
Построенная модель регрессии является разновидностью аддитивной модели
временного ряда. Базисным уравнением исследуемой регрессионной зависимости будет
являться уравнение тренда для первого квартала:
y =β +β ×t+ε
Тогда общий вид модели регрессии с переменной структурой будет иметь вид:
yt=β0+ β1*t+δ2*D2+δ3*D3+δ4*D4+εt.
Данная модель регрессии представляет собой одну из разновидностей аддитивной
модели временного ряда.
На основе общей модели регрессии с переменной структурой можно составить
базисную модель или модель тренда для первого квартала:
yt=β0+ β1*t+εt.
Также на основе общей модели регрессии с переменной структурой можно
составить частные модели регрессии:
1) частная модель регрессии для второго квартала:
yt=β0+ β1*t+δ2+εt;
2) частная модель регрессии для третьего квартала:
yt=β0+ β1*t+δ3+εt;
3) частная модель регрессии для четвёртого квартала:
yt=β0+ β1*t+δ4+εt.
Данные частные модели регрессии отличаются друг от друга только на величину
свободного члена δi.
Коэффициент β1 характеризует среднее абсолютное изменение уровней
временного ряда под влиянием основной тенденции.
Сезонная компонента для каждого сезона рассчитывается как разность между
средним значением свободных членов всех частных моделей регрессий и значением
постоянного члена одной из моделей.
Среднее значение свободных членов всех частных моделей регрессий
рассчитывается по формуле:

Для поквартальных данных оценка сезонных отклонений осуществляется по


формулам:
1) оценка сезонного отклонения для первого квартала:

2) оценка сезонного отклонения для второго квартала:

3) оценка сезонного отклонения для третьего квартала:

4) оценка сезонного отклонения для четвёртого квартала:

Сумма сезонных отклонений должна равняться нулю.


16.Регрессионные модели с фиктивными переменными.
Фиктивные переменные сдвига и фиктивные переменные
наклона

Термин “фиктивные переменные” используется как противоположность


“значащим” переменным, показывающим уровень количественного показателя,
принимающего значения из непрерывного интервала. Как правило, фиктивная переменная
— это индикаторная переменная, отражающая качественную характеристику. В
регрессионных моделях применяются фиктивные переменные двух типов: переменные
сдвига и переменные наклона.
Фиктивная переменная наклона изменяет наклон линии регрессии. При помощи
фиктивных переменных наклона можно построить кусочно-линейные модели, которые
позволяют учесть структурные изменения в экономических процессах (например,
введение новых правовых или налоговых ограничений, изменение политической ситуации
и т. д.). Для учета возможного изменения наклона графика модели при изменении
градации качественного фактора предлагается ввести в спецификацию модели еще одно
слагаемое вида «d умноженное на x».
Спецификация регрессионной модели в этом случае (например, для парной
регрессионной модели, для простоты) имеет вид:

Y t =β 0+ β1 ¿ X t + δ∗d t ¿ X t + ε t , где

dt = 0 – до структурных изменений
1 – после структурных изменений,
dt - бинарная переменная

Фиктивная переменная входит в уравнение в мультипликативной форме. Оценки


параметров рассчитываются с помощью метода наименьших квадратов. Параметр при
фиктивной переменной характеризует степень изменения наклона графика функции
регрессии под воздействием качественного фактора.
17.Регрессионные модели с фиктивными переменными.
Содержательная интерпретация. Тест Чоу для обоснования
необходимости включения фиктивных переменных в
модель

До сих пор в качестве факторов рассматривались экономические переменные,


принимающие количественные значения в некотором интервале. Вместе с тем может
оказаться необходимым включить в модель фактор, имеющий два или более качественных
уровней. Это могут быть разного рода атрибутивные признаки, такие, например, как
профессия, пол, образование, климатические условия, принадлежность к определенному
региону. Чтобы ввести такие переменные в регрессионную модель, им должны быть
присвоены те или иные цифровые метки, т.е. качественные переменные преобразованы в
количественные. Такого вида сконструированные переменные в эконометрике принято
называть фиктивными переменными.
Рассмотрим применение фиктивных переменных для функции спроса.
Предположим, что по группе лиц мужского и женского пола изучается линейная
зависимость потребления кофе от цены. В общем виде для совокупности обследуемых
уравнение регрессии имеет вид:
y  a  bx   ,
где y – количество потребляемого кофе; x – цена.
Аналогичные уравнения могут быть найдены отдельно для лиц мужского пола:
y1  a1  b1 x1  1 и женского пола: y2  a2  b2 x2   2 .
Различия в потреблении кофе проявятся в различии средних
y1 и y2 . Вместе с тем
сила влияния x на y может быть одинаковой, т.е. 1 bb b
2 . В этом случае возможно
построение общего уравнения регрессии с включением в него фактора «пол» в виде

фиктивной переменной. Объединяя уравнения


y1 и
y2 и, вводя фиктивные переменные,
можно прийти к следующему выражению:
y  a1 z1  a2 z2  bx   ,
где
z1 и z2 – фиктивные переменные, принимающие значения:
1  мужской пол, 0  мужской пол,
z1   z2  
0  женский пол; 1  женский пол.
В общем уравнении регрессии зависимая переменная y рассматривается как

функция не только ценыx  z1 , z2 


но и пола . Переменная z рассматривается как
дихотомическая переменная, принимающая всего два значения: 1 и 0. При этом когда
z1  1, то z2  0 , и наоборот.
Для лиц мужского пола, когда
z1  1 и
z2  0 , объединенное уравнение

регрессии составит: y  a1  bx , а для лиц женского пола, когда
z1  0 и
z2  1 :
y  a  bx
2 . Иными словами, различия в потреблении для лиц мужского и женского
пола вызваны различиями свободных членов уравнения регрессии: 1
a  a2 . Параметр b
является общим для всей совокупности лиц, как для мужчин, так и для женщин.

Однако при введении двух фиктивных переменных


z1 и
z2 в модель
y  a1 z1  a2 z2  bx   применение МНК для оценивания параметров 1 и 2
a a
приведет к вырожденной матрице исходных данных, а следовательно, и к невозможности
получения их оценок. Объясняется это тем, что при использовании МНК в данном
уравнении появляется свободный член, т.е. уравнение примет вид
y  A  a1 z1  a2 z2  bx   .
Предполагая при параметре A независимую переменную, равную 1, имеем
следующую матрицу исходных данных:
1 1 0 x1 
1 1 0 x2 
 
1 0 1 x3 
 
1 1 0 x4 
... ... ... ... 
 
 1 0 1 xn  .
В рассматриваемой матрице существует линейная зависимость между первым,
вторым и третьим столбцами: первый равен сумме второго и третьего столбцов. Поэтому
матрица исходных факторов вырождена. Выходом из создавшегося затруднения может
явиться переход к уравнениям
y  A  A1 z1  bx  
или
y  A  A2 z2  bx   ,
т.е. каждое уравнение включает только одну фиктивную переменную
z1 или z2 .
Предположим, что определено уравнение
y  A  A1 z1  bx   ,
z
где 1 принимает значения 1 для мужчин и 0 для женщин.
Теоретические значения размера потребления кофе для мужчин будут получены из
уравнения
y  A  A  bx
1 .
Для женщин соответствующие значения получим из уравнения
y  A  bx
.
Сопоставляя эти результаты, видим, что различия в уровне потребления мужчин и
женщин состоят в различии свободных членов данных уравнений: A – для женщин и
A  A1 – для мужчин.
Теперь качественный фактор принимает только два состояния, которым
соответствуют значения 1 и 0. Если же число градаций качественного признака-фактора
превышает два, то в модель вводится несколько фиктивных переменных, число которых
должно быть меньше числа качественных градаций. Только при соблюдении этого
положения матрица исходных фиктивных переменных не будет линейно зависима и
возможна оценка параметров модели.
Пример. Проанализируем зависимость цены двухкомнатной квартиры от ее
полезной площади. При этом в модель могут быть введены фиктивные переменные,
отражающие тип дома: «хрущевка», панельный, кирпичный.

При использовании трех категорий домов вводятся две фиктивные переменные:


z1
и
z2 . Пусть переменная
z1 принимает значение 1 для панельного дома и 0 для всех

остальных типов домов; переменная


z2 принимает значение 1 для кирпичных домов и 0

для остальных; тогда переменные


z1 z
и 2 принимают значения 0 для домов типа
«хрущевки».
Предположим, что уравнение регрессии с фиктивными переменными составило:
y  320  500 x  2200 z  1600 z
1 2.
Частные уравнения регрессии для отдельных типов домов, свидетельствуя о
наиболее высоких ценах квартир в панельных домах, будут иметь следующий вид:
 
«хрущевки» – y  320  500 x ; панельные – y  2520  500 x ; кирпичные –
y  1920  500 x
.
z z
Параметры при фиктивных переменных 1 и 2 представляют собой разность
между средним уровнем результативного признака для соответствующей группы и
базовой группы. В рассматриваемом примере за базу сравнения цены взяты дома

«хрущевки», для которых 1


z z 0
2 z
. Параметр при 1 , равный 2200, означает, что
при одной и той же полезной площади квартиры цена ее в панельных домах в среднем на
z
2200 долл. США выше, чем в «хрущевках». Соответственно параметр при 2 показывает,
что в кирпичных домах цена выше в среднем на 1600 долл. при неизменной величине
полезной площади по сравнению с указанным типом домов.
В отдельных случаях может оказаться необходимым введение двух и более групп
фиктивных переменных, т.е. двух и более качественных факторов, каждый из которых
может иметь несколько градаций. Например, при изучении потребления некоторого
товара наряду с факторами, имеющими количественное выражение (цена, доход на одного
члена семьи, цена на взаимозаменяемые товары и др.), учитываются и качественные
факторы. С их помощью оцениваются различия в потреблении отдельных социальных
групп населения, дифференциация в потреблении по полу, национальному составу и др.
При построении такой модели из каждой группы фиктивных переменных следует
исключить по одной переменной. Так, если модель будет включать три социальные
группы, три возрастные категории и ряд экономических переменных, то она примет вид:
y  a  b1s1  b2 s2  b3 z1  b4 z2  b5 x1  b6 x2  ...  bm4 xm   ,
где y – потребление;
Предположим, что на основе собранных данных была построена модель регрессии.
Перед исследователем стоит задача о том, стоит ли вводить в полученную модель
дополнительные фиктивные переменные или базисная модель является оптимальной.
Данная задача решается с помощью метода или теста Чоу. Он применяется в тех
ситуациях, когда основную выборочную совокупность можно разделить на части или
подвыборки. В этом случае можно проверить предположение о большей эффективности
подвыборок по сравнению с общей моделью регрессии.
Будем считать, что общая модель регрессии представляет собой модель регрессии
модель без ограничений. Обозначим данную модель через UN. Отдельными
подвыборками будем считать частные случаи модели регрессии без ограничений.
Обозначим эти частные подвыборки как PR.
Введём следующие обозначения:
PR1 – первая подвыборка;
PR2 – вторая подвыборка;
ESS(PR1 ) – сумма квадратов остатков для первой подвыборки;
ESS(PR2 ) – сумма квадратов остатков для второй подвыборки;
ESS(UN) – сумма квадратов остатков для общей модели регрессии.

– сумма квадратов остатков для наблюдений первой подвыборки в общей модели


регрессии;

– сумма квадратов остатков для наблюдений второй подвыборки в общей модели


регрессии.
Для частных моделей регрессии справедливы следующие неравенства:

Условие (ESS(PR1)+ESS(PR2))= ESS(UN) выполняется только в том случае, если


коэффициенты частных моделей регрессии и коэффициенты общей модели регрессии без
ограничений будут одинаковы, но на практике такое совпадение встречается очень редко.
Основная гипотеза формулируется как утверждение о том, что качество общей модели
регрессии без ограничений лучше качества частных моделей регрессии или подвыборок.
Альтернативная или обратная гипотеза утверждает, что качество общей модели
регрессии без ограничений хуже качества частных моделей регрессии или подвыборок
Данные гипотезы проверяются с помощью F-критерия Фишера-Снедекора.
Наблюдаемое значение F-критерия сравнивают с критическим значением F-критерия,
которое определяется по таблице распределения Фишера-Снедекора.
Критическое значение F-критерия Фишера определяется по таблице распределения
Фишера-Снедекора в зависимости от уровня значимости а и двух степеней свободы
свободы k1=m+1 и k2=n-2m-2.
Наблюдаемое значение F-критерия рассчитывается по формуле:где ESS(UN)–
ESS(PR1)– ESS(PR2) – величина, характеризующая улучшение качества модели регрессии
после разделения её на подвыборки;
m – количество факторных переменных (в том числе фиктивных);
n – объём общей выборочной совокупности.
При проверке выдвинутых гипотез возможны следующие ситуации.
Если наблюдаемое значение F-критерия (вычисленное по выборочным данным) больше
критического значения F-критерия (определённого по таблице распределения Фишера-
Снедекора), т. е. Fнабл>Fкрит, то основная гипотеза отклоняется, и качество частных
моделей регрессии превосходит качество общей модели регрессии.
Если наблюдаемое значение F-критерия (вычисленное по выборочным данным)
меньше или равно критического значения F-критерия (определённого по таблице
распределения Фишера-Снедекора), т.е. Fнабл≤Fкрит, то основная гипотеза принимается,
и разбивать общую регрессию на подвыборки не имеет смысла.
Если осуществляется проверка значимости базисной регрессии или регрессии с
ограничениями (restricted regression), то выдвигается основная гипотеза вида:

Справедливость данной гипотезы проверяется с помощью F-критерия Фишера-


Снедекора.
Критическое значение F-критерия Фишера определяется по таблице распределения
Фишера-Снедекора в зависимости от уровня значимости а и двух степеней свободы
свободы k1=m+1 и k2=n–k–1.
Наблюдаемое значение F-критерия преобразуется к виду:

При проверке выдвинутых гипотез возможны следующие ситуации.


Если наблюдаемое значение F-критерия (вычисленное по выборочным данным) больше
критического значения F-критерия (определённого по таблице распределения Фишера-
Снедекора), т. е. Fнабл›Fкрит, то основная гипотеза отклоняется, и в модель регрессии
необходимо вводить дополнительные фиктивные переменные, потому что качество
модели регрессии с ограничениями выше качества базисной или ограниченной модели
регрессии.
Если наблюдаемое значение F-критерия (вычисленное по выборочным данным)
меньше или равно критического значения F-критерия (определённого по таблице
распределения Фишера-Снедекора), т. е. Fнабл≤Fкрит, то основная гипотеза
принимается, и базисная модель регрессии является удовлетворительной, вводить в
модель дополнительные фиктивные переменные не имеет смысла.
18. Множественная регрессия. Отбор факторов для включения
в модель

Регрессионные модели с более чем одной независимой переменной называются


моделями множественной регрессии. Общий вид записи регрессионной модели с
несколькими объясняющими переменными:

Большинство понятий, введенных для парной линейной регрессии,


распространяется и на множественную регрессию. Однако появляются и некоторые новые
понятия, поскольку для прогноза зависимой переменной используется более одной
независимой переменной. Линейная регрессионная модель с несколькими объясняющими
переменными (Классическая линейная модель множественной регрессии (КЛММР)) –
уравнение вида:

Множественная регрессия широко используется в решении проблем спроса,


доходности акций, изучении функции издержек производства, в макроэкономических
расчетах и целого ряда других вопросов эконометрики.
Многофакторный корреляционный анализ состоит из нескольких этапов: 
определяются факторы, которые оказывают воздействие на изучаемый показатель, и
отбираются наиболее существенные для корреляционного анализа;  собирается и
оценивается исходная информация, необходимая для корреляционного анализа; 
изучается характер и моделируется связь между факторами и результативным
показателем, то есть подбирается и обосновывается математическое уравнение, которое
наиболее точно выражает сущность исследуемой зависимости;
 проводится расчет основных показателей связи корреляционного анализа;
 дается статистическая оценка результатов корреляционного анализа и
практическое их применение.
Отбор факторов для корреляционного анализа является очень важным моментом в
экономическом анализе. От того, насколько правильно он сделан, зависит точность
выводов по итогам анализа. Главная роль при отборе факторов принадлежит теории, а
также практическому опыту анализа.
При этом необходимо придерживаться следующих правил:
 При отборе факторов в первую очередь следует учитывать причинно −
следственные связи между показателями, так, как только они раскрывают сущность
изучаемых явлений. Анализ же таких факторов, которые находятся только в
математических соотношениях с результативным показателем, не имеет практического
смысла.
 При создании многофакторной регрессионной модели необходимо отбирать
самые значимые факторы, которые оказывают решающее воздействие на результативный
показатель, так как охватить все условия и обстоятельства практически невозможно.
Факторы, не существенные по критерию Стьюдента, не рекомендуется принимать в
расчет.
 Все факторы должны быть количественно измеримы, т.е. иметь единицу
измерения, и информация о них должна содержаться в учете и отчетности.
 В регрессионную модель линейного типа не рекомендуется включать факторы,
связь которых с результативным показателем имеет криволинейный характер.
 Не рекомендуется включать в регрессионную модель взаимосвязанные факторы.
Если парный коэффициент корреляции между двумя факторами не меньше 0,7, то по
правилам корреляционного анализа один из них необходимо исключить, иначе это
приведет к искажению результатов анализа.
 Нежелательно включать в регрессионную модель факторы, связь которых с
результативным показателем носит функциональный характер.
– При отборе факторов в регрессионную модель значительную помощь оказывают
аналитические группировки, способ сопоставления параллельных и динамических рядов,
линейные графики. С помощью них можно определить наличие, направление и форму
зависимости между изучаемыми показателями. Отбор факторов можно производить также
в процессе решения задачи корреляционного анализа и на основе оценки их значимости
по критерию Стьюдента.
19. Построение уравнения множественной регрессии.
Множественная и частная корреляция

Включение в уравнение множественной регрессии того или иного набора факторов


связано прежде всего с представлением исследователя о природе взаимосвязи
моделируемого показателя с другими экономическими явлениями. Факторы,
включаемые во множественную регрессию, должны отвечать следующим
требованиям:
1. Они должны быть количественно измеримы. Если необходимо включить в
модель качественный фактор, не имеющий количественного измерения, то ему нужно
придать количественную определенность (например, в модели урожайности качество
почвы задается в виде баллов; в модели стоимости объектов недвижимости учитывается
место нахождения недвижимости: районы могут быть проранжированы).
2. Факторы не должны быть интеркоррелированы и тем более находиться в точной
функциональной связи.
R yx1  Rx1x2
Включение в модель факторов с высокой интеркорреляцией, когда для

зависимости
y  a b x b x 
1 1 2 2 может привести к нежелательным последствиям –
система нормальных уравнений может оказаться плохо обусловленной и повлечь за собой
неустойчивость и ненадежность оценок коэффициентов регрессии.
Если между факторами существует высокая корреляция, то нельзя определить их
изолированное влияние на результативный показатель и параметры уравнения регрессии

оказываются неинтерпретируемыми. Так, в уравнении


y  a  b1 x1  b2 x2  

предполагается, что факторы


x1 и x2 независимы друг от друга, т. е. rx1x2  0 . Тогда
b x
можно говорить, что параметр 1 измеряет силу влияния фактора 1 , на результат y при
x r 1 x
неизменном значении фактора 2 . Если же x1x2 , то с изменением фактора 1 , фактор
x2 не может оставаться неизменным. Отсюда b1 и b2 нельзя интерпретировать как
x x
показатели раздельного влияния 1 и 2 и на y .
Для оценки мультиколлинеарности факторов может использоваться
определитель матрицы парных коэффициентов корреляции между факторами.

Если бы факторы не коррелировали между собой, то матрица парных


коэффициентов корреляции между факторами была бы единичной матрицей, поскольку
r  x  xj
все недиагональные элементы xi x j i были бы равны нулю. Так, для включающего
три объясняющих переменных уравнения

y  a  b1 x1  b2 x2  b3 x3  

матрица коэффициентов корреляции между факторами имела бы определитель, равный единице.


rx1x1 rx2 x1 rx3 x1 1 0 0
Det R  rx1x2 rx2 x2 rx3 x2  0 1 0 1
rx1x3 rx2 x3 rx3x3 0 0 1
.

Если же, наоборот, между факторами существует полная линейная зависимость и все
коэффициенты корреляции равны единице, то определитель такой матрицы равен нулю:

1 1 1
Det R  1 1 1  0
1 1 1
.

Практическая значимость уравнения множественной регрессии оценивается с


помощью показателя множественной корреляции и его квадрата – коэффициента
детерминации.
Показатель множественной корреляции характеризует тесноту связи
рассматриваемого набора факторов с исследуемым признаком, или, иначе, оценивает
тесноту совместного влияния факторов на результат.
Независимо от формы связи показатель множественной корреляции может быть
найден как индекс множественной корреляции:
 ост
2
R yx1x2 ... x p  1 2
y
 2y
где – общая дисперсия результативного признака;
 ост
2
y  f  x1 , x2 ,..., x p 
– остаточная дисперсия для уравнения .
Методика построения индекса множественной корреляции аналогична построению
индекса корреляции для парной зависимости. Границы его изменения те же: от 0 до 1. Чем
ближе его значение к 1, тем теснее связь результативного признака со всем набором
исследуемых факторов. Величина индекса множественной корреляции должна быть
больше или равна максимальному парному индексу корреляции:

R yx1x2 ... x p  max R yxi i  1, p .
Частные коэффициенты (или индексы) корреляции характеризуют тесноту связи
между результатом и соответствующим фактором при устранении влияния других
факторов, включенных в уравнение регрессии.
Показатели частной корреляции представляют собой отношение сокращения
остаточной дисперсии за счет дополнительного включения в анализ нового фактора к
остаточной дисперсии, имевшей место до введения его в модель.

Следовательно, чистое влияние фактора


x2 на результат у можно определить как

2 2
S yx  S yx1 x2
ryx2 x1  1
2
S yx1

Аналогично определяется и чистое влияние на результат фактора


x1 :
2 2
S yx  S yx1 x2
ryx1 x2  2
2
S yx 2
20.Отбор факторов для включения в модель множественной
регрессии. Частная корреляция и частные уравнения
регрессии.

Множественная регрессия имеет вид


Е[Y/ x1, x2….. xm]=f (x1,x2….xm)
Уравнение множественной регрессии:
Y=f(β, X)+ ε
Где (x1,x2….xm)- вектор объясняющих переменных,
β -вектор параметров ( подлежащих определению),
ε – вектор случайных ошибок(отклонений)
Y – зависимая переменная
С формальной точки зрения, объясняющие переменные в линейной
эконометрической модели должны обладать следующими свойствами:
• иметь высокую вариабельность;
• быть сильно коррелированными с объясняемой переменной;
• быть слабо коррелированными между собой;
• быть сильно коррелированными с представляемыми ими другими переменными,
не используемыми в качестве объясняющих.
Объясняющие переменные подбираются с помощью статистических методов.
Процедура подбора переменных состоит из следующих этапов:
1. На основе накопленных знаний составляется множество так называемых
потенциальных объясняющих переменных (первичных переменных), в которое
включаются все важнейшие величины, влияющие на объясняемую переменную. Такие
переменные будем обозначать X 1 , X 2 ,… , X m
2. Собирается статистическая информация о реализациях как объясняемой
переменной, так и потенциальных объясняющих переменных. Формируется вектор у
наблюдаемых значений переменной Y и матрица X наблюдаемых значений переменных
X 1 , X 2 ,… , X m в виде

[ y 1 ¿ ] [ y2 ¿ ] [ ...¿ ] ¿
y=¿ ¿¿
¿
3. Исключаются потенциальные объясняющие переменные, характеризующиеся
слишком низким уровнем вариабельности.
4. Рассчитываются коэффициенты корреляции между всеми рассматриваемыми
переменными.
5. Множество потенциальных объясняющих переменных редуцируется с помощью
выбранной статистической процедуры.
Речь идет о том, чтобы объясняющие переменные хорошо представляли те
переменные, которые не были включены в модель.
Идея метода показателей информационной емкости сводится к выбору таких
объясняющих переменных, которые сильно коррелированы с объясняемой переменной, и
одновременно, слабо коррелированы между собой. В качестве исходных точек этого
метода рассматриваются вектор R0 и матрица R.
Рассматриваются все комбинации потенциальных объясняющих переменных,
общее количество которых составляет I = 2W-1. Для каждой
комбинации потенциальных объясняющих переменных рассчитываются индивидуальные
и интегральные показатели информационной емкости.
Индивидуальные показатели информационной емкости в рамках конкретной
комбинации рассчитываются по формуле
r 2j
hlj = m i
m m
1+ r ; (l=1,2,…,L; j=1,2,… l), где l – номер переменной, l – количество
∑| ij|
i=1
i≠ j
переменных в рассматриваемой комбинации.
Интегральные рассчитываются по формуле
ml
H l=∑ hlj, (l=1,2,…,L). В качестве объясняющих выбирается такая комбинация
j=1
переменных, которой соответствует максимальное значение интегрального показателя и
формационной емкости.
21.Мультиколлинеарность, ее последствия, признаки,
причины появления.

Наибольшие затруднения в использовании аппарата множественной регрессии


возникают при наличии мультиколлинеарности факторных переменных, когда более чем
два фактора связаны между собой линейной зависимостью.
Мультиколлинеарностью для линейной множественной регрессии называется
наличие линейной зависимости между факторными переменными, включёнными в
модель.
Мультиколлинеарность – нарушение одного из основных условий, лежащих в
основе построения линейной модели множественной регрессии.
Мультиколлинеарность в матричном виде – это зависимость между столбцами
матрицы факторных переменных Х:

Если не учитывать единичный вектор, то размерность данной матрицы равна n*n.


Если ранг матрицы Х меньше n, то в модели присутствует полная или строгая
мультиколлинеарность. Но на практике полная мультиколлинеарность почти не
встречается.
Можно сделать вывод, что одной из основных причин присутствия
мультиколлинеарности в модели множественной регрессии является плохая матрица
факторных переменных Х.
Чем сильнее мультиколлинеарность факторных переменных, тем менее надежной
является оценка распределения суммы объясненной вариации по отдельным факторам с
помощью метода наименьших квадратов.
Включение в модель мультиколлинеарных факторов нежелательно по нескольким
причинам:
1) основная гипотеза о незначимости коэффициентов множественной регрессии
может подтвердиться, но сама модель регрессии при проверке с помощью F-критерия
оказывается значимой, что говорит о завышенной величине коэффициента множественной
корреляции;
2) полученные оценки коэффициентов модели множественной регрессии могут
быть неоправданно завышены или иметь неправильные знаки;
3) добавление или исключение из исходных данных одного-двух наблюдений
оказывает сильное влияние на оценки коэффициентов модели;
4) мультиколлинеарные факторы, включённые в модель множественной регрессии,
способны сделать её непригодной для дальнейшего применения.
Конкретных методов обнаружения мультиколлинеарности не существует, а
принято применять ряд эмпирических приёмов. В большинстве случаев множественный
регрессионный анализ начинается с рассмотрения корреляционной матрицы факторных
переменных R или матрицы (ХТХ).
Корреляционной матрицей факторных переменных называется симметричная
относительно главной диагонали матрица линейных коэффициентов парной корреляции
факторных переменных:
где rij – линейный коэффициент парной корреляции между i-м и j-ым факторными
переменными,

На диагонали корреляционной матрицы находятся единицы, потому что


коэффициент корреляции факторной переменной с самой собой равен единице.
При рассмотрении данной матрицы с целью выявления мультиколлинеарных
факторов руководствуются следующими правилами:
1) если в корреляционной матрице факторных переменных присутствуют
коэффициенты парной корреляции по абсолютной величине большие 0,8, то делают
вывод, что в данной модели множественной регрессии существует мультиколлинеарность;
2) вычисляют собственные числа корреляционной матрицы факторных переменных
λmin и λmax. Если λmin‹10-5, то в модели регрессии присутствует мультиколлинеарность.
Если отношение

то также делают вывод о наличии мультиколлинеарных факторных переменных;


3) вычисляют определитель корреляционной матрицы факторных переменных.
Если его величина очень мала, то в модели регрессии присутствует
мультиколлинеарность.
22.Методы устранения мультиколлинеарности в модели
множественной регрессии

Если оцененную модель регрессии предполагается использовать для изучения


экономических связей, то устранение мультиколлинеарных факторов является
обязательным, потому что их наличие в модели может привести к неправильным знакам
коэффициентов регрессии.
При построении прогноза на основе модели регрессии с мультиколлинеарными
факторами необходимо оценивать ситуацию по величине ошибки прогноза. Если её
величина является удовлетворительной, то модель можно использовать, несмотря на
мультиколлинеарность. Если же величина ошибки прогноза большая, то устранение
мультиколлинеарных факторов из модели регрессии является одним из методов
повышения точности прогноза.
К основным способам устранения мультиколлинеарности в модели множественной
регрессии относятся:
1) один из наиболее простых способов устранения мультиколлинеарности состоит
в получении дополнительных данных. Однако на практике в некоторых случаях
реализация данного метода может быть весьма затруднительна;
2) способ преобразования переменных, например, вместо значений всех
переменных, участвующих в модели (и результативной в том числе) можно взять их
логарифмы:
lny=β0+β1lnx1+β2lnx2+ε.
Однако данный способ также не способен гарантировать полного устранения
мультиколлинеарности факторов;
Если рассмотренные способы не помогли устранить мультиколлинеарность
факторов, то  переходят к использованию смещённых методов оценки неизвестных
параметров модели регрессии, или методов исключения переменных из модели
множественной регрессии.
Если ни одну из факторных переменных, включённых в модель множественной
регрессии, исключить нельзя, то применяют один из основных смещённых методов
оценки коэффициентов модели регрессии – гребневую регрессию или ридж (ridge).
При использовании метода гребневой регрессии ко всем диагональным элементам
матрицы (ХТХ) добавляется небольшое число τ: 10-6 ‹ τ ‹ 0.1. Оценивание неизвестных
параметров модели множественной регрессии осуществляется по формуле:

где ln – единичная матрица.


Результатом применения гребневой регрессии является уменьшение стандартных
ошибок коэффициентов модели множественной регрессии по причине их стабилизации к
определённому числу.
Метод главных компонент является одним из основных методов исключения
переменных из модели множественной регрессии.
Данный метод используется для исключения или уменьшения
мультиколлинеарности факторных переменных модели регрессии. Суть метода
заключается в сокращении числа факторных переменных до наиболее существенно
влияющих факторов. Это достигается с помощью линейного преобразования всех
факторных переменных xi (i=0,…,n) в новые переменные, называемые главными
компонентами, т. е. осуществляется переход от матрицы факторных переменных Х к
матрице главных компонент F. При этом выдвигается требование, чтобы выделению
первой главной компоненты соответствовал максимум общей дисперсии всех факторных
переменных xi (i=0,…,n), второй компоненте – максимум оставшейся дисперсии, после
того как влияние первой главной компоненты исключается и т. д.
Метод пошагового включения переменных состоит в выборе из всего
возможного набора факторных переменных именно те, которые оказывают существенное
влияние на результативную переменную.
Метод пошагового включения осуществляется по следующему алгоритму:
1) из всех факторных переменных в модель регрессии включаются те переменные,
которым соответствует наибольший модуль линейного коэффициента парной корреляции
с результативной переменной;
2) при добавлении в модель регрессии новых факторных переменных проверяется
их значимость с помощью F-критерия Фишера. При том выдвигается основная гипотеза о
необоснованности включения факторной переменной xk в модель множественной
регрессии. Обратная гипотеза состоит в утверждении о целесообразности включения
факторной переменной xk в модель множественной регрессии. Критическое значение F-
критерия определяется как Fкрит(a;k1;k2), где а – уровень значимости, k1=1 и k2=n–l –
число степеней свободы, n – объём выборочной совокупности, l – число оцениваемых по
выборке параметров. Наблюдаемое значение F-критерия рассчитывается по формуле:

где q – число уже включённых в модель регрессии факторных переменных.


При проверке основной гипотезы возможны следующие ситуации.
Если наблюдаемое значение F-критерия (вычисленное по выборочным данным)
больше критического значения F-критерия (определённого по таблице распределения
Фишера-Снедекора), т. е. Fнабл›Fкрит, то основная гипотеза о необоснованности
включения факторной переменной xk в модель множественной регрессии отвергается.
Следовательно, включение данной переменной в модель множественной регрессии
является обоснованным.
Если наблюдаемое значение F-критерия (вычисленное по выборочным данным)
меньше или равно критического значения F-критерия (определённого по таблице
распределения Фишера-Снедекора), т. е. Fнабл≤Fкрит, то основная гипотеза о
необоснованности включения факторной переменной xk в модель множественной
регрессии принимается. Следовательно, данную факторную переменную можно не
включать в модель без ущерба для её качества
3) проверка факторных переменных на значимость осуществляется до тех пор, пока
не найдётся хотя бы одна переменная, для которой не выполняется условие Fнабл›Fкрит.
23.Уравнение регрессии в стандартизованном виде. Бета-
коэффициенты. Частные индексы детерминации.

Уравнение регрессии в стандартизованной форме имеет вид:


¿ ¿ ¿ ¿
t ^y =β1⋅t x 1 + β 2⋅t x 2 + . .. β p t xp , ,
¿ ¿ ¿
¿ b1 S X 1 ¿ b 2 S X 2 ¿ b p S Xp
β 1= , β 2= , . .. , β p =
где Sy SY SY - стандартизованные коэффициенты
регрессии.
¿

Стандартизованные коэффициенты регрессии βi отличаются от коэффициентов


¿
bi обычной, естественной формы тем, что их величина не зависит масштаба измерения
объясняемой и объясняющих переменных модели. Кроме того, между ними существует
простая взаимосвязь:
¿ ¿ ¿
¿ β 1 SY ¿ β2 SY ¿ β p SY
b1 = , b 2= , .. . , β p =
SX 1 S X2 S Xp ,
¿

которая дает другой способ вычисления коэффициентов bi по известным


¿

значениям β i , более удобный в случае, например, двухфакторной регрессионной


модели.
Стандартизованные коэффициенты регрессии показывают, на сколько стандартных
отклонений S Y изменится в среднем объясняемая переменная Y, если соответствующая

объясняющая переменная Хi изменится на величину Xi одного ее стандартного


S
отклонения при сохранении неизменным значений среднего уровня всех остальных
факторов.
В силу того, что в стандартизованной регрессии все переменные заданы как

центрированные и нормированные случайные величины, коэффициенты i сравнимы β


между собой. Сравнивая их друг с другом, можно ранжировать соответствующие им
факторы Хi по силе воздействия на объясняемую переменную Y. В этом состоит основное

преимущество стандартизованных коэффициентов регрессии от коэффициентов i b


регрессии в естественной форме, которые несравнимы между собой.
Эта особенность стандартизованных коэффициентов регрессии позволяет
использовать при отсеве наименее значимых факторов Хi с близкими к нулю значениями
¿

их выборочных оценок β i . Решение об исключении их из модельного уравнения


линейной регрессии принимается после проверки статистических гипотез о равенстве
нулю его средней величины.
Практическая значимость эмпирического уравнения множественной регрессии
RYX
оценивается помощью коэффициента множественной корреляции 1 X 2 ... X p или его
2
R YX 1 X 2 . .. X p
квадрата – коэффициента множественной детерминации. Индекс
детерминации характеризует, на сколько процентов построенная модель регрессии
объясняет вариацию значений результативной переменной относительно своего среднего
уровня, т. е. показывает долю общей дисперсии результативной переменной, объяснённой
вариацией факторных переменных, включённых в модель регрессии.
Коэффициент множественной детерминации также называется количественной
характеристикой объяснённой построенной моделью регрессии дисперсии результативной
переменной. Чем больше значение коэффициента множественной детерминации, тем
лучше построенная модель регрессии характеризует взаимосвязь между переменными.
24.Оценка качества регрессионной модели. Проверка гипотез о
значимости параметров.

Проверкой статистической гипотезы о значимости отдельных параметров


модели называется проверка предположения о том, что данные параметры значимо
отличаются от нуля.
Необходимость проверки гипотез о значимости параметров модели вызвана тем,
что в дальнейшем построенную модель будут использовать для дальнейших
экономических расчётов.
Предположим, что по данным выборочной совокупности была построена линейная
модель парной регрессии. Задача состоит в проверке значимости оценок неизвестных
коэффициентов модели, полученных методом наименьших квадратов.
Основная гипотеза состоит в предположении о незначимости коэффициентов
регрессии, т. е.
Н0:β0=0, или Н0:β1=0.
Обратная или конкурирующая гипотеза состоит в предположении о значимости
коэффициентов регрессии, т.е.
Н1:β0≠0, или Н1:β1≠0.
Данные гипотезы проверяются с помощью t-критерия Стьюдента.
Наблюдаемое значение t-критерия (вычисленное на основе выборочных данных)
сравнивают со значением t-критерия, которое определяется по таблице распределения
Стьюдента и называется критическим.
Критическое значение t-критерия зависит от уровня значимости и числа степеней
свободы.
Уровнем значимостиа называется величина, которая рассчитывается по формуле:
а=1-γ,
где γ – это доверительная вероятность попадания оцениваемого параметра в
доверительный интервал. Значение доверительной вероятности должно быть близким к
единице, например, 0.95, 0.99. Следовательно, уровень значимости а можно определить
как вероятность того, что оцениваемый параметр не попадёт в доверительный интервал.
Числом степеней свободы называется показатель, который рассчитывается как
разность между объёмом выборочной совокупности n и числом оцениваемых параметров
по данной выборке h. Для линейной модели парной регрессии число степеней свободы
рассчитывается как (n-2), потому что по данным выборочной совокупности оцениваются
только два параметра – β0 и β1.
Таким образом, критическое значение t-критерия Стьюдента определяется как
tкрит(а;n-h).
При проверке основной гипотезы вида Н0:β1=0 наблюдаемое значение t-критерия
Стьюдента рассчитывается по формуле:

где – оценка параметра модели регрессии β1;


ω(β1) – величина стандартной ошибки параметра модели регрессии β1.
Показатель стандартной ошибки параметра модели регрессии β1 для линейной
модели парной регрессии рассчитывается по формуле:
Числитель стандартной ошибки может быть рассчитан через парный коэффициент
детерминации следующим образом:

где G2(y) – общая дисперсия зависимой переменной;


r2yx – парный коэффициент детерминации между зависимой и независимой
переменными.
При проверке основной гипотезы β0=0 наблюдаемое значение t-критерия
Стьюдента рассчитывается по формуле:

где

– оценка параметра модели регрессии β0;


ω(β0) – величина стандартной ошибки параметра модели регрессии β0.
Показатель стандартной ошибки параметра β0 модели регрессии для линейной
модели парной регрессии рассчитывается по формуле:

При проверке основных гипотез возможны следующие ситуации:


Если наблюдаемое значение t-критерия (вычисленное по выборочным данным) по
модулю больше критического значения t-критерия (определённого по таблице
распределения Стьюдента), т. е. |tнабл|›tкрит, то с вероятностью (1-а) или γ основная
гипотеза о незначимости параметров модели регрессии отвергается.
Если наблюдаемое значение t-критерия (вычисленное по выборочным данным) по
модулю меньше или равно критического значения t-критерия (определённого по таблице
распределения Стьюдента), т. е. |tнабл|≤tкрит, то с вероятностью а или (1-γ) основная
гипотеза о незначимости параметров модели регрессии принимается.
25.Уравнение регрессии в стандартизованном масштабе. Бета-
и дельта – коэффициенты. Коэффициенты эластичности

Помимо классического метода наименьших квадратов для определения


неизвестных параметров линейной модели множественной регрессии β0…βm
используется метод оценки данных параметров через β-коэффициенты (коэффициенты
модели регрессии в стандартных масштабах).
Построение модели множественной регрессии в стандартизированном или
нормированном масштабе означает, что все переменные, включенные в модель регрессии,
стандартизируются с помощью специальных формул.
Посредством процесса стандартизации точкой отсчёта для каждой нормированной
переменной устанавливается её среднее значение по выборочной совокупности. При этом
в качестве единицы измерения стандартизированной переменной принимается её
среднеквадратическое отклонение σ.
Факторная переменная х переводится в стандартизированный масштаб по формуле:

где xij – значение переменной xjв i-том наблюдении;


G(xj) – среднеквадратическое отклонение факторной переменной xi;

Результативная переменная у переводится в стандартизированный масштаб по


формуле:

где G(y) – среднеквадратическое отклонение результативной переменной у.


Если между исследуемыми переменными в исходном масштабе является линейной,
то процесс стандартизации не нарушает этой связи, поэтому стандартизированные
переменные будут связаны между собой линейно:

Неизвестные коэффициенты данной функции можно определить с помощью


классического метода наименьших квадратов для линейной модели множественной
регрессии. В этом случае минимизируется функционал F вида:

В результате минимизации данного функционала получим систему нормальных


уравнений, переменными в которой будут являться парные коэффициенты корреляции
между факторными и результативной переменной. Такой подход основывается на
следующем равенстве:
Система нормальных уравнений для стандартизированной модели множественной
регрессии имеет вид:

В связи с тем, что полученная система нормальных уравнений является квадратной


(количество уравнений равняется количеству неизвестных переменных), то оценки
коэффициентов

можно рассчитать с помощью метода Крамера, метода Гаусса или метода


обратных матриц.
Рассчитанные из системы нормальных уравнений β-коэффициенты в
стандартизированном масштабе необходимо перевести в масштаб исходных данных по
формулам:

Рассмотрим метод Гаусса решения квадратных систем линейных уравнений. Суть


данного метода заключается в том, что исходная квадратная система из n линейных
уравнений с n неизвестными переменными преобразовывают к треугольному виду. Для
этого в одном и уавнений системы оставляют все неизвестные переменные. В другом
уравнении сокращают одну из неизвестных переменных для того, чтобы число
неизвестных стало (n-1). В следующем уравнении сокращают две неизвестных
переменных, чтобы число переменных стало (n-2). В результате данных преобразований
исходная система уравнений примет треугольный вид, первое уравнение которой
содержит все неизвестные, а последнее – только одну. В последнем уравнении системы
остаётся (n-(n-1)) неизвестных переменных, т. е. одна неизвестная переменная, которая
называется базисной. Дальнейшее решение сводится к выражению свободных (n-1)
неизвестных переменных через базисную переменную и получению общего решения
квадратной системы линейных уравнений.
Коэффициент частной эластичности рассчитывается по формуле:

где

– среднее значение факторной переменной xi по выборочной совокупности,

– среднее значение результативной переменной у по выборочной совокупности;


26.Проблема гетероскедастичности остатков регрессионной
модели. Тесты для выявления гетероскедастичности
остатков

Гетероскедастичность - ситуация, когда дисперсия ошибки в уравнении регрессии


изменяется от наблюдения к наблюдению. В этом случае приходится подвергать
определенной модификации МНК (иначе возможны ошибочные выводы). Для
обнаружения гетероскедастичности обычно используют 3 теста: тест ранговой
корреляции Спирмена, тест Голдфеда - Квандта и тест Глейзера Доугерти.
Гетероскедастичность случайных возмущений – возмущения обладают различными
дисперсиями r2i=r2wi, но не коррелированны друг с другом.
Причина: При гетероскедастичности распределение u для каждого наблюдения имеет
нормальное распределение и нулевое ожидание, но дисперсия распределений различна.
Последствия нарушения условия гомоскедастичности случайных возмущений:
1. Потеря эффективности оценок коэффициентов регрессии, т.е. можно найти
другие, отличные от Метода Наименьших Квадратов и более эффективные оценки
2. Смещенность стандартных ошибок коэффициентов в связи с некорректностью
процедур их оценки
Случайной ошибкой называется отклонение в линейной модели множественной
регрессии:
εi=yi–β0–β1x1i–…–βmxmi
В связи с тем, что величина случайной ошибки модели регрессии является неизвестной
величиной, рассчитывается выборочная оценка случайной ошибки модели регрессии по
формуле:

где ei – остатки модели регрессии.


Термин гетероскедастичность в широком смысле понимается как предположение о
дисперсии случайных ошибок модели регрессии.
При построении нормальной линейной модели регрессии учитываются следующие
условия, касающиеся случайной ошибки модели регрессии:
6) математическое ожидание случайной ошибки модели регрессии равно нулю во всех
наблюдениях:

7) дисперсия случайной ошибки модели регрессии постоянна для всех наблюдений:

8) между значениями случайных ошибок модели регрессии в любых двух наблюдениях


отсутствует систематическая взаимосвязь, т. е. случайные ошибки модели регрессии не
коррелированны между собой (ковариация случайных ошибок любых двух разных
наблюдений равна нулю):

Второе условие

означает гомоскедастичность (homoscedasticity – однородный разброс) дисперсий


случайных ошибок модели регрессии.
Под гомоскедастичностью понимается предположение о том, что дисперсия
случайной ошибки βi является известной постоянной величиной для всех наблюдений.
Но на практике предположение о гомоскедастичности случайной ошибки βi или
остатков модели регрессии ei выполняется не всегда.
Под гетероскедастичностью (heteroscedasticity – неоднородный разброс) понимается
предположение о том, что дисперсии случайных ошибок являются разными величинами
для всех наблюдений, что означает нарушение второго условия нормальной линейной
модели множественной регрессии:

Гетероскедастичность можно записать через ковариационную матрицу случайных


ошибок модели регрессии:

Тогда можно утверждать, что случайная ошибка модели регрессии βi подчиняется


нормальному закону распределения с нулевым математическим ожиданием и дисперсией
G2Ω:
εi~N(0; G2Ω),
где Ω – матрица ковариаций случайной ошибки.
Если дисперсии случайных ошибок

модели регрессии известны заранее, то проблема гетероскедастичности легко


устраняется. Однако в большинстве случаев неизвестными являются не только дисперсии
случайных ошибок, но и сама функция регрессионной зависимости y=f(x), которую
предстоит построить и оценить.
Для обнаружения гетероскедастичности остатков модели регрессии необходимо
провести их анализ. При этом проверяются следующие гипотезы.
Основная гипотеза H0 предполагает постоянство дисперсий случайных ошибок модели
регрессии, т. е. присутствие в модели условия гомоскедастичности:
Альтернативная гипотеза H1 предполагает непостоянство дисперсиий случайных
ошибок в различных наблюдениях, т. е. присутствие в модели условия
гетероскедастичности:

Гетероскедастичность остатков модели регрессии может привести к негативным


последствиям:
1) оценки неизвестных коэффициентов нормальной линейной модели регрессии
являются несмещёнными и состоятельными, но при этом теряется свойство
эффективности;
2) существует большая вероятность того, что оценки стандартных ошибок
коэффициентов модели регрессии будут рассчитаны неверно, что конечном итоге может
привести к утверждению неверной гипотезы о значимости коэффициентов регрессии и
значимости модели регрессии в целом.
27.Экономические причины гетероскедастичности и её
последствия. Обобщённый метод наименьших квадратов.
Причины гетероскедастичности.
Неоднородность исследуемых объектов (например, если исследуется зависимость
спроса от дохода потребителя, то обнаруживается, что чем больше доход, тем больше
индивидуальное значение спроса колеблется относительно ожидаемого значения).
Характер наблюдений (например, временной ряд)
Обобщенный метод наименьших квадратов
При наличии гетероскедастичности в остатках рекомендуется традиционный
метод наименьших квадратов (МНК) заменять обобщенным методом наименьших
квадратов (ОМНК).
Будем предполагать, что среднее значение остаточных величин равно нулю.
А вот дисперсия их не остается неизменной для различных значений фактора, а

пропорциональна некоторой величине


Ki , т.е.
2 2
σ εi =σ ¿ K i
,
2
σ εi
где - дисперсия ошибки на конкретном (i – ом) значении фактора;
2
σ
- постоянная дисперсия ошибки при соблюдении предпосылки о
гомоскедастичности остатков;
Ki
- коэффициент пропорциональности, меняющийся с изменением
величины фактора, что и обуславливает неоднородность дисперсии.
2
При этом полагается, что величина σ неизвестна, а в отношении

величины i Kвыдвигаются определенные гипотезы, характеризующие структуру


гетероскедастичности.
В общем виде уравнение регрессии примет вид
yi α x
= + β i + εi
√Ki √ Ki √K i
.
Исходные данные для этого уравнения будут иметь вид:
y1 x1
√ K1 √ K1
y2 x2
y=| √ K |, x=| √ K |
2 2
… …
yn xn
√ Kn. √ Kn
По отношению к обычной регрессии уравнение с новыми,
преобразованными переменными представляет собой взвешенную регрессию, в которой
1
переменные x и y взяты с весами √K .
Оценка параметров нового уравнения с преобразованными переменными
приводит к взвешенному методу наименьших квадратов, для которого необходимо
минимизировать сумму квадратов отклонений вида
n
1
S=∑ ⋅( yi −a−b⋅xi ) 2 →min
i=1 Ki .
28.Обобщённая модель регрессии с гетероскедастичными
остатками.

При наличии гетероскедастичности целесообразно использовать обобщенный


метод наименьших квадратов (ОМНК). Фактически при этом корректируется модель,
изменяются ее спецификации, преобразуются исходные данные для обеспечения
несмещенности, эффективности и состоятельности оценок коэффициентов регрессии.
Предполагается, что среднее остатков равно нулю, но дисперсия уже не является
постоянной, а пропорционально величинам Ki, где величины представляют собой
коэффициенты пропорциональности, различные для различных значений фактора х.
Таким образом, именно эти коэффициенты характеризуют неоднородность дисперсии.
Исходная модель после введения этих коэффициентов в уравнение множественной
регрессии продолжает оставаться гетероскедастичной (точнее таковыми являются
остаточные величины (остатки) модели). Пусть эти остаточные величины не являются
автокоррелированными. Часто считают, что эти остатки просто пропорциональны
значениям фактора. Наиболее простой вид модель принимает, когда принимается гипотеза
о том, что ошибки пропорциональны значениям последнего по порядку фактора. Введем
новые переменные, получающиеся делением исходных переменных модели,
зафиксированные в результате i- наблюдения, на корень квадратный из коэффициентов
пропорциональности Ki. Тогда получаем новое уравнение в преобразованных
переменных, в котором уже остатки гомоскедастичны. Сами новые переменные – это
взвешенные старые (исходные) переменные.
29. Проблема автокорреляции остатков регрессионной модели.
Выявление автокорреляции остатков

Автокорреляцией называется корреляция, возникающая между уровнями


изучаемой переменной. Это корреляция, проявляющаяся во времени. Наличие
автокорреляции чаще всего характерно для данных, представленных в виде временных
рядов.
Автокорреляцией остатков модели регрессииei (или случайных ошибок
регрессии модели βi) называется корреляционная зависимость между настоящими и
прошлыми значениями остатков.
Временным лагом называется величина сдвига между рядами остатков модели
регрессии.
Величина временного лага определяет порядок коэффициента автокорреляции.
Например, если между остатками en и en-1 существует корреляционная зависимость, то
временной лаг равен единице. Следовательно, данную корреляционную зависимость
можно охарактеризовать с помощью коэффициента автокорреляции первого порядка
между рядами остатков e1…en-1 и e2…en.
Одно из условий, которое учитывается при построении нормальной линейной
модели регрессии, заключается в некоррелированности случайных ошибок модели
регрессии, т. е. ковариация случайных ошибок любых двух разных наблюдений равна
нулю:

Если в модели регрессии случайные ошибки коррелированны между собой, то


данное условие нарушается.
Последствия, к которым может привести наличие в модели регрессии
автокорреляции остатков, совпадают с последствиями, к которым может привести
наличие в модели регрессии гетероскедастичности:
1) оценки неизвестных коэффициентов нормальной линейной модели регрессии
являются несмещёнными и состоятельными, но при этом теряется свойство
эффективности;
2) существует большая вероятность того, что оценки стандартных ошибок
коэффициентов модели регрессии будут рассчитаны неверно, что конечном итоге может
привести к утверждению неверной гипотезы о значимости коэффициентов регрессии и
значимости модели регрессии в целом.
Наиболее наглядным способом обнаружения автокорреляции случайных остатков
регрессионной модели является графический метод. При этом осуществляется построение
графиков автокорреляционной и частной автокорреляционной функций.
Автокорреляционной функцией называется функция оценки коэффициента
автокорреляции в зависимости от величины временного лага между исследуемыми
рядами.
Графически автокорреляционная функция изображается с помощью
коррелограммы. Коррелограмма отражает численно и графически коэффициенты
автокорреляции и их стандартные ошибки для последовательности лагов из
определённого диапазона (например, от 1 до 25). При этом по оси Х откладываются
значения τ (тау) – величины сдвига между рядами остатков, которые совпадают с
порядком автокорреляционного коэффициента. Также на коррелограмме отмечается
диапазон в размере двух стандартных ошибок коэффициентов автокорреляции на каждом
лаге.
Частная автокорреляционная функция является более углублённой версией
обычной автокорреляционной функции. Её отличительной особенностью является
исключение корреляционной зависимости между наблюдениями внутри лагов, т. е.
частная автокорреляционная функция на каждом лаге отличается от обычной
автокорреляционной функции на величину удалённых автокорреляций с меньшими
временными лагами. Следовательно, частная автокорреляционная функция более точно
характеризует автокорреляционные зависимости внутри временного ряда.
30. Устранение автокорреляции остатков при построении
модели регрессии по временным рядам

В связи с тем, что наличие в модели регрессии автокорреляции между остатками


модели может привести к негативным результатам всего процесса оценивания
неизвестных коэффициентов модели, автокорреляция остатков должна быть устранена.
Устранить автокорреляцию остатков модели регрессии можно с помощью
включения в модель автокорреляционного параметра, однако на практике данный подход
реализовать весьма затруднительно, потому что оценка коэффициента автокорреляции
является величиной заранее неизвестной.
Авторегрессионной схемой первого порядка называется метод устранения
автокорреляции первого порядка между соседними членами остаточного ряда в линейных
моделях регрессии либо моделях регрессии, которые можно привести к линейному виду.
На практике применение авторегрессионной схемы первого порядка требует
априорного знания величины коэффициента автокорреляции. Однако в связи с тем, что
величина данного коэффициента заранее неизвестна, в качестве его оценки
рассчитывается выборочный коэффициент остатков первого порядка ρ1.
Выборочный коэффициент остатков первого порядка ρ1 рассчитывается по
формуле:

В общем случае коэффициент автокорреляции порядка l рассчитывается по


формуле:

где l – временной лаг;


T – число наблюдений;
t – момент времени, в который осуществлялось наблюдение;

– среднее значение исходного временного ряда.


Предположим, что на основе собранных наблюдений была построена линейная
парная модель регрессии:
yt=β0+β1xt+εt.(1)
Рассмотрим применение авторегрессионной схемы первого порядка на примере
данной модели.
Исходная линейная модель парной регрессии с учётом процесса автокорреляции
остатков первого порядка в момент времени t может быть представлена в виде:
yt=β0+β1xt+ρεt-1+νt,.
εt=ρεt-1+νt,
где ρ – коэффициент автокорреляции, |ρ|<1;
νt – независимые, одинаково распределённые случайные величины с нулевым
математическим ожиданием и дисперсией G2(νt).
Модель регрессии в момент времени (t-1) может быть представлена виде:
yt-1=β0+β1xt-1+εt-1.(2)
Если модель регрессии в момент времени (t-1) умножить на величину
коэффициента автокорреляции β и вычесть её из исходной модели регрессии в момент
времени t, то в результате мы получим преобразованную модель регрессии,
учитывающую процесс автокорреляции первого порядка:

Для более наглядного представления преобразованной модели воспользуемся


методом замен:
Yt=yt–ρyt-1;
Xt=xt–ρxt-1;
Zt=1– ρ.
В результате преобразованная модель регрессии примет вид:
Yt= Zt* β0+β1 Xt+ νt. (4)
В преобразованной модели регрессии случайная ошибка βt не подвержена процессу
автокорреляции, поэтому можно считать автокорреляционную зависимость остатков
модели устранённой.
Авторегрессионную схему первого порядка можно применить ко всем строкам
матрицы данных Х, кроме первого наблюдения. Однако если не вычислять Y1 и X1, то
подобная потеря в небольшой выборке может привести к неэффективности оценок
коэффициентов преобразованной модели регрессии. Данная проблема решается с
помощью поправки Прайса-Уинстена. Введём следующие обозначения:

Тогда оценки неизвестных коэффициентов преобразованной модели регрессии (4)


можно рассчитать с помощью классического метода наименьших квадратов:

Оценки коэффициентов исходной модели регрессии (1) определяются по


формулам:

В результате оцененная модель регрессии будет иметь вид:


31. Обобщённая модель регрессии с автокоррелированными
остатками.

МНК-оценки неизвестных коэффициентов модели регрессии, чьи случайные


ошибки подвержены явлениям гетероскедастичности или автокорреляции, не будут
удовлетворять теореме Гаусса-Маркова. Свойствами состоятельности и несмещённости
МНК-оценки будут обладать, однако свойство эффективности в этом случае утрачивается.
Для вычисления оценок неизвестных коэффициентов модели регрессии с
гетероскедастичными или коррелированными случайными ошибками используется
обобщённый метод наименьших квадратов. Оценки, полученные с помощью данного
метода, будут удовлетворять условиям состоятельности, несмещённости и
эффективности.
В основе нормальной линейной модели регрессии среди прочих лежат условия о
некоррелированности и гомоскедастичности случайных ошибок:
1) дисперсия случайной ошибки модели регрессии является величиной, постоянной
для всех наблюдений:

2) случайные ошибки модели регрессии не коррелированны между собой, т. е.


ковариация случайных ошибок любых двух разных наблюдений равна нулю:

Определение. Обобщённой линейной моделью регрессии называется модель, для


которой нарушаются условия о гомоскедастичности и некоррелированности случайных
ошибок.
Таким образом, обобщённая линейная модель регрессии характеризуется
неоднородностью дисперсий случайных ошибок:
D(εi)≠ D(εj)≠G2≠const, где i≠j,
и наличием автокорреляции случайных ошибок:
Cov(εi,εj)≠E(εi,εj)≠0 (i≠j).
Матричный вид обобщённой линейной модели регрессии:
Y=X* β+ε,
где X – неслучайная матрица факторных переменных;
ε – случайная ошибка модели регрессии с нулевым математическим ожиданием
E(ε)=0 и дисперсией G2(ε):
ε~N(0;G2Ω),
Ω  – ковариационная матрица случайных ошибок обобщённой модели регрессии.
Для нормальной линейной модели регрессии дисперсия случайной ошибки
определялась на основе условия гомоскедастичности:

где G2=const – дисперсия случайной ошибки модели регрессии ε;


In – единичная матрица размерности n*n.
Для обобщённой модели регрессии ковариационная матрица случайных ошибок
строится на основе условия непостоянства дисперсий остатков модели регрессии
(гетероскедастичности) D(εi)≠ D(εj)≠G2≠const:

Отличие между нормальной линейной моделью регрессии и обобщенной линейной


моделью регрессии заключается в матрице ковариаций случайных ошибок модели.
Теорема Айткена. В классе линейных несмещённых оценок неизвестных
коэффициентов обобщённой модели регрессии оценка

будет иметь наименьшую ковариационную матрицу.


Общая формула для расчёта матрицы ковариаций ОМНК-оценок коэффициентов
обобщенной модели регрессии имеет вид:

Величина G2(ε)  оценивается по формуле:

Однако значение G2(ε)  не следует трактовать как дисперсию случайной ошибки


модели регрессии.
Коэффициент детерминации не используется при оценке качества обобщённой
линейной модели регрессии, потому что он не отвечает требованиям, предъявляемым к
обычному множественному коэффициенту детерминации.
Проверка гипотез о значимости коэффициентов обобщенной линейной модели
регрессии и модели регрессии в целом осуществляется с помощью тех же статистических
критериев, что и в случае нормальной линейной модели регрессии.
32.Прогнозирование по регрессионной модели и его точность.

Целью построения регрессионной функции на основе эмпирических данных


является не только аппроксимация исходных данных с хорошей точностью, но и
возможность дальнейшего применения полученного уравнения в экономических расчетах.
В частности, на основе регрессионной модели можно вычислить прогнозное значение
результативного признака при любых заданных значениях факторов.

Под прогнозированием в эконометрике понимается построение оценки р для ^y


некоторого набора факторов, которых нет в исходных наблюдениях. Различают точечное
и интервальное прогнозирование. В первом случае оценка есть некоторое число, которое
вычисляется по модели регрессии. Во втором случае – интервал, в котором находится
истинное (теоретическое) значение зависимой переменной с заданным уровнем
значимости α.

Интервалы прогноза по линейному уравнению регрессии.


В прогнозных расчетах по уравнению регрессии определяется предсказываемое

значение

p как точечный прогноз ^у при
xp , то есть путем подстановки
xp
в уравнение регрессии.

Так для линейной регрессии


^у = a^ 0 + a^ 1 x ,
у= a^ 0 + a^ 1 x , поэтому

прогнозное значение
^у p =^a 0 + a^ 1 x p .

Точечный прогноз дополняется расчетом стандартной ошибки ^у , то есть


m ^у
¿
, и интервальной оценкой прогнозного значения у :
¿
^у −m ^у⋅t табл ≤ у ≤ ^у +m ^у⋅t табл .

Поставим в уравнение регрессии выражение параметра


a^ 0 :

a^ 0= у−^a 1 x ,
m2^у =D ( ^у ) ,
^у = a^ 0 + a^ 1 x= у −^a 1 x + a^ 1 x= у + a^ 1 ( x− x ) .

Отсюда вытекает, что стандартная ошибка


m ^у зависит от ошибки у и

ошибки коэффициента регрессии


a^ 1 :
2 2
D ( ^у )=m2^у =m 2 +ma ( x−x )
у . 1
Соотношение (2) вытекает из свойств дисперсии: дисперсия групповой средней
равна сумме дисперсий двух независимых слагаемых выражения (1). Учтено также, что
( x−x ) − неслучайная величина, при вынесении которой за знак дисперсии ее
необходимо возвести в квадрат.
Дисперсия выборочной средней
k k

m 2=D
у
( )∑ уi ∑ D ( уi)
i=1
k
2
=
i=1

k2
σ 2⋅k σ 2
= 2 =
k k .

ma a^ 1
Для нахождения дисперсии 1 представим коэффициент регрессии в
k
∑ ( x i− x )⋅( у i − у ) 2
a^ 1 =
i=1 2 σ
k ma = k
1
2
∑ ( xi −x ) ∑ ( x i −x )2
виде i=1 . Тогда i=1 (вывод смотри
ранее в разделе проверка качества уравнения регрессии).
2
Используем в качестве оценки σ остаточную дисперсию на одну степень
2
свободы s . Тогда из (2) получим следующую формулу расчета стандартной ошибки
предсказываемого по линии регрессии значения:
2
s 2
s 2
2 1 ( x p −x )
m2^у =
( )
2
+ k
x
( p ) ⋅ k+
−x =s k
k 2
∑ ( x i −x ) ∑ ( x i −x )2
i=1 i =1
.
(3)
Основываясь на предпосылках регрессионного анализа, можно показать, что
^у −Μ ( у )
t=
статистика
m ^у
имеет t–распределение Стьюдента с ( k −2 )
степенями свободы и можно построить доверительный интервал для условного

математического ожидания Μ ( у) :
^у −m ^у⋅t табл ≤Μ ( у )≤ ^у + m ^у⋅t табл , (4)
t табл=t
где ( 1−α , k−2) ,

m ^у =√ m2^у – стандартная ошибка групповой средней.


Таким образом, мы построим доверительный интервал для функции регрессии, то
есть для математического ожидания. Он с заданной надежностью 1− α накрывает

неизвестное значение Μ ( у ) .
Прогноз значений зависимой переменной у по уравнению регрессии оправдан, если
значение х объясняющей переменной не выходит за диапазон ее значений по выборке.
Другими словами, экстраполяция кривой регрессии, то есть ее использование вне
пределов обследованного диапазона значений объясняющей переменной может привести
к значительным погрешностям.

Рассмотренная формула (3) показывает, что величина


m ^у достигает минимума

при
x =x
p и возрастает по мере того, как
xp удаляется от x в любом
направлении.
33.Модели систем эконометрических уравнений.
Классификация моделей. Проблема идентифицируемости
моделей

Если экономический процесс не поддаётся описанию посредством одной модели


регрессии, то в подобных ситуациях прибегают к построению нескольких
эконометрических уравнений, которые в совокупности образуют систему.
В состав системы эконометрических уравнений входят множество зависимых или
эндогенных переменных и множество предопределённых переменных (лаговые и текущие
независимые переменные, а также лаговые эндогенные переменные).
Системы эконометрических уравнений используются для объяснения текущих
значений эндогенных переменных в зависимости от значений предопределённых
переменных.
Системы эконометрических уравнений, которые используются в эконометрическом
моделировании, подразделяются на три типа.
1. Система независимых эконометрических уравнений вида:

Данная система характеризуется тем, что каждая эндогенная переменная y является


функцией от одних и тех же переменных x;
2. Система рекурсивных эконометрических уравнений вида:

Данная система характеризуется тем, что в каждом последующем уравнении


эндогенная переменная выступает в качестве экзогенной переменной;
3. Система взаимозависимых эконометрических уравнений вида:
Данная система характеризуется тем, что эндогенные переменные в одних
уравнениях входят в левую часть (т. е. являются результативными переменными), а в
других уравнениях – в правую часть (т. е. являются факторными переменными).
В системе взаимозависимых уравнений значения результативных и факторных
переменных формируются одновременно под влиянием внешних факторов. Поэтому
данная система также называется системой одновременных или совместных уравнений.
В системах независимых и рекурсивных уравнений каждое уравнение может
рассматриваться самостоятельно, поэтому оценки неизвестных коэффициентов этих
уравнений можно рассчитать с помощью классического метода наименьших квадратов.
В системе одновременных уравнений каждое уравнение не может рассматриваться
как самостоятельная часть системы, поэтому оценки неизвестных коэффициентов данных
уравнений нельзя определить с помощью классического метода наименьших квадратов, т.
к. нарушаются три основных условия применения этого метода:
а) между переменными системы уравнений существует одновременная
зависимость, т. е. в первом уравнении системы y1 является функцией от y2, а во втором
уравнении уже y2 является функцией от y1;
б) наличие проблема мультиколлинеарности, т. е. во втором уравнении системы y2
зависит от x1, а в других уравнениях обе переменные являются факторными;
в) случайные ошибки уравнения коррелируют с результативными переменными.
Следовательно, если неизвестные коэффициенты системы одновременных
уравнений оценивать с помощью классического метода наименьших квадратов, то в
результате мы получим смещённые и несостоятельные оценки.
Основной моделью системы одновременных уравнений является модель
одновременного формирования спроса Qd и предложения QS товара в зависимости от его
цены P в момент времени t. Данная модель включает в себя три уравнения:
1) уравнение предложения:

2) уравнение спроса:

3) тождество спроса, справедливое при условии, что рынок находится в состоянии


равновесия:
QSt = Qdt
где
QSt – предложение товара в момент времени t;
Qdt– спрос на товар в момент времени t;
Pt – цена товара в момент времени t;
Pt–1 – цена товара в предшествующий момент времени (t–1);
It – доход потребителей в момент времени t.
34.Макроэкономические Кейнсианские модели.

Для анализа экономических процессов и явлений, прогнозирования их


дальнейшего развития применяются логические и формально-математические модели.
Макроэкономические модели — это формализованные логическим, графическим
или алгебраическим способом описания различных макроэкономических процессов и
явлений с целью установить между ними функциональные взаимозависимости. Следует
иметь в виду, что любая модель есть абстрактное упрощение реальности, поэтому она не
может быть всеобъемлющей.
При помощи моделирования можно определить способы управления темпами
инфляции, уровнем занятости, объемами выпуска и потребления продукции, величиной
процентной ставки, валютным курсом. Все эти позиции называются эндогенными
экономическими переменными, т.е. внутренними, формирующимися внутри модели,
являющимися результатами ее построения и определяемыми в ходе экономических
расчетов.
Внешними, экзогенными, экономическими переменными, т.е. исходной
информацией, задаваемой до начала построения модели, являются инструменты,
применяемые правительством и центральным банком в осуществлении фискальной и
монетарной политики. Это величина расходов государственного бюджета, размеры
налоговых ставок, объемы денежно^ массы.
Использование макроэкономических моделей позволяет более правильно сочетать
применяемые методы бюджетно-налоговой и денежно-кредитной, валютной и
внешнеторговой политики для сглаживания цикличности экономики, преодоления
кризисов.
Примерами наиболее известных макроэкономических моделей могут служить
логическая модель круговых потоков, графическая модель совокупного спроса и
совокупного предложения, кривые Филлипса и Лаффера, модели экономического роста
Солоу и Харрода — Домара и многие другие.
Модели не следует оценивать с точки зрения правильности для решения
конкретных задач, стоящих перед национальной экономикой конкретной страны. Их
оценка должна проводиться по критерию полезности при исследовании экономических
процессов и управляемости макроэкономическими показателями.
Наряду с делением экономических переменных на эндогенные и экзогенные
существует другая классификация — по способу их измерения во времени. Выделяют
переменные запаса, характеризующие состояние объекта на определенную дату (начало и
конец квартала, года и т.д.). К таким переменным относятся, к примеру, объем
национального богатства страны, величина государственного долга, совокупный объем
капитала в экономике. Помимо них, существуют переменные потока, характеризующие
течение экономических процессов во времени и измеряемые за единицу времени.
Примерами могут служить размеры валового продукта за год, потребительских расходов
за год, объем инвестиций за год и пр.
И те и другие переменные взаимосвязаны, так как потоки вызывают изменения в
запасах. Например, накопление бюджетного дефицита за ряд лет приводит к увеличению
государственного долга.
Существует множество видов макроэкономических моделей. Приведем пять из
них.
Абстрактно-теоретические и конкретно-экономические.
Статические. Статические модели характеризуются заданностью и
фиксированностью общего запаса экономических ресурсов, что может служить для
анализа эффективности их распределения. Динамические — учитывают распределенное
по времени решение таких проблем, как вовлечение ресурсов в производство, накопление
сбережений, внедрение достижений НТП, альтернативность издержек, и некоторых
других.
Динамические модели подразделяются на краткосрочные, среднесрочные и
долгосрочные, т.е. зависят от временных периодов, в которых осуществляется анализ. Так,
в моделях Дж.М. Кейнса экономические процессы рассматриваются в краткосрочном
периоде; классические модели являются долгосрочными.
Равновесные и неравновесные. Равновесные модели описывают ситуацию, когда
при неизменности внешних условий и параметров ни у одного из участников
хозяйственного процесса нет стимула менять свое экономическое поведение. Планы
экономических субъектов и их реализация совпадают. При усложнении ряда
экономических процессов возникает ситуация, описываемая неравновесными моделями,
например, моменты неопределенности при отсутствии полной информации, когда
различные экономические субъекты стремятся себя застраховать от возможных рисков
или сделки осуществляются по неравновесным ценам, до того как было установлено
равновесие. Равновесные и неравновесные модели тесно взаимосвязаны.
Открытые и закрытые модели соответствуют открытому или закрытому типам
экономики. Открытые модели предполагают участие национальной экономики в
международной торговле, учитывают основные макроэкономические показатели,
определяющие взаимодействие разных стран. Закрытые модели предполагают
абстрагирование национальной экономики от участия в международных экономических
отношениях.
35. Системы одновременных эконометрических уравнений,
идентифицируемость.

Введём следующие обозначения:


N – количество предопределённых переменных структурной формы системы
одновременных уравнений;
n – количество предопределённых переменных в уравнении, проверяемом на
идентифицируемость;
M – количество эндогенных переменных структурной формы системы
одновременных уравнений;
m – количество эндогенных переменных в уравнении, проверяемом на
идентифицируемость;
K – матрица коэффициентов при переменных, не входящих в уравнение,
проверяемое на идентифицируемость.
Необходимые и достаточные условия идентификации применяются только к
структурной форме системы одновременных уравнений.
Первое необходимое условие идентифицируемости уравнения структурной формы
системы одновременных уравнений.
Уравнение структурной формы системы одновременных уравнений
идентифицируемо в том случае, если оно исключает хотя бы N-1 предопределённую
переменную:
(N–n)+(M–m)≥N–1.
Второе необходимое условие идентифицируемости уравнения структурной формы
системы одновременных уравнений.
Уравнение структурной формы системы одновременных уравнений
идентифицируемо в том случае, если количество предопределённых переменных, не
входящих в данное уравнение, будет не меньше числа эндогенных переменных этого
уравнения минус единица:
N–n≥m–1.
Достаточное условие идентифицируемости уравнения структурной формы системы
одновременных уравнений.
Уравнение структурной формы системы одновременных уравнений
идентифицируемо в том случае, если ранг матрицы K равен (N-1).
Рангом матрицы называется размер наибольшей её квадратной подматрицы,
определитель которой не равен нулю.
На основе перечисленных условий идентификации, можно сформулировать
необходимые и достаточные условия идентифицируемости уравнения структурной формы
системы одновременных уравнений:
1) уравнение структурной формы системы одновременных уравнений считается
сверхидентифицированным, если M–m>n–1  и ранг матрицы K равен (N-1);
2) уравнение структурной формы системы одновременных уравнений считается
точно идентифицированным, если M–m=n–1 и ранг матрицы K равен (N-1);
3) уравнение структурной формы системы одновременных уравнений считается
неидентифицированным, если M–m≥n–1 и ранг матрицы K меньше (N-1);
4) уравнение структурной формы системы одновременных уравнений считается
неидентифицированным, если M–m<n–1.
В качестве примера можно рассмотрим процесс идентификации структурной
формы модели спроса и предложения. Данная модель включает в себя три уравнения:
1) уравнение предложения:
2) уравнение спроса:

3) тождество равновесия:
QSt = Qdt
С учётом тождества равновесия, модель спроса-предложения может быть записана
в виде:

Количество эндогенных переменных данной модели M равно двум (Pt и Qt), т.е.
M=2. Количество предопределённых переменных данной модели N равно двум (Pt–1 и It),
т.е. N=2.
Проверим выполнение первого необходимого условия идентифицируемости.
Для функции спроса выполняются равенства m=2 и n=1. Отсюда
(N–n)+(M–m)=(2–1)+(2–2)+(2–2)=1=(N–1)=1,
следовательно, уравнение спроса является точно идентифицированным.
Для функции предложения выполняются равенства m=2 и n=1. Отсюда
(N–n)+(M–m)=(2–1)+(2–2)+(2–2)=1=(N–1)=1,
следовательно, уравнение предложения является точно идентифицированным.
Проверим выполнение второго необходимого условия идентифицируемости.
Для функции спроса выполняются равенства m=2 и n=1. Отсюда
N–n=2–1=1=m–1=2–1=1,
следовательно, уравнение спроса является точно идентифицированным.
Для функции предложения выполняются равенства m=2 и n=1. Отсюда
N–n=2–1=1=m–1=2–1=1,
следовательно, уравнение предложения является точно идентифицированным.
Проверим выполнение достаточного условия идентифицируемости,
заключающееся в том, чтобы хотя бы один из коэффициентов матрицы K не был равен
нулю, т.к. M–1=1.
В первом уравнении модели исключена переменная It и матрица K=[b2]. Т.к.
определитель данной матрицы не равен нулю, следовательно, rank=1=M–1 и уравнение
является идентифицированным.
Во втором уравнении исключена переменная Pt–1 и матрица К=[a2]. Т.к.
определитель данной матрицы не равен нулю, следовательно, rank=1=M–1 и уравнение
является идентифицированным.
Т.к. уравнения спроса и предложения являются точно идентифицированными, то и
система уравнений в целом точно идентифицирована.
Приведённая форма системы уравнений модели спроса-предложения:
36. Оценка структурных коэффициентов эконометрической
модели. КМНК, ДМНК.

Коэффициенты структурной модели могут быть оценены разными способами в


зависимости от вида системы одновременных уравнений. Наибольшее распространение
получили два метода оценивания коэффициентов структурной модели:
косвенный метод наименьших квадратов (КМНК);
двухшаговый метод наименьших квадратов (ДМНК);
трёхшаговый метод наименьших квадратов МНК;
метод максимального правдоподобия с полной информацией;
метод максимального правдоподобия при ограниченной информации.
Косвенный и двухшаговый методы подробно описаны в литературе и
рассматриваются как традиционные методы оценки коэффициентов структурной модели.
КМНК применяется для идентифицируемой системы одновременных уравнений, а
ДМНК – для оценки коэффициентов сверхидентифируемой модели.
Косвенный метод наименьших квадратов (КМНК) применяется в случае точно
идентифицируемой структурной модели. Процедура применения КМНК предполагает
выполнение следующих этапов работы:
1. Структурная модель преобразовывается в приведенную форму модели.
2. Для каждого уравнения приведенной формы модели обычным МНК

оцениваются приведенные коэффициенты ij .



3. Коэффициенты приведенной формы модели трансформируются в параметры
структурной модели.
Рассмотрим применение КМНК для модели:

{ y1=b12 y2+a11 x1+ε1, ¿ ¿¿¿


Пусть мы располагаем некоторыми данными по 5 регионам:
Реги y1 y2 x1 x2
он
1 2 5 1 3
2 3 6 2 1
3 4 7 3 2
4 5 8 2 5
5 6 5 4 6
Сред 4 6,2 2,4 3,4
ние
Приведенная форма модели имеет вид:

{ y1=δ 11 x1+δ12 x2+u1, ¿ ¿¿¿


где
u u−1, 2 случайные ошибки приведенной формы модели.
Для каждого уравнения приведенной формы применим традиционный МНК и
определим δ- коэффициенты. Для простоты работаем в отклонениях, т.е.
y= y − ȳ , х=х− х̄ . Тогда система нормальных уравнений для первого уравнения
системы составит:

δ{ 11 ∑ х21+δ12∑ х1 х2=∑ у1 х1 ¿ ¿¿¿


Для приведенных данных система составит:

{5,2δ11+4,2δ12=6, ¿ ¿¿¿
Отсюда получаем первое уравнение (и аналогично второе):

{ y1=0,852х1+0,373х2+и1 ¿ ¿¿¿
Перейдем к структурной форме следующим образом: исключим из первого
уравнения приведенной формы x2 , выразив его из второго уравнения приведенной формы
и подставив в первое уравнение:
−0 , 072 х1 − у 2
x 2=
0 , 00557 .
Первое уравнение структурной формы:
−0 , 072 х1 − у 2
(
^у 1 =0 , 852 х 1 +0 , 373
0 ,00557 ) =−66 ,966 у 2 −3 , 97 х 1
.
Аналогично исключим из второго уравнения x1, выразив его через первое
уравнение и подставив во второе:
у 1−0 ,373 х 2 у 1−0 ,373 х 2
х 1=
0 , 852 (
;⇒ ^у 2 =−0 ,072
0 , 852) −0 ,00557 х2
,
^у 2 =−0 , 085 у 1 +0 , 026 х 2− второе уравнение структурной формы.

Структурная форма модели имеет вид: 1 2 { y =−66,966у −3,97х +ε ¿ ¿¿¿


1 1,
Эту же систему можно записать, включив в нее свободный член уравнения, т.е.
перейти от переменных в виде отклонений от среднего к исходным переменным y и
x:
А 01= ӯ 1 −b12 ȳ 2−a11 x̄ 1=428,717
А 02= ӯ 2 −b 21 ȳ 1 −a22 x̄ 2 =6, 451

Тогда структурная модель имеет вид: 1 2 1 1,{ у =428,717−66,966у −3,97х +ε ¿ ¿¿¿


Если к каждому уравнению структурной формы применить традиционный МНК, то
результаты могут сильно отличаться. В данном примере будет:

{ y1=−1,09+0,364у2+1,192х1+ε1, ¿ ¿¿¿
Двухшаговый МНК. ДМНК используется для сверхидентифицируемых систем.
Основная идея ДМНК: на основе приведенной формы модели получить для
сверхидентифицируемого уравнения теоретические значения эндогенных переменных,
содержащихся в правой части уравнения. Далее, подставив их вместо фактических
значений, можно применить обычный МНК к структурной форме
сверхидентифицируемого уравнения. Здесь дважды используется МНК: на первом шаге
при определении приведенной формы модели и нахождении на ее основе оценок

теоретических значений эндогенной переменной i i1 1 i2 2 ^y =δ x +δ x +. . .+δ x


im m, и на
втором шаге применительно к структурному сверхидентифицируемому уравнению при
определении структурных коэффициентов модели по данным теоретических (расчетных)
значений эндогенных переменных.
Сверхидентифицируемая структурная модель может быть двух типов:
- все уравнения системы сверхидентифицируемые;
- система содержит также точно идентифицируемые уравнения.
В первом случае для оценки структурных коэффициентов каждого уравнения
используется ДМНК. Во втором случае структурные коэффициенты для точно
идентифицируемых уравнений находятся из системы приведенных уравнений.
ДМНК является наиболее общим и широко распространенным методом решения
системы одновременных уравнений. Для точно идентифицируемых уравнений ДМНК
дает тот же результат, что и КМНК.

Рассмотрим модель:

{ y1=b12(y2+x1 )+ε1, ¿ ¿¿¿


Она получена из предыдущего примера наложением ограничения 12 11. b =a
Поэтому первое уравнение стало сверхидентифицируемым.
На первом шаге найдем приведенную форму модели. С использованием тех же
исходных данных получим систему:

{ y1=0,852x1+0,373х2+и1, ¿ ¿¿¿
На основе второго уравнения этой системы можно найти теоретические значения

для эндогенной переменной


у 2, т.е.
^у 2. Подставим в это уравнение значения
х1 и
х2 в форме отклонений от средних значений, запишем в виде таблицы:
^y 2 ^y 2 +x 1 =z y1 y1 z z2
- - 0 -1,297 - 2 1
1,4 0,4 ,103 2 ,594 ,682
- - 0 -0,358 - 0 0
0,4 2,4 ,042 1 ,358 ,128
0 - - 0,565 0 0 0
,6 1,4 0,035 ,319
- 1 0 -0,38 1 - 0
0,4 ,6 ,02 0,38 ,144
1 2 - 1,47 2 2 2
,6 ,6 0,13 ,94 ,161
0 0 0 0 0 5 4
,512 ,434

После того, как найдены оценки


^y 2, заменим в уравнении
у 1 =b12 ( y 2 + x 1 )

фактические значения
y2 их оценками
^y 2, найдем значения новой переменной
z= ^y 2 +x 1 . Применим МНК к уравнению:
у 1=b12 z .
Получим:

b12=
∑ y1 z = 5,512 =1,243.
∑ z2 4,434
В целом рассматриваемая система будет иметь вид:
{ у1=1,243( у2+х2) ¿ ¿¿¿
Второе уравнение не изменилось по сравнению с предыдущим примером.
37.Временные ряды. Анализ автокорреляции.

Временным рядом называется ряд наблюдений за значениями некоторого


показателя (признака), упорядоченный в хронологической последовательности, т.е. в
порядке возрастания переменной t- временного параметра. Отдельные наблюдения
временного ряда называются уровнями этого ряда.
Временные ряды делятся на моментные и интервальные. В моментных временных
рядах уровни характеризуют значения показателя по состоянию на определенные
моменты времени. Например, моментными являются временные ряды цен на
определенные виды товаров, временные ряды курсов акций, уровни которых фиксируются
для конкретных чисел. Примерами моментных временных рядов могут служить также
ряды численности населения или стоимости основных фондов, т.к. значения уровней этих
рядов определяются ежегодно на одно и то же число.
В интервальных рядах уровни характеризуют значение показателя за определенные
интервалы (периоды) времени. Примерами рядов этого типа могут служить временные
ряды производства продукции в натуральном или стоимостном выражении за месяц,
квартал, год и т.д.
Иногда уровни ряда представляют собой не непосредственно наблюдаемые значения, а
производные величины: средние или относительные. Такие ряды называются
производными. Уровни таких временных рядов получаются с помощью некоторых
вычислений на основе непосредственно наблюдаемых показателей. Примерами таких
рядов могут служить ряды среднесуточного производства основных видов промышленной
продукции или ряды индексов цен.
Автокорреляция (или серийная корреляция) определяется как корреляция между
наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в
пространстве (перекрестные данные).
Анализ автокорреляционной функции и коррелограммы позволяет определить лаг,
при котором автокорреляция наиболее высокая, а, следовательно, и лаг, при котором связь
между текущим и предыдущими уровнями ряда наиболее тесная, т.е. при помощи анализа
автокорреляционной функции и коррелограммы можно выявить структуру ряда.
Если наиболее высоким оказался коэффициент автокорреляции первого порядка,
исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался

коэффициент автокорреляции порядка , то ряд содержит циклические колебания с

периодичностью в  моментов времени. Если ни один из коэффициентов


автокорреляции не является значимым, можно сделать одно из двух предположений
относительно структуры этого ряда: либо ряд не содержит тенденции и циклических
колебаний, либо ряд содержит сильную нелинейную тенденцию, для выявления которой
нужно провести дополнительный анализ. Поэтому коэффициент автокорреляции уровней
и автокорреляционную функцию целесообразно использовать для выявления во
временном ряде наличия или отсутствия трендовой компоненты и циклической (сезонной)
компоненты.
38.Экономические причины автокоррелированности
случайных ошибок.

Автокорреляция (последовательная корреляция) – это корреляция между


наблюдаемыми показателями во времени (временные ряды) или в пространстве
(перекрестные данные). Автокорреляция остатков характеризуется тем, что не
выполняется следующая предпосылка использования МНК:
σεiεj=Cov (εi, εj)={0 , i≠ j σ 2 ,i= j
Причины автокорреляции остатков
Автокорреляция остатков может возникать по нескольким причинам:
Во-первых, иногда автокорреляция связана с исходными данными и наличием ошибок
измерения в значениях Y.
Во-вторых,иногда причину автокорреляции остатков следует искать в формулировке
модели. В модель может быть не включен фактор, оказывающий существенное
воздействие на результат, но влияние у которого отражается в остатках, вследствие чего
последние могут оказаться автокоррелированными. Зачастую этим фактором является
фактор времени t.
Иногда, в качестве существенных факторов могут выступать лаговые значения
переменных, включенных в модель. Либо в модели не учтено несколько второстепенных
факторов, совместное влияние которых на результат существенно ввиду совпадения
тенденций их изменения или циклических колебаний
39.Моделирование сезонных и циклических колебаний
временного ряда. Аддитивная модель.

Существует несколько подходов к анализу структуры временных рядов,


содержащих сезонные или циклические колебания. Моделирование циклических
колебаний в целом осуществляется аналогично моделированию сезонных колебаний,
поэтому мы рассмотрим только методы моделирования последних.
Простейший подход – расчет значений сезонной компоненты методом скользящей
средней и построение аддитивной или мультипликативной модели временного ряда.
Общий вид аддитивной модели следующий:
Y T S E 11\* MERGEFORM
Эта модель предполагает, что каждый уровень временного ряда может быть

представлен как сумма трендовой


T
, сезонной
 S
и случайной
 E
компонент.
Общий вид мультипликативной модели выглядит так:
Y  T S E 22\* MERGEFORM
Эта модель предполагает, что каждый уровень временного ряда может быть
представлен как произведение трендовой, сезонной и случайной компонент. Выбор одной
из двух моделей осуществляется на основе анализа структуры сезонных колебаний. Если
амплитуда колебаний приблизительно постоянна, строят аддитивную модель временного
ряда, в которой значения сезонной компоненты предполагаются постоянными для
различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается,
строят мультипликативную модель временного ряда, которая ставит уровни ряда в
зависимость от значений сезонной компоненты.
Построение аддитивной и мультипликативной моделей сводится к расчету
значений T , S и E для каждого уровня ряда. Процесс построения модели включает в
себя следующие шаги.
1. Выравнивание исходного ряда методом скользящей средней.
2. Расчет значений сезонной компоненты S .
3. Устранение сезонной компоненты из исходных уровней ряда и получение

выровненных данных
 T  E  T  E  в мультипликативной модели.
в аддитивной или

4. Аналитическое выравнивание уровней


 T  E  или  T  E  и расчет значений
T с использованием полученного уравнения тренда.
5. Расчет полученных по модели значений
 T  S
или
T S
.
6. Расчет абсолютных и/или относительных ошибок.
Если полученные значения ошибок не содержат автокорреляции, ими можно
заменить исходные уровни ряда и в дальнейшем использовать временной ряд ошибок E
для анализа взаимосвязи исходного ряда и других временных рядов.
40.Моделирование сезонных и циклических колебаний
временного ряда. Мультипликативная модель.

При построении мультипликативных моделей целесообразно строго


придерживаться специально разработанным правилам:
1. Каждый фактор-сомножитель модели должен иметь самостоятельное
экономическое значение.
2. Каждая пара прилегающих друг к другу факторов при перемножении должна
давать новый показатель, имеющий самостоятельное значение.
3. При перемножении всех факторов-сомножителей мы должны получить исходный
исследуемый показатель.
Все эти три правила позволяют безошибочно построить значимую
мультипликативную модель эффективности производства.
Технология построения модели достаточно проста. Вначале необходимо выделить
неявные факторы, которые могут повлиять на уровень эффективности. Затем, на основе
вышеперечисленных трех правил необходимо построить на основе выделенных неявных
факторов мультипликативную модель.
Существует несколько подходов к анализу структуры временных рядов,
содержащих сезонные или циклические колебания. Моделирование циклических
колебаний в целом осуществляется аналогично моделированию сезонных колебаний,
поэтому мы рассмотрим только методы моделирования последних.
Простейший подход – расчет значений сезонной компоненты методом скользящей
средней и построение аддитивной или мультипликативной модели временного ряда.
Общий вид аддитивной модели следующий:
Y T S E
Эта модель предполагает, что каждый уровень временного ряда может быть

представлен как сумма трендовой


T
, сезонной
 Sи случайной
 E
компонент.
Общий вид мультипликативной модели выглядит так:
Y  T S E
Эта модель предполагает, что каждый уровень временного ряда может быть
представлен как произведение трендовой, сезонной и случайной компонент. Выбор одной
из двух моделей осуществляется на основе анализа структуры сезонных колебаний. Если
амплитуда колебаний приблизительно постоянна, строят аддитивную модель временного
ряда, в которой значения сезонной компоненты предполагаются постоянными для
различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается,
строят мультипликативную модель временного ряда, которая ставит уровни ряда в
зависимость от значений сезонной компоненты.
Построение аддитивной и мультипликативной моделей сводится к расчету
значений T , S и E для каждого уровня ряда. Процесс построения модели включает в
себя следующие шаги.
1. Выравнивание исходного ряда методом скользящей средней.
2. Расчет значений сезонной компоненты S .
3. Устранение сезонной компоненты из исходных уровней ряда и получение

выровненных данных
 T  E  T  E  в мультипликативной модели.
в аддитивной или

4. Аналитическое выравнивание уровней


 T  E  или  T  E  и расчет значений
T с использованием полученного уравнения тренда.
 T  S
5. Расчет полученных по модели значений
T S
или .
6. Расчет абсолютных и/или относительных ошибок.
Если полученные значения ошибок не содержат автокорреляции, ими можно
заменить исходные уровни ряда и в дальнейшем использовать временной ряд ошибок E
для анализа взаимосвязи исходного ряда и других временных рядов.
41.Адаптивные модели прогнозирования. Общая
характеристика

Адаптивные модели прогнозирования - это модели дисконтирования данных,


способные быстро приспосабливать свою структуру и параметры к изменению условий.
Инструментом прогноза в адаптивных моделях, как и в кривых роста, является
математическая модель с единственным фактором « время ».
При оценке параметров адаптивных моделей в отличие от рассматриваемых ранее
моделей «кривых роста» наблюдениям (уровням ряда) присваиваются различные веса в
зависимости от того, насколько сильным признается их влияние на текущий уровень.
Это позволяет учитывать изменения в тенденции, а также любые колебания, в которых
прослеживается закономерность. Все адаптивные модели базируются на двух схемах:
скользящего среднего (СС-модели) и авторегрессии ( AP−¿модели).
Согласно схеме скользящего среднего, оценкой текущего уровня является
взвешенное среднее всех предшествующих уровней, причем веса при наблюдениях
убывают по мере удаления от последнего уровня, т. е. информационная ценность
наблюдений признается тем большей, чем ближе они к концу интервала наблюдений.
Такие модели хорошо отражают изменения, происходящие в тенденции, но в чистом
виде не позволяют отражать колебания.
Реакция на ошибку прогноза и дисконтирование уровней временного ряда в
моделях, базирующихся на схеме СС, определяется с помощью параметров сглаживания
(адаптации), значения которых могут изменяться от нуля до единицы. Высокое значение
этих параметров (свыше 0,5) означает придание большего веса последним уровням
ряда, а низкое (менее 0,5) — предшествующим наблюдениям. Первый случай
соответствует быстроизменяющимся динамичным процессам, второй — более стабильным.
В авторегрессионной схеме оценкой текущего уровня служит взвешенная сумма
не всех, а нескольких предшествующих уровней, при этом весовые коэффициенты при
наблюдениях не ранжированы. Информационная ценность наблюдений определяется не их
близостью к моделируемому уровню, а теснотой связи между ними.
Общая схема построения адаптивных моделей может быть представлена
следующим образом. По нескольким первым уровням ряда оцениваются значения
параметров модели. По имеющейся модели строится прогноз на один шаг вперед, причем
его отклонение от фактических уровней ряда расценивается как ошибка прогнозирования,
которая учитывается в соответствии с принятой схемой корректировки модели. Далее по
модели со скорректированными параметрами рассчитывается прогнозная оценка на
следующий момент времени и т.д. Таким образом, модель постоянно «впитывает» новую
информацию и к концу периода обучения отражает тенденцию развития процесса,
существующую в данный момент.
В практике статистического прогнозирования наиболее часто используются две
базовые CC −¿модели — Брауна и Хольта, первая из них является частным случаем
второй. Эти модели представляют процесс развития как линейную тенденцию с
постоянно изменяющимися параметрами
42.Адаптивные модели прогнозирования. Простая модель
экспоненциального сглаживания

Модель Брауна (модель экспоненциального сглаживания).


Модель Брауна может отображать развитие не только в виде линейной тенденции,
но также в виде случайного процесса, не имеющего тенденции, а также в виде
изменяющейся параболической тенденции. Соответственно различают модели Брауна:
• нулевого порядка, которая описывает процессы, не имеющие тенденции
развития. Она имеет один параметр A0 (оценка текущего уровня). Прогноз развития на k
шагов вперед осуществляется согласно формуле Y ( t+ k )= A 0 . Такая модель также
называется «наивной» («будет, как
было»);
• первого порядка ( Y ( t+ k )= A 0+ A 1 ∙ k ) . Коэффициент A0 −¿значение, близкое к
последнему уровню, и представляет как бы закономерную составляющую этого уровня.
Коэффициент A1 определяет прирост, сформировавшийся в основном к концу периода
наблюдений, но отражающий также (правда, в меньшей степени) скорость роста на более
ранних этапах;
• второго порядка, отражающей развитие в виде параболической
тенденции с изменяющимися «скоростью» и «ускорением». Она имеет три параметра
A2−¿оценка текущего прироста или «ускорение»). Прогноз осуществляется по формуле:
Y ( t+ k )= A 0+ A 1 ∙ k + A1 k 2.
Порядок модели обычно определяют либо априорно на основе визуального анализа
графика процесса (есть ли тренд и близок ли он к линейной функции), знаний законов
развития характера изменения исследуемого явления, либо методом проб, сравнивая
статистические характеристики моделей различного порядка на участке ретроспективного
прогнозирования.
Рассмотрим этапы построения линейной адаптивной модели Брауна.
Этап 1. По первым пяти точкам временного ряда оцениваются начальные значения
A0 И A1 параметров модели с помощью метода наименьших квадратов для линейной ап-
проксимации:
Y p ( t ) =A 0 + A1 ∙t (t=1 , 2 , ⋯ , n ) .
Этап 2. С использованием параметров A0 И A1 ПО модели Брауна находим прогноз
на один шаг (k = 1):
Y p ( t , k ) =A 0 (t)+ A1 (t )∙ k
Этап 3. Расчетное значение Y p ( t , k ) экономического показателя сравнивают с
фактическим Y (t ) и вычисляется величина их расхождения (ошибки). При k = 1 имеем:
e (t +1 )=Y ( t +1 )−Y p ( t , 1 ).
Этап 4. В соответствии с этой величиной корректируются параметры модели. В
модели Брауна модификация осуществляется следующим образом:
A0 ( t )= A0 ( t−1 )+ A 1 ( t−1 ) + ( 1−β )2;
A1 ( t ) =A 1 ( t−1 ) + ( 1−β )2 e ( t +1 ),
где β−¿коэффициент дисконтирования данных, изменяющийся в пределах от 0 до
1 (α + β=1), характеризующий обесценение данных за единицу времени и
отражающий степень доверия более поздним наблюдениям. Оптимальное значение
β находится итеративным путем, т. е. многократ ным построением модели при
разных β и выбором наилучшей, или по формуле:
3
β=N − ,
N −1
где N−¿ длина временного рада, α −¿параметр сглаживания α =1− β;
e (t )−¿ошибка прогнозирования уровня Y(t), вычисленная в момент времени (t - 1)
на один шаг вперед.
Этап 5. По модели со скорректированными параметрами A0 И A1 находят прогноз
на следующий момент времени. Возврат на пункт 3, если t < N.
Если t=N , то построенную модель можно использовать для прогнозирования на
будущее.
Этап 6. Интервальный прогноз строится как для линейной модели кривой
роста.
43.Обобщенный МНК при построении модели регрессии по
временным рядам

Методы устранения автокорреляции в остатках могут быть разные. Они зависят от


причин автокорреляции. Автокорреляция в остатках может быть следствием
неправильной спецификации модели: не учтена важная объясняющая переменная,
неправильно выбрана форма связи. В этом случае можно попытаться изменить
математическую функцию регрессии (например, линейную на степенную), уточнить
набор объясняющих переменных. Однако если эти попытки не увенчались успехом и
автокорреляция в остатках имеет место, то для ее устранения можно применить
обобщенный метод наименьших квадратов (ОМНК).
ОМНК можно использовать как для парной, так и для множественной регрессии.
Для простоты и уяснения сути проблемы рассмотрим регрессию двух временных рядов

yt=a + bxt+ t .

Для периода времени (t -1) справедливо равенство

yt-1=a + bxt-1+ t 1 .

Если имеет место автокорреляция в остатках, т.е. последующие по времени остатки
зависят от предыдущих, то регрессия остатков может быть представлена как
 t  c  d t 1  V t ,
где V t — случайная ошибка для линейной регрессии остатков.

Но так как
 y y t t t то  t
0
иt
0
. Полагая, что  t 1

t имеем
c    d  0.
t t 1 Тогда регрессия остатков примет вид
 t
 d  V t ,
t 1

Параметр d определим по формуле

d
cov   ,  ,
t t 1


2

t 1

где
cov   ,          
t t 1 t t 1 t t 1 t t 1

d
 t t 1

   
2 2

2

В результате получим, что t 1 . Предполагая, что t t 1


, можно
записать, что

d
  t t 1


2

, t

т.е. d — коэффициент автокорреляции остатков первого порядка. Обозначим его


через ρ. Тогда регрессия остатков примет вид
 t   t 1  V t ,
где ρ — коэффициент автокорреляции остатков первого порядка; Vt — случайная
ошибка, удовлетворяющая всем предпосылкам МНК.
Предполагая, что ρ известен, вычтем из уравнения уравнение, умноженное на ρ:
y y
t t 1
 a  1     b  x t   x t 1       .
t t 1
Введём обозначения:

y  y y
t t t 1
;

x  x  x
t t t 1
;

V    
t t t 1
;

a  a 1 a .

Тогда получим следующее уравнение

у* =а +bx*+ t , V
где Vt — независимые случайные величины, имеющие нормальное распределение.
Так как ошибки Vt удовлетворяют предпосылкам МНК (они не содержат
 

автокорреляцию), то оценки a и b будут обладать свойствами несмещенных оценок и


могут быть получены обычным МНК.
Уравнение (9) возможно только при t> 1, так как при t = 1 отсутствует лаговая
переменная. Чтобы не уменьшать число степеней свободы рекомендуется для первого
периода времени (t = 1) использовать поправку Прайса — Уинстена

x1  1    x1 ;  1   y .
 2  2
y
(5.30)
1 1

Таким образом, ОМНК предполагает, что вместо исходных переменных y t и


 
PY  y PX  x
xtиспользуются взвешенные переменные и ,
где P – веса. В матричном виде модель регрессии принимает вид PY = PXB + P  .
В ней матрица весов Р составит
 
 1  0 0 
2
0 0 0
  1 0  0 0 0
 
P=  0  1  0 0 0
 
       
 0 0 0   1 0
 
 0 0 0  0   0

Иными словами, матрица исходных данных трансформируется

 2 
 y1 1     2

   1x 1   
 
 y 2   y1   x 2   x1 
 
x   x 3   x 2  .

y   y3   y2 

   
   
   
 yn y n 1  x n   x n 1
   

Для длинных динамических рядов поправка Прайса — Уинстена может не


применяться. Тогда матрица весов не содержит первую строку рассмотренной матрицы Р,

и в расчетах используется (n-1) преобразованных наблюдений


y t и x

t .

К преобразованным переменным
y иx 

применяется традиционный МНК и


t t

 a1  
  

оцениваются параметры a и b . Далее из соотношения a можно найти


параметр a как
a  a / 1   .

ОМНК распространяется и на случай множественной регрессии


y  a  b1 x1t  b 2 x 2t    b p x pt   t .
t

Если имеет место автокорреляция остатков и t


   t 1  V t , то
y   y  a  1     b1  x1t   x1t 1  b 2  x 2t   x 2t 1   
t t 1

b p x pt
  x pt 1    t
 
t 1
.
Или, исходя из прежней символики, строим модель вида

y  a b x b x
   
1 1t 2 2t
   b p x pt  V t .
t

y , x ,x
  
1t 2t
, , x pt
Применяя к переменным t традиционный МНК, найдем оценки
a  a / 1   .
параметров b1 b 2
, , , b p 

. Свободный член модели определим как Далее


можно написать искомую модель регрессии y t =a + b l x lt + ...+b p x pt , в которой устранена
автокорреляция остатков.
Иными словами, применение ОМНК к регрессии с автокоррелированными
остатками сводится к двухшаговой процедуре:
— преобразование исходных уровней динамических рядов с помощью
известного значения коэффициента автокорреляции остатков первого порядка р;
— применение к преобразованным данным обычного МНК.
44.Учет тенденции развития при построении модели регрессии
по временным рядам

Важной задачей, возникающей при анализе рядов динамики, является определение


основной тенденции в развитии исследуемого явления. В некоторых случаях общая
тенденция ясно прослеживается в динамике показателя, в других ситуациях может не
просматриваться из-за ощутимых колебаний.
Распространенным приемом при выявлении тенденции развития является
сглаживание временного ряда. Суть различных приемов сглаживания сводится к замене
фактических уровней временного ряда расчетными уровнями, которые в меньшей степени
подвержены колебаниям. Это способствует более четкому проявлению тенденции
развития.
Скользящие средние позволяют сгладить как случайные, так и периодические
колебания, выявить имеющуюся тенденцию в развитии процесса и поэтому служат
важным инструментом при фильтрации компонент временного ряда.
Процедуры скользящих средних опираются на известную теорему Вейерштрасса,
согласно которой «любая гладкая функция при самых общих допущениях может быть
локально (т. е. в ограниченном интервале изменения ее аргумента t) представлена
алгебраическим полиномом подходящей степени».
Таким образом, на первом шаге необходимо определить длину интервала

l
сглаживания и . При этом исследователь должен иметь в виду, что чем шире интервал
сглаживания, тем в большей степени поглощаются колебания, и тенденция развития носит
более плавный, сглаженный характер. Чем сильнее колебания, тем шире должен быть
интервал сглаживания.
Схема сглаживания временного ряда по простой скользящей средней заключается в
следующем:
- определение длины интервала сглаживания, включающего в себя
(l  n)
последовательных уровней ряда и ;
- разделение исходного временного ряда на участки, каждый из которых содержит

l
уровней и уровней;
- вычисление средних значений для уровней ряда, образующих каждый участок;
-замена центральных значений на каждом участке на соответствующие средние
значения.

При этом удобно брать длину интервала сглаживания l и в виде нечетного числа:

l = 2р + 1, так как в этом случае полученные значения скользящей средней приходятся


и

на средний уровень интервала.


Наблюдения, которые берутся для расчета среднего значения, называются
активным участком сглаживания.

При нечетном значении l и = 2р + 1 все уровни активного участка могут быть


представлены в виде:
y ,y ,..., y , y t , y ,..., y , y ,
t p t  p 1 t 1 t 1 t  p 1 t p

y
где t — центральный уровень активного участка; t  p t  p 1 t 1

y ,y ,..., y ,

последовательность из р уровней активного участка, предшествующих центральному;


y ,...,
t 1
y t  p 1
, y t p
— последовательность из р уровней активного участка, следующих за
центральным.
Тогда скользящая средняя может быть определена по формуле:
t p

y
i t  p
i y t p
,y ,..., y , y ,..., y
t  p 1 t 1 t 1 t  p 1
,y
t p
y t

2 p 1

2 p 1
,

y
где i — фактическое значение i-го уровня; t — значение скользящейсредней в
y
момент t; 2р + 1 — длина интервала сглаживания.
При реализации простой скользящей средней выравнивание накаждом активном
участке производится по прямой (по полиномупервого порядка). Таким образом,
осуществляется аппроксимация неслучайной составляющей с помощью линейной
функции времени:

y  a a t
t 0 1
.

Рассмотрим активный участок с длиной интервала сглаживания l и =2р + 1.

На рис. 5.1 показан активный участок с длиной интервала сглаживания и = 7. l


Перенесем начало координат в середину временного интервала, т. е. будем рассматривать
моменты времени t = —3, —2, —1, 0, 1, 2, 3
80
Условные единицы

70
60
50
40
30
20
10
0
-4 -3 -2 -1 0 1 2 3 4
Моменты времени

Неизвестные коэффициенты линейной модели подбираются таким образом, чтобы


минимизировать критерий метода наименьших квадратов (МНК):
3
Q   ( y  a 0  a1t ) 2  min
t
t 3

Находим частные производные по a ,a


0 1 и приравниваем их нулю:
Q
 0, j  0;1.
a j

При j = 0 получаем уравнение


3 3

y t
 7a 0  a1 t
t 3 . 3

Очевидно, что за счет выполненного переноса начала координат


3

t
3 =0, а сглаженное значение в центральной точке активного участка
определяется коэффициентом а0. Из уравнения (5.2) получается выражение для
этого коэффициента:
3

y t
a 0  t 37 .
Таким образом, в качестве сглаженного значения в центральной точке активного
участка следует брать среднее арифметическое из уровней ряда, образующих этот
участок. Полученный вывод является обоснованием ранее рассмотренного алгоритма
сглаживания
45.Метод наименьших квадратов для оценки параметров
уравнения регрессии и его модификации

Рассмотрим линейную модель множественной регрессии


y  a  b1 x1  b2 x2  ...  bm xm   .
Классический подход к оцениванию параметров линейной модели множественной
регрессии основан на методе наименьших квадратов (МНК). МНК позволяет получить
такие оценки параметров, при которых сумма квадратов отклонений фактических

значений результативного признака y от расчетных y минимальна:

 
2
yi  y xi  min
i . Как известно
из курса математического анализа, для того чтобы найти экстремум функции нескольких
переменных, надо вычислить частные производные первого порядка по каждому из
параметров и приравнять их к нулю.
Итак. Имеем функцию m  1 аргумента:
S  a, b1 , b2 , ..., bm     y  a  b1 x1  b2 x2  ...  bm xm 
2
.
Находим частные производные первого порядка:
 S
 a  2  y  a  b1 x1  b2 x2  ...  bm xm   0;

 S  2 x  y  a  b x  b x  ...  b x   0;
 b 1 1 1 2 2 m m
 1
........................................................

 S  2 x  y  a  b x  b x  ...  b x   0.
 bm m 1 1 2 2 m m

После элементарных преобразований приходим к системе линейных нормальных


уравнений для нахождения параметров линейного уравнения множественной регрессии
(2.1):
na  b1  x1  b2  x2  ...  bm  xm   y ,

a  x1  b1  x1  b2  x1 x2  ...  bm  x1 xm   yx1 ,
2


................................................................
a x  b x x  b
  m 1  1 m 2  x2 xm  ...  bm  xm   yxm .
2

Для двухфакторной модели данная система будет иметь вид:


na  b1  x1  b2  x2   y ,

a  x1  b1  x1  b2  x1 x2   yx1 ,
2


a  x2  b1  x1 x2  b2  x2   yx2 .
2
Метод наименьших квадратов применим и к уравнению множественной регрессии
в стандартизированном масштабе:
t y  1t x1   2t x2  ...   mt xm   ,
(2.4)
y y
ty 
t y , t x1 , ..., t xm y
где – стандартизированные переменные: ,
xi  xi
t xi 
 xi ty  txi  0
, для которых среднее значение равно нулю: , а среднее

y xi
t  t  1 
квадратическое отклонение равно единице: ; i – стандартизированные
коэффициенты регрессии.
Стандартизованные коэффициенты регрессии показывают, на сколько единиц

изменится в среднем результат, если соответствующий фактор i изменится на одну


x
единицу при неизменном среднем уровне других факторов. В силу того, что все
переменные заданы как центрированные и нормированные, стандартизованные

коэффициенты регрессии i можно сравнивать между собой. Сравнивая их друг с другом,
можно ранжировать факторы по силе их воздействия на результат. В этом основное
достоинство стандартизованных коэффициентов регрессии в отличие от коэффициентов
«чистой» регрессии, которые несравнимы между собой.
Применяя МНК к уравнению множественной регрессии в стандартизированном
масштабе, получим систему нормальных уравнений вида
ryx1  1   2 rx1x2   3 rx1x3  ...   m rx1xm ,

ryx2  1rx1x2   2   3rx1x3  ...   m rx1xm ,

........................................................
ryx  1rx x   2 rx x   3 rx x  ...   m ,
 m 1 m 2 m 3 m

ryxi rxi x j
где и – коэффициенты парной и межфакторной корреляции.

Коэффициенты «чистой» регрессии


bi связаны со стандартизованными

коэффициентами регрессии
i следующим образом:
y
bi   i
 xi
.
Поэтому можно переходить от уравнения регрессии в стандартизованном масштабе
(2.4) к уравнению регрессии в натуральном масштабе переменных (2.1), при этом

параметр a определяется как 1 1 2 2 a  y  b x  b x  ...  b x


m m.
Рассмотренный смысл стандартизованных коэффициентов регрессии позволяет их
использовать при отсеве факторов – из модели исключаются факторы с наименьшим

значением i .

На основе линейного уравнения множественной регрессии
y  a  b1 x1  b2 x2  ...  bm xm  
могут быть найдены частные уравнения регрессии:
 y x x , x ,..., x  f  x1  ,
 1 2 3 m
 y x x , x ,..., x  f  x2  ,
 2 1 3 m
.............................

 y xm x1 , x2 ,..., xm1  f  xm  ,

т.е. уравнения регрессии, которые связывают результативный признак с
x
соответствующим фактором i при закреплении остальных факторов на среднем уровне.
В развернутом виде систему (2.8) можно переписать в виде:
 y x1x2 , x3 ,..., xm  a  b1 x1  b2 x2  b3 x3  ...  bm xm   ,

 y x2 x1 , x3 ,..., xm  a  b1 x1  b2 x2  b3 x3  ...  bm xm   ,

........................................................................
 y x x , x ,..., x  a  b1 x1  b2 x2  b3 x3  ...  bm xm   .
 m 1 2 m1
При подстановке в эти уравнения средних значений соответствующих факторов
они принимают вид парных уравнений линейной регрессии, т.е. имеем
 y x1x2 , x3 ,..., xm  A1  b1 x1 ,

 y x2 x1 , x3 ,..., xm  A2  b2 x2 ,

................................
 y x x , x ,..., x  Am  bm xm ,
 m 1 2 m1
где
 A1  a  b2 x2  b3 x3  ...  bm xm ,
 A  a  b x  b x  ...  b x ,
 2 1 1 3 3 m m

..............................................

 Am  a  b1 x1  b2 x2  b3 x3  ...  bm1 xm1 .
В отличие от парной регрессии частные уравнения регрессии характеризуют
изолированное влияние фактора на результат, ибо другие факторы закреплены на
неизменном уровне. Эффекты влияния других факторов присоединены в них к
свободному члену уравнения множественной регрессии. Это позволяет на основе частных
уравнений регрессии определять частные коэффициенты эластичности:
xi
Эyx  bi 
i y bi
xi  x1 , x2 ,... xi 1 , xi 1 ,..., xm , где –

коэффициент регрессии для фактора


xi в уравнении множественной регрессии,
y
xi  x1 , x2 ,... xi 1 , xi 1 ,..., xm
– частное уравнение регрессии.
Наряду с частными коэффициентами эластичности могут быть найдены средние по
совокупности показатели эластичности:
xi
Эi  bi 
y xi
,
которые показывают на сколько процентов в среднем изменится результат, при
изменении соответствующего фактора на 1%. Средние показатели эластичности можно
сравнивать друг с другом и соответственно ранжировать факторы по силе их воздействия
на результат.
46.Основные элементы временного ряда. Моделирование
тенденции развития временного ряда. Классы трендовых
моделей

Распространенным способом моделирования тенденции временного ряда является


построение аналитической функции, характеризующей зависимость уровней ряда от
времени, или тренда. Этот способ называют аналитическим выравниванием временного
ряда.
Поскольку зависимость от времени может принимать разные формы, для ее
формализации можно использовать различные виды функций. Для построения трендов
чаще всего применяются следующие функции:
y  a  b  t
линейный тренд: t ;
y  a  b
гипербола:
t t ;
y  eabt y  a  bt
экспоненциальный тренд: t (или t );
y  a  t b
степенная функция: t ;
y  a  b  t  b  t 2  ...  b  t m
полиномы различных степеней: t 1 2 m .
Параметры каждого из перечисленных выше трендов можно определить обычным

МНК, используя в качестве независимой переменной время


t  1, 2, ..., n , а в качестве
y
зависимой переменной – фактические уровни временного ряда t . Для нелинейных
трендов предварительно проводят стандартную процедуру их линеаризации.
Существует несколько способов определения типа тенденции. К числу наиболее
распространенных способов относятся качественный анализ изучаемого процесса,
построение и визуальный анализ графика зависимости уровней ряда от времени. В этих
же целях можно использовать и коэффициенты автокорреляции уровней ряда. Тип
тенденции можно определить путем сравнения коэффициентов автокорреляции первого
порядка, рассчитанных по исходным и преобразованным уровням ряда. Если временной
y y
ряд имеет линейную тенденцию, то его соседние уровни t и t 1 тесно коррелируют. В
этом случае коэффициент автокорреляции первого порядка уровней исходного ряда
должен быть высоким. Если временной ряд содержит нелинейную тенденцию, например,
в форме экспоненты, то коэффициент автокорреляции первого порядка по логарифмам
уровней исходного ряда будет выше, чем соответствующий коэффициент, рассчитанный
по уровням ряда. Чем сильнее выражена нелинейная тенденция в изучаемом временном
ряде, тем в большей степени будут различаться значения указанных коэффициентов.
Выбор наилучшего уравнения в случае, когда ряд содержит нелинейную
тенденцию, можно осуществить путем перебора основных форм тренда, расчета по
каждому уравнению скорректированного коэффициента детерминации и средней ошибки
аппроксимации. Этот метод легко реализуется при компьютерной обработке данных.
Наиболее распространенным методом прогнозирования выступает аналитическое
выражение тренда. При этом, для выхода за границы исследуемого периода достаточно
продолжить значения независимой переменной – времени. При таком подходе к
прогнозированию предполагается, что размер уровня, характеризующего явление, формируется
под воздействием множества факторов, причем не представляется возможным выделить порознь
их влияние.
Экстраполяция дает возможность получить точечное значение прогноза. Точечный прогноз
есть оценка прогнозируемого показателя в точке (в конкретном году, месяце, дне) по уравнению,
описывающему тенденцию показателя.
Точечная оценка рассчитывается путем подстановки номера года t, на который
рассчитывается прогноз, в уравнение тренда. Она является средней оценкой для прогнозируемого
интервала времени.
Метод прогнозирования на основе экстраполяции тренда базируется на следующих
предпосылках:

1. исходный временной ряд должен описываться плавной кривой;

2. общие условия, определяющие тенденцию развития изучаемого явления в


прошлом и настоящем не должны претерпевать значительных изменений в
будущем;

3. исходный ряд динамики должен иметь достаточное число уровней, с тем, чтобы
отчетливо проявилась тенденция.

При этом наиболее существенным вопросом прогнозирования по трендовым моделям


является проблема точного прогноза.
Точная оценка прогноза весьма условна в силу следующих причин:

4. Выбранная для прогнозирования функция дает лишь приближенную оценку


тенденции, так как она не является единственно возможной.

5. Статистическое прогнозирование осуществляется на основе ограниченного объема


информации, что, в свою очередь, сказывается на величине доверительных
интервалов прогноза.

6. Наличие в исходном временном ряду случайного компонента приводит к тому, что


любой прогноз осуществляется лишь с определенной долей вероятности.

Рассматривая получение интервальных или точечных оценок прогноза следует учитывать,


что в отдельных случаях получение более точных оценок не гарантирует надежности прогноза.
Применение трендовых моделей прогнозирования социально-экономических явлений
имеет большую значимость и, несмотря на определенную простоту их реализации, часто
используются для прогнозирования сложных социально-эконо-мических явлений.
47. Моделирование сезонных колебаний временного ряда.
Индексы сезонности и их интерпретация

Простейший подход к моделированию сезонных колебаний – это расчет значений


сезонной компоненты методом скользящей средней и построение аддитивной или
мультипликативной модели временного ряда.
Общий вид аддитивной модели следующий:
Y T S  E.
Эта модель предполагает, что каждый уровень временного ряда может быть
представлен как сумма трендовой ( T ), сезонной ( S ) и случайной ( E ) компонент.
Общий вид мультипликативной модели выглядит так:
Y T S E.
Эта модель предполагает, что каждый уровень временного ряда может быть
представлен как произведение трендовой ( T ), сезонной ( S ) и случайной ( E )
компонент.
Выбор одной из двух моделей осуществляется на основе анализа структуры
сезонных колебаний. Если амплитуда колебаний приблизительно постоянна, строят
аддитивную модель временного ряда, в которой значения сезонной компоненты
предполагаются постоянными для различных циклов. Если амплитуда сезонных
колебаний возрастает или уменьшается, строят мультипликативную модель временного
ряда, которая ставит уровни ряда в зависимость от значений сезонной компоненты.
Построение аддитивной и мультипликативной моделей сводится к расчету
значений T , S и E для каждого уровня ряда.
Процесс построения модели включает в себя следующие шаги.
1) Выравнивание исходного ряда методом скользящей средней.
2) Расчет значений сезонной компоненты S .
3) Устранение сезонной компоненты из исходных уровней ряда и получение
выровненных данных ( T  E ) в аддитивной или ( T  E ) в мультипликативной модели.
4) Аналитическое выравнивание уровней ( T  E ) или ( T  E ) и расчет
значений T с использованием полученного уравнения тренда.
5) Расчет полученных по модели значений ( T  E ) или ( T  E ).
6) Расчет абсолютных и/или относительных ошибок. Если полученные
значения ошибок не содержат автокорреляции, ими можно заменить исходные уровни
ряда и в дальнейшем использовать временной ряд ошибок E для анализа взаимосвязи
исходного ряда и других временных рядов.
48. Моделирование тенденции развития временного ряда.
Прогнозная экстраполяция по уравнению тренда

Распространенным способом моделирования тенденции временного ряда является


построение аналитической функции, характеризующей зависимость уровней ряда от
времени, или тренда. Этот способ называют аналитическим выравниванием временного
ряда.
Поскольку зависимость от времени может принимать разные формы, для ее
формализации можно использовать различные виды функций. Для построения трендов
чаще всего применяются следующие функции:
y  a  b  t
линейный тренд: t ;
y  a  b
гипербола:
t t ;
y  eabt y  a  bt
экспоненциальный тренд: t (или t );
y  a  t b
степенная функция: t ;
y  a  b  t  b  t 2  ...  b  t m
полиномы различных степеней: t 1 2 m .
Параметры каждого из перечисленных выше трендов можно определить обычным

МНК, используя в качестве независимой переменной время


t  1, 2, ..., n , а в качестве
y
зависимой переменной – фактические уровни временного ряда t . Для нелинейных
трендов предварительно проводят стандартную процедуру их линеаризации.
Существует несколько способов определения типа тенденции. К числу наиболее
распространенных способов относятся качественный анализ изучаемого процесса,
построение и визуальный анализ графика зависимости уровней ряда от времени. В этих
же целях можно использовать и коэффициенты автокорреляции уровней ряда. Тип
тенденции можно определить путем сравнения коэффициентов автокорреляции первого
порядка, рассчитанных по исходным и преобразованным уровням ряда. Если временной
y y
ряд имеет линейную тенденцию, то его соседние уровни t и t 1 тесно коррелируют. В
этом случае коэффициент автокорреляции первого порядка уровней исходного ряда
должен быть высоким. Если временной ряд содержит нелинейную тенденцию, например,
в форме экспоненты, то коэффициент автокорреляции первого порядка по логарифмам
уровней исходного ряда будет выше, чем соответствующий коэффициент, рассчитанный
по уровням ряда. Чем сильнее выражена нелинейная тенденция в изучаемом временном
ряде, тем в большей степени будут различаться значения указанных коэффициентов.
Выбор наилучшего уравнения в случае, когда ряд содержит нелинейную
тенденцию, можно осуществить путем перебора основных форм тренда, расчета по
каждому уравнению скорректированного коэффициента детерминации и средней ошибки
аппроксимации. Этот метод легко реализуется при компьютерной обработке данных.
49. Использование фиктивных переменных для
моделирования сезонных колебаний временного ряда

В регрессионных моделях с временными рядами используется три основных вида


фиктивных переменных:
1) Переменные-индикаторы принадлежности наблюдения к определенному
периоду - для моделирования скачкообразных структурных сдвигов. Границы периода
(моменты "скачков") должны быть установлены из априорных соображений. Например, 1,
если наблюдение принадлежит периоду 1941-45 гг. и 0 в противном случае. Это пример
использования для моделирования временного структурного сдвига. Постоянный
структурный сдвиг моделируется переменной равной 0 до определенного момента
времени и 1 для всех наблюдений после этого момента времени.
Сезонные переменные - для моделирования сезонности. Сезонные переменные
принимают разные значения в зависимости от того, какому месяцу или кварталу года или
какому дню недели соответствует наблюдение.
Линейный временной тренд - для моделирования постепенных плавных
структурных сдвигов. Эта фиктивная переменная показывает, какой промежуток времени
прошел от некоторого "нулевого" момента времени до того момента, к которому
относится данное наблюдение (координаты данного наблюдения на временной шкале).
Если промежутки времени между последовательными наблюдениями одинаковы, то
временной тренд можно составить из номеров наблюдений.
Фиктивные переменные помогают отразить тот факт, что коэффициенты линейной
регрессии могут меняться во времени. В простейшем случае изменяется константа, а тем
самым и мат. ожидание зависимой переменной.
Пусть исходная модель имеет вид Yt = а + pXt + єґ и предполагается, что а линейно
зависит от фиктивной переменной Ft: а = а0 + а1 Ft. Тогда уравнение изменится
следующим образом: Yt = а0 + а1 Ft + в X + st, оставаясь линейным по параметрам.
Коэффициенты при значащих переменных тоже могут быть подвержены
изменениям. Проинтерпретировать это можно так, что сила их влияния на независимую
переменную меняется со временем.
Например, в рассмотренном уравнении может быть pt = в + в 1 Ft. Тогда Yt = а + во
Xt + р1 FtXt + є. Эта модель также остается линейной по параметрам. Коэффициент р1
показывает, как исходный коэффициент в зависит от времени. С помощью
соответствующей t-статистики можно проверить гипотезу, что р1 = 0 (в не меняется со
временем).
Можно предложить следующий тест на стабильность коэффициентов модели во
времени.
Для его проведения нужно добавить в уравнения произведения всех исходных
регрессоров и фиктивной переменной. Например, в модель Yt = а + р1 Xt1 + РXt2 + є
следует добавить регрессоры Ft, Xt1Ft и Xt2Ft. Если коэффициенты при добавочных
переменных значимы в совокупности (применяем F-статистику), то нельзя отвергнуть
гипотезу о том, что коэффициенты изменяются со временем.
Тест Чоу представляет собой частный случай описанного теста. Для временных
рядов тест Чоу - это тест на то, что в определенный момент времени произошло
скачкообразное изменение коэффициентов регрессии.
Временной тренд отличается от бинарных фиктивных переменных тем,2 3 что
имеет смысл использовать его степени: t, t и т.д.
Они помогают моделировать гладкий, но нелинейный тренд. (Бинарную
переменную нет смысла возводить в степень, потому что в результате получится та же
самая переменная.)
Можно также комбинировать три указанных вида фиктивных перемен-ных,
создавая переменные "взаимодействия" соответствующих эффектов. Пусть Y -
квартальные данные по некоторому показателю.
Его поведение можно смоделировать, представляя мат. ожидание как комбинацию
линейного тренда и сезонности.

Y = "о + "і t + ві Qti + рг Qt2 + вз Qt3 + Yi Qit + Yi Qn t + Y Qn t + є,

где t - тренд, Q i - квартальные сезонные переменные 1


Qtj = j если j-й квартал 0
Иначе Qt4 не нужно вводить в эту регрессию, так как есть константа, а Qt41 не
нужно вводить в регрессию, так как есть временной тренд t.
Если все Yj ф 0, то это означает, что структура сезонности линейно изменяется со
временем.
Комбинация рассмотренных фиктивных переменных позволяет моделировать еще
один эффект - изменение наклона тренда с определенного момента. Помимо тренда в
регрессию следует тогда ввести следующую переменную: в начале выборки до некоторого
момента времени она равна 0, а вторая ее часть представляет собой временной тренд (1, 2,
3 и т.д. в случае одинаковых интервалов между наблюдениями) .
Регрессионные модели с фиктивными переменными являются альтернативой
ARIMA-моделям и регрессионным моделям с AR - или MA-процессом в ошибке. В
первом случае изменение мат. ожидания во времени можно назвать детерминированным
трендом, во втором - стохастическим (строго говоря термин "стохастический тренд"
употребляют только по отношению к нестационарным процессам). Решить, какой вид
модели применять, сложно. Дело в том, что трудно отличить (в случае малых выборок),
когда случайная величина имеет линейный детерминированный тренд со стационарными
отклонениями от него, а когда она формируется нестационарным авторегрессионным
процессом. То же самое верно для выбора способа моделирования сезонности.
Использование фиктивных переменных имеет следующие преимущества:
Интервалы между наблюдениями не обязательно должны быть одинаковыми. В
выборке могут быть пропущенные наблюдения.
Коэффициенты при фиктивных переменных легко интерпретировать, они наглядно
представляют структуру динамического процесса.
Для оценивания модели не приходится выходить за рамки классического метода
наименьших квадратов.
50.Автокорреляция остаточной компоненты временного ряда.
Выявление автокорреляции по критерию Дарбина - Уотсона

Автокорреляция в остатках может быть вызвана несколькими причинами,


имеющими различную природу.

1. Она может быть связана с исходными данными и вызвана наличием ошибок


измерения в значениях результативного признака.
2. В ряде случаев автокорреляция может быть следствием неправильной
спецификации модели. Модель может не включать фактор, который оказывает
существенное воздействие на результат и влияние которого отражается в остатках,
вследствие чего последние могут оказаться автокоррелированными. Очень часто этим

фактором является фактор времени t .


От истинной автокорреляции остатков следует отличать ситуации, когда причина
автокорреляции заключается в неправильной спецификации функциональной формы
модели. В этом случае следует изменить форму модели, а не использовать специальные
методы расчета параметров уравнения регрессии при наличии автокорреляции в остатках.
Один из более распространенных методов определения автокорреляции в остатках
– это расчет критерия Дарбина-Уотсона:
n

    t 1 
2
t
d t 2
n


t 1
t
2

.
Т.е. величина d есть отношение суммы квадратов разностей последовательных
значений остатков к остаточной сумме квадратов по модели регрессии.
Можно показать, что при больших значениях n существует следующее

соотношение между критерием Дарбина-Уотсона d и коэффициентом автокорреляции

остатков первого порядка


r1 :
d  2   1  r1  .
Таким образом, если в остатках существует полная положительная автокорреляция и

r1  1 , то d  0 . Если в остатках полная отрицательная автокорреляция, то r1  1 и,


следовательно, d  4 . Если автокорреляция остатков отсутствует, то
r1  0 и d  2.

Т.е. 0  d  4 .
Алгоритм выявления автокорреляции остатков на основе критерия Дарбина-

Уотсона следующий. Выдвигается гипотеза


H0 об отсутствии автокорреляции остатков.

Альтернативные гипотезы
H1 и H1* состоят, соответственно, в наличии положительной
или отрицательной автокорреляции в остатках. Далее по специальным таблицам (см.

приложение E) определяются критические значения критерия Дарбина-Уотсона


dL и

dU для заданного числа наблюдений n , числа независимых переменных модели m и

уровня значимости  . По этим значениям числовой промежуток  0; 4 разбивают на

пять отрезков. Принятие или отклонение каждой из гипотез с вероятностью 1


осуществляется следующим образом:

0  d  dL – есть положительная автокорреляция остатков,


H0 отклоняется, с

вероятностью P  1   принимается
H1 ;
d L  d  dU – зона неопределенности;

dU  d  4  dU – нет оснований отклонять


H 0 , т.е. автокорреляция остатков
отсутствует;

4  dU  d  4  d L – зона неопределенности;

4  dL  d  4 – есть отрицательная автокорреляция остатков,


H0

отклоняется, с вероятностью P  1   принимается H1* .


Если фактическое значение критерия Дарбина-Уотсона попадает в зону
неопределенности, то на практике предполагают существование автокорреляции остатков

и отклоняют гипотезу
H0 .