Вы находитесь на странице: 1из 5

Хлескина Юлия

Студент группы РФ-18-1


Вариант 7
Тема № 9
«Регрессионный анализ: множественные линейные модели»
Задание:
1. Построить множественную линейную модель регрессии. Провести статистическую
значимость коэффициентов регрессии с помощью доверительных интервалов с
надежностью 90% и проверок гипотез.
2. Верифицировать модель дисперсионным анализом (принять уровень значимости
равным 5%). Определить качество модели и частные коэффициенты эластичности.
3. Провести точечный и интервальный прогноз по модели.

yi x1 x2 yi x1 x2
3,9 5 100 6 9 210
3,9 6 140 6,4 11 220
3,7 4 150 6,8 9 220
4 8 160 7,2 11 250
3,8 12 170 8 12 280
4,8 9 190 8,2 12 290
5,4 10 190 8,1 12 300
4,4 5 200 8,5 12 310
5,3 6 200 9,6 14 320
6,8 8 200 9 14 360

Решение:
1. Рассмотрим общую линейную функцию, имеющую k = 2 переменных.
y i=b0 +b1 x 1i +b 2 x2 i . Для нахождения оценок неизвестных параметров используем
метод наименьших квадратов в векторно-матричной форме Y = XB+ E , где

3,9 1 5 100
3,9 1 6 140

[] [ ]
3,7 1 4 150
4 1 8 160
3,8 1 12 170
4,8 1 9 190
5,4 1 10 190
4,4 1 5 200
5,3 1 6 200
Y = 6,8 X= 1 8 200
6 1 9 210
6,4 1 11 220
6,8 1 9 220
7,2 1 11 250
8 1 12 280
8,2 1 12 290
8,1 1 12 300
8,5 1 12 310 ε1
b0
9,6
9
,
1
1
14
14
320
360
,
[]
B= b1
b2
и
[]
E= ⋮
ε 10
.
T
R=E E →min . Найдем вектор:
0 ,641 −0, 022 −0, 0017 123, 8 0,152

[
^B=( X T X )−1 ( X T Y ) = −0, 022 0, 017 −0, 0006 1259 , 5 = 0,045
−0 ,0017 −0, 0006 3 ,474 E−05 29974 0, 025 , т.е. ][ ] [ ]
b^ =0,152
0 b^ =0 , 045
, 1 b^ =0 , 025, 2 . Получаем оцененную линейную модель:
^y i= b^ 0 + b^ 1 x 1i + b^ 2 x2 i , ^y i=0 ,152+0 ,045 x 1i +0 , 025 x 2i .

Проверим статистическую значимость полученных оценок неизвестных параметров, т.е.:

1. Построим доверительные интервалы. b^ i −Δ i <bi < b^ i +Δ i .


Δ i=t γ D^ ( b^ i )
, где t γ ( γ , n−k )=t γ ( 0,9 ;20−2 )=0 , 127
2
yi x1 x2 ^y i ( y i − ^y i )
3,9 5 100 2,8936 1,012841
3,9 6 140 3,945518 0,002072
3,7 4 150 4,107451 0,166017
4 8 160 4,538842 0,290351
3,8 12 170 4,970233 1,369444
4,8 9 190 5,339008 0,29053
5,4 10 190 5,383918 0,000259
4,4 5 200 5,411122 1,022368
5,3 6 200 5,456032 0,024346
6,8 8 200 5,545851 1,57289
6 9 210 5,842513 0,024802
6,4 11 220 6,184084 0,04662
6,8 9 220 6,094265 0,498062
7,2 11 250 6,939341 0,067943
8 12 280 7,739507 0,067857
8,2 12 290 7,991259 0,043573
8,1 12 300 8,243012 0,020452
8,5 12 310 8,494764 2,74E-05
9,6 14 320 8,836335 0,583184
9 14 360 9,843344 0,71123
123,8 189 4460 123,8 7,81487
Rmin =7 , 815 . Чтобы найти D^ ( b^ i ) , нужно найти матрицу (обозначим ее H) и рассмотреть
ее главную диагональ:
0,641 −0,022 −0,0017 7 ,815 0,278 −0, 009 −0 ,00075
H=( X X )T
n−k
−1
= −0, 022
Rmin
0, 17
[ −0,0006
−0,0017 −0, 0006 3, 474 E−05
18
= −0, 009 0, 0075 −0 ,00028
−, 00075 −0, 00028 1, 508 E−05 ] [ ]
D^ ( b^ 0 )=0 , 278 , D^ ( b^ 1 )=0 , 0075 , D^ ( b^ 2 )=1, 508 E−05 . Тогда :
Отсюда,
Δ 1=0 ,127⋅√0 ,278=0,067 , Δ 2=0 ,127⋅√ 0 ,0075=0,011 ,
Δ 3=0,127⋅√1 , 508 Е−05=0 , 00049 . В итоге, доверительные интервалы: 0 , 083<b 0 <0 , 219
, 0 , 034<b1 <0 , 056 , 0 , 025<b 2 <0 , 026 . То есть в полученных доверительных интервалах
bi не принимает нулевое значение.

2. Проверим гипотезы о статистической незначимости рассматриваемых параметров.


H 0 :bi =0 , i=0,1,2 при уровне значимости α=0,05 . По критерию Стьюдента,
который имеет двустороннюю критическую область, найдем критическую точку
t кр ( α ;n−k ) =t кр ( 0 , 05 ;18 )=2,1 . Затем найдем наблюдаемые точки по формуле
b^ i
t 0=
√ D^ ( b^ )i

0 , 152
t 0 ( 0 )= =0 , 287
√ 0 , 278 - не попадает в критическую область, следовательно, основная
гипотеза принимается. Это говорит о том, что параметр принимает нулевое значение и он
является несущественным.
0 , 045
t 0(1 )= =0 , 518
0, 0075 - не попадает в критическую область, следовательно, основная
гипотеза принимается, параметр принимает нулевое значение – параметр не значимый.
2 2 2
0 ,025 yi ^y i ( y i − ȳ ) ( ^y i − ȳ ) ( y i − ^y i )
t 0(2 )= =6 ,482 3,9 2,89 5,244 10,866 1,013
1 ,508 E−05 - попадает в
3,9 3,946 5,244 5,038 0,0021
критическую область, следовательно,
3,7 4,107 6,2 4,337 0,166
основная гипотеза отклоняется, что
4 4,539 4,796 2,726 0,29
говорит о статистической значимости
3,8 4,97 5,712 1,488 1,369
параметра.
4,8 5,339 1,932 0,724 0,291

Эластичность ( ȳ=6,19 , x̄ 1=9 , 45 , 5,4 5,384 0,624 0,6498 0,00026


4,4 5,411 3,204 0,607 1,0224
x̄ 2=223 ) : 5,3 5,456 0,792 0,539 0,0243
6,8 5,546 0,372 0,415 1,573
' x̄ 1 9 , 45
E yx1 =b^ 1 =0 , 045⋅ =0 , 231 6 5,843 0,036 0,121 0,025
ȳ 6 ,19 - y 3,4997E-
6,4 6,184 0,044 0,0466
изменяется на 0,23% от своего среднего 05
6,8 6,094 0,372 0,0092 0,498
значения при изменении x 1 на 1% от 7,2 6,939 1,02 0,562 0,0679
своего среднего. 8 7,74 3,276 2,401 0,0679
8,2 7,991 4,04 3,245 0,0436
x̄2 223
E'yx =b^ 2 =0 , 025⋅ =1, 618 8,1 8,243 3,648 4,215 0,0205
2 ȳ 6 , 19 - y 8,5 8,495 5,336 5,312 2,742E-05
изменится на 1,6% от своего среднего 9,6 8,836 11,628 7,003 0,5832
при изменении x 2 на 1% от своего 9 9,843 7,896 13,347 0,711
123,
среднего. 8
123,8 71,418 63,603 7,815

2. Проведем верификацию модели


дисперсионным анализом в регрессии. TSS=RSS+ ESS. Общая сумма квадратов:
TSS=∑ ( y i − ȳ )2 =71 , 418.
Cумма квадратов, объясненная регрессией:
2
ESS=∑ ( ^y i− ȳ ) =63 ,603 .
Остаточная сумма квадратов:
2
RSS=∑ ( y i− y^ i ) =7 , 815
. 71,418=63,603+7,815. При уровне значимости 5%
выдвинем основную гипотезу о непригодности модели для дальнейшего
исследования: 0 i Н :b =0 .
Используем критерий Фишера (правосторонняя
критическая область), найдем критическую точку:
RSS 7 , 815
k −1 1
F0 = = =−6 , 245 .
ESS 63 , 603
F кр ( α ,k−1 ,n−k )=F кр ( 0 ,05;1 ;18 ) =4 , 414 . n−k 18
Наблюдаемая точка не входит в критическую область, поэтому основная гипотеза
принимается, т.е. параметр принимает нулевое значения и модель не верифицирована.
3. Но предположим, что оцененная модель пригодна для дальнейшего исследования.
Тогда определим качество модели с помощью коэффициента детерминации
ESS
(
R2 = 1−
TSS )
⋅100 %=89 , 06 %.
х
89,06% влияния оказывает фактор i и 10,94%
приходятся на другие неучтенные модели факторов. Скорректированный
ESS 63 ,603
2 n−k 18
R̄ =1− =1− =0 , 994 .
TSS 71 , 418
коэффициент детерминации: n−1 1 99,4% влияния
оказывают факторы.
Предположим, что имеются прогнозные значения:
 Точечный прогноз
x 0 - прогнозное значение фактора-1, который составляет 110% от среднего значения.

x 01= x̄1⋅1,1=9 , 45⋅1,1=10 , 395 , x 02= x̄2⋅1,1=223⋅1,1=245 , 3 .

x 0=( x 01 ; x 02 )=( 10 , 395 ;245 ,3 )


Тогда .
^y 0 =b^ 0 + b^ 1 x 01 + b^ 2 x 02 =0 , 152+0 , 045⋅10 , 395+0 , 025⋅245 , 3=6 ,794 .

 Интервальный прогноз

1+γ
^y 0 −Δ< ^y 0 < ^y 0 + Δ , где (
t γ 1−
2 )
;n−k =t γ ( 0 , 05 ;18 )=2 , 101
,

0,64 −0,022 −0,0017


R
2 0 T −1 0 T min 0 T −1 0 T

[ [
D^ ( ^y0)=S [1+x ( X X ) ( x ) ]= [1+x ( X X ) ( x ) ]=0,434⋅¿¿⋅ 1+ [10,395 245,3 ] −0,022 0,017 −0,00064
n−k

Δ=t γ⋅ D^ ( y^ 0 ) =2, 101⋅√ 0, 458=1, 422 .


] [ ]]
−0,0017 −0,00064 3,474E−05
10,395
245,3
=0,434⋅(1+0,0559 )=0,458.


Тогда,
6 , 794−1, 422< ^y 0 <6 , 794+1 , 422 , 5 ,371< ^y 0 <8 , 216

Вам также может понравиться