Вы находитесь на странице: 1из 4

Хлескина Юлия

Студент группы РФ-18-1


Вариант 7
Тема № 10
«Регрессионный анализ: особенности множественной линейной регрессии»
Задание:
1. Построить матрицу парных и частных коэффициентов корреляции. Сделать вывод о наличии
мультиколлинеарности.
2. Ввести в модель фиктивные переменные, провести анализ модели.
3. Дать интерпретацию полученным результатам.

Изучается уровень оценки квартир в Октябрьском районе города Иркутска (По у ) в зависимости
от количества этажей в доме ( х 1 ) и ценой квартиры в тысячах рублей ( х 2 ).

у х1 х2 у х1 х2
3,9 5 100 6 9 210
3,9 6 140 6,4 11 220
3,7 4 150 6,8 9 220
4 8 160 7,2 11 250
3,8 12 170 8 12 280
4,8 9 190 8,2 12 290
5,4 10 190 8,1 12 300
4,4 5 200 8,5 12 310
5,3 6 200 9,6 14 320
6,8 8 200 9 14 360

Решение:
1. Построим матрицу парных коэффициентов корреляции:

1 r yx r yx 2

[
A= r yx
1

r yx 2
1
r x 1 x2
1

r x1x2
1 ] .

у у х1 2
у х1 х2
х1 х2 y x 21 x 22
х2
3,9 5 100 19,5 390 500 15,21 25 10000
3,9 6 140 23,4 546 840 15,21 36 19600
3,7 4 150 14,8 555 600 13,69 16 22500
4 8 160 32 640 1280 16 64 25600
3,8 12 170 45,6 646 2040 14,44 144 28900
4,8 9 190 43,2 912 1710 23,04 81 36100
5,4 10 190 54 1026 1900 29,16 100 36100
4,4 5 200 22 880 1000 19,36 25 40000
5,3 6 200 31,8 1060 1200 28,09 36 40000
6,8 8 200 54,4 1360 1600 46,24 64 40000
6 9 210 54 1260 1890 36 81 44100
6,4 11 220 70,4 1408 2420 40,96 121 48400
6,8 9 220 61,2 1496 1980 46,24 81 48400
7,2 11 250 79,2 1800 2750 51,84 121 62500
8 12 280 96 2240 3360 64 144 78400
8,2 12 290 98,4 2378 3480 67,24 144 84100
8,1 12 300 97,2 2430 3600 65,61 144 90000
8,5 12 310 102 2635 3720 72,25 144 96100
9,6 14 320 134,4 3072 4480 92,16 196 102400
9 14 360 126 3240 5040 81 196 129600
123,8 189 4460 1259,5 29974 45390 837,74 1963 1082800
Найдем коэффициенты корреляции:
n ∑ yx 1 −∑ y ∑ x1 20⋅1259 ,5−123 , 8⋅189
r yx = = 2 2
=0 , 797
2 2
1

√(n ∑ y −(∑ y ) )( n∑ x −(∑ x ) ) √ (20⋅837 ,74−( 123 , 8) )(20⋅1963−( 189 ) )


2 2
1 1

n ∑ yx 2 −∑ y ∑ x 2 20⋅29974−123 , 8⋅4460
r yx = = 2 2
=0 , 945
2 2
√ ) √( 20⋅837 , 74−( 123 , 8 ) )(20⋅1082800−( 4460 ) )
2 2 2
(
( n ∑ y − ( ∑ y ) ) n ∑ x 2− ( ∑ x 2 )
n ∑ x 1 x 2 − ∑ x2 ∑ x 1 20⋅45390−4460⋅189
rx x = = =0 , 821
1 2
√ ( n ∑ x −( ∑ x ) ) ( n ∑ x − ( ∑ x ) )
12 1
2 2
2 2
2
√( 20⋅1963−( 189 )2 )( 20⋅1082800−( 4460 )2 )
Тогда матрица будет иметь вид:

1 0,797 0,945

[
А= 0,797 1 0,821
0,945 0,821 1 ]
Коэффициент корреляции выше 0,75, поэтому между факторами существует высокая корреляция.
Следовательно, можно говорить о эффекте мультиколлинеарности.
Построим матрицу частных коэффициентов корреляции:
r yx 1−r yx2 r x1 x 2 0 . 797−0 . 945⋅0. 821
r yx 1 / x2= = 2 2
=0 .121
√(1−r )(1−r ) √ (1−( 0 . 945) )(1− ( 0. 821 ) )
2
yx
2
2
x x
1 2

r yx2 −r yx1 r x1 x 2 0 . 945−0 . 797⋅0 . 821


r yx 2 /x1 = = 2 2
=0 .837
√ ( 1−r 2yx1 )( 1−r 2x 1 x2 ) √( 1−( 0 . 797 ) )(1−( 0 . 821 ) )
r x 1 x2 −r yx 2 r yx1 0 . 821−0 . 945⋅0 . 797
r x1 x 2 / y = = =0 . 345
2 2
√ ( 1−r )(1−r ) √ (1−( 0 . 945 ) )(1− ( 0. 797 ) )
2
yx
2
2
yx
1

Тогда матрица имеет вид:

1 0,121 0,837

[
А= 0 ,121 1 0,345
0 ,837 0,345 1 ]
Другим способом оценки мультиколлинеарности является нахождение определителя матрицы
Т T
Х Х : det ( X X )=101869600 - эффекта мультиколлинеарности нет.

2. Введем фиктивные переменные. Изучаются оценки квартиры в Октябрьском районе города


Иркутска в зависимости от количества этажей в доме:
¿8
d=¿ {0, ¿ ¿¿¿
при количестве этажей
при количестве этажей ¿8

3. 9 1 5 100 1
3. 9 1 6 140 0

[] [ ]
3. 7 1 4 150 0
4 1 8 160 0
3. 8 1 12 170 0
4. 8 1 9 190 1
5. 4 1 10 190 0
4. 4 1 5 200 1
5. 3 1 6 200 1
Y = 6. 8 X= 1 8 200 0
6 1 9 210 0
6. 4 1 11 220 1
6. 8 1 9 220 0
7. 2 1 11 250 0
8 1 12 280 1
8. 2 1 12 290 0
8. 1 1 12 300 1 b0
8. 5
9. 6
9
1
1
1
12
14
14
310
320
360
0
1
0 []
b
B= 1
b2
b3
ε1
E= ⋮
ε 20 []
b^ 0

Найдем оценочные значения параметров:


^
B=
[] b^
b^ 2
b^
1

3
. Используем МНК: R=E T E →min .

0 . 673 −0 .0254 −0 . 0016 −0 .083 123 . 8 0 .118


−1
B^ =( X T X ) ( X T Y ) =
[
−0.025 0 . 0177 −0. 00065 0 .0095 1259 . 5 0. 049
−0.002 −0. 00065 3 . 55 E−05 −0.0004 29974
−0.083 0 . 0095 −0 . 0004 0. 214 50 . 5
=
0 . 025
0 . 085
][ ] [ ]
b^ 0 =0 .118 , b^ 1 =0 . 049 , b^ 2 =0 . 025 , b^ 3=0 . 085 . Оцененная модель имеет вид:
^y i= b^ 0 + b^ 1 x 1 + b^ 2 x 2 + b^ 3 d .
2 2 2
у х1 x2 d ( y i − ȳ ) ^y i ( y i − ^y i ) ( ^y i − ȳ )
3,9 5 100 1 5,244 2,948 0,907 10,511
3,9 6 140 0 5,244 3,912 0,000 5,189
3,7 4 150 0 6,200 4,065 0,133 4,516
4 8 160 0 4,796 4,510 0,260 2,823
3,8 12 170 0 5,712 4,955 1,333 1,526
4,8 9 190 1 1,932 5,394 0,352 0,634
5,4 10 190 0 0,624 5,357 0,002 0,693
4,4 5 200 1 3,204 5,449 1,101 0,549
5,3 6 200 1 0,792 5,498 0,039 0,479
6,8 8 200 0 0,372 5,510 1,664 0,462
6 9 210 0 0,036 5,809 0,036 0,145
6,4 11 220 1 0,044 6,241 0,025 0,003
6,8 9 220 0 0,372 6,059 0,549 0,017
7,2 11 250 0 1,020 6,907 0,086 0,514
8 12 280 1 3,276 7,791 0,044 2,562
8,2 12 290 0 4,040 7,956 0,060 3,119
8,1 12 300 1 3,648 8,291 0,036 4,414
8,5 12 310 0 5,336 8,456 0,002 5,136
9,6 14 320 1 11,628 8,889 0,506 7,282
9 14 360 0 7,896 9,804 0,647 13,062
123,8 189 4460 71,418 123,8 7,781 63,637
RSS 63 , 64
R2 = ⋅100 %= ⋅100 %=89 , 1
Коэффициент детерминации: TSS 71 , 42 . 89,1% составляет влияние
факторов Х на Y, 10,895% влияния приходится на другие неучтенные модели факторов.
ESS 7 , 781
n−k 16
R2 =1− =1− =0 , 871.
TSS 71 , 42
Скорректированный коэффициент детерминации: n−1 19
Отсюда, 87,1% составляет влияния факторов Х на Y.
3. В данной модели коэффициент детерминации равен 89,1% и скорректированный
коэффициент детерминации – 87,1%, значит, факторы «количество этажей» и «цена за
квартиру» сильно влияют на оценку квартиры.
В предыдущей модели коэффициент детерминации был равен 89,06% и скорректированный
коэффициент детерминации – 99,4%.

Вам также может понравиться