Вы находитесь на странице: 1из 12

Министерство науки и высшего образования Российской Федерации

Федеральное государственное бюджетное образовательное учреждение


высшего образования
«Уфимский государственный нефтяной технический университет»
(Филиал ФГБОУ ВО «УГНТУ» в г. Салавате)
Кафедра «Информационных технологий»

Корреляционный и регрессионный анализ

Лабораторная работа
ПАРНЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ:
ПОСТРОЕНИЕ МОДЕЛИ В ВИДЕ ПАРНОЙ РЕГРЕССИИ И ПРОВЕРКА ЕЕ
КАЧЕСТВА
ЭАПП –15.04.04- 01.01.21 ЛР

Исполнитель:
студент гр. МАГ01-19-21 Е. В. Сиротина

Руководитель:
доцент, канд. тех. наук Т. М. Левина

Салават 2020
ПАРНЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ:

ПОСТРОЕНИЕ МОДЕЛИ В ВИДЕ ПАРНОЙ РЕГРЕССИИ И ПРОВЕРКА ЕЕ


КАЧЕСТВА

Цель работы: ознакомится с процедурой проведения регрессионного анализа,


построить модель в виде парной регрессии и проверить ее качества.
Лабораторная работа включает следующие этапы:
- постановку задачи;
- ознакомление с порядком выполнения работы MS Excel;
- выполнение расчетов индивидуальных задач на компьютере и анализ
результатов;
- подготовку письменного отчета с выводами по работе;
- защиту лабораторной работы.
Задание. На основании данных таблицы 1 для соответствующего варианта
(таблица 2):

Таблица 1 – Исходные данные


Переменная х Переменная у
0.16 21.1
0.80 20.6
0.94 20.7
0.26 22.1
0,27 20.2
0,47 19.0
0.34 21.3
0.31 20.2
0.65 20.0
0.06 21.4
0.14 20.7
0.10 20.9
0.81 20.3
0.19 21.6
0.39 20.1
0.91 19.6
0,64 20.3
0,87 18.5
0,33 20.9
0.92 19.5
0.49 20.1
0.17 20.0
0.47 20.1
0.79 20.9
0.22 21.2
0.39 21.0
0.57 19.5
0.24 20.0
0.0S 21.6
0.53 19.9
0.24 21.2
0,12 22.0
0.76 20.6
0.61 20.2
0.85 20.5
0.39 21.9
0.23 21.2
0.77 20.1
0.29 22.1
0.99 19.6
0.83 20.0
0.44 21.5
0.03 22.2
0,07 21.8
0,75 20.1

1. Построить предложенные в таблице 2 уравнения регрессии, включая


линейную регрессию.
2. Вычислить показатели качества и точности для каждого уравнения.
3. Проверить значимость уравнений регрессии при уровнях значимости 0,05 и
0,01.
4. Определить лучшее уравнение регрессии на основе средней ошибки
аппроксимации.
5. Проверить значимость коэффициентов линейной регрессии и построить
~
доверительные интервалы для точных значений параметров
~a
и b уравнения
линейной регрессии с уровнем значимости 0,05.
6. Построить точечный и интервальный прогноз для значения x = xmax по
уравнению линейной регрессии с уровнем значимости 0,05.
7. Определить средний коэффициент эластичности по уравнению линейной
регрессии.
8. Графически представить результаты моделирования.

Таблица 2 – Варианты кривых выравнивания


Виды кривых выравнивания
Графы из табл. 1
Вариант Экспонен Показа Логарифм Гипербо-
(Х,У) Линейная Степенная
циальная тельная ическая лическая
1 1.14 * *

Решение

1) Определим коэффициенты a и b линейной регрессии, используя


результаты промежуточных расчетов, приведенные в таблице 3.

Таблица 3 – Промежуточные результаты расчетов для линейной регрессии


x y x2 y2 xy ^y |( ^y − y ) / y| ( ^y − y )2 ( y− ȳ )2
1 0,16 21,10 0,0256 445,21 3,376 21,1958 0,0045 0,0092 0,2219
2 0,8 20,60 0,64 424,36 16,48 20,0028 0,0290 0,3566 0,0008
3 0,94 20,70 0,8836 428,49 19,458 19,7418 0,0463 0,9181 0,0051
4 0,26 22,10 0,0676 488,41 5,746 21,0094 0,0494 1,1895 2,1642
5 0,27 20,20 0,0729 408,04 5,454 20,9907 0,0391 0,6252 0,1839
6 0,47 19,00 0,2209 361 8,93 20,6179 0,0852 2,6177 2,6533
7 0,34 21,30 0,1156 453,69 7,242 20,8602 0,0206 0,1934 0,4504
8 0,31 20,20 0,0961 408,04 6,262 20,9162 0,0355 0,5129 0,1839
9 0,65 20,00 0,4225 400 13 20,2824 0,0141 0,0797 0,3955
10 0,06 21,40 0,0036 457,96 1,284 21,3822 0,0008 0,0003 0,5946
11 0,14 20,70 0,0196 428,49 2,898 21,2330 0,0258 0,2841 0,0051
12 0,1 20,90 0,01 436,81 2,09 21,3076 0,0195 0,1661 0,0735
13 0,81 20,30 0,6561 412,09 16,443 19,9842 0,0156 0,0998 0,1082
14 0,19 21,60 0,0361 466,56 4,104 21,1398 0,0213 0,2117 0,9431
15 0,39 20,10 0,1521 404,01 7,839 20,7670 0,0332 0,4449 0,2797
16 0,91 19,60 0,8281 384,16 17,836 19,7978 0,0101 0,0391 1,0586
17 0,64 20,30 0,4096 412,09 12,992 20,3010 0,0001 0,0000 0,1082
18 0,87 18,50 0,7569 342,25 16,095 19,8723 0,0742 1,8833 4,5322
19 0,33 20,90 0,1089 436,81 6,897 20,8789 0,0010 0,0004 0,0735
20 0,92 19,50 0,8464 380,25 17,94 19,7791 0,0143 0,0779 1,2744
21 0,49 20,10 0,2401 404,01 9,849 20,5806 0,0239 0,2310 0,2797
22 0,17 20,00 0,0289 400 3,4 21,1771 0,0589 1,3856 0,3955
23 0,47 20,10 0,2209 404,01 9,447 20,6179 0,0258 0,2682 0,2797
24 0,79 20,90 0,6241 436,81 16,511 20,0214 0,0420 0,7719 0,0735
25 0,22 21,20 0,0484 449,44 4,664 21,0839 0,0055 0,0135 0,3262
26 0,39 21,00 0,1521 441 8,19 20,7670 0,0111 0,0543 0,1377
27 0,57 19,50 0,3249 380,25 11,115 20,4315 0,0478 0,8677 1,2744
28 0,24 20,00 0,0576 400 4,8 21,0466 0,0523 1,0955 0,3955
29 0,08 21,60 0,0064 466,56 1,728 21,3449 0,0118 0,0651 0,9431
30 0,53 19,90 0,2809 396,01 10,547 20,5061 0,0305 0,3673 0,5313
31 0,24 21,20 0,0576 449,44 5,088 21,0466 0,0072 0,0235 0,3262
32 0,12 22,00 0,0144 484 2,64 21,2703 0,0332 0,5324 1,8799
33 0,76 20,60 0,5776 424,36 15,656 20,0774 0,0254 0,2732 0,0008
34 0,61 20,20 0,3721 408,04 12,322 20,3570 0,0078 0,0246 0,1839
35 0,85 20,50 0,7225 420,25 17,425 19,9096 0,0288 0,3486 0,0166
36 0,39 21,90 0,1521 479,61 8,541 20,7670 0,0517 1,2836 1,6157
37 0,23 21,20 0,0529 449,44 4,876 21,0653 0,0064 0,0181 0,3262
38 0,77 20,10 0,5929 404,01 15,477 20,0587 0,0021 0,0017 0,2797
39 0,29 22,10 0,0841 488,41 6,409 20,9534 0,0519 1,3146 2,1642
40 0,99 19,60 0,9801 384,16 19,404 19,6486 0,0025 0,0024 1,0586
41 0,83 20,00 0,6889 400 16,6 19,9469 0,0027 0,0028 0,3955
42 0,44 21,50 0,1936 462,25 9,46 20,6738 0,0384 0,6825 0,7588
43 0,03 22,20 0,0009 492,84 0,666 21,4381 0,0343 0,5805 2,4684
44 0,07 21,80 0,0049 475,24 1,526 21,3635 0,0200 0,1905 1,3715
45 0,75 20,10 0,5625 404,01 15,075 20,0960 0,0002 0,0000 0,2797
19182,8
∑ 20,88 928,30 13,41 423,78 928,3097 1,1614 20,1093 33,0724
7

С
р.
0,464 20,629 0,29808 426,286 9,41738 20,62910 0,0258099 0,44687 0,73494
зн
ач

yx  yx 9,417  20,629  0,464


b   1,865
x2  x2 0,2981  0, 4642 ,
a  y  b  x  20,629  ( 1,865)  0,464  21,494.
Уравнение линейной регрессии: y = 21,494 – 1,865· х.
2) Для построения степенной модели yx =a0*xa1 введем новые переменные
x’ = lnx; y’ = lny, вычислим значения новых переменных и выполним
промежуточные расчеты (таблица 4).

Таблица 4 – Промежуточные результаты расчетов для логарифмической регрессии


lnx lny ln2x ln2y lnx*lny y=f(x) (f(x)- (f(x)-y)2 (y-yср)2
y)/y
1 -1,833 3,049 3,358 9,298 -5,588 21,112 0,001 0,000 0,222
2 -0,223 3,025 0,050 9,152 -0,675 20,084 0,025 0,266 0,001
3 -0,062 3,030 0,004 9,182 -0,187 19,984 0,035 0,512 0,005
4 -1,347 3,096 1,815 9,583 -4,170 20,797 0,059 1,699 2,164
5 -1,309 3,006 1,714 9,034 -3,935 20,772 0,028 0,327 0,184
6 -0,755 2,944 0,570 8,670 -2,223 20,418 0,075 2,012 2,653
7 -1,079 3,059 1,164 9,356 -3,300 20,624 0,032 0,457 0,450
8 -1,171 3,006 1,372 9,034 -3,520 20,683 0,024 0,234 0,184
9 -0,431 2,996 0,186 8,974 -1,291 20,214 0,011 0,046 0,396
10 -2,813 3,063 7,915 9,384 -8,619 21,764 0,017 0,132 0,595
11 -1,966 3,030 3,866 9,182 -5,958 21,200 0,024 0,250 0,005
12 -2,303 3,040 5,302 9,240 -6,999 21,422 0,025 0,272 0,074
13 -0,211 3,011 0,044 9,064 -0,634 20,077 0,011 0,050 0,108
14 -1,661 3,073 2,758 9,441 -5,103 21,000 0,028 0,360 0,943
15 -0,942 3,001 0,887 9,004 -2,826 20,537 0,022 0,191 0,280
16 -0,094 2,976 0,009 8,854 -0,281 20,004 0,021 0,164 1,059
17 -0,446 3,011 0,199 9,064 -1,344 20,224 0,004 0,006 0,108
18 -0,139 2,918 0,019 8,513 -0,406 20,032 0,083 2,348 4,532
19 -1,109 3,040 1,229 9,240 -3,370 20,643 0,012 0,066 0,074
20 -0,083 2,970 0,007 8,823 -0,248 19,998 0,026 0,248 1,274
21 -0,713 3,001 0,509 9,004 -2,141 20,392 0,015 0,085 0,280
22 -1,772 2,996 3,140 8,974 -5,308 21,072 0,054 1,150 0,396
23 -0,755 3,001 0,570 9,004 -2,266 20,418 0,016 0,101 0,280
24 -0,236 3,040 0,056 9,240 -0,717 20,092 0,039 0,652 0,074
25 -1,514 3,054 2,293 9,327 -4,624 20,905 0,014 0,087 0,326
26 -0,942 3,045 0,887 9,269 -2,867 20,537 0,022 0,215 0,138
27 -0,562 2,970 0,316 8,823 -1,670 20,297 0,041 0,635 1,274
28 -1,427 2,996 2,037 8,974 -4,275 20,848 0,042 0,720 0,396
29 -2,526 3,073 6,379 9,441 -7,761 21,570 0,001 0,001 0,943
30 -0,635 2,991 0,403 8,944 -1,899 20,342 0,022 0,196 0,531
31 -1,427 3,054 2,037 9,327 -4,358 20,848 0,017 0,124 0,326
32 -2,120 3,091 4,496 9,555 -6,554 21,301 0,032 0,489 1,880
33 -0,274 3,025 0,075 9,152 -0,830 20,116 0,023 0,234 0,001
34 -0,494 3,006 0,244 9,034 -1,486 20,254 0,003 0,003 0,184
35 -0,163 3,020 0,026 9,123 -0,491 20,047 0,022 0,205 0,017
36 -0,942 3,086 0,887 9,526 -2,906 20,537 0,062 1,858 1,616
37 -1,470 3,054 2,160 9,327 -4,488 20,876 0,015 0,105 0,326
38 -0,261 3,001 0,068 9,004 -0,784 20,108 0,000 0,000 0,280
39 -1,238 3,096 1,532 9,583 -3,832 20,726 0,062 1,887 2,164
40 -0,010 2,976 0,000 8,854 -0,030 19,952 0,018 0,124 1,059
41 -0,186 2,996 0,035 8,974 -0,558 20,062 0,003 0,004 0,396
42 -0,821 3,068 0,674 9,413 -2,519 20,460 0,048 1,081 0,759
43 -3,507 3,100 12,296 9,611 -10,871 22,236 0,002 0,001 2,468
44 -2,659 3,082 7,072 9,498 -8,196 21,660 0,006 0,020 1,372
45 -0,288 3,001 0,083 9,004 -0,863 20,125 0,001 0,001 0,280
∑ 3,039 136,162 80,741 412,081 -142,969 927,372 1,141 19,615 33,072
Ср.з -1,043 3,026 1,794 9,157 -3,177 20,608 0,025 0,436 0,735
нач.

1 1 n ∑ ( ln x⋅ln y )−∑ ln x ∑ ln y
ln a0 = ∑ ln y− a1 ∑ ln x a1 = 2
n n , n ∑ ( ln x )2 −( ∑ ln y )

Вычислим значения параметров


ln x  ln y  ln x  ln y 3,177  ( 1,043  3,026)
a1    0,031
ln 2 x  ln x
2
1,794  1,0432 ,
ln a 0  ln y  a 1 ln x  3,026  ( 0,031)  ( 1,043)  2,993;
a 0  exp  2,993  19,946 .

Уравнение степенной регрессии имеет вид: y = 19,946 * x-0,031 .


3) Вычисление показателей качества: индекс корреляции R , коэффициент
детерминации R2, средняя квадратическая ошибка εкв, средняя ошибки
аппроксимации A.
Для линейной модели (табл. 3)
n

  ŷ  yi 
2
i
R  1 i 1
n
 0,626
 y  y
2
i
i 1 ,
R2 = 0,6262= 0,392,
n

  ŷ  yi 
2
i
20,08
 кв  i1
  0,668
n 45 ,
1 n y  yˆ 1
A 
n i1 y
 100%  1,1615  100%  2,581%
45
Для степенной модели модели (табл. 4)
n

  ŷ  yi 
2
i
R  1 i 1
n
 0,637
 y  y
2
i
i 1 ,
R2 = 0,6372= 0,4069,
n

  ŷ  yi 
2
i
19,602
 кв  i 1
  0,660
n 45 ,
1 n y  yˆ 1
A 
n i1 y
 100%  1,14  100%  2,536%
45
4) Проверка значимости уравнений регрессии.
Для линейной модели
R2 n  m 1 0.392 45  1  1
Fфиш      27,723
1 R 2
m 1  0.392 1
Fкрит,0,05 = FРАСПОБР(0,05;1;43)=4,067.
Fкрит,0,01 = FРАСПОБР(0,01;1;43)=7,264.
При α = 0,05 и α = 0,01 линейное уравнение значимо.
Для степенной модели
R2 n  m 1 0.407 45  1  1
Fфиш      29,5
1 R 2
m 1  0.407 1
Fкрит,0,05 = FРАСПОБР(0,05;1;43)=4,067.
Fкрит,0,01 = FРАСПОБР(0,01;1;43)=7,264.
При α = 0,05 и α = 0,01 линейное уравнение значимо.
5) Определение лучшего уравнения регрессии (по средней ошибке
аппроксимации).

Так как A лин  2,581%  A степ  2,536% , то степенная модель дает меньшую
погрешность.
6) Проверка значимости коэффициентов линейной регрессии.
2
Определим оценку остаточной дисперсии s ост
n

  ŷ  yi 
2
i
19,603
s2ост  i 1
  0, 456
 n  2 43

σ x = x́2 - x́2 = √ 0,2981- 0,464 2 =0,2877 ,



n

  ŷ  yi  /  n  2 
2
i
s2ост 0,456
sb  i 1
n
   0,05
x n 0, 2877 * 45
 x  x
2
i
i 1

n n n

  ŷ i  yi 
2
x 2
i x
i 1
2
i
13,41
sa  i 1 i 1
 s2ост  0,456  0,19
 n  2 n
 xn 45*0, 2877
 x  x
2
i
i 1

Вычислим
a 21,494 b 1,865
ta    429,88 tb    9,816
sa 0,05 , sb 0,19 .
Значение t1-α,n-2 определим по таблице 6
Таблица 6 – Значения критических уровней tα,k в зависимости от k степеней свободы
и заданного уровня значимости α для распределения Стьюдента
α
0.1 0.05 0.025 0.02 0.01 0.005 0.001
k
1 6.31 12.71 25.45 31.S2 63.66 127.32 636.62
2 2.92 4.30 6.21 6.96 9.92 14.09 31.60
3 2.35 3.18 4.18 4.54 5.84 7.45 12.92
4 2.13 2.78 3.50 3.75 4.60 5.60 8.61
5 2.02 2.57 3.16 336 4.03 4.77 6.87
6 1.94 2.45 2.97 3.14 3.71 4.32 5.96
7 1.89 2.36 2.S4 3.00 3.50 4.03 5.41
8 1.86 2.31 2.75 2.90 336 3.83 5.04
9 1.83 2.26 2.69 2.82 335 3.69 4.78
20 1.81 2.23 2.63 2.76 3.17 3.58 4.59
21 1.80 2.20 2.59 2.72 3.11 3.50 4.44
12 1.78 2.18 2.56 2.6S 3.05 3.43 4.32
13 1.77 2.16 2.53 2.65 3.01 3.37 4.22
24 1.76 2.14 2.51 2.62 2.9S 3.33 4.14
15 1.75 2.13 2.49 2.60 2.95 3.29 4.07
26 1.75 2.12 2.47 2.5S 2.92 3.25 4.01
17 1.74 2.11 2.46 2.57 2.90 3.22 3.97
28 1.73 2.10 2.45 2.55 2.SS 3.20 3.92
19 1.73 2.09 2.43 2.54 2.86 3.17 3.88
20 1.72 2.09 2.42 2.53 2.85 3.15 3.85
21 1.72 2.08 2.41 2.52 2.83 3.14 3.82
22 1.72 2.07 2.41 2.51 2.82 3.12 3.79
23 1.71 2.07 2.40 2.50 2.81 3.10 3.77
24 1.71 2.06 2.39 2.49 2.80 3.09 3.75
25 1.71 2.06 2.38 2.49 2.79 3.08 3.73
26 1.71 2.06 2.38 2.4S 2.7S 3.07 3.71
27 1.70 2.05 2.37 2.47 2.77 3.06 3.69
28 1.70 2.05 2.37 2.47 2.76 3.05 3.67
29 1.70 2.05 2.36 2.46 2.76 3.04 3.66
30 1.70 2.04 236 2.46 2.75 3.03 3.65
35 1.69 2.03 234 2.44 2.72 3.00 3.59
40 1.6S 2.02 233 2.42 2.70 2.97 3.55
45 2.68 2.01 232 2.41 2.69 2.95 3.52
50 1.6S 2.01 231 2.40 2.6S 2.94 3.50
60 1.67 2.00 230 2.39 2.66 2.91 3.46
70 1.67 1.99 239 2.3S 2.65 2.90 3.44
80 1.66 1.99 238 2.37 2.64 2.89 3.42
200 1.66 1.98 238 236 2.63 2.87 3.39
∞ 1.64 1.96 234 2.33 2.5S 2.81 3.29

При α = 0,05 и степени свободы k = n–2 = 45–2 = 43 получаем t1-α,n-2 = 2,016.


Так как |ta| = 429,88 > t1-α,n-2 = 2,016, то делаем вывод о значимости
коэффициента a.
Так как |tb|= 9,816 > t1-α,n-2 = 2,016, то делаем вывод о значимости коэффициента
b.
7) Определение доверительных интервалов для точных значений параметров
~
и b уравнения линейной регрессии.
~a
~
Доверительный интервал для точного значения параметра a
(21,494 – 2,016·0,19; 21,494 + 2,016·0,19) = (21,111; 21,877).
~
Доверительный интервал для точного значения параметра b
(-1,865 – 2,016·0,05; -1,865 + 2,016·0,05) = (-1,966; -1,764).
8) Построение точечного и интервального прогноза для значения x = xmax по
уравнению линейной регрессии.
xmax = 0,99.
Точечный прогноз yp:
уp = 21,494 -1,865 · xmax = 21,494 -1,865 ·0,99 = 19,645.
Вычислим

1  x  x 1  0,99  0, 464 
2 2

s yp  sост 1   n max  0,456  1    0,689.


n 45 12,947
  xi  x 
2

i 1

Интервальный прогноз
( ( y p - t1-α,n-2 * s y p ; y p+ t1-α,n-2 * s y p p ) =
= (19,645 – 2,016·0,689; 19,645 + 2,016·0,689) = (19,256; 21,034)
8) Определение среднего коэффициента эластичности по уравнению линейной
регрессии
x 0, 464
Yb  ( 1,865)  0,042.
y 20,629

Вывод: в данной лабораторной работе мы ознакомились с процедурой


проведения регрессионного анализа, построили модель в виде парной регрессии и
проверили ее качества. В результате получили:
1) Уравнение линейной регрессии y = 21,494 – 1,865· х.
2) Уравнение логарифмической регрессии y = 19,946*x(-0,031).
3) Показатели качества и точности:
Для линейной модели
R = 0,626,
R2 = 0,392,
εкв =0,668,
A = 2.581%.
Для степенной модели
R = 0,637 ,
R2 = 0,407,
εкв =0,660,
A = 2.536%.
4) Линейное уравнение значимо при α = 0,05 и при α = 0,01.
Степенное уравнение значимо при α = 0,05 и при α = 0,01.
5) Степенная модель дает меньшую погрешность.
6) Коэффициент a значим, коэффициент b значим.
7) Доверительный интервал для точного значения параметра
~
(21,111; 21,877), для b (-1,966; -1,764).
~a

8) Точечный прогноз уp = 19,645.


Интервальный прогноз (19,256; 21,034).
9) Средний коэффициент эластичности Ý = -0,042.
10) Графическое представление результатов моделирования (рисунок 1).

22.50

22.00

21.50

21.00

20.50

20.00

19.50

19.00

18.50

18.00
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1

Исходные данные Линейная модель Степенная модель

Рисунок 1 — Графическое представление результатов моделирования