Вы находитесь на странице: 1из 11

Исходные данные.

Регион Тираж, тыс.экз. Стоимость рекламы, тыс.у.е.


Ростовская область 350 1,6
Курская область 125 1,2
Воронежская область 400 2
Московская область 875 2,6
Ставропольский край 450 2
Хабаровский край 200 1,3
Вологодская область 100 0,8
Волгоградская область 300 1,7
Рязанская область 175 1,3
Красноярский край 225 1,5
Иркутская область 85 0,9
Томская область 325 1,6
Тюменская область 400 2,1
Краснодарский край 500 2,2
Ленинградская область 800 2,7

Задание 1.

Построить поле корреляции.

Задание 2.

Рассчитать коэффициент ковариации, линейный коэффициент корреляции


Пирсона, коэффициент детерминации.

1) Вычисление σx, σy и rxy


Промежуточные результаты расчетов
Регион Тираж, тыс.экз. X Стоимость рекламы, тыс.у.е. Y x2 y
2
xy
Ростовская область 350 1,6 122500 2,56 560
Курская область 125 1,2 15625 1,44 150
Воронежская область 400 2 160000 4 800
Московская область 875 2,6 765625 6,76 2275
Ставропольский край 450 2 202500 4 900
Хабаровский край 200 1,3 40000 1,69 260
Вологодская область 100 0,8 10000 0,64 80
Волгоградская область 300 1,7 90000 2,89 510
Рязанская область 175 1,3 30625 1,69 227,5
Красноярский край 225 1,5 50625 2,25 337,5
Иркутская область 85 0,9 7225 0,81 76,5
Томская область 325 1,6 105625 2,56 520
Тюменская область 400 2,1 160000 4,41 840
Краснодарский край 500 2,2 250000 4,84 1100
Ленинградская область 800 2,7 640000 7,29 2160
Ср. значение 354 1,7 176690 3,188666667 719,7666667
Сумма 5310 25,5 2650350 47,83 10796,5

2
, σx=√ 176690−354 =226,6583332

2
, σy= √ 3,188666667−1,7 =0,546504041

,
719,7666667−354∗1,7
rxy= 226,6583332∗0,546504041 =0,952344855

Коэффициент корреляции можно рассчитать с помощью функции КОРРЕЛ()


из MS Excel.

или с помощью анализа данных


  Тираж, тыс.экз. X Стоимость рекламы, тыс.у.е. Y
Тираж, тыс.экз. X 1
Стоимость рекламы,
тыс.у.е. Y 0,952344855 1

или
Регрессионная статистика
Множественный R 0,952344855
R-квадрат 0,906960722
Нормированный R-квадрат 0,899803855
Стандартная ошибка 0,17906079
Наблюдения 15

2) Проверка значимости rxy

Формулируем гипотезы:

H0= ρ=0

H1= ρ ≠0

Устанавливаем уровень значимости α=0,05

0,952344855
tнабл= 1−0,952344855 =1,209950671
√ 15−2

1−0,952344855
σr=
√ 15−2
= 0,787093952

Находим критическое значение критерия по таблице Стьюдента по уровню


значимости α и по числу степеней свободы k=n-2

tкр( α;k=n-2)

tкр(0,05;13)=2,16

Для определения tкр может использоваться статистическая функция


СТЬЮДРАСПОБР() из MS Excel.

tкр = t(α,n-2) = СТЬЮДРАСПОБР(0,05;13) = 2,160368656


Так как tнабл< tкр оснований отклонять нулевую гипотезу нет.

1,209950671<2,160368656

С надежностью, большей 0,95 и риском ошибиться меньшим 0,05, можно


утверждать, что между x и y ( между тиражом и стоимостью рекламы) в
генеральной совокупности ( для всех регионов) существует линейная
корреляционная связь.

Доверительный интервал коэффициента корреляции в генеральной


совокупности.

rxy - tкр σr< ρ < rxy + tкр σr


0,952344855- 2,160368656*0,787093952< ρ < 0,952344855+2,160368656*0,787093952

-0,74806825< ρ <2,652758

С надежностью 0,95 и риском ошибиться 0,05 можно утверждать, что


коэффициент корреляции между X и Y (между тиражом и стоимостью
рекламы) в генеральной совокупности (для всех регионов) находится в
интервале от -0,74806825 до 2,652758.

3) Рассчитаем коэффициент ковариации

,
Промежуточные результаты расчетов
Регион Тираж, тыс.экз. X Стоимость рекламы, тыс.у.е. Y x-xср y-yср (x-xср)(y-yср)
Ростовская область 350 1,6 -4 -0,1 0,4
Курская область 125 1,2 -229 -0,5 114,5
Воронежская область 400 2 46 0,3 13,8
Московская область 875 2,6 521 0,9 468,9
Ставропольский край 450 2 96 0,3 28,8
Хабаровский край 200 1,3 -154 -0,4 61,6
Вологодская область 100 0,8 -254 -0,9 228,6
Волгоградская область 300 1,7 -54 0 0
Рязанская область 175 1,3 -179 -0,4 71,6
Красноярский край 225 1,5 -129 -0,2 25,8
Иркутская область 85 0,9 -269 -0,8 215,2
Томская область 325 1,6 -29 -0,1 2,9
Тюменская область 400 2,1 46 0,4 18,4
Краснодарский край 500 2,2 146 0,5 73
Ленинградская область 800 2,7 446 1 446
Ср. значение 354 1,7 0 0,00 117,9666667
Сумма 5310 25,5 0 0,00 1769,5

117,966666666667
cov(x,y)= 15
= 117,9666667

Связь между тиражом и стоимостью рекламы прямая.

Также коэффициент ковариации можно рассчитать с помощью функции


КОВАРИАЦИЯ.Г() из MS Excel.

4) Рассчитаем коэффициент детерминации

, r2 xy=0,9523448552=0,906960722

Таким образом стоимость рекламы зависит от тиража на 90,7%.


Также коэффициент детерминации можно рассчитать с помощью анализа
данных из MS Excel.
Регрессионная статистика
Множественный R 0,952344855
R-квадрат 0,906960722
Нормированный R-квадрат 0,899803855
Стандартная ошибка 0,17906079
Наблюдения 15

Задание 3.

Оценить параметры модели парной линейной регрессии, запишите линейное


уравнение регрессии.

1) Определим коэффициенты a и b линейной регрессии.

Промежуточные результаты расчетов для линейной регрессии.

Регион Тираж, тыс.экз. X Стоимость рекламы, тыс.у.е. Y x2 y


2
xy
Ростовская область 350 1,6 122500 2,56 560
Курская область 125 1,2 15625 1,44 150
Воронежская область 400 2 160000 4 800
Московская область 875 2,6 765625 6,76 2275
Ставропольский край 450 2 202500 4 900
Хабаровский край 200 1,3 40000 1,69 260
Вологодская область 100 0,8 10000 0,64 80
Волгоградская область 300 1,7 90000 2,89 510
Рязанская область 175 1,3 30625 1,69 227,5
Красноярский край 225 1,5 50625 2,25 337,5
Иркутская область 85 0,9 7225 0,81 76,5
Томская область 325 1,6 105625 2,56 520
Тюменская область 400 2,1 160000 4,41 840
Краснодарский край 500 2,2 250000 4,84 1100
Ленинградская область 800 2,7 640000 7,29 2160
Ср. значение 354 1,7 176690 3,188667 719,7666667
Сумма 5310 25,5 2650350 47,83 10796,5

,
719,7666667−1,7∗354
b=
176690−354 2
=0,002296233

a=1,7-0,002296233*354=0,88713357
Уравнение линейной регрессии: y = 0,88713357+ 0,002296233х.

2) Вычислим показатели качества

Промежуточные результаты расчетов


Стоимость рекламы,
Регион Тираж, тыс.экз. X тыс.у.е. Y (y˄-yi)^2 (y-y^)/y
Ростовская область 350 1,6 0,008247 -0,05676
Курская область 125 1,2 0,000668 0,021531
Воронежская область 400 2 0,037781 0,097187
Московская область 875 2,6 0,087816 -0,11398
Ставропольский край 450 2 0,00633 0,039781
Хабаровский край 200 1,3 0,002151 -0,03568
Вологодская область 100 0,8 0,100335 -0,39595
Волгоградская область 300 1,7 0,015375 0,072939
Рязанская область 175 1,3 0,000122 0,008481
Красноярский край 225 1,5 0,009257 0,064143
Иркутская область 85 0,9 0,033238 -0,20257
Томская область 325 1,6 0,001116 -0,02088
Тюменская область 400 2,1 0,086656 0,140178
Краснодарский край 500 2,2 0,027143 0,074886
Ленинградская область 800 2,7 0,000582 -0,00893
Ср. значение 354 1,7 0,027788 -0,02104
Сумма 5310 25,5 0,416816 -0,31562
Коэффициент корреляции rxy =0,952344855

Коэффициент детерминации r2 xy=0,9523448552=0,906960722

Cредняя квадратическая ошибка εкв

0,416816

, Ɛкв=
√ 15
=0,166696523

Cредняя ошибки аппроксимации

1
∗(−0,31562 )∗100 %
, = 15 =-0,02254

Задание 4.

На уровне значимости α=0,05 проверьте значимость уравнения регрессии в


целом
H0:R2=0

H1:R2>0

Устанавливаем уровень значимости α=0,05

Найдем наблюдаемое значение критерия

SSR/(m−1 )
F набл.=
SSE /(n−m)

SSR=∑ ( ^y x −~y)2 , SSE=∑ ( y− ^y x )2

6,294739953
2−1
Fнабл= 0,416815964 = 196,3255404
15−2

По таблице распределения Фишера найдем критическое значение критерия


или можно воспользоваться формулой FРАСПОБР().
F кр=F (α ; m−1;п−m)

Fкр=FРАСПОБР(0,05;1;13)= 4,667192732

Fнабл.>Fкр.

Нулевая гипотеза отклоняется в пользу альтернативной о статистической


значимости уравнения регрессии в целом.

Задание 5.

На уровне значимости α=0,05 проверьте значимость оценок параметров


модели парной линейной регрессии.

Н0:β1=0

Н1:β1≠0

Устанавливаем уровень значимости α=0,05

Находим наблюдаемое значение критерия


b
t набл. =
Sb

Cтандартная ошибка коэффициента регрессии


S2yx
Sb =
√ 2
nσ (x)

Стандартная ошибка уравнения регрессии

SSE
S yx =
√ n−m

0,416815964
S yx =
√ 15−2
=0,17906079

0,17906079
Sb =
√ 15∗226,6583331801412
=0,00020398

0,002296233
t набл. = =11,2572614
0,00020398

Находим критическое значение критерия по таблице Стьюдента по уровню


значимости α и по числу степеней свободы k=n-m или может использоваться
статистическая функция СТЬЮДРАСПОБР().
t кр.(α ;k=n−m)

t кр.(α =0,05 ;k=15−2)=¿2,160368656

|tнабл.|>tкр.

Нулевая гипотеза отклоняется в пользу альтернативной о статистической


значимости коэффициента регрессии b.

Доверительный интервал неизвестного значения β1


b−t кр. Sb < β 1 <b+ t кр . S b

0,002296233-2,160368656*0,00020398¿ β 1< ¿0,002296233+2,160368656*0,00020398

0,001855565< β 1 <0,002736 9

С надежностью 0,95 и риском ошибиться 0,05 можно утверждать, что


коэффициент регрессии b в генеральной совокупности находится в интервале
от 0,001855565 до 0,002737
Так как интервал не включает 0, коэффициент регрессии значим.

Н0:β0=0

Н1:β0≠0
2

Sa=√ S 2xy *
√∑ x i
2
nσ ¿¿

Sa=√ 0,179060792* √ 2650350 =0,08574112


15∗226,6583332

0,88713357
t набл. = =10,34665224
0,00006774

tкр=2,160368656

tнабл>tкр

Нулевая гипотеза отклоняется в пользу альтернативной о статистической


значимости коэффициента регрессии a.

Доверительный интервал неизвестного значения β0


a−t кр. Sa < β 0 < a+t кр. Sa

0,88713357- 2,160368656* 0,08574112¿ β 0 <¿0,88713357+2,160368656* 0,08574112

0,701901138¿ β 0 <1,072366001

С надежностью 0,95 и риском ошибиться 0,05 можно утверждать, что


коэффициент регрессии a в генеральной совокупности находится в интервале
от 0,701901138 до 1,072366
Так как интервал не включает 0, коэффициент регрессии значим.

Задание 6

Построение точечного и интервального прогноза для значения x = x* по


уравнению линейной регрессии. X*=150

Точечный прогноз

Y * =0,88713357+ 0,002296233х*=0,88713357+ 0,002296233*150=1,231569