Вы находитесь на странице: 1из 14

Задание 2.

Значения для расчёта №5 [151; 210]

1) Ряд данных выборки «Зарплата»

Зарплата
Зарплата № х-
№ х- (тыс.
(тыс. тики
тики лей)
лей) 31 198
1 171 32 207
2 202 33 196
3 218 34 198
4 223 35 166
5 198 36 207
6 196 37 184
7 168 38 212
8 162 39 201
9 168 40 194
10 176 41 205
11 168 42 192
12 198 43 201
13 192 44 184
14 206 45 176
15 172 46 190
16 175 47 205
17 177 48 213
18 209 49 195
19 191 50 193
20 196 51 198
21 198 52 202
22 129 53 195
23 193 54 206
24 191 55 172
25 185 56 192
26 171 57 203
27 221 58 181
28 182 59 196
29 173 60 218
30 201

220
Интерва 129- 136- 143- 150- 157- 164- 171- 178- 185- 192- 199- 206- 213- -
л 135 142 149 156 163 170 177 184 191 198 205 212 219 226
Частота 1 0 1 2 3 6 6 8 3 9 7 4 7 1
2.1) Ряд распределения, с шагом интервала по 6 тыс. лей.
2.2) Графическое изображение интервального ряда

Распределение рабочих по
величине зарплаты
10
9
8
7
6
5
4
3
2
1
0
142- 148- 154- 160- 166- 172- 178- 184- 190- 196- 202- 208- 214- 220- 226-
148 154 160 166 172 178 184 190 196 202 208 214 220 226 232

Вывод: Гистограмма служит наглядным изображением данного интервального ряда.

3) Показатели размера и интенсивности вариации.


• Размах вариации R

R=232-142=90 (тыс. лей)


Вывод: Размах вариации показывает пределы [142;232], в которых изменяется величина признака
данной совокупности и составляет 90 тыс. лей.
• Среднее линейное отклонение
Для начала найдём середину интервалов и вычислим взвешенную среднюю.
Середина
Часто
интервала( xini
та (ni)
xi)
132 1 145 48,6
139 0 0 0
146 1 157 36,6
152 2 326 61,2
160 3 507 73,8
167 6 1050 111,6
174 6 1086 75,6
181 8 1496 52,8
188 3 579 1,8
195 9 1791 48,6
202 7 1435 79,8
209 4 844 69,6
216 7 1519 163,8
223 1 223 29,4
2 458 70,8
1161
Итого: 60 6 924

N
∑ x i ni
X̄ = i =1N
∑ ni
i =1

X̄ = 11616/60 = 193,6 (тыс. лей)

d=
∑|x−x|⋅ni
∑ ni
d=924/60 =15,4 (тыс. лей)
Вывод: Среднее линейное отклонение учитывает различия всех единиц совокупности зарплаты и
показывает, что в среднем каждое значение признака отклоняется от средней величины на 191,99
тыс. лей.
• Дисперсия
Середина
Частот
интервала(xi
а (ni)
)
2361,9
145 1
6
151 0 0
1339,5
157 1
6
1872,7
163 2
2
1815,4
169 3
8
2075,7
175 6
6
181 6 952,56
187 8 348,48
193 3 1,08
199 9 262,44
205 7 909,72
1211,0
211 4
4
3832,9
217 7
2
223 1 864,36
2506,3
229 2
2
Итого: 60 20354,4

D=
∑ ( x−x )2 ni
ni
D=20354,4/60 = 339,24 тыс.лей
Используем взвешенную дисперсию для данных. Разброс случайной величины вокруг её
математического ожидания составляет 339,24 тыс.лей.
• Среднее квадратическое отклонение

σ =√ D
σ=√ 339,24=18,42
Вывод: Масштаб возможного отклонения случайной величины от её математического ожидания
составляет 18,42 тыс. лей.
• Несмещённая оценка дисперсии
S=
∑ ( x−x ) ni
2

ni−1
S=20354,4/59=344,99
Вывод: Исправленная выборочная дисперсия является несмещенной оценкой генеральной
дисперсии.
• Оценка среднеквадратического отклонения
s= √ S
s= √344,99=18,57
Вывод: Мера отклонения относительно среднего значения составляет 18,5 тыс. лей.
• Коэффициент вариации
σ
V = ⋅100 %

V =(18 , 42/193 ,6 )∗100 %=9 ,51 %


d
K o = ∗100 %

15 , 4
K o= ∗100 %=7, 95 %
193 , 6
Вывод: Чем больше значение коэффициента вариации, тем больше разброс значений признака
вокруг средней. Коэффициент вариации меньше 33%, а значит совокупность однородная.

4) Показатели асимметрии и эксцесса


• Показатель асимметрии Пирсона As

∑ ( x−x )3 ni
3= N
Середина
Частот
интервала(xi xini
а (ni)
)
145 1 145 -114791
151 0 0 0
157 1 157 -49027,9
163 2 326 -57305,2
169 3 507 -44660,8
175 6 1050 -38609,1
181 6 1086 -12002,3
187 8 1496 -2299,97
193 3 579 -0,648
199 9 1791 1417,176
205 7 1435 10370,81
211 4 844 21072,1
217 7 1519 89690,33
223 1 223 25412,18
229 2 458 88723,73
Итого: 60 11616 -82010,9

3=-82010,9/60=-1366,85
3
As= 3/ σ

As=-1366,83/ 18,42 =-0,22<0


3

• Показатель асимметрии Asp1


f Mo−f Mo−1
Mo=X Mo +i Mo
( f Mo −f Mo−1 )+(f Mo −f Mo+1 )

Mo =196+6*(9-3)/[(9-3)+(9-7)]=199,75

x−Me
Asp1= σ
Asp1=(193,6-199,75)/18,42=-0,33<0

• Показатель асимметрии Asp2

Частот Накопленна
Интервал
а я частота
142 148 1 1
148 154 0 1
154 160 1 2
160 166 2 4
166 172 3 7
172 178 6 13
178 184 6 19
184 190 8 27
190 196 3 30
196 202 9 39
202 208 7 46
208 214 4 50
214 220 7 57
220 226 1 58
226 232 2 60
60

n+1
−S Me−1
2
Me=X Me +i Me∗
f Me
n+1
N Me =
2
N Me =61/2=30,5→[196-202]

9¿
Me=196+6∗30,5−30¿ ¿
¿ =196,33
3∗( x−Me )
Asp2= σ
Asp2=[3*(193.6-196.33)]/18.42=-0,44<0

• Показатель асимметрии Cay


(Q3−Me)−( Me−Q 1)
Cay=
(Q3−Me)+(Me−Q1 )
Σ ¿ +1
−F Q −1
Q1=x0+h0 4 1

nQ 1

61/4=15,25→[178;184]
Q1=178+6*[(15,25-13)/6]=180,25
Q2=Me=196,33
3⋅ Σ ¿ +1
−F3−1
Q3=x0+h0¿( 4
)
nQ 3

(3*61)/4=45,75→[202;208]
Q3=202+6*[(45,75-39)/7]=207,78
(207 ,78−196 , 33)−(196 , 33−108 , 25 )
Cay= =−293 ,13 /99 ,53=−2 , 94
(207 , 78−196 . 33 )+(196 .33−108 , 25)

• Показатель асимметрии Cab


( D 9−Me )−( Me−D 1 )
Cab=
( D 9−Me)+( Me−D 1)
Σ ¿ +1
−F D
D1=x0+h0* 10 1−1

nD 1

61/10=6,1→[166;172]
D1=166+6*(6,1-4)/3=170,2
9 Σ ¿ +1
−F D
D9=x0 +h0* 10 9−1

nD 9

(9*61)/10=54,9→[214;220]
D9=214+6*(54,9-50)/7=218,2
(218 , 2−196 , 33 )−(196 , 33−170 , 2 )
Cab= =−344 , 66/48=−7 , 18
(218 , 2−196 , 33 )+(196 , 33−170 , 2)
Вывод: Данные коэффициенты служат для характеристики асимметрии полигона вариационного
ряда. Так как они отрицательные, то более пологий спуск полигона наблюдается слева от вершины.

• Показатель эксцесса
¿
Еk= (4/ σ ¿4 ¿ ¿ )-3

∑ ( x−x )4 ni
4= N

Середина Частот
интервала(xi) а (ni)
5578855,0
145 1
4
151 0 0
1794420,9
157 1
9
163 2 1753540,1
1098655,8
169 3
8
175 6 718129,93
151228,42
181 6
6
15179,788
187 8
8
193 3 0,3888
199 9 7652,7504
205 7 118227,21
1
211 4 366654,47
2098753,6
217 7
8
223 1 747118,21
3140819,9
229 2
7
17589236,
Итого: 60 8

¿
Еk= (4/ σ ¿4 ¿ ¿ )-3=(293153,95/115122,05)-3=-0,45>0

Вывод: Эксцесс принимает отрицательное значение, следовательно, распределение является


плосковершинным и пик ниже пика нормального распределения.

5) Проверка гипотез о виде распределения


• Проверим гипотезу о том, что Х распределено по нормальному закону с помощью критерия
согласия Пирсона. α=0,1

, где pi- вероятность попадания i-й интервал случайной величины.

, где s=18,57, Хср=193,6


Теоретическая (ожидаемая) частота равна npi, где n=60.
Ожидаема Слагаемые
Интервал Част x1 = (xi x2 = (xi+1 pi=Ф(x2)-
Ф(x1) Ф(x2) я частота, статистики
xi÷xi+1 ота - xср)/s - xср)/s Ф(x1)
60pi Пирсона, Ki
142 148 1 -2,78 -2,46 -0,4973 -0,4931 0,0042 0,252 2,22
148 154 0 -2,46 -2,13 -0,4931 -0,483 0,0101 0,606 0,61
154 160 1 -2,13 -1,81 -0,483 -0,4649 0,0181 1,086 0,01
160 166 2 -1,81 -1,49 -0,4649 -0,4319 0,033 1,98 0,00
166 172 3 -1,49 -1,16 -0,4319 -0,377 0,0549 3,294 0,03
172 178 6 -1,16 -0,84 -0,377 -0,2995 0,0775 4,65 0,39
178 184 6 -0,84 -0,52 -0,2995 -0,1985 0,101 6,06 0,00
184 190 8 -0,52 -0,19 -0,1985 -0,0753 0,1232 7,392 0,05
190 196 3 -0,19 0,13 -0,0753 0,0517 0,127 7,62 2,80
196 202 9 0,13 0,45 0,0517 0,1736 0,1219 7,314 0,39
202 208 7 0,45 0,78 0,1736 0,2823 0,1087 6,522 0,04
208 214 4 0,78 1,10 0,2823 0,3643 0,082 4,92 0,17
214 220 7 1,10 1,42 0,3643 0,4222 0,0579 3,474 3,58
220 226 1 1,42 1,74 0,4222 0,4591 0,0369 2,214 0,67
226 232 2 1,74 2,07 0,4591 0,4803 0,0212 1,272 0,42
60 11,36
Число интервалов k=15
=11,36 –слагаемое статистики Пирсона
Необходимо определить границу критической области, потому что статистика Пирсона измеряет
разницу между практическим и теоретическим распределением.
Таблицы распределения χ² и значения s, k, r=2 помогают найти её границу
=χ²(15-2-1;0,1)= χ2 (12;0,1)=18,5494
Kнабл<Kкр - наблюдаемое значение статистики Пирсона попадает в критическую
область, поэтому нет оснований отвергать основную гипотезу. Данные выборки имеют нормальное

• Проверим гипотезу о том, что х распределено по закону Пуассона, α=0,05

, λ=xcp=193,6
Хср=193,6
Принимаем в качестве оценки параметра λ распределения Пуассона выборочную среднюю.
Следовательно, предполагаемый закон Пуассона имеет вид:
P(i)=(193,6ͥ /i!)*ⅇ−193,6
Найдем по формуле Пуассона вероятности Pi, появления ровно i событий в n испытаниях. Находим
теоретические частоты по формуле npi (6 столбец таблицы)
Вычисляем слагаемые статистики Пирсона по формуле (7 столбец таблицы):

Слагаемые
Интервал xi÷xi+1 Частота i pi npi статистики Пирсона,
Ki
142 148 1 0 8,49779E-85 5,09867E-83 1,96129E+82
148 154 0 1 1,64517E-82 9,87103E-81 9,87103E-81
154 160 1 2 1,59253E-80 9,55516E-79 1,04655E+78
160 166 2 3 1,02771E-78 6,16626E-77 6,48691E+76
166 172 3 4 4,97412E-77 2,98447E-75 3,01561E+75
172 178 6 5 1,92598E-75 1,15559E-73 3,1153E+74
178 184 6 6 6,21449E-74 3,7287E-72 9,65485E+72
184 190 8 7 1,71875E-72 1,03125E-70 6,20606E+71
190 196 3 8 4,15938E-71 2,49563E-69 3,60631E+69
196 202 9 9 8,94728E-70 5,36837E-68 1,50884E+69
202 208 7 10 1,73219E-68 1,03932E-66 4,71464E+67
208 214 4 11 3,04866E-67 1,8292E-65 8,74701E+65
214 220 7 12 4,91851E-66 2,9511E-64 1,6604E+65
220 226 1 13 7,32479E-65 4,39488E-63 2,27538E+62
226 232 2 14 1,01291E-63 6,07748E-62 6,58167E+61
60 1,96141E+82

r=1 (параметр λ)
Таблицы распределения λ ² и значения s, k, r=2 помогают найти границу критической области.
Kkp = χ2(k-r-1;α)= χ2(15-1-1;0,05)= χ2(13;0,05)=22,3620
Kнабл=1,96141E+82
Вывод: Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл>Kkp,
поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по закону
Пуассона.
α=1-p=1-0.95=0.05

• Проверка гипотезы о показательном распределении генеральной совокупности, α=0,05


Принимаем в качестве оценки параметра Х показательного распределения величину, обратную
выборочной средней: λ=1/xср=1/193,6=0,005
Эмпирические частоты:
Найдем вероятности попадания X в каждый из интервалов по формуле:

Pi = P(xi < X < xi+1) = e-λxi - e-λxi+1


P1(142<x<148) = 2,718^(-0,005*142)-2,718^(-0,005*148)=0,492-0,477=0,015
P2(148<x<154) =2,718^(-0,005*148)-2,718^(-0,005*154)=0,477-0,463=0,014
P3(154<x<160) =2,718^(-0,005*154)-2,718^(-0,005*160)=0,463-0,449=0,014
P4(160<x<166) =2,718^(-0,005*160)-2,718^(-0,005*166)=0,449-0,436=0,013
P5(166<x<172) =2,718^(-0,005*166)-2,718^(-0,005*172)=0,436-0,423=0,013
P6(172<x<178) =2,718^(-0,005*172)-2,718^(-0,005*178)=0,423-0,411=0,012
P7(178<x<184) =2,718^(-0,005*178)-2,718^(-0,005*184)=0,411-0,398=0,013
P8(184<x<190) =2,718^(-0,005*184)-2,718^(-0,005*190)=0,398-0,387=0,011
P9(190<x<196) =2,718^(-0,005*190)-2,718^(-0,005*196)=0,387-0,375=0,012
P10(196<x<202) =2,718^(-0,005*196)-2,718^(-0,005*202)=0,375-0,364=0,011
P11(202<x<208) =2,718^(-0,005*202)-2,718^(-0,005*208)=0,364-0,353=0,011
P12(208<x<214) =2,718^(-0,005*208)-2,718^(-0,005*214)=0,353-0,343=0,01
P13(214<x<220) =2,718^(-0,005*214)-2,718^(-0,005*220)=0,343-0,333=0,01
P14(220<x<226) =2,718^(-0,005*220)-2,718^(-0,005*226)=0,333-0,323=0,01
P15(226<x<232) =2,718^(-0,005*226)-2,718^(-0,005*232)=0,323-0,313=0,01

i И np n Сл
н i аг
т ае
ер м
ва ые
с
т
а
т
ис
т
л ик
ы и
П
ир
со
на
,
Ki
0
1 1 ,
0,0
14 4 10 0 1
2 8 1
5
0
1 1 ,
0,8
24 5 00 0 4
8 4 1
4
0
1 1 ,
0,0
35 6 10 0 3
4 0 1
4
0
1 1 ,
1,9
46 6 20 0 1
0 6 1
3
0
1 1 ,
6,3
56 7 30 0 2
6 2 1
3
0
1 1 ,
38,
67 7 60 0 72
2 8 1
2
0
1 1 ,
34,
77 8 60 0 93
8 4 1
3
81 1 80 0 81,
8 9 , 63
4 0 0
1
1
0
1 1 ,
7,2
99 9 30 0 2
0 6 1
2
0
1 2 , 10
19 0 90 0 5,3
6 2 1 9
1
0
2 2 ,
60,
10 0 70 0 90
2 8 1
1
0
2 2
, 19,
10 1 4 0 27
0
8 4
1
0
2 2
, 68,
11 2 7 0 27
0
4 0
1
0
2 2
, 0,2
12 2 1 0 7
0
0 6
1
0
2 2
, 3,2
12 3 2 0 7
0
6 2
1
И
42
то
6 8,9
го
7
:

r=1 (параметр λ)
Таблицы распределения λ ² и значения s, k, r=2 помогают найти границу критической области.
Kkp = χ2(k-r-1;α)= χ2(15-1-1;0,05)= χ2(13;0,05)=22,36
Kнабл= 428,97
Вывод: Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл>Kkp,
поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по
показательному закону.
• Проверка гипотезы о равномерном распределении генеральной совокупности. α=0,025
Чтобы проверить гипотезу о равномерном распределении Х, т.е. по закону f(x) = 1/(b-a) в интервале
(a, b). Необходимо:
- Дать оценку параметрам a и b- концы интервала, в котором наблюдались возможные значения Х по
формулам:

α *=xср-√ 3 σ α *=193,6-√ 3*18,42=161,7

β *= xср+√ 3 σ β *=193,6+√ 3*18,42=225,50

-Найти плотность вероятности предполагаемого распределения:


f(x) = 1/(b* - a*)=1/(225,5-161,7)=1/63,8=0,016
- Найти теоретические частоты:
n1 = n*f(x)(x1 - a*) = 60*0,016*(148-161,7)=-13,152
n15 = n*f(x)(b*- x14) = 60*0,016*(225,5-226)=-0,48
Остальные ns будут равны:
ns = n*f(x)(xi - xi-1)

Интервал xi÷xi+1 i ni n*i ni - n*i (ni - n*i)2 (ni - n*i)2/n*i


142 148 0 1 -13,2 14,152 200,2791 -15,23
148 154 1 0 5,76 -5,76 33,1776 5,76
154 160 2 1 5,76 -4,76 22,6576 3,93
160 166 3 2 5,76 -3,76 14,1376 2,45
166 172 4 3 5,76 -2,76 7,6176 1,32
172 178 5 6 5,76 0,24 0,0576 0,01
178 184 6 6 5,76 0,24 0,0576 0,01
184 190 7 8 5,76 2,24 5,0176 0,87
190 196 8 3 5,76 -2,76 7,6176 1,32
196 202 9 9 5,76 3,24 10,4976 1,82
202 208 10 7 5,76 1,24 1,5376 0,27
208 214 11 4 5,76 -1,76 3,0976 0,54
214 220 12 7 5,76 1,24 1,5376 0,27
220 226 13 1 5,76 -4,76 22,6576 3,93
226 232 14 2 -0,48 2,48 6,1504 -12,81
60 -5,53

Определим границу критической области. Так как статистика Пирсона измеряет разницу между
эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл,
тем сильнее довод против основной гипотезы.
Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp; +∞).
Её границу Kkp = χ2(k-r-1; α) находим по таблицам распределения χ2 и заданным значениям s, k
(число интервалов), r=2 (параметры a и b).

Kkp (15-2-1; 0,025) = 23,3


Kнабл = -5,53
Вывод: Наблюдаемое значение статистики Пирсона не попадает в критическую область: Кнабл<Kkp,
поэтому нет оснований отвергать основную гипотезу. Данные выборки распределены по
равномерному закону.
• Критерий Колмогорова и Романовского. α=0,01
Критерий Романовского вычисляется по формуле:
|193,6−232|
→ βнабл= =2,08
18.42
По таблице Критерий Романовского находи при Р=0,99 и n=60, β кр=¿3,849
Отсюда 2,08<3.849→ β набл< β кр
Вывод: Последний результат измерения необходимо учитывать.
Критерий Колмогорова
На уровне значимости α=0,01с помощью критерия Колмогорова определить подчиняется ли данные
выборки на интервале [142;232] при n=60 равномерному закону распределения случайной величины.
Классический критерий Колмогорова предназначен для проверки простых гипотез. Если проверяется
гипотеза о согласии наблюдаемой выборки с законом, все параметры которого известны, то критерий
Колмогорова является свободным от распределения.

Вам также может понравиться