Вы находитесь на странице: 1из 9

Методические указания к выполнению контрольной работы.

Решение типовых задач.


Задача 1.
Из генеральной совокупности X , распределенной по нормальному
закону, извлечена выборка. Требуется:
1. Составить вариационный, статистический и выборочный ряды
распределения; найти размах выборки;
По полученному распределению выборки:
2. Построить полигон относительных частот;
3. Построить график эмпирической функции распределения;
4. Вычислить выборочную среднюю, выборочную дисперсию,
выборочное исправленное среднее квадратическое отклонение, моду и
медиану;
5. С надежностью γ найти доверительные интервалы для оценки
математического ожидания и среднего квадратического отклонения
изучаемого признака генеральной совокупности.

1.0. γ =0 , 95
5,6 5,8 5,0 5,4 5,2 5,8 5,2 5,6
5,6 5,6 5,4 5,0 5,4 5,8 5,4 5,6
5,4 5,2 5,4 5,4 5,6 5,0 6,0 5,8
5,2 5,8 5,6 5,8 6,0 5,2 5,8 6,0
6,2 5,4 6,2 5,6 6,0 5,6 5,2 5,6

Составим вариационный ряд. Напомним, что вариационным рядом


называется последовательность наблюдаемых значений признака X ,
расположенных в неубывающем порядке x 1 , x 2 ,…, x n , где x 1≤x 2 ¿ …
¿ x n Следовательно, в нашей задаче вариационный ряд запишется так:

5,0 5,0 5,0 5,2 5,2 5,2 5,2 5,2


5,2 5,4 5,4 5,4 5,4 5,4 5,4 5,4
5,4 5,6 5,6 5,6 5,6 5,6 5,6 5,6
5,6 5,6 5,6 5,8 5,8 5,8 5,8 5,8
5,8 5,8 6,0 6,0 6,0 6,0 6,2 6,2

Составим статистический ряд распределения данной нам выборки

xi 5,0 5,2 5,4 5,6 5,8 6,0 6,2


ni 3 6 8 10 7 4 2
xi
- варианты, i - частоты.
n
Найдем объем выборки
7
n=∑ ni =3+6+8+ 10+7+ 4+2=40
i=1 .
ni
ωi =
Относительная частота вычисляется по формуле n .
Запишем выборочный ряд распределения

xi 5,0 5,2 5,4 5,6 5,8 6,0 6,2


ωi 3 6 8 10 7 4 2
40 40 40 40 40 40 40

x min =5,0 x max =6,2 .


Размах выборки R=x max −x min , т.е. в нашем случае R=6,2−5,0=1,2 .

Построим полигон относительных частот

Вычислим выборочную среднюю


7
1
x=∑ x i ωi = 40 ( 3⋅5,0 + 6⋅5,2 + 8⋅5,4 + 10⋅5,6 +7⋅5,8 + 4⋅6,0 +2⋅6,2)
i =1
222 ,4
1

=
40 ( 15+31 ,2+43 , 2+56 +40 , 6+24 +12 , 4 )= 40 =5,56.

Построим график
эмпирической функции распределения
nx
¿ ω( x < x )=
F ( x )=ω( xi < x ), где ( n x− число вариант, меньших,
i
n
чем значение аргумента x ).
2 2
Вычислим выборочную дисперсию D b =( x ) −( x ) , где в нашем случае
Fi*

1
38/40
34/40

27/40

17/40
9/40
3/40
xi
5,0 5,2 6,2
7
2
x =∑ ωi x 2 1
i=1 i
= 40 ( 3⋅25 , 0 +6⋅27 , 04 +8⋅29 , 16 +10⋅31, 36 +7⋅33 , 64 +4⋅36 +2⋅38 , 44
1 1240 , 48
(75+162 , 24+233 , 28+316 , 6+235 , 48+144 +76 , 88)=
)= 40 40 =31,012
2
Db = 31 ,012−( 5 ,56 ) =31 , 012−30 , 914=0 , 10 .
Найдем выборочное среднее квадратическое отклонение
σ b = √ D = √0,1=0 , 316.
b

Вычислим "исправленную" дисперсию S 2 , которая выражается


формулой
n
S 2= D 40
S 2 = 40−1⋅0 ,10≈0 , 103 )
n−1 b (в нашем случае
и «исправленное» среднее квадратическое отклонение

S= √ S2 =√ 0 ,103=0 , 321 .
Модой M 0 называется варианта с наибольшей частотой, т.е. в нашей
задаче M 0 =5,6 . Медиана me - варианта, которая делит вариационный ряд
на две части, равные по числу вариант, т.е. в нашей задаче me=5,6 .
Найдем с надежностью =0,95 доверительные интервалы для оценки
математического ожидания и среднего квадратического отклонения
изучаемого признака генеральной совокупности.
Так как по условию задачи генеральная совокупность xраспределена по
нормальному закону и объем выборки равен n=40, то искомый
доверительный интервал для оценки математического ожидания имеет вид
tσ b ¿ tσ b
( )
¿
I γ ( a )= x − ; x+
√n √n ,
где σb - среднее квадратическое отклонение, а величина t
γ
Φ(t )=
определяется по таблице значений функции Лапласа из равенства 2 .
Следовательно, в нашем случае последнее равенство принимает вид
0 , 95
Φ(t )= =0 , 475
2 . Из этого равенства по таблице значений интегральной
функции Лапласа Φ( x) находим значение t=1,96. Величина σ b была

найдена ранее: σ b =0 ,316 и √ 40=6,325 .


tσ b 1 , 96⋅0 , 316
δ= = =0 , 0979
Вычислим √n 6 , 325 . δ≈0,098 .
¿
Учитывая, что x =5,56 , доверительный интервал для оценки
математического ожидания запишется I 0,95 (a)=(5 , 56−0 , 098; 5 ,56+0, 098) или,
окончательно, I 0,95 (a)=(5, 462; 5,658 ) .
Доверительный интервал для среднего квадратического отклонения
нормально распределенной случайной величины находится по формуле
I γ (σ )=( s−δ ; s+δ ) , где s - "исправленное" среднее квадратическое
отклонение, а  находится по формуле δ=sq , где величина q определяется
по специальной таблице значений функции q=q (γ , n ) .
Найдем I γ (σ ) для нашей конкретной задачи:
q=q(0,95;40)=0,24; =sq=0,3210,24=0,077. Следовательно,
I 0,95 (σ )=( 0,321−0, 077 ;0,321−0 ,077) или окончательно I 0,95 (σ )=( 0,244 ; 0,398 ) .
На этом решение задачи 1 закончено.

Задача 2.
Для выборки, извлеченной из генеральной совокупности и
представленной интервальным рядом (в первой строке указаны интервалы
значений xi−1 −x i исследуемого количественного признака X генеральной
совокупности; во второй – частоты m i , т.е. количество элементов выборки,
значения x признака которых принадлежат указанному интервалу),
требуется:
1) Построить полигон относительных накопленных частот
(кумулятивную кривую);
2) Построить гистограмму частот и гистограмму относительных частот;
3) Найти выборочную среднюю, выборочную дисперсию, моду и
медиану;
4) Проверить на уровне значимости α=0 ,05 гипотезу о нормальном
распределении признака X генеральной совокупности по критерию
согласия Пирсона;
5) В случае согласованности с нормальным распределением найти с
надежностью γ=0,95 доверительные интервалы для оценки
математического ожидания и среднего квадратического отклонения признака
X генеральной совокупности.

2.0.
xi−1 −x i 3-5 5-7 7-9 9-11 11-13 13-15 15-17
ni 10 70 450 970 860 330 60

k
x i −1 + x i ni ¿

xi =
¿ , ni =ni , n=∑ ni , ωi =
¿ ¿
2 . i=1 n
В нашем случае n=2750.Тогда на основе данной таблицы построим
интервальный статистический и интервальный выборочный ряды
распределения, сведенные в одну таблицу.
i 1 2 3 4 5 6 7
xi−1 −x i 3-5 5-7 7-9 9-11 11-13 13-15 15-17
xi
¿ 4 6 8 10 12 14 16
ni
¿ 10 70 450 970 860 330 60
ωi ¿ 0,0036 0,0255 0,1636 0,3527 0,3127 0,12 0,0218
k
0,0036 0,0291 0,1927 0,5454 0,8581 0,9781 1
∑ ωi ¿

i=1

Построим полигон относительных накопленных частот (кумулятивную


кривую);
1.2
Построим
1 0.98 1 1 гистограмму частот.
0.86 В нашем случае
0.8 исследуемый признак X
0.6
может принимать значения
0.55 на отрезке [3;17].
0.4 Интервальная группировка
выполнена таким образом,
0.2 0.19 что длина каждого
0 0 0 0 0.03 интервала равна h=2.
0 3 5 7 9 11 13 15 17 Площадь прямоугольника,
построенного на i-ом
интервале, должна равняться ni . Это значит, что высота i-го
ni ni
=
прямоугольника будет h 2 .
На остальных интервалах прямоугольники строятся аналогично.

ni*/2 Wi*/2

35

5 x 0,0036 x

0 0
3 5 7 3 5 7

ωi ωi
=
Если высоту i-го прямоугольника определим как h 2 , то получим
гистограмму относительных частот, которую можно рассматривать как
аналог дифференциальной функции распределения в теории вероятностей.
Для того, чтобы найти выборочную среднюю, воспользуемся формулой
k

¿
∑ n¿i x i ¿

i=1
x=
n , где k - количество интервалов, n - объем выборки.
¿
1 29660
x= ( 10⋅4+ 70⋅6+ 450⋅8+ 970⋅10+860⋅12+ 330⋅14+60⋅16 )= =10 ,785
2750 2750
.
Для вычисления выборочной дисперсии воспользуемся формулой
2
Db =x 2− ( x ) . В случае интервальной группировки x 2 находится по
формуле
k
1
x 2= ∑ n x 2= 1 ( 10⋅42 +70⋅62 + 450⋅82 +970⋅102 +860⋅122 +330⋅14 2 +60⋅162 )=
n i=1 i ( i ) 2750
¿ ¿

332360
=120 , 858
= 2750 .
Теперьможно окончательно вычислитьвыборочную дисперсию
2
Db =120 , 858−10 , 785 =4 ,542
.
Найдем выборочное среднее квадратическое отклонение
σ b = √ Db = √ 4 , 452=2 , 131
.
Отыщем выборочный коэффициент вариации
σb 2 ,131
V b= 100 %= 100 %=19 , 76 %
x 10 ,785 .
Найденное значение выборочного коэффициента вариации дает
наглядное представление о степени относительного рассеяния исследуемого
признака.
Отыщем значения «исправленной» дисперсии и «исправленного»
n 2750
s2= Db = ⋅4 ,542≈4 ,544
среднего квадратического отклонения n−1 2749 ,
s= √ s2 =2 ,132 .
Для отыскания моды M0 в случае интервальной группировки
n ¿M −n¿M −1

используем формулу
M 0 =a M + h
( ¿
2 n M −n M −1−nM +1 ¿ ¿
)
, где a M - левая граница
интервала, имеющего наибольшую интервальную частоту, h - шаг (длина
R
h=
интервала группировки), k , R - размах выборки, k - количество
¿ ¿
интервалов, n M n
- наибольшая интервальная частота, M−1 - интервальная
частота интервала, расположенного слева от интервала с наибольшей
¿
интервальной частотой, n M+1 - интервальная частота интервала,
расположенного справа от интервала с наибольшей интервальной частотой.

В нашем случае
M 0 =9+2 ( 970−450
2⋅970−450−860 )
=10 ,65
.
Значение медианы me для случая интервальной группировки отыщем
n

по формуле
me=am +h
2
(−(n ¿1 +n¿2 +.. .+n¿m−1 )
n¿m )
, где am - левая граница
¿
интервала, содержащего медиану, n - объем выборки, h - шаг, nm -
¿ ¿ ¿
интервальная частота интервала, содержащего медиану, n1 ,n2 ,...,nm−1 -
интервальные частоты всех интервалов, расположенных слева от интервала,
содержащего медиану.
Найдем значение медианы me для нашей конкретной задачи .
Далее начнем суммировать интервальные частоты слева направо до тех
n
=1375
пор пока сумма интервальных частот не превзойдет .Номер 2
последней прибавленной частоты будет совпадать с номером интервала,
содержащего медиану распределения: 10+70+450+970=1500>1375.
1375−(10+70+ 450)
Следовательно, am =9,
me=9+2 ( 970
=10 , 74
.
)
Проверим на уровне значимости =0,05 гипотезу H 0 о нормальном
распределении признака x генеральной совокупности по критерию согласия
Пирсона.
Для нашей задачи все условия применимости метода Пирсона
¿
выполняются: n≥50 , m≥6 , для любого интервала ni ≥5 .
Проверка гипотезы нормальности по критерию Пирсона основана на
сравнении эмпирического и гипотетического распределений, точнее, на
сравнении эмпирических и гипотетических интервальных частот. Мера
близости между ними оценивается статистикой Пирсона:
2
2
m
( n¿i −np i )
χ =∑ ¿
i=1 npi , где ni- интервальные (эмпирические) частоты,
npi =n '
i - интервальные теоретические частоты, pi - теоретические
вероятности попадания переменной x в i-ый интервал группировки,
pi= p( α i < x i < β i ) , α i - левая граница i-го интервала, β i - правая граница
i-го интервала.
При этом теоретические вероятности pi рассчитываются в
предположении нормальности распределения случайной величины x по
формуле:
¿
h |x i −x|
pi= ϕ( z i ) z i=
s , где s и функция ϕ( x) есть плотность
стандартного нормального распределения, таблица значений которой
приведена в приложении 2.
2
Вычисление наблюдаемого значения статистики Пирсона χ
организуем в форме расчетной таблицы. Для заполнения таблицы нам
h
=0 , 938
понадобятся величины x=10,785 , s=2 ,132 , s .
|x i − x| z i pi npi ni −npi ( n ¿i −npi )2 2
¿ ¿ ¿ ¿
i ( x i−1 ; x i ) x i ni ϕ( z i ) ( n¿i −npi )
npi
1 (3;5) 4 10 6,785 3,182 0,0025 0,0023 6,325 3,675 13,506 2,135
2 (5;7) 6 70 4,785 2,244 0,0325 0,0305 83,87 -13,87 192,516 2,295
3 (7;9) 8 450 2,785 1,306 0,1691 0,1586 436,15 13,85 191,823 0,440
4 (9;11) 10 970 0,785 0,368 0,3726 0,3495 961,12 8,875 78,766 0,082
5 (11;13) 12 860 1,215 0,570 0,3391 0,3181 874,78 -14,78 218,301 0,250
6 (13;15) 14 330 3,215 1,508 0,1276 0,1197 329,18 0,825 0,681 0,002
7 (15;17) 16 60 5,215 2,446 0,0198 0,0186 51,15 8,85 78,322 1,531
∑ 2750 0,9973 6,735

2
Следовательно, χ набл =6 , 735 . Заданный уровень значимости α=0, 05 ,
количество интервалов группировки m=7 , и потому p=1-=0,95 и число
степеней свободы k=m-3=4.
2
Теперь по таблице критических точек распределения χ отыщем
2 2
крит
значение χ = χ 0 , 95 ( 4 )=9,5 .
Сравним значения χ 2набл и
χ 2крит . Имеем 6,735<9,5 ,
следовательно, χ 2набл
< χ 2крит
. Поэтому гипотезу о нормальном
распределении признака x принимаем. В этом случае необходимо найти с
надежностью =0,95 доверительные интервалы для оценки математического
ожидания и среднего квадратического отклонения признака x генеральной
совокупности. Пример нахождения доверительных интервалов разобран при
решении задачи 1 (пятый вопрос).
Таким образом, решение задачи 2 полностью разобрано