1.0. γ =0 , 95
5,6 5,8 5,0 5,4 5,2 5,8 5,2 5,6
5,6 5,6 5,4 5,0 5,4 5,8 5,4 5,6
5,4 5,2 5,4 5,4 5,6 5,0 6,0 5,8
5,2 5,8 5,6 5,8 6,0 5,2 5,8 6,0
6,2 5,4 6,2 5,6 6,0 5,6 5,2 5,6
=
40 ( 15+31 ,2+43 , 2+56 +40 , 6+24 +12 , 4 )= 40 =5,56.
Построим график
эмпирической функции распределения
nx
¿ ω( x < x )=
F ( x )=ω( xi < x ), где ( n x− число вариант, меньших,
i
n
чем значение аргумента x ).
2 2
Вычислим выборочную дисперсию D b =( x ) −( x ) , где в нашем случае
Fi*
1
38/40
34/40
27/40
17/40
9/40
3/40
xi
5,0 5,2 6,2
7
2
x =∑ ωi x 2 1
i=1 i
= 40 ( 3⋅25 , 0 +6⋅27 , 04 +8⋅29 , 16 +10⋅31, 36 +7⋅33 , 64 +4⋅36 +2⋅38 , 44
1 1240 , 48
(75+162 , 24+233 , 28+316 , 6+235 , 48+144 +76 , 88)=
)= 40 40 =31,012
2
Db = 31 ,012−( 5 ,56 ) =31 , 012−30 , 914=0 , 10 .
Найдем выборочное среднее квадратическое отклонение
σ b = √ D = √0,1=0 , 316.
b
S= √ S2 =√ 0 ,103=0 , 321 .
Модой M 0 называется варианта с наибольшей частотой, т.е. в нашей
задаче M 0 =5,6 . Медиана me - варианта, которая делит вариационный ряд
на две части, равные по числу вариант, т.е. в нашей задаче me=5,6 .
Найдем с надежностью =0,95 доверительные интервалы для оценки
математического ожидания и среднего квадратического отклонения
изучаемого признака генеральной совокупности.
Так как по условию задачи генеральная совокупность xраспределена по
нормальному закону и объем выборки равен n=40, то искомый
доверительный интервал для оценки математического ожидания имеет вид
tσ b ¿ tσ b
( )
¿
I γ ( a )= x − ; x+
√n √n ,
где σb - среднее квадратическое отклонение, а величина t
γ
Φ(t )=
определяется по таблице значений функции Лапласа из равенства 2 .
Следовательно, в нашем случае последнее равенство принимает вид
0 , 95
Φ(t )= =0 , 475
2 . Из этого равенства по таблице значений интегральной
функции Лапласа Φ( x) находим значение t=1,96. Величина σ b была
Задача 2.
Для выборки, извлеченной из генеральной совокупности и
представленной интервальным рядом (в первой строке указаны интервалы
значений xi−1 −x i исследуемого количественного признака X генеральной
совокупности; во второй – частоты m i , т.е. количество элементов выборки,
значения x признака которых принадлежат указанному интервалу),
требуется:
1) Построить полигон относительных накопленных частот
(кумулятивную кривую);
2) Построить гистограмму частот и гистограмму относительных частот;
3) Найти выборочную среднюю, выборочную дисперсию, моду и
медиану;
4) Проверить на уровне значимости α=0 ,05 гипотезу о нормальном
распределении признака X генеральной совокупности по критерию
согласия Пирсона;
5) В случае согласованности с нормальным распределением найти с
надежностью γ=0,95 доверительные интервалы для оценки
математического ожидания и среднего квадратического отклонения признака
X генеральной совокупности.
2.0.
xi−1 −x i 3-5 5-7 7-9 9-11 11-13 13-15 15-17
ni 10 70 450 970 860 330 60
k
x i −1 + x i ni ¿
xi =
¿ , ni =ni , n=∑ ni , ωi =
¿ ¿
2 . i=1 n
В нашем случае n=2750.Тогда на основе данной таблицы построим
интервальный статистический и интервальный выборочный ряды
распределения, сведенные в одну таблицу.
i 1 2 3 4 5 6 7
xi−1 −x i 3-5 5-7 7-9 9-11 11-13 13-15 15-17
xi
¿ 4 6 8 10 12 14 16
ni
¿ 10 70 450 970 860 330 60
ωi ¿ 0,0036 0,0255 0,1636 0,3527 0,3127 0,12 0,0218
k
0,0036 0,0291 0,1927 0,5454 0,8581 0,9781 1
∑ ωi ¿
i=1
ni*/2 Wi*/2
35
5 x 0,0036 x
0 0
3 5 7 3 5 7
ωi ωi
=
Если высоту i-го прямоугольника определим как h 2 , то получим
гистограмму относительных частот, которую можно рассматривать как
аналог дифференциальной функции распределения в теории вероятностей.
Для того, чтобы найти выборочную среднюю, воспользуемся формулой
k
¿
∑ n¿i x i ¿
i=1
x=
n , где k - количество интервалов, n - объем выборки.
¿
1 29660
x= ( 10⋅4+ 70⋅6+ 450⋅8+ 970⋅10+860⋅12+ 330⋅14+60⋅16 )= =10 ,785
2750 2750
.
Для вычисления выборочной дисперсии воспользуемся формулой
2
Db =x 2− ( x ) . В случае интервальной группировки x 2 находится по
формуле
k
1
x 2= ∑ n x 2= 1 ( 10⋅42 +70⋅62 + 450⋅82 +970⋅102 +860⋅122 +330⋅14 2 +60⋅162 )=
n i=1 i ( i ) 2750
¿ ¿
332360
=120 , 858
= 2750 .
Теперьможно окончательно вычислитьвыборочную дисперсию
2
Db =120 , 858−10 , 785 =4 ,542
.
Найдем выборочное среднее квадратическое отклонение
σ b = √ Db = √ 4 , 452=2 , 131
.
Отыщем выборочный коэффициент вариации
σb 2 ,131
V b= 100 %= 100 %=19 , 76 %
x 10 ,785 .
Найденное значение выборочного коэффициента вариации дает
наглядное представление о степени относительного рассеяния исследуемого
признака.
Отыщем значения «исправленной» дисперсии и «исправленного»
n 2750
s2= Db = ⋅4 ,542≈4 ,544
среднего квадратического отклонения n−1 2749 ,
s= √ s2 =2 ,132 .
Для отыскания моды M0 в случае интервальной группировки
n ¿M −n¿M −1
используем формулу
M 0 =a M + h
( ¿
2 n M −n M −1−nM +1 ¿ ¿
)
, где a M - левая граница
интервала, имеющего наибольшую интервальную частоту, h - шаг (длина
R
h=
интервала группировки), k , R - размах выборки, k - количество
¿ ¿
интервалов, n M n
- наибольшая интервальная частота, M−1 - интервальная
частота интервала, расположенного слева от интервала с наибольшей
¿
интервальной частотой, n M+1 - интервальная частота интервала,
расположенного справа от интервала с наибольшей интервальной частотой.
В нашем случае
M 0 =9+2 ( 970−450
2⋅970−450−860 )
=10 ,65
.
Значение медианы me для случая интервальной группировки отыщем
n
по формуле
me=am +h
2
(−(n ¿1 +n¿2 +.. .+n¿m−1 )
n¿m )
, где am - левая граница
¿
интервала, содержащего медиану, n - объем выборки, h - шаг, nm -
¿ ¿ ¿
интервальная частота интервала, содержащего медиану, n1 ,n2 ,...,nm−1 -
интервальные частоты всех интервалов, расположенных слева от интервала,
содержащего медиану.
Найдем значение медианы me для нашей конкретной задачи .
Далее начнем суммировать интервальные частоты слева направо до тех
n
=1375
пор пока сумма интервальных частот не превзойдет .Номер 2
последней прибавленной частоты будет совпадать с номером интервала,
содержащего медиану распределения: 10+70+450+970=1500>1375.
1375−(10+70+ 450)
Следовательно, am =9,
me=9+2 ( 970
=10 , 74
.
)
Проверим на уровне значимости =0,05 гипотезу H 0 о нормальном
распределении признака x генеральной совокупности по критерию согласия
Пирсона.
Для нашей задачи все условия применимости метода Пирсона
¿
выполняются: n≥50 , m≥6 , для любого интервала ni ≥5 .
Проверка гипотезы нормальности по критерию Пирсона основана на
сравнении эмпирического и гипотетического распределений, точнее, на
сравнении эмпирических и гипотетических интервальных частот. Мера
близости между ними оценивается статистикой Пирсона:
2
2
m
( n¿i −np i )
χ =∑ ¿
i=1 npi , где ni- интервальные (эмпирические) частоты,
npi =n '
i - интервальные теоретические частоты, pi - теоретические
вероятности попадания переменной x в i-ый интервал группировки,
pi= p( α i < x i < β i ) , α i - левая граница i-го интервала, β i - правая граница
i-го интервала.
При этом теоретические вероятности pi рассчитываются в
предположении нормальности распределения случайной величины x по
формуле:
¿
h |x i −x|
pi= ϕ( z i ) z i=
s , где s и функция ϕ( x) есть плотность
стандартного нормального распределения, таблица значений которой
приведена в приложении 2.
2
Вычисление наблюдаемого значения статистики Пирсона χ
организуем в форме расчетной таблицы. Для заполнения таблицы нам
h
=0 , 938
понадобятся величины x=10,785 , s=2 ,132 , s .
|x i − x| z i pi npi ni −npi ( n ¿i −npi )2 2
¿ ¿ ¿ ¿
i ( x i−1 ; x i ) x i ni ϕ( z i ) ( n¿i −npi )
npi
1 (3;5) 4 10 6,785 3,182 0,0025 0,0023 6,325 3,675 13,506 2,135
2 (5;7) 6 70 4,785 2,244 0,0325 0,0305 83,87 -13,87 192,516 2,295
3 (7;9) 8 450 2,785 1,306 0,1691 0,1586 436,15 13,85 191,823 0,440
4 (9;11) 10 970 0,785 0,368 0,3726 0,3495 961,12 8,875 78,766 0,082
5 (11;13) 12 860 1,215 0,570 0,3391 0,3181 874,78 -14,78 218,301 0,250
6 (13;15) 14 330 3,215 1,508 0,1276 0,1197 329,18 0,825 0,681 0,002
7 (15;17) 16 60 5,215 2,446 0,0198 0,0186 51,15 8,85 78,322 1,531
∑ 2750 0,9973 6,735
2
Следовательно, χ набл =6 , 735 . Заданный уровень значимости α=0, 05 ,
количество интервалов группировки m=7 , и потому p=1-=0,95 и число
степеней свободы k=m-3=4.
2
Теперь по таблице критических точек распределения χ отыщем
2 2
крит
значение χ = χ 0 , 95 ( 4 )=9,5 .
Сравним значения χ 2набл и
χ 2крит . Имеем 6,735<9,5 ,
следовательно, χ 2набл
< χ 2крит
. Поэтому гипотезу о нормальном
распределении признака x принимаем. В этом случае необходимо найти с
надежностью =0,95 доверительные интервалы для оценки математического
ожидания и среднего квадратического отклонения признака x генеральной
совокупности. Пример нахождения доверительных интервалов разобран при
решении задачи 1 (пятый вопрос).
Таким образом, решение задачи 2 полностью разобрано