характеристик
1 0,04 0,04
2 0,06 0,10
3 0,12 0,22
4 0,16 0,38
5 0,44 0,82
6 0,18 1,00
Σ 1,00
нак нак
x mx / n .
6,71 – 6,73 24
6,73 – 6,75 54
6,75 – 6,77 52
6,77 – 6,79 23
6,79 – 6,81 18
6,81 – 6,83 7
vx
0,44
0,18
0,16
0,12
0,04
6 1 2 3 4 5 6
x
Рисунок 1-Полигон
15
13
2
3
60 90 100 110 120 130140 150
x
Рисунок 2- Полигон
117
96
69
23
8
80 90 100 110 120 130 140 150 x
x
1,00
0,38
0,22
0,06
1 2 3 4 5 6 x
n n
xi x (1.2)
i 1 i 1
n
Так как x =const , то x i n x . Отсюда получаем следующую формулу
i 1
x xm x mx (1.4)
m x
xm x mx
x x x xx
x x x x
m m
x x
n n
x iq (x q )q (1.6)
i 1 i 1
n q
x q x i n
q (1.7)
i1
x 1m x 1
x 1 1 x (1.9)
mx
(1 / x )m x mx
x
x x
x 2 x 2 m x mx (1.10)
x x
x 3 3 x 3 m x mx (1.11)
x x
и т. д.
Пример 11. Наблюдения показали, что каждая из 10 медицинских сестер
затрачивает на ухаживание за больным 0,11 ч., индивидуальные же затраты
времени на ухаживание за теми же больными у 15 медицинских сестер
составляют 0,1 ч. Вычислить среднее время, необходимое на ухаживание за
одним больными, при котором за час всеми медицинскими сестрами могли бы
поухаживать за тем же количеством больных.
Решение. Здесь наблюдаемый признак – время, необходимое на
ухаживание за больным. Признак принял два различных значения x1 0,11 и
x 2 0,1 ; соответствующие частоты m x1 10 и m x 2 15 .
(1 / x1 ) m x1 (1/ x 2 ) m x 2 (1 / t )(m x1 m x 2 )
Отсюда получаем, что среднее время t есть не что иное, как средняя
гармоническая взвешенная:
m x1 m x 2 10 15 11
t ( ч)
(1 / x1 )m x1 (1 / x 2 )m x 2 (1 / 0,11) 10 (1 / 0,1) 15 106
c12 t1 c 22 t 2 c() 2 ( t1 t 2 )
12 t1 22 t 2 20 2 6 30 2 1
21,7(км / ч)
t1 t 2 6 1
должен быть таким, чтобы темп роста за 5 лет остался неизменным, если
каждый ежегодный темп заменить среднегодовым, т.е. T определится из
условия
(a i1 / a i ) (T) 4
i 1
Отсюда получаем, что среднегодовой темп роста T есть не что иное, как
средняя геометрическая из ежегодных темпов:
4
T4 (a i1 / a i ) 4 7 / 6 9 / 7 10 / 9 13 /10 1,21
i 1
случаем степенной средней q-гo порядка при q=0, т.е. x геом q lim 0 x q
Поэтому среднюю геометрическую условно называют степенной средней
нулевого порядка: x геом x 0 .
Если для вариационного ряда вычислить степенные средние различных
порядков, то окажется, что с ростом порядка увеличивается числовое значение
степенной средней, т. е. x 2 x 1 x 0 x1 x 2 . Это свойство называется
мажорантностью степенных средних. Советский статистик Б. С. Ястремский
показал, что если
(x x) 2 m x qV 2
V x
мало (<0,3), то x q x 0 1
n(x) 2 2
0 xm x xm x ( xm x xm x ) ( x x )m x ,
x x x x
(x c)m x xm x cm x xm x cm x
xc x x x
x x x c,
x
m xm x x
m m
x x x x
x
(x / k)m x 1 xm x x
x
x ,
k x m k x k
m
x x
( n1 n 2 ) x = n 1 x 1 + n 2 x 2 ,
x n x 2 n 2 ... x k n k
xini
i 1
x 1 1 .
n1 n 2 ... n k k
ni
i 1
x y x y.
Доказательство. Имеем
n n n
(x i yi ) x i yi
i 1 i 1 i 1
xy x y,
n n n
x x' k c (1.14)
x c x c x c
x ' ;
k k k
~
(M e ) x q .
значений x ( q ) и x ( q 1) , т. е.
~
(M e ) ( x ( q ) x ( q 1) ) / 2.
~
(M e ) ( x (50) x (51) ) / 2,
~
M e 100 (10 / 46)(59 23) 107,8(%)
m x 2 m нак
~
Me
h x
~
M e a M~ (1.15)
e
m M~
e
нак
~ 0,5 M~
M e a M~ h e
(1.16)
e
M~
e
~
если a M e . В частности, это свойство медианы может быть использовано при
проектировании расположения трамвайных и троллейбусных остановок,
бензоколонок, ссыпных пунктов и т. д.
Пример 17. На участке дороги имеются 4 населенных пункта. Для
проектирования ЛПУ собраны данные о числе предполагаемых больных из
каждого пункта. Результаты обследования приведены в таблице 1.6. На каком
километре следует расположить ЛПУ, чтобы общий путь скорой до него был
минимальным?
~
Решение. Здесь n=130=2·65; M e ( x ( 65) x ( 66) ) / 2 (3 3) / 2 3(км) . По
свойству медианы минимальный общий путь будет получен в том случае, если
ЛПУ сделать на третьем километре.
Из определения медианы ясно, что на медиану совершенно не влияет
изменение крайних членов ранжированного ряда наблюдений, если только
любой из них, меньший медианы, остается меньше ее, а любой, больший
медианы, продолжает быть больше ее. Поэтому медиану следует предпочесть
средней арифметической, если крайние варианты по сравнению с остальными
оказались чрезмерно большими или малыми.
Итак, медиана – это значение признака, который делит ранжированный
ряд наблюдений на две равные по объему группы. В свою очередь, в каждой
группе можно найти значение признака, делящее ее на две равные по объему
группы. Это значение называется квартилем. Квартили и медиана делят
ранжированный ряд на 4 равные части.
Аналогично можно разделить ранжированный ряд на 10 равных по
объему частей децилями, на 100 частей центилями. Такие величины, как
квартили, децили и т. д., делящие ранжированный ряд наблюдений на
некоторое число равных частей, называют квантилями. Под p – процентным
квантилем понимают такое значение признака в ранжированном ряду, которое
не превосходит p % наблюдений.
~
Модой ( M o ) называется такое значение признака, которое наблюдалось
наибольшее число раз. Нахождение моды для дискретного вариационного
ряда не требует каких-либо вычислений, так как ею является вариант,
которому соответствует наибольшая частота.
В случае интервального вариационного ряда мода вычисляется по
следующей формуле (приводится без доказательства):
~ m M~ m M~
o 1
M o a M~ h o
(1.17)
o
2m M~ m M~ 1
m M~
o o o 1
~ M~ M~
o 1
M o a M~ h o
(1.18)
o
2M~ M~ 1
M~
o o o 1
модальным.
Пример 18. Вычислить моду для интервального вариационного ряда,
заданного таблице 1.3.
Решение. Модальным интервалом является интервал от 100 до 110, так
как ему соответствует наибольшая частота, равная 46. Поэтому по форуле
(1.17), в которой a M~o 100, h 10, m M~o 46, m M~o 1 15, m M~o 1 29, получаем
~ 46 15
M o 100 10 106,2(%).
2 46 15 29
d x x m x / m x (1.20)
x x
Дисперсией ( s 2 ) называется средняя арифметическая квадратов
отклонений вариантов от их средней арифметической:
s 2 ( x x ) 2 m x mx (1.21)
x x
s ( x x ) 2 m x mx (1.22)
x x
s 159 12,61(%).
s 2 x a m x mx ,
2
x x
если a x .
Доказательство. Найдём экстремум функции
f (a ) x a m x mx .
2
x x
f ' (a ) 2 x a m x m x 0;
x x
x a m x 0; a xm x m x x.
x x x
Так как
f ' ' (a ) 2 xm x m x 0,
x x
x xj ,
n
2 1 n 2
2
i
i , j1
V s x 100%. (1.23)
x c x c m x x x m x
2 2
s x c x
2
x s2 ,
mx mx
x x
x x m x
2
1 s2
2 x
2,
k mx k
x
s2 x 2 x ,
2
(1.24)
где x 2 x 2 m x mx .
x x
x 2mx 2 x xm x x m
2
x
x x
x
mx mx mx
x x x
x2 2 x x
2 2
x2 x ,
2
s
2 s 12 n 1 s 22 n 2
2
x1 x n1 x 2 x n 2
.
2
n1 n 2 n1 n 2
2
s12 x i2 x 1 , s 22 x 2j x 2 .
2
s12 n 1 s 22 n 2 x i n 1 x j n 2 x 1 n 1 x 2 n 2
2 2
2
2
n1 n 2 n1 n 2
n1 n 2
n1
2 2
x i2 x 2j x 1 n 1 x 2 n 2
i 1 j n1 1
n1 n 2
n1 n 2
2
x q2 x 1 n 1 x 2 n 2 2
q 1
.
n1 n 2
x 1
2
x n1 x 2 x n 2
2
n1 n 2
x n 1
2
1 2
2 x 1 xn 1 x n 1 x 2 n 2 2 x 2 xn 2 x n 2
2
2
n1 n 2
x n x n x n
1
2
1
2
2
2
1
n 2 2x x 1 n 1 x 2 n 2
n1 n 2
x n x n x n
1
2
1
2
2
2
1 n2
.
n1 n 2
Используя найденные выражения для слагаемых, получим:
s12 n 1 s 22 n 2
2
x1 x n1 x 2 x n 2
2
n1 n 2 n1 n 2
n1 n 2
2
2
x q2 x 1 n 1 x 2 n 2 x 1 n 1 x 2 n 2 x
2
2
n
2
1 n2
q 1
n1 n 2
n1 n 2
xq
q 1
n1 n 2
x
2
x2 x 2
s2 ,
x i x n i
k
i 1
2
k
.
ni
i 1
называется, s i2 средняя арифметическая групповых дисперсий s i2 , причем
весами являются объемы группы ( n i ):
k
s i2 n i
i 1
s i2 k
.
ni
i 1
s 2 s i2 2
первоначального ряда:
s 2 s 2x k 2 . (1.25)
s 2 1,59 10 2 159.
0 x 0 x 0 m x
~
m x 1.
x x
~
1 x.
2 x 2 x 2 m x
~
mx
x x
и т.д.
Центральны моментом ~
порядка q называется средняя
q
~ xx
q
q
q
x x m x mx . (1.27)
x x
1
~ x x 1
x x1
m
x
mx 0
x x
~ xx
2
2
x x m x
2
mx s2.
x x
~ xx
q
q
~ ~
0 1,
0
~ ~
1 ~
1 0,
1
~ ~
2 2~
1 ~
1 ~
12 ~
2 ~
12 , (1.29)
2
~ ~
3 3~
1 ~
2 3~
12 ~
1 ~
13 ~
3 3~
1 ~
2 2~
12 , (1.30)
3
~ ~
4 4~
1 ~
3 6~
12 ~
2 4~
13 ~
1 ~
1 ~
4
4 4~
1 ~
3 6~
12 ~
2 3~
14 . (1.31)
4
x c x c m x x x m x
q q
~
x x ~ ,
q x c
mx mx q
x x
~
что и требовалось доказать. Аналогично можно доказать, что ~
q x c q .
первоначального ряда:
~
~ 'q * k q
q
~
1
' x 'm x
72 ~ ' ( x ) m x 230
; 2
' 2
,
xm 117 xm 117
~
3
' (x ' ) 3 m x
264 ~ ' ( x ) m x 1238
;
' 4
,
mx 117 4 mx 117
~
p 2' ~
2' ( ~
1' ) 1,59, ~
p 3' ~
3' 3 1' '2 2( 1' ) 2 0,91
~
p 4' ~
4' 4 1' 3' 6( 1' ) 2 '2 3( 1' ) 4 9,6
то
Действительно,
~ ~
~ 4
E 3 ~ 42 3
s4 2
m
PA . (2.1)
n
0 m n ,0 PA 1.
m
Р(А) = 1.
n
0
PA 0.
n
Р(В) = C15
3
/С 325 = 91/460 .
m C15
2
C110 ;
PC C15
2
C110 / C 325 21 / 46.
m
Р * А , (2.3)
n
A+B
A B
A AB B
A+B
A B
A AСB B
С С
n n
P A i PA i , (2.6)
i 1 i 1
Обозначим
A 1 A 2 A n 1 C ,
тогда по доказанной теореме можно записать:
Так как
PC PA 1 A 2 A n 1
PA 1 PA 2 PA n 1 ,
то имеем
PA 1 A 2 A n 1 A n
PA 1 PA 2 PA n 1 PA n ,
P A i PA i . (2.7)
i 1 i 1
P(A) + Р(A) = 1 .
Противоположные события образуют полную группу из двух
несовместных событий. Поэтому это следствие можно вывести как частный
случай из предыдущего следствия, не прибегая к отдельному доказательству.
Последнее следствие часто используют при решении практических
задач, когда оказывается легче вычислить вероятность противоположного
события А , чем вероятность прямого события A.
Если события совместны, то при сложении вероятностей этих событий
следует учитывать вероятность их совместного появления. Докажем
следующую теорему.
Теорема 2.3. Сложение вероятностей двух совместных событий.
Вероятность суммы двух совместных событий равна сумме вероятностей этих
двух событий без вероятности их совместного появления
А = АВ АВ ,
В = АВ АВ ,
А + В = АВ + АВ АВ .
Отсюда
PA 2 / 5; PA 3 / 5 .
или
P(AB) = k/n .
P(B/A) = k/m ,
Р(А) m/n .
C A 1 A 2 A n 1 .
Так как
PC PA 1 A 2 A n 1
PA 1 PA 2 / A 1 PA n 1 / A 1 A 2 A n 2 ,
то можно записать:
PA 1 A 2 A n 1 A n
(2.15)
PA 1 / PA 2 / A 1 PA n / A 1 A 2 A n 1 ,
что и требовалось доказать.
Следствие 1. Если появление события А не зависит от события В, то и
появление события В не зависит от события А
Доказательство. Если появление события А не зависит от события В, то
можно записать
Р(В/А) - Р(В) ,
зависимыми.
Рассмотрим меру степени зависимости между этими событиями. В
качестве абсолютного показателя величины связи между событиями А и В
можно принять разность
АВ + АB = А .
Тогда
Р(АВ) + Р(АВ) = Р(А) . (*)
С другой стороны,
P( B/A) l - P(B/A),
P( B/A) l - P(B/A),
P(A )P( A )
A , B , A B
PBPB PA PA
. (2.24)
P(B)P( B)
Р(А) = Р(В)
или
или
1 R 1 .
Р( В) = Р (AB) + Р(АВ) ,
откуда
АВ = А + В .
Следовательно,
Р (AB) = Р (А + В) = 1 - Р (А B) ,
Р (A B) = Р(А) Р (ВВ- Р(АВ) = 0,1280 + 0,0346 - 0,0206 = 0,1420 ,
PAB 0,0206
PB / A 0,1609 .
PA 0,1280
PAB 0,0140
PB / A 0,0160 .
PA 0,8720
A B1 A B 2 A ... B n A
A B1 A B 2 A ... B n A
\
По теореме умножения вероятностей имеем
Или
n
P(A ) P(B i ) * P(A / B i ),
i 1
Искомая вероятность
P( A ) P( B j / A ) P( B j ) P( A / B j )
получим
P( B j A ) P( B j ) P( A / B j ) / P( A )
n
P(B j A ) P(B j )P(A / B j ) / P(B i ) * P(A / B i ), (2.27)
i 1
0,5 * 0,98
P(B1 A) P(B1 )P(A / B1 ) / P(A) 0,525;
0,935
0,3 * 0,95
P( B 2 A) P( B 2 ) P( A / B 2 ) / P( A) 0,304;
0,935
0,2 * 0,8
P( B 2 A ) P( B 2 ) P( A / B 2 ) / P( A ) 0,171;
0,935
j m
Cm
n C Nn
P(B j )[
l C nN
P(B j A ) P(B j )P(A / B j ) / P(B i ) * P(A / B i ) l
l m
Cm
n / C nN P(B j ) * C Njmn
lm
P(B j ) * C Njmn
l
,
P(B j ) * C Njmn
lm
P(B 0 / A ) 0,
0
P(B1 ) * C180
P ( B1 A ) 0,00085
0
P(B1 ) * C180 P(B 2 ) * C1180 P(B 3 ) * C180
2
P(B 2 ) * C1180
P(B 2 A) 0,09129
0
P(B1 ) * C180 P(B 2 ) * C1180 P(B 3 ) * C180
2
2
P(B 3 ) * C180
P(B 3 A) 0,90786
0
P(B1 ) * C180 P(B 2 ) * C1180 P(B 3 ) * C180
2
m n m
Pm, n C m
np q ,
или
n!
Pm, n * p mq n m (2.29)
m!(n m)!
(q p) n q n C1n p q n 1 ... C m m n m
n p q ... p n 1
Pm,n p1q 2 ...p m q m 1 ...q n ... p1q 2 p 3 ...p n q n 1 ...q 1q 2 ...q n m p n m 1 ...p n
P(A i ) p i ,
P( A i ) 1 p i q i ,
или
n ( x ) П(q l p i x ), (2.31)
n
П (q l p i x ) Pm,n x m , (2.32)
m 0
n
Pm,n 1
m 0
n ( x ) (q p x ) n q n x 0 C1n p q n 1 x 1 ... C m m n m m
n p q x ... p n x n , (2.33)
или
n
(q p x ) n
C mn p m q n m x m ,
m 0
C m B m B m 1 ... B n ,
D m B 0 B1 ... B m ,
D m 1 B 0 B1 ... B m 1 ,
C m 1 B m 1 B m 2 ... B n ,
m
P(D m ) P(B 0 ) P(B1 ) ... P(B m ) Pi ,n , (2.35)
i 0
m 1
P(D m 1 ) P(B 0 ) P(B1 ) ... P(B m 1 ) Pi ,n , (2.36)
i 0
n
P(C m 1 ) P(B m 1 ) P(B m 2 ) ... P(B n ) Pi,n , (2.37)
i m 1
( x ) (0,2 0,8x )(0,3 0,7 x )(0,1 0,9 x )(0,05 0,95x ) 0,003 0,0103x
0,1073x 2 0,4033x 3 0,4788x 4
4
P(C 2 ) Pi , 4
i2
Коэффициенты при х2 , х3, х4 в разложении по степеням х производящей
функции 4 ( x ) являются соответствующими вероятностями
Р2,4 ; Р3,4; Р4,4 , следовательно,
n!
Pm0,n C m
n p
m0 n m0
q * p m0 q n m0 (2.40)
m 0 !(n m 0 )!
Pm 0 ,n Pm 0 1,n ,
m 0 np q; m 0 np q;
np q m 0 np q, (2.41)
np q (np q ) p q 1,
n! n n e n 2n ,
n n e n 2n p np q nq 1
Pm 0 ,n , (2.42)
(np) np e np 2np (np) nq e nq 2nq 2qnp
1
P234, 250 0,1012
2 * 250 * 14 / 15 * 1 / 15
3 Законы распределения случайных величин
X x1 , X x 2 ; ...; X x n . (3.1)
n n
P(X x1 ) p i 1 .
i 1 i 1
F( x ) P(X x ) . (3.3)
F( x ) P( X x 1 ) , (3.4)
xi x
F( x ) P(X x 1 ) 0 ;
при x 1 x x 2 :
F( x ) P(X x 2 ) P(X x 1 ) p1 ;
при x 2 x x 3 :
при x 3 x x 4 :
F( x ) P(X x 4 ) P(X x 1 ) P(X x 2 ) P(X x 3 ) p1 p 2 p 3 ;
при x n 1 x x n :
p1 p 2 p 3 ... p n 1 p n 1 .
F(x)
0 x
0 x
0 F( x ) 1 .
А = В + С.
или
откуда
F() F() .
P( X ) 0 ,
F() 0 ; F() 1 .
P( x X x x ) F( x x ) F( x ) .
P( x X x x ) F( x x ) F( x )
.
x x
Полученное отношение называется средней вероятностью,
приходящейся на единицу длины этого участка. Считая функцию
распределения F (х) дифференцируемой, перейдем в последнем равенстве к
пределу при x 0 . В пределе получим производную от функции
распределения, которая и называется дифференциальной функцией
распределения
P( x X x x ) F( x x ) F( x )
lim lim F' ( x ) . (3.9)
x 0 x x 0 x
f(x)
0 x
0 dx x
f (x) 0 .
Таким образом,
P( X ) f ( x )dx .
x
F(X ) f (x )dx . (3.11)
Доказательство. По определению интегральной функции
x
P( X x ) f (x )dx .
x
F(X ) f (x )dx .
F(x)
α β x 0 х x
f (x )dx 1 .
F() f (x )dx 1 ,
m n m
Pn ,m C m
n p q .
р
0,5
0,25
0 1 2 3 4 5 х
при 0 х 1:
при 1 х 2 :
при 2 х 3 :
при 3 х 4 :
при 4 х 5 :
при х 5 :
F( x ) P(X x i ) P(X 0) P(X 1) Р(Х 2) Р(Х 3) Р(Х 4)
x i 4
P(X 5) 1 .
F(x)
0,5
0,25
0 1 2 3 4 5 х
f (x )dx a sin xdx a cos x 0 2a .
0
1
sin x при 0 x ,
f (x) 2
0 при x 0 и x .
/2 /2
1 1 1 1
P 0 x
2 2
sin x dx cos x
2 0
cos cos 0 .
2 2 2
0
F(x)
0,5
3
0 x
4 2 4
x x
1 1
F( x ) sin x dx cos x 0,5 0,5 cos x .
0
2 2 0
0 при x 0,
Fi ( x ) 0,5 0,5 cos x при 0 x ,
при x .
1
0 x
x p x 2 p 2 ... x n p n
x i pi
i 1
M( x ) 1 1 .
p1 p 2 ... p n n
pi
i 1
n
Учитывая, что p i 1 , получим
i 1
n
M(x ) x i p i . (3.13)
i 1
M(x ) x i p i .
i 1
M(x ) xf (x )dx , (3.14)
при условии существования интеграла x f (x )dx .
b
M ( x ) xf ( x )dx . (3.15)
a
M(x ) xdF(x ) .
M ( x y) M ' ( x ) M ( y) .
Х x1 x2 … xn Х y1 y2 … ym
Р p1 p2 … pn Р g1 g2 … gm
n m
pi 1 pj 1
i 1 j1
M( x y) ( x i y i )p i g j x i p i g j y i p i g j
i j i j i j
x i p i g j y i g j p i M ( x ) M ( y) .
i j j i
M( xy ) M( x )M( y) .
n m
M ( x ) x i p i , M ( y) y j g j .
i 1 j1
M( xy) x i y j p i g j x i p i y j g j M( x )M( y) .
i j i j
n n
M x i M ( x i ) .
i 1 i 1
Таким образом, математическое ожидание произведения нескольких
взаимно независимых случайных величин равно произведению их
математических ожиданий.
Свойство 3. Математическое ожидание постоянной величины равно
самой постоянной:
М (с) = с.
М (с) = с, 1 = с.
Свойство 4. Постоянный множитель случайной вeличины может быть
вынесен за знак математического ожидания:
М (сх) = с М (х)
M( x ) 1,2 0,32 1,3 0,25 1,4 0,14 1,5 0,12 1,6 0,08 1,7 0,05 1,8 0,02
1,8 0,02 1,9 0,01 2,0 0,01 1,373% .
P(X Me ) P(X Me ) ,
2x M[X M( x )] 2 .
Для дискретной случайной величины дисперсия равна сумме
произведений квадратов отклонений значений случайной величины от ее
математического ожидания на соответствующие вероятности:
n
2x [ x i M ( x )] 2 p i . (3.16)
i 1
2x [ x M ( x )] 2 f ( x )dx . (3.17)
2x [ x M ( x )] 2 dF( x ) .
x 2x .
2 [X Y] 2x 2y ,
М ( X Y ) M ( x ) M ( y) ,
2 [X Y] 2x 2y .
Методом математической индукции можно доказать это свойство для
произвольного числа взаимно независимых случайных величин:
X i 2 X i .
n
2
i 1
2x M( x 2 ) [M( x )] 2 . (3.18)
2 (c) 0 .
2 [cX] c 2 2x .
c 2 M[X M( x )] 2 c 2 2x
2 [X Y] 2x 2y .
2 [X (Y)] 2x 2 [Y] .
2 [Y] (1) 2 2y 2y .
Окончательно получаем:
2 [X Y] 2x 2y
M[X 2 Y 2 ] [M(XY )] 2 .
Окончательно имеем:
M( x 2 ) 1,2 2 0,32 1,3 2 0,25 1,4 2 0,14 1,5 2 0,12 1,6 2 0,08 1,7 2 0,05
q M[X q ] .
n
q x iq p i ;
i 1
q x
q
f ( x )dx .
q M{[ X M( x )]q } .
n
q [ x i M ( x )]q p i ;
i 1
A 3 / 3 .
E 4 / 4 3 .
0 при х 0,
f ( x ) ax 2 при 0 x 2,
0 при x 2.
2 2 2
ax 3 8
f (x )dx ax dx 3 a.
2
0 0 0
3
Учитывая, что эта площадь должна быть равна единице, находим: a=3/8.
Для определения интегральной функции используем форму (3.11)
x x x
F( x ) f ( x )dx 3 / 8x 2 dx | 3 / 8 x 3 / 3 x 3 / 8 ,
0 0 0
следовательно,
0 при х 0,
3
f ( x ) x / 8 при 0 x 2,
1 при x 2.
2 2
M ' ( x ) xf ( x )dx 3 / 8x 3 dx 3 / 8 0 x 4 / 4 1,5 .
2
0 0
2 2
M ( x ) x f ( x )dx 3 / 8x 4 dx 3 / 8 0 x 5 / 5 2,4 .
2 2 2
0 0
Таким образом,
1 M( x ) 1,5 ,
2 M( x 2 ) 2,4 ,
2 2
32
3 M ( x ) x f ( x )dx 3 / 8x 3 dx | x 6 / 6 4 ,
3 3
0 0
80
2 2
32 7
4 M ( x ) x f ( x )dx 3 / 8x dx | x / 7 6,8571,
4 4 6
0 0
80
] M[X M( x )] 0 .
M[X
] 2 [X M( x )] 2x .
2 [X
X X M(x )
T .
x x
x x
0 при х a ,
f ( x ) c при a x b,
0 при x b.
где с = const. Равномерное распределение иногда называют законом
равномерной плотности.
График плотности f(х) для равномерного распределения изображен на
рисунке 19. Найдем значение постоянной с. Так как площадь, ограниченная
кривой распределения, равна единице, и все значения случайной величины
принадлежат интервалу [а, b], то должно выполняться равенство
f (x )dx 1,
a
или
cdx 1,
a
отсюда
c = 1 / (b – a).
0 при х a ,
f ( x ) 1 /(b a ) при a x b,
при x b.
0
f(x)
0 а b x
x
xa
x x
1 x
F( x ) f ( x )dx dx .
a a
ba ba a ba
x
ab
b
x x2
M(x ) dx .
a
b a 2( b a ) a
2
Me (a b) / 2 .
f(x)
0 а b x
2
(b a ) 1 (b a ) 2
b
2 x
2
dx .
a 2 b a 12
(b a ) / 2 3 .
4
(b a ) 1 (b a ) 4
b
4 x dx .
a
2 ba 80
Коэффициент эксцесса
E 4 / 1 3 1,2 .
1
e ( x a ) / 2 ,
2 2
f (x) (3.19)
2
f(x)
0 M(x) x
1
М ( x ) xf ( x )dx xe ( x a ) / 2 dx .
2 2
2
Введём новую переменную t ( x a ) / . Имеем: x t a ; dx dt .
Нетрудно убедиться, что новые пределы интегрирования совпадают со
старыми. Таким образом,
1 1
(t a )e t / 2 dt te t / 2 dt e t / 2 dt a .
2 2 2
М(x )
2 2 2
Первое слагаемое в правой части равенства равно нулю, так как под
знаком интеграла с симметричными пределами находится нечетная функция.
Второе слагаемое равно а, поскольку
e
t 2
/2
dt 2 .
1
(x a ) f (x )dx (x a ) e
2 ( x a ) 2
/ 2 2
2x 2
dx .
2
3 2
2 2
2 t 2 / 2 t 2 / 2
2x t e dt te dt .
Интегрируем по частям, положив u = t, te t
2
/2
dt d , откуда du = dt,
te
t 2
/2
dt . Окончательно имеем
2x 2 .
lim f ( x ) 0 .
x
1
f (a ) .
2
В этом нетрудно убедиться, найдя первую производную от f(x)
x a ( x a ) 2 / 2 2
f ' (x) e .
3 2
Так как первая производная при переходе через точку, в которой она
обращается в пуль, меняет знак от «+» к «», то имеем в точке х = а максимум
функции f(x).
Свойство 5. График функции плотности f (х) симметричен относительно
прямой, проходящей через точку х = а.
Отсюда следует равенство для нормально распределенной величины
моды, медианы и математического ожидания.
Свойство 6. Кривая распределения имеет две точки перегиба с
координатами
1 1
a ; и a ;
2e 2e
1 ( x a ) 2 / 2 2 (x a ) 2
f ' ' (x) e 1.
3 2 2
1
q ( x a ) f ( x )dx
q
( x a ) q ( x a ) 2 / 2 2
e dx .
2
q
2
q q 2 / 2
q t e dt . (3.21)
(k 1) q
t e
q 2 q 2
q /2
dt . (3.22)
2
q 2
t e
q 2 q 2
q 2 /2
dt .
2
q / q 2 (k 1) 2 .
Отсюда получаем простое рекуррентное соотношение, выражающее
моменты высших порядков через моменты низших порядков:
q (q 1) 2 q 2 . (3.23)
2 2 ; 4 3 4 ; 6 15 6 .
A 3 / 3 0 ;
E 4 / 4 3 0 .
f(x)
II
III
0 х
t
[ 2]
2 0
t 2 / 2
( t ) e dt .
M( x ) X M( x ) M( x )
P( X ) P .
P( t 1 T t 2 ) F( t 2 ) F( t 1 ) , (3.24)
M( x ) M( x )
где t 1 ; t2 . Считая, что нормированная случайная
величина Т имеет нормальное pacпределение и используя определение
интегральной функции распределения, получим:
t t 0 t
1 1 1
F( t ) P(T t ) f ( t )dt e t 2 / 2
dt e t 2 / 2
dt e t 2 / 2
dt .
2 2 2 0
F( t ) 1 / 2 1 / 2 ( t ) . (3.25)
M( x ) M( x )
t .
P ( X M ( x ) ) ( / ) . (3.27)
T M( x )
P(X Tн ) F(Tн ) 1 / 2 1 / 2 н 1 / 2 1 / 2(2) 1 / 2 1 / 2(2)
0,0225 ,
T M( x )
P(X Tв ) 1 P(X Tн ) 1 F(Tн ) 1 / 2 1 / 2 н
1 / 2 1 / 2 (0,86) 0,1950
1 1 t 2 / 2 1
f (x) e f (t) .
2
Таблица 3.6 – Расчёт теоретической кривой распределения диаметра шейки плунжера после шлифовки с помощью
нормированной плотности нормального распределения
1 t 2 / 2
f (t) e
2
1 1
P (a X b ) ( t 2 ) ( t 1 )
2 2
1,000
x 6,7507
s = 0,0316
1
Произведение f ( t ) является теоретической частостью признака
приходящейся на середину интервала. Для определения частоты признака,
распределенной по всей ширине интервала, эта величина умножается на
ширину интервала h и на общее число наблюдений N m i . При округлении
1 1
P (a X b ) ( t 2 ) ( t 1 ) ,
2 2
P(X m) C mn p m q n m (m 0, 1, ..., n )
где q = l - p. Постоянные n и р, входящие в это выражение, являются пара
метрами биномиального закона.
Биномиальным распределением описывается распределение
вероятностей только дискретной случайной величины. Возможными
значениями случайной величины Х являются m 0, 1, ..., n . Биномиальному
распределению подчиняется, например, число бракованных изделий в
выборках из неограниченной партии продукции. Биномиальное
распределение может быть задано в виде ряда:
0 при m 0,
F(m) Pm ,n при 0 m n ,
m i m
1 при m n.
n
1 mC mn p m q n m , (3.30)
m 0
n
2 m 2 C mn p m q n m , (3.31)
m 0
n
3 m 3 C mn p m q n m , (3.32)
m 0
n
4 m 4 C mn p m q n m , (3.33)
m 0
n
(p q) n
C mn p m q n m .
m 0
В результате получим:
n
n (p q ) n 1 mC mn p m1q n m , (3.34)
m 0
n
n (n 1)( p q ) n 2
m(m 1)C mn p m2 q n m , (3.35)
m 0
n
n (n 1)( n 2)( p q ) n 3
m(m 1)(m 2)C mn p m3 q n m , (3.36)
m 0
n
n (n 1)(n 2)(n 3)(p q ) n 4
m(m 1)(m 2)(m 3)C mn p m4 q n m , (3.37)
m 0
n
np(p q ) n 1
mC mn p m1q n m , (3.38)
m 0
Правые части равенства (3.30) и (3.38) равны между собой,
следовательно, равны и левые части. т. е.
1 np(p q) n 1 .
1 np (3.39)
или
M ( x ) np .
n
n (n 1)p (p q )
2 n 2
m(m 1)C mn p m q n m .
m 0
n n
n 2 p 2 np 2 m 2 C mn p m q n m mC mn p m q n m .
m 0 m 0
n
n (n 1)(n 2)p 3 (p q ) n 3 m(m 1)(m 2)C mn p m q n m
m 0
или
n n n
n p 3n p 2np
3 3 2 3 3
m 3
C mn p m q n m 3 m 2
C mn p m q n m 2 mC mn p m q n m .
m 0 m 0 m 0
n
n (n 1)(n 2)(n 3)p (p q ) 4 n 4
m(m 1)(m 2)(m 3)C mn p m q n m
m 0
или
n n
n p 6n p 11n p 6np
4 4 3 4 2 4 4
m 4
C mn p m q n m 6 m 3 C mn p m q n m
m 0 m 0
n n
11 m 2
C mn p m q n m 6 mC mn p m q n m .
m 0 m 0
7n 2 p 2 7np2 np .
2 2 npq ; (3.42)
npq , (3.43)
3 npq(q p) ,
4 3n 2 p 2 q 3 npq(1 6pq) .
A (q p) / npq , (3.44)
E (1 6pq) / npq . (3.45)
Р
р=0,9
0,3
р=0,1
0,25
р=0,7
0,2 р=0,3 р=0,5
0,15
0,1
0,05
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 m
р n=3
0,4 n=5
0,3 n=10
0,2
0,1
0,05
0 1 2 3 4 5 6 7 8 9 10 m
np q m 0 np p .
1
Pm ,n f (t) , (3.47)
npq
1 t 2 / 2 m np
где f ( t ) e ;t .
2 npq
Pm 1,n Pm ,n
y' Pm 1,n Pm ,n .
(m 1) m
q / x 0 ; x / np 0 ; 1 / np 0 .
Тогда имеем
dy
Так как y' , то равенство (3.49) можно представить в виде
dx
dy xdx
.
y npq
x2
ln y c,
2npq
e (x / 2 npq ) c
2
y.
или
y e c e x
2
/ 2 npq
.
y y 0 e x
2
/ 2 npq
.
1
Pm 0 ,n .
2npq
1
y y0e0 .
2npq
Отсюда
1
e x
2
y / 2 npq
. (3.50)
2 npq
получим
1
e t
2
y /2
,
2 npq
1 t 2 / 2
где e - нормированная плотность нормального распределения f (t),
2
т.е.
1
Pm ,n f (t) .
npq
1
e x / 2 .
2 2
y
2
Локальная теорема Муавра - Лапласа относится к предельным теоремам
теории вероятностей (смотри главу IV). Асимптотическая формула этой
теоремы позволяет производить расчеты вероятности появлений событий при
большом числе испытаний, не прибегая к формуле Бернулли.
Пример 10. Вероятность того, что станок - автомат производит годную
таблетку, равна 8/9. За смену было изготовлено 280 таблеток. Определить
вероятность того, что среди них 20 бракованных.
Решение. Согласно условию задачи имеем; n = 280; m = 20; p = 1/9; q=8/9,
По формуле (3.47) находим
1 f (t )
P20, 280 f (t) .
280 1 / 9 8 / 9 5,2588
m np 20 280 1 / 9
t 2,11 .
npq 280 1 / 9 8 / 9
m np 1 5 0,07 0,65
t 1,14 .
npq 5 0,07 0,93 0,5705
1
e [ u M ( u )] / 2 2u
2
f (u ) . (3.51)
u 2
Плотность распределения случайной величины Х, которую можно
представить как показательную функцию x e u , связана с плотностью
распределения величины и следующим образом:
dF( x ) dF[ x (u )] du du 1
f (x) f (u ) f (u ) .
dx du dx dx x
Отсюда находим:
1
e [ln x M ( u )] / 2 2u
2
f (x) ,
x u 2
M ( x ) xf ( x )dx e ( u 2 M ( u )) / 2 ;
2
(3.52)
0
[ x M ( x )] 2 f ( x )dx e u 2 M ( u ) e u 1 .
2 2
2x (3.53)
0
2x /[M( x )] 2 e u 1 ,
2
откуда
2u ln[ 2x /[M( x )] 2 1] .
ln M( x ) 2u / 2 M(u ) ,
откуда
1 2x
M (u ) ln M ( x ) 2u / 2 ln M ( x ) ln 1.
2 [M ( x )] 2
1 2x
ln X ln M ( x ) ln 1
2 [ M ( x )]2
2x
2 ln 1
1 [ M ( x )]2
f (x) e
2x
x 2 ln 2
1
[M ( x )]
ln x M ( u ) 2
2 2 ( u )
e
ln x M ( u ) 2
1 2 2 ( u )
e
x 2(u )
0 x
ln x M(u ) 2
2 2 ( u )
n n 1 1 n2 2
lim 1 ; lim lim 1 1 ; lim lim 1 1 ;
n n n n n n n n n n
m
n m 1 m 1 a
lim lim 1 1 ; lim 1 1.
n n n n n n
a 1
Для нахождения предела выражения (1 a / n ) n обозначим ,
n x
откуда n ax . Далее имеем:
ax a
a
n
1 1
x
lim 1 lim 1 lim 1 e a ,
n n x x x x
a m e a
Pm,n . (3.54)
m!
а=0,5
0,5
а=1
а=2
а=3,5
0 1 2 3 4 5 6 7 8 m
m
Pm e e e … e …
1! 2! m!
a m am
Pm m! e e m! .
m 0 m 0 m 0
am
Но e , следовательно,
m 0 m!
Pm e e 1.
m 0
a m
M(x ) mPm m m!
e .
m 0 m 0
a m
a m 1
M( x ) m e e
np .
m 1 m ! m 1 ( m 1 )!
a m 1
a m 1
a m2
a m 1
e
(m 1) (m 1)! e (m 1)! e (m 2)! e (m 1)! .
2
m 1 m 1 m2 m 1
M ( x 2 ) 2 e e e e 2 .
2X M( x 2 ) [M( x )] 2 2 2 np .
3 3 3 2 ,
4 4 6 3 7 2 .
3 3 3 2 3( 2 ) 2 3 ,
4 4 6 3 7 2 4( 3 3 2 ) 6( 2 ) 2 3 4 3 2 .
А / 3 1/ ;
E [(3 2 ) /( 3 )] 3 1 / .
(6 1,52) 2 1 (7 1,52) 2 0
... 1,54 ,
150
что является одним из признаков пуассоновского распределения. Приравняв
полученное значение х математическому ожиданию теоретического закона и
подставив 1,52 в формулу закона Пуассона, вычисляем теоретические
частоты. Общее число наблюдений равно числу проб (N = 150).
M( x )
PX 1 . (4.1)
x 1 p1 x 2 p 2 .... x r p r ... x n p n М( х )
следовательно,
x 1 p1 x 2 p 2 .... x r p r М( х ) .
(p1 p 2 ... p r ) М( х ) ,
или
М( х )
p1 p 2 ... p r .
М( х )
Р{X } 1 ,
2 (x)
P{| X M( x ) | } 1 , (4.2)
2
Тогда имеем:
MX M( x )
2
P X M( x ) 1
2 2
.
2
PX M( x ) 1
2 2 (х)
2
.
2
2 (х)
PX M( x ) 1 2 ,
P{| X M ( x ) | } 1 1 / t 2
P{| X M ( x ) | } 1 / t 2
P{| X M ( x ) | 2} 0,9844.
P{| X M( x ) | } 1 , (4.4)
n
X X i / n.
i 1
n
Xi 1 n
M ( x ) M i1 M ( x i ) M ( x ) , (4.5)
n n i1
n
Xi 1 n 2 ( x )
(x)
2 2 i 1
2 (xi )
2
. (4.6)
n n i1 n
2 (х)
PX M( x ) 1 2 .
2 ( х )
PX M( x ) 1 2 . (4.7)
n
Задавшись сколь угодно малым числом , можно определить n, для
которого выполняется неравенство
2 (х)
.
2n
PX M( x ) 1 ,
PX M( x ) . (4.8)
n n
i X M ( x )
i1
i
P i 1
1 , (4.9)
n n
n
Xi
i 1
Х .
n
2 (х)
PX M( x ) 1 2 ,
или
n n n
i X M ( x ) 2 ( x i )
i
P i1 i1 1 i1 2 2 . (4.10)
n n n
n n
Xi M(x i )
i1 В
P i 1
1 2 . (4.11)
n n n
Для любого сколь угодно малого числа 0 можно найти такое число
n, при котором выполняется неравенство:
B
.
n 2
n n
i M(x i )
X
i 1 i 1
P 1 .
n n
n n
Xi M(x i )
i1
P i 1
. (4.12)
n n
2 (х)
1 0,9,
2n
откуда находим n 50 .
Пример 3. На завод поступила партия таблеток, рассортированных
автоматом для упаковки по их длине. Таблетки, распределенные по размерам
на группы, помещены в 64 ящика с одинаковым количеством в каждом. Из
каждого ящика отобрано по 10 таблеток и измерены их длины. При условии,
что дисперсия контролируемого параметра в каждом ящике не превышает
0,015мм 2 , определить, с какой вероятностью можно ожидать, что средняя
арифметическая, вычисленная по результатам выборок, отклонится по
абсолютной величине от средней длины деталей о всей партии не более чем на
0,3 мм.
n n
i M( x i )
X
i 1 i 1
P 0,3 0,997.
n n
Рассмотрим случай зависимых случайных величин, являющихся
дальнейшим обобщением закона больших чисел.
Теорема Маркова. При достаточно большом числе случайных величин
Х 1 , Х 2 ,..., Х n , среди которых могут быть зависимые, с вероятностью, близкой
к единице, можно утверждать, что разность между средней арифметической
наблюдавшихся значений случайных величин и средней арифметической их
математических ожиданий по абсолютной величине окажется меньше сколь
угодно малого 0 , если при n выполняется условие
2
n
X i
i 1
0.
n2
n
Xi
i 1
X .
n
Очевидно,
n
M(x i )
i 1
M(x ) , (4.13)
n
2 n
Xi
2 ( x ) i12 . (4.14)
n
Используя равенства (4.13) и (4.14) и учитывая, что при n , согласно
2 n
X i
i 1
накладываемому теоремой условию, 0, получим:
n2
n n
i M( x i )
X
i1
P i 1
1 , (4.15)
n n
m
P p 1 , (4.16)
n
где и - любые сколь угодно малые положительные числа.
Доказательство. Рассмотрим в качестве случайных величин число
появлений событий А в n испытаниях.
Пусть:
X 1 - число появлений события А в первом испытании;
M( x i ) 1 p 0 q p , (4.17)
2 ( x i ) (1 p) 2 p (0 p) 2 q pq . (4.18)
Очевидно, что:
M ( x i ) M ( x 2 ) ... M ( x n ) , (4.19)
2 ( x i ) 2 ( x 2 ) ... 2 ( x n ) . (4.20)
n
Xi / n m / n ,
i 1
m
P p 1 (pq) /(n2 ) . (4.21)
n
(pq) /(n 2 ) .
m
P p 1 .
n
m X 1 X 2 ... X n ,
n n n
M (m) M X i M ( x i ) p np,
i 1 i 1 i 1
2 n 2
n n
(m) X i [X i ] pq npq.
2
i 1 i 1 i 1
p 25 / 200 0.125.
m
P p 0,025 1 (0,125 0,875) /(1000 0,025 2 ) ,
n
или
P{| m / n p | 0,025} 0,825.
Обобщение теоремы Бернулли на случай, когда испытания происходят
при неодинаковых условиях, что вызывает изменение вероятности появлений
события А в каждом испытании, является теорема Пуассона.
Теорема Пуассона. При достаточно большом числе независимых
испытаний n можно с вероятностью, близкой к единице, утверждать, что
разность между частостью появлений событий А и средней арифметической
вероятностей этого события в каждом испытании по абсолютной величине
окажется меньше сколь угодно малого числа , если вероятность события А
меняется от испытаний к испытанию. Утверждение теоремы можно записать
в виде следующего неравенства:
P{| m / n p | } 1 , (4.23)
M( x i ) 1 p i 0 q i p i ,
2 ( x i ) (1 p i ) 2 p i (0 p i ) 2 q i p i q i .
Средняя арифметическая математических ожиданий величин Х i есть не
что иное, как частость появлений события А в n испытаниях
n
Xi / n m / n .
i 1
n
p p i / n.
i 1
1 n
pq p i q i .
n i 1
Итак, случайные величины Х i (i 1,2,..., n ) удовлетворяют все условиям
обобщенной теоремы Чебышева. Используя формулу (4.10), получим:
m
P p 1 (pq) /(n2 ) , (4.24)
n
или
m
P p 1 1 / 4 n 2 .
n
Для любого сколь угодно малого числа 0 можно найти такое число
n, при котором выполняется неравенство:
1 / 4n 2 .
P{| m / n p | } 1 .
0,01 0,99 100 0,01 0,99 250 0,02 0,98 326 0,04 0,96 405
pq ...
2500
0,06 0,94 500 0,09 0,91 567 0,12 0,88 273 0,15 0,85 54
... ...
2500
0,20 0,80 25
... 0,0559
2500
M ( x i ) a i ; M[ x i a i ] ( x i ), M[ x i a i ] c i ,
2 2
где 0, (i 1,2,..., n ) ;
2) Ни одна из величин по своему значению резко не отличается от всех
остальных:
n
ci
i 1
lim 1 / 2
0.
n
n 2
( x i
)
i 1
n
Следовательно, для Yn X i при n выполняется соотношение:
i 1
y [ y M ( Yn )]
2
1
2( y)
22 ( y )
P{Yn y} e dy , (4.25)
n n
где M (Yn ) M ( x i ); (Yn ) ( x i ).
2 2
i 1 i 1
nc c
0.
(n 2 ( x ))1 / 2 n / 2 2 ( x )
[ x M ( x )]2
x
1
2( x )
22 ( x )
P{x x} e dx . (4.26)
1
2( x ) a
22 ( x )
P (a x b ) e dx . (4.27)
1 1
P(a x b) Ф( t 2 ) Ф( t 1 ),
2 2
где
t 1 (a M ( x )) / ( x ); t 2 (b M ( x )) / ( x ).
a np m np b np 1 b np 1 a np
P(a m b) P Ф
2 npq 2 Ф npq , (4.28)
npq npq npq
n
m Xi ,
i 1
1 b M (m) 1 a M (m)
P (a m b ) Ф Ф
2 (m) 2 (m)
. (4.29)
a np m np b np 1 b np 1 a np
P ( a m b ) P Ф Ф .
npq npq 2 npq 2 npq
npq
Теорема доказана.
Теорема Муавра – Лапласа справедлива для биномиального
распределения при больших значениях n. Это обстоятельство позволяет
упростить вычисление вероятностей биномиального распределения при
больших n, так как подсчет вероятностей того, что событие наступит в n
испытаниях не менее а раз и не более b раз по точной формуле:
P (a m b ) C mn p m q n m
a m b
m
P( t1 (pq) / n p t 2 (pq) / n ) 1/ 2Ф( t 2 ) 1/ 2Ф( t1 ) . (4.33)
n
P m np t npq Ф( t ) , (4.34)
m
P p t (pq) / n Ф( t ) . (4.35)
n
или
0,17 0,83
P 0,2 0,17 1,96 0,95.
n
~
n f (X1 , X 2 , ..., X m ).
~
Поскольку X1 , X 2 , ..., X m - случайные величины, то и n является
величиной случайной. Так, например, если известно, что изучаемая величина
распределена в генеральной совокупности по нормальному закону, то
необходимо оценить по выборкам математическое ожидание и среднее
квадратическое отклонение, так как именно эти два параметра полностью
определяют нормальное распределение; если случайная величина подчинена
закону Пуассона, то необходимо оценить только один параметр ,
определяющий это распределение.
Выбор оценки, позволяющей получить хорошее приближение
оцениваемого параметра, - основная задача теории оценивания.
~
M ( n ) .
~
Если это равенство не выполняется, то оценка n может либо завышать
~ ~
значение (т.е. M ( n ) ), либо занижать его (т.е. M ( n ) ). В обоих
случаях это приводит к систематическим (одного знака) ошибкам в оценке
параметра .
Требование несмещенности гарантирует отсутствие систематических
ошибок при оценке параметров.
~
Так как n - случайная величина, значение которой изменяется от
выборки к выборке, то меру ее рассеивания около математического ожидания
~ ~ ~
будем характеризовать дисперсией D( n ) . Пусть n и Tn - две
~ ~
несмещенные оценки параметра , т.е. M ( n ) и M (Tn ) , причем
~ ~ ~ ~
дисперсию n и Tn обозначим соответственно через D( n ) и D(Tn ) . Из двух
~ ~
оценок n и Tn следует отдать предпочтение той, которая обладает меньшим
рассеиванием около оцениваемого параметра, так как в этом случае значение
оценки, вычисленное по конкретной выборке, меньше всего отличается от
~ ~
истинного значения оцениваемого параметра. Если D( n ) D(Tn ) , то в
~
качестве оценки принимают n .
~
Несмещенная оценка n , которая имеет наименьшую дисперсию среди
всех возможных несмещенных оценок параметра , вычисленных по
выборкам одного и того же объема, называется эффективной оценкой.
~
Оценка n параметра называется состоятельной, если она
подчиняется закону больших чисел, т.е. выполняется следующее равенство:
~
lim P n 1.
n
Состоятельность оценки означает, что чем больше объем выборки, тем
больше вероятность того, что ошибка оценки не превысит сколь угодно малого
положительного числа . Следовательно, в случае использования
состоятельных оценок оправдывается увеличение числа единиц выборки, так
как при этом все менее вероятной становится возможность значительной
ошибки в оценке неизвестного параметра.
На практике при оценке параметров не всегда удается удовлетворить
одновременно требованиям несмещенности, эффективности и
состоятельности оценки. Так, например, может оказаться, что для простоты
расчетов целесообразно использовать незначительно смещенную оценку.
Однако выбору оценки всегда должно предшествовать ее критическое
рассмотрение со всех точек зрения.
X X 2 ... X i ... X n
Xl
l1
X 1 .
n n
X X 2 ... X i ... X n
M ( X ) M 1 1 / n M X1 X 2 ... X i ... X n
n
1 / n M (X1 ) M (X 2 ) ...M (X i ) ... M (X n ) 1 / n ( ... ...
n
1 / n ( n ) ,
M ( X ) .
P X D( X )
.
2
Известно, что
D( X ) 1 / n 2 D(X1 ) D(X 2 ) ... D(X i ) ... D(X n ).
Следовательно,
D( X) 2
lim lim 0,
n 2 n n 2
поэтому
lim P X 1,
n
n
s 1 / n (X i X ) 2
2
i 1
s 2 1 / n (X i X ) 2 1 / n (X i X ) 2 1 / n (X i ) ( X )
n n n
2
i 1 i 1 i 1
n
1 / n (X i ) 2 2(X i )( X ) ( X ) 2
i 1
n n
1 / n ( X i ) 2 / n ( X ) ( X i ) n / n ( X ) 2 .
2
i 1 i 1
n
Упростим выражение 2 / n ( X ) (X i ) . Принимая во внимание,
i 1
n n
что X X i n , откуда nX X i , можно записать
i1 i 1
n n
2( X ) (X i ) 2( X ) X i n
i 1
i1 2( X )(nX n) 2( X ) 2 .
n n n
Тогда
n n
( X i ) 2 ( X i ) 2
i 1 i 1
s2 2( X ) 2 ( X ) 2 ( X ) 2 .
n n
n 2
( X i )
M (s 2 ) M i1 M ( X ) 2 .
n
n 2
( X i )
M i1 2
n
и
M ( X ) 2 D( X ) 2 / n ,
следовательно,
M(s 2 ) 2 2 / n.
Итак,
2 (n 1) 2
M(s )
2 2
,
n n
1 n
ŝ
2
n 1 i1
(X i X ) 2 .
n 2
ŝ 2 s ,
n 1
тогда
n 2 n n n 1 2
M(ŝ 2 ) M s M(s 2 ) 2 .
n 1 n 1 n 1 n
n
( X i ) 2
i 1
s 2 ,
n
1 L ln L
0. (5.3)
L
1
e (( X ) / 2 ) .
2 2
f (X, , 2 )
2
Задача заключается в том, чтобы по данным выборки
X1 , X 2 , ..., X i , ..., X n оценить неизвестные параметры распределения и 2 .
Функцию наибольшего правдоподобия можно записать в следующем виде:
( X1 ) 2 ( X 2 ) 2 ( X n ) 2
1 1
L e 22 e 22 ... e 22
2 2
1
( X1 ) 2 ( X 2 ) 2
...
( X n ) 2
1
1
( X ) ( X ) ...( X
1
2
2
2
n )
2
e 2 2 2 2 2 2 e 22
2
n
2 2
n
1
2
( X i ) 2
1 2
e i 1
.
2
n
n
1
( X i ) 2
1 2 2
L e i 1
,
2 n
n
1 1 n
ln L ln
2 2 2
(X i ) 2 ln e.
i 1
ln L n l
(5.4)
Для нахождения оценок параметров и 2 необходимо решить
совместно следующую систему уравнений:
ln L
0,
(5.5)
ln L 0.
2
1
n ln
2
0,
1
так как при дифференцировании по выражение n ln является
2
константой. Следовательно,
1 n
( X i ) 2
ln L 2
2
i 1
1
2
(X 1 ) 2 (X 2 ) 2 ... (X i ) 2
2
1 n ( X i )
2 ( X i ) i 1
.
2 2
i 1 2
Итак,
n
ln L
( X i )
i 1
.
2
n
( X i )
i 1
0,
2
или
n n
X i 0,
i 1 i 1
n
X i n 0,
i 1
следовательно,
n
n X i ,
i 1
n n
откуда X i / n , но X i / n по определению есть X . Таким образом,
i1 i1
математическое ожидание следует оценивать с помощью средней
арифметической.
Исследуем вторую частную производную
n
( X i )
i 1 2
2 ln L
2
1 (X 1 ) (X 2 ) ... (X n )
2
1 X 1 X 2 X n 1
... n (0 0 ... 0 ... 0 n )
2 2
n
1 n
(n ) 0.
2
2
n
n ln 1 / 2 1 / 2 2 (X i ) 2
ln L i 1
( )
2
( )
2
n
1 / 2 (X i ) 2
2
n ln 1 ln 2 1 / 2( )
2
i 1
( )
2
( ) 2
ln 1 ln 2 n ln( ) 2 ( X i ) 2 ( 2 ) 1
i 1
n n
( 2 ) ( 2 ) 2 ( 2 ) 2 ( 2 )
n n
n
( X i ) 2 n
( X i ) 2
i 1 i 1
00 .
2 2
2( ) 2 2
2 2
2 4
Для определения оценки 2 производную от ln L по параметру 2
приравняем к нулю:
n
( X i ) 2
i 1
0 ( 2 0),
2 2 2 4
или
n
n (X i ) 2 0,
2
i 1
откуда
n
( X i ) 2
i 1
2 .
n
n
(X i X ) 2
i 1
2 .
n
ln L
2
n ( ) 2 1 ( X i ) 2 ( 2 ) 2
i 1
( 2 ) 2 2 ( 2 ) 2 ( 2 )
n n
2 ( X i ) 2
( X i ) 2
n i 1 n i 1
2 1
2( )2 3
2 4
6
n
n
( X i ) 2 1 n n 2 n n n
i 1
n 0.
2 4
n 6
2 4
6
2 4
4
2 4
2 ln L 2 ln L
( X i )
i 1
.
( 2 ) ( 2 ) 4
2 ln L 2 ln L
2 ( 2 )
Q 0.
2 ln L 2 ln L
( 2 ) 2 ( 2 ) 2
Действительно,
n
n/ 2
- (X i ) 1 / 4 2
n
n 2 / 2( 2 ) 3 (X i ) 1 /( 2 ) 4 .
i 1
i1
n
(X i ) 1 / 4 - n/2 4
i 1
2
n 2
n n
2 3 ( X i X ) n
4
3
i1
4
.
n
n
2
2 ( X i X ) 2 ( X i X )
i1 i1
Выражение
n n
(X i X ) X i nX 0,
i 1 i 1
n5
Q 3
0.
n
2 ( X i X ) 2
i1
n
то выборочная средняя X X i / n также подчиняется нормальному
i1
закону распределения.
X
M ( X ) , D( X ) 2 / n . Поэтому нормированное отклонение
/ n
подчиняется нормальному закону распределения со средним значением,
равным нулю, и дисперсией, равной единице. Действительно, используя
свойства математического ожидания, а также тот факт, что X и -
независимы, имеем
X n n n
M M ( X ) [M ( X ) M ()] ( ) 0,
/ n
X n n n 2
D 2 [D( X ) D()] 2 D( X ) 2 1.
/ n n
1 b a
P X 2 P[2( X ) 2) P( 2 X 2) Ф
2
Ф
a b X X
1 ( 2 )4 ( 2 )4 1
Ф Ф 2 [Ф(8 / 3) Ф 8 / 3)]
2 3 3
1
[Ф(8 / 3) Ф(8 / 3)] Ф(8 / 3) 0,9922,
2
следовательно,
P( X 2) 1 0,9922 0,0076,
т.е. практически можно быть уверенным, что наблюдаемая средняя длина
детали отклонится от заданной, принимаемой за математическое ожидание, не
более, чем на 2 мм.
Итак, если случайная величина Х имеет нормальный закон
распределения, то нормированное отклонение:
X
z n,
X
t n,
ŝ
n / 2
t2
s( t , n ) B n 1 . (5.6)
n 1
Р.
Так, n=13 соответствуют следующие значения распределения
Стьюдента: t13; 0,95 2,18; t13; 0,99 3,06; t13; 0,999 4,32 .Заметим, что существуют
X
В заключение еще раз подчеркнем, что статистика t . n имеет
ŝ
распределение Стьюдента, если случайная величина X подчиняется
нормальному закону распределения, а средняя X вычисляется по выборочным
данным X1 , X 2 , ..., X n , полученным в результате независимых наблюдений.
1 n
s 2 (X i ) 2 .
n i1
1 n 1 n 2
s 2 i
n i1
( X ) 2
i .
n i1
1 n 2
s 2 i ,
n i1
откуда
n
ns 2 i2 .
i 1
f ( 2 ) L( n ) n 2 e
2
/2
,
n=1
0,5
0,4
0,3 n=2
0,2
n=6
0,1
0 2 4 6 8 10 12 14 2
n 2
М ( ) М u i M (u12 ) M (u 22 ) ... M (u 2n )
2
i1
2 2 2
X Х Х
M 1 M 2 ... n
M ( X1 ) 2 M ( X 2 ) 2 M ( X n ) 2
...
2 2 2
2 2 2
2 2 ... 2 n.
n
Следовательно, математическое ожидание случайной величины с
распределением 2 и k = n степенями свободы равно числу степеней свободы.
В специальной литературе можно найти доказательство того, что дисперсия
распределения 2 равна удвоенному числу степеней свободы, т. е. D(2) = 2k.
Дифференциальная функция распределения 2 сложна и интегрирование
ее является весьма трудоемким процессом, поэтому созданы таблицы
распределения 2.
В приложениях приводится таблица 7 для вычисления вероятности того,
что случайная величина, подчиняющаяся закону 2 с известным числом
степеней свободы, превысит некоторое фиксированное значение 2k ; , т. е.
P(2 > 2k ; ).
10 2 10 X i 2 16
P X i 16 P P( 2 4).
i1 i1 2 4
ns 2
Примем без доказательства тот факт, что случайная величина 2 имеет
распределение 2 с k = (n - 1) степенями свободы.
~ ~
P (n1) (n2) 1 .
~ ~
Чем меньше для выборки вероятности (n1) (n2) , тем точнее оценка
Х
нормированное отклонение распределено также нормально с
/ n
X
P n z p Ф(z) . (5.7)
P X z p Ф( z ) ,
n
или
P z p
X zp
(z) ,
n n
откуда получим
P X z p X zp Ф( z ) .
n n
Х zp ; Х zp (5.8)
n n
X
t n
s
X
P n t n , p 1 . (5.9)
s
s
P X t n ,p 1 ,
n
или
s s
P t n ,p ( X ) t n , p 1 ,
n n
откуда
s s
P X t n ,p X t n ,p 1 .
n n
s s
X t X t (5.10)
n
n ,p n ,p
n
3 3
6 1,96 6 1,96 ,
9 9
следовательно,
s s
X t n ,p X t n ,p ,
n n
или
3 3
6 2,31 6 2,31 .
9 9
f(2) f(2)
S1 S2
1 2 3 4 5 6 7 8 9 10
2 1 2 3 4 5 6 7 8 9 10
2
12 22 12 22
а) б)
P 2 12 P 2 22 / 2 ,
Поэтому
2 n s 2
P 1 2 22 1 [1 P( 2 12 )] P( 2 22 )
1 1 P( 2 12 ) P( 2 22 )
P( 2 12 ) P( 2 22 ).
Итак,
2 n s 2
P 1 2 22 P( 2 12 ) P( 2 22 ) 1 ;
1 2 3 4 5 6 7 8 9 10
2
12 22
ns 2
12 2 22 (5.11)
так, чтобы было можно оценить 2. Рассмотрим два неравенства, ему
эквивалентные:
ns 2 ns 2
12
2 и 2 22 ,
ns 2 ns 2
откуда находим: 2 и 2 .
2 2
2 1
Обобщая полученные результаты, можно записать
ns 2 ns 2
2 .
2
22 1
2 1
n s
n s
P 1 .
2 1
5,935 23,256 ,
или
D( X Y ) D( X ) D( Y ) 2X / n 1 2Y / n 2 .
M( X Y ) M( X ) M( Y ) 0 ,
XY
z
2X / n 1 2Y / n 2
XY
zp .
1 / n1 1 / n 2
Имеем 2,59 > 2,576, поэтому с надёжностью 0,99 можно считать расхождение
средних неслучайным (значимым), так как попадание в область значений
z 2,576 при нашей гипотезе практически невозможно. Заметим однако, что
же значение 2 неизвестно.
Пусть имеются две независимые выборки объемами n 1 и n2
соответственно из генеральных совокупностей Х и У. Необходимо проверить
2 1 n1 2 1 n2
sx
n 1 1 i 1
(x i x) и s y
n 2 1 i 1
( y i y) 2 .
2 2
2 s x (n 1 1) s y (n 2 1)
s
n1 n 2 2
M( X Y ) M( X ) M( Y ) 0 ,
D( X Y ) D( X ) D( Y ) 2 / n 1 2 / n 2 2 (1 / n 1 1 / n 2 ) .
Так как величина 2 неизвестна, то возникает вопрос о том какой
статистикой оценить D( X Y ) . В качестве выборочной оценки D( X Y )
1 1 2
обычно принимают оценку s X2 Y s , так как
1
n n 2
1 2 1 s x2 (n 1 1) s y2 (n 2 1)
M
1
s
1
1
M s 2
1
M
n1 n 2 2
n 1 n 2 n1 n 2 n1 n 2
2 2
1 1 (n 1 1) M ( s x ) (n 2 1) M ( s y )
n1 n 2 n1 n 2 2
1 1 (n 1 1) 2 (n 2 1) 2 1 1 2
.
1
n n 2 n 1 n 2 2 1
n n 2
(X Y ) M(X Y ) (X Y ) M(X Y )
t 2 2
s(X Y) 1 1 s x (n 1 1) s y (n 2 1)
1
n n 2 n1 n 2 2
(X Y)
t 2 2
1 1 s x (n 1 1) s y (n 2 1)
1
n n 2 n1 n 2 2
Выбрав вероятность p 1 , можно по t - распределения определить
критическое значение t n1 n 2 2; для которого
P ( t t n 1 n 2 2; ) .
. Далее имеем
0,28 2 24 0,33 2 49
s 0,31 .
74
xy 0,19
t 2,47 .
s 1 / n 1 1 / n 2 0,31 0,04 0,02
Так как 2,47 < 2,65, то с надежностью 0,99 нельзя считать pacхождение
средних значимым.
n 2 s12 n 1 / 2 s12
F ,
n 1 s 22 n 2 / 2 s 22
P[F F( , k1 , k 2 ) ] .
гипотезе.
Пример 3. На двух станках обрабатываются печатные платы для
медицинских приборов. Были отобраны две пробы: из печатных плат,
сделанных на станке 1, n 1 10 штук, на 2 станке - n 2 15 штук. По данным
этих выборок рассчитаны выборочные дисперсии s12 9,6 (для первого
станка) и s 22 5,7 (для второго станка). Следовательно,
2
s 9,6
F 12 1,68
s 2 5,7
Эмпирические m1 m2 … mi … ml
частоты ( m i )
Теоретические np1 np 2 … np i … np l
частоты ( np i )
y i (m i np i ) / np i q i
n n 0.
l l
(m i np i ) 2
y l2 q l
np l
i 1 i 1
(m i np i ) 2
l
2
i 1 np l
(m i np i ) 2
l
2
i 1 np l
0 8 1 17 2 16 3 10 4 6 5 2 6 0 7 1
x 2.
60
2 8 (0 2) 17 (1 2) 16 (2 2) 10 (3 2) 6 (4 2) ...
2 2 2 2 2
s
59
2 (5 2) 2 0 (6 2) 2 1 (7 2) 2
2,1 .
59
Необходимое условие для распределения Пуассона x s2 2
практически выполняется. Запишем теоретический закон Пуассона в виде
2 m 2
P ( m) e .
m!
2 0 2
P(0) e 0,1353 р 0 ,
0!
21 2
P(1) e 0,2707 р1 ,
1!
2 2 2
P(2) e 0,2707 р 2 ,
2!
2 3 2
P(3) e 0,1804 р 3 ,
3!
2 4 2
P(4) e 0,0902 р 4 ,
4!
2 5 2
P(5) e 0,0361 р 5 ,
5!
2 6 2
P(6) e 0,0120 р 6 ,
6!
2 7 2
P (7 ) e 0,0034 р 7 .
7!
Вычислим значение 2 :
(3 3,09) 2
0,2 .
3,09
и k = 4 соответствует Х 24; 0,05 9,5 . Имеем 9,5 > 0,2, следовательно, нет
x 0,6 ; s 2 2,53 ; s 1,6
3 0,6 X 1 0,6
P1 P(3 x 1) P
1,6 1,6
Вычислим статистику 2 :
(13 14,64) 2 (14 19,33) 2 (24 24,67) 2 (24 24,67) 2 (25 21,19) 2
2
14,64 19,33 24,67 24,67 21,19
или
Поэтому
P X / 0,24 0,99 .
Nn
DX 2 / n (7.1)
N 1
30
P X 30 .
X
Теперь необходимо вычислить Х т.е. среднее квадратическое
2 N n
отклонение средней арифметической. Так как 2X , то
n N 1
Тогда
P X 30
30
2,90 0,9962
10,34
N 1 2
s2 ŝ ,
N
где
n 2
X i X
i 1
ŝ
2
n 1
z p .
P X z p X zp
n n
X z p n X z p n 2z p n ,
определяет точность оцениваемого параметра. Если обозначить z p ,то
n
по заданной точности и найденному значению z p всегда можно вычислить
n . Действительно,
2
z 2p 2
n
Откуда
n z 2p 2 / 2 . (7.2)
тогда:
n = (1,30 2 5)/0,52 = 33,8 34 .
t 2n ,p ŝ 2
n , (7.2)
2
PX z p X X z p X z p
2 N n
2X ,
n N 1
и доверительный интервал для математического ожидания можно записать в
виде
2 N n 2 N n
X zp X zp
n N 1 n N 1
В данном случае
2 N n
2
z 2p
n N 1
Откуда
n N 12 z 2p 2 N n 2 z 2p
или
Nz 2p 2
n . (7.3)
N 12 z 2p 2
Nz 2p 2 z 2p z 2p 2
lim lim .
N N 12 z 2p 2 N
N 1 2 z 2p 2 2
N N
Пример 4. Определить необходимый объем случайной выборки без
возврата для определения средней продолжительности работы тонометров в
партии из 5000 штук, чтобы с вероятностью 0,99 предельная ошибка выборки
не превышала 25 ч. Генеральное среднее квадратическое отклонение принять
равным 150 ч.
Решение. По формуле (7.3) при N = 5000 , z 0,99 = 2,58 ; = 150 ; = 25
найдем
Nz 2p 2 z 2p 2
n' и n (7.4)
N 12 z 2p 2 2
Заметим, что1 / n 2 / z 2p 2 . Преобразуем формулу для вычисления n '
1 1 Nn
n' (7.5)
N 1 2 z 2p 2 N 1 1 1 N n 1
N z 2p 2 Nz 2p 2 N n N
Как известно, значение дроби увеличится, если уменьшить ее
знаменатель. Так как n 1 , то n 1 0 , поэтому дробь не уменьшится, если
отбросить в знаменателе выражение (n - 1) , следовательно,
n' (N n)/N n .
2 = 0,25 .
(7.4) находим
1,752 0,25
n 1914 .
0,022
8000 1914
n' 1545
8000 1913
X x ,
H 0 : 1 2 i m ;
альтернативную - в виде
H1 : 1 2 i m .
Гипотеза Н0 проверяется сравнением внутригрупповых и
межгрупповых дисперсий по F-критерию. Если расхождение между ними
незначительно, то нулевая гипотеза принимается. В противном случае
гипотеза о равенстве средних отвергается и делается заключение о том, что
различие в средних обусловлено не только случайностями выборок, но и
действием исследуемого фактора.
Рассмотрим структуру межгрупповой и внутригрупповой дисперсии и
способ их вычисления. Вернемся к табл. 8.1. Найдем средние арифметические
членов каждой совокупности. Для первой совокупности обозначим среднюю
арифметическую через x1* , для i-й - через x i* . Тогда имеем
n1 ni nm
x1 j x ij x mj
j1 j1 j1
x i* ; x ij ; x mj .
n1 ni nm
1 m n
x x ij ,
mn i1 j1
или
1 m
x x i* .
m i1
x ij x 2 .
m n
Найдем сумму квадратов отклонений x ij от x , т. е.
i 1 j1
Представим ее в виде
Q x ij x x ij x i* x i* x
m n m n
2 2
i 1 j1 i 1 j1
x ij x i* x i* x
m n m n
2
(8.1)
i 1 j1 i 1 j1
2 x ij x i* x i* x
m n
i 1 j1
причем
S x ij x i* x i* x
m n
i 1 j1
x ij x i* x i* x
n m
j1 i 1
x ij x i* 0 ,
n
Но так как это есть сумма отклонений переменных
j1
m n m
x i* x 2 n x i* x 2 .
i 1 j1 i 1
i
i 1 j1 1 i 1 j1
Q Q1 Q2
или
Q Q1 Q 2 (8.2)
1 m
s12 x i* x 2 Q1 ,
m 1 i1 m 1
x ij x i* 2 Q 2 ,
m n
1
s 22
mn 1 i1 j1 mn 1
x ij x 2 .
m n
1
s
2
mn 1 i1 j1
Q1 / m 1
F . (8.3)
Q 2 / mn 1
PF F .
ij
Полная (общая) x ij x 2 mn 1 1
ij mn 1
x ij x
2
ij
1 n
x i* x ij .
n j1
Имеем: x1* 164 ; x 2* 170 ; x 3* 202 ; x 4* 164 .
m n
x x ij / mn 3500 / 20 175 .
i1 j1
4
Q1 5 x i* x 5 996; k 1 4 1 3 ;
i 1
Q 2 x ij x i* 7270; k 2 20 4 16 ;
4 5
2
i 1 j1
3) полную сумму квадратов Q с k mn 1 степенями свободы:
Q x ij x 12250; k 20 1 19 .
4 5
2
i 1 j1
A2 x 21 x 22 … … … x 2 v x 2*
… … … …
… … … …
Ai x ij
…
Ar x r1 x r2 … … … x rv x r*
x *j x *1 x *2 … … … x *v x
Пусть имеется r A1 , A 2 , , A i , , A r станков. В матрице наблюдений
им соответствуют r строк, которые назовем уровнями фактора A . Имеем
vB1 , , B j , , B v партий сырья. В матрице им соответствуют v столбцов,
1 v 1 r
x i* x ij , x * j x i j ,
v j1 r i1
1 r v
x x ij .
rv i1 j1
Q x ij x x ij x i* x * j x x i* x x * j x
r v r v
2 2
i 1 j1 i 1 j1
v x i* x r x * j x x ij x i* x * j x
r v r v
2 2 2
(8.4)
i
1
j1
i 1 j1
Q1 Q2 Q3
Q1 Q 2 Q 3
s2
1 r v
x ij x 2 Q , (8.5)
rv 1 i1 j1 rv 1
r
1 Q
v x i* x 1 ,
2
s12 (8.6)
r 1 i1 r 1
r x * j x 2 ,
v
1 Q
2
s 22 (8.7)
v 1 j1 v 1
x
r v
1
r 1v 1
s 32 ij x i* x * j x
i 1 j1
(8.8)
Q3
r 1v 1
Q1 / r 1 s12
FA ,
Q 3 / r 1v 1 s 32
Q 2 / v 1 s2
FB 22 .
Q 3 / r 1v 1 s 3
средними по i 1
строкам
Между v 1
Q 2 r x * j x
v
2 s 22
средними по j1
столбцам
Остаточная r 1v 1
Q 3 x ij x i* x * j x
r v
2 s 32
i 1 j1
Полная rv 1
Q x ij x
r v
2 s2
(общая) i 1 j1
Q1 3 2 4,5 7 4,5 3 2,5 2,52 37,5 ;
2 2 2
Q 2 2 3 4,5 4 4,5 6,5 4,5 13 ;
2 2 2
Q 3 1 2 3 4,5 2 2 4 4,5
2 2
Вычисляем FA и FB :
F A 18,51 , FA 25 ,
F B 19,0 , FB 4,3 .
FA F A ; FB F B .
A2 x 21* x 22* x 2 v*
x 211 , x 212 , x 221 , x 222 , … x 2 v1 , x 2 v 2 , x 2**
..., x 21k ..., x 22 k ..., x 2 vk
x ij*
… … … x ij1 , x ij 2 , … x i**
..., x ijk
Ar x r1* x r 2* x rv*
x r11 , x r12 , x r 21 , x r 22 , … x rv1 , x rv 2 , x r**
..., x r1k ..., x r 2 k ..., x rvk
x * j* x *1* x *2* … x * v* x
1 k
x ij* x ijk - среднее значение в ячейке;
k 1
1 v
x i** x ij* - среднее значение по строке;
v j1
1 r
x * j* x ij* - среднее значение по столбцу; (8.9)
r i1
1 r v
x x ij* - общее среднее.
rv i1 j1
Здесь r - число уровней фактора A; v - число уровней фактора В.
Порядок проведения дисперсионного анализа в этом случае такой же,
как и прежде: сначала вычисляют суммы квадратов, оценки дисперсий, затем
отношение дисперсий F сравнивают с табличным.
Схема анализа и порядок вычисления сумм приведены в таблице 8.10.
Как видно из таблицы 8.10, в схеме анализа появляется новая сумма
квадратов Q 4 и несколько меняется структура суммы Q 3 (вместо x ijk берется
ячейке. В предыдущей схеме (таблица 8.6) эта сумма отсутствовала, так как
при одном наблюдении в ячейке разность ( x ijk x ij* ) равна нулю.
FA s12 / s 24 , FB s 22 / s 24 .
средними по i 1
строкам (по
фактору А)
Между r 1
Q 2 rk x * j* x
v
2 s 22
средними по j1
столбцам (по
фактору В)
Взаимодействи v 1r 1
Q 3 k x ij* x i** x * j* x
r v
2 s 32
е i 1 j1
Остаточная rvk 1
Q 4 x ijk x ij*
r v k
2 s 24
i 1 j1 1
s 22 Q 2 r 1 480 / 3 1 240 ;
с вычисленными, имеем
FA F A ; FB FA B .
Q общ Q A Q B Q C Q D Q AB Q AC Q AD Q BC
Q BD Q CD Q ABC Q ABD Q BCD Q ABCD
x ijk i j ij eijk ,
1 I 1 J 1 I 1 J
i J j I ij J ij 0
I i1
j1 i 1 j1
x 241 2 4 24 e 241 ,
x 242 2 4 24 e 242 ,
x 243 2 4 24 e 243 ,
x 351 3 5 35 e 351 ,
x 352 3 5 35 e 352 .
x ij* i i ij ,
следовательно,
Итак,
x ijk x ij* 2
K
Qe
ij D k 1
x ij* i j
Q ABe ij e ijk
K
2
ijD k 1
x ijk i j
K
2
ijD k 1
по каждому из параметров:
Q ABe Q Q
0; ABe 0; ABe 0 (8.10)
i j
i 1,2,, I; j 1,2,, J .
n i G i i H j x ijk ,
i 1 j1 ijD k 1
J J K
G i G i i k ij j x ijk ,
*
(8.11)
j1 j1 k 1
I I K
H j k ij i H j j x ijk .
**
i 1 i 1 k 1
J J K
G i G i i k ii x ijk ,
j1 j1 k 1
I I K
H j k ij i H j j x ijk ,
i 1 i 1 k 1
I (8.12)
i 0,
i 1
J
j 0.
j1
Откуда
4 41 2 2 1,8 .
Q ABe x ijk
2
x ijk i x ijk
i j k i j k i j k
i x ijk ;
j k
Вычислим Q e :
F
0,106 0,0955 2 3 1 0,71, k 1; k 6.
0,0951 5
1 2
MY | x f x .
MY | X x yx ,
p x , y x 2y x 2y
pY | X x .
1 1
x 1
px, ydy x 2ydy
0 0
Тогда функция регрессии
x 2y 0,5x 2 / 3
1 1
MY | X x урY | X x dy y dy .
0 0
x 1 x 1
2 Y | X x MY | X x MY | X x
2
или
2 Y | X x M Y 2 | X x MY | X x ,
2
2 X | Y y MX | Y y MX | Y y
2
или
2 X | Y x M X 2 | Y y MX | Y y .
2
2
x 2y 0,5x 2 / 3
1
Y | X x y
2 2
dy
0
x 1 x 1
1 / 3x 0,5 1 / 4 x 2 2 / 3x 4 / 9 1 / 12x 2 1 / 6 x 1 / 18
.
x 1 x 12 x 12
11
2 Y | X 1 M 0,076.
144
yx f x .
60
50
40
30
20
10
1 2 3 4 5 6 x
Накладные расходы, млн. руб
выполнен ,2 ,5 ,5 ,5 ,5 ,5 ,5 ,5
ных
работ,
млн. . руб.
10-20 4 5 9
15
20-30 1 3 1 5
25
30-40 2 3 6 5 3 1 20
35
40-50 5 9 19 8 7 2 1 51
45
50-60 1 2 7 16 9 4 2 41
55
60-70 1 5 6 4 2 2 20
65
70-80 1 3 4
75
mx 7 17 10 36 33 21 9 8 150
y a 0 a 1x, (9.1)
n
Q x i Q min ,
2
i 1
n
Q y i yx Q min ,
2
i 1
Q y a 0 a 1 x Q min ,
2
Q
a 2 y a 0 a 1 x 0,
0
Q 2 y a a x x 0.
a 1 0 1
y a 0 a 1 x 0,
yx a 0 x a 1 x 0.
2
Величины a0 и а1, являются постоянными, поэтому их можно вынести за
знак суммы; a0 есть не что иное, как па0. В результате имеем
na 0 a 1 x y,
(9.2)
a 0 x a 1 x yx.
2
a0
y x 2 x yx
,
n x 2 x
2
n yx x y
a1 .
n x x
2 2
a 0 m xy a 1 xm x ym y ,
(9.3)
a 0 xm x a 1 x m x yxm xy .
2
a 0 4,900a 1 47,400,
a 0 5,515a 1 50,578.
y
Относительный уровень поддержек
5,6
5,2
обращения
5
4,6
4,2
3,4
3,2
4 6 8 10 12 14 16 x
Объем сбыта товаров
y x a 0 a 1 / x. (9.4)
Нахождение коэффициентов регрессии а0 и а1 в этом случае аналогично их
нахождению в случае линейной связи, т. е. коэффициенты регрессии находятся из
условия
Q y yx Q min
2
или
Q y a 0 a 1 / x Q min .
2
Q
a 2 y a 0 a 1 / x ,
0
Q 2 y a a / x 1 / x.
a 1 0 1
a 0 a 1 / x y,
(9.5)
a 0 / x a 1 x y / x.
2
na 0 a 1 m x / x ym y ,
a 0 m x / x a 1 m x x ym xy / x ,
2
Таблица 9.3- Суммы для составления нормальных уравнений
Объем сбыта
товара(x),
млн. руб.
4-6 6-8 8-10 10-12 12-14 14-16 16-18 18-20 1
Относитель- my y my y2 my ym xy
5 7 9 11 13 15 17 19 x
ный
уровень издержек
обращения (y), %
1 2 3 4 5 6 7 8 9 10 11 12 13
3,4-3,8 2 3 5 18 64,8 0,9918
3,6
3,8-4,2 1 1 3 2 1 8 32 128 2,1524
4,0
4,2-4,6 1 4 2 2 9 39,6 174,24 3,3523
4,4
4,6-5,0 3 1 3 3 10 48 230,4 5,0074
4,8
5,0-5,4 3 2 5 26 135,2 3,3842
5,2
5,4-5,8 2 2 2 5 28 156,8 4,4621
5,6
5,8-6,2 3 1 4 24 144 4,2666
6,0
6,2-6,6 3 1 4 25,6 163,84 4,7546
6,4
mx 8 9 6 8 6 5 4 4 50 241,2 1197,28 28,371
4
1 1,600 1,2857 0,6667 0,7273 0,4615 0,3333 0,2353 0,2105 5,5203
mx
x
Продолжение таблицы 9.3
1 2 3 4 5 6 7 8 9 10 11 12 13
1 0,320 0,1837 0,0711 0,0661 0,0661 0,0222 0,0138 0,0111 0,7265
mx 0
x2
y 1 x
ym xy 06,05 5,29 5,20 4,50 1,50 4,16 3,80 3,70
mx
50a 0 5,5203a 1 241,2,
5,5203a 0 0,7265a 1 28,3714.
a 0 0,1104a 1 4,824,
a 0 0,1316a 1 5,1395.
Т а б ли ц а 9 .4 - Те о р е ти ч е с к и е зн а ч е н и я
x 5 7 9 11 13 15 17 19
y x 6 ,1 6 5 ,3 1 4 ,8 3 4 ,5 3 4 ,3 2 4 ,1 7 4 ,0 5 3 ,9 6
Рисунок 9.2 дает наглядную картину расположения выборочных точек
(пар значений х, у) эмпирической линии регрессии и теоретической линии
регрессии, вычисленной но способу наименьших квадратов.
Рассмотрим общий случай нелинейной зависимости между
переменными X и У. Это многочлен к-й степени от х:
y x a 0 a 1 x a 2 a k x k . (9.6)
Q Q Q
, ,, . (9.7)
a 0 a 1 a k
Q
a 2 y a 0 a 1 x a 2 x a k x 0,
2 k
0
Q
2 y a 0 a 1 x a 2 x 2 a k x k x 0,
a 1
Q
a 2 y a 0 a 1 x a 2 x a k x x 0.
2 k
k
k
a 0 n a 1 x a 2 x 2 y,
a 0 x a 1 x a 2 x xy,
2 3
a 0 x a 1 x a 2 x yx .
2 3 4 2
0 x
yx Y px, y
yx Y px Y yx py | x 0,
x y
MyX Y 2 2Y|x
2
TY| x . (9.9)
2Y 2Y
2Y / 2Y 2Y|x 2Y|x / 2Y ,
или
1 2Y / x / 2Y TY
2
|x .
Из последней формулы можно легко получить другое выражение для
TY
2
|x .
TY
2
| x 1 Y| x / Y .
2 2
(9.10)
и единицей.
Все сделанные выводы справедливы и для TY
2
|x . Из равенства (9.10)
0 x
0 x
y 0 2 T 1
0 x
TY
2
| x TY| x Y|x / Y .
2
(9.11)
следующем виде:
y2m y ym y
2
2Y ,
my m
y
2Y|x
1
yx y2 m x .
m
y ym y / m y 241,2 / 50 4,824.
y x
yx y mx yx y2 m x
6,16 +1,336 8 14,2792
5,31 +0,486 9 2,1258
4,83 +0,006 6 0
4,53 -0,294 8 0,6915
4,32 -0,504 6 1,5241
4,17 -0,654 5 2,1386
4,05 -0,774 4 2,3963
3,96 -0,864 4 2,9860
26,1415
откуда TY
2
| x =0,8803. Значение TY| x позволяет сделать вывод о достаточно
2
S 2y
1
y y i x 2 1 y i x y2 , (9.12)
n k
или
2 1 2y x / 2y . (9.14)
27,6387
27б6387
2yx 0,5528,
50
0,5528
2 0,8194, откуда 2 0,905.
0,6746
2
T . (9.15)
2Y n 2Y
y
y na 0 a 1 x a a 1 x. (9.16)
0
n n
a 0 a 1 x a 0 a 1 x a 12 x x 2
T
2
n 2y n 2y
a 12 x x
2
a 12 2x
.
n 2y 2y
xy
2
a 12 2x / 2y xy 2x 2y .
n
Извлекая квадратный корень, получим
xy
xy x y r. (9.17)
n
r
x x y y (9.18)
n x y
В самом деле,
1
x x y y 1 xy xy yx xy
n n
xy x y y x nxy xy xy.
n n n n n
n xy x y
r , (9.19)
n x x n y y
2 2 2 2
r a 1 x / y . (9.20)
2
1 x x y y
n x
0.
y
1 x x 2 2 1 x x y y 1 y y 2 0.
2 y
n 2x n x y n
1 2r 1 0,
откуда
1 r 1,
r a 1 x b1 ; a 2 x b 2 r x , y .
r
xy x y 1 / n . (9.21)
x x / 2 y y / 2
2 2 2 2
x 2mx xm x
2
x ,
mx mx
y 2 m y ym y
2
y .
m y m y
x 2mx 27,02
y2my 2426,33
mx my
x 2mx y2m y
2 2
24,01 2246,76
mx my
x 1,73, y 13,4;
1 r2
r Sr .
n
1 r2 1 r2
r tq < p < r tq . (9.23)
n n
Пример 9. Найти доверительные интервалы для коэффициента
корреляции, вычисленного в примере 8.
Решение. При r =0,67 и n=150 имеем
r S r 1 0,67 2 / 150 0,045.
r thz,
откуда
1 1 r
r ln .
2 1 r
Распределение величины z не зависит от значений р и n; с ростом числа
наблюдений распределение быстро приближается к нормальному.
При корреляционном анализе необходимо оценить достоверность связи
между переменными, т. е. выяснить, не объясняемся ли величина
коэффициента корреляции, полученная по выборочным данным,
случайностями выборки. Для этого оценивается значимость (или сущест-
венность) коэффициента корреляции. Проверяется гипотеза H0 о том, что р=0,
альтернативной является гипотеза H1: p 0 .
При большом объеме выборки величина r / r подчиняется
нормальному закону распределения с параметрами (0, 1), поэтому проверка
значимости (или существенности) коэффициента корреляции сводится к
следующему: вычисляется значение t r / r , которое затем сравнивается с
найденным по таблице 4 приложений для заданной вероятности p значением
tq .
r 0,67
t 14,9.
r 0,045
Вероятности Р=0,95 соответствует значение t q = 1,96. Таким образом,
y 1 r2
a , (9.25)
x n
среднеквадратического отклонения:
n y 2 y ,
1 2
y
n
n x 2 x ,
1 2
x
n
Пример 11. Определить доверительные интервалы для коэффициентов
регрессии, вычисленных в примере 3.
Решение. Необходимые для вычисления y и x суммы находим в
1
y 150 363950,0 7110,0 13,4,
2
150
1
x 150 4053,5 735 1,73.
2
150
13,4
a 0,045 0,348.
1,73
y x a 0 a 1 x 1 a 2 x 2 a n x n , (9.26)
Q y a 0 a 1 x 1 a 2 x 2 a n x n Q min .
2
a
0 x n a 1 x 1 x n a 2 x 2 x n a n x n x n y,
2
yy x x1 x xn
t0 , t1 1 , …, t n n , (9.27)
0 1 n
где y , х1 х2, ..., хn — средние значения переменных у, х1 х2, ..., хn (по выборке
в N единиц); 0 , 1 ,..., n — средние квадратические отклонения величин у, х1
х2, ..., хn. В этом случае упрощается вид линейных соотношений между
переменными, что весьма важно при изучении зависимости многих
переменных. В стандартизованном масштабе среднее значение признака равно
нулю, а среднее квадратическое отклонение равно единице. Действительно,
1 N x1 x1 1 1 N 1 N
t1 1
1 N 1
x 1 x 1 0;
N 1 N 1
1 N x 1 x 1 1 N 2
2
1
2t1 N 1 x x .
N 1 1
1 1
12 12 1
1 N
r12 t 1 t 2 . (9.28)
N 1
Действительно,
1 N t 1 t 1 t 2 t 2
r12
N 1
t1 t 2
1 N t 1 0 t 2 0 1 N
N 1 1 1
t1t 2 .
N 1
t y 1 t 1 2 t 2 n t n ,
t y t y min .
Используя это условие, приходим к следующей системе нормальных
уравнений:
r10 1 2 r12 n rn ,
r r r r ,
20 1 21 2 12 n 2n
ri 0 1 r11 2 r12 j rij n rin ,
rn 0 1 rn1 2 rn 2 n rnn ,
a i i y / i i 1,2, , n ,
a 0 y a1x1 a 2 x 2 a n x n , (9.30)
где i — оценки коэффициентов регрессии в стандартизованном масштабе,
полученные в результате решения системы (9.29).
Пример 12. По данным, приведенным в таблице 9.9, вычислить ко-
коэффициенты регрессии. Связь между переменными предполагается
линейной
y a 0 y a1x1 a 2 x 2 .
1 0,57 2 0,82.
0,571 2 0,69.
Вычислим определители , 1 , 2 :
1 0,57
1 0,325 0,675,
0,57 1
0,82 0,57
1 0.82 0,39 0,43,
0,69 1
1 0,82
2 0,69 0,47 0,22.
0,57 0,69
a 1 1 y / 1 ; a 2 2 y / 2 .
9,02
a 1 0,63 0,065,
86,9
9,02
.a 2 0,33 0,480,
6,2
a 0 y a 1 x 1 a 21 x 2 .
a 0 73,05 0,65 418,60 0,48 25,55 112,52.
симметричном изгибе
п
1 2 3 4 5 6 7 8 9 10
1 85,5 255 1,38 17,3 -1,88 -1,33 -2,59 -1,81 2,5
2 81,7 341 0,96 19.8 -0,89 -0,93 -0,85 -0,89 0,83
3 81,7 373 -0,15 30.1 -0,52 0,73 0,08 -0,11 -0,38
4 62,7 447 -1,15 31,9 0,33 1,02 -0,38 -1,17 0,34
5 66,4 446 -0,74 38,3 0,32 2,06 -0,24 -1,52 0,66
6 70,6 410 -0,27 26,5 -0,1 0,15 0,03 -0,04 -0,02
7 65 495 -0,89 36,2 0,88 1,72 -0,78 -1,54 1,51
8 72,8 451 -0,03 21 0,37 -0,73 -0,01 0,02 -0,27
9 67,6 565 -0,6 29,5 1,68 0,64 -1,01 -0,39 1,07
10 90,2 354 1,9 24,9 -0,74 -1,06 -1,41 -2,02 0,78
11 60,2 549 -1,42 25 1,5 -0,09 -2.13 0,13 -0,14
12 74,8 328 0,19 28 -1,04 0,4 -0,2 0,08 -0,41
13 63.4 555 -1,07 33,9 1,57 1,35 -1,68 1,44 2,11
Продолжение таблицы 9.9
1 2 3 4 5 6 7 8 9 10
14 74,2 415 0,13 16,1 -0,04 -1,52 0 -0,19 0,06
15 71,6 415 -0,16 21 -0,04 -0,73 0,01 0,12 0,03
16 60,9 527 -1,35 28,7 1,25 0,51 -1,69 -0,69 0,64
17 81,1 379 0,89 20,3 -0,46 -0,85 -0,41 -0,76 0,39
18 71,5 439 -0,17 19,9 0,23 -0,91 -0,04 0,16 -0,21
19 77,2 350 0,46 22,6 -0,79 -0,48 -0,36 0,22 0,38
20 91,2 278 2,09 20,1 -1,62 -0,88 -3,38 -1,84 1,42
Если x1 и x2 зависяn от x3, то имеем ( r12 - r13 r23 =0), так как r13 и r23
отличны от нуля. Оценивать зависимость с помощью такой разности
неудобно. Поэтому ее нормируют так, чтобы получившийся коэффициент
находился в пределах от - 1 до + 1. В это случае получаем выражение (9.31),
которое в общем виде можно записать так:
rij rik r jk
rij,k , (9.32)
(1 r 2
ik ) (1 r 2
jk )
1 1
yx
2
1x 2
n
( y x1x 2 y) 2 , 2y ( y y) 2
n
2
ryx ryx
2
2ryx ryx rx x
R 2 i 2 1 2 1 2
1 rx21x 2
[a 1 ( x 1 x 1 ) a 2 ( x 2 x 2 ] 2 (9.35)
n 2y
[ a 1 2 ( x 1 x 1 ) 2 a 2 2 ( x 2 x 2 ) 2 2a 1 a 2 ( x 1 x 1 )( x 2 x 2 )]
n 2y
a 12 2x1 a 22 2x 2 2a 1 x1a 2 x 2 rx1x 2
,
2y