Вы находитесь на странице: 1из 87

Министерство образования и науки Украины

Одесский национальный университет имени И.И. Мечникова

Институт математики, экономики и механики

Кафедра методов математической физики

Ю.С. Процеров

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

Учебно-методическое пособие

Одесса – 2016
Печатается по решению Научно-методического совета ОНУ имени И.И. Мечникова
(протокол № 1 от 20 октября 2016 года).

Составитель: Ю.С. Процеров, канд. физ. – мат. наук, доцент кафедры методов
математической физики

Рецензенты: Н.Д. Вайсфельд, докт. физ-мат. наук, профессор, заведующая


кафедрой Методов математической физики

В.Г. Попов, докт. физ-мат. наук, профессор, заведующий


кафедрой Высшей математики Национального университета «Одесская
морская академия»

А.В. Усов, докт. техн. наук, профессор, заведующий


кафедрой Высшей математики и моделирования систем
Одесского национального политехнического университета,
лауреат Государственной премии Украины

Данное учебно-методическое пособие ставит своей целью оказать помощь студентам


III-го курса направления 6.040301 «Прикладная математика» в изучении курса
«Математическая статистика». В нем подробно и систематично изложены основные темы
программы курса:
статистическое распределение выборки, эмпирическая функция распределения и
эмпирические моменты, точечные оценки параметров распределений и методы их
нахождения, интервальные оценки параметров распределений, статистическая проверка
гипотез о значении параметров распределений и о виде закона распределения, теория
корреляции.
Изложение материала сопровождается многочисленными примерами. Также приведено
большое число заданий, предназначенных для самостоятельной работы студентов. Все
задания сопровождены ответами.

2
Оглавление
§ 1. Основные задачи математической статистики ……………………………………… .4
§ 2. Статистическое распределение выборки. Полигон и гистограмма частот ………………….5
§ 3. Эмпирическая функция распределения ………………………………………………………..7
§ 4. Эмпирические моменты ………………………………………………………………………. .8
§ 5. Точечные оценки параметров распределений ………………………………………………..10
§ 6. Основные виды распределений случайных величин и их числовые
характеристики………………………………………………………………………………….12
§ 7. Метод моментов нахождения точечных оценок параметров распределений ………………14
§ 8. Метод максимального правдоподобия нахождения точечных оценок параметров
распределений ………………………………………………………………… ……………….17
§ 9. Теорема о свойствах логарифмической функции правдоподобия. Неравенство
Рао-Крамера …………………………………………………………………………….22
§ 10. Интервальные оценки параметров распределений …………………………………28
§ 10.1. Построение доверительных интервалов для параметров нормального
распределения ……………………………………………………………………….29
§ 10.2. Построение доверительного интервала для параметра  распределения
Пуассона ……………………………………………………………………………..33
§ 10.3. Построение доверительного интервала для вероятности p биномиального
распределения …………………………………………........................................….34
§ 11. Статистическая проверка гипотез о значениях параметров распределений ………………37
§ 11.1. Проверка гипотез о значении параметров нормального распределения ………...40
§ 11.2. Проверка гипотез о значении вероятности p биномиального распределения …52
§ 12. Статистическая проверка гипотез о виде закона распределения …………………..59
§ 12.1. Критерий Колмогорова ………………………………………………………….......59
§ 12.2. Критерий Пирсона или  2 ………………………………………………………….61
§ 13. Элементы теории корреляции …………………………………………………….…..73
x2
1 2
Таблица 1 значений функции   x   e . ………………………..………………….79
2
x t2
1 
Таблица 2 значений функции   x    2 dt. …………………………….………..80
e
2 0
Таблица 3 значений t  t  , n  ………………………………………………….………..81
Таблица 4 значений q  q  , n  ……………………………………………………….……81
Таблица 5 критических точек распределения Стьюдента ………………………….…….82
Таблица 6 критических точек распределения  2 ………………………………………..83
Таблица 7 значений функции распределения Колмогорова

K  x   1  2  1 e 2 m x ……………………………………………………..84
m 2 2

m 1

Ответы ……………………………………………………………………………………85
Литература ……………………………………………………………………………....87

3
§ 1. Основные задачи математической статистики.

Теория вероятностей занимается изучением математических моделей случайных


явлений. Имея подходящую математическую модель какого-либо случайного явления, мы
можем вычислять вероятности тех или иных событий; по вероятностям одних случайных
событий находить вероятности других, с ними связанных; по числовым характеристикам
и функциям распределения одних случайных величин находить функции распределения и
числовые характеристики других. Но естественно возникает вопрос: как найти эти
исходные вероятности, функции распределения и числовые характеристики? Это как раз и
является предметом исследования другой науки о массовых случайных явлениях, которая
получила название математической статистики. Установление закономерностей, которым
подчинены массовые случайные явления, основано на изучении методами теории
вероятности статистических данных – результатов наблюдений или экспериментов.
Как наука с оформившейся тематикой и методами исследования математическая
статистика возникла в конце XIX, начале XX веков, хотя отдельные задачи, как, например,
сбор и обработка статистических сведений о народонаселении, рассматривались еще в
древнем Китае, Египте, Римской империи.
Задачи математической статистики являются в определенной мере обратными к
задачам теории вероятности. Если в теории вероятностей мы считаем заданной модель
явления и, исходя из нее, производим расчет возможного реального течения этого
явления, то в математической статистике мы исходим из известных реализаций каких-
либо случайных событий, то есть из статистических данных, и уже по ним подбираем
подходящую теоретико-вероятностную модель.
Исходным материалом для статистического исследования реального явления служит
набор результатов наблюдений над ним или же результатов специально поставленных
испытаний. При этом возникают следующие основные задачи.
Первая задача математической статистики состоит в определении числа необходимых
данных и разработке способа их сбора.
Пусть, например, требуется изучить совокупность однородных объектов относительно
некоторого качественного или количественного признака. Так, в партии некоторых
изделий качественным признаком может служить их стандартность, а количественным –
контролируемый размер изделия. Изучаемую совокупность объектов принято называть
генеральной совокупностью. Из нее некоторым способом отбирают для исследования n
объектов. Эти отобранные объекты принято называть выборочной совокупностью или
выборкой объема n . Выборка может быть повторной, когда отобранный объект после
изучения возвращается в генеральную совокупность, бесповторной – когда отобранный
объект в генеральную совокупность не возвращается. При этом способы самого отбора
могут быть различными. От сплошной выборки, когда исследуются все объекты, до
разбиения генеральной совокупности на части и отбора одного или нескольких объектов
из каждой части. Для того, чтобы по данной выборке можно было достаточно уверенно
судить о всей генеральной совокупности, необходимо, чтобы выборка была
репрезентативной, то есть представительной. В силу закона больших чисел можно
утверждать, что выборка будет репрезентативной, если ее осуществлять случайно и ее
объем n не должен быть мал.
Вторая задача математической статистики – разработка методов анализа
статистических данных в зависимости от целей исследования. Сюда относятся:
4
- оценивание вероятностей некоторых событий исходя из статистических данных;
- определение, хотя бы и приближенно, закона распределения исследуемой случайной
величины;
- нахождение неизвестных параметров закона распределения случайной величины, тип
которого известен из других соображений;
Например, во многих случаях можно считать, что некоторая случайная величина
распределена по нормальному закону, но его параметры a и  неизвестны.
- статистическая проверка гипотез о законе распределения случайной величины или его
параметрах;
Например, на основании некоторых соображений мы выдвигаем гипотезу о конкретном
законе распределения или о значении его параметра, если этот закон известен, и на
основании имеющихся статистических данных мы должны подтвердить или опровергнуть
выдвинутую гипотезу.
- нахождение корреляционной зависимости между двумя или большим числом случайных
величин.
§ 2. Статистическое распределение выборки. Полигон и гистограмма частот.
Пусть имеется случайная величина  , заданная на вероятностном пространстве
, F , P . Пусть в результате n наблюдений (экспериментов) получено n ее значений
1 , 2 ,..., n - выборка объема n из генеральной совокупности всех возможных значений
случайной величины  . Значения  i в выборке могут повторятся. Обозначим через
x1 , x2 ,..., xk их различные значения (их принято называть вариантами), расположенные в
порядке возрастания, а через n1 , n2 ,..., nk частоты этих значений, то есть варианта x1
встретилась n1 раз, варианта x2 - n2 раза и так далее. При этом n1  n2  ...  nk  n . Если
теперь каждой варианте xi поставить в соответствие ее частоту ni , то получим так
называемое статистическое распределение выборки
xi x1 x2 … xk
ni n1 n2 … nk
где n1  n2  ...  nk  n.
ni
Наряду с частотами ni рассматривают еще относительные частоты i  . В этом случае
n
статистическое распределение выборки записывают в виде
xi x1 x2 … xk
i 1 2 … k
где 1  2  ...  k  1.
Статистическое распределение выборки также задают в виде последовательности
интервалов и соответствующих им частот, то есть сумму частот вариант, попавших в этот
интервал
 xi 1; xi   x0 ; x1   x1; x2  …  xk 1; xk 
ni n1 n2 … nk
где n1  n2  ...  nk  n.

5
Здесь также вместо частот ni могут стоять относительные частоты i .
Для наглядного изображения данных выборки используют графическую иллюстрацию
в виде полигонов и гистограмм частот. По статистическому распределению выборки
можно построить полигон частот или полигон относительных частот, то есть ломаную с
вершинами в точках  xi ; ni  или в точках  xi ; i  соответственно. На рис. 1 изображен
полигон частот следующего распределения выборки объема n  50

xi 2 3 5 6
ni 10 15 5 20

В случае, когда статистическое распределение выборки задается в виде интервалов


одинаковой длины h , то строят гистограмму частот или гистограмму относительных
частот. Гистограмма частот это ступенчатая фигура, состоящая из прямоугольников с
n
основаниями длиной h и высотой i . Площадь i -го прямоугольника будет равна частоте
h
n
h  i  ni , а площадь всей гистограммы равна n1  n2  ...  nk  n , то есть объему выборки.
h
При построении гистограмм относительных частот высоты прямоугольников берут
i
равными , тогда площадь одного прямоугольника равна относительной частоте i , а
h
площадь всей гистограммы равна единице.
Например, построим гистограмму относительных частот для следующего распределения
выборки объема n  50

 xi 1; xi   0; 2   2; 4   4;6   6;8


ni 5 15 10 20

Найдем сначала относительные частоты 1  0,1; 2  0,3; 3  0, 2; 4  0, 4 , а затем


i
высоты прямоугольников : 0, 05; 0,15; 0,1; 0, 2 . На рис. 2
h
изображена требуемая гистограмма относительных частот

6
§ 3. Эмпирическая функция распределения.

В курсе теории вероятности при изучении свойств случайных величин основную роль
играют их функции распределения F  x   P  :     x , которые в статистике принято
называть теоретическими функциями распределения.
Пусть дана выборка объема n

xi x1 x2 … xk
ni n1 n2 … nk
где n1  n2  ...  nk  n.
Эмпирической функцией распределения или функцией распределения выборки
n
называют функцию Fn  x   x , где nx число вариант, меньших x .
n
Она обладает теми же свойствами, что и теоретическая функция распределения, а именно:
ее значения лежат от 0 до 1; она не убывает; непрерывна слева; Fn  x   0 при x  x1 и
Fn  x   1 при x  xk .
Отличие в том, что F  x  это вероятность тех событий, для которых     x , а Fn  x 
есть сумма относительных частот тех вариант xi , которые меньше x
0, x  x1
n
 1 , x1  x  x2
n
 n n
Fn  x    1  2 , x2  x  x3
n n


1, x  xk

ni
Ее графиком будет ступенчатая кусочно-постоянная кривая со скачками в точках xi .
n
Имеет место следующая
Теорема Гливенко. При увеличении объема выборки n эмпирическая функция
распределения Fn  x  сходится по вероятности к теоретической функции
распределения F  x 


lim P sup Fn  x   F  x     1.
n  x 

Пример. По выборке объема n  50 xi 1 4 6
ni 10 15 25

найти эмпирическую функцию распределения и построить ее график.

7
0, x  1
0, 2, 1  x  4

Эмпирическая функция распределения имеет вид Fn  x    ,
 0,5, 4  x  6
1, x  6
а ее график приведен на рис. 3.

Если выборка задана в виде интервалов, то при нахождении эмпирической функции


x x
распределения в качестве xi берут середины интервалов xi  i 1 i .
2

§ 4. Эмпирические моменты.
В курсе теории вероятности для случайной величины  были введены следующие
моменты

 m  M  m
  x m
dF  x  - начальный момент m - го порядка, в частности 1  M  -


математическое ожидание случайной величины, и



m  M   M      x  M  dF  x  - центральный момент m - го порядка, в
m m



частности 2  M   M    D - дисперсия случайной величины.


2

Введем эмпирические или выборочные моменты



 m  x
m
dFn  x  - начальный момент m - го порядка и


  x   dFn  x  - центральный момент m - го порядка.


 m
 

m 1


Так как эмпирическая функция распределения Fn  x  кусочно-постоянная и терпит


ni
скачки в точках xi , то по свойству интеграла Стилтьеса
n
k
n 1 k 1 n
 m   xim i   xim ni   im .
i 1 n n i 1 n i 1

8
1 k 1 n
Начальный эмпирический момент первого порядка  1  
n i 1
xi ni   i  xв
n i 1
называют выборочным средним. Выборочное среднее xв есть среднее арифметическое
значений выборки.
Аналогично вычисляется

     
k m n 1 k 1 n
m   xi  1   xi  xв ni   i  xв
m m
i
.
i 1 n n i 1 n i 1
Центральный эмпирический момент второго порядка
1 k
 1 n

2   xi  xв ni   i  xв  Dв  
2 2

n i 1 n i 1
называют выборочной дисперсией. Выборочная дисперсия Dв есть среднеквадратичное
отклонение значений выборки от их среднего значения x в .
Для вычисления выборочной дисперсии удобно пользоваться следующей формулой
1 k
 1 k
  1 k

1 k k
2 1
Dв   xi  xв ni   xi2  2 xi xв  xв ni   xi2 ni  2 x в  xi ni  x в  ni 
2 2

n i 1 n i 1 n i 1 n i 1 n i 1
1 k 2 1 k 2
 
2 2 2
 x n
i i  2 x в  x в  xi ni  x в ,
n i 1 n i 1
то есть выборочная дисперсия равна среднему из квадратов минус квадрат среднего.
Если выборка задана в виде интервалов, то при вычислении выборочного среднего и
x x
выборочной дисперсии в качестве xi берут середины интервалов xi  i 1 i .
2
Пример 1. По выборке объема n  20 x -2 1 3 6 i

ni 3 8 5 4

найти выборочное среднее и выборочную дисперсию.


1 41
Вычислим xв   2  3  1 8  3  5  6  4    2, 05
20 20
1 209
Dв   4  3  1 8  9  5  36  4   2, 052   2, 052  10, 45  4, 2025  6, 2475.
20 20
Во многих задачах варианты xi являются довольно большими числами, и работать с
ними по полученным формулам не очень удобно. В этом случае используется метод
условных вариант. Он заключается в том, что от вариант xi при помощи линейной
замены переходят к условным вариантам ui , которые уже малы. Например, если варианты
xi  C
xi равноотстоящие с шагом h : xi 1  xi  h , то положим ui  , где C некоторое
h
значение из середины выборки (его обычно берут с наибольшей частотой),
Тогда xв  hui  C и
1 k 1 k 1 k 1 k
xв   i i n
n i 1
x n 
i 1
 i  i
hu  C n  h  ii
n i 1
u n  C   ni  h  u в  C
n i 1
1 k
  1 k
   
k
2 1
 xi  xв  i  ui  u в
2 2 2
Dx  ni  hu  C  hu в  C ni  h  ni  h 2 Du .
n i 1 n i 1 n i 1
9
Пример 2. По выборке объема n  80

 xi 1; xi   10;0  0;10  10; 20   20;30   30; 40 


ni 10 15 25 20 10

методом условных вариант найти выборочное среднее и выборочную дисперсию.


x x
Отнесем частоты ni к серединам интервалов xi  i 1 i
2
 -5 5 15 25 35
xi
ni 10 15 25 20 10
xi  15
и перейдем к условным вариантам ui  . Тогда
10
ui -2 -1 0 1 2
ni 10 15 25 20 10

1 5
Вычислим u в   2 10  115  0  25  1 20  2 10    0, 0625 и
80 80
1 115
Du   4 10  115  0  25  1 20  4 10   0, 06252   0, 06252  1, 4375  0, 0039  1, 4336
80 80
Тогда xв  10  u в  15  0,625  15  15,625 и Dв  10  Du  143,36 .
2

§ 5. Точечные оценки параметров распределений.


Пусть для случайной величины  , заданной на вероятностном пространстве , F , P ,
из каких-либо соображений известен закон ее распределения, но не известны параметры
этого закона. Поставим задачу как по выборке найти приближенные значения этих
параметров.
Пусть   1 , 2 ,..., n  выборка объема n из генеральной совокупности, а 
неизвестный параметр известного закона распределения F  x  . Нашей задачей является
построение приближенной формулы
     h    h 1 , 2 ,..., n  , (1)
где h   функция от выборки, называемая статистикой, а приближенное значение
параметра    h   называют точечной оценкой параметра  . При этом предполагается,
что функция h   не должна зависеть от оцениваемого параметра  и от других
параметров функции распределения F  x  . Кроме того функция h   должна быть
одной и той же для всех распределений некоторого семейства F  x  . Если изменяется
объем выборки, то будем обозначать   n  hn   , а последовательность hn   будем
называть последовательностью порядковых статистик.

10
Следует отметить, что для каждой выборки   1 , 2 ,..., n  значение    h   будет
свое, а потому   , как функция выборки, будет случайной величиной.
Здесь сразу возникает вопрос: как оценить точность приближенной формулы (1)? Будем
оценивать величину погрешности при замене  на   среднеквадратичной погрешностью
2
M     , то есть дисперсией оценки D  - величиной рассеяния   относительно
точного значения  . Среди оценок с одной и той же дисперсией D  минимальную
величину рассевания относительно  имеют оценки, для которых M    .

Определение. Точечная оценка   называется несмещенной оценкой параметра  , если


M    .
Требование несмещенности оценки есть условие отсутствия «систематической
ошибки». Его смысл состоит в том, что при многократном использовании формулы (1)
для различных выборок среднее значение ошибки при замене  на   равно нулю.
Определение. Точечная оценка  n параметра  называется асимптотически
несмещенной, если lim M n   .
n

Покажем, что выборочное среднее x в является несмещенной точечной оценкой для


математического ожидания M  . Рассмотрим
1 n  1 n 1 n 1
M x в  M   i    M i   M    n  M   M  ,
 n i 1  n i 1 n i 1 n
так как  i есть значение случайной величины  , полученное в i -том наблюдении, а
значит все они одинаково распределены и M i  M  .
Покажем теперь, что выборочная дисперсия Dв не является несмещенной оценкой для
дисперсии D :
1 n  1 n

MDв  M   i  xв  
   M i  x в  1
   
2 2 2 2
  n  M i  x в  M i  x в
 n i 1  n i 1 n

 
Так как M i  xв  M i  M xв  M   M   0 , то

      M   x    
2 2 2
D i  x в  M i  x в i в  M i  x в и

 
 1 n 
    1
 n 
1 n 
MDв  D i  x в  D  i    j   D 1   i    j 
n j 1 
 n j 1  
 j i 
поскольку в последней сумме стоят независимые слагаемые, то
2 2
 1 1 n
 1 n 1 n 2  2n  1  n  1 n 1
 1   Di  2
 n n

j 1
D j   1
 n
  D 
n 2
D 
n 2
D 
n
D ,
j i

учитывая, что все  i одинаково распределены и Di  D .

11
n 1
Таким образом, MDв  D  D и выборочная дисперсия есть смещенная оценка для
n
дисперсии D . Однако эта оценка является асимптотически несмещенной, так как
n 1
lim MDв  lim D  D .
n n n

Несложно видоизменить выборочную дисперсию так, чтобы измененная оценка стала


уже несмещенной. Для этого введем исправленную выборочную дисперсию
n
s2  Dв
n 1
n n n 1
Тогда Ms 2  MDв   D  D и эта оценка является уже несмещенной.
n 1 n 1 n
Обычно при вычислениях, если объем n выборки невелик  n  50  , то в качестве
оценки для дисперсии берут исправленную выборочную дисперсию s 2 , а при больших
объемах выборки берут выборочную дисперсию Dв .

Определение. Оценка  n параметра  называется состоятельной, если она сходится по


вероятности к параметру  при n   :
 
lim P n      1.
n

Определение. Оценка  n параметра  называется эффективной, если ее дисперсия с


ростом n уменьшается:
Dn1  Dn .

Покажем, что выборочное среднее x в является состоятельной и эффективной оценкой


для математического ожидания M  . Найдем
1 n  1 n 1 D
Dx в  D   i   2  Di  2  n  D  .
 n i 1  n i 1 n n
Состоятельность оценки следует из II-го неравенства Чебышева

  
P xв  M     P xв  M xв    1  Dxв
 2
 1
D
n 2
1 n  .

Эффективность оценки вытекает из неравенства


 n 1 D D  n
Dxв    Dxв .
n 1 n

§ 6. Основные виды распределений случайных величин и их числовые


характеристики

В дальнейшем мы неоднократно будем пользоваться различными законами


распределения случайных величин и их числовыми характеристиками, изученными ранее
в курсе «Теории вероятности». Поэтому приведем здесь их основные характеристики.

12
Дискретные распределения.
1) Распределение Пуассона.

k
P   k  e  ,   0, k  0,1, 2,... ; M    , D  .
k!
2) Биномиальное распределение.
P   k  Cnk p k q nk , k  0,1, 2,..., n ; M   np, D  npq.

3) Геометрическое распределение.
1 q
P   k  q k 1 p, k  1, 2,... ; M  , D  2 .
p p
Абсолютно-непрерывные распределения.
1) Нормальное распределение или распределение Гаусса.
 x  a 2 t2
 xa
x
1  1 1 
p  x   2
, F  x       , где   x    2 dt
2
e e
 2 2    2 0

M   a, D   2 .

2) Равномерное на промежутке  a; b  распределение.

0, x  a
 1 xa
 , x   a; b  
p  x    b  a , F  x    ,a xb
0, x   a; b   b  a

1, x  b

b  a  .
2
ab
M  , D 
2 12
3) Показательное распределение.

 e  x , x  0 1  e  x , x  0
p  x    , F  x    , 0
0, x  0 0, x  0
1 1
M  , D  .
 2
4) Гамма распределение
    1   x
 x e ,x0 
p  x       ,      x 1e  x dx,   0,   0
0, x  0 0

 
M  , D  2 .
 

13
5) Распределение Пирсона или  2 с n степенями свободы.

Пусть 1 , 2 ,..., n нормированные нормально распределенные случайные величины


 a  0,  1 . Тогда случайная величина
n
 2   i2
i 1

имеет распределение Пирсона или  2 с n степенями свободы. Его плотность


 1
 n n n 1  x
  
p 2  x   kn  x    2 2    x 2 e 2 , x  0, M  2  n, D  2  2n.
 2

0, x  0
С этим распределением тесно связаны следующие распределения

 
n
 
i 1
i
2
с плотностью p  x   2 xkn x 2 ,

1 2 1 n 2
   i с плотностью p  x   nkn  nx  ,
n n i 1

1
n

1 n 2

n i 1
i с плотностью p  x   2nxkn nx 2 .  
6) Распределение Стьюдента с n степенями свободы.
Пусть  и 1 , 2 ,..., n нормированные нормально распределенные случайные величины
 a  0,  1 . Тогда случайная величина

t
1 n 2
 i
n i 1
имеет распределение Стьюдента с n степенями свободы. Его плотность

 n 1  n 1
   x 2  2
    1
1 2 n
pt  x     , Mt  0  n  1 , Dt   n  2 .
n  n   n  n2
 
2
С ростом n распределения Пирсона и Стьюдента стремятся к нормальному
распределению.

§ 7. Метод моментов нахождения точечных оценок параметров распределений.


Предположим, что известная функция распределения случайной величины  зависит
от m неизвестных параметров 1 ,2 ,...,m : F  x,1 ,2 ,...,m  . Запишем для нее выражения
для теоретических моментов

14
 
k   x k dF  x,1 ,..., m  и k    x  M  dF  x,1 ,..., m  ,
k

 

которые будут содержать эти неизвестные параметры. С другой стороны по выборке


  1 , 2 ,..., n  подсчитаем эмпирические моменты
1 n k

1 n
  
k
 k   i и  k

 i  x в ,
n i 1 n i 1
которые будут числовыми значениями. Приравнивая соответствующие теоретические и
эмпирические моменты, получим систему уравнений для определения параметров
1 ,2 ,...,m . Ее решение 1 ,2 ,...,m и берем в качестве точечных оценок искомых
параметров распределения.
В частности, если функция распределения содержит один параметр, то берут M   xв , а
если два параметра, то берут M   xв и D  s 2 или D  Dв , если n велико.

Пример 1. Случайная величина  - продолжительность безотказной работы прибора


 e   x , x  0
имеет показательное распределение с плотностью p  x    . Найти
0, x  0
методом моментов точечную оценку параметра  по выборке объема n  200

 xi 1; xi   0;5  5;10  10;15 15; 20   20; 25  25;30 


ni 133 45 15 4 2 1

1 1 
Для показательного распределения M   . Согласно методу моментов M    xв ,
 
1
откуда      . Для вычисления x в рассмотрим середины интервалов

x1  2,5; x2  7,5; x3  12,5; x4  17,5; x5  22,5; x6  27,5;
xi  2,5
и перейдем к условным вариантам ui  . Для них выборка примет вид
5
ui 0 1 2 3 4 5
ni 133 45 15 4 2 1

1 100
Вычислим u в   0  45  30  12  8  5   0,5 . Тогда xв  5  0,5  2,5  5 и
200 200
1 1
      0, 2 .
xв 5
Пример 2. Случайная величина  - число появлений события А в m  5 независимых
испытаниях подчинена биномиальному закону распределения с неизвестным
параметром p - вероятностью наступления события А в одном испытании.
Проведено n  50 опытов по m  5 испытаний в каждом опыте, результаты
которых представлены выборкой

15
xi 0 1 2 3 4 5
ni 10 16 12 8 3 1

где xi число появлений события А в одном опыте, а ni количество опытов, в


которых наблюдалось xi появлений события А. Найти методом моментов
точечную оценку вероятности p .
Для биномиального распределения M   mp . Согласно методу моментов M   xв , то
1
есть mp  xв и p  p  xв . Вычислим
m
1 81
xв   0  16  24  24  12  5   1, 62 .
50 50
1
Тогда p  p  1, 62  0,324 .
5
Задания.
1. Случайная величина  распределена по закону Пуассона. По выборке

xi 0 1 2 3 4
ni 140 40 15 4 1

методом моментов найти точечную оценку неизвестного параметра 


распределения Пуассона.
2. Случайная величина  имеет геометрическое распределение. По выборке

xi 1 2 3 4 5 6
ni 2 3 6 5 2 2

найти методом моментов точечную оценку вероятности p наступления события А


в одном испытании. Здесь xi номер испытания, в котором впервые появилось
событие А, а ni количество опытов, в которых событие А произошло на xi
испытании.
3. Случайная величина  распределена нормально. По выборке
xi 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0 2,2

ni 6 9 25 26 30 26 24 21 20 8 5

найти методом моментов точечные оценки неизвестных параметров a и 


нормального распределения.

4. Случайная величина  распределена равномерно с неизвестными параметрами a и b .


По выборке

16
xi 3 5 7 9 11 13 15 17 19 21
ni 21 16 15 26 22 14 21 22 18 25
методом моментов найти точечные оценки параметров a и b равномерного
распределения.
5. Случайная величина  имеет гамма распределение с неизвестными параметрами  и
 . По выборке
xi 5 10 15 20 25 30 35 40 45
ni 1 3 6 7 7 5 4 8 4

методом моментов найти точечные оценки параметров  и  гамма


распределения.

§ 8. Метод максимального правдоподобия нахождения точечных оценок параметров


распределений.

Пусть  дискретная случайная величина, для которой известен закон ее распределения,


но неизвестен параметр  этого закона распределения. Обозначим через
P   i   p i , 
вероятность того, что случайная величина  приняла значение  i .
По заданной выборке   1 , 2 ,..., n  построим функцию правдоподобия

L  ,   p 1 ,  p 2 ,  ... p n ,    p  x1 ,    p  x2 ,  ...  p  xk ,   ,


n1 n2 nk

которая является функцией от выборки  и неизвестного параметра  . Так как значения


 i независимы, то функция правдоподобия L  ,  есть вероятность появления исхода
  1 , 2 ,..., n  в n независимых испытаниях, то есть как раз того результата, который
дан выборкой.
Параметр  будем искать из условия максимума функции правдоподобия L  ,  , то
есть из условия максимума вероятности полученной выборки  . Иными словами, чтобы
полученный в выборке результат был наиболее правдоподобным.
Для удобства вычислений будем искать максимум не самой функции правдоподобия
L  ,  , а ее логарифма – логарифмической функции правдоподобия
n k
ln L  ,    ln p i ,    n i ln p  xi ,   .
i 1 i 1

d
Необходимое условие экстремума нас приводит к уравнению ln L  ,   0
d
относительно  . Если   его решение и выполняется достаточное условие максимума
d2
ln L  ,  |    0 , то это значение   и берем в качестве точечной оценки параметра
d 2

17
Пусть теперь случайная величина  имеет абсолютно-непрерывное распределение с
плотностью p  x,   p  x,  . Для выборки   1 , 2 ,..., n  функция правдоподобия
имеет вид
L  ,   p 1 ,  p 2 ,  ... p n ,    p  x1 ,    p  x2 ,  ...  p  xk ,   .
n1 n2 nk

В силу независимости величин  i их совместная плотность распределения, то есть


плотность распределения вектора   1 , 2 ,..., n  , равна произведению плотностей
компонент. Таким образом, функция правдоподобия L  ,  есть плотность
распределения выборки  .
В этом случае параметр  также ищется из условия максимума функции
правдоподобия, точнее из условия максимума логарифмической функции правдоподобия
d d2
ln L  ,   0 и ln L  ,  |    0 .
d d 2
Как видно, формальная математическая формулировка обоих случаев ничем не отличается
друг от друга. Только в первом случае p  ,  это вероятность, а во втором случае это
плотность функции распределения.
Наконец, если функция распределения зависит не от одного, а от m параметров
1 ,2 ,...,m , то и функция правдоподобия также будет зависеть от этих m параметров и
задача сводится к их нахождению из условий максимума логарифмической функции
n
правдоподобия ln L  ,1 , 2 ,..., m    ln p i ,1 , 2 ,..., m  .
i 1

Необходимые условия экстремума нам дадут m уравнений



ln L  ,1 , 2 ,..., m   0, j  1, m .
 j

 

Если   1 ,2 ,...,m есть решение этой системы и выполняется достаточное условие
максимума d 2 ln L  ,1 ,2 ,...,m  |   0 , то найденные значения и берутся в качестве

точечных оценок параметров распределения.


Пример 1. Случайная величина  - число появлений события А в m  10 независимых
испытаниях подчинена биномиальному закону распределения с неизвестным
параметром p - вероятностью наступления события А в одном испытании.
Проведено n  100 опытов по m  10 испытаний в каждом опыте, результаты
которых представлены выборкой

xi 0 1 2 3 4 5 6 7
ni 2 3 10 22 26 20 12 5
где xi число появлений события А в одном опыте, а ni количество опытов, в
которых наблюдалось xi появлений события А. Найти методом максимального
правдоподобия точечную оценку вероятности p .

18
В данном случае P   xi   p  xi , p   Cmxi p xi 1  p 
m xi
. Составим функцию
правдоподобия

 m  x1 n1
  C 
m  x2 n2
 
nk
L  , p   Cmx1 p x1 1  p  p x2 1  p   ...  Cmxk p xk 1  p 
m  xk
x2
m 

  C  ...C  p x1n1  x2n2 ... xk nk 1  p 


 m x1 n1  m x2 n2 ... m xk nk
n1 n2 nk
 Cmx1 x2
m
xk
m .
1 k
Учтем, что x1n1  x2 n2  ...  xk nk  n   xi ni  n  xв , n1  n2  ...  nk  n
n i 1
 m  x1  n1   m  x2  n2  ...   m  xk  nk  m  n1  n2  ...  nk    x1n1  x2n2  ...  xk nk  

 mn  nxв  n n  xв 
  C  ...C 
n1 n2 nk
и обозначим через C  Cmx1 x2
m
xk
m - величину, не зависящую от p .

Тогда L  , p   C  p n xв  1  p    и ln L  , p   ln C  n xв ln p  n m  xв ln 1 p  .
n m  xв
 
Найдем
d
ln L  , p  
nx в n m  xв
 n

x в  px в  mp  px в 
n
x в  mp
.
dp p 1 p p 1  p  p 1  p 
1
Это выражение будет равно нулю, если xв  mp  0 , то есть p  xв .
m
d2 xв m  xв
Найдем теперь L  , p   n 2  n . Эта величина отрицательна, так как
1  p 
2 2
dp p
1
0  xв  m . Таким образом в точке p  x в функция правдоподобия достигает
m
1
максимума, и мы нашли точечную оценку вероятности p  p  x в .
m
По заданной выборке найдем
1 400
xв   0  3  20  66  104  100  72  35   4.
100 100
1
Тогда p   4  0, 4 .
10
Пример 2. Случайная величина  распределена по нормальному закону с плотностью

 x  a 2
1
p  x   e 2 . По выборке объема n  100
2

 2
xi -4 -2 0 2 4 6 8 10
ni 3 7 15 25 24 16 8 2

методом максимального правдоподобия найти точечные оценки параметров a и  .


Составим функцию правдоподобия
n1 n2 nk
 1  x a    1  x a     x a  
2 2 2
 1 2  2 2  k
L   , a,     e 2   e 2  ...  1 e 2 2  
  2    2    2 
     
19
k
 xi a 
1 2

 
  n1  n2 ...nk  ni
2
  2
2
e i 1
.
Логарифмическая функция правдоподобия имеет вид
1 k

ln L  , a,    n ln   ln 2  2   xi  a  ni .
2 i 1
2

Найдем частные производные
 1 k
1  k k

ln L  , a,     2  2    xi  a  ni  2   xi ni  a  ni  
a 2 i 1   i 1 i 1 


1
 2  nx в  an   2
n
x в a 
 n 2 k 1  k

ln L  , a,      3   xi  a  ni  3    xi  a  ni 
2 2
  n 2

  2 i 1   i 1 
Из системы уравнений
 n
 2 x в  a  0

 

 1  n 2    xi  a 2 ni   0
k

 3  i 1


1 k

1 k
 i  i  xi  xв ni  Dв .  
2
находим a  xв и  2 
2
x  a n 
n i 1 n i 1
Для проверки выполнимости достаточного условия максимума вычислим вторые
производные
2 2
a 2

n
ln L  , a,     2 ;
a
2n
ln L  , a,     3 x в  a

 
2 n 3 k
    2 4   xi  a  ni
2
ln L , a,  
 2
  i 1
и найдем дифференциал второго порядка
 n 
x 
k
n 4n 3
d 2 ln L  , a,      a dad   2  4  x  a ni  d 2
2
da 2  в
 2
 3
  i 1
i

При a  xв и   Dв получаем, что
2

 n 
 x  x 
k
n 3
d 2 ln L  , a,    
2
da 2    2 i в ni  d 2 
Dв  Dв Dв i 1 
n  n 3  n 2n
 da 2    2  nDв  d 2   da 2  d 2  0 .
Dв  в
D Dв  Dв Dв

Таким образом, функция правдоподобия имеет максимум в найденной точке, и мы нашли


точечные оценки параметров a  a  xв и      Dв .
По заданной выборке вычислим
1 k 1 300
xв   xi ni   12  14  50  96  96  64  20   3
n i 1 100 100

20
1 n

 xi  xв  1
 49  3  25  7  3 15  1 25  1 24  9 16  25  8  49  2  
948
2
Dв  ni   9, 48
n i 1 100 100
Тогда a  3 и    9, 48  3,08 .

Задания.
1. Случайная величина  распределена по закону Пуассона. По выборке
xi 0 1 2 3 4
ni 120 55 15 8 2

методом максимального правдоподобия найти точечную оценку неизвестного


параметра  распределения Пуассона.

2. Случайная величина  имеет геометрическое распределение. По выборке


xi 2 3 4 5 6
ni 2 4 5 5 4

найти методом максимального правдоподобия точечную оценку вероятности p


наступления события А в одном испытании. Здесь xi номер испытания, в котором
впервые появилось событие А, а ni количество опытов, в которых событие А
произошло на xi испытании.

3. Случайная величина  имеет показательное распределение. По выборке


xi 5 10 15 20 25 30
ni 150 80 40 20 8 2

методом максимального правдоподобия найти точечную оценку неизвестного


параметра  показательного распределения.
4. Случайная величина  распределена по нормальному закону с известным
среднеквадратичным отклонением   4 . По выборке
xi 2,5 5 7,5 10 12,5 15 17,5
ni 10 20 35 60 40 25 15

найти методом максимального правдоподобия точечную оценку неизвестного


параметра a нормального распределения.
5. Случайная величина  распределена по нормальному закону с известным
математическим ожиданием a  25 . По выборке

xi 16 19 22 25 28 31 34
ni 4 15 25 45 20 10 1

21
найти методом максимального правдоподобия точечную оценку неизвестного
параметра  нормального распределения.
6. Случайная величина  имеет гамма распределение с известным параметром   1,5 .
По выборке
xi 1 5 9 13 17 21
ni 40 25 15 10 6 4

найти методом максимального правдоподобия точечную оценку неизвестного


параметра  гамма распределения.

§ 9. Теорема о свойствах логарифмической функции правдоподобия.


Неравенство Рао-Крамера.
Рассмотрим здесь ряд вопросов, которые с одной стороны служат обоснованием
рассмотренного выше метода максимального правдоподобия, а с другой стороны
позволяют найти нижнюю границу дисперсии несмещенных точечных оценок параметра.
Последнее позволяет сравнивать дисперсию полученной несмещенной оценки с нижней
границы дисперсии и тем самым судить о том насколько полученная оценка близка к
оптимально возможной. Кроме того будут получены условия достижения этой нижней
границы дисперсии, а значит условия получения наиболее эффективной точечной
несмещенной оценки.
Теорема. Пусть случайная величина  имеет абсолютно-непрерывное распределение с
плотностью p  x,  и пусть для логарифмической функции правдоподобия
n
ln L  ,    ln p i ,  выполняются следующие условия:
i 1

 2
1. Существуют производные ln L  ,  и ln L  ,  ;
  2
  
2. Существуют и конечны математические ожидания M  ln L  ,   ,
  
 2     
2

M  2 ln L  ,    и M   ln L  ,    .
       

    2     
2

Тогда M  ln L  ,    0 , а M  2 ln L  ,     M   ln L  ,     0 .
          

Доказательство. Так как функция правдоподобия L  ,   p 1 ,  p 2 ,  ... p n , 
есть совместная плотность распределения случайного вектора   1 , 2 ,..., n  , то
справедливо тождество
 L  ,   d  1 .
Rn

Продифференцируем этот интеграл по  , что допустимо по условиям теоремы

22

  L  ,  d  0 .
n
(1)
R

Преобразуем подынтегральное выражение



L  ,  
 
n L  ,  L  ,  d  0 или n  ln L  ,   L  ,  d  0 ,
R R

а это и есть математическое ожидание от производной логарифмической функции


правдоподобия
   
M ln L  ,     ln L  ,   L  ,  d  0 .
   Rn 
Таким образом, первое утверждение теоремы доказано.
Рассмотрим теперь вторую производную от логарифмической функции правдоподобия
  
 L  ,   
2      
ln L  ,    ln L  ,     
       L  ,  
2

 
2  
L  ,    L  ,    L  ,    L  ,  
  2
  
 L  ,   
2

2  
2
 2
L  ,    L  ,    L  ,  
 
2
 2
  2 
     ln L  ,   
L  ,    L  ,    L  ,     
 
и найдем от нее математическое ожидание
 2  2
M  2 ln L  ,     ln L  ,   L  ,  d 
   Rn 
2

2
2   
 L  ,   d    ln L  ,   L  ,  d 
Rn
 2
Rn 
 

2    
2

 n  2  
L  ,  d   M  
 
ln L     .
 , 
 
R 
Дифференцируя по  полученное ранее равенство (1), получим
2
  2 L  ,  d  0 .
Rn

 2     
2

Таким образом, M  2 ln L  ,     M   ln L  ,     0 и теорема доказана.


       

   
2

Функцию I    M   ln L  ,    называют количеством информации по Фишеру.


    

В определенном смысле ее можно рассматривать как количество информации,
содержащемся в векторе   1 , 2 ,..., n  о значении параметра  .
23
Теперь утверждения теоремы мы можем записать в виде
    2 
M ln L  ,    0 и M  2 ln L  ,     I    0 .
     
Полученный результат может служить определенным обоснованием рассмотренного
метода максимального правдоподобия, так как точечная оценка   параметра 
находилась из условий максимума логарифмической функции правдоподобия ln L  ,  , а
 2
именно из условий ln L  ,   0 и ln L  ,   0 .
  2
Неравенство Рао-Крамера. Пусть выполнены оба условия предыдущей теоремы и пусть
   h   есть несмещенная точечная оценка параметра  . Тогда

Dh    M  h       I 1  .
2

Доказательство. Рассмотрим равенство


M    Mh     h   L  ,   d  
Rn

и продифференцируем его по 

 h    L  ,  d  1 .
Rn

Преобразуем левую часть этого равенства



L  ,  
  
n h    L   ,   d    h    L   ,   d    h   ln L  ,   L  ,  d .
R
 R n L   ,   R n 
Таким образом

 h    ln L  ,   L  ,  d  1 .
Rn

Из доказанной теоремы следует, что


   
M ln L  ,     ln L  ,   L  ,  d  0 .
   Rn 
Умножим последнее равенство на  и вычтем из предыдущего

n  h        ln L  ,   L  ,  d  1 , то есть
R

  
M   h       ln L  ,    1 . (2)
  
Воспользуемся неравенством Коши-Буняковского

 f   g   d   f 2   d   g   d
2
,
n n n
R R R

где равенство достигается только если g    C  f   , C  const.


Преобразуем его применительно к математическим ожиданиям

24
M  f    g      f    g    L   ,   d     f    
L   ,    g   L  ,   d  
Rn Rn

  f 2   L  ,   d   g   L  ,   d 
2
  
 M f 2    M g 2   . 
Rn Rn

Применим полученное неравенство к соотношению (2)

 
      
2

1  M   h       ln L  ,    M         
2
h     M   ln L  , 
       

 Dh    I   ,

1
откуда получаем неравенство Рао-Крамера Dh    .
I  

При этом равенство в нем будет достигаться, если



ln L  ,   C    h      . (3)

Доказательство теоремы и получение неравенства Рао-Крамера было проведено для
абсолютно-непрерывных распределений, но все остается в силе и для дискретных
распределений. Надо только при доказательстве заменить плотность p  ,  на
вероятности p i ,  , а интегралы на суммы.

Определение. Несмещенная точечная оценка   параметра  называется оптимальной


или наиболее эффективной, если
D   inf Dn .
n

Выполнение условия (3), при котором неравенство Рао-Крамера переходит в точное


равенство, есть условие того, что полученная несмещенная оценка будет наиболее
эффективной.
Пример 1. Пусть случайная величина  распределена по закону Пуассона
k
P   k  e  ,   0, k  0,1, 2,...
k!
Найдем по выборке   1 , 2 ,..., n  методом максимального правдоподобия
точечную оценку параметра  и исследуем ее на эффективность.
Составим функцию правдоподобия
 1    2    n  
L  ,    e  e  ...  e  A   1 2 ...n  e  n  A   n xв e  n ,
1 ! 2 ! n !
где A  1 ! 2 ! ...  n !  const и 1  2  ...  n  nxв .
1

Найдем ln L  ,    ln A  nxв ln    n и вычислим производную




1
ln L  ,    nxв   n 

n

xв   ,  
25
которая обращается в ноль при      xв .
2 nxв
При этом ln L  ,     2  0 , а значит, при      xв функция правдоподобия
 2

имеет максимум и мы нашли точечную оценку    xв . Эта оценка будет несмещенной
M    M xв  M    , поскольку для распределения Пуассона M    .

Кроме того из полученного равенства

ln L  ,   
n

 
xв   следует, что выполняется

n
условие (3) (при C     , h    xв ) того, что полученная несмещенная оценка будет

наиболее эффективной.
В этом случае неравенство Рао-Крамера переходит в точное равенство
1
Dh    Dxв  .
I  
1 n  1 n
1 
Найдем Dxв  D   i   2  D i  2
 nD  , так как для распределения Пуассона
 n i 1  n i 1 n n
D   .
 1 n
Таким образом, Dxв   , откуда I     .
n I   

Пример 2. Пусть случайная величина  распределена по нормальному закону с



 x  a 2
1
плотностью p  x   e 2 2
. Предположим, что параметр a известен, а
 2
для параметра  требуется по выборке   1.2 ,..., n  методом максимального
правдоподобия найти точечную оценку и исследовать ее на эффективность.
Составим функцию правдоподобия
1  a 2   2  a 2   n  a 2
n
i a 
1 2

 
1  1  1  n
L  ,    2
 2
 ...  2
  2 2 2 i 1
2 2 2
e e e e .
 2  2  2
n
1
Найдем ln L  ,    n ln   n ln 2     a  и вычислим
2

2 2 i
i 1

 n 1 n 1 nn

ln L  ,      3  i  a   3   i  a    2  .
2 2

   i 1   n i 1 
1 n
Производная равна нулю, если  2   2   i  a  . При этом
2

n i 1
2
 2
ln 
L  ,  


n

2

3 n
4   i
 i 1
2


n

3 2n
  a   2  4 n 2   2  0 .

Таким образом, функция правдоподобия имеет максимум при     и мы нашли


1 n
точечную оценку      i  a  . Отметим сразу, что эта точечная оценка для
2
2 2

n i 1

26
1 n

 i  x в 
2
дисперсии D не является выборочной дисперсией Dв  , так как параметр
n i 1
a здесь известен.
Покажем, что полученная оценка является несмещенной
1 n 2
  1 n 1
M  2  M   i  a     M i  a    nM   a   D   2 .
2 2

 n i 1  n i 1 n
Кроме того выполнено условие (3)
 n 1 n  n 1 n
ln L  ,    3   i  a    2  при C    3 , h     i  a  ,
2 2

   n i 1   n i 1
а значит, полученная несмещенная точечная оценка является наиболее эффективной и в
неравенстве Рао-Крамера будет точное равенство.
Вычислим дисперсию полученной оценки
1 n 2 1 n 1
D 2  D   i  a    2  D i  a   2  nD   a  
2 2

 n i 1  n i 1 n
1
n
4
2 2 1
 n
4 2 1
  M   a   M   a     M   a    D     M   a    4  .
 n
4

 x  a 2
1

  x  a   t, x  a   t 
Найдем M   a     x  a dx   
4 4 2 2
e
 2   dx   dt 
u  t , du  3t 2 dt
3

 t2
 4  3  t2   
2
t2
4 
 

  t e dt   t2   t e | 3  t e 2 dt  
4 2 2
t2
2    2  
 dv  te dt , v  e  
2 2

u  t , du  dt  4  t2  t2  3 4
  3   
 2  3 4 .

 t2 t2   te 2
|  e 2
dt 
 dv  te 2 dt , v  e 2  2   2
  

2 4 2 4
Тогда D 2 
1
n
3 4   4  
n
и D 2 
n

1
I  
, откуда I   
n
2 4
.

Задание.
Пусть случайная величина  распределена по нормальному закону с

 x  a 2
1
плотностью p  x   e 2 2
. Предположим, что параметр  известен, а
 2
для параметра a требуется по выборке   1.2 ,..., n  методом максимального
правдоподобия найти точечную оценку и исследовать ее на эффективность.

27
§ 10. Интервальные оценки параметров распределений.

Понятие оценки параметра распределения будет неполным, если не указать величину


ошибки, возникающей при использовании полученной оценки. Наглядное представление
о точности оценок дают доверительные интервалы.
Доверительным интервалом для параметра распределения  называется случайный
интервал  ;   , внутри которого с вероятностью  , близкой к единице, содержится
точное значение оцениваемого параметра
P    ;    .
Величина  называется доверительной вероятностью. Она выбирается в соответствии с
готовностью мириться с возможностью ошибки. При заданной доверительной
вероятности  длина доверительного интервала характеризует точность, с которой
локализовано значение параметра. Поэтому естественно выбирать среди различных
доверительных интервалов при заданной доверительной вероятности  интервал
кратчайшей длины. Такой выбор обеспечивает наиболее точную локализацию параметра.
Отличие интервальной оценки от точечной состоит в следующем:
- доверительный интервал  ;   как оценка менее точен в том смысле, что он указывает
целое множество возможных значений  ;
- с другой стороны утверждение: «    ;   с вероятностью  » является истинным, в то
время как событие     , как правило, имеет вероятность, равную нулю.
Объявляя верным утверждение    ;   , мы используем тот факт, что если некоторое
событие имеет вероятность  и это  близко к единице, то практически невозможно,
чтобы это событие не произошло при единичном испытании.
Очевидно, что существуют различные способы построения доверительных интервалов.
Рассмотрим один из них, основанный на использовании точечной оценки   параметра.
Построенные на основе этой оценки интервалы будут тем короче, чем меньше дисперсия
оценки. Таким образом, эффективные и асимптотически эффективные оценки приводят к
кратчайшим или асимптотически кратчайшим доверительным интервалам.
Закон распределения оценки   в общем случае зависит от самих оцениваемых
параметров и, как правило, не известен. Поэтому будем переходить от случайной
величины   к некоторой другой случайной величине, закон которой уже не зависит от
неизвестных параметров, а зависит только от числа опытов n и от вида закона
распределения случайной величины  . Как правило, это нормированное нормальное
распределение, распределение Стьюдента или распределение Пирсона. Это позволит нам
по доверительной вероятности  найти доверительный интервал. Кроме того эти
доверительные интервалы будем строить симметричными относительно оценки   .
Рассмотрим применение этой схемы для нахождения доверительных интервалов для
параметров некоторых видов распределений.

28
§ 10.1. Построение доверительных интервалов для параметров нормального
распределения.
Поскольку нормальное распределение имеет два параметра a и  , то рассмотрим
следующие случаи.
I. Нахождение доверительного интервала для параметра a , если дисперсия  2
известна.
Несмещенной точечной оценкой для параметра a является выборочное среднее
1 n
x в   i . Оно имеет математическое ожидание M xв  a и дисперсию
n i 1
1 n  1 n 1 2
Dx в  D   i   2  Di  2  nD  .
 n i 1  n i 1 n n
Введем нормированную случайную величину
xв  M xв xв  a
  n,
Dxв 
которая является нормированной суммой случайных величин, имеющих математическое
ожидание и дисперсию. Тогда к ней применима центральная предельная теорема,
согласно которой она будет асимптотически нормальна с параметрами a  0 и   1 .
x t2

Тогда P      2     , где   x  
1
2
e
0
2 dt .


По таблице значений функции   x  находим решение    уравнения     .
2
xв  a 
   
Тогда n   , xв  a 
 и a   xв   ; xв     требуемый
 n  n n 
доверительный интервал для параметра a .
Пример 1. Найти доверительный интервал для оценки с надежностью   0,95 параметра
a нормального распределения, если среднеквадратичное отклонение   5 ,
выборочное среднее xв  14 , а объем выборки n  64 .

Из уравнения      0, 475 по таблице значений функции   x  (Таблица 2) находим
2
    1,96 . Доверительный интервал

     5 5
a   xв   ; xв     14  1,96  ;14  1,96    12, 775;15, 225 .
 n n   8 8

Пример 2. Найти минимальный объем выборки, при котором с надежностью   0,95


точность оценки математического ожидания a равна   0,5 , если   5 .

  
2

Так как     , то n      . В данном случае   1,96 и


n  
2
 5 
n  1,96    32, 6  1068 .
2

 0,3 
29
II. Нахождение доверительного интервала для параметра a , если дисперсия  2
не известна.
Несмещенной точечной оценкой для параметра a является выборочное среднее
1 n 2
xв  i
n i 1
 . При этом M x в  a и Dx в 
n
.

Так как дисперсия  2 нам не известна, то приблизим ее точечной несмещенной оценкой


n s2
s2  Dв , то есть возьмем Dx в  . Введем нормированную случайную величину
n 1 n
1 n
1 n 1 n i  a
xв  M xв xв  a n
i   a
n
 i  n 
  a

t  n  n i 1  n i 1  i 1
.
Dx в s n n n D
Dв Dв  в
n 1 n 1 n 1  2
 a
Перейдем к случайным величинам i  i , которые распределены нормально с


параметрами a  0 и    1. При этом Dв  и тогда
2
1 n  1 n  1 n 
 i
n i 1
 i
n i 1
 i
n i 1
t   .
n n  1 n 2  1 n    1  n 2  1 n   
2 2
Dв
n 1   i    i     i    i  
n  1  n i 1  n i 1   n  1  i 1  n  
  i 1


Введем в n -мерном пространстве выборок 1 , 2 ,...,  n новую ортогональную систему 
1 n  n n
1, i  m
координат 1 ,2 ,...,n  так, что 1    ,     jii и   jm   im   .
0, i  m
i j ji
n i 1 i 1 j 1

Тогда
 
2
n n
 n
 n n n n n

 2j     jkk       ji jmim    im  ji jm   i2 и


j 1 j 1  k 1  j 1  i,m1  i, m 1 j 1 i 1

1 1
t  .
1  n 2  1 n 2
 j  1 
n  1  j 1
2
 j
n  1 j 2

Поскольку случайные величины  j , так же как и  i , распределены нормально с
параметрами 0 и 1, то случайная величина t имеет распределение Стьюдента с n  1
степенью свободы.
Из уравнения P  t  t    по таблице 3 находим соответствующее значение t  t  , n  .

n s
Тогда t  xв  a  t , x в  a  t и искомый доверительный интервал
s n
 s s 
a   xв  t ; x в  t  .
 n n 

30
Полученное выражение для доверительного интервала совпадает с предыдущим случаем
(когда дисперсия  2 известна) с заменой  на s и   на t .
Так как с ростом n распределение Стьюдента стремится к нормальному распределению,
то при достаточно больших n t    и доверительный интервал находят по формуле
 s s 
a   xв   ; xв    .
 n n 
Пример 3. Из генеральной совокупности, распределенной нормально, извлечена выборка
объема n  25 :
xi -1,0 -0,5 0,0 0,5 1,0 1,5 2,0
ni 2 3 5 8 4 2 1

Найти с надежностью   0,95 доверительный интервал для математического


ожидания a .
По заданной выборке вычислим выборочное среднее и исправленную выборочную
дисперсию
1 n 1
xв   xi ni   2  1,5  4  4  3  2   0,38
n i 1 25

s2 
1 n

n  1 i 1
 
xi  xв ni 
1
24
 
1,382  2  0,882  3  0,382  5  0,122  8  0,722  4  1,122  2  1,622 

14,176
  0,5907 и s  0,5907  0, 7686 .
24
По таблице 3 находим t  t  0,95;25  2,064 . Тогда
 0, 7686 0, 7686 
a   0,38   2, 064;0,38   2, 064  , то есть a   0,063;0,697  .
 5 5 

III. Нахождение доверительного интервала для параметра  , если


математическое ожидание a не известно.
Несмещенной точечной оценкой для дисперсии  2 является исправленная выборочная
n
дисперсия s 2  Dв . Будем искать доверительный интервал  s   ; s    так, чтобы
n 1
P s      s      .
nDв nDв
Положим s    и s   , где t1 и t2 неизвестные пока величины.
t1 t2
nDв nDв
Тогда неравенство s      s   перейдет в неравенство   или
t1 t2
 nDв   t1 nDв
 , откуда  t2  nDв   t1 или t2   t1 .
 nDв   t 2

31

 nDв 

Таким образом получаем условие P s      s     P t2   t1    .

  

Так как математическое ожидание a неизвестно, то приблизим его выборочным средним
i  x в
x в и введем нормированные случайные величины i  , распределенные

2
Dв nDв  1 n  n
нормально. Тогда Dв  2 и  nDв   i    i  . 2

  i 1  n i 1 
Как и в предыдущем пункте осуществим линейное ортогональное преобразование
1 n  n n
1, i  m
координат 1    ,       и   ji jm   im   . При этом случайные
0, i  m
i j ji i
n i 1 i 1 j 1

величины  j также нормированы и распределены нормально.


n n
Там же мы показали, что     
j 1
2
j
i 1
i
2
. Тогда

2
n
 1 n  n n
nDв    i
 2
   i    2j 12   2
j
i 1  n i 1  j 1 j 2


 n 

и мы приходим к соотношению P t2   2
j  t1    .

 j 2 

n
Случайная величина   
j 2
2
j имеет  распределение с n  1 степенью свободы и нам

известна плотность p  x  ее функции распределения (см. § 6).


t1

Для нахождения величин t1 и t2 получаем уравнение P t2    t1   p  x  dx   .


t2

Преобразуем выражения для t1 и t2 , чтобы получить в этом уравнении одно неизвестное


n 1 2
n s
nDв n s n 1 n 1 
t1     , где q  .
s  s  s  1 q s
nDв s n 1 n 1
Аналогично t2    .
s  s  1 q
n 1
1 q
Получили уравнение относительно q :  p  x  dx   .
n 1
1 q

По таблице 4 находим его решение q  q  , n  . Тогда   sq и доверительный интервал


имеет вид    s   ; s      s 1  q  ; s 1  q   . При этом, если 1  q  0 , то так как   0 ,
берется интервал    0; s 1  q   .

32
Пример 4. Проведено n  20 измерений одним прибором без систематической ошибки
некоторой величины. Найдена исправленная выборочная дисперсия s  0,8 . Найти
точность прибора с надежностью   0,99 .

Ошибки измерений подчинены нормальному закону, а точность прибора характеризуется


среднеквадратичным отклонением случайных ошибок измерений. Таким образом, задача
сводится к отысканию доверительного интервала для  с заданной надежностью   0,99
По таблице 4 находим q  q  0,99;20   0,58 . Тогда
   0,8 1  0,58 ;0,8 1  0,58    0,336;1, 264  .

§ 10.2. Построение доверительного интервала для параметра  распределения


Пуассона.
Пусть случайная величина  распределена по закону Пуассона
k
P   k  e  ,   0, k  0,1, 2,...
k!
По выборке   1 , 2 ,..., n  найдем с надежностью  доверительный интервал для
1 n
параметра  . Несмещенной точечной оценкой параметра  является    xв   i .
n i 1
1 n  1 n
1 
При этом M    M xв   и D   Dxв  D   i   2  D i  2
nD  , так как для
 n i 1  n i 1 n n
распределения Пуассона M    и D   .
Введем нормированную случайную величину
  M  xв   n 1 n 

D 



n

x в 
    i    ,
  n i 1 
n
которая по центральной предельной теореме асимптотически нормальна с параметрами
a  0 и   1 . Тогда P      2     . Теперь по таблице 2 значений функции   x 

находим решение   уравнения     .
2
n
Далее из неравенства    xв      следует найти интервал изменения  .

Запишем это неравенство в виде системы



n

 
 xв      n  x в   n       n      x в n  0
 или  , то есть  .
 n  x в   n       n      xв n  0


n

 
 x в     

Решим эти квадратичные неравенства относительно .

33
  2
Нулями первого квадратного трехчлена будут   1,2

2 n
 xв 
4n
и решением

  2
первого неравенства с учетом того, что   0 будет     xв  .
2 n 4n
  2
Нулями второго квадратного трехчлена будут   
1,2

2 n
 xв 
4n
и его решение

  2
есть   xв  . Таким образом, решением системы неравенств будет
2 n 4n
 2   2
  xв     xв  .
2 n 4n 2 n 4n
Отсюда искомый доверительный интервал есть
2 2
  2    2 
    xв          xв    .
 2 n 4n  2 n 4n 
   
Пример 5. Случайная величина  распределена по закону Пуассона. По выборке объема
n  100
xi 0 1 2 3 4

ni 58 28 11 2 1

Найти с надежностью   0,95 доверительный интервал для параметра  .

1
Вычислим сначала xв   28  22  11  2  1  0, 6 . Затем по таблице 2 из уравнения
100

 0,95
      0, 475 находим   1,96 . Согласно полученной формуле
2 2
2 2
 1,96 1,962   1,96 1,962 
  0, 6      0, 6  
 20 400   20 400 
    , то есть 0, 4662    0,8788 .

§ 10.3. Построение доверительного интервала для вероятности p


биномиального распределения.
Пусть случайная величина  имеет биномиальное распределение
P   k  Cnk p k 1  p 
nk
.
Ее математическое ожидание и дисперсия соответственно равны M   np и D  npq .
m
Будем считать, что известна относительная частота  появления события в n
n
независимых испытаниях. Найдем доверительный интервал для вероятности p
наступления события в одном испытании.
34
В качестве точечной оценки для вероятности p возьмем относительную частоту
m
p    . Эта оценка будет несмещенной, так как   m и
n
m 1
  1
M p  M    M    M  m    np  p
n n n
и ее дисперсия
m 1 pq p 1  p 
  n n n
1
D p  D    D    2 D  m   2  npq 
n

n .
Введем нормированную случайную величину


 
p  M p  p
n
D p  
p 1  p 
.

По теореме Муавра-Лапласа она асимптотически нормальна с параметрами a  0 и   1 .


Тогда P      2     . Теперь по таблице 2 значений функции   x  находим

решение   уравнения     .
2
Доверительный интервал для вероятности p найдем, решив неравенство
n
   p    . Для этого возведем его в квадрат и приведем подобные члены
p 1  p 

 2
   
 n p 2  2  2n p  n 2  0 .
  2  1    
   
2
Найдем дискриминант D   2  2n  4n 2  2  n  4n 2 2   2   и корни
 4n n
 

n   2 2  1    
квадратного трехчлена p1,2  2       . Тогда решение
  n  2n 4n 2 n 
 
квадратичного неравенства, то есть доверительный интервал имеет вид
n   2  2  1     n   2  2  1    
       p 2       .
 2  n  2n 4n 2 n    n  2n 4n 2 n 
   
 2  2
Если n достаточно велико, то величины и малы и ими можно пренебречь, а
2n 4n 2
n
величина  1 . В этом случае получаем упрощенную формулу
  n
2

 1     1   
    p     .
n n
Пример 6. Проведено n  160 независимых испытаний, в которых событие А появилось
m  16 раз. Найти с надежностью   0,95 доверительный интервал для
вероятности p появления события А в одном испытании.

35
m 16
В данном случае     0,1 . По таблице 2 находим решение   1,96 уравнения
n 160
 0,95
      0, 475 . По упрощенной формуле находим доверительный интервал
2 2

0,1 0,9 0,1 0,9


0,1   p  0,1  , то есть 0,0954  p  0,1046 .
160 160

Задания.
1. Выборка из большой партии электроламп содержит 100 ламп. Средняя
продолжительность горения лампы выборки оказалась равной 1000 часов. Найти с
надежностью 0,95 доверительный интервал для средней продолжительности a
горения лампы всей партии, если известно, что среднеквадратичное отклонение
продолжительности горения лампы   40 часов. Предполагается, что
продолжительность горения ламп распределена нормально.
2. Глубина моря измеряется прибором, систематическая ошибка которого равна
нулю, а случайные ошибки распределены нормально со среднеквадратичным
отклонением   20 метров. Сколько надо сделать независимых измерений, чтобы
определить глубину с ошибкой не более 15 метров при надежности 90%?
3. Из генеральной совокупности, распределенной нормально, извлечена выборка
xi 1 2 3 4 5 6 7
ni 2 3 7 12 9 2 1

Найти доверительный интервал для оценки с надежностью 0,95 неизвестного


математического ожидания a .
4. Из генеральной совокупности, распределенной нормально, извлечена выборка
xi -1,5 -1,0 -0,5 0 0,5 1,0 1,5
ni 2 4 8 12 7 5 2

Найти доверительный интервал, покрывающий среднеквадратичное отклонение 


с надежностью 0,99.
5. Случайная величина  (число поврежденных при перевозке изделий в одном
контейнере) распределена по закону Пуассона. В выборке приведено
распределение числа поврежденных изделий в 500 контейнерах (в первой строке
указано количество xi поврежденных изделий в одном контейнере, во второй
строке приведена частота ni - число контейнеров, содержащих xi поврежденных
изделий):
xi 0 1 2 3 4 5 6 7
ni 199 169 87 31 9 3 1 1

36
Найти с надежностью 0,99 доверительный интервал для параметра 
распределения Пуассона.
6. Игровой автомат должен обеспечивать появление выигрыша в одном случае из 100
бросаний монеты в автомат. При проверке игрового автомата произведено 500
испытаний, причем выигрыш появился 4 раза. Найти доверительный интервал,
покрывающий неизвестную вероятность появления выигрыша с надежностью
0,999. Обеспечивает ли этот игровой автомат заявленную вероятность выигрыша?

§ 11. Статистическая проверка гипотез о значениях параметров распределений.


В данном разделе пойдет речь о проверке каких-либо предположений (гипотез)
относительно неизвестных параметров известного закона распределения случайной
величины. Решение о том, справедлива ли рассматриваемая гипотеза или нет, должно
основываться лишь на знании выборки   1 , 2 ,..., n  , то есть на основании некоторой
статистики. Таким образом, чтобы определить процедуру принятия решения по выборке
 , мы должны задать в той или иной форме отображение выборочного пространства на
множество рассматриваемых гипотез. Такое отображение называют статистическим
критерием.
Пусть задан закон распределения случайной величины  , но не известен его параметр  .
Относительно значений этого параметра мы и будем выдвигать гипотезы.
Статистическая гипотеза H называется простой, если она состоит в том, что   0 , где
 0 некоторое фиксированное значение, и сложной, если   1;2  .
Например, для биномиального распределения Pn   k  Cnk p k 1  p 
nk

1 1
гипотеза H : p  является простой, а гипотеза H : p  является сложной.
2 2
Задачу проверки статистических гипотез будем ставить следующим образом. Дана
выборка   1 , 2 ,..., n  . Относительно значения параметра  имеется:
основная гипотеза H 0 :   0
и конкурирующая или альтернативная гипотеза H1 :   1
(для наглядности изложения гипотезы возьмем простыми).
Мы должны построить такой статистический критерий, который позволял бы нам
заключить согласуется ли выборка  с гипотезой H 0 или нет, то есть принимаем ли мы
эту гипотезу или нет. Будем строить статистические критерии при помощи так
называемого критического множества. Выборку   1 , 2 ,..., n  можно рассматривать
как точку n -мерного пространства выборок. В этом пространстве выборок выделим такое
множество S , называемое критическим, что при попадании выборки  в S гипотеза H 0
отвергается, а в остальных случаях она принимается. Получаемый при помощи
критического множества S статистический критерий принято называть S -критерием.

37
Пусть p  x,  плотность функции распределения, тогда вероятность попадания выборки
 в критическое множество S равна W  S ,    p  x,  dx . Эту вероятность называют
S

еще функцией мощности S -критерия.


С каждым S -критерием связаны ошибки двух родов:
ошибка I-го рода   W  S ,0    p  x,0  dx - отвергаем гипотезу H 0 , когда она верна, то
S

есть, принимаем альтернативную гипотезу, хотя верна основная;


 
ошибка II-го рода   W S ,1   p  x,1  dx  1   p  x,1  dx - отвергаем гипотезу H1 ,
S S

когда она верна, то есть, принимаем основную гипотезу, хотя верна альтернативная.
Вероятность  ошибки I-го рода называют уровнем значимости критерия, а величину
W  S ,1   1   называют мощностью критерия.
Очевидно, что S -критерий будет тем лучше, чем меньше будут ошибки  и  , то есть
чем меньше уровень значимости  и чем больше мощность W  S ,1  этого критерия.
Однако при заданном числе испытаний n невозможно ни при каком выборе критической
области S одновременно сделать как угодно малыми обе ошибки  и  . Поэтому,
сначала задается уровень значимости  и рассматривается множество S  всех S -
критериев с уровнем значимости  . Далее среди них выбирается критерий S  , для
которого мощность максимальна
 
W S  ,1  max W  S ,1  .
SS 

Критерий S , удовлетворяющий этим условиям, называют оптимальным или наиболее
мощным критерием.
К сожалению, оптимальный критерий, удовлетворяющий этим условиям, существует не
для всех типов распределений. Поэтому видоизменим схему построения наиболее
мощного статистического критерия. Введем функцию   x  такую, что 0    x   1 и
рассмотрим  -критерий с функцией мощности W  ,      x  p  x,  dx .
S

Для этого  -критерия ошибки I-го и II-го рода равны соответственно


  W  ,0      x  p  x,0  dx и   1  W  ,1   1     x  p  x,1  dx ,
S S

а мощность критерия равна W  ,1   1   .


Зададим уровень значимости  и рассмотрим множество   всех  -критериев с
уровнем значимости  . Выберем среди них критерий   , для которого мощность
максимальна
   
W   ,0   и W   ,1  max W  ,1 
 
(1)

Такой  -критерий будем называть наиболее мощным или оптимальным. Покажем, что в
такой постановке задача уже будет всегда разрешимой.
Для сокращения записей введем обозначения

38
p0  x   p  x,0  ; p1  x   p  x,1  ; M 0     x  p0  x  dx ; M1     x  p1  x  dx
(здесь M есть символ математического ожидания).
Оптимальный критерий будем искать среди критериев, которые определяются
p  x
отношением правдоподобия 1 .
p0  x 

Теорема Неймана-Пирсона. Для любого   0;1 существуют такие числа c  0 и


  0;1 , что   -критерий с функцией
 p1  x 
1, если  c, то есть p1  x   c  p0  x 
 p0  x 
 p  x

   x    , если 1  c, то есть p1  x   c  p0  x 
 p 0  x 
 p  x
0, если 1  c, то есть p1  x   c  p0  x 
 p0  x 
является наиболее мощным критерием согласно (1) с уровнем значимости  .
Доказательство. Рассмотрим следующую функцию от c в предположении, что верна
 p  x
 

гипотеза H 0 : g  c   P  1  c | H0  .
 p0  x 
 

 p  x
 

Функция 1  g  c   P  1  c | H 0  есть функция распределения случайной величины
 p0  x 
 

p1  x 
, а значит, она не убывает и непрерывна слева. Тогда функция
p0  x 

 p  x
 

g c  1 P  1  c | H 0  не возрастает и также непрерывна слева. Кроме того
 p0  x 
 

g  0   1 и g     0 .
Найдем c из условия g  c     g  c  0  .
А именно, если g  c   g  c  0  (функция g  c  терпит скачок в точке c ), то возьмем
  g  c 
  . Если же g  c   g  c  0  (функция g  c  непрерывна точке c ),
g  c  0   g  c 
то возьмем   0 . При этом если g  c    на некотором промежутке (функция g  c 
постоянна на этом промежутке), то примем за c любую точку этого промежутка,
например левый конец.
Положив в выражении для    x  c  c и    , получим требуемую функцию.
Действительно, покажем, что построенный   -критерий имеет уровень значимости  и
обладает свойством оптимальности, то есть его мощность максимальна.
Найдем сначала

39
M 0       x  p0  x  dx   1 p0  x  dx     p0  x  dx   0  p0  x  dx 
p1  x  c p0  x  p1  x  c p0  x  p1  x c p0  x 

  g  c 
 p0  x  dx  p0  x  dx  g  c  
g  c  0   g  c  p1  x c p0  x 

p1  x  c p0  x 

  g  c 

g  c  0   g  c 
 g  c  0  g  c   g  c     g  c    .
Таким образом, уровень значимости этого критерия равен  .
Пусть  любой другой критерий с уровнем значимости  : M 0   . Покажем, что
M1   M1 . Рассмотрим интеграл

   x     x    p  x   c p  x   dx     x     x   p  x   c p  x  dx 
 
1 0 1  0
   x    x 
 p1  x c p0  x 
    x     x   p  x   c p  x  dx  0 , откуда

1  0
   x   x 
 p1  x c p0  x 

   x     x  p  x  dx  c    x     x  p  x  dx , то есть
 
1 0

 
M1   M1  c M o   M 0  c      0 и M1   M1 .
Таким образом, мы построили наиболее мощный критерий.
Мы провели все рассуждения, используя плотность p  x,  случайной величины, то
есть считая, что она абсолютно-непрерывна. Но все остается в силе и для дискретных
случайных величин с заменой плотности на вероятности p i ,  , а интегралы на суммы.

Рассмотрим теперь применение построенного критерия Неймана-Пирсона для проверки


гипотез о значении параметров распределений.

§ 11.1. Проверка гипотез о значении параметров нормального распределения.


Пусть случайная величина  распределена по нормальному закону и   1 , 2 ,..., n 
выборка объема n . Поскольку нормальное распределение имеет два параметра a и  , то
рассмотрим следующие случаи.
I. Проверка гипотез о значении математического ожидания a , если дисперсия
 2 известна.
Пусть требуется проверить основную гипотезу
H 0 : a  a0
при альтернативной гипотезе (правая односторонняя)
H1 : a  a1  a0
Совместная плотность распределения вектора  есть
n

 1   2 2  i a j  1
n 2

p j    p j 1  p j  2  ... p j  n     e i 1
, j  0,1
  2 
Тогда отношение правдоподобия примет вид

40
p1    1 n
1 n
2
 i  a1     a0   
2
 exp   2 
p0    2 2 2 i
i 1 i 1 
 1 n   1  
   
n
 exp   2  i2  2a1i  a12  i2  2a0i  a02   exp  2  n a12  a02  2  a1  a0   i   
 2 i 1   2  i 1 

 n  a1  a0  
 1
 2
  
 exp   2 n a12  a02  2n  a1  a0  x в   exp 
 2 2 a1  a0  2 x в  .  
 
Критическая область S определяется при некотором c из равенства
 p  
 

P 1  c | H0    .
 p0  
 

рассмотрим неравенство
p1    n  a1  a0  
p0  
 exp  
2 2 
a1  a0  2 xв   c  (2)
 
и разрешим его относительно x в :
n  a1  a0 

2 2
 
a1  a0  2 xв  ln c и с учетом того, что a1  a0 получим

a a 2
xв  1 0  ln c .
2 n  a1  a0 
a1  a0 2
Обозначим через c1   ln c - это тоже еще неизвестная величина, так как
2 n  a1  a0 
c неизвестно. Таким образом, xв  c1 и
 p  
 

P 1
 p0   

 c | H 0   P x в  c1   . 
 
Задача нахождения критической области S в n -мерном пространстве выборок сведена к
задаче нахождения критической области для одномерного случая (относительно
выборочного среднего).
Выборочное среднее x в имеет математическое ожидание M xв  a и дисперсию
2 xв  M x xв  a
Dx в  . Введем нормированную случайную величину   n, 
n Dxв 
которая по центральной предельной теореме распределена асимптотически нормально с
параметрами a  0 и   1 . Тогда

 xв  a0 c a 


P xв  c1 | H 0  P   n  1 0 n   P   c  ,
 
  

c1  a0 n  a1  a0 2  xв  a0
где c  n   ln c  и   n.
   2 n  a1  a0   

Теперь из уравнения P   c    найдем c . Для этого рассмотрим

41
 t2  t2 c t2
1  1  1  1
P   c   e 2
dt   e 2
dt  e 2
dt     c  .
2 c 2 0 2 0
2
1 1
Тогда для нахождения c получаем уравнение    c    , то есть   c     .
2 2
x t2
1 
По таблице 2 значений функции   x    2 dt находим критическую точку c .
e
2 0
xв  a0
Теперь, если    n  c , то у нас нет оснований отвергать гипотезу H 0 , если же

  c , то гипотезу H 0 отвергаем.
На рисунке 4 изображена критическая область S ,
вероятность попадания в которую равна  .

Предположим, что нам известно гипотетическое значение a1 . Тогда мы можем найти


мощность W  1   построенного правостороннего критерия. Для этого вычислим
 p1  
 
  xв  a1 c a 
  P
 p0  

 c | H1   P x в  c1 | H1  P  
n  1 1 n   P   c  ,
 
    
c a c a a a a a
где c  1 1 n  1 0 n  1 0 n  c   и   1 0 n .
   
Тогда
c t2 0 t2 c t2
  P   c      c      c    .
1  1  1  1 1
2 e

2 dt 
2 e

2 dt 
2 e
0
2 dt 
2 2
Таким образом, зная c и  , можно найти  , а значит и мощность

   c      c   
1 1
W  1  
2 2
построенного правостороннего критерия.
Наконец, если заданы ошибки  и  (или мощность W  1   ), то можно найти объем
выборки, обеспечивающий эти ошибки.

  находим c , а из уравнения   c    
1 1
Действительно, из уравнения   c  
2 2
находим c . Далее, из соотношения
2
a1  a0  c  c 
c  c   , то есть n  c  c находим n     .
2

  a1  a0 
Пример 1. По выборке объема n  16 , извлеченной из генеральной совокупности,
распределенной нормально со среднеквадратичным отклонением   4 , найдено
xв  2,3 . Требуется при уровне значимости   0,05 :

1) Проверить основную гипотезу H 0 : a  a0  2


при альтернативной гипотезе H1 : a  a1  2 ;

42
2) Найти мощность построенного правостороннего критерия при значении a1  3 ;
3) Найти объем выборки n , при котором мощность критерия будет равна W  0,6 .

1
Из уравнения   c      0, 45 по таблице 2 значений функции   x  находим
2
xв  a0
2,3  2
c  1,65 . Вычислим   n
 4  0,3 .
 4
Так как   0,3  c  1,65 , то у нас нет оснований отвергать гипотезу H 0 .
a1  a0 3 2
Найдем далее c  c    c  n  1, 65   4  0, 65 и мощность построенного
 4
   c   0,5  0, 24  0, 26 .
1
правостороннего критерия W  1   
2
Найдем теперь объем выборки n , при котором мощность критерия будет равна W  0,6 .

В этом случае   1  W  1  0,6  0, 4 и из уравнения   c    


1
 0, 4  0,5  0,1 по
2
таблице 2 с учетом того, что функция   x  нечетна, находим c  0, 25 . Тогда
2
 c c   1, 65  0, 25 
2

n        16 
2
  58 .
 a1  a0   3 2 

Рассмотрим теперь случай, когда альтернативная гипотеза левая односторонняя


H 0 : a  a0
H1 : a  a1  a0
Критическая область S и в этом случае определяется при некотором c из равенства
 p  
 

P 1  c | H 0    . Но в этом случае a1  a0 и, разрешая неравенство (2) относительно
 p0  
 

a1  a0 2
x в , получим xв  c1 , где c1    ln c . Таким образом,
2 n  a1  a0 

 p1    xв  a 
  P

 p0  





 
 c | H 0   P x в  c1 | H 0  P 
 

0
n  1


c   a0 
n   P   c  ,

xв  a0 c1  a0
где   n и c  n.
 
Теперь из уравнения P   c    следует найти c . Для этого рассмотрим
 c t2 0 t2  c t2
1  1  1  1 1
P   c   e 2 dt  e 2 dt  e 2 dt     c      c  .
2  2  2 0
2 2
Таким образом, для нахождения c получаем тоже уравнение, что и в предыдущем случае
1
  c    .
2

43
xв  a0
По таблице 2 находим значение c . Если   n  c , то гипотезу H 0 отвергаем,

иначе принимаем.
На рисунке 5 изображена критическая область S ,
вероятность попадания в которую равна  .

Если нам известно гипотетическое значение a1 , то мы можем найти мощность W  1  


построенного левостороннего критерия. Для этого вычислим
 p    xв  a 

  P 1
 p0  





 
 c | H1   P x в  c1 | H1  P 
 

1
 c   a1
n  1

n   P   c  ,

c1  a1 c1  a0 a1  a0 a1  a0
где c  n n n  c   , где   n тоже, что и в
   
предыдущем случае. Тогда
 t2  t2 0 t2
  P   c      c      c  .
1  1  1  1 1
2 e
 c
2
dt  
2 0
e 2
dt 
2 e
 c
2
dt 
2 2

   c      c    и мощность критерия
1 1
Таким образом,  
2 2
1
W  1       c    .
2
Наконец, если заданы уровень значимости  и мощность W , то находя c и c

  и   c       W , из соотношения
1 1 1
соответственно из уравнений   c  
2 2 2
2
a1  a0  c  c 
c  c    c  n найдем объем выборки n     , обеспечивающий эти
2

  a1  a0 
заданные величины.
Рассмотрим еще случай, когда альтернативная гипотеза двусторонняя
H 0 : a  a0 (3)
H1 : a  a1  a0
Так как условие a1  a0 эквивалентно тому, что a1  a0 или a1  a0 , то мы можем
воспользоваться результатами двух предыдущих случаев
  P   c   P   c   P   c      c      c   1  2  c 
1 1
2 2
1
и для нахождения c получаем уравнение   c   .
2
x в  a0
Теперь, если   n  c , то гипотезу H 0 отвергаем, иначе принимаем.

44
На рисунке 6 изображена критическая область S , состоящая из
двух интервалов, вероятность попадания в каждый из них равна

. Поскольку  есть нормированная нормально
2
распределенная случайная величина, а распределение такой величины симметрично
относительно нуля, то и критические точки симметричны относительно нуля. В этом
случае достигается наибольшая мощность критерия.
Для нахождения мощности построенного двустороннего критерия найдем

  
  P xв  c1 | H1  P x в  c1 | H1  P 
 

 xв  a1 c a 
n  1 1 n
 

 xв  a1 c   a1 

P  n  1 n   P   c    P   c   
 
  

 P c      c      c       c       c       c    .
Тогда W  1    c       c    .

Замечание. Находя двустороннюю критическую область при уровне значимости  , мы


одновременно находим и доверительный интервал для математического ожидания a с
надежностью   1   . Действительно, при проверке двусторонней гипотезы (3), мы
xв  a0
требовали, чтобы вероятность попадания случайной величины   n в

двустороннюю критическую область S была равна  . Следовательно, вероятность
попадания величины  в область принятия гипотезы  c ; c  равна   1   . Другими
xв  a0
словами с надежностью  выполняется неравенство c  n  c , откуда

  1 
xв  c  a  xв  c , где   c    , а это и есть доверительный интервал
n n 2 2
для математического ожидания a .
Хотя отыскание двусторонней критической области и доверительного интервала приводит
к одинаковым результатам, их истолкование различно: двусторонняя критическая область
определяет границы (критические точки), между которыми заключено 1    % числа
наблюдаемых значений величины  , найденных при повторении опытов; доверительный
же интервал определяет границы (концы интервала), между которыми в   1    %
опытов заключено истинное значение параметра a .

II. Проверка гипотез о значении математического ожидания a , если дисперсия


 2 не известна.
Пусть необходимо проверить гипотезы
H 0 : a  a0
H1 : a  a1  a0 (правая односторонняя).
45
Как и в предыдущем пункте, критическая область S определяется при некотором c из
соотношения

 p1  
 

  P
 p0  

 c | H 0   P xв  c1 | H 0 .


 
Дальнейшие рассуждения аналогичны тем, которые мы делали в § 10 при нахождении
доверительного интервала для математического ожидания для случая, когда дисперсия не
известна.
Выборочное среднее x в имеет математическое ожидание M xв  a и дисперсию
2
Dx в  . Поскольку дисперсия  2 не известна, то по выборке   1 , 2 ,..., n  найдем
n
n s2
исправленную выборочную дисперсию s 2  Dв и примем Dx в  . Введем
n 1 n
нормированную случайную величину

1 n 1 n 1 n i  a
xв  M xв xв  a n
i   a
n
 i   a  
n i 1 
t  n  n i 1  n i 1  .
Dx в s n n n Dв
Dв Dв 
n 1 n 1 n 1  2
 a
Перейдем к случайным величинам i  i , которые распределены нормально с


параметрами a  0 и    1. Для нее Dв  и тогда
2
1 n  1 n  1 n 
 i
n i 1
 i
n i 1
 i
n i 1
t   .
n n  1 n 2  1 n    1  n 2  1 n   
2 2
Dв
n 1   i    i     i    i  
n  1  n i 1  n i 1   n  1  i 1  n i 1  
 

 
Введем в n -мерном пространстве выборок 1 , 2 ,...,  n новую ортогональную систему

1 n  n n
1, i  m
координат 1 ,2 ,...,n  так, что 1   i ,  j    jii и   jm   im   .
0, i  m
ji
n i 1 i 1 j 1
n n
Мы ранее показали, что     
j 1
2
j
i 1
i
2
. Тогда

1 1
t  .
1  n 2  1 n 2
 j  1 
n  1  j 1
2
 j
n  1 j 2

Поскольку случайные величины  j , так же как и  i , распределены нормально с
параметрами 0 и 1, то случайная величина t имеет распределение Стьюдента с n  1
степенью свободы. Таким образом

46

 xв  a0 c a 
 c a
 
  P xв  c1 | H 0  P 

n  1 0 n   P t  c  , где c  1 0 n .

 s s  s
По таблице 5 критических точек распределения Стьюдента для случая односторонней
критической области находим c  c  ; n  1 . Теперь, если
xв  a0
t n  c , то гипотезу H 0 отвергаем, иначе принимаем.
s
Совершенно аналогично рассматривается случай левой односторонней гипотезы
H 0 : a  a0
H1 : a  a1  a0
 p  

Имеем   P  1
 p0  



 
 c | H 0   P x в  c1 | H 0  P t  c  .


По таблице 5 критических точек распределения Стьюдента для случая односторонней
критической области находим c  c  ; n  1 . Теперь, если
xв  a0
t n  c , то гипотезу H 0 отвергаем, иначе принимаем.
s
Для случая двусторонней гипотезы
H 0 : a  a0
H1 : a  a1  a0 ,
объединяя два предыдущих случая, получим уравнение   P  t  c  .
По таблице 5 критических точек распределения Стьюдента для случая двусторонней
x в  a0
критической области находим c  c  ; n  1 . Если t  n  c , то гипотезу H 0
s
отвергаем, иначе принимаем.
Как мы уже отмечали ранее, с ростом n распределение Стьюдента стремится к
нормальному распределению и при достаточно больших n значение c следует находить
1 1
из уравнений   c    для односторонних гипотез и   c   для двусторонней
2 2
гипотезы, которые мы получили в пункте I при рассмотрения случая с известной
дисперсией.
Пример 2. Из генеральной совокупности, распределенной по нормальному закону,
извлечена выборка объема n  25 и по ней найдены выборочная средняя xв  102,5
и исправленное среднеквадратичное отклонение s  7,5 . Требуется при уровне
значимости   0,02 проверить основную гипотезу H 0 : a  a0  100 при
конкурирующей гипотезе H1 : a  a1  a0 .

47
По уровню значимости   0,02 и числу степеней свободы n  1  24 по таблице 5
критических точек распределения Стьюдента для двусторонней критической области
xв  a0 102,5  100
находим c  2, 49 . Далее вычислим t  n  5  1, 67 .
s 7,5

Так как t  1,67  c  2, 49 , то гипотезу H 0 принимаем, то есть отличие xв  102,5 от


гипотетического значения a  100 не существенно для данного уровня значимости.

III. Сравнение математических ожиданий двух случайных величин, дисперсии


которых известны.
Пусть даны две случайные величины  и  , распределенные нормально с параметрами
a1 ,  1 и a2 ,  2 соответственно. Будем считать, что их дисперсии  12 и  22 известны, а
относительно математических ожиданий имеются гипотезы
H 0 : a1  a2
H1 : a1  a2
По выборкам  1  1 , 2 ,..., n  и  2  1 ,2 ,...,m  объемов n и m соответственно,
находим выборочные средние
1 n 1 m
x в   i и y в  i .
n i 1 m i 1
Как и в предыдущих случаях рассмотрим нормированную случайную величину

z
x
  в .
 y в  M xв  y в

Dx  y  в в

При гипотезе H имеем M  x  y   M x


0 в в в  M y в  a1  a2  0 ,

12  22 xв  y в
 
D xв  y в  Dx в  D y в 
n

m
, то есть z 
 12  22
.

n m
По центральной предельной теореме случайная величина z распределена асимптотически
нормально с параметрами a  0 и   1 . Так как альтернативная гипотеза двусторонняя,

то   P  z  c | H 0   P z  c   P z  c      c      c   1  2  c 
1 1
2 2
и для нахождения критической точки c приходим к уже известному нам уравнению
1
  c  
.
2
Зная уровень значимости  , находим по таблице 2 значений функции   x  значение c .
Теперь, если z  c , то гипотезу H 0 принимаем, если же z  c , то гипотезу H 0
отвергаем.
В случае, когда конкурирующая гипотеза односторонняя (правая или левая)
H 0 : a1  a2 или H 0 : a1  a2
H1 : a1  a2 H1 : a1  a2 ,
48
1
то значение c находится из уравнения   c    и гипотезу H 0 принимаем при
2
z  c для правой односторонней гипотезы и принимаем при z  c для левой
односторонней гипотезы.
Пример 3. Из двух генеральных совокупностей, распределенных нормально с
дисперсиями 12  80 и  22  100 соответственно, по двум независимым выборкам
объема n  40 и m  50 найдены выборочные средние xв  130 и y в  140 . При
уровне значимости   0,01 требуется проверить гипотезы
H 0 : a1  a2
H1 : a1  a2 .

xв  y в 130  140 10
Вычислим z     5 .
 12  22 80 100

4

mn 40 50
1   0,99
Из уравнения   c     0, 495 по таблице 2 значений функции   x  находим
2 2
c  2,58 . Так как z  5  c  2,58 , то гипотезу H 0 отвергаем, то есть математические
ожидания разнятся значительно.

IV. Проверка гипотез о значении дисперсии  2 .


Пусть при уровне значимости  требуется проверить гипотезы
H 0 :  2   02
H1 :  2  12   02 (правая односторонняя).
Согласно теореме Неймана-Пирсона составим отношение правдоподобия
n n

p1    1   2 2 i a 
1 2

, где p j      e j i 1 , j  0,1 .
p0    
 j 2 

1 1 1 
n

p1     0   2  12  02 


n
i  a 2
В данном случае   e i 1
.
p0     1 
Критическая область S определяется при некотором c из равенства
 p  
 

P 1  c | H0    .
 p0  
 

1 1 1 
n

p1     0   2  12  02 


n
i  a 2
Рассмотрим неравенство   e i 1
c
p0     1 
n

   a :
2
и разрешим его относительно i
i 1

 1 1 1  n 2  1   12   02
n
n    n 
exp    2  2   i  a       c ,    a  ln  1   c 
2

 2   1  0  i 1   0  2 02 12   0  
i
i 1

49
2 02 12   1  
n
n
и так как 1   0 , то    a ln    c  .
2
 2
i
 1   02   0  
i 1
 

2 02 12   1  
n

Обозначим через c1  2 ln    c  . Таким образом


 1   02   0  
 

 p1  
 
 n 
  P  c | H 0   P  i  a   c1 | H 0  .
2

 p0  
 
  i 1 

Поскольку математическое ожидание a неизвестно, то заменим его несмещенной

 
n n

  i  a    i  x в
2 2
точечной оценкой x в . Тогда  nDв . Перейдем к нормированным
i 1 i 1

i  x в D
случайным величинам i  , распределенным нормально. Тогда Dв  2в и
 
 nDв c1   c 
  P nDв  c1 | H 0   P   2
 P nDв  12  .
 0  0 
2
0 
Введем случайную величину (при гипотезе H 0 )

 n  1 s 2
2
nDв n
 1 n 
2    nDв   i2    i  .
 02  02 i 1  n i 1 


В n -мерном пространстве выборок 1 , 2 ,...,  n введем новую ортогональную систему 
1 n  n n
1, i  m
координат 1 ,2 ,...,n  так, что 1  i j 
 ,    jii и   jm   im   .
0, i  m
ji
n i 1 i 1 j 1

При этом случайные величины  j также нормированы и распределены нормально.


n n
Ранее при построении доверительных интервалов мы показали, что     
j 1
2
j
i 1
i
2
.

n n
Тогда  2   2j  12   2j имеет распределение Пирсона или  2 с n  1 степенью
j 1 j 2

свободы. Таким образом

  P  2  c  , где c 
c1
.
 02
По таблице 6 критических точек распределения  2 находим c  c  ; n  1 . Теперь, если

для найденного значения  



2 n  1 s 2
 c , то гипотезу H 0 отвергаем, иначе принимаем.
2
0
Если альтернативная гипотеза левая односторонняя
H 0 :  2   02
H1 :  2  12   02
то для нахождения критической области получаем равенство
50
 p1  
 
 n   c 
  P  c | H 0   P  i  a   c1 | H 0   P nDв  12   P  2  c .
2
 
 p0  
 
  i 1   0 
По той же таблице 6 критических точек распределения  2 находим c  c 1   ; n  1 и

тогда, если для найденного значения  2 


 n  1 s 2  c , то основную гипотезу H 0

 02
отвергаем, иначе принимаем.
В случае двусторонней гипотезы
H 0 :  2   02
H1 :  2  12   02 ,
объединяя два предыдущих случая, по таблице 6 критических точек распределения  2
    
находим две критические точки c   c  ; n  1 и c   c 1  ; n  1 и тогда, если
2   2 
c    2  c  , то гипотезу H 0 принимаем, иначе отвергаем.

Пример 4. Из генеральной совокупности, распределенной нормально, извлечена выборка


объема n  30 и по ней найдена исправленная выборочная дисперсия s 2  12,5 .
Требуется при уровне значимости   0,01 проверить основную гипотезу
H 0 :  2   02  14 при конкурирующей гипотезе H1 :  2  12  14 .

Вычислим сначала  
2  n  1 s 2

29 12,5
 25,9 . Учитывая, что гипотеза левая
0
2
14
односторонняя по таблице 6 критических точек распределения  2 находим
c  c 1   ; n  1  c  0,99;29   14,3 . Так как  2  25,9  c  14,3 , то гипотезу H 0
принимаем, то есть различие между найденной исправленной выборочной дисперсией s 2
и гипотетическим значением  02 не значительно.

§ 11.2. Проверка гипотез о значении вероятности p биномиального распределения.

Пусть случайная величина  имеет биномиальное распределение


P   k  Cnk p k q nk , q  1  p , при этом M   np и D  npq .

I. Проверка гипотез о значении вероятности p появления события в одном


испытании.
Рассмотрим сначала случай, когда альтернативная гипотеза правая односторонняя
H 0 : p  p0
H1 : p  p1  p0
Отношение правдоподобия для биномиального распределения имеет вид
p1  x  Cnx p1x 1  p1   p 1  p0  
n x n x
 1  p1 
 x x     1  .
p0  x  Cn p0 1  p0  n x
 1  p0  p
 0 1  p 
1 

51
 p  x
 

Критическая область S определяется при некотором c из условия P  1  c | H0    .
 p0  x 
 

p  x   1  p1   p 1  p0  
n x

Рассмотрим неравенство 1     1   c и разрешим его


p0  x   1  p0   p0 1  p1  
относительно x :
 p1 1  p0  
x
 1  p0 
n
p1 1  p0    1  p n 
   c   ; x ln  ln c  0
 
p
 0 1  p 
1   1  p1  p0 1  p1  
 
1  p1  

p1 1  p0 p 1  p0 
Так как p1  p0 , то   1 и ln 1  0 , откуда
p0 1  p1 p0 1  p1 
  1  p n   p 1  p   1
x  ln c  0
   ln
1 0
 .
  1  p1    p0 1  p1  

 p  x
 

Таким образом P  1  c | H 0   P  x  c1 | H 0    ,
 p0  x 
 

  1  p n   p 1  p   1
где c1  ln c  0
   ln
1 0
 .
  1  p1    p0 1  p1  
x  Mx x  np
Введем случайную величину    , которая по теореме Муавра-Лапласа
Dx npq
x
асимптотически нормальна с параметрами a  0,   1. Если задается частота  
n
x  np  p
наступления события в n независимых испытаниях, то     n.
npq p 1  p 

 x  np0 c1  np0  
Тогда   P  x  c1 | H 0   P     P   c  ,

 np0 1  p0  np 0 1  p 
0 
c1  np0
где c  . Так как
np0 1  p0 
 t2  t2 c t2
1  1  1  1
P   c   e 2
dt   e 2 dt  e 2
dt     c  ,
2 c 2 0 2 0
2
1
то для нахождения c получаем уже известное нам уравнение   c    .
2
x  np0   p0
Теперь, если     n  c , то гипотезу H 0 отвергаем, иначе
np0 1  p0  p0 1  p0 
принимаем.
Если задано гипотетическое значение вероятности p1 , то можно найти мощность
построенного правостороннего критерия, Для этого найдем сначала

52
 p1  x 
 
  x  np1 c1  np1 
  P  c | H1   P  x  c1 | H1  P     P   c  , где

 p0  x  
 
 np1 1  p1  np 1 1  p 
1 

c1  np1 p0 1  p0  c1  np0 p0 1  p0  n  p0  p1 
c      
np1 1  p1  p1 1  p1  np0 1  p0  p1 1  p1  np0 1  p0 

p0 1  p0  p0  p1
  c   и   n.
p1 1  p1  p1 1  p1 
c t2 0 t2 c t2
Учитывая, что P   c      c  получим
1  1  1  1
2 e

2 dt 
2 e

2 dt 
2 e
0
2 dt 
2
 p0 1  p0  
     c     
1 1
 c    и мощность построенного критерия равна
2 2  p1 1  p1  
 
1  p0 1  p0  
W  1  
  c    .
2  p1 1  p1  
 
Если же заданы уровень значимости  и мощность W (или ошибка II-го рода  ), то
можно найти минимальный объем выборки n , обеспечивающий эти величины.

Действительно, из уравнения   c     находим c , а из уравнения   c    


1 1
2 2
p0 1  p0  p0  p1
находим c . Далее, учитывая связь между ними c   c  n,
p1 1  p1  p1 1  p1 

получим  p0  p1  n  p1 1  p1   c   p0 1  p0   c , откуда
2
 p1 1  p1   c  p0 1  p0   c 
n  .
 p0  p1 
 
Проведенные рассуждения и полученные формулы аналогичны тем, которые были
получены для нормального распределения при проверке гипотез о значении
математического ожидания a при известной дисперсии  2 .
Аналогично рассматривается случай левосторонней альтернативной гипотезы
H 0 : p  p0
H1 : p  p1  p0
p 1 1  p0  p 1 1  p0 
С учетом того, что  1 и ln  0 получим
p0 1  p1  p0 1  p1 

 p1  x    1  p n   p 1  p   1

  P
 p0  x 





 
 c | H 0   P x  c1 | H 0 , где c1   ln c  0
   ln
1 0
 .
  1  p1    p0 1  p1  

53
 c1  np0 
Далее имеем   P x  c1 | H 0  P 


 x  np0
np 1  p 

np 1 
p 

  P   c  , где

 0 0 0 0 

c1  np0
c  . Учитывая, что
np0 1  p0 
 c t2 0 t2  c t2
1  1  1  1 1
P   c   e 2 dt  e 2 dt  e 2 dt     c      c  ,
2  2  2 0
2 2
1
для определения c получаем тоже уравнение   c    .
2
x  np0   p0
Если теперь     n  c , то гипотезу H 0 отвергаем, иначе
np0 1  p0  p0 1  p0 
принимаем.
По заданной гипотетической вероятности p1 найдем мощность построенного
левостороннего критерия
 p1  x 
  P

 p0  x 




 c | H1   P x  c1 | H1  P   c  , где



c1  np1 p0 1  p0  c1  np0 p0 1  p0  n  p0  p1 
c      
np1 1  p1  p1 1  p1  np0 1  p0  p1 1  p1  np0 1  p0 

p0 1  p0  p0  p1
  c   и   n.
p1 1  p1  p1 1  p1 
 t2  t2 0 t2
Учитывая, что P   c  
1  1  1 

2 e
 c
2
dt  
2 0
e 2 dt 
2 e
 c
2
dt 

 c t2

   c      c  получим
1 1  1 1
 
2 2 e
0
2 dt 
2 2
 p0 1  p0  
     c     
1 1
 c    и мощность построенного критерия равна
2 2  p1 1  p1  
 
1   p0 1  p0 
W  1    c    .

p1 1  p1 
2  
 
Если же заданы ошибки I-го и II-го рода  и  , то найдя c и c соответственно из уравнений

  и   c     и учитывая связь между ними


1 1
  c  
2 2
p0 1  p0  p0  p1
c   c  n , найдем минимальный объем выборки, обеспечивающий
p1 1  p1  p1 1  p1 