Вы находитесь на странице: 1из 87

Министерство образования и науки Украины

Одесский национальный университет имени И.И. Мечникова

Институт математики, экономики и механики

Кафедра методов математической физики

Ю.С. Процеров

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

Учебно-методическое пособие

Одесса – 2016
Печатается по решению Научно-методического совета ОНУ имени И.И. Мечникова
(протокол № 1 от 20 октября 2016 года).

Составитель: Ю.С. Процеров, канд. физ. – мат. наук, доцент кафедры методов
математической физики

Рецензенты: Н.Д. Вайсфельд, докт. физ-мат. наук, профессор, заведующая


кафедрой Методов математической физики

В.Г. Попов, докт. физ-мат. наук, профессор, заведующий


кафедрой Высшей математики Национального университета «Одесская
морская академия»

А.В. Усов, докт. техн. наук, профессор, заведующий


кафедрой Высшей математики и моделирования систем
Одесского национального политехнического университета,
лауреат Государственной премии Украины

Данное учебно-методическое пособие ставит своей целью оказать помощь студентам


III-го курса направления 6.040301 «Прикладная математика» в изучении курса
«Математическая статистика». В нем подробно и систематично изложены основные темы
программы курса:
статистическое распределение выборки, эмпирическая функция распределения и
эмпирические моменты, точечные оценки параметров распределений и методы их
нахождения, интервальные оценки параметров распределений, статистическая проверка
гипотез о значении параметров распределений и о виде закона распределения, теория
корреляции.
Изложение материала сопровождается многочисленными примерами. Также приведено
большое число заданий, предназначенных для самостоятельной работы студентов. Все
задания сопровождены ответами.

2
Оглавление
§ 1. Основные задачи математической статистики ……………………………………… .4
§ 2. Статистическое распределение выборки. Полигон и гистограмма частот ………………….5
§ 3. Эмпирическая функция распределения ………………………………………………………..7
§ 4. Эмпирические моменты ………………………………………………………………………. .8
§ 5. Точечные оценки параметров распределений ………………………………………………..10
§ 6. Основные виды распределений случайных величин и их числовые
характеристики………………………………………………………………………………….12
§ 7. Метод моментов нахождения точечных оценок параметров распределений ………………14
§ 8. Метод максимального правдоподобия нахождения точечных оценок параметров
распределений ………………………………………………………………… ……………….17
§ 9. Теорема о свойствах логарифмической функции правдоподобия. Неравенство
Рао-Крамера …………………………………………………………………………….22
§ 10. Интервальные оценки параметров распределений …………………………………28
§ 10.1. Построение доверительных интервалов для параметров нормального
распределения ……………………………………………………………………….29
§ 10.2. Построение доверительного интервала для параметра  распределения
Пуассона ……………………………………………………………………………..33
§ 10.3. Построение доверительного интервала для вероятности p биномиального
распределения …………………………………………........................................….34
§ 11. Статистическая проверка гипотез о значениях параметров распределений ………………37
§ 11.1. Проверка гипотез о значении параметров нормального распределения ………...40
§ 11.2. Проверка гипотез о значении вероятности p биномиального распределения …52
§ 12. Статистическая проверка гипотез о виде закона распределения …………………..59
§ 12.1. Критерий Колмогорова ………………………………………………………….......59
§ 12.2. Критерий Пирсона или  2 ………………………………………………………….61
§ 13. Элементы теории корреляции …………………………………………………….…..73
x2
1 2
Таблица 1 значений функции   x   e . ………………………..………………….79
2
x t2
1 
Таблица 2 значений функции   x    2 dt. …………………………….………..80
e
2 0
Таблица 3 значений t  t  , n  ………………………………………………….………..81
Таблица 4 значений q  q  , n  ……………………………………………………….……81
Таблица 5 критических точек распределения Стьюдента ………………………….…….82
Таблица 6 критических точек распределения  2 ………………………………………..83
Таблица 7 значений функции распределения Колмогорова

K  x   1  2  1 e 2 m x ……………………………………………………..84
m 2 2

m 1

Ответы ……………………………………………………………………………………85
Литература ……………………………………………………………………………....87

3
§ 1. Основные задачи математической статистики.

Теория вероятностей занимается изучением математических моделей случайных


явлений. Имея подходящую математическую модель какого-либо случайного явления, мы
можем вычислять вероятности тех или иных событий; по вероятностям одних случайных
событий находить вероятности других, с ними связанных; по числовым характеристикам
и функциям распределения одних случайных величин находить функции распределения и
числовые характеристики других. Но естественно возникает вопрос: как найти эти
исходные вероятности, функции распределения и числовые характеристики? Это как раз и
является предметом исследования другой науки о массовых случайных явлениях, которая
получила название математической статистики. Установление закономерностей, которым
подчинены массовые случайные явления, основано на изучении методами теории
вероятности статистических данных – результатов наблюдений или экспериментов.
Как наука с оформившейся тематикой и методами исследования математическая
статистика возникла в конце XIX, начале XX веков, хотя отдельные задачи, как, например,
сбор и обработка статистических сведений о народонаселении, рассматривались еще в
древнем Китае, Египте, Римской империи.
Задачи математической статистики являются в определенной мере обратными к
задачам теории вероятности. Если в теории вероятностей мы считаем заданной модель
явления и, исходя из нее, производим расчет возможного реального течения этого
явления, то в математической статистике мы исходим из известных реализаций каких-
либо случайных событий, то есть из статистических данных, и уже по ним подбираем
подходящую теоретико-вероятностную модель.
Исходным материалом для статистического исследования реального явления служит
набор результатов наблюдений над ним или же результатов специально поставленных
испытаний. При этом возникают следующие основные задачи.
Первая задача математической статистики состоит в определении числа необходимых
данных и разработке способа их сбора.
Пусть, например, требуется изучить совокупность однородных объектов относительно
некоторого качественного или количественного признака. Так, в партии некоторых
изделий качественным признаком может служить их стандартность, а количественным –
контролируемый размер изделия. Изучаемую совокупность объектов принято называть
генеральной совокупностью. Из нее некоторым способом отбирают для исследования n
объектов. Эти отобранные объекты принято называть выборочной совокупностью или
выборкой объема n . Выборка может быть повторной, когда отобранный объект после
изучения возвращается в генеральную совокупность, бесповторной – когда отобранный
объект в генеральную совокупность не возвращается. При этом способы самого отбора
могут быть различными. От сплошной выборки, когда исследуются все объекты, до
разбиения генеральной совокупности на части и отбора одного или нескольких объектов
из каждой части. Для того, чтобы по данной выборке можно было достаточно уверенно
судить о всей генеральной совокупности, необходимо, чтобы выборка была
репрезентативной, то есть представительной. В силу закона больших чисел можно
утверждать, что выборка будет репрезентативной, если ее осуществлять случайно и ее
объем n не должен быть мал.
Вторая задача математической статистики – разработка методов анализа
статистических данных в зависимости от целей исследования. Сюда относятся:
4
- оценивание вероятностей некоторых событий исходя из статистических данных;
- определение, хотя бы и приближенно, закона распределения исследуемой случайной
величины;
- нахождение неизвестных параметров закона распределения случайной величины, тип
которого известен из других соображений;
Например, во многих случаях можно считать, что некоторая случайная величина
распределена по нормальному закону, но его параметры a и  неизвестны.
- статистическая проверка гипотез о законе распределения случайной величины или его
параметрах;
Например, на основании некоторых соображений мы выдвигаем гипотезу о конкретном
законе распределения или о значении его параметра, если этот закон известен, и на
основании имеющихся статистических данных мы должны подтвердить или опровергнуть
выдвинутую гипотезу.
- нахождение корреляционной зависимости между двумя или большим числом случайных
величин.
§ 2. Статистическое распределение выборки. Полигон и гистограмма частот.
Пусть имеется случайная величина  , заданная на вероятностном пространстве
, F , P . Пусть в результате n наблюдений (экспериментов) получено n ее значений
1 , 2 ,..., n - выборка объема n из генеральной совокупности всех возможных значений
случайной величины  . Значения  i в выборке могут повторятся. Обозначим через
x1 , x2 ,..., xk их различные значения (их принято называть вариантами), расположенные в
порядке возрастания, а через n1 , n2 ,..., nk частоты этих значений, то есть варианта x1
встретилась n1 раз, варианта x2 - n2 раза и так далее. При этом n1  n2  ...  nk  n . Если
теперь каждой варианте xi поставить в соответствие ее частоту ni , то получим так
называемое статистическое распределение выборки
xi x1 x2 … xk
ni n1 n2 … nk
где n1  n2  ...  nk  n.
ni
Наряду с частотами ni рассматривают еще относительные частоты i  . В этом случае
n
статистическое распределение выборки записывают в виде
xi x1 x2 … xk
i 1 2 … k
где 1  2  ...  k  1.
Статистическое распределение выборки также задают в виде последовательности
интервалов и соответствующих им частот, то есть сумму частот вариант, попавших в этот
интервал
 xi 1; xi   x0 ; x1   x1; x2  …  xk 1; xk 
ni n1 n2 … nk
где n1  n2  ...  nk  n.

5
Здесь также вместо частот ni могут стоять относительные частоты i .
Для наглядного изображения данных выборки используют графическую иллюстрацию
в виде полигонов и гистограмм частот. По статистическому распределению выборки
можно построить полигон частот или полигон относительных частот, то есть ломаную с
вершинами в точках  xi ; ni  или в точках  xi ; i  соответственно. На рис. 1 изображен
полигон частот следующего распределения выборки объема n  50

xi 2 3 5 6
ni 10 15 5 20

В случае, когда статистическое распределение выборки задается в виде интервалов


одинаковой длины h , то строят гистограмму частот или гистограмму относительных
частот. Гистограмма частот это ступенчатая фигура, состоящая из прямоугольников с
n
основаниями длиной h и высотой i . Площадь i -го прямоугольника будет равна частоте
h
n
h  i  ni , а площадь всей гистограммы равна n1  n2  ...  nk  n , то есть объему выборки.
h
При построении гистограмм относительных частот высоты прямоугольников берут
i
равными , тогда площадь одного прямоугольника равна относительной частоте i , а
h
площадь всей гистограммы равна единице.
Например, построим гистограмму относительных частот для следующего распределения
выборки объема n  50

 xi 1; xi   0; 2   2; 4   4;6   6;8


ni 5 15 10 20

Найдем сначала относительные частоты 1  0,1; 2  0,3; 3  0, 2; 4  0, 4 , а затем


i
высоты прямоугольников : 0, 05; 0,15; 0,1; 0, 2 . На рис. 2
h
изображена требуемая гистограмма относительных частот

6
§ 3. Эмпирическая функция распределения.

В курсе теории вероятности при изучении свойств случайных величин основную роль
играют их функции распределения F  x   P  :     x , которые в статистике принято
называть теоретическими функциями распределения.
Пусть дана выборка объема n

xi x1 x2 … xk
ni n1 n2 … nk
где n1  n2  ...  nk  n.
Эмпирической функцией распределения или функцией распределения выборки
n
называют функцию Fn  x   x , где nx число вариант, меньших x .
n
Она обладает теми же свойствами, что и теоретическая функция распределения, а именно:
ее значения лежат от 0 до 1; она не убывает; непрерывна слева; Fn  x   0 при x  x1 и
Fn  x   1 при x  xk .
Отличие в том, что F  x  это вероятность тех событий, для которых     x , а Fn  x 
есть сумма относительных частот тех вариант xi , которые меньше x
0, x  x1
n
 1 , x1  x  x2
n
 n n
Fn  x    1  2 , x2  x  x3
n n


1, x  xk

ni
Ее графиком будет ступенчатая кусочно-постоянная кривая со скачками в точках xi .
n
Имеет место следующая
Теорема Гливенко. При увеличении объема выборки n эмпирическая функция
распределения Fn  x  сходится по вероятности к теоретической функции
распределения F  x 


lim P sup Fn  x   F  x     1.
n  x 

Пример. По выборке объема n  50 xi 1 4 6
ni 10 15 25

найти эмпирическую функцию распределения и построить ее график.

7
0, x  1
0, 2, 1  x  4

Эмпирическая функция распределения имеет вид Fn  x    ,
 0,5, 4  x  6
1, x  6
а ее график приведен на рис. 3.

Если выборка задана в виде интервалов, то при нахождении эмпирической функции


x x
распределения в качестве xi берут середины интервалов xi  i 1 i .
2

§ 4. Эмпирические моменты.
В курсе теории вероятности для случайной величины  были введены следующие
моменты

 m  M  m
  x m
dF  x  - начальный момент m - го порядка, в частности 1  M  -


математическое ожидание случайной величины, и



m  M   M      x  M  dF  x  - центральный момент m - го порядка, в
m m



частности 2  M   M    D - дисперсия случайной величины.


2

Введем эмпирические или выборочные моменты



 m  x
m
dFn  x  - начальный момент m - го порядка и


  x   dFn  x  - центральный момент m - го порядка.


 m
 

m 1


Так как эмпирическая функция распределения Fn  x  кусочно-постоянная и терпит


ni
скачки в точках xi , то по свойству интеграла Стилтьеса
n
k
n 1 k 1 n
 m   xim i   xim ni   im .
i 1 n n i 1 n i 1

8
1 k 1 n
Начальный эмпирический момент первого порядка  1  
n i 1
xi ni   i  xв
n i 1
называют выборочным средним. Выборочное среднее xв есть среднее арифметическое
значений выборки.
Аналогично вычисляется

     
k m n 1 k 1 n
m   xi  1   xi  xв ni   i  xв
m m
i
.
i 1 n n i 1 n i 1
Центральный эмпирический момент второго порядка
1 k
 1 n

2   xi  xв ni   i  xв  Dв  
2 2

n i 1 n i 1
называют выборочной дисперсией. Выборочная дисперсия Dв есть среднеквадратичное
отклонение значений выборки от их среднего значения x в .
Для вычисления выборочной дисперсии удобно пользоваться следующей формулой
1 k
 1 k
  1 k

1 k k
2 1
Dв   xi  xв ni   xi2  2 xi xв  xв ni   xi2 ni  2 x в  xi ni  x в  ni 
2 2

n i 1 n i 1 n i 1 n i 1 n i 1
1 k 2 1 k 2
 
2 2 2
 x n
i i  2 x в  x в  xi ni  x в ,
n i 1 n i 1
то есть выборочная дисперсия равна среднему из квадратов минус квадрат среднего.
Если выборка задана в виде интервалов, то при вычислении выборочного среднего и
x x
выборочной дисперсии в качестве xi берут середины интервалов xi  i 1 i .
2
Пример 1. По выборке объема n  20 x -2 1 3 6 i

ni 3 8 5 4

найти выборочное среднее и выборочную дисперсию.


1 41
Вычислим xв   2  3  1 8  3  5  6  4    2, 05
20 20
1 209
Dв   4  3  1 8  9  5  36  4   2, 052   2, 052  10, 45  4, 2025  6, 2475.
20 20
Во многих задачах варианты xi являются довольно большими числами, и работать с
ними по полученным формулам не очень удобно. В этом случае используется метод
условных вариант. Он заключается в том, что от вариант xi при помощи линейной
замены переходят к условным вариантам ui , которые уже малы. Например, если варианты
xi  C
xi равноотстоящие с шагом h : xi 1  xi  h , то положим ui  , где C некоторое
h
значение из середины выборки (его обычно берут с наибольшей частотой),
Тогда xв  hui  C и
1 k 1 k 1 k 1 k
xв   i i n
n i 1
x n 
i 1
 i  i
hu  C n  h  ii
n i 1
u n  C   ni  h  u в  C
n i 1
1 k
  1 k
   
k
2 1
 xi  xв  i  ui  u в
2 2 2
Dx  ni  hu  C  hu в  C ni  h  ni  h 2 Du .
n i 1 n i 1 n i 1
9
Пример 2. По выборке объема n  80

 xi 1; xi   10;0  0;10  10; 20   20;30   30; 40 


ni 10 15 25 20 10

методом условных вариант найти выборочное среднее и выборочную дисперсию.


x x
Отнесем частоты ni к серединам интервалов xi  i 1 i
2
 -5 5 15 25 35
xi
ni 10 15 25 20 10
xi  15
и перейдем к условным вариантам ui  . Тогда
10
ui -2 -1 0 1 2
ni 10 15 25 20 10

1 5
Вычислим u в   2 10  115  0  25  1 20  2 10    0, 0625 и
80 80
1 115
Du   4 10  115  0  25  1 20  4 10   0, 06252   0, 06252  1, 4375  0, 0039  1, 4336
80 80
Тогда xв  10  u в  15  0,625  15  15,625 и Dв  10  Du  143,36 .
2

§ 5. Точечные оценки параметров распределений.


Пусть для случайной величины  , заданной на вероятностном пространстве , F , P ,
из каких-либо соображений известен закон ее распределения, но не известны параметры
этого закона. Поставим задачу как по выборке найти приближенные значения этих
параметров.
Пусть   1 , 2 ,..., n  выборка объема n из генеральной совокупности, а 
неизвестный параметр известного закона распределения F  x  . Нашей задачей является
построение приближенной формулы
     h    h 1 , 2 ,..., n  , (1)
где h   функция от выборки, называемая статистикой, а приближенное значение
параметра    h   называют точечной оценкой параметра  . При этом предполагается,
что функция h   не должна зависеть от оцениваемого параметра  и от других
параметров функции распределения F  x  . Кроме того функция h   должна быть
одной и той же для всех распределений некоторого семейства F  x  . Если изменяется
объем выборки, то будем обозначать   n  hn   , а последовательность hn   будем
называть последовательностью порядковых статистик.

10
Следует отметить, что для каждой выборки   1 , 2 ,..., n  значение    h   будет
свое, а потому   , как функция выборки, будет случайной величиной.
Здесь сразу возникает вопрос: как оценить точность приближенной формулы (1)? Будем
оценивать величину погрешности при замене  на   среднеквадратичной погрешностью
2
M     , то есть дисперсией оценки D  - величиной рассеяния   относительно
точного значения  . Среди оценок с одной и той же дисперсией D  минимальную
величину рассевания относительно  имеют оценки, для которых M    .

Определение. Точечная оценка   называется несмещенной оценкой параметра  , если


M    .
Требование несмещенности оценки есть условие отсутствия «систематической
ошибки». Его смысл состоит в том, что при многократном использовании формулы (1)
для различных выборок среднее значение ошибки при замене  на   равно нулю.
Определение. Точечная оценка  n параметра  называется асимптотически
несмещенной, если lim M n   .
n

Покажем, что выборочное среднее x в является несмещенной точечной оценкой для


математического ожидания M  . Рассмотрим
1 n  1 n 1 n 1
M x в  M   i    M i   M    n  M   M  ,
 n i 1  n i 1 n i 1 n
так как  i есть значение случайной величины  , полученное в i -том наблюдении, а
значит все они одинаково распределены и M i  M  .
Покажем теперь, что выборочная дисперсия Dв не является несмещенной оценкой для
дисперсии D :
1 n  1 n

MDв  M   i  xв  
   M i  x в  1
   
2 2 2 2
  n  M i  x в  M i  x в
 n i 1  n i 1 n

 
Так как M i  xв  M i  M xв  M   M   0 , то

      M   x    
2 2 2
D i  x в  M i  x в i в  M i  x в и

 
 1 n 
    1
 n 
1 n 
MDв  D i  x в  D  i    j   D 1   i    j 
n j 1 
 n j 1  
 j i 
поскольку в последней сумме стоят независимые слагаемые, то
2 2
 1 1 n
 1 n 1 n 2  2n  1  n  1 n 1
 1   Di  2
 n n

j 1
D j   1
 n
  D 
n 2
D 
n 2
D 
n
D ,
j i

учитывая, что все  i одинаково распределены и Di  D .

11
n 1
Таким образом, MDв  D  D и выборочная дисперсия есть смещенная оценка для
n
дисперсии D . Однако эта оценка является асимптотически несмещенной, так как
n 1
lim MDв  lim D  D .
n n n

Несложно видоизменить выборочную дисперсию так, чтобы измененная оценка стала


уже несмещенной. Для этого введем исправленную выборочную дисперсию
n
s2  Dв
n 1
n n n 1
Тогда Ms 2  MDв   D  D и эта оценка является уже несмещенной.
n 1 n 1 n
Обычно при вычислениях, если объем n выборки невелик  n  50  , то в качестве
оценки для дисперсии берут исправленную выборочную дисперсию s 2 , а при больших
объемах выборки берут выборочную дисперсию Dв .

Определение. Оценка  n параметра  называется состоятельной, если она сходится по


вероятности к параметру  при n   :
 
lim P n      1.
n

Определение. Оценка  n параметра  называется эффективной, если ее дисперсия с


ростом n уменьшается:
Dn1  Dn .

Покажем, что выборочное среднее x в является состоятельной и эффективной оценкой


для математического ожидания M  . Найдем
1 n  1 n 1 D
Dx в  D   i   2  Di  2  n  D  .
 n i 1  n i 1 n n
Состоятельность оценки следует из II-го неравенства Чебышева

  
P xв  M     P xв  M xв    1  Dxв
 2
 1
D
n 2
1 n  .

Эффективность оценки вытекает из неравенства


 n 1 D D  n
Dxв    Dxв .
n 1 n

§ 6. Основные виды распределений случайных величин и их числовые


характеристики

В дальнейшем мы неоднократно будем пользоваться различными законами


распределения случайных величин и их числовыми характеристиками, изученными ранее
в курсе «Теории вероятности». Поэтому приведем здесь их основные характеристики.

12
Дискретные распределения.
1) Распределение Пуассона.

k
P   k  e  ,   0, k  0,1, 2,... ; M    , D  .
k!
2) Биномиальное распределение.
P   k  Cnk p k q nk , k  0,1, 2,..., n ; M   np, D  npq.

3) Геометрическое распределение.
1 q
P   k  q k 1 p, k  1, 2,... ; M  , D  2 .
p p
Абсолютно-непрерывные распределения.
1) Нормальное распределение или распределение Гаусса.
 x  a 2 t2
 xa
x
1  1 1 
p  x   2
, F  x       , где   x    2 dt
2
e e
 2 2    2 0

M   a, D   2 .

2) Равномерное на промежутке  a; b  распределение.

0, x  a
 1 xa
 , x   a; b  
p  x    b  a , F  x    ,a xb
0, x   a; b   b  a

1, x  b

b  a  .
2
ab
M  , D 
2 12
3) Показательное распределение.

 e  x , x  0 1  e  x , x  0
p  x    , F  x    , 0
0, x  0 0, x  0
1 1
M  , D  .
 2
4) Гамма распределение
    1   x
 x e ,x0 
p  x       ,      x 1e  x dx,   0,   0
0, x  0 0

 
M  , D  2 .
 

13
5) Распределение Пирсона или  2 с n степенями свободы.

Пусть 1 , 2 ,..., n нормированные нормально распределенные случайные величины


 a  0,  1 . Тогда случайная величина
n
 2   i2
i 1

имеет распределение Пирсона или  2 с n степенями свободы. Его плотность


 1
 n n n 1  x
  
p 2  x   kn  x    2 2    x 2 e 2 , x  0, M  2  n, D  2  2n.
 2

0, x  0
С этим распределением тесно связаны следующие распределения

 
n
 
i 1
i
2
с плотностью p  x   2 xkn x 2 ,

1 2 1 n 2
   i с плотностью p  x   nkn  nx  ,
n n i 1

1
n

1 n 2

n i 1
i с плотностью p  x   2nxkn nx 2 .  
6) Распределение Стьюдента с n степенями свободы.
Пусть  и 1 , 2 ,..., n нормированные нормально распределенные случайные величины
 a  0,  1 . Тогда случайная величина

t
1 n 2
 i
n i 1
имеет распределение Стьюдента с n степенями свободы. Его плотность

 n 1  n 1
   x 2  2
    1
1 2 n
pt  x     , Mt  0  n  1 , Dt   n  2 .
n  n   n  n2
 
2
С ростом n распределения Пирсона и Стьюдента стремятся к нормальному
распределению.

§ 7. Метод моментов нахождения точечных оценок параметров распределений.


Предположим, что известная функция распределения случайной величины  зависит
от m неизвестных параметров 1 ,2 ,...,m : F  x,1 ,2 ,...,m  . Запишем для нее выражения
для теоретических моментов

14
 
k   x k dF  x,1 ,..., m  и k    x  M  dF  x,1 ,..., m  ,
k

 

которые будут содержать эти неизвестные параметры. С другой стороны по выборке


  1 , 2 ,..., n  подсчитаем эмпирические моменты
1 n k

1 n
  
k
 k   i и  k

 i  x в ,
n i 1 n i 1
которые будут числовыми значениями. Приравнивая соответствующие теоретические и
эмпирические моменты, получим систему уравнений для определения параметров
1 ,2 ,...,m . Ее решение 1 ,2 ,...,m и берем в качестве точечных оценок искомых
параметров распределения.
В частности, если функция распределения содержит один параметр, то берут M   xв , а
если два параметра, то берут M   xв и D  s 2 или D  Dв , если n велико.

Пример 1. Случайная величина  - продолжительность безотказной работы прибора


 e   x , x  0
имеет показательное распределение с плотностью p  x    . Найти
0, x  0
методом моментов точечную оценку параметра  по выборке объема n  200

 xi 1; xi   0;5  5;10  10;15 15; 20   20; 25  25;30 


ni 133 45 15 4 2 1

1 1 
Для показательного распределения M   . Согласно методу моментов M    xв ,
 
1
откуда      . Для вычисления x в рассмотрим середины интервалов

x1  2,5; x2  7,5; x3  12,5; x4  17,5; x5  22,5; x6  27,5;
xi  2,5
и перейдем к условным вариантам ui  . Для них выборка примет вид
5
ui 0 1 2 3 4 5
ni 133 45 15 4 2 1

1 100
Вычислим u в   0  45  30  12  8  5   0,5 . Тогда xв  5  0,5  2,5  5 и
200 200
1 1
      0, 2 .
xв 5
Пример 2. Случайная величина  - число появлений события А в m  5 независимых
испытаниях подчинена биномиальному закону распределения с неизвестным
параметром p - вероятностью наступления события А в одном испытании.
Проведено n  50 опытов по m  5 испытаний в каждом опыте, результаты
которых представлены выборкой

15
xi 0 1 2 3 4 5
ni 10 16 12 8 3 1

где xi число появлений события А в одном опыте, а ni количество опытов, в


которых наблюдалось xi появлений события А. Найти методом моментов
точечную оценку вероятности p .
Для биномиального распределения M   mp . Согласно методу моментов M   xв , то
1
есть mp  xв и p  p  xв . Вычислим
m
1 81
xв   0  16  24  24  12  5   1, 62 .
50 50
1
Тогда p  p  1, 62  0,324 .
5
Задания.
1. Случайная величина  распределена по закону Пуассона. По выборке

xi 0 1 2 3 4
ni 140 40 15 4 1

методом моментов найти точечную оценку неизвестного параметра 


распределения Пуассона.
2. Случайная величина  имеет геометрическое распределение. По выборке

xi 1 2 3 4 5 6
ni 2 3 6 5 2 2

найти методом моментов точечную оценку вероятности p наступления события А


в одном испытании. Здесь xi номер испытания, в котором впервые появилось
событие А, а ni количество опытов, в которых событие А произошло на xi
испытании.
3. Случайная величина  распределена нормально. По выборке
xi 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0 2,2

ni 6 9 25 26 30 26 24 21 20 8 5

найти методом моментов точечные оценки неизвестных параметров a и 


нормального распределения.

4. Случайная величина  распределена равномерно с неизвестными параметрами a и b .


По выборке

16
xi 3 5 7 9 11 13 15 17 19 21
ni 21 16 15 26 22 14 21 22 18 25
методом моментов найти точечные оценки параметров a и b равномерного
распределения.
5. Случайная величина  имеет гамма распределение с неизвестными параметрами  и
 . По выборке
xi 5 10 15 20 25 30 35 40 45
ni 1 3 6 7 7 5 4 8 4

методом моментов найти точечные оценки параметров  и  гамма


распределения.

§ 8. Метод максимального правдоподобия нахождения точечных оценок параметров


распределений.

Пусть  дискретная случайная величина, для которой известен закон ее распределения,


но неизвестен параметр  этого закона распределения. Обозначим через
P   i   p i , 
вероятность того, что случайная величина  приняла значение  i .
По заданной выборке   1 , 2 ,..., n  построим функцию правдоподобия

L  ,   p 1 ,  p 2 ,  ... p n ,    p  x1 ,    p  x2 ,  ...  p  xk ,   ,


n1 n2 nk

которая является функцией от выборки  и неизвестного параметра  . Так как значения


 i независимы, то функция правдоподобия L  ,  есть вероятность появления исхода
  1 , 2 ,..., n  в n независимых испытаниях, то есть как раз того результата, который
дан выборкой.
Параметр  будем искать из условия максимума функции правдоподобия L  ,  , то
есть из условия максимума вероятности полученной выборки  . Иными словами, чтобы
полученный в выборке результат был наиболее правдоподобным.
Для удобства вычислений будем искать максимум не самой функции правдоподобия
L  ,  , а ее логарифма – логарифмической функции правдоподобия
n k
ln L  ,    ln p i ,    n i ln p  xi ,   .
i 1 i 1

d
Необходимое условие экстремума нас приводит к уравнению ln L  ,   0
d
относительно  . Если   его решение и выполняется достаточное условие максимума
d2
ln L  ,  |    0 , то это значение   и берем в качестве точечной оценки параметра
d 2

17
Пусть теперь случайная величина  имеет абсолютно-непрерывное распределение с
плотностью p  x,   p  x,  . Для выборки   1 , 2 ,..., n  функция правдоподобия
имеет вид
L  ,   p 1 ,  p 2 ,  ... p n ,    p  x1 ,    p  x2 ,  ...  p  xk ,   .
n1 n2 nk

В силу независимости величин  i их совместная плотность распределения, то есть


плотность распределения вектора   1 , 2 ,..., n  , равна произведению плотностей
компонент. Таким образом, функция правдоподобия L  ,  есть плотность
распределения выборки  .
В этом случае параметр  также ищется из условия максимума функции
правдоподобия, точнее из условия максимума логарифмической функции правдоподобия
d d2
ln L  ,   0 и ln L  ,  |    0 .
d d 2
Как видно, формальная математическая формулировка обоих случаев ничем не отличается
друг от друга. Только в первом случае p  ,  это вероятность, а во втором случае это
плотность функции распределения.
Наконец, если функция распределения зависит не от одного, а от m параметров
1 ,2 ,...,m , то и функция правдоподобия также будет зависеть от этих m параметров и
задача сводится к их нахождению из условий максимума логарифмической функции
n
правдоподобия ln L  ,1 , 2 ,..., m    ln p i ,1 , 2 ,..., m  .
i 1

Необходимые условия экстремума нам дадут m уравнений



ln L  ,1 , 2 ,..., m   0, j  1, m .
 j

 

Если   1 ,2 ,...,m есть решение этой системы и выполняется достаточное условие
максимума d 2 ln L  ,1 ,2 ,...,m  |   0 , то найденные значения и берутся в качестве

точечных оценок параметров распределения.


Пример 1. Случайная величина  - число появлений события А в m  10 независимых
испытаниях подчинена биномиальному закону распределения с неизвестным
параметром p - вероятностью наступления события А в одном испытании.
Проведено n  100 опытов по m  10 испытаний в каждом опыте, результаты
которых представлены выборкой

xi 0 1 2 3 4 5 6 7
ni 2 3 10 22 26 20 12 5
где xi число появлений события А в одном опыте, а ni количество опытов, в
которых наблюдалось xi появлений события А. Найти методом максимального
правдоподобия точечную оценку вероятности p .

18
В данном случае P   xi   p  xi , p   Cmxi p xi 1  p 
m xi
. Составим функцию
правдоподобия

 m  x1 n1
  C 
m  x2 n2
 
nk
L  , p   Cmx1 p x1 1  p  p x2 1  p   ...  Cmxk p xk 1  p 
m  xk
x2
m 

  C  ...C  p x1n1  x2n2 ... xk nk 1  p 


 m x1 n1  m x2 n2 ... m xk nk
n1 n2 nk
 Cmx1 x2
m
xk
m .
1 k
Учтем, что x1n1  x2 n2  ...  xk nk  n   xi ni  n  xв , n1  n2  ...  nk  n
n i 1
 m  x1  n1   m  x2  n2  ...   m  xk  nk  m  n1  n2  ...  nk    x1n1  x2n2  ...  xk nk  

 mn  nxв  n n  xв 
  C  ...C 
n1 n2 nk
и обозначим через C  Cmx1 x2
m
xk
m - величину, не зависящую от p .

Тогда L  , p   C  p n xв  1  p    и ln L  , p   ln C  n xв ln p  n m  xв ln 1 p  .
n m  xв
 
Найдем
d
ln L  , p  
nx в n m  xв
 n

x в  px в  mp  px в 
n
x в  mp
.
dp p 1 p p 1  p  p 1  p 
1
Это выражение будет равно нулю, если xв  mp  0 , то есть p  xв .
m
d2 xв m  xв
Найдем теперь L  , p   n 2  n . Эта величина отрицательна, так как
1  p 
2 2
dp p
1
0  xв  m . Таким образом в точке p  x в функция правдоподобия достигает
m
1
максимума, и мы нашли точечную оценку вероятности p  p  x в .
m
По заданной выборке найдем
1 400
xв   0  3  20  66  104  100  72  35   4.
100 100
1
Тогда p   4  0, 4 .
10
Пример 2. Случайная величина  распределена по нормальному закону с плотностью

 x  a 2
1
p  x   e 2 . По выборке объема n  100
2

 2
xi -4 -2 0 2 4 6 8 10
ni 3 7 15 25 24 16 8 2

методом максимального правдоподобия найти точечные оценки параметров a и  .


Составим функцию правдоподобия
n1 n2 nk
 1  x a    1  x a     x a  
2 2 2
 1 2  2 2  k
L   , a,     e 2   e 2  ...  1 e 2 2  
  2    2    2 
     
19
k
 xi a 
1 2

 
  n1  n2 ...nk  ni
2
  2
2
e i 1
.
Логарифмическая функция правдоподобия имеет вид
1 k

ln L  , a,    n ln   ln 2  2   xi  a  ni .
2 i 1
2

Найдем частные производные
 1 k
1  k k

ln L  , a,     2  2    xi  a  ni  2   xi ni  a  ni  
a 2 i 1   i 1 i 1 


1
 2  nx в  an   2
n
x в a 
 n 2 k 1  k

ln L  , a,      3   xi  a  ni  3    xi  a  ni 
2 2
  n 2

  2 i 1   i 1 
Из системы уравнений
 n
 2 x в  a  0

 

 1  n 2    xi  a 2 ni   0
k

 3  i 1


1 k

1 k
 i  i  xi  xв ni  Dв .  
2
находим a  xв и  2 
2
x  a n 
n i 1 n i 1
Для проверки выполнимости достаточного условия максимума вычислим вторые
производные
2 2
a 2

n
ln L  , a,     2 ;
a
2n
ln L  , a,     3 x в  a

 
2 n 3 k
    2 4   xi  a  ni
2
ln L , a,  
 2
  i 1
и найдем дифференциал второго порядка
 n 
x 
k
n 4n 3
d 2 ln L  , a,      a dad   2  4  x  a ni  d 2
2
da 2  в
 2
 3
  i 1
i

При a  xв и   Dв получаем, что
2

 n 
 x  x 
k
n 3
d 2 ln L  , a,    
2
da 2    2 i в ni  d 2 
Dв  Dв Dв i 1 
n  n 3  n 2n
 da 2    2  nDв  d 2   da 2  d 2  0 .
Dв  в
D Dв  Dв Dв

Таким образом, функция правдоподобия имеет максимум в найденной точке, и мы нашли


точечные оценки параметров a  a  xв и      Dв .
По заданной выборке вычислим
1 k 1 300
xв   xi ni   12  14  50  96  96  64  20   3
n i 1 100 100

20
1 n

 xi  xв  1
 49  3  25  7  3 15  1 25  1 24  9 16  25  8  49  2  
948
2
Dв  ni   9, 48
n i 1 100 100
Тогда a  3 и    9, 48  3,08 .

Задания.
1. Случайная величина  распределена по закону Пуассона. По выборке
xi 0 1 2 3 4
ni 120 55 15 8 2

методом максимального правдоподобия найти точечную оценку неизвестного


параметра  распределения Пуассона.

2. Случайная величина  имеет геометрическое распределение. По выборке


xi 2 3 4 5 6
ni 2 4 5 5 4

найти методом максимального правдоподобия точечную оценку вероятности p


наступления события А в одном испытании. Здесь xi номер испытания, в котором
впервые появилось событие А, а ni количество опытов, в которых событие А
произошло на xi испытании.

3. Случайная величина  имеет показательное распределение. По выборке


xi 5 10 15 20 25 30
ni 150 80 40 20 8 2

методом максимального правдоподобия найти точечную оценку неизвестного


параметра  показательного распределения.
4. Случайная величина  распределена по нормальному закону с известным
среднеквадратичным отклонением   4 . По выборке
xi 2,5 5 7,5 10 12,5 15 17,5
ni 10 20 35 60 40 25 15

найти методом максимального правдоподобия точечную оценку неизвестного


параметра a нормального распределения.
5. Случайная величина  распределена по нормальному закону с известным
математическим ожиданием a  25 . По выборке

xi 16 19 22 25 28 31 34
ni 4 15 25 45 20 10 1

21
найти методом максимального правдоподобия точечную оценку неизвестного
параметра  нормального распределения.
6. Случайная величина  имеет гамма распределение с известным параметром   1,5 .
По выборке
xi 1 5 9 13 17 21
ni 40 25 15 10 6 4

найти методом максимального правдоподобия точечную оценку неизвестного


параметра  гамма распределения.

§ 9. Теорема о свойствах логарифмической функции правдоподобия.


Неравенство Рао-Крамера.
Рассмотрим здесь ряд вопросов, которые с одной стороны служат обоснованием
рассмотренного выше метода максимального правдоподобия, а с другой стороны
позволяют найти нижнюю границу дисперсии несмещенных точечных оценок параметра.
Последнее позволяет сравнивать дисперсию полученной несмещенной оценки с нижней
границы дисперсии и тем самым судить о том насколько полученная оценка близка к
оптимально возможной. Кроме того будут получены условия достижения этой нижней
границы дисперсии, а значит условия получения наиболее эффективной точечной
несмещенной оценки.
Теорема. Пусть случайная величина  имеет абсолютно-непрерывное распределение с
плотностью p  x,  и пусть для логарифмической функции правдоподобия
n
ln L  ,    ln p i ,  выполняются следующие условия:
i 1

 2
1. Существуют производные ln L  ,  и ln L  ,  ;
  2
  
2. Существуют и конечны математические ожидания M  ln L  ,   ,
  
 2     
2

M  2 ln L  ,    и M   ln L  ,    .
       

    2     
2

Тогда M  ln L  ,    0 , а M  2 ln L  ,     M   ln L  ,     0 .
          

Доказательство. Так как функция правдоподобия L  ,   p 1 ,  p 2 ,  ... p n , 
есть совместная плотность распределения случайного вектора   1 , 2 ,..., n  , то
справедливо тождество
 L  ,   d  1 .
Rn

Продифференцируем этот интеграл по  , что допустимо по условиям теоремы

22

  L  ,  d  0 .
n
(1)
R

Преобразуем подынтегральное выражение



L  ,  
 
n L  ,  L  ,  d  0 или n  ln L  ,   L  ,  d  0 ,
R R

а это и есть математическое ожидание от производной логарифмической функции


правдоподобия
   
M ln L  ,     ln L  ,   L  ,  d  0 .
   Rn 
Таким образом, первое утверждение теоремы доказано.
Рассмотрим теперь вторую производную от логарифмической функции правдоподобия
  
 L  ,   
2      
ln L  ,    ln L  ,     
       L  ,  
2

 
2  
L  ,    L  ,    L  ,    L  ,  
  2
  
 L  ,   
2

2  
2
 2
L  ,    L  ,    L  ,  
 
2
 2
  2 
     ln L  ,   
L  ,    L  ,    L  ,     
 
и найдем от нее математическое ожидание
 2  2
M  2 ln L  ,     ln L  ,   L  ,  d 
   Rn 
2

2
2   
 L  ,   d    ln L  ,   L  ,  d 
Rn
 2
Rn 
 

2    
2

 n  2  
L  ,  d   M  
 
ln L     .
 , 
 
R 
Дифференцируя по  полученное ранее равенство (1), получим
2
  2 L  ,  d  0 .
Rn

 2     
2

Таким образом, M  2 ln L  ,     M   ln L  ,     0 и теорема доказана.


       

   
2

Функцию I    M   ln L  ,    называют количеством информации по Фишеру.


    

В определенном смысле ее можно рассматривать как количество информации,
содержащемся в векторе   1 , 2 ,..., n  о значении параметра  .
23
Теперь утверждения теоремы мы можем записать в виде
    2 
M ln L  ,    0 и M  2 ln L  ,     I    0 .
     
Полученный результат может служить определенным обоснованием рассмотренного
метода максимального правдоподобия, так как точечная оценка   параметра 
находилась из условий максимума логарифмической функции правдоподобия ln L  ,  , а
 2
именно из условий ln L  ,   0 и ln L  ,   0 .
  2
Неравенство Рао-Крамера. Пусть выполнены оба условия предыдущей теоремы и пусть
   h   есть несмещенная точечная оценка параметра  . Тогда

Dh    M  h       I 1  .
2

Доказательство. Рассмотрим равенство


M    Mh     h   L  ,   d  
Rn

и продифференцируем его по 

 h    L  ,  d  1 .
Rn

Преобразуем левую часть этого равенства



L  ,  
  
n h    L   ,   d    h    L   ,   d    h   ln L  ,   L  ,  d .
R
 R n L   ,   R n 
Таким образом

 h    ln L  ,   L  ,  d  1 .
Rn

Из доказанной теоремы следует, что


   
M ln L  ,     ln L  ,   L  ,  d  0 .
   Rn 
Умножим последнее равенство на  и вычтем из предыдущего

n  h        ln L  ,   L  ,  d  1 , то есть
R

  
M   h       ln L  ,    1 . (2)
  
Воспользуемся неравенством Коши-Буняковского

 f   g   d   f 2   d   g   d
2
,
n n n
R R R

где равенство достигается только если g    C  f   , C  const.


Преобразуем его применительно к математическим ожиданиям

24
M  f    g      f    g    L   ,   d     f    
L   ,    g   L  ,   d  
Rn Rn

  f 2   L  ,   d   g   L  ,   d 
2
  
 M f 2    M g 2   . 
Rn Rn

Применим полученное неравенство к соотношению (2)

 
      
2

1  M   h       ln L  ,    M         
2
h     M   ln L  , 
       

 Dh    I   ,

1
откуда получаем неравенство Рао-Крамера Dh    .
I  

При этом равенство в нем будет достигаться, если



ln L  ,   C    h      . (3)

Доказательство теоремы и получение неравенства Рао-Крамера было проведено для
абсолютно-непрерывных распределений, но все остается в силе и для дискретных
распределений. Надо только при доказательстве заменить плотность p  ,  на
вероятности p i ,  , а интегралы на суммы.

Определение. Несмещенная точечная оценка   параметра  называется оптимальной


или наиболее эффективной, если
D   inf Dn .
n

Выполнение условия (3), при котором неравенство Рао-Крамера переходит в точное


равенство, есть условие того, что полученная несмещенная оценка будет наиболее
эффективной.
Пример 1. Пусть случайная величина  распределена по закону Пуассона
k
P   k  e  ,   0, k  0,1, 2,...
k!
Найдем по выборке   1 , 2 ,..., n  методом максимального правдоподобия
точечную оценку параметра  и исследуем ее на эффективность.
Составим функцию правдоподобия
 1    2    n  
L  ,    e  e  ...  e  A   1 2 ...n  e  n  A   n xв e  n ,
1 ! 2 ! n !
где A  1 ! 2 ! ...  n !  const и 1  2  ...  n  nxв .
1

Найдем ln L  ,    ln A  nxв ln    n и вычислим производную




1
ln L  ,    nxв   n 

n

xв   ,  
25
которая обращается в ноль при      xв .
2 nxв
При этом ln L  ,     2  0 , а значит, при      xв функция правдоподобия
 2

имеет максимум и мы нашли точечную оценку    xв . Эта оценка будет несмещенной
M    M xв  M    , поскольку для распределения Пуассона M    .

Кроме того из полученного равенства

ln L  ,   
n

 
xв   следует, что выполняется

n
условие (3) (при C     , h    xв ) того, что полученная несмещенная оценка будет

наиболее эффективной.
В этом случае неравенство Рао-Крамера переходит в точное равенство
1
Dh    Dxв  .
I  
1 n  1 n
1 
Найдем Dxв  D   i   2  D i  2
 nD  , так как для распределения Пуассона
 n i 1  n i 1 n n
D   .
 1 n
Таким образом, Dxв   , откуда I     .
n I   

Пример 2. Пусть случайная величина  распределена по нормальному закону с



 x  a 2
1
плотностью p  x   e 2 2
. Предположим, что параметр a известен, а
 2
для параметра  требуется по выборке   1.2 ,..., n  методом максимального
правдоподобия найти точечную оценку и исследовать ее на эффективность.
Составим функцию правдоподобия
1  a 2   2  a 2   n  a 2
n
i a 
1 2

 
1  1  1  n
L  ,    2
 2
 ...  2
  2 2 2 i 1
2 2 2
e e e e .
 2  2  2
n
1
Найдем ln L  ,    n ln   n ln 2     a  и вычислим
2

2 2 i
i 1

 n 1 n 1 nn

ln L  ,      3  i  a   3   i  a    2  .
2 2

   i 1   n i 1 
1 n
Производная равна нулю, если  2   2   i  a  . При этом
2

n i 1
2
 2
ln 
L  ,  


n

2

3 n
4   i
 i 1
2


n

3 2n
  a   2  4 n 2   2  0 .

Таким образом, функция правдоподобия имеет максимум при     и мы нашли


1 n
точечную оценку      i  a  . Отметим сразу, что эта точечная оценка для
2
2 2

n i 1

26
1 n

 i  x в 
2
дисперсии D не является выборочной дисперсией Dв  , так как параметр
n i 1
a здесь известен.
Покажем, что полученная оценка является несмещенной
1 n 2
  1 n 1
M  2  M   i  a     M i  a    nM   a   D   2 .
2 2

 n i 1  n i 1 n
Кроме того выполнено условие (3)
 n 1 n  n 1 n
ln L  ,    3   i  a    2  при C    3 , h     i  a  ,
2 2

   n i 1   n i 1
а значит, полученная несмещенная точечная оценка является наиболее эффективной и в
неравенстве Рао-Крамера будет точное равенство.
Вычислим дисперсию полученной оценки
1 n 2 1 n 1
D 2  D   i  a    2  D i  a   2  nD   a  
2 2

 n i 1  n i 1 n
1
n
4
2 2 1
 n
4 2 1
  M   a   M   a     M   a    D     M   a    4  .
 n
4

 x  a 2
1

  x  a   t, x  a   t 
Найдем M   a     x  a dx   
4 4 2 2
e
 2   dx   dt 
u  t , du  3t 2 dt
3

 t2
 4  3  t2   
2
t2
4 
 

  t e dt   t2   t e | 3  t e 2 dt  
4 2 2
t2
2    2  
 dv  te dt , v  e  
2 2

u  t , du  dt  4  t2  t2  3 4
  3   
 2  3 4 .

 t2 t2   te 2
|  e 2
dt 
 dv  te 2 dt , v  e 2  2   2
  

2 4 2 4
Тогда D 2 
1
n
3 4   4  
n
и D 2 
n

1
I  
, откуда I   
n
2 4
.

Задание.
Пусть случайная величина  распределена по нормальному закону с

 x  a 2
1
плотностью p  x   e 2 2
. Предположим, что параметр  известен, а
 2
для параметра a требуется по выборке   1.2 ,..., n  методом максимального
правдоподобия найти точечную оценку и исследовать ее на эффективность.

27
§ 10. Интервальные оценки параметров распределений.

Понятие оценки параметра распределения будет неполным, если не указать величину


ошибки, возникающей при использовании полученной оценки. Наглядное представление
о точности оценок дают доверительные интервалы.
Доверительным интервалом для параметра распределения  называется случайный
интервал  ;   , внутри которого с вероятностью  , близкой к единице, содержится
точное значение оцениваемого параметра
P    ;    .
Величина  называется доверительной вероятностью. Она выбирается в соответствии с
готовностью мириться с возможностью ошибки. При заданной доверительной
вероятности  длина доверительного интервала характеризует точность, с которой
локализовано значение параметра. Поэтому естественно выбирать среди различных
доверительных интервалов при заданной доверительной вероятности  интервал
кратчайшей длины. Такой выбор обеспечивает наиболее точную локализацию параметра.
Отличие интервальной оценки от точечной состоит в следующем:
- доверительный интервал  ;   как оценка менее точен в том смысле, что он указывает
целое множество возможных значений  ;
- с другой стороны утверждение: «    ;   с вероятностью  » является истинным, в то
время как событие     , как правило, имеет вероятность, равную нулю.
Объявляя верным утверждение    ;   , мы используем тот факт, что если некоторое
событие имеет вероятность  и это  близко к единице, то практически невозможно,
чтобы это событие не произошло при единичном испытании.
Очевидно, что существуют различные способы построения доверительных интервалов.
Рассмотрим один из них, основанный на использовании точечной оценки   параметра.
Построенные на основе этой оценки интервалы будут тем короче, чем меньше дисперсия
оценки. Таким образом, эффективные и асимптотически эффективные оценки приводят к
кратчайшим или асимптотически кратчайшим доверительным интервалам.
Закон распределения оценки   в общем случае зависит от самих оцениваемых
параметров и, как правило, не известен. Поэтому будем переходить от случайной
величины   к некоторой другой случайной величине, закон которой уже не зависит от
неизвестных параметров, а зависит только от числа опытов n и от вида закона
распределения случайной величины  . Как правило, это нормированное нормальное
распределение, распределение Стьюдента или распределение Пирсона. Это позволит нам
по доверительной вероятности  найти доверительный интервал. Кроме того эти
доверительные интервалы будем строить симметричными относительно оценки   .
Рассмотрим применение этой схемы для нахождения доверительных интервалов для
параметров некоторых видов распределений.

28
§ 10.1. Построение доверительных интервалов для параметров нормального
распределения.
Поскольку нормальное распределение имеет два параметра a и  , то рассмотрим
следующие случаи.
I. Нахождение доверительного интервала для параметра a , если дисперсия  2
известна.
Несмещенной точечной оценкой для параметра a является выборочное среднее
1 n
x в   i . Оно имеет математическое ожидание M xв  a и дисперсию
n i 1
1 n  1 n 1 2
Dx в  D   i   2  Di  2  nD  .
 n i 1  n i 1 n n
Введем нормированную случайную величину
xв  M xв xв  a
  n,
Dxв 
которая является нормированной суммой случайных величин, имеющих математическое
ожидание и дисперсию. Тогда к ней применима центральная предельная теорема,
согласно которой она будет асимптотически нормальна с параметрами a  0 и   1 .
x t2

Тогда P      2     , где   x  
1
2
e
0
2 dt .


По таблице значений функции   x  находим решение    уравнения     .
2
xв  a 
   
Тогда n   , xв  a 
 и a   xв   ; xв     требуемый
 n  n n 
доверительный интервал для параметра a .
Пример 1. Найти доверительный интервал для оценки с надежностью   0,95 параметра
a нормального распределения, если среднеквадратичное отклонение   5 ,
выборочное среднее xв  14 , а объем выборки n  64 .

Из уравнения      0, 475 по таблице значений функции   x  (Таблица 2) находим
2
    1,96 . Доверительный интервал

     5 5
a   xв   ; xв     14  1,96  ;14  1,96    12, 775;15, 225 .
 n n   8 8

Пример 2. Найти минимальный объем выборки, при котором с надежностью   0,95


точность оценки математического ожидания a равна   0,5 , если   5 .

  
2

Так как     , то n      . В данном случае   1,96 и


n  
2
 5 
n  1,96    32, 6  1068 .
2

 0,3 
29
II. Нахождение доверительного интервала для параметра a , если дисперсия  2
не известна.
Несмещенной точечной оценкой для параметра a является выборочное среднее
1 n 2
xв  i
n i 1
 . При этом M x в  a и Dx в 
n
.

Так как дисперсия  2 нам не известна, то приблизим ее точечной несмещенной оценкой


n s2
s2  Dв , то есть возьмем Dx в  . Введем нормированную случайную величину
n 1 n
1 n
1 n 1 n i  a
xв  M xв xв  a n
i   a
n
 i  n 
  a

t  n  n i 1  n i 1  i 1
.
Dx в s n n n D
Dв Dв  в
n 1 n 1 n 1  2
 a
Перейдем к случайным величинам i  i , которые распределены нормально с


параметрами a  0 и    1. При этом Dв  и тогда
2
1 n  1 n  1 n 
 i
n i 1
 i
n i 1
 i
n i 1
t   .
n n  1 n 2  1 n    1  n 2  1 n   
2 2
Dв
n 1   i    i     i    i  
n  1  n i 1  n i 1   n  1  i 1  n  
  i 1


Введем в n -мерном пространстве выборок 1 , 2 ,...,  n новую ортогональную систему 
1 n  n n
1, i  m
координат 1 ,2 ,...,n  так, что 1    ,     jii и   jm   im   .
0, i  m
i j ji
n i 1 i 1 j 1

Тогда
 
2
n n
 n
 n n n n n

 2j     jkk       ji jmim    im  ji jm   i2 и


j 1 j 1  k 1  j 1  i,m1  i, m 1 j 1 i 1

1 1
t  .
1  n 2  1 n 2
 j  1 
n  1  j 1
2
 j
n  1 j 2

Поскольку случайные величины  j , так же как и  i , распределены нормально с
параметрами 0 и 1, то случайная величина t имеет распределение Стьюдента с n  1
степенью свободы.
Из уравнения P  t  t    по таблице 3 находим соответствующее значение t  t  , n  .

n s
Тогда t  xв  a  t , x в  a  t и искомый доверительный интервал
s n
 s s 
a   xв  t ; x в  t  .
 n n 

30
Полученное выражение для доверительного интервала совпадает с предыдущим случаем
(когда дисперсия  2 известна) с заменой  на s и   на t .
Так как с ростом n распределение Стьюдента стремится к нормальному распределению,
то при достаточно больших n t    и доверительный интервал находят по формуле
 s s 
a   xв   ; xв    .
 n n 
Пример 3. Из генеральной совокупности, распределенной нормально, извлечена выборка
объема n  25 :
xi -1,0 -0,5 0,0 0,5 1,0 1,5 2,0
ni 2 3 5 8 4 2 1

Найти с надежностью   0,95 доверительный интервал для математического


ожидания a .
По заданной выборке вычислим выборочное среднее и исправленную выборочную
дисперсию
1 n 1
xв   xi ni   2  1,5  4  4  3  2   0,38
n i 1 25

s2 
1 n

n  1 i 1
 
xi  xв ni 
1
24
 
1,382  2  0,882  3  0,382  5  0,122  8  0,722  4  1,122  2  1,622 

14,176
  0,5907 и s  0,5907  0, 7686 .
24
По таблице 3 находим t  t  0,95;25  2,064 . Тогда
 0, 7686 0, 7686 
a   0,38   2, 064;0,38   2, 064  , то есть a   0,063;0,697  .
 5 5 

III. Нахождение доверительного интервала для параметра  , если


математическое ожидание a не известно.
Несмещенной точечной оценкой для дисперсии  2 является исправленная выборочная
n
дисперсия s 2  Dв . Будем искать доверительный интервал  s   ; s    так, чтобы
n 1
P s      s      .
nDв nDв
Положим s    и s   , где t1 и t2 неизвестные пока величины.
t1 t2
nDв nDв
Тогда неравенство s      s   перейдет в неравенство   или
t1 t2
 nDв   t1 nDв
 , откуда  t2  nDв   t1 или t2   t1 .
 nDв   t 2

31

 nDв 

Таким образом получаем условие P s      s     P t2   t1    .

  

Так как математическое ожидание a неизвестно, то приблизим его выборочным средним
i  x в
x в и введем нормированные случайные величины i  , распределенные

2
Dв nDв  1 n  n
нормально. Тогда Dв  2 и  nDв   i    i  . 2

  i 1  n i 1 
Как и в предыдущем пункте осуществим линейное ортогональное преобразование
1 n  n n
1, i  m
координат 1    ,       и   ji jm   im   . При этом случайные
0, i  m
i j ji i
n i 1 i 1 j 1

величины  j также нормированы и распределены нормально.


n n
Там же мы показали, что     
j 1
2
j
i 1
i
2
. Тогда

2
n
 1 n  n n
nDв    i
 2
   i    2j 12   2
j
i 1  n i 1  j 1 j 2


 n 

и мы приходим к соотношению P t2   2
j  t1    .

 j 2 

n
Случайная величина   
j 2
2
j имеет  распределение с n  1 степенью свободы и нам

известна плотность p  x  ее функции распределения (см. § 6).


t1

Для нахождения величин t1 и t2 получаем уравнение P t2    t1   p  x  dx   .


t2

Преобразуем выражения для t1 и t2 , чтобы получить в этом уравнении одно неизвестное


n 1 2
n s
nDв n s n 1 n 1 
t1     , где q  .
s  s  s  1 q s
nDв s n 1 n 1
Аналогично t2    .
s  s  1 q
n 1
1 q
Получили уравнение относительно q :  p  x  dx   .
n 1
1 q

По таблице 4 находим его решение q  q  , n  . Тогда   sq и доверительный интервал


имеет вид    s   ; s      s 1  q  ; s 1  q   . При этом, если 1  q  0 , то так как   0 ,
берется интервал    0; s 1  q   .

32
Пример 4. Проведено n  20 измерений одним прибором без систематической ошибки
некоторой величины. Найдена исправленная выборочная дисперсия s  0,8 . Найти
точность прибора с надежностью   0,99 .

Ошибки измерений подчинены нормальному закону, а точность прибора характеризуется


среднеквадратичным отклонением случайных ошибок измерений. Таким образом, задача
сводится к отысканию доверительного интервала для  с заданной надежностью   0,99
По таблице 4 находим q  q  0,99;20   0,58 . Тогда
   0,8 1  0,58 ;0,8 1  0,58    0,336;1, 264  .

§ 10.2. Построение доверительного интервала для параметра  распределения


Пуассона.
Пусть случайная величина  распределена по закону Пуассона
k
P   k  e  ,   0, k  0,1, 2,...
k!
По выборке   1 , 2 ,..., n  найдем с надежностью  доверительный интервал для
1 n
параметра  . Несмещенной точечной оценкой параметра  является    xв   i .
n i 1
1 n  1 n
1 
При этом M    M xв   и D   Dxв  D   i   2  D i  2
nD  , так как для
 n i 1  n i 1 n n
распределения Пуассона M    и D   .
Введем нормированную случайную величину
  M  xв   n 1 n 

D 



n

x в 
    i    ,
  n i 1 
n
которая по центральной предельной теореме асимптотически нормальна с параметрами
a  0 и   1 . Тогда P      2     . Теперь по таблице 2 значений функции   x 

находим решение   уравнения     .
2
n
Далее из неравенства    xв      следует найти интервал изменения  .

Запишем это неравенство в виде системы



n

 
 xв      n  x в   n       n      x в n  0
 или  , то есть  .
 n  x в   n       n      xв n  0


n

 
 x в     

Решим эти квадратичные неравенства относительно .

33
  2
Нулями первого квадратного трехчлена будут   1,2

2 n
 xв 
4n
и решением

  2
первого неравенства с учетом того, что   0 будет     xв  .
2 n 4n
  2
Нулями второго квадратного трехчлена будут   
1,2

2 n
 xв 
4n
и его решение

  2
есть   xв  . Таким образом, решением системы неравенств будет
2 n 4n
 2   2
  xв     xв  .
2 n 4n 2 n 4n
Отсюда искомый доверительный интервал есть
2 2
  2    2 
    xв          xв    .
 2 n 4n  2 n 4n 
   
Пример 5. Случайная величина  распределена по закону Пуассона. По выборке объема
n  100
xi 0 1 2 3 4

ni 58 28 11 2 1

Найти с надежностью   0,95 доверительный интервал для параметра  .

1
Вычислим сначала xв   28  22  11  2  1  0, 6 . Затем по таблице 2 из уравнения
100

 0,95
      0, 475 находим   1,96 . Согласно полученной формуле
2 2
2 2
 1,96 1,962   1,96 1,962 
  0, 6      0, 6  
 20 400   20 400 
    , то есть 0, 4662    0,8788 .

§ 10.3. Построение доверительного интервала для вероятности p


биномиального распределения.
Пусть случайная величина  имеет биномиальное распределение
P   k  Cnk p k 1  p 
nk
.
Ее математическое ожидание и дисперсия соответственно равны M   np и D  npq .
m
Будем считать, что известна относительная частота  появления события в n
n
независимых испытаниях. Найдем доверительный интервал для вероятности p
наступления события в одном испытании.
34
В качестве точечной оценки для вероятности p возьмем относительную частоту
m
p    . Эта оценка будет несмещенной, так как   m и
n
m 1
  1
M p  M    M    M  m    np  p
n n n
и ее дисперсия
m 1 pq p 1  p 
  n n n
1
D p  D    D    2 D  m   2  npq 
n

n .
Введем нормированную случайную величину


 
p  M p  p
n
D p  
p 1  p 
.

По теореме Муавра-Лапласа она асимптотически нормальна с параметрами a  0 и   1 .


Тогда P      2     . Теперь по таблице 2 значений функции   x  находим

решение   уравнения     .
2
Доверительный интервал для вероятности p найдем, решив неравенство
n
   p    . Для этого возведем его в квадрат и приведем подобные члены
p 1  p 

 2
   
 n p 2  2  2n p  n 2  0 .
  2  1    
   
2
Найдем дискриминант D   2  2n  4n 2  2  n  4n 2 2   2   и корни
 4n n
 

n   2 2  1    
квадратного трехчлена p1,2  2       . Тогда решение
  n  2n 4n 2 n 
 
квадратичного неравенства, то есть доверительный интервал имеет вид
n   2  2  1     n   2  2  1    
       p 2       .
 2  n  2n 4n 2 n    n  2n 4n 2 n 
   
 2  2
Если n достаточно велико, то величины и малы и ими можно пренебречь, а
2n 4n 2
n
величина  1 . В этом случае получаем упрощенную формулу
  n
2

 1     1   
    p     .
n n
Пример 6. Проведено n  160 независимых испытаний, в которых событие А появилось
m  16 раз. Найти с надежностью   0,95 доверительный интервал для
вероятности p появления события А в одном испытании.

35
m 16
В данном случае     0,1 . По таблице 2 находим решение   1,96 уравнения
n 160
 0,95
      0, 475 . По упрощенной формуле находим доверительный интервал
2 2

0,1 0,9 0,1 0,9


0,1   p  0,1  , то есть 0,0954  p  0,1046 .
160 160

Задания.
1. Выборка из большой партии электроламп содержит 100 ламп. Средняя
продолжительность горения лампы выборки оказалась равной 1000 часов. Найти с
надежностью 0,95 доверительный интервал для средней продолжительности a
горения лампы всей партии, если известно, что среднеквадратичное отклонение
продолжительности горения лампы   40 часов. Предполагается, что
продолжительность горения ламп распределена нормально.
2. Глубина моря измеряется прибором, систематическая ошибка которого равна
нулю, а случайные ошибки распределены нормально со среднеквадратичным
отклонением   20 метров. Сколько надо сделать независимых измерений, чтобы
определить глубину с ошибкой не более 15 метров при надежности 90%?
3. Из генеральной совокупности, распределенной нормально, извлечена выборка
xi 1 2 3 4 5 6 7
ni 2 3 7 12 9 2 1

Найти доверительный интервал для оценки с надежностью 0,95 неизвестного


математического ожидания a .
4. Из генеральной совокупности, распределенной нормально, извлечена выборка
xi -1,5 -1,0 -0,5 0 0,5 1,0 1,5
ni 2 4 8 12 7 5 2

Найти доверительный интервал, покрывающий среднеквадратичное отклонение 


с надежностью 0,99.
5. Случайная величина  (число поврежденных при перевозке изделий в одном
контейнере) распределена по закону Пуассона. В выборке приведено
распределение числа поврежденных изделий в 500 контейнерах (в первой строке
указано количество xi поврежденных изделий в одном контейнере, во второй
строке приведена частота ni - число контейнеров, содержащих xi поврежденных
изделий):
xi 0 1 2 3 4 5 6 7
ni 199 169 87 31 9 3 1 1

36
Найти с надежностью 0,99 доверительный интервал для параметра 
распределения Пуассона.
6. Игровой автомат должен обеспечивать появление выигрыша в одном случае из 100
бросаний монеты в автомат. При проверке игрового автомата произведено 500
испытаний, причем выигрыш появился 4 раза. Найти доверительный интервал,
покрывающий неизвестную вероятность появления выигрыша с надежностью
0,999. Обеспечивает ли этот игровой автомат заявленную вероятность выигрыша?

§ 11. Статистическая проверка гипотез о значениях параметров распределений.


В данном разделе пойдет речь о проверке каких-либо предположений (гипотез)
относительно неизвестных параметров известного закона распределения случайной
величины. Решение о том, справедлива ли рассматриваемая гипотеза или нет, должно
основываться лишь на знании выборки   1 , 2 ,..., n  , то есть на основании некоторой
статистики. Таким образом, чтобы определить процедуру принятия решения по выборке
 , мы должны задать в той или иной форме отображение выборочного пространства на
множество рассматриваемых гипотез. Такое отображение называют статистическим
критерием.
Пусть задан закон распределения случайной величины  , но не известен его параметр  .
Относительно значений этого параметра мы и будем выдвигать гипотезы.
Статистическая гипотеза H называется простой, если она состоит в том, что   0 , где
 0 некоторое фиксированное значение, и сложной, если   1;2  .
Например, для биномиального распределения Pn   k  Cnk p k 1  p 
nk

1 1
гипотеза H : p  является простой, а гипотеза H : p  является сложной.
2 2
Задачу проверки статистических гипотез будем ставить следующим образом. Дана
выборка   1 , 2 ,..., n  . Относительно значения параметра  имеется:
основная гипотеза H 0 :   0
и конкурирующая или альтернативная гипотеза H1 :   1
(для наглядности изложения гипотезы возьмем простыми).
Мы должны построить такой статистический критерий, который позволял бы нам
заключить согласуется ли выборка  с гипотезой H 0 или нет, то есть принимаем ли мы
эту гипотезу или нет. Будем строить статистические критерии при помощи так
называемого критического множества. Выборку   1 , 2 ,..., n  можно рассматривать
как точку n -мерного пространства выборок. В этом пространстве выборок выделим такое
множество S , называемое критическим, что при попадании выборки  в S гипотеза H 0
отвергается, а в остальных случаях она принимается. Получаемый при помощи
критического множества S статистический критерий принято называть S -критерием.

37
Пусть p  x,  плотность функции распределения, тогда вероятность попадания выборки
 в критическое множество S равна W  S ,    p  x,  dx . Эту вероятность называют
S

еще функцией мощности S -критерия.


С каждым S -критерием связаны ошибки двух родов:
ошибка I-го рода   W  S ,0    p  x,0  dx - отвергаем гипотезу H 0 , когда она верна, то
S

есть, принимаем альтернативную гипотезу, хотя верна основная;


 
ошибка II-го рода   W S ,1   p  x,1  dx  1   p  x,1  dx - отвергаем гипотезу H1 ,
S S

когда она верна, то есть, принимаем основную гипотезу, хотя верна альтернативная.
Вероятность  ошибки I-го рода называют уровнем значимости критерия, а величину
W  S ,1   1   называют мощностью критерия.
Очевидно, что S -критерий будет тем лучше, чем меньше будут ошибки  и  , то есть
чем меньше уровень значимости  и чем больше мощность W  S ,1  этого критерия.
Однако при заданном числе испытаний n невозможно ни при каком выборе критической
области S одновременно сделать как угодно малыми обе ошибки  и  . Поэтому,
сначала задается уровень значимости  и рассматривается множество S  всех S -
критериев с уровнем значимости  . Далее среди них выбирается критерий S  , для
которого мощность максимальна
 
W S  ,1  max W  S ,1  .
SS 

Критерий S , удовлетворяющий этим условиям, называют оптимальным или наиболее
мощным критерием.
К сожалению, оптимальный критерий, удовлетворяющий этим условиям, существует не
для всех типов распределений. Поэтому видоизменим схему построения наиболее
мощного статистического критерия. Введем функцию   x  такую, что 0    x   1 и
рассмотрим  -критерий с функцией мощности W  ,      x  p  x,  dx .
S

Для этого  -критерия ошибки I-го и II-го рода равны соответственно


  W  ,0      x  p  x,0  dx и   1  W  ,1   1     x  p  x,1  dx ,
S S

а мощность критерия равна W  ,1   1   .


Зададим уровень значимости  и рассмотрим множество   всех  -критериев с
уровнем значимости  . Выберем среди них критерий   , для которого мощность
максимальна
   
W   ,0   и W   ,1  max W  ,1 
 
(1)

Такой  -критерий будем называть наиболее мощным или оптимальным. Покажем, что в
такой постановке задача уже будет всегда разрешимой.
Для сокращения записей введем обозначения

38
p0  x   p  x,0  ; p1  x   p  x,1  ; M 0     x  p0  x  dx ; M1     x  p1  x  dx
(здесь M есть символ математического ожидания).
Оптимальный критерий будем искать среди критериев, которые определяются
p  x
отношением правдоподобия 1 .
p0  x 

Теорема Неймана-Пирсона. Для любого   0;1 существуют такие числа c  0 и


  0;1 , что   -критерий с функцией
 p1  x 
1, если  c, то есть p1  x   c  p0  x 
 p0  x 
 p  x

   x    , если 1  c, то есть p1  x   c  p0  x 
 p 0  x 
 p  x
0, если 1  c, то есть p1  x   c  p0  x 
 p0  x 
является наиболее мощным критерием согласно (1) с уровнем значимости  .
Доказательство. Рассмотрим следующую функцию от c в предположении, что верна
 p  x
 

гипотеза H 0 : g  c   P  1  c | H0  .
 p0  x 
 

 p  x
 

Функция 1  g  c   P  1  c | H 0  есть функция распределения случайной величины
 p0  x 
 

p1  x 
, а значит, она не убывает и непрерывна слева. Тогда функция
p0  x 

 p  x
 

g c  1 P  1  c | H 0  не возрастает и также непрерывна слева. Кроме того
 p0  x 
 

g  0   1 и g     0 .
Найдем c из условия g  c     g  c  0  .
А именно, если g  c   g  c  0  (функция g  c  терпит скачок в точке c ), то возьмем
  g  c 
  . Если же g  c   g  c  0  (функция g  c  непрерывна точке c ),
g  c  0   g  c 
то возьмем   0 . При этом если g  c    на некотором промежутке (функция g  c 
постоянна на этом промежутке), то примем за c любую точку этого промежутка,
например левый конец.
Положив в выражении для    x  c  c и    , получим требуемую функцию.
Действительно, покажем, что построенный   -критерий имеет уровень значимости  и
обладает свойством оптимальности, то есть его мощность максимальна.
Найдем сначала

39
M 0       x  p0  x  dx   1 p0  x  dx     p0  x  dx   0  p0  x  dx 
p1  x  c p0  x  p1  x  c p0  x  p1  x c p0  x 

  g  c 
 p0  x  dx  p0  x  dx  g  c  
g  c  0   g  c  p1  x c p0  x 

p1  x  c p0  x 

  g  c 

g  c  0   g  c 
 g  c  0  g  c   g  c     g  c    .
Таким образом, уровень значимости этого критерия равен  .
Пусть  любой другой критерий с уровнем значимости  : M 0   . Покажем, что
M1   M1 . Рассмотрим интеграл

   x     x    p  x   c p  x   dx     x     x   p  x   c p  x  dx 
 
1 0 1  0
   x    x 
 p1  x c p0  x 
    x     x   p  x   c p  x  dx  0 , откуда

1  0
   x   x 
 p1  x c p0  x 

   x     x  p  x  dx  c    x     x  p  x  dx , то есть
 
1 0

 
M1   M1  c M o   M 0  c      0 и M1   M1 .
Таким образом, мы построили наиболее мощный критерий.
Мы провели все рассуждения, используя плотность p  x,  случайной величины, то
есть считая, что она абсолютно-непрерывна. Но все остается в силе и для дискретных
случайных величин с заменой плотности на вероятности p i ,  , а интегралы на суммы.

Рассмотрим теперь применение построенного критерия Неймана-Пирсона для проверки


гипотез о значении параметров распределений.

§ 11.1. Проверка гипотез о значении параметров нормального распределения.


Пусть случайная величина  распределена по нормальному закону и   1 , 2 ,..., n 
выборка объема n . Поскольку нормальное распределение имеет два параметра a и  , то
рассмотрим следующие случаи.
I. Проверка гипотез о значении математического ожидания a , если дисперсия
 2 известна.
Пусть требуется проверить основную гипотезу
H 0 : a  a0
при альтернативной гипотезе (правая односторонняя)
H1 : a  a1  a0
Совместная плотность распределения вектора  есть
n

 1   2 2  i a j  1
n 2

p j    p j 1  p j  2  ... p j  n     e i 1
, j  0,1
  2 
Тогда отношение правдоподобия примет вид

40
p1    1 n
1 n
2
 i  a1     a0   
2
 exp   2 
p0    2 2 2 i
i 1 i 1 
 1 n   1  
   
n
 exp   2  i2  2a1i  a12  i2  2a0i  a02   exp  2  n a12  a02  2  a1  a0   i   
 2 i 1   2  i 1 

 n  a1  a0  
 1
 2
  
 exp   2 n a12  a02  2n  a1  a0  x в   exp 
 2 2 a1  a0  2 x в  .  
 
Критическая область S определяется при некотором c из равенства
 p  
 

P 1  c | H0    .
 p0  
 

рассмотрим неравенство
p1    n  a1  a0  
p0  
 exp  
2 2 
a1  a0  2 xв   c  (2)
 
и разрешим его относительно x в :
n  a1  a0 

2 2
 
a1  a0  2 xв  ln c и с учетом того, что a1  a0 получим

a a 2
xв  1 0  ln c .
2 n  a1  a0 
a1  a0 2
Обозначим через c1   ln c - это тоже еще неизвестная величина, так как
2 n  a1  a0 
c неизвестно. Таким образом, xв  c1 и
 p  
 

P 1
 p0   

 c | H 0   P x в  c1   . 
 
Задача нахождения критической области S в n -мерном пространстве выборок сведена к
задаче нахождения критической области для одномерного случая (относительно
выборочного среднего).
Выборочное среднее x в имеет математическое ожидание M xв  a и дисперсию
2 xв  M x xв  a
Dx в  . Введем нормированную случайную величину   n, 
n Dxв 
которая по центральной предельной теореме распределена асимптотически нормально с
параметрами a  0 и   1 . Тогда

 xв  a0 c a 


P xв  c1 | H 0  P   n  1 0 n   P   c  ,
 
  

c1  a0 n  a1  a0 2  xв  a0
где c  n   ln c  и   n.
   2 n  a1  a0   

Теперь из уравнения P   c    найдем c . Для этого рассмотрим

41
 t2  t2 c t2
1  1  1  1
P   c   e 2
dt   e 2
dt  e 2
dt     c  .
2 c 2 0 2 0
2
1 1
Тогда для нахождения c получаем уравнение    c    , то есть   c     .
2 2
x t2
1 
По таблице 2 значений функции   x    2 dt находим критическую точку c .
e
2 0
xв  a0
Теперь, если    n  c , то у нас нет оснований отвергать гипотезу H 0 , если же

  c , то гипотезу H 0 отвергаем.
На рисунке 4 изображена критическая область S ,
вероятность попадания в которую равна  .

Предположим, что нам известно гипотетическое значение a1 . Тогда мы можем найти


мощность W  1   построенного правостороннего критерия. Для этого вычислим
 p1  
 
  xв  a1 c a 
  P
 p0  

 c | H1   P x в  c1 | H1  P  
n  1 1 n   P   c  ,
 
    
c a c a a a a a
где c  1 1 n  1 0 n  1 0 n  c   и   1 0 n .
   
Тогда
c t2 0 t2 c t2
  P   c      c      c    .
1  1  1  1 1
2 e

2 dt 
2 e

2 dt 
2 e
0
2 dt 
2 2
Таким образом, зная c и  , можно найти  , а значит и мощность

   c      c   
1 1
W  1  
2 2
построенного правостороннего критерия.
Наконец, если заданы ошибки  и  (или мощность W  1   ), то можно найти объем
выборки, обеспечивающий эти ошибки.

  находим c , а из уравнения   c    
1 1
Действительно, из уравнения   c  
2 2
находим c . Далее, из соотношения
2
a1  a0  c  c 
c  c   , то есть n  c  c находим n     .
2

  a1  a0 
Пример 1. По выборке объема n  16 , извлеченной из генеральной совокупности,
распределенной нормально со среднеквадратичным отклонением   4 , найдено
xв  2,3 . Требуется при уровне значимости   0,05 :

1) Проверить основную гипотезу H 0 : a  a0  2


при альтернативной гипотезе H1 : a  a1  2 ;

42
2) Найти мощность построенного правостороннего критерия при значении a1  3 ;
3) Найти объем выборки n , при котором мощность критерия будет равна W  0,6 .

1
Из уравнения   c      0, 45 по таблице 2 значений функции   x  находим
2
xв  a0
2,3  2
c  1,65 . Вычислим   n
 4  0,3 .
 4
Так как   0,3  c  1,65 , то у нас нет оснований отвергать гипотезу H 0 .
a1  a0 3 2
Найдем далее c  c    c  n  1, 65   4  0, 65 и мощность построенного
 4
   c   0,5  0, 24  0, 26 .
1
правостороннего критерия W  1   
2
Найдем теперь объем выборки n , при котором мощность критерия будет равна W  0,6 .

В этом случае   1  W  1  0,6  0, 4 и из уравнения   c    


1
 0, 4  0,5  0,1 по
2
таблице 2 с учетом того, что функция   x  нечетна, находим c  0, 25 . Тогда
2
 c c   1, 65  0, 25 
2

n        16 
2
  58 .
 a1  a0   3 2 

Рассмотрим теперь случай, когда альтернативная гипотеза левая односторонняя


H 0 : a  a0
H1 : a  a1  a0
Критическая область S и в этом случае определяется при некотором c из равенства
 p  
 

P 1  c | H 0    . Но в этом случае a1  a0 и, разрешая неравенство (2) относительно
 p0  
 

a1  a0 2
x в , получим xв  c1 , где c1    ln c . Таким образом,
2 n  a1  a0 

 p1    xв  a 
  P

 p0  





 
 c | H 0   P x в  c1 | H 0  P 
 

0
n  1


c   a0 
n   P   c  ,

xв  a0 c1  a0
где   n и c  n.
 
Теперь из уравнения P   c    следует найти c . Для этого рассмотрим
 c t2 0 t2  c t2
1  1  1  1 1
P   c   e 2 dt  e 2 dt  e 2 dt     c      c  .
2  2  2 0
2 2
Таким образом, для нахождения c получаем тоже уравнение, что и в предыдущем случае
1
  c    .
2

43
xв  a0
По таблице 2 находим значение c . Если   n  c , то гипотезу H 0 отвергаем,

иначе принимаем.
На рисунке 5 изображена критическая область S ,
вероятность попадания в которую равна  .

Если нам известно гипотетическое значение a1 , то мы можем найти мощность W  1  


построенного левостороннего критерия. Для этого вычислим
 p    xв  a 

  P 1
 p0  





 
 c | H1   P x в  c1 | H1  P 
 

1
 c   a1
n  1

n   P   c  ,

c1  a1 c1  a0 a1  a0 a1  a0
где c  n n n  c   , где   n тоже, что и в
   
предыдущем случае. Тогда
 t2  t2 0 t2
  P   c      c      c  .
1  1  1  1 1
2 e
 c
2
dt  
2 0
e 2
dt 
2 e
 c
2
dt 
2 2

   c      c    и мощность критерия
1 1
Таким образом,  
2 2
1
W  1       c    .
2
Наконец, если заданы уровень значимости  и мощность W , то находя c и c

  и   c       W , из соотношения
1 1 1
соответственно из уравнений   c  
2 2 2
2
a1  a0  c  c 
c  c    c  n найдем объем выборки n     , обеспечивающий эти
2

  a1  a0 
заданные величины.
Рассмотрим еще случай, когда альтернативная гипотеза двусторонняя
H 0 : a  a0 (3)
H1 : a  a1  a0
Так как условие a1  a0 эквивалентно тому, что a1  a0 или a1  a0 , то мы можем
воспользоваться результатами двух предыдущих случаев
  P   c   P   c   P   c      c      c   1  2  c 
1 1
2 2
1
и для нахождения c получаем уравнение   c   .
2
x в  a0
Теперь, если   n  c , то гипотезу H 0 отвергаем, иначе принимаем.

44
На рисунке 6 изображена критическая область S , состоящая из
двух интервалов, вероятность попадания в каждый из них равна

. Поскольку  есть нормированная нормально
2
распределенная случайная величина, а распределение такой величины симметрично
относительно нуля, то и критические точки симметричны относительно нуля. В этом
случае достигается наибольшая мощность критерия.
Для нахождения мощности построенного двустороннего критерия найдем

  
  P xв  c1 | H1  P x в  c1 | H1  P 
 

 xв  a1 c a 
n  1 1 n
 

 xв  a1 c   a1 

P  n  1 n   P   c    P   c   
 
  

 P c      c      c       c       c       c    .
Тогда W  1    c       c    .

Замечание. Находя двустороннюю критическую область при уровне значимости  , мы


одновременно находим и доверительный интервал для математического ожидания a с
надежностью   1   . Действительно, при проверке двусторонней гипотезы (3), мы
xв  a0
требовали, чтобы вероятность попадания случайной величины   n в

двустороннюю критическую область S была равна  . Следовательно, вероятность
попадания величины  в область принятия гипотезы  c ; c  равна   1   . Другими
xв  a0
словами с надежностью  выполняется неравенство c  n  c , откуда

  1 
xв  c  a  xв  c , где   c    , а это и есть доверительный интервал
n n 2 2
для математического ожидания a .
Хотя отыскание двусторонней критической области и доверительного интервала приводит
к одинаковым результатам, их истолкование различно: двусторонняя критическая область
определяет границы (критические точки), между которыми заключено 1    % числа
наблюдаемых значений величины  , найденных при повторении опытов; доверительный
же интервал определяет границы (концы интервала), между которыми в   1    %
опытов заключено истинное значение параметра a .

II. Проверка гипотез о значении математического ожидания a , если дисперсия


 2 не известна.
Пусть необходимо проверить гипотезы
H 0 : a  a0
H1 : a  a1  a0 (правая односторонняя).
45
Как и в предыдущем пункте, критическая область S определяется при некотором c из
соотношения

 p1  
 

  P
 p0  

 c | H 0   P xв  c1 | H 0 .


 
Дальнейшие рассуждения аналогичны тем, которые мы делали в § 10 при нахождении
доверительного интервала для математического ожидания для случая, когда дисперсия не
известна.
Выборочное среднее x в имеет математическое ожидание M xв  a и дисперсию
2
Dx в  . Поскольку дисперсия  2 не известна, то по выборке   1 , 2 ,..., n  найдем
n
n s2
исправленную выборочную дисперсию s 2  Dв и примем Dx в  . Введем
n 1 n
нормированную случайную величину

1 n 1 n 1 n i  a
xв  M xв xв  a n
i   a
n
 i   a  
n i 1 
t  n  n i 1  n i 1  .
Dx в s n n n Dв
Dв Dв 
n 1 n 1 n 1  2
 a
Перейдем к случайным величинам i  i , которые распределены нормально с


параметрами a  0 и    1. Для нее Dв  и тогда
2
1 n  1 n  1 n 
 i
n i 1
 i
n i 1
 i
n i 1
t   .
n n  1 n 2  1 n    1  n 2  1 n   
2 2
Dв
n 1   i    i     i    i  
n  1  n i 1  n i 1   n  1  i 1  n i 1  
 

 
Введем в n -мерном пространстве выборок 1 , 2 ,...,  n новую ортогональную систему

1 n  n n
1, i  m
координат 1 ,2 ,...,n  так, что 1   i ,  j    jii и   jm   im   .
0, i  m
ji
n i 1 i 1 j 1
n n
Мы ранее показали, что     
j 1
2
j
i 1
i
2
. Тогда

1 1
t  .
1  n 2  1 n 2
 j  1 
n  1  j 1
2
 j
n  1 j 2

Поскольку случайные величины  j , так же как и  i , распределены нормально с
параметрами 0 и 1, то случайная величина t имеет распределение Стьюдента с n  1
степенью свободы. Таким образом

46

 xв  a0 c a 
 c a
 
  P xв  c1 | H 0  P 

n  1 0 n   P t  c  , где c  1 0 n .

 s s  s
По таблице 5 критических точек распределения Стьюдента для случая односторонней
критической области находим c  c  ; n  1 . Теперь, если
xв  a0
t n  c , то гипотезу H 0 отвергаем, иначе принимаем.
s
Совершенно аналогично рассматривается случай левой односторонней гипотезы
H 0 : a  a0
H1 : a  a1  a0
 p  

Имеем   P  1
 p0  



 
 c | H 0   P x в  c1 | H 0  P t  c  .


По таблице 5 критических точек распределения Стьюдента для случая односторонней
критической области находим c  c  ; n  1 . Теперь, если
xв  a0
t n  c , то гипотезу H 0 отвергаем, иначе принимаем.
s
Для случая двусторонней гипотезы
H 0 : a  a0
H1 : a  a1  a0 ,
объединяя два предыдущих случая, получим уравнение   P  t  c  .
По таблице 5 критических точек распределения Стьюдента для случая двусторонней
x в  a0
критической области находим c  c  ; n  1 . Если t  n  c , то гипотезу H 0
s
отвергаем, иначе принимаем.
Как мы уже отмечали ранее, с ростом n распределение Стьюдента стремится к
нормальному распределению и при достаточно больших n значение c следует находить
1 1
из уравнений   c    для односторонних гипотез и   c   для двусторонней
2 2
гипотезы, которые мы получили в пункте I при рассмотрения случая с известной
дисперсией.
Пример 2. Из генеральной совокупности, распределенной по нормальному закону,
извлечена выборка объема n  25 и по ней найдены выборочная средняя xв  102,5
и исправленное среднеквадратичное отклонение s  7,5 . Требуется при уровне
значимости   0,02 проверить основную гипотезу H 0 : a  a0  100 при
конкурирующей гипотезе H1 : a  a1  a0 .

47
По уровню значимости   0,02 и числу степеней свободы n  1  24 по таблице 5
критических точек распределения Стьюдента для двусторонней критической области
xв  a0 102,5  100
находим c  2, 49 . Далее вычислим t  n  5  1, 67 .
s 7,5

Так как t  1,67  c  2, 49 , то гипотезу H 0 принимаем, то есть отличие xв  102,5 от


гипотетического значения a  100 не существенно для данного уровня значимости.

III. Сравнение математических ожиданий двух случайных величин, дисперсии


которых известны.
Пусть даны две случайные величины  и  , распределенные нормально с параметрами
a1 ,  1 и a2 ,  2 соответственно. Будем считать, что их дисперсии  12 и  22 известны, а
относительно математических ожиданий имеются гипотезы
H 0 : a1  a2
H1 : a1  a2
По выборкам  1  1 , 2 ,..., n  и  2  1 ,2 ,...,m  объемов n и m соответственно,
находим выборочные средние
1 n 1 m
x в   i и y в  i .
n i 1 m i 1
Как и в предыдущих случаях рассмотрим нормированную случайную величину

z
x
  в .
 y в  M xв  y в

Dx  y  в в

При гипотезе H имеем M  x  y   M x


0 в в в  M y в  a1  a2  0 ,

12  22 xв  y в
 
D xв  y в  Dx в  D y в 
n

m
, то есть z 
 12  22
.

n m
По центральной предельной теореме случайная величина z распределена асимптотически
нормально с параметрами a  0 и   1 . Так как альтернативная гипотеза двусторонняя,

то   P  z  c | H 0   P z  c   P z  c      c      c   1  2  c 
1 1
2 2
и для нахождения критической точки c приходим к уже известному нам уравнению
1
  c  
.
2
Зная уровень значимости  , находим по таблице 2 значений функции   x  значение c .
Теперь, если z  c , то гипотезу H 0 принимаем, если же z  c , то гипотезу H 0
отвергаем.
В случае, когда конкурирующая гипотеза односторонняя (правая или левая)
H 0 : a1  a2 или H 0 : a1  a2
H1 : a1  a2 H1 : a1  a2 ,
48
1
то значение c находится из уравнения   c    и гипотезу H 0 принимаем при
2
z  c для правой односторонней гипотезы и принимаем при z  c для левой
односторонней гипотезы.
Пример 3. Из двух генеральных совокупностей, распределенных нормально с
дисперсиями 12  80 и  22  100 соответственно, по двум независимым выборкам
объема n  40 и m  50 найдены выборочные средние xв  130 и y в  140 . При
уровне значимости   0,01 требуется проверить гипотезы
H 0 : a1  a2
H1 : a1  a2 .

xв  y в 130  140 10
Вычислим z     5 .
 12  22 80 100

4

mn 40 50
1   0,99
Из уравнения   c     0, 495 по таблице 2 значений функции   x  находим
2 2
c  2,58 . Так как z  5  c  2,58 , то гипотезу H 0 отвергаем, то есть математические
ожидания разнятся значительно.

IV. Проверка гипотез о значении дисперсии  2 .


Пусть при уровне значимости  требуется проверить гипотезы
H 0 :  2   02
H1 :  2  12   02 (правая односторонняя).
Согласно теореме Неймана-Пирсона составим отношение правдоподобия
n n

p1    1   2 2 i a 
1 2

, где p j      e j i 1 , j  0,1 .
p0    
 j 2 

1 1 1 
n

p1     0   2  12  02 


n
i  a 2
В данном случае   e i 1
.
p0     1 
Критическая область S определяется при некотором c из равенства
 p  
 

P 1  c | H0    .
 p0  
 

1 1 1 
n

p1     0   2  12  02 


n
i  a 2
Рассмотрим неравенство   e i 1
c
p0     1 
n

   a :
2
и разрешим его относительно i
i 1

 1 1 1  n 2  1   12   02
n
n    n 
exp    2  2   i  a       c ,    a  ln  1   c 
2

 2   1  0  i 1   0  2 02 12   0  
i
i 1

49
2 02 12   1  
n
n
и так как 1   0 , то    a ln    c  .
2
 2
i
 1   02   0  
i 1
 

2 02 12   1  
n

Обозначим через c1  2 ln    c  . Таким образом


 1   02   0  
 

 p1  
 
 n 
  P  c | H 0   P  i  a   c1 | H 0  .
2

 p0  
 
  i 1 

Поскольку математическое ожидание a неизвестно, то заменим его несмещенной

 
n n

  i  a    i  x в
2 2
точечной оценкой x в . Тогда  nDв . Перейдем к нормированным
i 1 i 1

i  x в D
случайным величинам i  , распределенным нормально. Тогда Dв  2в и
 
 nDв c1   c 
  P nDв  c1 | H 0   P   2
 P nDв  12  .
 0  0 
2
0 
Введем случайную величину (при гипотезе H 0 )

 n  1 s 2
2
nDв n
 1 n 
2    nDв   i2    i  .
 02  02 i 1  n i 1 


В n -мерном пространстве выборок 1 , 2 ,...,  n введем новую ортогональную систему 
1 n  n n
1, i  m
координат 1 ,2 ,...,n  так, что 1  i j 
 ,    jii и   jm   im   .
0, i  m
ji
n i 1 i 1 j 1

При этом случайные величины  j также нормированы и распределены нормально.


n n
Ранее при построении доверительных интервалов мы показали, что     
j 1
2
j
i 1
i
2
.

n n
Тогда  2   2j  12   2j имеет распределение Пирсона или  2 с n  1 степенью
j 1 j 2

свободы. Таким образом

  P  2  c  , где c 
c1
.
 02
По таблице 6 критических точек распределения  2 находим c  c  ; n  1 . Теперь, если

для найденного значения  



2 n  1 s 2
 c , то гипотезу H 0 отвергаем, иначе принимаем.
2
0
Если альтернативная гипотеза левая односторонняя
H 0 :  2   02
H1 :  2  12   02
то для нахождения критической области получаем равенство
50
 p1  
 
 n   c 
  P  c | H 0   P  i  a   c1 | H 0   P nDв  12   P  2  c .
2
 
 p0  
 
  i 1   0 
По той же таблице 6 критических точек распределения  2 находим c  c 1   ; n  1 и

тогда, если для найденного значения  2 


 n  1 s 2  c , то основную гипотезу H 0

 02
отвергаем, иначе принимаем.
В случае двусторонней гипотезы
H 0 :  2   02
H1 :  2  12   02 ,
объединяя два предыдущих случая, по таблице 6 критических точек распределения  2
    
находим две критические точки c   c  ; n  1 и c   c 1  ; n  1 и тогда, если
2   2 
c    2  c  , то гипотезу H 0 принимаем, иначе отвергаем.

Пример 4. Из генеральной совокупности, распределенной нормально, извлечена выборка


объема n  30 и по ней найдена исправленная выборочная дисперсия s 2  12,5 .
Требуется при уровне значимости   0,01 проверить основную гипотезу
H 0 :  2   02  14 при конкурирующей гипотезе H1 :  2  12  14 .

Вычислим сначала  
2  n  1 s 2

29 12,5
 25,9 . Учитывая, что гипотеза левая
0
2
14
односторонняя по таблице 6 критических точек распределения  2 находим
c  c 1   ; n  1  c  0,99;29   14,3 . Так как  2  25,9  c  14,3 , то гипотезу H 0
принимаем, то есть различие между найденной исправленной выборочной дисперсией s 2
и гипотетическим значением  02 не значительно.

§ 11.2. Проверка гипотез о значении вероятности p биномиального распределения.

Пусть случайная величина  имеет биномиальное распределение


P   k  Cnk p k q nk , q  1  p , при этом M   np и D  npq .

I. Проверка гипотез о значении вероятности p появления события в одном


испытании.
Рассмотрим сначала случай, когда альтернативная гипотеза правая односторонняя
H 0 : p  p0
H1 : p  p1  p0
Отношение правдоподобия для биномиального распределения имеет вид
p1  x  Cnx p1x 1  p1   p 1  p0  
n x n x
 1  p1 
 x x     1  .
p0  x  Cn p0 1  p0  n x
 1  p0  p
 0 1  p 
1 

51
 p  x
 

Критическая область S определяется при некотором c из условия P  1  c | H0    .
 p0  x 
 

p  x   1  p1   p 1  p0  
n x

Рассмотрим неравенство 1     1   c и разрешим его


p0  x   1  p0   p0 1  p1  
относительно x :
 p1 1  p0  
x
 1  p0 
n
p1 1  p0    1  p n 
   c   ; x ln  ln c  0
 
p
 0 1  p 
1   1  p1  p0 1  p1  
 
1  p1  

p1 1  p0 p 1  p0 
Так как p1  p0 , то   1 и ln 1  0 , откуда
p0 1  p1 p0 1  p1 
  1  p n   p 1  p   1
x  ln c  0
   ln
1 0
 .
  1  p1    p0 1  p1  

 p  x
 

Таким образом P  1  c | H 0   P  x  c1 | H 0    ,
 p0  x 
 

  1  p n   p 1  p   1
где c1  ln c  0
   ln
1 0
 .
  1  p1    p0 1  p1  
x  Mx x  np
Введем случайную величину    , которая по теореме Муавра-Лапласа
Dx npq
x
асимптотически нормальна с параметрами a  0,   1. Если задается частота  
n
x  np  p
наступления события в n независимых испытаниях, то     n.
npq p 1  p 

 x  np0 c1  np0  
Тогда   P  x  c1 | H 0   P     P   c  ,

 np0 1  p0  np 0 1  p 
0 
c1  np0
где c  . Так как
np0 1  p0 
 t2  t2 c t2
1  1  1  1
P   c   e 2
dt   e 2 dt  e 2
dt     c  ,
2 c 2 0 2 0
2
1
то для нахождения c получаем уже известное нам уравнение   c    .
2
x  np0   p0
Теперь, если     n  c , то гипотезу H 0 отвергаем, иначе
np0 1  p0  p0 1  p0 
принимаем.
Если задано гипотетическое значение вероятности p1 , то можно найти мощность
построенного правостороннего критерия, Для этого найдем сначала

52
 p1  x 
 
  x  np1 c1  np1 
  P  c | H1   P  x  c1 | H1  P     P   c  , где

 p0  x  
 
 np1 1  p1  np 1 1  p 
1 

c1  np1 p0 1  p0  c1  np0 p0 1  p0  n  p0  p1 
c      
np1 1  p1  p1 1  p1  np0 1  p0  p1 1  p1  np0 1  p0 

p0 1  p0  p0  p1
  c   и   n.
p1 1  p1  p1 1  p1 
c t2 0 t2 c t2
Учитывая, что P   c      c  получим
1  1  1  1
2 e

2 dt 
2 e

2 dt 
2 e
0
2 dt 
2
 p0 1  p0  
     c     
1 1
 c    и мощность построенного критерия равна
2 2  p1 1  p1  
 
1  p0 1  p0  
W  1  
  c    .
2  p1 1  p1  
 
Если же заданы уровень значимости  и мощность W (или ошибка II-го рода  ), то
можно найти минимальный объем выборки n , обеспечивающий эти величины.

Действительно, из уравнения   c     находим c , а из уравнения   c    


1 1
2 2
p0 1  p0  p0  p1
находим c . Далее, учитывая связь между ними c   c  n,
p1 1  p1  p1 1  p1 

получим  p0  p1  n  p1 1  p1   c   p0 1  p0   c , откуда
2
 p1 1  p1   c  p0 1  p0   c 
n  .
 p0  p1 
 
Проведенные рассуждения и полученные формулы аналогичны тем, которые были
получены для нормального распределения при проверке гипотез о значении
математического ожидания a при известной дисперсии  2 .
Аналогично рассматривается случай левосторонней альтернативной гипотезы
H 0 : p  p0
H1 : p  p1  p0
p 1 1  p0  p 1 1  p0 
С учетом того, что  1 и ln  0 получим
p0 1  p1  p0 1  p1 

 p1  x    1  p n   p 1  p   1

  P
 p0  x 





 
 c | H 0   P x  c1 | H 0 , где c1   ln c  0
   ln
1 0
 .
  1  p1    p0 1  p1  

53
 c1  np0 
Далее имеем   P x  c1 | H 0  P 


 x  np0
np 1  p 

np 1 
p 

  P   c  , где

 0 0 0 0 

c1  np0
c  . Учитывая, что
np0 1  p0 
 c t2 0 t2  c t2
1  1  1  1 1
P   c   e 2 dt  e 2 dt  e 2 dt     c      c  ,
2  2  2 0
2 2
1
для определения c получаем тоже уравнение   c    .
2
x  np0   p0
Если теперь     n  c , то гипотезу H 0 отвергаем, иначе
np0 1  p0  p0 1  p0 
принимаем.
По заданной гипотетической вероятности p1 найдем мощность построенного
левостороннего критерия
 p1  x 
  P

 p0  x 




 c | H1   P x  c1 | H1  P   c  , где



c1  np1 p0 1  p0  c1  np0 p0 1  p0  n  p0  p1 
c      
np1 1  p1  p1 1  p1  np0 1  p0  p1 1  p1  np0 1  p0 

p0 1  p0  p0  p1
  c   и   n.
p1 1  p1  p1 1  p1 
 t2  t2 0 t2
Учитывая, что P   c  
1  1  1 

2 e
 c
2
dt  
2 0
e 2 dt 
2 e
 c
2
dt 

 c t2

   c      c  получим
1 1  1 1
 
2 2 e
0
2 dt 
2 2
 p0 1  p0  
     c     
1 1
 c    и мощность построенного критерия равна
2 2  p1 1  p1  
 
1   p0 1  p0 
W  1    c    .

p1 1  p1 
2  
 
Если же заданы ошибки I-го и II-го рода  и  , то найдя c и c соответственно из уравнений

  и   c     и учитывая связь между ними


1 1
  c  
2 2
p0 1  p0  p0  p1
c   c  n , найдем минимальный объем выборки, обеспечивающий
p1 1  p1  p1 1  p1 
2
 p0 1  p0   c  p1 1  p1   c 
эти ошибки n    .
 p0  p1 
 
54
Если же альтернативная гипотеза двусторонняя
H 0 : p  p0
H1 : p  p1  p0
то, объединяя два рассмотренных выше случая, получим

  P   c   P   c   P   c      c      c   1  2  c 
1 1
2 2
1
и для нахождения c получаем уравнение   c   .
2
x  np0   p0
Если теперь    n  c , то гипотезу H 0 отвергаем, иначе
np0 1  p0  p0 1  p0 
принимаем.
Найдем мощность построенного двустороннего критерия

 p0 1  p0  p0 1  p0  

  P c    c   P   c       c    
 p1 1  p1  p1 1  p1  
 
 p0 1  p0    p 1  p0  
   c        0  c    
 p1 1  p1    p1 1  p1  
   
 p0 1  p0    p0 1  p0  
   c        c    и
 p1 1  p1    p1 1  p1  
   
 p0 1  p0    p0 1  p0  
W  1    c        c    .
 p1 1  p1    p1 1  p1  
   
Пример 5. По 100 независимым испытаниям найдена относительная частота   0,14 .
При уровне значимости   0,05 требуется проверить гипотезы
H0 : p  p0  0, 2
H1 : p  p1  0, 2 .
Найти мощность построенного двустороннего критерия для гипотетического
значения p1  0,1 .
1   0,95
Из уравнения   c     0, 475 по таблице 2 значений функции   x  находим
2 2
  p0 0,14  0, 2 0, 06
c  1,96 . Вычислим   n 100  10  1,5 .
p0 1  p0  0, 2  0,8 0, 4

Так как   1,5  c  1,96 , то у нас нет оснований отвергать гипотезу H 0 . Таким образом
наблюдаемая относительная частота   0,14 незначимо отличается от гипотетической
вероятности p0  0, 2 .
Для нахождения мощности построенного критерия вычислим сначала

55
p0 1  p0  0, 2  0,8 4
 c  1,96  1,96  2, 61 и
p1 1  p1  0,1 0,9 3
p0  p1 0, 2  0,1 0,1
 n 100  10  3,33 .
p1 1  p1  0,1 0,9 0,3
Тогда мощность
W  1    2,61  3,33    2,61  3,33  1    5,94     0,72   1  0,5  0, 264  0,764 .

II. Сравнение двух вероятностей биномиального распределения.


Пусть имеется две генеральные совокупности, распределенные по биномиальному
закону, с неизвестными вероятностями p1 и p2 наступления события A в этих
совокупностях. Из этих генеральных совокупностей извлечены выборки объемов n1 и n2
соответственно и пусть число появлений события A в этих выборках равны m1 и m2
m1 m
соответственно, то есть известны относительные частоты 1  и 2  2 .
n1 n2
Предположим, что требуется проверить гипотезу о равенстве вероятностей наступления
события A в этих двух генеральных совокупностях
H 0 : p1  p2
H1 : p1  p2
Как было показано ранее в §10.3, точечной несмещенной оценкой для вероятности p
m pq
является относительная частота   : M    p , при этом ее дисперсия D    .
n n
Введем нормированную случайную величину
    M 1  2 
 1 2 ,
D 1  2 
которая будет асимптотически нормальной с параметрами a  0 и   1 .
При гипотезе H 0 вероятности p1  p2  p , где p их общее значение. Тогда
M 1  2   M 1   M 2   p  p  0
pq pq 1 1
D 1  2   D 1   D 2     p 1  p    
n1 n2  n1 n2 
Кроме того, объединяя обе выборки в одну, получим следующую оценку для их общей
m  m2
вероятности p  1 .
n1  n2
1  2
Таким образом,   .
m1  m2  m1  m2  1 1 
1    
n1  n2  n1  n2  n1 n2 
Так как гипотеза двусторонняя, то, как мы уже показывали ранее, критическая область S
определяется при некотором c из соотношения P   c | H 0    , что приводит нас к
1
уже известному уравнению   c   .
2
56
Теперь, если   c , то гипотезу H 0 принимаем, то есть вероятности p1 и p2 разнятся
незначительно, если же   c , то гипотезу H 0 отвергаем.

В случае односторонних гипотез


H 0 : p1  p2 или H 0 : p1  p2
H1 : p1  p2 H1 : p1  p2
1
то значение c находится из уравнения   c   .
2
Гипотезу H 0 принимаем, если   c при правосторонней гипотезе и   c при
левосторонней гипотезе. В противных случаях гипотезу H 0 отвергаем.

Пример 6. Первое предприятие изготовило партию из 800 изделий и из них 15 оказалось


бракованными. Второе предприятие изготовило партию в 1000 изделий и из них
бракованными оказалось 25 изделий. Требуется при уровне значимости   0,05
проверить гипотезу о равенстве вероятностей изготовления бракованного изделия
обоими предприятиями:
H 0 : p1  p2
H1 : p1  p2
1   0,95
Из уравнения   c     0, 475 по таблице 2 находим c  1,96 .
2 2
15 25

800 1000 0, 01875  0, 025 0, 28125
Вычислим      0,89 .
40  40  1 1  1 44 0,3146
1       0, 00225
1800  1800  800 1000  45 45
Так как   0,89  c  1,96 , то у нас нет оснований отвергать нулевую гипотезу. Таким
образом, вероятности изготовления бракованного изделия у обоих предприятий
различаются незначительно.
Задания.
1. Из генеральной совокупности, распределенной по нормальному закону с
известным среднеквадратичным отклонением   5 , извлечена выборка объема
n  36 и по ней найдена выборочная средняя xв  13,5 . Требуется при уровне
значимости   0, 01 : 1) проверить основную гипотезу H 0 : a  a0  15 при
конкурирующей гипотезе H1 : a  a1  15 ; 2) найти мощность построенного
левостороннего критерия проверки для гипотетического значения a1  14 ; 3) найти
минимальный объем выборки n , при котором мощность критерия равна 0,8.
2. Из генеральной совокупности, распределенной по нормальному закону с
известным среднеквадратичным отклонением   5 , извлечена выборка объема
n  49 и по ней найдена выборочная средняя xв  27,5 . Требуется при уровне
значимости   0,02 : 1) проверить основную гипотезу H 0 : a  a0  26 при
конкурирующей гипотезе H1 : a  a1  26 ; 2) найти мощность построенного
левостороннего критерия проверки для гипотетического значения a1  28 .
57
3. Из генеральной совокупности, распределенной по нормальному закону, извлечена
выборка
7. x8.i 29. 410. 611. 12.
8 13.
10 12
14. n15.
i
216. 17.
6 10
18. 12
19. 20.
8 3
Требуется при уровне значимости   0, 01 проверить основную гипотезу
H 0 : a  a0  7 при конкурирующей гипотезе H1 : a  a1  7 .
4. Из генеральной совокупности, распределенной по нормальному закону, извлечена
выборка
21. x22.
i
23.
2 2,5
24. 25.
3 3,5
26. 27.
4 4,5
28. n29.
i
130. 331. 832. 633. 34.
2 1
Требуется при уровне значимости   0,02 проверить основную гипотезу
H 0 : a  a0  3 при конкурирующей гипотезе H1 : a  a1  3 .
5. Из двух генеральных совокупностей, распределенных нормально с дисперсиями
12  60 и  22  80 соответственно, по двум независимым выборкам объема n  30
и m  40 найдены выборочные средние xв  130 и y в  125 . При уровне
значимости   0,05 требуется проверить гипотезы
H 0 : a1  a2
H1 : a1  a2 .
6. Точность работы станка-автомата проверяется по дисперсии контролируемого
размера изделий, которая не должна превышать  02  0,1 . В результате измерений
25 случайно отобранных изделий получена следующая выборка

xi 2,8 3,0 3,2 3,4 3,6


ni 2 6 9 7 1
Предполагается, что размер изделия xi есть нормально распределенная случайная
величина. Требуется при уровне значимости   0,05 проверить, обеспечивает ли
станок требуемую точность. Принять нулевую гипотезу H 0 :  2  0,1 при
конкурирующей гипотезе H1 :  2  0,1 .
7. Из генеральной совокупности, распределенной по нормальному закону, извлечена
выборка
35. x36.
i
5637. 5838. 6039. 6240. 64
41. ni42. 1 43. 444. 1045. 3 46. 2
Требуется при уровне значимости   0,05 проверить нулевую гипотезу
H 0 :  2   02  2 при конкурирующей гипотезе H1 :  2  2 .
8. Предприятие рассылает рекламные каталоги возможным заказчикам. Как показал
опыт, вероятность того, что организация, получившая каталог, закажет
рекламируемое изделие, равна 0,08. Предприятие разослало 1000 каталогов новой
улучшенной формы и получило 100 заказов. Можно ли при уровне значимости
  0,05 считать, что новая форма каталога оказалась эффективнее старой?
Принять нулевую гипотезу H 0 : p  p0  0,08 при конкурирующей гипотезе
58
H1 : p  p1  0,08 . Найти мощность построенного правостороннего критерия для
гипотетического значения p1  0,1 .
9. При n  100 выстрелов по цели каждым из двух орудий зарегистрировано
соответственно m1  10 и m2  12 промахов. При уровне значимости   0,05
проверить нулевую гипотезу H 0 : p1  p2 о равенстве вероятностей промаха обоих
орудий при конкурирующей гипотезе H1 : p1  p2 .

§ 12. Статистическая проверка гипотез о виде закона распределения.


В предыдущем разделе были рассмотрены так называемые параметрические критерии,
предназначенные для проверки гипотез о значении параметров распределений, если закон
распределения случайной величины известен. В данном разделе речь пойдет о
непараметрических критериях, предназначенных для проверки гипотез о виде закона
распределения.
Пусть   1 , 2 ,..., n  выборка из генеральной совокупности, закон распределения
которой неизвестен. Основная гипотеза H 0 утверждает, что закон распределения имеет
вполне конкретный вид (нормальный, показательный или какой-либо другой) и задается
функцией распределения F  x  . Альтернативная гипотеза здесь никак не
конкретизируется, то есть гипотеза H1 утверждает «не H 0 » и речь идет просто о согласии
данных выборки и гипотезы H 0 . Наиболее известными критериями согласия для данной
задачи являются критерий Колмогорова и критерий Пирсона или  2 (хи-квадрат).

§ 12.1. Критерий Колмогорова.


Этот критерий применяется в том случае, когда гипотетическая функция распределения
F  x  абсолютно непрерывна. Критерий Колмогорова базируется на теореме Гливенко,
которая говорит о сходимости по вероятности эмпирической функции распределения
Fn  x  к теоретической функции распределения F  x 

 
lim P sup Fn  x   F  x     1 .
n  x 

В качестве критерия выбирается величина


Dn  sup Fn  x   F  x  .
 x 

Она замечательна тем, что распределение величины Dn при гипотезе H 0 не зависит от


вида функции F  x  , то есть в качестве гипотетической функции F  x  может выступать
произвольная абсолютно непрерывная функция распределения. Кроме того она имеет
предельное распределение, а именно
  
   1 e  1  2  1 e 2 k x , x  0
k  2 k 2 x2 k 2 2

lim P
n 
 
nDn  x  K  x   k  k 1 .
0, x  0

Критическая область S при заданном уровне значимости  и достаточно больших n
(уже при n  20 ) определяется соотношением

59
P  
nDn  c | H 0  1  K  c  .
Критическое значение c определяется из уравнения K  c   1   при помощи таблицы
9 значений функции K  x  . Если nDn  c , то гипотезу H 0 принимаем, иначе отвергаем.
Пример 1. Из генеральной совокупности извлечена выборка объема n  200
xi 0,3 0,5 0,7 0,9 1,1 1,3 1,5 1,7 1,9 2,1 2,3

ni 6 9 24 27 30 26 23 22 20 8 3

Используя критерий Колмогорова, при уровне значимости   0,01 , проверить


гипотезу о нормальном распределении генеральной совокупности.
Сначала найдем точечные несмещенные оценки параметров нормального распределения
1 11 1
a  xв   xi ni   0,3  6  0,5  9  ...  2,3  5  1, 2620
n i 1 200

1 11

 xi  xв  1 
 0,3  1, 262   6  ...   2,3  1, 262   3  0, 2381 ,
2
 2  s2 
2 2
ni 
n  1 i 1 199  

откуда   s  0, 2381  0, 4880 .

Далее вычислим значения теоретической функции распределения F  x  в точках xi

1  x a 1  xi  1, 262 
F  xi     i     .
2    2  0, 488 
При помощи таблицы 2 вычислим
 0,3  1, 262 
F  0,3  0,5      0,5    1,97   0,5  0, 4756  0, 0244 и так далее.
 0, 488 

Затем вычисляем значения эмпирической функции распределения Fn  x  в точках xi . Так


как эта функция терпит скачки в точках xi , то будем брать полу сумму левого и правого
1 6  1 6 15 
предельных значений Fn  0,3   0    0, 015 ; Fn  0,5      0, 0525 и
2 200  2  200 200 
так далее. Результаты вычислений занесем в следующую таблицу

60
xi ni F  xi  Fn  xi  F  xi   Fn  xi 

0,3 6 0,0244 0,0150 0,0093


0,5 9 0,0592 0,0525 0,0067
0,7 24 0,1247 0,1350 0,0103
0,9 27 0,2291 0,2625 0,0334
1,1 30 0,3700 0,4050 0,0350
1,3 26 0,5310 0,5450 0,0140
1,5 23 0,6871 0,6675 0,0196
1,7 22 0,8153 0,7800 0,0353
1,9 20 0,9045 0,8850 0,0195
2,1 8 0,9570 0,9550 0,0020
2,3 3 0,9833 0,9875 0,0042

Из таблицы находим Dn  sup F  x   Fn  x   0, 0353 и nDn  200  0, 0353  0, 499 .


x

По таблице 7 находим решение уравнения K  c   1    0,99 : c  1, 63 .


Так как nDn  0, 499  c  1,63 , то у нас нет оснований отвергать гипотезу о нормальном
распределении генеральной совокупности.

§ 12.2. Критерий Пирсона или  2 .

Одним из наиболее универсальных методов статистической проверки гипотез о виде


закона распределения является метод, предложенный К. Пирсоном в 1900 году и носящий
его имя. Пусть из генеральной совокупности извлечена выборка объема n , которую
запишем в виде вариационного ряда

x1 x2 ... xk

n1 n2 … nk

входящие в нее частоты ni  n1  n2  ...  nk  n  называют эмпирическими частотами.


Пусть основная гипотеза H 0 утверждает, что закон распределения генеральной
совокупности описывается функцией распределения F  x  . Найдем по выборке точечные
оценки параметров, входящих в функцию распределения, если они не заданы самой
гипотезой. Например, основная гипотеза – имеет место биномиальное распределение с
неизвестной вероятностью p наступления события в одном испытании, или – имеет
место биномиальное распределение с вероятностью p  0,3 наступления события в одном
испытании. Далее находятся так называемые теоретические частоты ni . Теоретическая
частота показывает сколько раз случайная величина примет значение xi , если бы был
справедлив гипотетический закон распределения случайной величины. Для этого согласно
61
гипотетическому закону вычисляются вероятности pi  P   xi  , а затем, учитывая

ni
приближенное равенство pi  , находят ni  npi . Если же выборка задается в виде
n
интервалов и соответствующим им эмпирических частот, то вероятности pi есть
вероятности попадания случайной величины в соответствующий интервал.
После этого вводится случайная величина

 n n
2
k

i i
 n2 .
i 1 ni
Эта случайная величина, во-первых, не зависит от вида функции F  x  , то есть в роли
гипотетической функции может выступать любая функция распределения, а во-вторых,
при достаточно больших объемах выборки она имеет предельное распределение. Этим
предельным распределением является распределение Пирсона или  2 с m  k  r  1
степенью свободы. В последней формуле k есть число различных вариант (или
интервалов) в выборке, а r есть число определяемых по выборке параметров
гипотетического распределения. На практике предельное распределение можно
использовать для расчетов с хорошим приближением уже при n  50 и ni  5  i  1, 2,..., k  .
Малочисленные частоты  ni  5 следует объединить; в этом случае и соответствующие
им теоретические частоты также суммируются. Если производилось объединение частот,
то при определении числа степеней свободы m  k  r  1 в качестве значения k следует
принять число групп выборки, оставшихся после объединения частот.
При заданном уровне значимости  критическая область S определяется из соотношения
 
P  2  c | H 0   . Критическое значение c находится по таблице 6 критических точек
распределения  2 с учетом числа степеней свободы. Если  n2  c , то гипотезу H 0 о
законе распределения принимаем, иначе отвергаем.
Рассмотрим вычисление теоретических частот для различных видов распределений.
I. Нахождение теоретических частот при проверке гипотез о нормальном
распределении для случая, когда выборка задана в виде последовательности
равноотстоящих вариант и соответствующих им частот.
Пусть вариационный ряд состоит из равноотстоящих вариант xi 1  xi  h . По выборке
находим точечные несмещенные оценки параметров нормального распределения a  xв и
xi  a xi  x в
 2  s 2 . Перейдем к нормированным случайным величинам ui   .
 s
ui2
1  1
Можно считать, что P  x  xi   P u  ui   e 2    ui  и
s 2 s
h nh
pi  P  xi  x  xi 1  P ui  u  ui 1   ui  , откуда ni  npi    ui  .
s s

62
 n n
2
k

i i
Теперь, зная ni и ni , находим  n2 и сравниваем с c , которое находится по
i 1 ni
таблице 6 критических точек распределения  2 с m  k  2 1  k  3 степенями свободы
( r  2 , так как оба параметра нормального распределения мы находили по выборке).
Если  n2  c , то гипотезу о нормальном распределении генеральной совокупности
принимаем, иначе отвергаем.
Пример 2. Используя критерий Пирсона, при уровне значимости   0,05 проверить,
согласуется ли гипотеза о нормальном распределении генеральной совокупности с
эмпирическим распределением выборки объема n  200
xi 5 7 9 11 13 15 17 19 21
ni 15 26 25 30 26 21 24 20 13

Находим точечные оценки параметров нормального распределения


1 9
a  xв   xi ni  12, 63 и  2  s 2 
1 9
  
2
xi  xв ni  22,1539 , откуда   s  4,7068 .
n i 1 n  1 i 1

nh 200  2
Далее вычисляем теоретические частоты ni    ui     ui   84,9834    ui  , где
s 4, 7068
2
x  xв xi  12, 63 1 2
u
ui  i  , а значения функции   u   e можно найти, используя
s 4, 7068 2
таблицу 1. Результаты вычислений представим в виде таблицы

  ui  ni
n  n  
2
xi ni ui
i i

ni
5 15 -1,6211 0,1072 9,1121 3,8046
7 26 -1,1961 0,1951 16,5790 5,3534
9 25 -0,7712 0,2963 25,1819 0,0013
11 30 -0,3463 0,3757 31,9303 0,1167
13 26 0,0786 0,3977 33,7990 1,7996
15 21 0,5035 0,3514 29,8669 2,6324
17 24 0,9284 0,2593 22,0324 0,1757
19 20 1,3534 0,1597 13,5681 3,0490
21 13 1,7783 0,0821 6,9753 5,2036

63
 n n
2
9

i i
Теперь находим  n2  22,1364 , а по таблице 6 по   0,05 и числу степеней
i 1 ni
свободы m  9  2 1  6 находим c  12,6 . Так как n2  22,14  c  12,6 , то гипотезу о
нормальном распределении генеральной совокупности отвергаем.

II. Нахождение теоретических частот при проверке гипотез о нормальном


распределении для случая, когда выборка задана в виде последовательности
интервалов одинаковой длины и соответствующих им частот.
Пусть выборка задана в виде интервалов и соответствующих им частот

 x0 ; x1   x1; x2  …  xk 1; xk 
n1 n2 … nk
xi  xi 1
По серединам интервалов xi  находим точечные несмещенные оценки
2
параметров нормального распределения a  xв и  2  s 2 . Перейдем к нормированной
xa x  xв
случайной величине u   и рассмотрим интервалы  u0 ; u1  ,  u1; u2  ,...,  uk 1; uk 
 s
xi  xв
где u0  , ui   i  1, 2,...k  1 , uk   .
s
Учитывая, что pi  P xi 1  x  xi   P ui 1  u  ui    ui    ui 1  , находим

теоретические частоты ni  npi  n   ui     ui 1  .

 
2
k ni  ni
Теперь, зная ni и ni , находим  n2   и сравниваем с c , которое находится по
i 1 ni
таблице 6 критических точек распределения  2 с m  k  2 1  k  3 степенями свободы

( r  2 , так как оба параметра нормального распределения мы находили по выборке).


Если  n2  c , то гипотезу о нормальном распределении генеральной совокупности
принимаем, иначе отвергаем.
Пример 3. Используя критерий Пирсона, при уровне значимости   0,05 проверить,
согласуется ли гипотеза о нормальном распределении генеральной совокупности с
эмпирическим распределением выборки объема n  300

 xi 1; xi   20; 10  10;0  0;10  10; 20   20;30   30; 40   40;50 

ni 20 47 80 89 40 16 8

По серединам интервалов находим точечные оценки параметров нормального


распределения

64
1 7 

1 7 
 xi  xв  
2
a  xв  xi ni  10, 4 и  2  s 2  ni  187, 4649 , откуда   s  13,6918 .
n i 1 n  1 i 1

xi  xв xi  10, 4
Далее находим концы интервалов ui   и теоретические частоты
s 13, 6918
ni  n   ui     ui 1  с использованием таблицы 2 значений функции   x  .
Результаты вычислений представим в виде таблицы

 xi 1; xi   ui 1; ui  ni  n   ui     ui 1 


n  n  
2
ni
i i

ni

 20; 10 20  ; 1, 4899 20,4358 0,0093

 10;0 47  1, 4899; 0,7596 46,6901 0,0021

 0;10  80  0,7596; 0,0292 79,3781 0,0049

10; 20  89  0,0292;0,7012 81,0146 0,7871

 20;30  40  0,7012;1, 4315 49,6390 1,8717

 30; 40  16 1, 4315; 2,1619 18,2433 0,2770

 40;50  8  2,1619;   4,5941 2,5250

 
2
7 ni  ni
Теперь находим  n2    5, 477 , а по таблице 6 по   0,05 и числу степеней
i 1 ni
свободы m  7  2 1  4 находим c  9,5 . Так как n2  5, 477  c  9,5 , то гипотезу о
нормальном распределении генеральной совокупности принимаем.

III. Нахождение теоретических частот при проверке гипотез о показательном


распределении.
Предположим, что выдвинута гипотеза о том, что генеральная совокупность имеет
показательное распределение с плотностью
 e   x , x  0
p  x    , где параметр   0 .
 0, x  0
Пусть выборка задана в виде интервалов и соответствующих им частот

 x0 ; x1   x1; x2  …  xk 1; xk 
n1 n2 … nk

где n1  n2  ...  nk  n .

65
xi  xi 1
По серединам интервалов xi  найдем точечную несмещенную оценку параметра
2
1
 и вероятности попадания случайной величины в каждый из интервалов

xi xi x x xi 1 xi

 
1  1   
pi  P  xi 1  x  xi    e
x
dx  e xв
dx   x в e xв |xxii 1  e xв
e xв
,
xi 1 xв xi 1 xв

  xxi 1 x
 i 
откуда теоретические частоты равны ni  n  e в
e в
x
.
 
 

 n n
2
k

i i
Теперь, зная ni и ni , находим  n2 и сравниваем с c , которое находится по
i 1 ni
таблице 6 критических точек распределения  2 с m  k  1  1  k  2 степенями свободы
( r  1 , так как параметр показательного распределения мы находили по выборке).
Если  n2  c , то гипотезу о нормальном распределении генеральной совокупности
принимаем, иначе отвергаем.
Пример 4. В результате испытания n  200 элементов на продолжительность безотказной
работы получено следующее эмпирическое распределение

 xi 1; xi   0;5  5;10  10;15 15; 20   20; 25  25;30 


ni 133 45 15 4 2 1
При уровне значимости   0,01 используя критерий Пирсона требуется проверить
гипотезу о том, что продолжительность безотказной работы элементов
распределено по показательному закону.
1 6 
По серединам интервалов найдем xв   xi ni  5 , тогда   0, 2 . Затем находим
n i 1

 
теоретические частоты ni  n e 0,2 xi  e 0,2 xi 1 . При этом объединим малочисленные
частоты (4+2+1=7), а соответствующие им интервалы объединим в один интервал 15;30  .
Результаты вычислений занесем в таблицу
 xi 1; xi  ni
 
2
ni
ni  ni

ni
 0;5 133 126,4241 0,3420
 5;10  45 46,5088 0,0489
10;15 15 17,1096 0,2601
15;30 7 9,4616 0,6404

66
 n n
2
4

i i
Теперь находим  n2  1, 2914 , а по таблице 6 по   0,01 и числу степеней
i 1 ni
свободы m  4 1 1  2 находим c  9, 2 . Так как n2  1, 2914  c  9, 2 , то гипотезу о
показательном распределении принимаем.

IV. Нахождение теоретических частот при проверке гипотез о равномерном


распределении.
Предположим, что выдвинута гипотеза о том, что генеральная совокупность
распределена равномерно на некотором промежутке  a; b  с плотностью
 1
 , x   a; b 
p  x    b  a .
0, x   a; b 

Пусть выборка задана в виде интервалов и соответствующих им частот

 x0 ; x1   x1; x2  …  xk 1; xk 
n1 n2 … nk

где n1  n2  ...  nk  n .
Во-первых, следует найти точечные оценки a  и b для концов интервала  a; b  . Для
этого следует воспользоваться методом моментов. Для равномерного распределения из
 b  a   s 2 получаем систему уравнений
2
ab
соотношений M    xв и D 
2 12
  
a  b  2 x в a  x в  s 3
   , из которой находим   .

b  a  2 s 3 
b  x в  s 3
x x 1 k
По серединам интервалов xi  i i 1 находим xв   xini и s 2 
1 k 
 xi  xв  
2
ni , а
2 n i 1 n  1 i 1
затем a и b .
1
Учитывая, что плотность функции распределения p  x   , находим теоретические
b  a

x1  a  xi  xi 1 b  xk 1
частоты n1  n  , n  n   i  2,3,..., k  1 k
, n   n  .
b  a b  a b  a
i

 n n
2
k

i i
Далее находим  n2 и сравниваем с c , которое находится по таблице 6
i 1 ni
критических точек распределения  2 с m  k  2 1  k  3 степенями свободы
( r  2 , так как два параметра равномерного распределения мы находили по выборке).
Если  n2  c , то гипотезу о равномерном распределении генеральной совокупности
принимаем, иначе отвергаем.

67
Если в формулировке задачи указано конкретное значение интервала  a; b  , то их
xi  xi 1
точечные оценки находить не надо, теоретические частоты ni  n   i  1,3,..., k  и
ba
при нахождении c число степеней свободы m  k  1 .

Пример 5. Произведено n  200 испытаний, в результате каждого из которых событие А


появлялось в различные моменты времени. В итоге было получено эмпирическое
распределение (в первой строке указаны интервалы времени в минутах, а во второй
– число появлений события А в данном интервале)

 xi 1; xi   2; 4   4;6   6;8 8;10  10;12 12;14  14;16 16;18 18; 20 


ni 23 19 18 29 24 18 23 25 21

Требуется при уровне значимости   0,05 , используя критерий Пирсона


проверить гипотезу о том, что время появления событий распределено равномерно.
x x 1 9
По серединам интервалов xi  i i 1 находим xв   xini  11, 0900 и
2 n i 1
1 9 

 xi  xв 
2
s2  ni  26,3436 , откуда s  5,1326 . Далее находим a  2, 2001 ,
n  1 i 1
b  19,9799 и теоретические частоты, которые занесем в таблицу

 xi 1; xi  ni
n  n  
2
ni
i i

ni
 2; 4  23 20,2468 0,3744
 4;6  19 22,4974 0,5437
 6;8 18 22,4974 0,8991
8;10  29 22,4974 1,8725
10;12  24 22,4974 0,1004
12;14  18 22,4974 0,8991
14;16  23 22,4974 0,0112
16;18 25 22,4974 0,2784
18; 20  21 22,2716 0,0726

 n n
2
9

i i
Теперь находим  n2  5, 0583 , а по таблице 6 по   0,05 и числу степеней
i 1 ni
свободы m  9  2 1  6 находим c  12, 6 . Так как n2  5,0583  c  12,6 , то гипотезу о
равномерном распределении принимаем.

68
V. Нахождение теоретических частот при проверке гипотез о биномиальном
распределении.
Предположим, что произведено n серий испытаний. Каждая серия испытаний состоит
из m опытов. В каждом из опытов событие А может появится с вероятностью p . В итоге
получено следующее эмпирическое распределение
xi 0 1 … m
ni n0 n1 … nm
В первой строке указано число xi появлений события А в одном опыте, во второй строке
– число опытов, в которых зарегистрировано xi появлений события А.
Требуется проверить гипотезу о том, что случайная величина – число появлений события
А распределена по биномиальному закону.
Если вероятность p не задана, то по выборке находим ее точечную несмещенную
1
оценку p  x в . Далее по формуле Бернулли находим вероятности
m
pi  Pm  i   Cmi pi 1  p  и теоретические частоты ni  n  pi .
m i

 
2
k ni  ni
Затем находим  n2   и сравниваем с c , которое находится по таблице 6
i 1 ni
критических точек распределения  2 с m  k  1  1  k  2 степенями свободы, если
вероятность p определялась по выборке, или с m  k  1 степенями свободы, если
вероятность p задана.
Если  n2  c , то гипотезу о биномиальном распределении генеральной совокупности
принимаем, иначе отвергаем.
Пример 6. Произведено n  100 серий испытаний. Каждая серия испытаний состояла из
m  10 опытов. В каждом из опытов вероятность появления события А равна
p  0,3 . В итоге получено следующее эмпирическое распределение
xi 0 1 2 3 4 5
ni 2 10 27 32 23 6
Требуется при уровне значимости   0,05 проверить гипотезу о том, что число
появлений события А распределено по биномиальному закону.
Так как вероятность p  0,3 задана, то по формуле Бернулли находим вероятности
p0  C100  0,30  0,710  0,0282, p1  C10
1
 0,3  0,79  0,1211, p2  0, 2335, p3  0, 2668,
p4  0, 2001, p5  0,1029 , затем теоретические частоты и заносим их в таблицу. Поскольку
частота n0  2 малочисленная, объединим ее с частотой n1  10 ; соответствующие

теоретические частоты также объединим n0  n1  2,82  12,11  14,93 .

69
ni
n  n  
2
xi ni
i i

ni
0;1 12 14,93 0,5750
2 27 23,35 0,5706
3 32 26,68 1,0608
4 23 20,01 0,4468
5 6 10,29 1,7886

 
2
5 ni  ni
Теперь находим  n2    4, 4418 , а по таблице 6 по   0,05 и числу степеней
i 1 ni
свободы m  5 1  4 находим c  9,5 . Так как n2  4, 4418  c  9,5 , то гипотезу о
биномиальном распределении принимаем.
VI. Нахождение теоретических частот при проверке гипотез о распределении
Пуассона.
Пусть задано эмпирическое распределение дискретной случайной величины
xi x1 x2 … xk

ni n1 n2 … nk
Требуется проверить гипотезу о том, что данная случайная величина распределена по
k
закону Пуассона P   k  e  , где параметр   0 .
k!
По выборке находим точечную несмещенную оценку параметра   xв , а затем

 
2

 xi k ni  ni
теоретические частоты ni  n  e  . Затем находим  n2   и сравниваем с c ,
xi ! i 1 ni
которое находится по таблице 6 критических точек распределения  2 с m  k  1  1  k  2
степенями свободы.
Если  n2  c , то гипотезу о том, что генеральная совокупность распределена по закону
Пуассона, принимаем, иначе отвергаем.
Пример 7. Отдел технического контроля проверил n  200 партий одинаковых изделий и
получил следующее эмпирическое распределение (в первой строке указано
количество xi нестандартных изделий в одной партии; во второй строке –
количество партий, содержащих xi нестандартных изделий)

xi 0 1 2 3 4

ni 116 56 22 4 2

Требуется при уровне значимости   0,025 проверить гипотезу о том, что число
нестандартных изделий распределено по закону Пуассона.

70
Сначала найдем выборочную среднею
1 5 1
xв   xi ni  116  0  56 1  22  2  4  3  2  4   0, 6 .
n i 1 200
Тогда точечная оценка параметра   0,6 . Теперь найдем теоретические частоты
0, 60  0,6 0, 6  0,6
n0  200  e  200  0,5488  109, 76 ; n1  200  e  200  0,3293  65,86 ;
0! 1!
n2  19,76; n3  3,96; n4  0,60 .
Объединим малочисленные частоты (4+2=6) и соответствующие им теоретические
частоты (3,96+0,60=4,56). Результат представим в виде таблицы

ni
n  n  
2
xi ni
i i

ni
0 116 109,76 0,3548
1 56 65,86 1,4762
2 22 19,76 0,2539
3;4 6 4,56 0,4547

 
2
4 ni  ni
Теперь находим  n2    2,5396 , а по таблице 6 по   0,025 и числу степеней
i 1 ni
свободы m  4 1 1  2 находим c  7, 4 . Так как n2  2,5396  c  7, 4 , то гипотезу о
распределении Пуассона принимаем.
Задания.
1. Из генеральной совокупности извлечена выборка

xi ; xi 1  1 2 3 4 5 6 7 8
ni 259 167 109 74 70 47 40 34

Используя критерий Колмогорова, при уровне значимости   0,01 , проверить


гипотезу о показательном распределении генеральной совокупности.
2. Используя критерий Пирсона, при уровне значимости   0,05 проверить,
согласуется ли гипотеза о нормальном распределении генеральной совокупности с
эмпирическим распределением выборки
xi -5 -3 -1 1 3 5 7
ni 8 22 44 57 40 23 6
3. Используя критерий Пирсона, при уровне значимости   0,05 проверить,
согласуется ли гипотеза о нормальном распределении генеральной совокупности с
эмпирическим распределением выборки
xi ; xi 1  (-45;-30) (-30;-15) (-15;0) (0;15) (15;30) (30;45) (45;60)
ni 22 45 60 76 42 34 21

71
4. В итоге испытаний n  800 элементов на время безотказной работы, получено
следующее эмпирическое распределение выборки

xi ; xi 1  (0; 10) (10; 20) (20; 30) (30; 40) (40; 50) (50; 60) (60; 70)
ni 305 215 150 80 30 15 5

Здесь в первой строке указаны интервалы времени в часах, а во второй –


количество отказавших элементов в соответствующем интервале. Используя
критерий Пирсона при уровне значимости   0,01 проверить гипотезу о том, что
время безотказной работы элементов распределено по показательному закону.

5. Часы, выставленные в витринах часовых магазинов, показывают случайное время.


Выдвигается естественная гипотеза, что показания этих часов распределены
равномерно в интервале (0; 12). Наблюдения над 500 часами в различных
магазинах дали следующую выборку, где весь интервал разбит на 12 часовых
интервалов
 xi 1; xi  0-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9-10 10-11 11-12
ni 36 47 41 47 49 45 32 37 40 41 37 48

Используя критерий Пирсона проверить гипотезу о равномерном распределении


при уровне значимости   0,05.

6. В библиотеке случайно отобрано 200 выборок по 5 книг. Регистрировалось число


поврежденных книг. В итоге получено следующее эмпирическое распределение
выборки
xi 0 1 2 3 4
ni 72 77 34 14 3

Здесь в первой строке указано число поврежденных книг в одной выборке, а во


второй количество выборок, содержащих xi поврежденных книг. Требуется,
используя критерий Пирсона, при уровне значимости   0,05 проверить гипотезу
о том, что случайная величина – число поврежденных книг распределена по
биномиальному закону.

7. В итоге проверки n  250 партий одинаковых изделий на стандартность получено


следующее эмпирическое распределение выборки
xi 0 1 2 3 4
ni 136 86 22 4 2

Здесь в первой строке указано количество xi нестандартных изделий в одной


партии, а во второй – количество партий, содержащих xi нестандартных изделий.
Используя критерий Пирсона при уровне значимости   0,01 проверить гипотезу
о том, что случайная величина – число нестандартных изделий распределено по
закону Пуассона.
72
§ 13. Элементы теории корреляции.
В курсе «Теория вероятности» был введен коэффициент корреляции двух случайных
величин  и 
   M    M 
  ,   M   
 D D 

и получены его свойства:


1) если случайные величины  и  независимы, то коэффициент корреляции   ,   0 ;

2)   ,   1 ;
3) если случайные величины  и  зависят линейно      , то коэффициент
корреляции максимален по модулю   ,   1 .
В случае, когда коэффициент корреляции   ,   0 , случайные величины  и 
называются коррелированными. В этом случае между ними существует определенная
зависимость   g   . Функцию g   называют функцией регрессии  на  . Там же
был рассмотрен случай линейной регрессии g       и при помощи метода
наименьших квадратов получено уравнение прямой линии среднеквадратичной регрессии
 на 

D
    ,     M    M (1)
D
Рассмотрим здесь этот вопрос с точки зрения статистики. Во многих задачах
математической статистики требуется установить и оценить зависимость изучаемой
случайной величины  от одной или нескольких других случайных величин.
Статистической называют зависимость, при которой изменение одной из величин влечет
изменение распределения другой. В частности, статистическая зависимость проявляется в
том, что при изменении одной из величин изменяется среднее значение другой. В этом
случае статистическую зависимость называют корреляционной.
Если мы рассмотрим условное математическое ожидание M  |   x  , то эту функцию
от x называют функцией регрессии  на  . Аналогично, условное математическое
ожидание M  |   y  называют функцией регрессии  на  .
Например, пусть  урожай зерна, а  количество внесенных удобрений. С одинаковых
по площади участков земли при равном количестве внесенных удобрений снимают
различные урожаи, то есть  не является функцией от  . Это объясняется влиянием
случайных факторов (осадки, температура воздуха и др.). Вместе с тем, как показывает
опыт, средний урожай является функцией от внесенных удобрений, то есть  связано с 
корреляционной зависимостью.
Рассмотрим для определенности выборку для двух случайных величин  и  :
1;1  , 2 ;2  ,..., n ;n  .

73
Здесь значения  i и  k могут повторяться. Поэтому обозначим через x1 , x2 ,..., xt и через
y1 , y2 ,..., ys различные значения этих величин. Пусть значение x1 встречается nx1 раз,
значение x2 встречается nx2 раз и так далее; значение y1 встречается n y1 раз, значение y2
t s
встречается n y2 раз и так далее. При этом  nxi   nyk  n . Пара  xi ; yk  встречается
i 1 k 1

nxi yk раз. Тогда выборку удобно представить в виде так называемой корреляционной
таблицы

47.  \  48. x1 49. x2 … xt 50. ny

y1 51. nx1 y1 52. nx2 y1 … 53. nxt y1 54. n y1

y2 55. nx1 y2 56. nx2 y2 … 57. nxt y2 58. n y2

… 59. … … … … …

ys 60. nx1 ys 61. nx2 ys … 62. nxt ys 63. n ys

nx 64. nx1 65. nx2 … 66. nxt n

По этой таблице мы можем найти:


1 t 1 s
выборочные средние xв   i xi в n 
n i 1
x n и y 
k 1
yk nyk , которые являются несмещенными

точечными оценками для математических ожиданий M  и M ;

1 t
 i  
1 s
 yk  yв  
2 2
выборочные дисперсии Dx  x  x в nxi и D y  nyk , которые являются
n i 1 n k 1
точечными оценками для дисперсий D и D .
s
1
Кроме того, мы можем найти условные выборочные средние y xi 
nxi
y n
k 1
k xi yk ,

являющиеся несмещенными точечными оценками для условных математических


ожиданий M  |   xi  . Тогда выборочная функция регрессии  на  определяется
таблицей
67. xi 68. x1 69. x2 70. … 71. xt

72. y xi73. y x174. y x2 75. …76. y xt

74
t
1
Аналогично, условные выборочные средние x yk 
nyk
xn
i 1
i xi yk есть несмещенные

точечные оценки для условных математических ожиданий M  |   yk  и их значения


определяют выборочную функцию регрессии  на  .

Для коэффициента корреляции

   M    M  M     M   M
  ,   M    
 D D  D  D

точечной оценкой является выборочный коэффициент корреляции


1 t s
 xi yk nxi yk  xв  y в
n i 1 k 1
rв 
Dx Dy
.
Поставим теперь задачу найти приближенное значение выборочной функции регрессии
 на  в виде линейной, квадратичной или какой-либо другой функции. Для этого
воспользуемся методом наименьших квадратов.
Найдем уравнение прямой линии выборочной среднеквадратичной регрессии  на 
yx   x   .
Коэффициенты  и  находятся из условия, чтобы сумма квадратов отклонений
t
F  ,      y xi   xi   
2
была наименьшей. Для этого следует найти от функции
i 1

F  ,   частные производные по переменным  и  , приравнять их нулю и так далее.


Но мы практически все это проделали ранее в курсе «Теория вероятности» при получении
уравнения (1), только надо в нем заменить в нем  и  на x и y x , а математические
ожидания, дисперсии и коэффициент корреляции на их точечные оценки. В результате
получим выборочное уравнение прямой линии среднеквадратичной регрессии  на 

x  x  y .
Dy
y x  rв в в (2)
Dx
Совершенно аналогично находится выборочное уравнение прямой линии
среднеквадратичной регрессии  на 

y y  x
Dx
x y  rв в в .
Dy
При построении квадратичной линии выборочной среднеквадратичной регрессии  на
 y x   x2   x   коэффициенты находятся из условия минимума функции

 
t
F  ,  ,      y xi   xi2   xi    . Так же поступают и при нахождении линий
2

i 1

выборочной среднеквадратичной более высоких порядков.

75
Пример. Найти выборочное уравнение прямой линии среднеквадратичной регрессии по
корреляционной таблице

 \  77. 2078. 2579. 3080. 3581. 4082. ny

83. 16 84. 4 6 - - - 10

26 - 8 85. 10 - - 18

36 - - 86. 32 3 9 44

46 - - 487. 12 6 22

56 - - - 1 5 6

nx 4 88. 1489. 4690. 1691. 20


92. n  100

xi  30 y  36
Для удобства вычислений перейдем к условным вариантам ui  , vk  k . Тогда
5 10
корреляционная таблица примет вид

93. v \ u94. -295. -1 0 1 2 nv

-2 4 6 - - - 10

-1 - 8 96. 10 - - 18

0 - - 97. 32 3 9 44

1 - - 4 98. 12 6 22

2 - - - 1 5 6

nu 4 99. 14100. 46101. 16102. 103.


20 n  100

Найдем сначала выборочные средние

1
uв   2  4  114  0  46  116  2  20   0,34 , откуда xв  5  uв  30  31,70
100

1
vв   2 10  118  0  44  1 22  2  6   0, 04 , откуда yв  10  vв  36  35,60
100

выборочные дисперсии

76
1
Du   4  4  114  0  46  116  4  20   0,342  1,14 , откуда Dx  25  Du  25,8
100

1
Dv   4 10  118  0  44  1 22  4  6   0,042  1,04 , откуда Dy  100  Dv  104
100

и выборочный коэффициент корреляции, для которого в условных вариантах справедлива


1 t s
 ui vk nuivk  u в  vв
n i 1 k 1
формула rв  . Вычислим сначала
Du Dv

1 t s

n i 1 k 1
ui vk nui vk 
1
100
 2   2  4   2 1  6   1   1  8   1  0 10  0  0  32 
1112  1 2  6  2 11  2  2  5  0,82 ,

0,82  0,34   0, 04 


тогда rв   0, 76 . Подставим найденные значения в выборочное
1,14 1, 04
уравнение прямой линии среднеквадратичной регрессии  на 

104
y x  0, 76  x  31, 7   35, 6 или y x  1, 45x 10,36 .
25,8

Найдем из корреляционной таблицы условные выборочные средние


1 1 1
vu1   2  4  2; vu2   2  6  1 8  1, 25; vu3   110  0  32  1 4   0,13;
4 16 46
1 1
vu4   0  3  112  2 1  0,875; vu5   0  9  1 6  2  5  0,8 , откуда
16 20

y x1  10  vu1  36  16; y x2  10  vu2  36  23,5; y x3  10  vu3  36  34,7;

y x4  10  vu4  36  44,75; y x5  10  vu5  36  44 .

Таким образом, мы нашли значения выборочной функции регрессии  на 

x 20 25 30 35 40

yx 16104. 23,5
105. 34,7
106. 44,75 44

Для иллюстрации полученного решения на рисунке 7 изображен график найденной


прямой линии выборочной среднеквадратичной регрессии, а также значения выборочной
функции регрессии (отмечены крестиками). Из рисунка видно, что прямая линия
выборочной среднеквадратичной регрессии достаточно хорошо аппроксимирует функцию
регрессии.

77
Задание.

Найти выборочные уравнения прямых линий среднеквадратичной регрессии  на


 и  на  по корреляционной таблице

107.  \108.
 109.
5 110.
10 111.
15 112.
20 113.
25 114.
30 35
115. ny

116. 100
117. 118.
- 119.
- 120.
- 121.
- 122.
- 123.
6 1 7

124. 120
125. 126.
- 127.
- 128.
- 129.
- 130.
- 131.
4 2 6

132. 140
133. 134.
- 135.
- 136.
8 10
137. 5138. 139.
- - 23

140. 160
141. 142.
3 143.
4 3144. 145.
- 146.
- 147.
- - 10

148. 180
149. 150.
2 1151. 152.
- 1153. 154.
- 155.
- - 4

156. n157.
x
158.
5 159.
5 160.
11 11
161. 162.
5 10
163. 164.
3 n  50

78
x2
1 2
Таблица 1 значений функции   x   e .
2

165.
166.

79
x t2
1 
Таблица 2 значений функции   x    2 dt.
e
2 0

80
Таблица 3 значений t  t  , n 

Таблица 4 значений q  q  , n 

81
Таблица 5 критических точек распределения Стьюдента

82
Таблица 6 критических точек распределения 2

83

Таблица 7 значений функции распределения Колмогорова K  x   1  2  1 e 2 m x
m 2 2

m 1

x 0 1 2 3 4 5 6 7 8 9
0,5 0,0361 0,0428 0,0503 0,0585 0,0675 0,0772 0,0876 0,0987 0,1104 0,1228
0,6 0,1357 0,1492 0,1633 0,1778 0,1927 0,2080 0,2236 0,2396 0,2556 0,2722
0,7 0,2888 0,3055 0,3223 0,3391 0,3560 0,3728 0,3896 0,4064 0,4230 0,4395
0,8 0,4559 0,4720 0,4880 0,5038 0,5194 0,5347 0,5497 0,5645 0,5791 0,5933
0,9 0,6073 0,6209 0,6343 0,6473 0,6601 0,6725 0,6846 0,6964 0,7079 0,7191
1,0 0,7300 0,7406 0,7508 0,7608 0,7704 0,7798 0,7889 0,7976 0,8061 0,8143
1,1 0,8223 0,8300 0,8374 0,8445 0,8514 0,8580 0,8644 0,8706 0,8765 0,8823
1,2 0,8878 0,8930 0,8981 0,9030 0,9076 0,9121 0,9164 0,9206 0,9245 0,9283
1,3 0,9319 0,9354 0,9387 0,9418 0,9449 0,9478 0,9505 0,9531 0,9557 0,9580
1,4 0,9603 0,9625 0,9646 0,9665 0,9684 0,9702 0,9718 0,9734 0,9750 0,9764
1,5 0,9778 0,9791 0,9803 0,9815 0,9826 0,9836 0,9846 0,9855 0,9864 0,9873
1,6 0,9880 0,9888 0,9895 0,9901 0,9908 0,9914 0,9919 0,9924 0,9929 0,9934
1,7 0,9938 0,9942 0,9946 0,9950 0,9953 0,9956 0,9959 0,9962 0,9965 0,9967
1,8 0,9969 0,9971 0,9973 0,9975 0,9977 0,9979 0,9980 0,9982 0,9983 0,9984
1,9 0,9985 0,9986 0,9987 0,9988 0,9989 0,9990 0,9991 0,9991 0,9992 0,9993
2,0 0,9993 0,9994 0,9994 0,9995 0,9995 0,9996 0,9996 0,9996 0,9997 0,9997

84
Ответы.

1 1
§ 7: 1)      xв  0, 43. 2) p  p    0, 29.
xв 3, 4
3) a  a  xв  1,16;      Dв  0, 2372  0, 487.
4) xв  12,31; Dв  33,7829; a  a  xв  3Dв  2, 24; b  b  xв  3Dв  22,38.
2
xв xв
5) xв  27,3333; Dв  122,8889;      6, 08;     

 0, 22.
Dв Dв
§ 8: 1) ln L  ,    nxв ln   n  ln C; C   x1  1 ...  xk  k  const;      xв  0,585.
n n

 
2) ln L  , p   n ln p  n xв  1 ln 1  p  ; p  p 
1

1
xв 4, 25
 0, 2353.

1 1
3) ln L  ,    n ln    nxв ;        0,1068.
xв 9,3667

 
k
1
4) ln L  , a   n ln  2   x  a ni ; a  a  x в  10,366.
2

2 2 i
i 1
k
1 1 k
2  i 
5) ln L  ,    n ln   n ln 2  x  a ni ;  2   2   xi  a  ni  14, 25;
2 2

2 i 1 n i 1
  3,775.

n
6) ln L  ,     n ln    nxв  ln C; C  x1 1n1 ...xk 1nk     const;
 1,5
      0, 2435.
xв 6,16

   
n
1 n
§ 9: ln L  , a   n ln  2     a ; ln L  , a   2 x в  a - выполнено
2

2 a 
2 i
i 1

2
условие существования ниболее эффективной оценки; D x в    n
и I a 
n
2
.

§ 10: 1) xв  1000; n  100;   1,96; 992,16  a  1007,87.

 
2

2)   20;   15;    1, 65; n       5.


 
3) xв  3,9167; s  1,339; t  2,03; 3, 4636  a  4,3697.
4) s  0,7467; q  0,5; 0,37335    1,1205.
5) xв  1;   2,58; 0,8911    1,1222.
6)   0,008;   3,32; 0  p  0132. Обеспечивает.
§ 11: 1) 1)   1,8  c  2,33. Гипотезу H 0 принимаем. 2) w  0,1292; 3) n  150.
2) 1)   2,1  c  2,33. Гипотезу H 0 принимаем. 2) w  0,6808.
3) xв  7,3171; s  2,5927; t  0,7831  c  2, 42. Гипотезу H 0 принимаем.
4) xв  3,1905; s  0,5804; t  1,504  c  2,53. Гипотезу H 0 принимаем.

85
5) z  2,5  c  1,65. Гипотезу H 0 отвергаем, математические ожидания разнятся
значительно.
6) s 2  0,0416;  2  9,984  c  36, 4. Гипотезу H 0 принимаем.
7) s 2  3,99;  2  37,9  8,91;32,9  . Гипотезу H 0 отвергаем.
8)   2,33  c  1,65. Гипотезу H 0 отвергаем, новая форма рекламы эффективней
старой. Мощность построенного критерия w  0,317.
9)   0, 452;   c  2,58. Гипотезу H 0 принимаем.

1 1
§ 12: 1)    ; nDn  3, 44  c  1, 63. Гипотезу о показательном распределении
xв 3
отвергаем.
2) a  xв  0,92;   s  2,799; n2  1,51  c  9,5. Гипотезу о нормальном
распределении принимаем.
3) a  xв  5,35;   s  24,518; n2  7, 245  c  9,5. Гипотезу о нормальном
распределении принимаем.
1
4) xв  17, 25;    0, 058;  n2  32, 212  c  15,1. Гипотезу о показательном

распределении отвергаем.
1
5) xв  0,995; p  xв  0,199; n0  65,9466; n1  81,9187; n2  40, 7037; n3  10,1124;
m
n4  1, 2562; n2  2,5641  c  6. Гипотезу о биномиальном распределении
принимаем.
6)   xв  0,6; n0  137, 2029; n1  82,3217; n2  24,6965; n3  4,9393; n4  0,7409;
n2  0,9663  c  9, 2. Гипотезу о распределении по закону Пуассона принимаем.

§ 13: y x  2,15x  181,8; x y  0,33 y  65,7.

86
Литература.
1. Гнеденко Б.В. Курс теории вероятностей. М: Наука, 1988. – 448 с.
2. Гихман И.И., Скороход А.В., Ядренко М.И. Теория вероятностей и математическая
статистика. К: Вища школа, 1978. – 408 с.
3. Ивченко Г.И., Медведев Ю.И. Введение в математическую статистику. М:
Издательство ЛКИ, 2010. – 600 с.
4. Крамер Г. Математические методы статистики. М: Мир, 1975. – 648 с.
5. Гмурман В.Е. Руководство к решению задач по теогии вероятностей и
математической статистике. М: Высшая школа, 1979. – 400 с.
6. Процеров Ю.С. Теория вероятностей. Учебно-методическое пособие. Одесса, 2015.
– 122 с. (Размещено на сайте Научной библиотеки ОНУ: www.lib.onu.edu.ua).

87

Оценить