ОТЧЕТ
к лабораторной работе по дисциплине
Математическая статистика и прогнозирование
Доверительные границы и интервалы
наименование темы
Иркутск 2023 г.
Результатом применения точечной оценки â(x1,...,xn) является одно числовое
значение; оно не дает представления о точности, т.е. о том, насколько близко
полученное значение к истинному значению параметра. Интуитивно ясно,
что такое представление может дать, например, дисперсия оценки, так что
истинное значение должно находиться где-то в пределах
â (24)
Внесем уточнения.
1. Основные
положения
1.1. Определе
ния и построение интервалов
Пусть (x1,...,xn) x - n независимых наблюдений над случайной величиной с
законом распределения F(z/a), зависящим от параметра a, значение которого
неизвестно.
Определение 1. Функция наблюдений a1(x1,...,xn) (заметим, что это
случайная величина) называется нижней доверительной границей для
параметра a с уровнем доверия РД (обычно близким к 1), если при любом
значении
P{ a1(x1,...,xn) a} PД
Определение 2. Функция наблюдений a2(x1,...,xn) (случайная величина)
называется верхней доверительной границей для параметра с уровнем
доверия РД , если при любом значении
P{ a2(x1,...,xn) a } PД .
Определение 3. Интервал со случайными концами (случайный интервал)
I(x) = ( a1(x), a2(x) ) ,
определяемый двумя функциями наблюдений, называется доверительным
интервалом для параметра a с уровнем доверия РД , если при любом значении
a
P{ I(x) a } P{ a1(x1,...,xn) a a2(x1,...,xn) } PД ,
т.е. вероятность (зависящая от a) накрыть случайным интервалом I(x)
истинное значение a - велика: больше или равна РД.
Построение доверительных границ и интервалов. Для построения
доверительного интервала (или границы) необходимо знать закон
распределения статистики =(x1,...,xn), по которой оценивается неизвестный
параметр (такой статистикой может быть оценка = â(x1,...,xn) ). Один из
способов построения состоит в следующем. Предположим, что некоторая
случайная величина = (, a), зависящая от статистики и неизвестного
параметра a такова, что
1) закон распределения известен и не зависит от a;
2) (, a) непрерывна и монотонна по .
Выберем диапазон для интервал так, чтобы попадание в него
было практически достоверно:
P{ f1 (, a) f2 } PД , (1)
для чего достаточно в качестве и взять квантили распределения
уровня (1- РД )/2 и (1+ РД )/2 соответственно. Перейдем в (1) к другой записи
случайного события, разрешив неравенства относительно параметра a;
получим (полагая, что монотонно возрастает по ):
P{ g(, f1) a g(, f2) } PД .
Это соотношение верно при любом значении параметра a (поскольку это так
для (1)), и потому, согласно определению, случайный интервал
( g(, f1) , g(, f2) )
является доверительным для a с уровнем доверия РД . Если убывает по ,
интервалом является ( g(, f2) , g(, f1) ).
Для построения односторонней границы для a выберем значения и так,
чтобы
P{ (, a) f1 } PД , f1=Q(1 - PД )
или P{ (, a) f2 } PД , f2 = Q( PД ),
где квантиль уровня . После разрешения неравенства под знаком
получим односторонние доверительные границы для a.
Пример. Доверительный интервал с уровнем доверия РД для среднего a
нормальной совокупности при известной дисперсии .
Пусть x , ... , xn - выборка из нормальной N(a, ) совокупности.
Достаточной оценкой для а является
â = â(x ,...,xn) = ,
, (2)
которая распределена нормально N(0,1) при любом значении а.
По заданному уровню доверия РД определим для отрезок -fp, fp так, чтобы
, (3)
т.е. fp - квантиль порядка (1+ РД )/2 распределения N(0,1); заметим, что
зависит от а , но (3) верно при любом значении а. Подставим в (3) выражение
для из (2) и разрешим неравенство под знаком вероятности в (3)
относительно а ; получим соотношение
, (4)
верное при любом значении а. Под знаком вероятности две функции
наблюдений
, ( 5)
определяют случайный интервал
I( x1, ... , xn) =(a1( x1, ... , xn), a2( x1, ... , xn)), (5a)
который в силу (4) обладает тем свойством , что накрывает неизвестное
значение параметра а с большой вероятностью РД при любом значении а, и
потому, по определению доверительно интервала, он является
доверительным с уровнем доверия РД .
В общем случае случайную величину в (1) можно построить следующим
образом. Определим функцию распределения F(z/a) статистики (F,
конечно, зависит от а). Для непрерывной случайная величина (, а) F(
/a), как нетрудно видеть, распределена равномерно на отрезке 0, 1 при
любом значении а; приняв f1= (1- PД)/2, f2 =(1+PД)/2, будем иметь в
качестве (4)
P{f1 F( /a) f2} = PД .
Для дискретной ситуация аналогична.
Можно рассуждать иначе: при любом фиксированном значении а определим
отрезок z1(a), z2(a) так, что
P{ z1(a) z2(a) } РД ; (6)
ясно, что в качестве z1 и z2 можно взять квантили, т.е. определить из условий
F(z!/a)=(1- РД )/2, F(z2/a)=(1+ РД )/2.
Если z1(a) и z2(a) монотонно возрастают по а, то, разрешив два неравенства
под знаком Р в (6) и учитывая, что z1(a) < z2(a), получим:
P{ z2 () a z1-1() } РД ,
-1
1.3. Интервал
ы для параметров нормального распределения
Пусть х1, … ,хn - выборка из нормального N(a,2) распределения; значения
среднего а и дисперсии 2 неизвестны. Оценки для а и 2:
, . (7)
Как известно, доверительным интервалом для среднего а с уровнем доверия
РД при неизвестной дисперсии является интервал
I(x) = (a1(х), a2(х) ), (8)
где , , (9) tp
- квантиль порядка (1+ РД)/2 распределения Стьюдента с n-1 степенями
свободы.
Доверительным интервалом для стандартного отклонения с уровнем
доверия РД является интервал
I (x)=(1(х), 2(х)) , (10)
где , , (11)
t1 и t2- квантили порядков соответственно (1+ РД)/2 и (1- РД)/2 распределения
хи-квадрат с n-1 степенями свободы.
Сгенерируем выборку объема n=20 из нормального распределения с
параметрами a =10, 2=22=4 и определим доверительные интервалы для
a и с уровнем доверия РД : 0.8 , 0.9 , 0.95 , 0.98 , 0.99 , 0.995 , 0.998 , 0.999.
Результаты выпишем в виде таблицы. C ростом РД интервал расширяется, с
ростом n - уменьшается.
Выполнение см. в пп. 2 - 4.
Если нас интересуют не интервалы, а верхние или нижние доверительные
границы, то, как известно, они определяются теми же формулами (9) è (11),
îäíàêî, çíà÷åíèÿ ïîðîãîâ t изменяются. Например, нижней доверительной
границей для a с уровнем доверия РД является значение
,
где tp - квантиль порядка РД распределения Стьюдента с n-1 степенями
свободы, а верхней границей для с уровнем доверия РД является
,
где t2 - квантиль порядка 1- РД распределения хи-квадрат с n-1 степенями
свободы.
Задание: определить верхние доверительные границы для а и с уровнем
доверия РД = 0.95 .
1.4. Задание
на самостоятельную работу
1) для заданной задачи построить оценку заданным методом (варианты
заданий см. ниже);
2) построить доверительный интервал, основанный на этой оценке;
3) сгенерировать выборку заданного объема;
4) вычислить доверительный интервал.
Варианты задач.
Задача1. Расстояние а до некоторого объекта измерялось n1 раз одним
прибором и n2- вторым; результаты х1,…,хn1; y1,…,yn2. Оба прибора при
каждом измерении дают независимые случайные ошибки, нормально
распределенные со средним 0 и стандартными отклонениями 1 и 2
соответственно. Методом максимального правдоподобия построить оценку â
для а и доверительный интервал с уровнем доверия РД .
Варианты исходных данных
¹ n1 n2 1, êì 2, êì Ðä a, êì
1 5 10 3 5 0.95 300
2 8 12 3 5 0.98 300
3 10 15 3 5 0.95 300
4 5 10 4 6 0.98 350
5 8 12 4 6 0.95 350
6 10 15 4 6 0.98 350
7 5 10 5 8 0.95 400
8 8 12 5 8 0.98 400
9 10 15 5 8 0.95 400
, где с= ;
доверительный интервал
I=( , ),
где - квантиль порядка (1+РД)/2 распределения N(0,1).
, x0
С целью определения значения параметра а этой партии были поставлены на
испытания n приборов; времена безотказной работы оказались равными х1,
…,хn. Методом моментов построить оценку для а и доверительный интервал с
уровнем доверия РД . Кроме того, построить доверительный интервал для
числа М приборов, имеющих время безотказной работы менее 50 часов.
Варианты исходных данных
1 2 3 4 5 6 7 8 9
n 20 25 30 20 25 30 20 25 30
ÐД 0.95 0.99 0.95 0.99 0.95 0.99 0.95 0.99 0.95
à 300 400 500 300 400 500 300 400 500
;
доверительный интервал для а
Ia = ( , ),
где t1=Q(2n, (1-РД)/2), t2=Q(2n, (1+РД)/2) - квантили распределения хи-
квадрат с 2n степенями свободы; доверительный интервал для М
IM = ( N(1- exp(- )), N(1- exp(- )) ).
или
(у этих статистик асимптотические свойства одинаковы). Приближенный
доверительный интервал, основанный на асимптотическом распределении
выборочной р-квантили
I=( ),
где tp=Q((1+РД)/2) - квантиль порядка (1+РД)/2 распределения N(0,1).
, n ,
tp- квантиль порядка (1+ РД)/2 для N(0,1).
2. Выполнение задания
Выборка
Среднее выборок по строкам