Академический Документы
Профессиональный Документы
Культура Документы
БОРОВКОВ
519Л
5-23
МАТЕМАТИЧЕСКАЯ
СТАТИСТИКА
©
С Ш Ц к
ОЦЕНКА П А РА М ЕТРО В
П РО ВЕРКА ГИПОТЕЗ
Л
%
МОСКВА «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
■19 8 4
ФУНДАМЕНТАЛЬНАЯ
£И Б Л И © Т Е К А
МИ И Т а
22.172
Б 82
УДК 519.31
ИВ М 2239
И здательство «Наука»
Главная редакция физико-математической литературы
117071, Москва, В-71, Ленинский проспект, 15
© Издательство «Наука»!
Главная редакция
физико-математической литературы,
1S84
ОГЛАВЛЕНИЕ
П р ед и сл ови е................................................................................................................
В ведение.......................................................................................................................
Глава 1
Выборка. Эмпирическое распределение.
Асимптотические свойства статистик
| 1. Понятие в ы б о р к и ....................................................................................
§ 2. Эмпирическое распределение (одномерный случай) - .
§ 3. Выборочные характеристики. Два типа статистик . . . .
1. Примеры выборочных характеристик (25). 2. Два типа ста
тистик (26).
§ 4. Многомерные в ы б о р к и ............................................................................
1. Эмпирические распределения (28). 2*. Более общие варианты
теоремы Гливенко — Кантелли. Закон повторного логарифма (29)ч
3. Выборочные характеристики (30).
§ 5. Теоремы н е п р е р ы в н о с т и ...............................................................
§ 6*. Эмпирическая функция распределения как случайный процесс.
Сходимость к броуновскому м о с т у ............................ .-
*
1. Расйределение процесса nFn(t) (35). 2. Предельное поведение про
цесса w n ( t ) (39).
§ 7. Предельное распределение для статистик первого типа .
§ 8*. Предельное распределение для статистик второго типа .
§ 9*. Замечания о непараметрических с т а т и с т и к а х ............................
_§ 10*. Сглаженпые эмпирические распределения. Эмпирические плот
ности .............................................................................................................
Глава 2
Глава 3
А. А. Боровков
Сентябрь 1982 года
ВВЕДЕНИЕ
«
— 1^
при П г^°°. Поэтому естественно ожидать, что число х = — z ^ x t
i=l
при достаточно большом п окажется близким к 0 и позволит в
какой-то мере ответить на поставленные вопросы. При этом оче
видно, что мы заинтересованы в том, чтобы требуемое число
наблюдений п было по возможности наименьшим, а наша оцеп ка
числа 0 по возможности более точной (завышение параметра О,
как и его занижение, приведут к материальным потерям).
П р и м е р 2. Радйолоканиопное устройство в моменты вре
мени tz, . tn зондирует заданную часть воздушного про-
* странства с целью обнаружения там некоторого объекта. Обозна
чим Xi, . . х„ значения отраженных сигналов, принятых устрой
ством. Если в заданной части пространства интересующий нас
объект отсутствует, то значения xf можно рассматривать как
независимые случайные величины, распределенные так же, как
некоторая случайная величина природа которой обусловлена
характером различных помех. Если же в течение всего периода
наблюдений объект находился в поле зрения, то будут наряду
с помехами содержать «полезный» сигнал а, и значения Xi будут
распределены как | + а. Таким ооразом, если в первом случае
наблюдения х, имели функцию распределения Fix), то во вто
ром случае их функция распределения будет иметь вид F ix — а).
Но выборке х1? ..., хп требуется решить, какой из этих двух
случаев имеет место, т. е. существует в заданном месте интере
сующий нас объект или нет.
В этой задаче окажется возможным указать в известном
смысле «оптимальное решающее правило», которое будет ре
шать поставленную задачу с минимальными ошибками. Сформу
лированная задача может быть усложнена следующим образом.
Сначала объект отсутствует, а затем, начиная с наблюдения с
неизвестпым номером 0, появляется. Требуется по возможности
более точно определить момент 0 появления объекта. Это так
называемая «задача о разладке», имеющая и целый ряд других
интерпретаций, важных для приложений.
П р и м е р 3. Некоторый эксперимент производится сначала
Jii раз в условиях А и затем п2 раз в условиях В. Обозначим
х1? . . . , х П1 и Уц . . . , У п 2 результаты этих экспериментов соот
ветственно в условиях А и В. Спрашивается, сказывается ли из
менение условий эксперимента на его результатах? Иными сло
вами, если обозначить через РА распределение х„
и через Р в — распределение у„ 1 < i ^ п2, то вопрос состоит н
том, выполнено соотношение Р А — Рв или нет.
Например, если нужно установить, влияет ли некоторый пре
парат на развитие, скажем, растений или животных, то парал
лельно ставятся две серии экспериментов (с препаратом и без),
результаты которых необходимо уметь сравнивать.
16 ВВЕДЕНИЕ
§ 1. Понятие выборки
рациональны, т. е.
p ( i = « i ) = 4 ^* 2 ^ = ЛГ> ■
5—1 ,
то выборку Х п можпо представить как результат «выборки с воз
вращением» (в смысле гл. 1 [111) из урны с N шарами, из них
на Ni ш арах написано аи па N 2 шарах паписано а2 и т. д.
Как математический объект выборка X —Х п (индекс « мы
часто будем опускать) есть не что иное, как случайная величина
(xi, . . х„) со значениями в ««-мерном» пространстве $вп — S6 X
X $6 X . . . X и распределением, определяемым для В ==■
= Bi X В 2 X . . . X В п, Bj е равенствами
Р ( 1 е й ) = Р ( х , е г „ . . , x ne P , ) = n P (x ie « i). <3>
*=1
71
тогда, очевидно, v(B ) = 2 1х,- (В),
i=i
П
Р ’ (В) = | 2 К ; (В). ( 2)
i—1
Яспо, что Р* (В) для любого борелевского В как фупкция от
выборки есть случайная величина. Таким образом, мы имеем
здесь дело со случайной функцией множеств, или со случайпым
распределением.
Предположим теперь, что Х ^ ^ Р , Х п = [Х^Е и п о о.
Мы получим тогда последовательность эмпирических распределе
ний Р*. Замечательный факт состоит в том, что эта последова
тельность неограниченно сближается с исходным распределением
Р наблюдаемой случайной величины. Этот факт имеет принци
пиальное значепне для всего последующего изложепия, посколь
ку он показывает,что неизвестное распределение Р может быть
сколь угодно точно восстановлено по выборкедостаточно боль
шого объема.
Т е о р е м а 1. Пусть B<^$Q и Х п = [X ^ E d ; Р. Тогда при
п ->■ °о
К { В ) - - + р (В).
п.н.
Т е о р е м а 2А. При п °о
sup | F* (ж) — F (ж) |— > 0.
X П .Н .
Тогда
О 71
S = S ( X ) = \ g ( x ) dF l {х) = 2 gМ
i= l
есть сумма независимых случайных величин с математическим
ожиданием
Mg ( x t) = § g{x) dF (х).
Поэтому по усиленному закону больших чисел S — >- Mg (хД.
Пусть теперь А = {Х^: *S'(X )->M g(x1)}. Тогда РС4) — 1, и ес
ли Хп, е Д то S (X ) -*■ Mg (х1), /г (5 (X)) /г (Mg (xj)). Другими
словами, на мпожестве А
C (K )-fG (F ).
Утверждение теоремы для функционалов второго типа есть
прямое следствие теоремы Гливенко — Кантелли. <1
Из теоремы вытекает, что абсолютные и центральные выбо
рочные моменты п. и. сходятся при п -*• °° к соответствующим
моментам распределения Р:
at = al (*) = 1 2 X? Мх?,
i=l и-н.
§ 4. Многомерные выборки
1. Эмпирические распределения. Совершенно аналогичным об
разом выглядят построения эмпирического распределения и выбо
рочных характеристик в многомерном случае, когда наблюдаемая
случайная величина а вместе с ней и выборочные значения
МНОГОМЕРНЫЕ ВЫБОРКИ 29
«(В)- ^ - = ^ - 2 1 * . (В).
i=l
где \ ( В ) — число точек, попавших в множество В, 1Х. — рас
пределение, сосредоточенное в точке х,.
Утверждение теоремы 1 о сходимости Рп (В) — >- Р (В) здесь,.
П .И . .
очеглщпо, сохранится.
Обобщение теоремы Гливеттко — Каптелли на многомерный
случай связано с появлением качественно новых вопросов. Один
из них — обобщения понятия интервалов на многомерный слу
чай. Таких обобщений может быть несколько — ото могут быть,,
например, прямоугольники, выпуклые множества и др.
Простейший вариант обобщения теоремы Гливенко — Каптел
ли таков.
Пусть у = (yf, ..., у т ) есть точка R m и В, есть угол с вер
шиной в точке t — (/,, . . . , tm):
В, = {у e yh < th, к = 1, . . . , rti).
Функция
F*(t) = P* (Z?()
называется эмпирической функцией распределения.
Т е о р е м а 1. IIусгь Х п = [У«,] „, X ^ ^ F . Тогда
sup | F* (t) — F (t) | — ^ 0
l П .Н .
при n oo.
2*. Более общие варианты теоремы Гливенко — Каптелли. З а
кон повторного логарифма. Одно из возможных обобщепий тео
рем тина Гливенко — Каптелли состоит в следующем. Пусть © —
класс всех выпуклых множеств в /?"*.
Т е о р е м а 2. Пусть Х п — [У^З,,, У«€§Ё Г\ распределение Р
абсолютно непрерывно относительно меры Лебега в R m. Тогда
sup | Р ; < В ) - Р ( В ) | — * 0 . ( 1)
вел, п.н.
Другие возможные обобщения теоремы 1 можно получить с.
помощью утверждений Приложения I.
so ВЫБОРКА. ЭМПИРИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ [ГЛ. 1
Р ( Ь п 1 « 1Р ^ I n in й Slj p I F * ^ ~ F (О I = l ) = !•
Ql,ij S iy = — ^2 ^1j ) t
ft= l
§ 5. Теоремы непрерывности
где 2 Ь = п.
Пусть теперь ц(аХ, и е [ 0 , 1], есть непрерывный, слева пуассо-
новский процесс (см. [11], стр. 304) с параметром ц(0) = 0.
Приращения этого процесса независимы,
= Л " П
3=0 з
= » !3=Пео 4 гг - (2)
Мы получили при любом %> 0 то же самое выражение, что и в
правой части (1). Таким образом, мы доказали следующее ут
верждение.
Т е о р е м а 1. Если Fit) непрерывна, то распределение про
цесса nFn ( i t ) совпадает с условным распределением процесса
nit) = rj(FU)) при условии зт(оо) = п (г](1) = п ).
Теорема показывает, что отклонения п рас
пределены так же, как r\iFit)) — nFit) при условии т)(1) = тг,
и задача с точностью до замены времени и — Fit) сводится к
изучепию отклонений г\{и) — пи для условного (71( 1) = п) пуас-
соновского процесса на отрезке [0, 1] или, что то же, к изуче
нию отклонений n { F * ( t ) — t ), где F* (t) соответствует равно
мерному на [0, 1] распределению.
Полезным бывает и другое представление для процесса
nFn {t). Пусть £ 1, £2, - — точки скачков пуассоповского процес
са T]U), так что ц ( £ ь + 0) = А. Как известно ([11]), разности
%к= £h— £ь- 1 ( £ 0 = 0 ), к = 1, 2, . . . , независимы и показательно
распределены,
Р ( |* > я ) =е-**,
£д имеет Г-распределение с плотностью (см. также § 2.2)
/ \ tJ1 —%х h—1
(%) — р е х ,
Из следствия 1 вытекает
С л е д с т в и е 2. Совместное распределение элементов вари
ационного ряда х ()), . . х (п) выборки X из равномерного распре
деления совпадает с совместным распределением
Сх Jn _
Sn+l ’ £n+l ’
Sn(X ) = h ( г 2 s (Xi)
ч i=i
Мы уже видели (теорема 3!l), что если X^=F0 и h непрерывна
в точке \ g (х) dF0(x), то S n— >h(a).
П .П .
Т е о р е м а 1. Если X(==F0, h дифференцируема в точке а,
J* g2(z)d F 0( x ) < o o , то
V п (,Sn (X) — h (а)) =ф- h ‘ (а) £,
где £<§ёФ0о2, <*2 — J ( g ( # ) — a)2dF0 (x). Ф о 2 здесь означает пор- *
лальное распределение с параметрами (0 , а2).
Д о к а з а т е л ь с т в о . Статистику S n(X ) представим в виде
/г
я» = А ; 2 (е (х0 - «) V -
Г г= 1
( 5 „ (X) - h («)) У п ^ | ( = 2 ^ - №
j-= l 3
так что
{S — 1/a) l / n §=> ф 0>сг2/а4. ‘
П р и м е р 2. Найдем предельное распределение статистики
s 3= 4 2 ( x* - * ) 2.
i —1
если Mx1 = a , Dxx = d 2 и Mxi < oo. (Мы уже знаем, что в силу
первой теоремы непрерывности/? 2—- d2.) Найти требуемое пре-
П.Ц.
ПРЕДЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ СТАТИСТИК ПЕРВОГО ТИПА 43
s- = ~ 2 ~ а 2 ) — ( х — а )2>
г~ \
п *
(S* — d2) Y 7i =
* 2 Kxi — а )2 — d2l — V n (х — а ) 2.
У 11 i==1
Одпако мы воспользуемся теоремой 1А. В условиях этой теоремы
мы должны положить
ТО
(S 2 - й2) / п = > - 1, Ш Ф 0,,„ = М (х, —а ) 4—й4.
П р и м е р 3. Статистика х2- В заключение этого параграфа
мы рассмотрим пример статистики, которую можно относить к
статистикам как 1, так и И типов.
Рассмотрим статистики, построенные с помощью функциона
лов вида
е (Г ) = л ( 1 г й г ) , (2>
о ( п = с , (Р )= i (p (Ai ~ pf Ai))a.
t l о V i)
G(F) = h ( $ g d ( F - F 0))
г
с функцией h (и) = 2 и] и векторной функцией g с координатами
5--1
= f i / V p i при ж е Aj,
ёз (*)
[О при х ф A j.
° » = т & = М Ы х г ) - Y P i ) { g j (x jl) — V P j)
Me — е2 .
2 Й = 2 ч! = 2 “»ь?.
5=1 5=1 5=2 (5)
х 8( х ) = * 2 п?.
5=2
Распределение правой части в этом равенстве называется распре
делением («хи-квадрат») с г —1 степенями свободы (см. t l l i ,
а также § 2.2). Мы будем встречать это распределение в после
дующем изложении неоднократно.
Еще одно доказательство (5) будет получено в следующем
параграфе. Кроме того, (5) будет доказано в § 3.16 с помощью
более общих соображений.
Некоторые другие примеры использования теорем 1, 1А будут
содержаться в последующих главах»
46 ВЫБОРКА. ЭМПИРИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ [ГЛ. t
§ 8 *. Предельное распределение
для статистик второго типа
Мы ограничимся здесь случаем $6 — R. Рассматриваемый
функционал G{Fn) будет случайной величиной, если он осуще
ствляет измеримое отображение (ZX— °°), aD) в (/?, S9). Однако
в дальнейшем нам будет удобнее иметь дело с функционалами,
определенными не на Z>X—°°, °°), а на ZXO, 1) (ср. с § 6 ).
Для того чтобы это сделать, устроим отображение D{— оо)
в D (0, 1). Пусть функция распределения F,„ соответствующая
выборке, непрерывна и монотонна, так что определена обратная
функция /'У 1G) (равная квантили F0 порядка £). Нам достаточно
будет рассматривать значения G{F) для функций F, носитель
которых содержится в носителе F0. Каждой F мы поставим
в соответствие функцию
Очевидно, что Лг~ сг [0, 1], где есть носитель F, так что
F e Z ) (0 , 1) и есть функция распределения. Обратное преобразо
вание D{0, 1) в D (—оо, оо) осуществляется равенством
F ( u ) = F ( F 0{u ))s * F F 0b ) .
Поставим теперь в соответствие функционалу G функционал Gy
определенный па функциях распределеппя H ^ D { 0, 1) (NH~
— [0 , 1]) равенством
GUI) = G(HFo). ' (1)
Обращение этой формулы имеет вид
Здесь
D l = F*nF~x (3)
есть пе что иное, как эмпирическая функция распределения вы
борки из равномерного на [0, 1] распределения. Действительно,
согласно теореме 6.1 процесс nD*i(t) = nFn {F0 1 (t)) имеет то що
распределение, что и пуассоновский процесс я ( F 0( F 01 (t))) —
= я(£), £ е [ 0 , 1] (с параметром %> 0 ) при условии r t ( l ) = w,
В силу той же теоремы 6.1 это доказывает требуемое утверж
дение.
ПРЕДЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ СТАТИСТИК ВТОРОГО ТИПА 47
— а д | . В этом случае
G (A ) = G(ffF„) = sup \H(F0(t)— F0(i)| = sup — uj,
—oo<f<oo «£=[0,1]
так что
G i Fn) = G (D*) = sup |d ; (и) — и I,
ti€[0,l]
и в соответствии с содержанием § 6 р а с п р е д е л е н и е с т а т и ст и к и
G{F*) н е б у д е т от F0, е с л и F0 н е п р е р ы в н а . П эт о м
за в и с е т ь
G{F*) можно н а зы в а т ь и н в а р и а н т н о й о т н о с и
см ы с л е с т а т и с т и к у
тельн о неп реры вн ого р асп р ед ел ен и я вы борки.
П р и м е р 3. Функционал
оо
G(F) = J | F ( t ) - F 0(»)l\tfV(*)
— ОО
П р и м е р 4. Рассмотрим функционал
G(F) = 2 (^ £ .
j=1 30
где AjF суть приращепия функции F на интервалах Aj — [th iJ+{),
образующих разбиение вещественной прямой. Очевидно, что
48 ВЫБОРКА ЭМПИРИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ [ГЛ. i
G (Н) = G (HF0)
j -*•
где
AjIIF о = H(F0{tj+l)) - H i F M ) = №
6; # есть приращения II па интервалах 6, = 1т,-, t j+1) , Tj = F0{tj).
Стало быть, обозначая той же буквой 6j длину интервала
мы получим
Г
G ( I Q = G ( F X ) = G (D'n) = s (b ,D l - bjY/Sj.
(4)
' g(F<>, vh) - * g { F 0, v).
Последнее соотношение означает, очевидно, непрерывность в
равномерной метрике в точках из С(0, 1) функционала g(F0, н),
который можно называть п р о и з в о д н о й п о р я д к а к от G по н а п р а в
л е н и ю V.
З а м е ч а н и е 1, Напомним, что здесь везде под F0 можно»
понимать равномерное на [0 , 1] распределение.
г
§ 81 ПРЕДЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ СТАТИСТИК ВТОРОГО ТИПА 49
6 (0 = 2
3=1 3 0
п 3=1 з О
Обобщением функционалов в примерах 2 —4 являются функ
ционалы вида G(F) = Gt(F — F0), где функционал Gt является
однородным в том смысле, что GiUiv) — hkG{v). Очевидно, все
такие функционалы будут дифференцируемыми.
Сформулируем теперь основную теорему о функционалах вто
рого типа. Пусть по-прежнему F0(t) s £, £ е [0, II.
Т е о р е м а 1. Если X ^ F 0 и функционал G(F) дифферен
цируем (порядка к) в смысле определения 1, то
жества К.
Покажем теперь, что для заданного 6 > 0 существуют ком
пакт К (и, стало быть, соответствующее ему семейство предком-
пактов Kh) и последовательность 1гп 0 при п °° такие, что
lim sup Р {wn ф. К/,п) ^ 6. (С)
?1—> оо
h+1
2 lim sup Р (о)д^. (шГ‘) >* 8;) 6/2
j = l /г-»<х>
1, 1 1
[р)> ц м '
Т ак как Мш° (р) = 0, Dw° (р) = М {w (р) — pw (I ))2 = М (w (р) (1 —
— р) + р (w ( 1) — w (р )))2 = р (1 — р )2 + р 2 ( 1—р) = р ( 1—р), то ут
верждение следствия 1 можно записать также в виде
(Ср — Ср) V п ^ > Ф о а2, а 3 = р (1 —р )//2 (СР). <3
В примере 2 функционал G (F) = sup \ F (t) — F0 (t) \ диф-
фереицируем и, стало быть, по теореме 1
G ( / ’*) У п sup | w° (t) J.
i=i
i=i
Здесь матрица о2= Hc.jfl та же, что и в примере 7.3, так как
Г
— символ Крочекера),
М (У О (У ) _ 1 я *
-j/T -г - ^bJ a ln a !ijV k
к 6i6j /1“ i
^ 7 7 = ( M i — §&) = ~ /З Д .
r
Повторяя рассуждения примера 7.3, мы получим, что 2 имеет
з= 1
распределение %2 с г — 1 степенями свободы.
В заключение этого параграфа отметим, что далеко не все
статистики, представляющие интерес, могут быть отнесены к ста
тистикам I или II типа. Достаточно рассмотреть, например, ста-
71—1
тистику S (X) = ^ x ixi+i или статистики S, связанные с функцию—
j—1
налами Gn(F), где функционалы Gn «существенно» зависят от п
(не только через выборку), такие, как, скажем, максимальный
член вариационного ряда S (*Х) = х(п) = п п др.
— — sup ] I] (и) — нп j. ( 1)
n UE=[0.l]
pr<fi)=rJjQ( - ^ i ) , ( 2)
QT
где •— j — есть множество точек у ^ $6, для которых х 4- yh ^
е В ; hn -*■ 0 при п -> оо.
Очевидно, что Р н (В ) есть не что иное, как «средняя сумма»
распределений Q, сжатых до размеров 1гп и «посаженных» в точ
ки х,. Определение (2 ) обобщает ( 1). Формула (1) получается из
(2), если положить Q = I 0, так как I x.(/i) = 10 (# — *i)—
= — jt— - j при любой последовательности { h j .
Отметим следующие свойства распределения Р**, которое
мы будем называть сглаженным эмпирическим распределением.
1. Распределение Рп есть свертка распределении Рп и
Q {B!hn), а
Р„ (В )= МР** (В) = J Q
равенство
МР* = Р.
2. Если распределение Р абсолютно непрерывно относительно
меры Лебега, то распределение Рп будет удовлетворять теоремам
типа теоремы Гливепко — Кантеллп. Действительно, в этом слу
чае сходимость (3) будет означать равномерную сходимость рас
пределений по всем интервалам. Ограничиваясь для простоты
одномерным случаем, будем иметь (F**(t), Fn {x) и Q (х) обо
значают фупкции распределения, соответствующие Р**, Рп и Q)
— J (/^ (y ) —
- М В . - т [ м '5 « , ( Ч г ) - * л и ] .
"М ^ Н М т т )™ -» -
— J q2 (z) f (я — zhn) d z - + f (a:) J q2 (z) dz = / (a:) cZ'2. (8)
Таким образом, MfejP ^ f (a:) d r hi, если fix) > 0. Условие Линде-
берга в нашем случае имеет форму
пМ ( |i , n; | h,n | > *) -> 0 (9)
при п 00 и любом е > 0 . Так как h nf f t (я) —>-0, 2 ( g 2 ((а:—
—xf)/hn) Д hnf n ( x ) \ то для выполнения (9) достаточно, чтобы
\ .Г -х Д
Мf 1 А Л-
\ к q V hи tJ* ч к /
Это соотношение имеет место, так как левая часть его равна
(ср. с (8))
\ ( f (z) f {я — z!i7L) d z ^ c j* q1 (z) dz -> 0 .
o (T )> £ \ /n h a Q (z)> E ^ / n h n
П
Таким образом, к случайной величине (я) — 2 ьь п прпмепи-
л=1
ма центральная предельная теорема. Это доказывает теоре
му 1. <
СГЛАЖЕННЫЕ ЭМПИРИЧЕСКИЕ РАСПРЕДЕЛЕНИИ 50
и И = J Ч(z) / ix — zhn) dz —
г Г 2д3
= J q (z) I / (x) — zh nf (я) 4---- 2~ Г И + ° ( z4tn) dz —
(10)
м № м - / (x)]2 - (« )•
Минимизация этого выражения по h n и q даст, в силу асимп
тотической нормальности £п(я), наименьший возможный «раз
брос» /* (х) около значения fix ). Одиако минимизирующие зна
чения /гп и q прп этом будут зависеть от х через неизвестные
значения fix ) и f " ix ) . Чтобы избавиться от этого эффекта и по
лучить оптимальность «в среднем», естественно рассмотреть ин
теграл
jM[/,*,(x)-/(x)P<fo, (11)
главная часть которого будет равна /^ »^Ч—2Л3 , тд-
) Ф 4~ ,(это полу
§ 1. Предварительные замечания
К ак мы уже отмечали в предыдущих разделах, исходным
объектом статистических исследований является выборка
Х п (х,, ..., Х„), Xj£=
из распределения Р, которое полностью или частично неизвест
но. В математической статистике традиционно выделяют в каче
стве основных два следующих класса задач:
1. Оценка неизвестных параметров.
2. Проверка статистических гипотез.
Задачи первого класса возникают, когда по выборке X — Х п
нужно оценить какую-нибудь неизвестную числовую характери
стику 0 распределения Р (оно ведь неизвестно). То есть, для за
данного функционала
0 = 0(Р)
от распределения Р мы должны указать функцию от выборки
(или, что то же, статистику)
е* = е; (х ?1),
предназначенную для использования вместо параметра 0 в каче
€2 ТЕОРИЯ ОЦЕНИВАНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ [ГЛ. 2
0* —v -<«■
1 2 i=vx+l
где х {)), / = 1 , I?., п,— элементы вариационного ряда и т. д. В ка
честве 0* можно брать и значепия, не зависящие от выборки.
Можно положить, например, 0* = 0, хотя это не всегда разумно
и совсем плохо, если множество возможных значений 0 не со
держит 0.
В связи с последним замечанием отметим, что часто в постам
новке задачи об оценивании содержится указание на то, каким
является множество © возможных зпачепий параметра 0. Напри
мер, если оценивается доля 0 какого-нибудь минерала в руде, то
ясно, что 0 е [0, 11.
Во многих случаях бывает заранее известно также, что рас
пределение Р выборки X пе может быть произвольным, а при
надлежит какому-то определенному семейству распределений .9*.
К задачам оценки параметров относится пример 1 пз Вве
дения.
Задачи второго класса имеют дело с проверкой того или ино
го предположения (гипотезы) о неизвестном распределении Р.
Например, мы можем проверять гипотезу о том, что Р имеет тот
или иной заданный вид. К этому типу задач относится пример 2
из Введения.
Позже мы увидим, что .качественной разницы между задача
ми первого класса (теории оценок) и второго класса (проверка
статистических гипотез) не существует.
В этой главе мы приведем постановки задач и подходы, ко
торые тесно связаны с результатами предыдущей главы и кото
рые можно назвать «чисто статистическими», в отличие от более
общих теоретико-игровых подходов, которые будут изложены
нами в отдельной книге (см. предисловие).
В известной мере чисто статистические подходы выражают
существо методов математической статистики. Исторически они
НЕКОТОРЫЕ ПАРАМЕТРИЧЕСКИЕ СЕМЕЙСТВА G3
так что
(В) = (*)<&.
В
= й J “v “ = (А' + 1/2>’
где
J e tfxY«.3iHda; = ^l — \ (3)
Если £ € = Г ад , то
оо оо
*«* = T W = I W J = т г 1 - <4>
о о
Такой же результат при целых £ > 0 можно было бы получить,
дифференцируя характеристическую, функцию. Полагая £ = 1, 2,
НЕКОТОРЫЕ ПАРАМЕТРИЧЕСКИЕ СЕМЕЙСТВА 65
находим
Ms = Х/а, Dg = } Ja \ (5)
Из формул (3), (4) видно, что параметр сс играет роль мас
штаба, так что
т)/а£|Е Гад, если г|£ = Г 1Л.
В силу этого обстоятельства многие свойства Г-распределе
ний достаточно изучать при каком-нибудь одном значении а , на
пример при а — 1 или а = 1/2. Второе значение часто будет для
нас более удобным, так как .распределение Г 1/2, >. играет важную
самостоятельную роль в математической статистике и называ
ется распределением «хи-квадрат» (или х2-распределепием).
4. Распределение «хи-квадрат» Hft с к степенями свободы
Так называется распределение Hj, = Г1/2 h/z при целых к > 0. Мы
сохраним это название за распределением II/t и при произволь
ных к > 0. Характеристическая функция распределения Hft рав
на в силу (3)
( 1 - 2 il)~h,\
Отметим следующие три свойства распределения Н,.
1) Если ip независимы, тр (=§ IIft , i = 1, . . . , s, то
Я S
jS Pi Л/! j к =
i—1 j—1
Это свойство сразу вытекает из вида характеристической функ
ции распределения Н,(.
2) Если £бЕЁФа о 2» г®е Фа а 2 есть к-мерное нормальное рас
пределение с невырожденной матрицей вторых моментов ог, то
Q (I) = (I — а) — а)т^ И/{.
Действительно, характе!шстичоская функция случайной ве
личины £К£;) равна
(С)
1/24
Отсюда и из теорем непрерывности § 1.5 следует, что наряду
с (6)
l/"2у* — У 2 к — 1 <==> Фод.
Эта сходимость служит основой для приближенного (при боль
ших к и х) равенства H h((0, я)) « Ф(У2ж—V2& — 1), Ф(я) —
= Ф о , 1( ( - со, я)), которое, как правило, оказывается более точ
ным, чем приближение И* (-(0, х)) ш Ф^ — вытекающее
из (6).
Отметим еще один частный случай Г-распределеппя, часто
встречающийся в приложениях.
5. Экспоненциальное распределение. Это есть расирсдслспие
Га> i с плотностью
а е -ах, х > 0.
Из формул (5) получаем для £ ^ = Г од
M l = 1/а, D | = 1/a2.
Рассмотрим теперь некоторые распределения, связанные с
нормальным и гамма-распре делениями и играющие важную роль
в математической статистике. В отличие от предыдущих, эти
распределения нам прежде не встречались.
6. Распределение Фишера F ft /<9 с числом степенен свободы
&j, к2. Так называется распределение случайной величины
I = 111/ 112,
где г)} независимы, тр €= БЦ , / — 1,2. Из свойств Г-распределс-
пий следует, что распредслеиие I останется тем же при
6ЁЁ Гa.ft^/2 и любом ос > 0 и что Z, при целых к] допускает пред
ставление
т £?+ -+ Й г
с?+ — + & ’
где случайные величины \ и независимы, ^ ^ Ф о д , £«€§Фо,1.
§ 2] НЕКОТОРЫЕ ПАРАМЕТРИЧЕСКИЕ СЕМЕЙСТВА G7
, , v Л Г (!;<.*) Г {v t )%x ~ Xv ^ X - v- vx ,
/<»(*) = ^ -J r fil)r ( ^ ) e •’ * ’ =
0
oo « .
^-1"1 Л -i . Xi—*
___________ Г - C(i+»)rf » Г +M (7)
~ »’ (X )г P .) j (1-1- ,)h + l‘ r p .) *' <4> ''
t
Р т ( У +•••+£?)
где £j независимы, lj(§§Фол» 7 = 0, Очевидно, что —t
имеет то же самое распределение и, стало быть, распределение
Стыодента симметрично относительно начала координат. Далее,
* *е; и,
I6J ,ч 2 ’
где rjj независимы, rj, 1]2€=Д ч. Это значит, что t2/k имеет
Г (Л ,-Ц г)
kj — kj/2, ж>*0.
г (/.,) Г(Д2) ‘(1 + f f i + V
(к , К) =f ХЧ ~
'(1 - x ^ - 'd x = -г(( У
При 1 = 1 ,2 находим
М р = т -Ь ^ _ , МР2- М Ч + 1)
Ч + Ч * (Ч + Ч) (Ч + Ч + 1) *
9. Равномерное распределение. Частным случаем В-распредс
ления является равпомерное на [0, 1] распределение, которое
получится, если положить А1= Я 2= 1.
Символом U0, 6 мы будем обозначать равномерное распределе
ние на отрезке [я, Ы, так что B (i j = U 0j *.
С помощью В-распределения можно описать распределение
членов вариационного ряда х((0 выборки X.
Т е о р е м а 1. Если Х £ = Р есть выборка из распределения
Р с непрерывной функцией распределения F, то
У(л) ~ F (xw ) ВА,я_*+1
70 ТЕОРИЯ ОЦЕНИВАНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ [ГЛ. 2
ноэтому
Ka,a{t) = e x p {iat — о\ t\ },
Уау,о1 (P) ^а2,ст2 (0 = exp {? (aA+ a 2) t (Oj -j- a 2) | 11},
так что свертка K ai>ai и K a.2>02 равна K ai+0C2iai+O2.
Нетрудно видеть, что К 0, , = Т , .
В приложениях часто приходится иметь дело с разного рода
функциями от нормально распределенных случайных величин.
Одна из них — экспоненциальная функция, с которой связано
так называемое логнормальное распределение.
11. Логнормальное распределение Ь х о2. Мы будем говорить,
что Т] (§§ La>a2 , если 1 п ц ^ Ф а 0о. Другими словами, ц = ег, где
§ € = Ф а о 2. Отсюда видно, что распределение L » сосредоточено
на положительной полуоси.
Плотность Ц L 2» в силу формул для плотности функции
от случайной величины (см. [11], стр. 53), равна
Фа.о* (1п х)
Кроме того, находим
О/—о:>-
(а а')." — а"
Мц — f е' — — е 2°" dy = ехр •X
J о 1/
V 2л 2ст"
Г 1 ( (н — —П2)2 \ 7
х ] Т у 1 л 'е х р ( -----------3 ? -----
<"//—о:) -
Мч3 = Г е2" — в 202 dy = в» + " 5.
а а у 2л
НЕКОТОРЫЕ ПАРАМЕТРИЧЕСКИЕ СЕМЕЙСТВА 73
i= 1
Выборочные моменты, используемые для оценки
Mxt — J х Р (dx) и Dx, = J (х — М хА)2 Р (dx),
имеют свои специальные традиционные обозначения
П П
e* = G ,( p ;) (2)
вместе с С ( « ) будет оценкой подстановки, при этом множе
ство возможных значений 0* будет принадлежать 0 .
Про оценки (1), (2) мы будем говорить, чтоони получены
сужением метода подстановки.
Пусть, например, оценивается параметр а нормального рас
пределения Ф а, !, и нам заранее известно, что a e [ 0 , 1J. Тогда
может оказаться, что оценка а* = х ^ 10, 1] (очевидно, что
х =. J t d,F*n (t) есть оценка подстановки). Сужение метода под
становки рекомендует в качестве оценки взять точку из l0, 1J,
ближайшую к х.
Отметим теперь, что в сформулированном виде метод подста
новки не всегда имеет смысл. Дело в том, что исходный функ
ционал G может оказаться не определенным на множестве эмпи
рических распределений. Пусть, например, заранее известно, что
распределение Р принадлежит классу FP абсолютно непрерывных
относительно меры Лебега распределений, так что каждое Р е=
имеет плотпость /. Нас интересует значение
e ^ G ( P ) = j V (* )d * =
при п °о.
Оценка 0* называется сильно состоятельной, если при п.-* оо
0*— * 0 .
П.П.
о* = а( 4 2 ? ы ) . . (3)
есть статистика I типа. Тогда из результатов § 1.7 вытекает сле
дующее утверждение. Предположим, что 0 — скалярный пара
метр, a g — скалярная функция.
Т е о р е м а 2. Пусть XGez F q, h дифференцируема в точке
J
а = ё (х ) dF0 (ж), 0 < | h' (а) \ < оо, J g2 (х) dF0 {х) < оо. Тогда
0* — а. и. оценка с коэффициентом
а2= [ h' («)J2 j (g (л) —о)2 dF() (x).
Примеры, рассмотренные в § 1.7, можно взять в качестве
иллюстраций и к этой теореме, так как статистики, рассмотрен
ные в них, используются в качестве оценок.
Аналогичным образом мы могли бы, пользуясь результатами
§ 1.8, получить условия асимптотической нормальности оценок,
являющихся статистиками II типа. Читатель может получить
нужные утверждения, если воспользуется теоремой 1.8.1 без ка
ких-либо ее изменений, потребовав, однако, чтобы в се форму
лировке выполнялось к — 1, а производная g была такой, что
g{F О» О ^ Ф 0,02.
3. Асимптотическая нормальность. Случай многомерного па
раметра.
О п р е д е л е н и е 2А. Оценка 0* ~ (©i, . . . , 0л) называется
а. н.оценкой 0 = (01? . . . , 0*) с матрицей о2, если
(0* — 0) V п Ф оо2, (4)
где Ф( 02 есть /с-мерное нормальное распределение с нулевым
вектором математических ожиданий и матрицей вторых моментов
° 2 ~ II I- Плотность этого распределения равна (см. § 2)
П
Решая уравпения (а) — х, т 2 (а) —— ^ xf, мы получим
г=1
оценки по методу моментов
. —1/2
а* = (х)V— 1
и а** = ■Иг- > . х? I . (5)
(6)
разрешимо относительно 0 = С(Р), так что последнее равенство
вместе с (6) превращается в тождество 0 = GKP0) при Р = Р 0.
Оценкой по обобщенному методу моментов мы назовем
оценку
«(P.Q
f / И 1п7 [ ^ И^ ^ J f № ( j j ^ ~ 4) Р =
= J ё И I1 (<&) — j / (ж) I1 (da;) = °* (2)
Если соотношение f ~ g п. в. [р]не имеет места, то,очевидно,
знак неравенства в (2) будет строгим. <3
Рассмотрим теперь семейство 5э = { Р е}еев, удовлетворяющее
условиям (Д0), (Д Д и «расстояние» d (P 0, Q) между произволь
ным распределением Q и распределением Ре е 03.
2 In /е (х{) = In П /е (х0,
i= l i —1
присутствующего в (5). Для простоты рассмотрим сначала диск-
П
ретный случай, когда ц — считающая мера. Тогда П /е(хг) есть
г—1
вероятность появления исхода X = (xl7 , . хп), Стало быть, мы
выбираем в качестве 0* значение параметра, которое максими
зирует эту вероятность (ведь функции ср(0) > 0 н In ср(0) дости
гают экстремумов в одних и тех же точках).
Аналогичное толкование имеет место и в общем случае. В си
лу независимости хг имеем для множеств В = В 1х , . . Х В п, В г е
п
Таким образом, П
i= l
fe{x{) \in (dx) можно интерпретировать (ана-
логично дискретному случаю) как вероятность попадания выбор
ки в параллелепипед, образованный пересечением «полос» (х,,
сс{ Jr dx{), и оценка максимального правдоподобия максимизирует
по 0 эту вероятность.
Функция
П у
/е(*) = П /о ( * 0 -
i=l
£ (X, О) = in /е (X) = 2
г—1
г (х4, е), ^
П П
где Y = (ylt . . . , Уп), Уг = 1п Х Ь Sy (у* “ у ) 2«
г -1 L " i= l
интеграла в равенстве
j /еИ И{Ах) = 1.
Тогда
O-.J f'0(x)p{dx)=* j =
■= j Р (*» 0) /о (*) Ц (<*-г) = М0г (хА, 0).
{/eW^o}
Таким образом, если мы в (4.6) положим g(x,
0) = 1'{х, G), то получим для
оценки по обобщенному методу моментов уравнение
§ 7. О сравнении оценок
Мы видели, что существует много весьма естественных; под
ходов к получению оценок. Возникает вопрос — как сравнивать
между собой разные оценки и какие оценки следует предпочи
тать другим? Мы выделим два подхода к сравнению оценок —
среднеквадратический и асимптотический.
Первый из них основан на сравнении среднеквадратических
уклонений. Второй подход применим лишь к выборкам большого
объема, так как он основан на сравнении «рассеиваний» распре
делений для (б* — G) У/г при больших п. Основанием для такого
сравнения служит обычно вид предельных распределений для
(0* —0)У/г нри п -> сю (если таковые существуют). Соответствую
щие предельные теоремы дают нам условия, при которых распре
деление (0* — б)Утг при больших п можно приближать с помощью
упомянутых предельных распределений.
В этом параграфе предполагается, что оценки сравниваются
при каком-то одном неизвестном, но фиксированном распределе
нии выборки Р.
1. Среднеквадратический подход. Одномерный случай. Это
подход используется при рассмотрении оценок по выборке X лю
бого фиксированного (не обязательно большого) объема. Он со
стоит в сравнении средиеквадратических уклонений М (0* — б)2.
П р а в и л о 1. Оцепку 01? в соответствии со средпеквадрати-
ческим подходом, мы будем считать лучшей, чем 02, если
м ( о Г - о ) 2< м ( е * - е ) \ (1)
94 ТЕОРИЯ ОЦЕНИВАНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ [ГЛ 2
еГ = х, е* = *«>, е3* = - ^ 4 М -
Имеем
i
Dxj = J {х - 1/2f d x = 1/12, М (еГ — е )2 = Dx = Dxx/3 = 1/36.
о
Далее, в силу определения медианы Ы недетно) {Е* <•*} :
= | f ; ( * » i / 2 ) и, стало быть,
П
Г (? ,* < : г ) = Р ( р : (х ) > 1 /2 ) = -2 Р ( п К О ) = Л ). (3 )
*=(«+1)/2
Для ?г = 3
Р (F J (я) = 1) = Р ^ п г {Xi< х}^ = /?3
где F (гг) = j / (/) dt = Р (хх < гг). В случае Р — U 0ii эта плотность
—оо
будет равна Qtxil —х) при х ^ [0, 11, так чтб
1
М (V Y = J Gx3 (1 - х) dx = сfа - А) =
О
Dt* = М К*)2 - (ME*)2 = ± i = -А
M ( o j) 2 = J J j 6 (к — u) du dv.
О О
s2 =
а также оценку
= V 2 Ui - Mxi)a = i 2 X? + (MxJ> - 2TMx,
^ = = м^ ) 2=
Ш т< А + 2,
2 g И /е {х) = 0
X
или, что то же,
d — DoOf, Д; = о? — е, е* - А -1 , г = o ,i.
Так как
( A + A . J + ( A° 7 At)8 = А\
(0 )
2
Ло + Д1 - о* — е, д0- д 1= о ; - е г ,
то
Ме (в* - О)2 + А М0 (0о* - 0? ) 2 = D + С (0). (7)
р К - e*) = VA.
Доказательство читатель может провести самостоятельно, убедившись,
чго при р(бо* и соответствующем выборе а оценка
0* = (1 — ос) 0* + а0* е К ъ
равенством
М (IIН) = -Мр(- ^ ;>, <1)
Q (Л) = f 1
А
В общем случае положим Е — Е+ ~ 1 Е+ — шах (0, > О,
Е” = max (0, -Е ) > О,
Е = Е+ ~ Г ,
где I* — у. м. о. для Е*. Этим доказано существование у. м. о., так
как Е будет удовлетворять условиям 1), 2) определения 2. Отсю
да же следует и единственность, так как предположение о не
единственности Е будет означать неединственность §+ или До
казательство для векторных Е сводится к одномерному случаю,
так как свойствами 1), 2) будут обладать координаты Е, существо
вание и единственность которых нами доказана. <]
Существо проведенного доказательства достаточно прозрачно:
ведь по условию 2 для всякого А ^ S l задано М (Е;^-) — J Е^Р>
л А
т. е. заданы значения интегралов от Е по всем множествам A s §1.
Ясно, что это должно определять St-измеримую фупкцию Е одно-
значпо с точностью до значений на множестве меры 0.
Смысл М (E/St) остается прежним — грубо говоря, это есть
усреднение Е по ^неделимым» элементам St.
Если St = S, то, очевидно, Е = Е удовлетворяет свойствам 1), 2)
и, стало быть, М (Е/$0 = Е-
О п р е д е л е н и е 3. Пусть Е и 11 — случайные величины на
(Q, $, Р), St = о(г)) есть о-алгебра, порожденная случайной вели
чиной г). Тогда IV!(E/St) называется также условным математиче
ским ожиданием величины Е относительно т).
8 А. А. Боровков
i!4 ТЕОРИЯ ОЦЕНИВАНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ [ГЛ. 2
Р ( | а Д/п = У) = (2)
* 2 р ( - т - с £ , ) ( г / - а 2) ( (/, - а 2)21]
1
О
охр j
/°Ha22 ‘ °22 J)
1---
I 2 ( 1 - р г)
Одномерные плотности и | 2 соответственно равны
(*-«1Г (V—ОСо)-
/(* ) =
У 2поч
у(у) =
] / 2л 22
■ *= j M, ( 0 * - * ) * g ( f > X ( A ) (3)
то оценка 0* минимаксна. -
Д о к а з а т е л ь с т в о . Пусть 0* — любая другая оцепка.
Тогда
sup Mt (0* — t)2 ^ f М< (0* — t f q (t) К ((dt) >
t J %
> J M, ( e j - 0* ? (t) (dt) > m ,(01* - 0*. <
Из равенства
следует, что
14-Tih*14“^1h
j|(
Так как байесовская оценка a Q(fe) параметра а равна математи-
ческому ожиданию апостериорного распределения, то отсюда по
лучаем
* хпк. X
a Q<fc> 14-пк 1 1
i + Xk
ОТ
•Т — ° 47Г> 4 ( 1 + У У
В то же время ясно, что для всех значений р, лежащих вне
узкой окрестности точки р = 1/2, оценка х все же будет лучше,
чем Pq — это будет иметь место для всех р, для которых
р ( 1 - р ) < Щ + Т /у ^ р
Р (х = ж , . . . X = хп)
SJ. I 11 если 2 ] Xi S)
— Р (их = s) рл
P (X = a?/nx = s ) = * г~ (1)
О, если 2 * i ^ s .
£ 12] ДОСТАТОЧНЫЕ СТАТИСТИКИ 129
1=1 1- 1=1 x i l
п
п х — 2 -И,
{—1
Ч> (К
,S) = e
1^1 x v
О т с ю д а в силу теоремы 1 будет следовать, что S = пх есть до
статочная статистика.
9 А. Л . Боровков
ISO ТЕОРИЯ ОЦЕНИВАНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ [ГЛ. 2
определяться соотношением
, .. Of) /е IJ 1
' 4' ( ! ,/s ) = ^ = ^ r п р и й = 8-
= а ехр
[0~п при 5 ^ 0 ,
0) = {А
(U в противном случае.
оо
при всех X. При этом S = sup {0: f e(X)/ f Q(X) — 0). Это означает,
что S измерима относительно минимальной о-алгебры 5t0, g(S) <=
<= §10 и что, стало быть, ^-минимальная достаточная статистика.
Можно указать другой способ отыскания минимальных достаточных
статистик, такж е связанный с функцией правдоподобия. В самом деле, лю
бая статистика и, в частности, достаточная статистика S порождает разби
ение выборочного пространства на классы эквивалентности — т. е. па под
множества точек х с одинаковым значением S (х).
Если S ь подчинена S2, т. е. S \ — ср(3'2) , то, очевидно, разбиение для
S 1 будет более крупным, так как классы эквивалентности для S 2
содержатся в классах эквивалентности для 5 ;. Таким образом, минималь
ной достаточной статистике соответствует самое «крупное» разбиение сре
ди разбиений, порожденных достаточными статистиками.
Можно рассматривать просто разбиения пространства на классы экви
валентности, по связывая их непосредственно со статистиками. Класс экви
валентности, содержащий точку х , обозначим D(x). Каждый класс однознач
но определяется какой-нибудь одной своей точкой. Разбиение па классы
D будем называть достаточным, если
/ е (ж) = Ф (x , 0) h (x),
(2)
где <р (х, 0) = ф (х 0, 0) постоянно при х е D (х 0) (т. е. Ф (х, 0) = const внут
ри класса эквивалентности). Е с л и классы D (х) определяются соотношениями
S (х) = s, то из теоремы 11.1 сразу вытекает, что статистика S (х) до ста
точна тогда и только тогда, когда разбиение на классы D достаточно.
Рассмотрим теперь разбиение, построенное следующим образом: возь
мем точку х 0 и объявим, что х принадлежит классу если отно
шение
(3)
не зависит от 0. Очевидно, что при таком построении D ( x {) = D ( x ^ —
если так что правило (3) порождает разбиение
всего пространства на пенересекающпеся классы.
§ 131 МИНИМАЛЬНЫЕ ДОСТАТОЧНЫЕ СТАТИСТИКИ 137
h W lh К) = П Х г' = П Х г Л Х г-
П
пе будет зависеть от "К тогда п только тогда, когда х — хп = xi0» где
г—1
х |*о— координаты вектора х () Этого достаточно, чтобы заключить, что
S (х ) = х есть минимальная достаточная статистика.
Рассмотрим теперь с помощью предложенного правила пример, когда
«экономных» достаточных статистик не существует. Прежде заметим, что
вариационный ряд S v = ( х(щ х( 2)’ •••> х (п))» построенный по выборке X,
очевидно, всегда является достаточной статистикой, так как / е (X) —
п п
=П /e(xi)= n / 0 (x(fc)). Эта статистика «чуть-чуть экономнее» самой
i= 1 ' ft=1
выборки X. Отсюда, в частностп, следует, что любая мпш ш альная достаточ
ная статистика инвариантна относительно перестановки координат х* в
выборке X.
Если плотность fo(x) симметрична, т. е. /е ( —х) — fe(x) при всех 0,
то, очевидно, будет существовать еще немного более «экономная» достаточ
ная статистика, представляющая из себя упорядоченную по возрастанию
совокупность(х®, . . . , х£), которую мы обозначим
П р и м е р 3. Если Х(=Е КО0,т. е. если х ; имеют плотность распределе
ния Коши с нараметром 0 = а
' ‘ t- 1
так что
(5)
единственности 0*
{0* < f } = Гsup ф (S (X), 0 ) > sup ф (S (X), 0)1.
I 0<f 0ist /
Так как ф(5(Х), 0) при каждом S ( X ) непрерывна по 0 спра
ва (или слева), то существует счетное всюду плотное множество
0 С= cz 0 (одно и то же для всех S ( X )) такое, что
sup ф (S (X), 0) = sup ф (S (X), 0 + (7)
е<г 0j «
9jS
Такое же соотношение будет справедливо для области 0 > t. Так
как ф(5(Х), 0^) измеримы относительно o(S), то в силу (7) зна
чения sup ф (£ , 0) и sup ф (S , 0) будут случайными величина-
e<t
ми,. также измеримыми относительно о (S). Следовательно,
{0* < t) е о(&), и теорема доказана. <3
Условие достаточности о. м. п. 0* в условии приведенного
утверждения существенно, поскольку оценка м. п. 0* сама по
себе не обязана быть достаточной статистикой. Соответствующий
пример легко получить, рассмотрев любое семейство распределе
ний {Ре) со скалярным параметром 0 и векторной (размерности
большей 1) минимальной достаточной статистикой S. В этом
случае оценка м. п. 0* также будет скалярной, так что с-алгебра
о(5) будет более богатой, чем о(0*), и, стало быть, включение
o( S) сг о(0*), вытекающее из минимальности S и достаточности
0*, невозможно.
П р и м е р 4. Пусть X g _ U eil+fl, © = R. Тогда, как мы ви
дели в примере 6.4,
(1 ПРИ 0 < Х(1) < Х(„) < 1 + 0 ,
' \0 в противном случае,
так что / 0(Х) зависит от X только через х(1) и х(п). Это означает,
что S = (х(1), х (п)) есть достаточная статистика- Ни одна из ве
личин х (1), х(п) в отдельности не является достаточной статисти
кой, на что указывают следующие соотношения:
П
Р (Х(1) > и, Х(„) < v) = П р (х* е [и, v)) =
i=l
— (v — и)п при н > 0 , V< 1 + 0, v^> и.
г (х1 = ш = *) = с5 ( |) * ( 1 - А ) ,' \
Следовательно,
* ОС
U1 (х) = In X, и 2 (ж) = X, V (а, X) — ln -f-щ ,
ах (а, X) = X, а2 (а, X) = — а. <]
Функция правдоподобия для равна
П
/е (X) = ехр {(а6),
( S) + nV (в)} Ц h (х,),
где
а (0) = (а, (в) в* (0)), S = (S, , . . . , S k),
п
SJ = S j ( X ) = ' 2 (х{),
1=1
Заметим, что так как h$ (0) = [ G ; {du) <T оо, to Gj можно считать
вероятностными мерами. Из теоремы'о взаимпо однозначном со
ответствии между характеристическими функциями ц распреде
лениями ([11]) и нз (2) следует, что G, = G2.
Если параллелепипед I имеет вид {х: \х — ccol^cc), то сле
дует перейти к мерам G* {du) = е 0 Gj {du).
В многомерном случае к > 1 доказательство происходит точно
так же. <3
Мы можем перейти теперь пепосредствеппо к д о к а з а т е л ь
с т в у т е о р е м ы 2.
Нам надо доказать, что если ср — измеримая функция в
330 и существует
J Ф (s) Ge {ds) ~ 0 при всех 0 е 0 , (3)
то ф Ы = 0 п. в. [^ ], ^ = {G0}e<=e. Пусть <р = ф+ —ф“, где ф± 5*0.
Тогда пз (3) следует j ф+ (s) Go(ds) = j* ф- (s) Go {ds), или, в силу
леммы 1,
f <р+ ( 0 Ф (* , 0 ) v (ds) = J ф ” (•s) t 6) v {d s),
/(^ ( ^ ( ^ М е Г Г К ,® ) ] * . (1)
получим
е в
L (.г, 0) = 0* J* с (t) dt — j* с
(t ) a it) dt + L (x , 0A),
% h
что эквивалеитио (3) для [p n] п. в. ос. Так как изменение /в(а?)
на множестве р п-меры 0 роли не играет, то (3) доказано.
Обратимся к последнему утверждению теоремы. Если 0* =
— const, то b'(Q) = —1 и обе части неравенства (2) обращаются
в нуль. Пусть теперь выполнено (3). Тогда, дифференцируя по 0
функцию ЫХ , 0), получим
L' i X, 6) = 0*Ж (0) + В' (в).
Из (7) следует, что а(0М '(0) + B'(Q) = 0. Поэтому
L'(X , 0) = Д '(0)(0* —а(0))
и, стало быть (см. (10)), в (2) достигается равепство. <3
В дальнейшем тривиальный случай 0* = const мы будем ис
ключать из рассмотрений и будем предполагать, что DgO *)>0
всюду па 0 . Тогда справедливо
С л е д с т в и е 2. При выполнении условий (Ю для достиже
ния нижней границы в неравенстве Р а о — Крамера необходимо
и достаточно, чтобы оценка 0* была достаточной и функция
т]:(0*, 0) в факторизационном равенстве имела вид
я];(0*, 0) = ехр {0*Д (0) + Ж0)},
где Ж 0) и 7?(0) — дифференцируемые ф ункции.
' С л е д с т в и е 3. Если выполнены условия (/?), 0 * ^ Х &, и в
неравенстве Рао — Крамера достигается равенство, то 0 * — эф
фективная в Кь оценка.
Это утверждение следует из представления
Ме (0* - 0)2 = De0* - f b- (0).
Заметим, что обратное, вообще говоря, не верно: оценка мо
жет быть эффективной в Кь, по нижняя граница -111h_ M l
nl (В)
для дисперсии может не достигаться.
П р и м е р 1. Пусть X С§ Га д. Здесь / в (X) = а 1е~апх. Усло
вия (/?) в области 0 £ { а ^ б > О ) вынолнепы. Очевидно, S — их
есть полная достаточная статистика. Поэтому оценка сс* = х-1
= M « .( x '7 s ) является эффективной в классе К,, со смещением
Ь(а) = Мах-1 — а .
Заметим теперь, что так что при п > 1 (см. § 23
Мах-1
w = пМсс^-1 = —^-гСС.
п —1 /
’ , П 1 * /4 1\
Таким образом, оценка а ** = — а ’ 11 — — I будет при
п > 1 несмещенной.
154 ТЕОРИЯ ОЦЕНИВАНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ [ГЛ. 2
Dr/a** = а 2 — l] = - А _
(_/г — 2 J /г — 2
Итак, при ?г > 2 оцепка а** является эффективной. Однако кри
терий (3) не выполнен, так как
и ( Х ) = а - пе - а{п~1);а* \
Следовательно, в неравенстве Рао — Крамера нижняя граница не
достигается. В этом можно убедиться и непосредственно. В самом
деле, здесь /(#, а ) = In а — ах, Г(х, а) = 1 /а —х и
и/(0) ап п—
2 Daa* V *
для всех 0* е R 0
lim inf Мен (0* - 0)2 > Г 1 (0) - lim М0и (©Г - 0)2. <3
П -» о о 7 1 - * ОС
nSПА
где —у -у 2 (Х! — а ) 2 имеет распределение Н п = Т 1/ 2>П/-2, поэтому
о
(см. § 2)
Л /т
D o * = М п | У ч у — 7- - - - -
Г(т) (l) (13)
° у 2
r2№ )
С другой стороны, здесь
1 (х — а)~
V (х, а) =
так что (п !(о ))~ 1 — о 2/(2п). Но это значение отличается от (13). Их от
ношение, например, для п = 3 равио 0,936. Таким образом, /{-эффективных
оценок едесь не существует. При п-*- оо коэффициент при о 2 в (13) ведет
1 / 1^
\-ак у
себя асимптотически как -г О I у }, так что о* есть о. R-э. оценка.
~п \ п j
/« (в ) = м вг;(х1,е ) г ;( х 1,в )
и предположим, что выполнено условие
(R). Ф ункции У/е(ж) непрерывно дифференцируемы по 6j для
п. в. [р.] значений х. Матрица
7(0) == ll/fj(0)H,
1ц (0) = J l'i 0) Ii (z; 0) /e И p (dx)
непрерывна no 0*), ее определитель 17(0)1 отличен от нуля.
Так как 7(0) есть матрица вторых моментов случай
ных величии li = 1%(хь 0), то она будет положительно опреде
ленной матрицей, так как для любого вектора а = (a lt . . . , a h) Ф
Ф 0 выполняется
2 cciajMelilj = Me ( 2 а ih У ^ О»
где равенство пулю исключается условием 17(0)1 =^0.
Неравенство между матрицами of ^ о\ мы, как и раньше,
2 Т 2 Г ^
будем понимать как неравенство а а га ^ ао 2а для любого векто
ра-строки а = ( a t, , . a ft) Ф 0. Это эквивалентно, очевидно, тому,
что матрица о 2 — о \ неотрицательно определена. Строгое нера
венство будет соответствовать положительной' определенности,
так что, например, 7(0) > 0.
Т е о р е м а 1А. Е сли Ъ * ^ К Ь и выполнено условие (R), то
для матрицы вторых моментов о2 = || Оц j| = Me (0* — а (0))г (0* —
— а (0)) любой оценки 0* вектора-строки 0 справедливо нера
венство
0s > i (iB + О (8)) (0) (Е + (1-5).
L) = L] (X , 0 ) = S l'i ( х „ 0 ) , L ’ = L ' (X , 0) = , К ).
1=1
Й<*. 0) = - ^ . 4 ( * ,о щ ( x~ a f 1
2а 4 2а
(напомним, что 1ч есть производная но о2, а но но о, ср. с при
мером 3). Поэтому
(х — а )2 \
1 ц (6) = Ме — — “V»
(х, — а )3 х. — а 1
[ L ~ ^ 2 ------ — , - j = о,
hi (в) = -А4о Мо ( К - а )2- а2р = А2а
Отсюда находим '
, [ о У п 0 1 ч
= lo 2avJ- (22>
Вычислим теперь для сравнения матрицу вторых центральных
моментов оценки 0*.
§ 1C] НЕРАВЕНСТВО РАО — КРАМЕРА И ЕГО СЛЕДСТВИЯ 163
Имеем
М о № - 0.)№ - о 3) = о.
Последние два равенства устанавливаются непосредственным
подсчетом. Рассмотрим, например, второе из них. Нам достаточно
убедиться, что
Мо (* — ос) S i — 0. (23)
Но
/ s (e) = M0 [(iog£e(S))T
мы будем называть информацией, содержащейся в статистике S
относительно параметра 0.
Отметим, что значение I s(0) ие зависит от выбора меры X.
Действительно, пусть X — какая-нибудь другая мера и v *= X + X.
Тогда X и X абсолютно непрерывны относительно v, а плотность
go (•■?) распределения S относительно меры v равна
$ (« ) = ge (-s-)4v =
Г" ,-р dX dX п
где ge — плотность относительно д. 1ак как и от 0 пе
зависят, то производные от логарифмов всех трех выражений
будут совпадать.
Т е о р е м а 1. Пусть плотности /е<Ы и g e(.s) удовлетворяют
условиям (Ю. Тогда
* / 5( 0 ) < /* ( 0 ) . (1)
Равенство адесъ достигается тогда и только тогда, когда S есть
достаточная статистика.
Д о к а з а т е л ь с т в о . Для любого В е S3' обозначим S~l(B) е
е множество х ^ ё в п^ для которых 5(ж) е fi, Тогда по оп
ределению у. м. о.
J L' (х, 0) Р е (dx) = М9 [U (X , 0); X е= S -1 (5)] =*
S~^(B) *
Далее, имеем
0<М q [L' ( X ,0 ) -( lo g g e ( S ) ) T -
= I х (0) + I s (6) - 2М0£ ' (Ж, в) (log go (5 ))',.
где в силу (4)
МqL' (X, 0) (log gQ(S))f ^
*= M„ [(log go (S))'M0 ( £ ’ (X, 0)/S)[ = Me [(loggo (S))')s - /* (0).
Это доказывает неравенство (I).
Пусть теперь S — достаточная статистика для 0. Тогда
/ 9(Х) = г! (б', 0 Ш Х ). (5)
Возьмем в качестве Л, меру
X (В) — j* h (.х) p,n (dx).
>s ~4 b )
*
Тогда, как показано в лемме 15.1, распределение S будет абсо
лютно непрерывно относительно а и будет иметь плотность ge(s),
равную £еЫ = ij)(s, 0). Отсюда в силу (5) получаем
I х (6) = Мо [£ ' (X, 0)[2 = Mo [(log у ( 5 , 6))'р = (6).
Покажем теперь, что из равенств / х(0) = / 8(0) при всех О
следует, что S — достаточная статистика. Действительно, / х(0)
есть дисперсия L ' ( X , 0), так что
I х (в) = Мо [£ ' (X, 0) - Mo ( V (X, 0)AS)p+Mo[Mo ( V (X, 6)/5)[2. (6)
Но в силу (4) последнее слагаемое равно
Me [(log go (Ж))']2 = I s (0).
Так как / х (0) — / s(0), то в (6) и. в. [Р е1 при всех 0
U (X, 0) — М0 (Z/ (X, 0)/5) = 0.
То есть L' ( X, 0) измерима относительно a(S) и, стало быть,
существует измеримая функция ср(S, 0) такая, что
L '(X , 0) = ф(S, 0), L(X, 0) = Ф(5, 0) + M X ),
/ 0(Х) - ехр [Ф (S, 0) + М Х )1. <
Мы уже отмечали, что достаточные статистики являются тем
единственным типом статистик, которые сокращают выборочные
данные без потери информации о параметре 0. Теорема 1 при
дает этому утверждению точпый смысл примепптельпо к инфор
мации Фишера.
П р и м е р 1. Пусть X Вр. Здесь
/ РЫ »- />*(1 — р)1"*,
где х равно 0 «ли 1, f P(x) есть плотность относительно
8 17} СВОЙСТВА ИНФОРМАЦИИ ФИШЕРА 167
1 (Р ) = М ,л г ( * „ р )? = p ( j J + ( 1 - р )
—х (х — n p f
2 с&>*а - рГ Н - - ^ | ) 2 = 2 СпРх (1 - р Г *
«=о ' ' а=0 (р (1- p)Y
п
Dv
( p ( l - p ))2 W I- Р Г
Это равенство полностью согласуется с теоремой 1.
Мы предлагаем читателю найти в виде упражнении инфор
мации наблюдений для выборок из распределений, зависящих от
одномерного параметра и приведенных в § 2.
2. Многомерный случай. Пусть теперь 0 ^ /?'*, к > 1. В это
случае мы будем иметь дело с информационной матрицей Фи
шера наблюдения х 4
I (в) = II/ у (в) I, / у (6) ^ М о щ Ц х , , Щ щ 1 (х„ в),
ТО 7х(0) = 72/(0).
Теорема 1 также сохраняется полностью. Пусть g eis) — плот
ность некоторой статистики S = S ( X ) со значениями в /Г отно
сительно некоторой меры Я. Обозначим
I s (0) = || 4(
0) |, / 5 (0) = Мв^ - b g (S) ^ log go (S).
i j
Это есть информационная матрица наблюдения S.
Т е о р е м а 1А. Если плотности feix) и geis) удовлетворяют
условиям Ш) § 16, то
/ 5(0) ^ / х (0), - (7)
т. е. матрица / х (0) —7S(0) является неотрицательно-определенной.
Равенство в (7) имеет место тогда и только тогда, когда S — tfo-
статочная статистика.
Д о к а з а т е л ь с т в о этой теоремы вполне аналогично дока
зательству теоремы 1, и для сокращения текста мы его опускаем.
Это доказательство можно найти, например, в [30J, 131J.
П р и м е р 2. Б § 16 мы уже вычисляли информационную мат
рицу для нормального распределения.- Вычислим теперь инфор
мационную матрицу для двупараметрического семейства распре
делений
/ | ■= j ** dx = М(0.„х{ (X,))2, i = 0 ,1 , 2.
Имеем
I {х, 0) = log / 0 (х) = — log о + I
01 ( х , 6) 1
0а о
0 1 ( х , 0) 1 {х — а ) г [ х — а \
Оо
Отсюда находим
1 .. Г — а v ( х. — а \Т2 1
^ ( e ) - 5 r M . [ i + - i ^ i ( - V ) J - 7 [Л -1 1 ,
д*,(Р)
Если обозначить V = , то мы получим, что
*Р;
вектор производных в (8) Ц (xlt v ф)) представим в виде
Iq ( х х, v (P))Pt так что
А Р )= м „(гЩ ,, р(р» v)T(t'i(*,, i-'(P)) v)-- vTi (ищ
В частпости, если 0 = рС, С — IIс,-,-И, i, j — 1, , . 1с, то
V = CT и
Л р ) = с / ( 0 ) С Т. (0 )
P aU ) = P U - c c ) .
/е И = / (* — е), (/е И = j - /
±/(ln»-a)=-i-[f/(lni)].
Z (s 0) S ( x ~ и) f ( x — и) j (х )
II ^ f {х — {,-) uv
в
После замены х - и - ^ х во внутреннем интеграле получим
(S0(x) при этом перейдет в себя)
С f1 _Z (,y0).s (*)/(*)/(*+■■> dx du = Г г (So)S {х) 1 (х) dx =
е asn
in \ f { x + u — v) do J
е
Это доказывает (8). Изменение порядка интегрирования, ко
торое мы дважды производили, законно в силу абсолютной ин
тегрируемости S н ограниченности Z. <3
Д о к а з а т е л ь с т в о т е о р е м ы 1. Заметим прежде всего,,
что для эквпвариантпой оценки Ма | а* — а |2 пе зависит от «_
Действительно,
Ма |а * (X) - а |2 = Ма | а* ( X - а) |* = М01а* (X) |2.
Таким образом, для отыскания равномерно оптимальной экви-
вариантпон оценки надо найти а*, минимизирующую М0| а * |2.
Пусть а* — любая эквиварнаитная оценка а. В силу свойств,
у. м. о.
м„ | а* р = М0|а* - М0 ( a * IS t) ? + М01М0 (а*/S„) |г >
> М 0 | а * - М 0 (а»/5„)р. (9>
Остается заметить, что в силу леммы 1 оценка ос* —сс*— М0 (a*IS(i}
равна (5) п от выбора а * пе зависит. Равенство в (9), очевидно,
возможно тогда и только тогда, когда М0 (a */80) = 0 п. в. <]
И з доказательства теоремы видно, что особую роль в построе
нии оптимальной эквпвариантпой оцепки играет статистика S 0=
= (х2 —хь . . . , х« — х,), инвариантная относительно преобразова
ния сдвига. Инвариантность статистики есть качество в извест
ном смысле противоположное достаточности, а конструкция оцеп
ки 0* *= 0* — М0 (0*/»So) на основе произвольной оценки 0* пред
§ 18 ] ОЦЕНКИ ПАРАМЕТРА СДВИГА II МАСШТАБА 175
- — Ч н « р { - Т 2 ( ч ■- -*)2) •
У и (2л) 2
Оказывается, что в области |а! < Л 7—У/V это так и есть, при
чем сходимость будет равномерной по а в указанном интервале
значений а. (Доказательство связано с оценкой Ma (а * — N))1,
ноент в основном технический характер, и мы его опускаем.)
Но в таком случае мы можем воспользоваться критерием ми
нимаксности оценок в теореме 11.3: если оценка а * такова, что
при всех а
Ма (a* — а)2 <1 lim sup J М/ (аых) — t\ 2 Q (A}(dt) (10)
N-*OO ' '
для некоторой последовательности априорных распределений Q(V)
(не обязательно равномерных) и соответствующих им байесовских
оценок то а *-— минимаксная оценка.
В нашем случае пг — Ма (сс*— а ) 2 от а не зависит. Поэтому
в силу отмеченных выше свойств сходимости
lim sup f М* (сс*(х) — f)2 Q(A) (dt) ^
iV—
>oo
/ “ (») = / И л
(И)
12 л . А. Боросиов
178 ТЕОРИЯ ОЦЕНИВАНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ [ГЛ. 2
Ре (gX е ^ ) = Р ^0 ^ А).
0 ^ 7 ? неравенство для
inf f Мt (0* — t f q (t)d t (1)
о* J
■ ^ It w d t -■ <2>
2. Основные неравенства. Прежде чем сформулировать соот
ветствующие теоремы, заметим, что иптеграл в (!) можно рас
сматривать как безусловное математическое ожидание М (0* — 0)2
в байесовском случае, когда 0 имеет анриорпое распределение с
плотностью qit) относительно меры Лебега. В этом случае I —
- М /_ 1(0).
Обозначим через f ix , t) — f,ix )q it) плотность совместного рас-
пределеппя X и 0. fi{x), как и прежде, будет означать произволь
ную ftix) по t.
Пусть, далее, N h сг © есть носитель функции h, определенной
на в : Nh = [t: hit) Ф 0), и N есть носитель fix, t) в ё6п X 0 .
. Т е о р е м а 1. Предположим, что /Да?) дифференцируема по
t, а функция Уlit) интегрируема па любом конечном интервале.
Тогда для любой финитной (т. е. равной 0 вне конечного интер
вала) дифференцируемой функции hit) такой, что Nh с= N q, спра
ведливо неравенство
Jyj /0* 0\2 ;___________ [М (h (f))/<7 (О))]-____________
ПЙЛ (#- (в ) [ Л C0)/ff ( 0 ) ] а) IV! 1Л." -(6 )/^ (0 )]*- " .
fJ h it) d t\
Г , ,
n 1I I { t ) h * { t ) ! q ( t ) d l - -| j ‘ { h ' ( t f ) / q ( t ) d t
^ ~ggnI вJ (0 И
s' h dtVn (dx) =—еJ (0 ё =—J (0=°-
%' dt
+
» [ ^ Ч + "(т У — 'К т М + “ (т У -
Здесь мы воспользовались тем, что в силу ( 6 )
+ (7)
где II
■ л ш 40*
З а м е ч а н и е 1. Неравепства в теоремах 1, 2 являются интег
ральными в том смысле, что они относятся к интегралам от
(0* — I)2. В этом смысле неравепства § 16 можно называть
локальными.
Д о к а з а т е л ь с т в о . Это утверждение немедленно вытекает
из теоремы 1, так- как правая часть в (3) при h = q !l преобразу
ется к виду P fin J + Я). <
Мы видим, таким образом, что нижняя граница возможных
значеппи М (В* — Э)2 при больших п лишь нсмпогим отличается
©т границы ~,7p(t) > равной зпачеиию М( 0 * — Э)2 для Я-эф-
фективпой оценки G*. Это указывает па целесообразность исподь-
аовапия эффективных оцепок, поскольку для них при любой функ
ции q почти достигается экстремальное значение М (0* — В)2.
Оценка (7) неулучитаема, на что указывает
П р и м е р 1. Пусть Х(=§Фа л . Как мы знаем, в этом случае
Iia ) — 1. Пусть, далее, параметр а выбирается случайно с гладкой
плотностью qit), t е ( — <x>t о о ) . Тогда правая часть (7) превраща
ется в in + Я )-1, где
а « = * + ^ ) - + 0Ш ’ M(“ S -« ) 2= v - f + 0( 7 }
1 I- '
Одпако мы поступим проще, предположив, что q(t) — ■ ,— е~~ 1.
у 2л
Тогда, очевидно, Н = 1, и правая часть в (7) превращается в
1/(/г + 1). По в примере 11.1 было устаповлепо, что
М(a j — а )1
где
_ / п nt nt \2
I — 5 2 C O S т;—
' л т О2 п
I \9ог 2к s i n - ^2— с) £ ^
о 3Tf
c o s-^
1
1
я 2 sin 2 -^g-. <3
e“ J z £
—1
Можно отметить, что на функции gU) = cos2(я£/2) достигается
1
минимум функционала j* (qr {t))2/q (t)dt в классе всех диффе-
реицируемых плотностей q(t).
Из теоремы 3 вытекает, в частности, что интервал значений 0,
при которых оценка 0 * является сверхэффективной, не может
иметь длину большую, чем 0(1/1/п).
3. Неравенства в случае, когда функция #(6)/JT(0) не диффе
ренцируема. Если функция h0 — q/I не удовлетворяет условиям
теоремы 1, то справедливо следующее полезное утверждение, по
зволяющее оценивать асимптотику М (0* — 0)2 в общем случае.
Т е о р е м а 4. Пусть последовательность функций ht (t), зави
сящих от параметра 8 > 0, такова, что каждая функция /?е удов
летворяет условиям теоремы 1 и
1) М * Х М < ) .
если
Qe (0 =
0, если qe (t) <i e,
190 ТЕОРИЯ ОЦЕНИВАНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ [ГЛ. 2
he W = &Г J dV ^ k °
t—e
Очевидно, что функция /г8 финитна и дифференцируема при лю
бом е > 0.
Из того, что q(t) интегрируема по Римапу, следует, что
<?еШ t q(t) почти всюду при е 0. Чтобы доказать это, убедимся,
что
ь
j [9 (*) — Че (*)) dt I °* (9)
а ,
лг к1)
Кроме того,
11/ U\ I 1I + ~ е) с </(0
1 ®0 1 2е | / Л Н - б ) / в( *-е)
Н ( е ) < Д - ^ г ) * ?_1(() Л =
Мы можем воспользоваться теперь теоремой 3. Полагая е
е (я) = гг_1/5, гс -*■ °°, получим е(п) -*■ 0,
§ 201 ИНТЕГРАЛЬНОЕ НЕРАВЕНСТВО ТИПА РАО — КРАМЕРА 191
получаем
р ,(Р , G) = — j In ^ - p n ( d x ) — l) Pl' (d') = - | M p >G),
= 1 ~ Т Р з ( Ро г р в Д О)
1- 4 рз К
р °J = - т р* ( р %. р »г)) ■
Д о к а з а т е л ь с т в о почти очевидно, если предположить для
простоты, что Лгре а (в общем случае выкладки по суще
ству сохранятся, но станут чуть более громоздкими). Действи
тельно, в этом случае мы можем воспользоваться равенствами
(2). Тогда первое из соотношений (4) немедленно следует из
того, что
111 ЫЛХ
(X)) 2df /в' (х°
P Лц(Хг)‘ ■
Далее, в силу (2)
1 ч- Р2 (Рбх» р б2) = М01 (/в 2 (Xj)//Oj (xi)) >
i - Рз(рв1. рс2)/г = м , , , Ц / й Щ ч м ,
.. л /Л м Т Г.,
fl1\ ч т )
f fh ^ T
%Д [ч (xi)j ' L 11Ч Л) J j ’
( W X V
Следствие 1.
Рз К , Ро,) < пр3 ( р 01, Ре2).
Действительно, 1 — Ц" < (1 — р)гс при любом ^ Зз 0. Полагая
Р = 1 — y Рз(р0,. Р«->)’ мы П0ЛУЧИМ 113
Рз К - Р%) = 2 ( 1 - Р") < 2 (1 - Р) = «р 3 (Ре,, Р е,). <
2. Связь расстояний Хеллннгера и других с информацией
Фишера. Среди трех введенных в предыдущем разделе расстоя
ний наибольший интерес для нас в дальнейшем будет представ
лять расстояние Хеллннгера. В то же время характер главных
утверждений, приводимых ниже (теоремы 2, 3), и характер дока
зательств будет один н тот же для всех трех расстояний. Поэто
му для краткости изложения мы ограничимся в этом разделе
изучением расстояния Хеллннгера, которое будем обозначать те
перь (опуская индекс у символа р3)
Р (Ре,, р е2) = j [ Y K - У Щ I1<*>•
Положим г(0!, 02) = р(Р е1, Рев).
Л е м м а 1. Если при п. в. [р] значениях х непрерывна
по 0. 0! =т=02, то
(5)
в '- ^ | G' — 0" |“ 1Gj Gg |
0^ e 2
Если функция Vfo(x) при п. в. [р] значениях х дифференци
руема по 0 , то
l i mi nf r ( e ' . e - ) (с
0/^6 | 0' — 0" I ^ '
О"-»!)
Кроме того,
1
Iе | е , р < 4 J 7 ~ е*> У)d,J -(?>
2 v{ >< 2 „J 1/ V »
Г п
г (е ь 02) = X I* \ (ф (*> °1 + о;>) аУ ц (*И <
8В Lo
2 »1
< X I J ( ф( *, 0 i + <°)2 Ф ^ (rfj0
гУ
| 01 - Н
02|з ^ т J Лл (01 + ауь^ dy ^ h '
202 ТЕОРИЯ ОЦЕНИВАНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ ' [ГЛ. 2
^ (Р е. G) = J In /е (a-) G (dx).
d ( p ,* ,p i) = -
о Г
Ра р
(Ре, Рп) /0(в|)
= 1 / п . Таким образом,
/г ■— 1 7 . S S ( п — 1) га - f - 1
Мо(хг/5) Г г —u,S-— ау -\-----
п 2п + т 2п
в ; = * ( 1 + 4 ).
Имеем
о
D„0s = Mo(ej)2 - е2= j»-2(i + 4 ) 2 * - 02 =
\п (/г 2) ) п (п 2)• (1 )
204 ТЕОРИЯ ОЦЕНИВАНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ ГГЛ. 2
(2)
Таким образом, при больших п средпеквадратическое укло
нение Мо(0 5 — В)2 будет иметь порядок малости 1/ п \ С точки
зрения нижней границы неравенства Рао — Крамера, имеющей
порядок 1/ /г, это ненормально высокая точность*). Можно пока
зать, что это есть Дочпость, с Которой по выборке определяются
любые точки скачков / 6(х) (запрещаемые условием (/?)). Мы ви
дели в примере 1Л об оценке медианы, что точки, где плотность
/е (.т ) бесконечна, можпо определить с еще большей точностью,
так что, грубо говоря, чем больше нарушение-регулярности в точ
ке, тем точнее эта точка оценивается по выборке. Скажем, если
есть распределение, сосредото-
чепное в точке 0, то P 0(S ^ 0) = 2~" (5 = тахх,*), так что диспер
сия 0* — 0 при 0* = S будет убывать с ростом п экспоненциаль
ным образом.
Можно ли в этих условиях указать нпжнюю границу для дис
персии оценок? Ниже мы получим неравенство, аналогичное не
равенству Рао — Крамера, с помощью которого такие границы
можно строить при более слабых условиях регулярности, чем
условие (/?).
Мы будем предполагать лишь, что выполнено условие (Л,,),
хотя и оно не очень существенно (см. замечание в конце пара
графа).
Обозначим через. Дф(0) приращение функции ср(0) на интер
вале (0, 0 + Д), через N vpxi— носитель в 93п распределения вы
борки: N p Q= {#: /в (ж) ф 0 ), и положим N n — Np^ (J N pe+&.
• Т е о р е м а 1 (неравенство Ченмепа — Роббинса). Пусть 0 &
е ©, 0 + Д ^ 0 , «(0) = М 00*. Тогда при любом Д Ф 0
( А а (О ))2 _ (А д (0 ))2
г 2 (Д) - Р2
ГГА/в(.Т)12Р {.dx).
(Pe-j-д, Ре) - ) — (4)
А/о (хх)
аналогично г.2 (Д) = М(,
Ы х0
Если же распределение Р е+д не абсолютно непрерывно относи
тельно Р е, то существует подмножество из ЛТе+д положительной
Ро+д-меры, на котором / е(.т) = 0, так что интеграл в (4) обраща
ется в бесконечность, а само неравенство (3) становится тривиаль
ным. Следует вновь отметить, что выражение Me [Л/е (^Q//o(-^)lJ,
понимаемое как интеграл по может при этом оставаться
конечным.
Д о к а з а т е л ь с т в о теоремы 1. Из сказанного выше следу
ет, что не ограничивая общности мы можем считать, что Р е+д аб
солютно непрерывно относительно Р 0, так что NpQ+&cz N pQ—
= ЛТ". Так как / е(«0 и / е + д ( # ) есть плотности в St?n, то
J Дfe(x)yin {dx) = 0.
Кроме того,
j* 0*Л/о (х) p.n (dx) = Аа (0).
Отсюда следует, что
j (в* — а (0)) Д/е И pn (dx) = Аа (0). (5)
Г\п
Па множестве N n мы можем подынтегральную функцию в (5)
представить в виде произведения
(0* _ 6))
а( У 7 ё Щ -у = = .
(«'■ (6) ?
п
*где, как и раньше, L ( X , 0) = 2 Н хь 0). Число 0 в (1), как пра-
i=i
вило, будет считаться фиксированным и представлять собой ис
тинное значение параметра, т. е. такое, что X е Ро. В этом
случае 7Ли) есть функция двух переменных и и X и, стало быть,
вместе с фукцией правдоподобия ]в+и(Х) будет случайной функ
цией переменного и. Функцию Z (u ) мы будем называть отноше
нием правдоподобия, она играет важную роль в математической
статистике. Основная задача этого и следующего параграфов —
изучить свойства 7Ли).
Будет установлено, что 7(и) близко к нулю вне окрестности
точки и = 0. В окрестности этой точки 7{и). сближается в из
вестном смысле с дельта-функцией, точнее, 7{v/~\in) сближается
асимптотически при п °° с функцией плотности нормального
закона.
В §§ 23—26 мы будем рассматривать лишь одномерный слу
чай. Случай многомерного параметра будет рассмотрен отдельно
в § 28.
Важную роль в последующих оценках будет играть расстоя
ние Хеллипгера
так что
Mr =J V / o + u (/о
M0Zl/2(u) = ( l - r ( u ) / 2 ) n. (3)
Относительно параметрического семейства {Р0} мы будем
предполагать в этом и последующих параграфах, что наряду
с Ы.,,) выполнены условия (И0Э (/н, (х) Ф /о г(х) при 0 , Ф 02) и
iA c) (0 есть компакт). Несущественность с точки зрения прило
жений последнего условия мы уже отмечали. Это связано с тем,
что в реальных задачах из априорных соображений обычно бы
вает возможпо указать границы возможных значений 0. Для
простоты там, где это потребуется, мы будем предполагать так
же, что 0 выпукло (в одномерном случае это означает, что 0 —
== [а, 6], —оо < а < Ъ < оо).
Кроме того, в этом параграфе мы будем предполагать, что
функция У/ 0 дифференцируема для п. в. [р] значений х, а ин
формация Фишера
Mo I 'p(м) К 4 nlВ
V( -I
Из рассмотрений § 21 следует, что для значений и — o il)
вместо g в этих неравенствах можно брать значения, сколь угод
но близкие к 7(0).
Д о к а з а т е л ь с т в о . Имеем в силу (3), (4)
M0Z 1/2 (к) = (1 — г {и))2)п <; ехр {— пт {и)/ 2 } ехр {— ngiP! 2 }.
Далее, в силу неравенства Коши — Бупяковского
Мор (и) < [MeZ1/2 (u).M oZ(it)]1'* = [M 0Z 1/2 (u )]1'2 <
14 л А. Воровиов
210 ТЕОРИЯ ОЦЕНИВАНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ [ГЛ. 2
находим
Me I Р' (U)| = •§- Мо IL ' ( X ,0 + и) 12,/г (и
< [М 0 [L‘( X, 0 +
Т е о р е м а 2. /7/ж ecez z, н 3* 1
Р 0 ( sup Z ( v i y n ) > ez\ ^ ce~*z i e~u2gU,
Vh>l > u )
На основании леммы 1
Р 11xb2
< + £. j +
( Г - е ) / п / « „ — >о. (Ю)
п.н.
Эти соотношения являются, очевидно, усилениями соответ
ственно состоятельности ^ 0 * — 0 —> 0j п сильной состоятельности
(® *~ ° - м-п-
Д о к а з а т е л ь с т в о . Соотношение (8 ) следует непосредствен
но из ( 6 ), если в последнем положить v = 6un. Соотношение (10)
такж е вытекает из ( 6 ), так как сумма правых частей в (6 ) нрн
выполнении (9) будет образовывать сходящийся ряд. О
Например, даже такая медленно растущая последователь
ность, как ип = In п, удовлетворяет условию (9), так что*)
(0* — 0) У п / l n n — -»-0.
С л е д с т в и е 2. Существует значение ct < °°, не зависящее
■от тг, 0, такое, что при любом а ^ g/Ъ
Me exp {а (гг*)2} <1 с1} где и* = п ( 0* — 0). (И)
Д о к а з а т е л ь с т в о . Интегрируя по частям, получаем
оо оо
Меа'2 = — J eav~dP ( 1ё | > v) = 1 4 - 2а j reav'2P ( 1 > г) Jr.
о о
Поэтому, в силу теоремы 3
оо
Meea<“*)2 < 1 + - х J ve-svVwd v е с , < о о . <
О
при N -*■
13 дальнейшем нам понадобятся следующие два свойства, вы
текающие нз {RR):
1) Законность двойного дифференцирования по параметру по
знаком интеграла в равенстве
J /о(я)р(«&г) = 1,
означающая справедливость соотношений
j /о (я) Р {dx) = 0, j /о {х) р {dx) = 0. (1)
^ V (j) (x i) =J hi) W h W P
сходится равномерно n a 0 E 0 j , / = 1, . .. , s.
**) Такое понимание равномерной сходимости находится в согласпп с
равномерной сходимостью, использовавшейся в теореме 1.5.4 — там-оно от
носилось к функции 1(х) == х. В то же время это не есть равномерная схо
димость J ф (х , 0) u (dx) при ф(’ж, 0) = l(x) fe(x), когда предполагается, что
при .V ->- оо
214 ТЕОРИ Я ОЦЕНИВАНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ [ГЛ. 2
при А ->■ 0, где сод (.г) — модуль непрерывности функции I" (х, 0 ):
®д {х) — sup I Г (х , 0 -{- гг) — Г {х, 0) 1. (4)
Оее.о+иее
|и|«Д
Д о к а з а т е л ь с т в о . В силу теоремы о мажорируемой схо
димости соотношение (3) будет следствием обычной непрерывно
сти, так как в этом случае сод (#)->• О для п. в. [р] значений х
при А 0 и, кроме того, }сод (ж) [ ^ 21 {х). <]
Обозначим
T n(A , 6) = sup
|г|<д! nv
Л е м м а 2. Пусть выполнены условия {RR), б(!> 0 , п —
= 1, 2 , . . . , есть любая последовательность, сходящаяся к нулю.
Тогда для любого 0 ^ 0 « для X Ре
Уп (6п, 0) °» V» ( б п , Г ) °*
Но
Tn (6n) < sup ~ 1L" (X, 0 + v) — L" (X, 0) К
I V|< 6П п
П
< 1Г 2 °>6п (Х г) = (*),
г=1
sup
v ( х , е* +- v) и (х , е*) v ( х , е)
^ собте+|е*-е| (Х)> &
|с| <бп
и* = 7 W е” (Х >0^ ’ <8)
2 Y (гг*) = 2 In Z (0* — 0)
/ ( 6) (1 + £п (X, 0))
н, (9)
Наряду с (7) справедливо представление
Д о к а з а т е л ь с т в о т е о р е м ы 1. Из леммы 2 при Ы ^
^ 6„ получаем
L '(X , Q+ v ) = L ' ( X , в ) - п и ! ( в ) ( 1 + е»(Х, 6 , i>)),
1е,ДХ, 0, н)| < e„(X, 0 ).
Интегрируя ото равенство no v в пределах от 0 до и/Тп,
находим
^Q+ u /V n 2 !- p i ( P e + A ’ p o) 2
= lira п М р I n Т~Гх~\ =f u llm - - - - - - = — u I (6 ) / 2
П-* oo ■'0 V 1 / Д-*0 Д
(см. теорему 21.2 и замечание 21.1). Далее
о2 ( ц ) = Jim пМд |7 (xj» 0 + n/~l/ и ) — г (х 1, 0 ) ] 2 =
■ , J Пт J ~ ! if - g J / , И „ № ) =
= j (!'(*,в))'2/„(I)ц(dx)=и21(0).
Если бы мы_при вычислении а (и) и а2(и) воспользовались разложени
ем 1(х, 0 + и/рга) в ряд с двумя производными, то получили бы тот же ре
зультат. Однако мы убедились, что это делать не обязательно.
то при у ^ г г
Z ~ XJ ( у ) - - + 0. ( 18)
Тг . н . —
— J (?(6)+ И) ш(w*—х
Н <2rn
= М „ (( 6 * - о) V п |„ ) = М о т ^ - (1 + е„(Х , 0)),
Еп (X, 0) ■ > 0.
Д о к а з а т е л ь с т в о . Асимптотическая Л-байесовость о. м. п.
следует из соотношений
Jim М [ ]Лг ( 6* — ®)] = lim ММе [ y S i( 0* — 0)]2 ==
п - + оо - п —* оо
= М 7И т М ё [ / п ( в * - е ) ] 2 = М / _ 1(0) = / -
1 - * ОО
п.н.
Доказательство следует из теоремы 2 предыдущего па-
- , * л \ (t - 6*) q (t) f t (X) dt
раграфа. Д ействтельно, ©о— 0* = : ?---------------------- . Делая
J ,(<)/, m d t -
замену переменных i = 0 f и/ i n и деля числитель и знаменатель
в этом выражении на /е(Х), получим
Г (в — и*) q (б и /~ \/п ) Z (и !~ \/ /г) ви
0j _ 0 * = А ------- .
У /г J q (0 -(- в / У и) Z ( и / У п) du
§ 26] ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ О. М. Н. 225
45 а . А. Боровков
226 ТЕОРИЯ ОЦЕНИВАНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ [ГЛ 2
V (X, t) = (f — 0*) L" (X, 0*) -I- -{-.:Г-е *)Г L m (X, 0') =
^ 3
= (t — 0*) L" (X , t) + - j (f — 0* f L m (X, 0"),
= т ( 8 п - в * ) 2(п е )+ е „ ), y j ( ( 7 ( e n) - > ) - p j - о,
I
если ] 0,г 0 | = о ( п ~ 1/4) . <\
fv (Х ) = П (p f i
г= 1
(x i) + (1 — р) /г (Х г)),
так что
T.,v V МЧ)~МЧ) m
Й р/» (ч ) + ( t - .Р ) /,(* ,) • (>
. р* —
fc T -V *
Нетрудно видеть, что Мр* ~ р и что
ь '= - 2 ( М х* ) - М * 0)2
(Pf 1 (х{) + ( 1 - д ) /2 (X,))5
д а - Г (м * > -м * » г dx
' J p/t (*) + (1 — р) / 2 (*)
и будет меньше, чем коэффициент рассеивания р*.
П р и м е р 2. Мы предлагаем читателю аналогичным образом
найти приближение для о. м. п. параметра а распределения Коши
, К д , 1 С ПЛОТНОСТЬЮ
2 1 + (xi — «)
х- — a
-— j
■Vi 1 — (х- — a'i2
- Ь '(Х ,а ) = 2 2 т гГ Г - J -i»
+ (x i—a ) j
§ 261 ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ О. М. П. 229
(*))s
—.. /?г ------ -
(l + *2)3 2’
2ка 1 (а)
7 - w2 ( a ) = / 2 , / 2.
1 0 00 г2
2 А АА, АО рг + рг
2
3 В ВВ, ВО д2 + 2дг
4 АВ АВ 2РЧ .
1 2 . 3 4
р* = V p i + Р 2 — У р *з 2* = V p * + p* — V p *'
Таблица 3
0 А в АВ Всего
при 0 = 0 * получаем
t>Pi (В) У 1 4/
2( dp j Pi (в) >= 4 + Р (Р + 2г)
+ -gA+ L2r- + i р£ = 9,970,
у / dPj (0) V 4r
«AJ V dq ) 4 + -р 4-I- ^2 г + q ,{g +, 2r)
, . + —
g
= 13,761,
Pi (У)
0 А в АВ
С / Л (т)
J ln */е (*) Р (dx) < — в ( 1)
1V t ?t(Xi) ■i i Uh (xi)
< m a x - 2 f « P 1п1 7 Я л - Г т ?хМе1п1 Л 7 Т < - Е-
З а м е ч а н и е 1. Как мы уже отмечали, одпого условия С40)
для состоятельности 0* недостаточно. Чтобы убедиться в этом,
рассмотрим следующий пример. Пусть О = [0, П, P fl = U 0> 1+0
при 0 ^ 0 = ^ 1/2 и при 0 = 1 . При 1 > 0 > 1/2 распределение Р 0
имеет плотность / е(#) = 1/0 при 1 — 0 < х < 1. Пусть теперь
X^==P0 = U0>1, Тогда условие С40) выполнено, так как р(0, I) —
= —оо при f ^ O . В то же время нетрудно видеть, что /ДХ) > I
при £ «в (1 — X(i), 1) и что 0* = 1 — Х (1) —>■1.
П.И*
Условия ( Д ,) можно эквивалентным образом представить в
О
несколько иной форме. Обозначим /* (а:) = lim s u p /u (a:).
■u-»f
^ Т е о р е м а 2. Условие (^ о ) эквивалентно одновременному
выполнению следующих двух условий
(Ло). Д л я всех f =И=0
1
(У). При всех £ и некотором А > 0
234 ТЕОРИЯ ОЦЕНИВАНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ [ГЛ. 2
j 1 1 1 И V^ < 00 ’ (2>
где / е (х) = sup f t {х).
ь=е
Д о к а з а т е л ь с т в о т е о р е м ы 2. Тот факт, что из ( ^ о )
следует К ) И (/), очевиден. Пусть теперь выполнены (^о )
и (/). Если допустить, что (^о ) пе имеет места, то найдутся после
довательности tk ->■ t <= О, 0 , eft 0 такие, что
Г ftk
J In -j -{х) • /е (Л ц (dx) > — ek.
Г ft h (*) Г /? (х)
П т siip J In • / 0 (x) ц (dx) < J In - j- щ / 0 (x) p (dx) < 0 ,
< f sup I V ft+u {x) — V f t и | sup I Vf t +u (x) + 1/'ft {x) I и (dx) <
J lu |« A lu |< A
д
*= 1 + j [j* | ft+u (z) 1ц (<fe)] du < 1 + 2Дс.
и расстояния Хеллингера
■= и/1 и I, получим
H/Vn
L (X , 0 + и / V n ) — L (.X , 6) - J (L' (X, 0 + Ди), и)
О
■2
= м ( V (X, в), и) - о,/ (6) а т (1 + е„ (X, в, и)) =
Vп .
= (£», и) — Y u l (в) (1 + еи (X, 0, н))» I En (X, 0, м)| < en (X, 0).
Здесь по многомерной центральной предельной теореме (см. при
ложение V)
71
J = eYiu,,g
(0) (M
wТ|(
при п °о.
Аналог теорем 25.2, 25.3 имеет здесь ту же самую форму:
16*
244 ТЕОРИЯ ОЦЕНИВАНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ [ГЛ. 2
где
0 = (р,, . . . , р„, а2).
О. м. п. для pi здеСъ равны
1
14 = "ГГ (Х4 + Уг).
п ' 'ч р н
равномерно по 0.
2. Равномерные варианты теорем об асимптотических свой
ствах отношения правдоподобия и оценок максимального правдо
подобия. Заметим предварительно, что при выполнении условий
(HR) результаты § 23 являются равпомерными по 0 по самой
своей форме, так как правые части неравенств в теоремах 23.1 —
23.3 (и в теоремах 28.1—28.3) от 0 не зависят.
Перейдем к результатам §§ 24, 28 об асимптотическом пове
дении Z iu /Уп).
Утверждения лемм 24.1, 28.1, 24.2, 28.2 можно сделать равно
мерными по 0 .
JI е м м а 1. При Д 0
sup Меюд (хД -н- 0 , (3)
е
п п
Полагая для краткости содп (хх) = со э получим
Мепсо" = Ме?г (ы"; / 0П(хх) < 2/ е (хД) + М6п (о)"; / 0п (хг) >
> 2/е (хх), I (хг) < N ) + Меп (со"; /е„ (хх) > 2/ 0 (хД, I (хх) > ЛГ).
Здесь первое слагаемое не превосходит 2Ме<о" и сходится к пу
лю в силу леммы 28.1. Второе — не превосходит 2NJn, где
равномерно по 0. <1
Т е о р е м а 3 (аналог теоремы 28.4). При выполнении условий
{RR) утверждения теоремы 28.4 сохранятся при следующих из
менениях: еп (Х, Э )-* 0 равномерно по 0 , Еп(Е=>Ф0,це), Z Y {и*)(=ЛИк
■Pq ч.
равномерно по 0.
Д о к а з а т е л ь с т в о т е о р е м ы полностью основано на
лемме 2, так же как доказательство теоремы 28.4 — на лемме
28.2. Поэтому требуемое доказательство получается путем вне
сения очевидных изменений в доказательство теоремы 28.4, свя
занных с заменой (вытекающей из леммы 28.2) сходимости
£п (X, 0) 0 на равномерную сходимость en (X, 0) 0. Кроме
того, надо добавить, что
тг
fen “ I (^ii 0) Феде,
i=l
равномерно по 0 в силу теоремы 2 и равномерной сходимости
(28.6) интеграла / ( 0 ) (это есть матрица вторых моментов для
Г (х 1, 0)), которая вытекает из условий (RR) (см. Приложение V I).
Отсюда и из замечаний, касающихся (2), получаем равномерную
сходимость
2 У ( ц * ) ^ Н а. <
U* = У П ( 0* — 0) Ф 0,j-l(0) (°)
S lip Р в+„/ Л (А ,) — 0 .
1и|«дг
равномерно по и
Y (и) = Цп, и) — - i и I (0) и {1 + Еп (X , 0 + и / / п ) ) ^ Ф _ ^ а2 а2,
2 *
О)
где о 2 = n/(0 )n T < 7V2Ah(0) при ] u \ ^ N , Л *(0)— максимальное
собственное число матрицы / ( 0 ). Так как Ф i „ 0((с, оо)) ^
< Ф 0 а2 ((с, °°)) то в силу равномерности в (9)
lim sup Р ^ (У < „ ) > « ) <
П -» о о w |< J V
« ± = - - - -- ( l ± Р/ V n ) , (6)
1- р/ < 1+ р/
где лгах^=Г1>п. Так как а есть параметр масштаба, то 2пах(==
€§ Г 1/2((„ = Н 2п. Таким образом, точный уровень интервала ( 6 )
17 а . А. Боровков
258 ТЕОРИЯ ОЦЕНИВАНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ [ГЛ. 2
равен
2 (n —l ) ( l + f l / v T )
*) Замечапие о том, что Г ,/2. п = Н2п полезно, так как оно позволяет
для вычисления Га, \ (если 2Х — целое) использовать таблицы распределе
ния х2, приведенные в приложении, а такж е во многих других руковод
ствах по математической статистике.
€ 31] ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕ 259
р± « р* ± рУр*(1 —р*)/п.
G (0, х) == — 2 In (/,e-(ari))
t=i
удовлетворяет условиям теоремы 2.
Если числа у ± таковы, что
у+
tW 1 *n~fe~Xdx = 1 — 8, (10)
у~
то Q± = G~i(y±1 X ) образуют границы доверительного интервала
уровня 1 — в.
Д о к а з а т е л ь с т в о . Проверим выполнение условий теоре
мы 2. Поскольку по условию 1) /'е(х,) распределена равномерно
на [0, 1], то — In F q(х,) е Г, л и G (6 , Х)£== Г1п. Другими
словами, P e(G( 6 , X) ^ В) = Г, п(В), и II = Г, „ не зависит от 0.
Монотонность и непрерывность G( 0, х) при каждом х следуют из
условия 2). Кроме того, в силу (10)
H((JT. 1/+)) = Г, Л(у~, у +)) = 1 - 8. <
Можпо указать и некоторые другие конструкции доверитель
ных интервалов. При эголг, так же как в теории точечного оце
нивания, сразу же возникает вопрос о том, какой доверительный
интервал, если их получено несколько, считать лучшим. Подхо
дов, которые здесь существуют, мы коснемся в § 3.8. Однако из
предыдущего нзложепия ясно, что по существу задача поиска
оптилгалыюго доверительного интервала во многом очень близка
задаче оптимального точечного оценивания. Ясно также, что
если мы строим доверительные интервалы с помощью точечных
оценок, то предпочтение следует отдавать доверительным интер
валам, построенным с помощью лучших оценок.
Близость задач оптимизации точечного и интервального оце
нивания можпо проиллюстрировать на примере следующего
утверждения.
Т е о р е м а 4. Рассмотрим асимптотический доверительный
интервал (0“, 0+) уровня 1 —в и предположим, что случайная
величина 0* = ( 0+ + 0- )/2 есть асимптотически центральная
264 ТЕОРИЯ ОЦЕНИВАНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ [ГЛ. 2
<с$/УТЩ ). (11)
Последнее неравенство следует из того, что о. м. п. 0* является
а. э. в классе К° асимптотически центральных оценок (см. теоре
му 25.4). Так как правая часть в (11) строго меньше 1 — 8, то мы
получили противоречие, доказывающее теорему. <1
6. Многомерный случай. Понятие доверительного интервала
обобщается в случае многомерного параметра 0 е R h в понятие
доверительной области, или доверительного множества.
О п р е д е л е н и е 4. Случайное*) подмножество ©* = ©*(е, X)
параметрического пространства 0 называется доверительным
множеством уровня 1 — е, если
Ре(©*^0)>1-е. (12)
Другими словами, доверительное множество уровня 1 — е на
крывает неизвестное истинное значение 0 с вероятностью, не
меньшей 1 — е.
О и р е д е л е н н е 5. Если X = [ХоДп Ро, и случайное
множество ©* удовлетворяет соотношению
lim inf Р е (0* э 6) ^ 1 — 8,
П -?о о
Т(Х)= ...-Уг
1=1
не зависит от случайных величин у,, ..., у г иимеет распределе
ние %2сп — г степенями свободы: Т (X )£§H n_r.
Д о к а з а т е л ь с т в о почти очевидно, так как после примене
ния ортогонального преобразования С получим
t — ( х ~ ~ ° 0 У 1 1 _____________________ \ ________________________
° 1 /" 1 (л —1) s$ ^
V п - 1* 0*
а ±(е, X) = х ± ар/Угс.
Читателю в виде упражнения предлагается воспользоваться
несколько более формальной процедурой, изложенной в теоре
ме 31.2, с использованием функции G(a, Х ) ~ ( х — а ) ] /и /а £ = Ф 0. 1-
б) Пусть теперь известно а. Требуется построить доверитель
ный интервал уровня 1 — е для о2.
Положим
П
Мы получили противоречие. Л
ПРОВЕРИЛ КОНЕЧНОГО ЧИСЛА ПРОСТЫХ ГИПОТЕЗ
множеств
q (A*) fh (ж) > max q (;) fj (ж)j , (6)
= П r ft П Tj,
1 i—L зИкг ......
называется минимаксным.
Следующее утверждение является полным аналогом теоре
мы 2 . 11.2 .
Т е о р е м а 2 . Пусть существует байесовский критерий л
(соответствующий некоторому априорному распределению Q),
для которого
аД л) = . . . = а г(л). ( 10)
Тогда л — минимаксный критерий.
Д о к а з а т е л ь с т в о Обозначим q(j) априорные вероятности,
соответствующие Q. Тогда для любого критерия л имеем
Г Г
« (л) > 2 q (/) aj (л) ^ 2 q (/) аз ( jx) = max ( я) = « ( л ). <з
j= l 3
= J J ^ - ^ ( d X) = ± P 2( Z ( X ) = c),
Z (jt)= c Z ( jc) = c
*) Ясно, что если <р(с) пепрерывпа в точке се, то проблема реш ения
(3) сводится к отысканию квантиля распределения Z порядка 1 — е.
284 ТЕОРИЯ ПРОВЕРКИ ГИПОТЕЗ [ГЛ. 3
71 *
Так как /j (X) = П / j ( xi), то событие, стоящее под знаком ве-
i —1
роятности в ( 1), можно записать в виде
V ,' ^2 (Xi) 1
- A lnW > Inc’
где слагаемые
, f2 ( Хг)
(2)
Выберем в качестве с — с(п) любую последовательность, для
которои
In с -[ - ап .
7= '-е)
Ojl V П
Так 1*ак —(а + Ъ)Мп/ог + А£с ,/с 2 —°° при /г-*- оо5 то применение
здесь центральной предельной теоремы дает нам лишь, что
а 2(бс) 0.
Задача вычисления точного асимптотического поведения пра
вой части в (5) приводит нас к задаче о вероятностях больших
уклонений для сумм случайных величин тр.
Приведем здесь результаты о вероятностях больших уклоне
ний, изложенные в § 5 гл. 7 [11]. Пусть нам надо вычислить
асимптотическое поведение ? ^ 2 £ i > XJ при п -*■ оо, х оо, где-
пезависпмы и одинаково распределены. Предположим, что рас
пределение имеет абсолютно непрерывную компоненту п что-
я]>(А) = МеА* <С со
при некоторых А > 0. Пусть, далее,
A+ = sup{A: Д(А) < оо},
f = — Чг ~ 1
£t In ■U
у М: , лГ~
Х ~ ап — у ]/ П.
2 V г)
С (Ч
Если а = а = pt (P l5 Р 2) — J / i (■£') In ^ ^ р О&г), т0 (Ю) будет
удовлетворено при А = 1. Это означает, что
А(й) = 1, я]}(А(я)) = г|'(1) = 1.
Отсюда следует, что
А (а) = «А (а) — In \р (А (й)) = а,
а 2 (бс) - Р 2 2 Дг > ап — у V n j ~
~ — Л = е х р {— па-У у V n — if-/(2o]) 1 =
Oj у Znti
Pl(pi»p2) = - l —
im
> оо
T ln “ .(«c) = " - itIlm
i оо
T- O *nf
S -K g
1пв2(б).
п " 1 Ь ? 2 ( S x P I 7 ” ~ 1 1 ^ I < б ) = р 1 ( Р 1 * Р з ) (1 2 )
Так как
a , f t ) = Р , ( £ П. > ! » « ) * 1 - Ф
(14)
( v-i , ^ /Inc-nMr
а 2(6С) =*= Р 2^ ^ < In с I « ф
то
Мв2£ / ~ б н / ( 0 2) ~ 6 п / ( 0 О ,
De2C/ — n l (02) — n l (0 0 -
Это озпачает, что распределения U при гипотезах H t и Я 2 и при
больших п будут различимы, если только величина
Mo У — М01Я ~ бтг/ (00 будет значительно больше или сравнима
1 3 ~ V n l (00. Другими словами, должно выполняться ра
венство Ьп = vl/n, v Ф 0 , или, что то же, б = vfl/n.
Итак, переходя к более точному изложению, мы будем пред
полагать, что
02 = 0 ! + и/ 1 4 (17)
С
= у - (v) = ln Ш - '
*) Знак , используемый здесь, означает асимптотическую эквивалент
ность при б 0,
19*
202 ТЕОРИЯ ПРОВЕРКИ ГИПОТЕЗ ГГЛ. 3
Тогда
/р9 (X)
% ^ = ln 7~'(Х) = y i = “ у 2 (— ”)• (18)
У 1 ( V) = Uv - i . с 2( / (0j) + е„),(19)
где &п— >-0, £rt/ -1/2 (0j) (==> Ф 0 j. Аналогично при X Ре„
% ' ■ ’
Y 2 (— v) — | 71Р + ~2 ^'2 (®г) "1* ®я),
Т П ° < ) -И " С
ах(6С) = Рех^ 2 Л*> In cj 1 —Ф
| о | 1 / 7 ( 0 ,) Г
V К 1} ' (20 )
\ ( —~2~I (0 1) + In с
а , ( Ц - Р , [ Ь < Ь с р ^ *
= , „ e 2 _ ( 0s - 1))£i, (22)
Г (0 1. х 4) = 1 — xif (23)
0* = 1/х .
Отсюда следует, что н. м. к. бс, а также оба а п. м. к., рассмотрен
ные выше (с критическими областями вида 2 I' (хь 0 Х) < и
0* — ©1 < d tl(n l (©i)), dx = d Y w/(0i)) будут иметь форму: 6C(X )=
= i / 2 \ если
= р1 ( Щ 2 j
(xi — В > 2 ^ 1 - ф <2>« 0 ,0 2 3 (25)
п п
при п оо. Так как в нашем случае 2 П; = п In 02 + (1 — 02) 2
i= l i= l
то Inc в (14) (или в (20)) связан с </, соотношением
In с = /г(1п 02+ 1 - 0а) + (1 - 0Ж .
§ 31 ДВА АСИМПТОТИЧЕСКИХ ПОДХОДА It РАСЧЕТУ КРИТЕРИЕВ 295
п
30 100 300 1000
«2 ---^
г=1 “)•
Так к ак MBt>x { = 1/0O, De^xi = 1/ 0 |, то нормальное приближение (14)
для «2 (6с) будет иметь вид
Ф
[{' ' i ) " + 2 у " ] ) = ф ((°2 _ 4) у " + 20^ '
~
Рассмотрим теперь формулу (8), в которой в пашем случае падо поло
жить li = ——п—
Xi, X 2|'й1 Здесь условие теоремы 1«
х - пМ|, — п —2У п+ н/02 ( 1 -0
— Д/п
~\/ п
выполнено. Далее,
ОО
—\ х —09х , 0„
z dx — ___ _
~[/ п '
Так как Jim а = — 1 < 0 , то условие lim sup -i_ < а . такж е выиолнеио.
П->оо П-гсю И
ДВА АСИМПТОТИЧЕСКИХ ПОДХОДА К РАСЧЕТУ КРИТЕРИЕВ 297
Поэтому при t — п + 2) п
/ п \ я —1
х<е^%п\ 2 (x i — 1) >
i=l J
10
Допустим, что для выборки X объема п = 10 оказалось 2 xi •==
г=1
гг
= 18. Так как при гипотезе Н х 2 хг€ = Г 1>п и Г 1>зг(( а, Ь)) =
= Н 2п ((2а, 26)), то r t>ю((18, оо)) = Н2((36, оо)) = 0,0154 (см. таб
лицы III или [8]) и фактически достигаемый уровепь в этом
случае будет равен 1 — е(Х) = 1 —0,0154 = 0,9846, так что гипо
теза Н 1 будет отвергаться н. м. к. с уровнем 1 — е = 0,98 и не бу
дет отвергаться н. м. к. с уровнем 1 — е = 0,99.
2. Равномерно наиболее мощные критерии. Вернемся к про
извольным рандомизированным критериям я, которые мы дого
ворились задавать критической функцией я(х), x ^ S 6 n. (Функ
цию п (х) можно называть также статистической (рандомизиро
ванной) решающей функцией.)
Если существует достаточпая статистика S (X ), то можно ог
раничиться критериями я(Х ), которые зависят от X только через
достаточную статистику S(X ), т. е. критериями, представимыми
в форме я(Х ) == ф(£(Х)). Ведь мы знаем, что вся информация о
неизвестном параметре сосредоточена в & и привлечение других
статистик (другой информации о выборке X) не имеет смысла.
Как мы уже отмечали, для отыскания оптимальных критери
ев обычно сужают множество рассматриваемых критериев до
класса К в критериев фиксированного уровня. Среди них можно
пытаться отыскать такой критерий, для которого мощпость
Ря (6) = Метс (X)
в области ©2 максимальпа (т. е. вероятность ошибки второго
рода 1 — (3„(0) минимальна). Другими словами, максимальной
должны быть вероятность принять гипотезу Я 2, когда она верна.
Функция (6) = Мея (X) часто называется также функцией
мощности критерия я.
О п р е д е л е н и е 3. Критерий я " е й , называется равномер
но наиболее мощным критерием (р. н. м. к.) в К е, если для лю
бого я е К е
Р„г(0) 5? рл(0 ) при всех 0 е 0 2. ( 1)
Конечно, р. н. м. к. существуют далеко не всегда. Если такой
критерий я° существует, то для него фупкция мощности ( 0)
располагается на графике выше любой другой функции рД 0 )
в области 0 2 при условии, что обе они не превосходят значения
е в области ©( (ведь а 1 (я) = sup (Зя (0)), так что Ря° (®) есть
6=©!
огибающая семейства (ря(0 )} в области @2.
ПРОВЕРКА СЛОЖНЫХ ГИПОТЕЗ. ОПТИМАЛЬНОСТЬ 303
■ = е х Р { ( а — а о) пх — ^ (а 2— «о )],
ix ) f 1 / 11 11 \\ 'V
V 2]
= с (0) I (dt),
tSA
где мера v определяется соотношением
v {А) — j* h (a?) j / 1(dx)t
{х: Одел)
Ото означает, что распределение Т относительно меры v имеет
плотность (см. также лемму 2.15.1) g e(f) = c(0)ea(6)t и, стало быть,
также принадлеяшт экспоненциальному семейству. Далее, в силу
монотонности а(0) можпо ввести новый параметр j} = a(0), совер
шенно пе изменив при этом задачи и ее условий. Следовательно,
мы можем считать, не ограничивая общности, что н(0) = 0. В этом
случае функции с(0) = 1 j*ee*v(d£)j и Р° (0) = Мея°(Х) бу
дут, очевидпо, непрерывными. Допустим теперь, что утвержде
ние теоремы о характере поведения р°(0) неверно. Тогда найдут
ся три точки 0' < 0" < В"', для которых
Р°(0') = Р °(0") = р°(0~) = a е (0, •1). (14)
Мы видели, что л° максимизирует р(0") при условиях р(0') =
= (Н0") = а, при этом если не выполнено условие вида (13), то
Р°(0") > а . Но равенство (13) в пашем случае означает, что
Тогда элемент п°, на котором J л (a?) f m+1 (х) \\!l(dx) достигает мак
симума, имеет вид
771
Qi
Для проверкиH Ql против / / 2 в классе К г = {л: е}
критериев уровня 1 —е существует н. м. к. л<э , имеющий вид
(л*^ есть критерий ^ q xq2 в обозначениях § 4, где Q2 — вырож
денное в точке 02 распределение):
(1, если g ( x ) > c f Q l(x),
л Ог 0*0 |q^ если g {x ) c c f Ql{x) ^
с (0i) J е 1v{dt) 1 — е,
ci
с2
(10 )
с (0i) j r (t) (dt) (1 — е) т.
ci
Мы пришли к задаче, совпадающей с задачей, рассматривавшейся
в лемме 5.1, с той лишь разницей, что распределение с плот
ностью r{t)gQ1 (t) может быть обобщенным (т. е. принимать и
отрицательные значения). В этих новых условиях следует поло
жить t 0 = т. В остальном рассуждения леммы 5.1 не меня
ются. <1
§ 7*. Инвариантные критерии
В этом параграфе мы рассмотрим еще одип способ сужения
класса всех критериев, основанный на этот раз па соображениях
инвариантности.
Предположим, что ^(=§{Pe} и {Ру} есть инвариантное се
мейство. Напомним необходимые обозначения и понятия (см.
§ 2.19). Пусть дана группа G измеримых преобразований g про
странства <%п в себя. Семейство {Р0) будет инвариантным отно
сительно G., если для каждого g ^ G и 0 ^ 0 найдется элемент
0g е 0 , такой что
P0g (X е Л) = Р 0 {gX <= А).
для любого Л <=
Преобразования g пространства 0 , определяемые равенством
при выполнении условий С40) образуют груину G (см.
§ 2.19).
О п р е д е л е н и е 1. Мы будем говорить, что задача проверки
гипотезы IG = {0 ^ ©j} против Нг = {0 е= 0 2}? 0 , U 0 2 = 0 , являет
ся инвариантной, если выполнены следующие два условия:
1) Семейство (Ре) является инвариантным относительно G.
2) Множества 0 , и ©2 являются инвариантными отиоситель-
по g е= О, т. е. g & i = i = 1, 2.
Если задача проверки гипотез является иивариаптпой, то для
ее решения естественно воспользоваться инвариантным крите
рием.
О п р е д е л е н и е 2. Критерий я называется инвариантным
если я(Х ) есть инвариантная относительно g статистика*)!
nigx) = п(х) для всех х е= g ^ G.
*) См. сноску на стр. 182,
21 А , А. Боровков
322 ТЕОРИЯ ПРОВЕРЮ ! ГИПОТЕЗ [ГЛ. 3
Т х = х, Г а = 2 ( х 4 — х )2,
г=1
то преобразование g дает
Td g X) = х + с, T 2(gX) = TAX) .
Таким образом, статистика Т 2 является ипвариантной относи
тельно G. То есть инвариантный критерий зт, основапный па
достаточных статистиках, должен быть функцией от 1 \. (Ниже
мы увидим, что любой инвариантный критерий зт должен быть
функцией от Т2.) В силу § 2.32 о~?Т 2 (§= Г1/2, (n-i)/2, и мы приходим
к задаче, разобранной в предыдущем примере. Р. н. м. инвари
антный несмещенный критерий будет иметь вид щ --51 Т> ^ с2.
П р и м е р 3. Оба рассмотренные выше примера касались
нормального распределения. Применительно к распределению
выборки X это было многомерное пормальное распределение с
диагональной матрицей вторых моментов. Для дальнейшего по
лезно отметить, что семейство произвольных многомерных нор
мальных распределений Фа
а2, а е R m, о2 = ||оу|!» *,7 = 1, , тп,
является инвариаптпым относительно группы G линейных невы
рожденных преобразований
g x = ( х — а)С,
где С — обратимая матрица. В самом деле, мы должны убедить
ся, что при некотором преобразовании g выполняется Р^е(21) =
== P e G ^ M ) , где Р е = 0 = (а, Фа>ав»
g ~ l A, -как обычно,
означает множество g~lA_= { х ^ R m: g x ^ A ) . Имеем (а = УIа21)
% . А е ~ 1 А ) = (2д)»/^|С||cxP(-i-(g-V-<x)o-4g~V-«)r}<6g-
Учитывая, что g~l y = y C ~ l + a, мы можем показатель у экспо
ненты в последнем интеграле записать в виде
( у - ( а - а)С)С- 1а~ЧС-1)т(у - (а - а)С)т.
Стало быть, если ’положить
g t i ^ g i a , а2) - (get, Сто2С) = ((а - а ) С , СтогС), (2)
то мы получим '
ф а, А е ~ ' Л ) =Фг(а>0»)И). О)
21*
326 ТЕ0Г11Я ПРОВЕРКИ ГИПОТЕЗ [ГЛ. 3
п
статистика Т 2 = 2 ( x i — х) 2 является, очевидно, максимальным
?=i
инвариантом в наблюдении (х, Т 2).
В заключение этого параграфа отметим еще раз, что суще
ство подхода, связанного с инвариантностью, состоит в редукции
рассматриваемых задач о проверке гипотез к более простым за
дачам, относящимся к распределению максимальных инвариан
тов. В этих новых, более простых условиях в ряде случаев ока
зывается возможным построить и. м. или р. п. м. критерии. В этом
отношении «принцип инвариантности» близок к «принципам»
достаточности и несмещенности, в соответствии с которыми ис
ходная задача редуцируется к задаче в терминах достаточных
или несмещенных статистик.
О
— j* Ре ( 0~ <С и) duw (и, 0) = Меи> ( 0_ 5О). <\
— оо
S = £ хг'--|- У, у ^ и о;1.
i=l
Оно имеет в точке t, 0 ^ t ^ п + 1, плотность С \Р р ^ (1 — р)п ^ .
Обозначим GpСО функцию распределения с этой плотностью.
Тогда р+ будет решением уравнения Gp(t) = е.
3. Несмещенные доверительные множества. Вернемся к во
просу о наиболее точных доверительных множествах. С помо
щью теоремы 3 мы можем строить наиболее точные верхние п
нижние границы, основываясь на том, что для односторонних
альтернатив (0 > 0Д, {0 <. 0Д гипотез {0 = 0 J в ряде случаев су
ществует р. п. м. к. Если же попытаться использовать теоремы 1, 2
непосредственно для построения наиболее точных доверительных
интервалов, то нам потребуется существование р. и. м. к. для про
верки гипотезы {0 = 0!} против (0 0 1}, что бывает весьма ред
ко. Выход из этого положения состоит в естественном сужении
класса рассматриваемых доверительных интервалов на тон же
основе, на которой мы сужали классы рассматриваемых крите
риев в § 6, 7. Именно, введем понятия несмещенных и инвари
антных доверительных множеств.
Пусть, как н прежде, каждому 0 соответствует множество
0 2(0), О<£©2(0).
О п р е д е л е н и е 4. Доверительное множество 0*(Х, е) для
0 уровня 1 — е называется несмещенным относительно альтерна-
тие 0', таких что 0 е 0 2(0' )5 если
Р о( 0 ' е 0*(Х, е ) ) < 1 — е при всех 0, 0', -0 ^ 02 (0 0 . (6)
0*(gX, е ) = # 0 * ( Х , е) (7)
для всех g ^ G .
Смысл этого понятия аналогичен смыслу эквивариантпой
оценки (§ 2.19). Если преобразования g и g интерпретировать
как замену системы координат, сохраняющую распределение, то
(7) означает, что доверительпое множество не зависит от коорди
натной системы, в которой вПражепы исходные даппые.
Хп СЁ!Пп—
— 1 j•
Соответствующее (8) доверительное множество ®*(Х, е) имеет
вид интервала
(п — 1) £ о Д 2,е < о-'2< (тг— 1) SoAi.e. (9)
Этот интервал, очевидно, инвариантен относительно g, как
и критерий (8) (в этом примере G[oJ = G для любого щ). Следо
вательно, в силу вторых утверждений теорем 4, 5 интервал (9)
есть наиболее точное инвариантное несмещенное доверительное
множество уровня 1 — е.
П р и м е р 3. Пусть X Фа о2. Требуется построить наиболее
точное доверительное множество для параметра а при неизвест
ном о. Здесь
иметь вид
1, если /q2 {X) > c/Ql (X),
я Q( X ) = P, если /q 2 {X) = cJQi (X ),
(1)
О, если fQ2 ( X ) C c f Q l ( X ) t
пе меняет. <3
В теореме 5.3 мы использовали байесовские критерии для
отыскания р. н. м. к. Следующее утверждение есть некоторое
«развитие» теоремы 5.3. Опо является также аналогом теорем 1.2,
2.11.2 и устанавливает, что минимаксные критерии следует искать
в классе критериев (1), явный вид которых нам известен.
Т е о р е м а 1. Пусть существуют распределения Q,, сосредото
ченные соответственно на подмножествах ©i сz ©i, i = 1, 2,
и постоянные с и р, такие что критерий ^ qxq2, определенный
с (1), обладает свойствами
§ 9] БАЙЕСОВСКИЙ И МИНИМАКСНЫЙ ПОДХОДЫ 339
1) ^ е й 1,
2) МеЯадДХ) = sup MchQiq2(X) (6)
Os ©j
Q'
Критерий q , как и л > г, будет критерием из Кг
для проверки Н г против Н >, так как
Qj Q3
Фо,1 w независимы.
Д о к а з а т е л ь с т в о . Мы начнем с наводящих соображений.
В нашем случае для х = (ж(1), х (т)) имеем
UW = ехР { - Т - “ ) (ж - “ )Т}>
> С JСХР(—у(ж—V)(ж—1')Т}^ 1
( 11)
©1
exp {Г— —
1 х х т — 2\ | т\} dVy (v)
Г\ c x V {xv
©i
Иптеграл здесь равен
J exp {| x I aexvT} dV (h)/F, V = mes 0 °,
©°
где 0° — поверхность единичного шара, ex = x l\ х j. Стало быть,
если обозначить
4 (0 .[ ехР \ texVT] dV (v), (12)
©°
то область (11) приема / / 2 примет форму
4(|а?|6) > с4'(1ж|а) (13)
(через с мы обозначаем здесь постоянные, не обязательно совпа
дающие со значением в (11)). IIo очевидно, от х тте зависит,
поскольку значение интеграла (12) не зависит от направления
единичного вектора ех . Поэтому
4 (0 = j схр {fEj} dV (и},
©°
где и, есть первая координата вектора v.
Так как i] /( 0 ) = 0 , i|) " U ) > 0 при f > 0, то фИ) есть выпук
лая возрастающая функция на [0, °°). Отсюда следует, что нера
венство (13) (или (11)) эквивалентно
\х\ > с. (14)
Эго есть, очевидно, инвариантный критерий Проверим для него
выполнение условий 1—3 теоремы 1 и устаповим тем самым, что
это минимаксный критерий.
Имеем
(X) = Ра ( | X | > с) = Ф о,е ({ж: | ж — а | > с}).
Ясно, что перемещение точки'1а по сфере 1а1 = const этой вероят
ности не меняет. Стало быть, она зависит лишь от |а | и, следова
тельно,
Ma^Q1<?2 = Р ( 11 — а |2> с2) =
Отсюда и из условий
Ма ,а2(Уг— pi)2 = 1,
М а ,а 2 (Y i — p i) (У; — Pj) = 0,
М «п(Х) = 1 - ф ( < - г - а р 7 |р |) .
> ЯН J {/О1 (х) — /о (х)) И (dx) + Я (Ь) j (/о/ (х) — /е (ж)) ц (dx) =
■
—со Ь
оо
v * sup / 0 {X) ■
(1 )
4>
0еег
называется критерием отношения правдоподобия (к. б. п.) для про
верки гипотезы Hi против Н2.
Постоянная с обычно выбирается из условия
snp Ре (Я (Х )> с) = в, -
0=0!
при котором к. о. п. будет иметь уровень 1 — е.
Наряду с критерием (1) часто рассматривают по существу эк
вивалентный ему критерий (который также называется к. о. п.)
вида
sup / е {X) . , у,
- (3 )
ее©! . еееА
350 ТЕОРИЯ ПРОВЕРКИ ГИПОТЕЗ' [ГЛ 3
если \ X \ ^ Ъ.
ВИД
р2(Х, ©2) - р2(Х, 0) < с,
где р (X, 0 2) — inf | X — а |, р (А', 0) = [ X |.
аев-2
Установим теперь, что при выполнении некоторых предполо
жений критерий отношения правдоподобия обладает свойствами
инвариантности. Пусть G — любая группа преобразований в й? ",
относительно которой задача проверки гипотез Я* п Я 2 инвариант
на, и пусть U — соответствующая группа преобразований g на ©.
Т е о р е м а 1. Если fe(x) обладает свойством
/е {gx) = с (g , х) / - 0 (я), (8)
то критерий отношения правдоподобия инвариантен относитель
но G.
Но поводу условия (8) отметим, что опо всегда выполпепо, если
р есть мера Лебега, и g — преобразование, сохраняющее меру
( сдвиг, поворот). В этом случае c(gt ж) = 1. Для преобразований
' сжатия cig, х ) ен=const.
Д о к а з а т е л ь с т в о т е о р е м ы 1. В силу того, что g S t = ©,,
i = 1, 2, будем иметь
sup f Q(gx) sup С {g, X) f . (x) Slip f e (x)
„ , 0efi2 —— - =
v
R (gx) — ------ e=^e2 j—:—\ = Яr , ,(ж).
j - 7-7g—— = — v ^
<]
45 >sup / q (gx) sup {g, x) f- x)
С sup f 0 (x)
I ~ >_
- 0=0! OS©! osi©!
Другие свойства к. о. п. см. в §§ 11, 13—16.
1 — Yi = 1 — V2 =
шг шг так что
Рис. 5.
m i - ь , бЭ = л ( 1 - % б2).
Из приведенных рассуждений и рис. 5 вытекает следующее
оптимальное правило действий. По данным а, щ , w% вычисляем
l — ^i, 1 — ^ 2. Если —72 или, что то же, 1 — q~> то наи
меньший риск среди всех критериев дает б2 (т. е. надо немед-
§ 11] ПОСЛЕДОВАТЕЛЬНЫЙ АНАЛИЗ 357
00 с
< 2 J /2 ( ® )r r V ( d » ) = ( l - a ,( e r ) ) / r ,. (5)
,l_l
Диалогично устанавливается, что
а Д б гХ Г Л -а Д б г)). ( 6)
Положим для краткости аДбг) — а,. Степень точности получен
ных неравенств
1 — а0 „ а
г.,“ <
^ Ч ’ 1\ > -7—
1 ^ 1 —а г v(7);
мы обсудим позже. А сейчас выясним свойства критерия, кото
рый мы получим, если воспользуемся соотношениями (7 ) в каче
стве основы для определения Г,- но заданным сц. Если положить
г' аз г' 1_а2 ' ч
Г1 = ~i —« 12 = — a i = “ i (бгО,
то для полученного критерия бр' будем иметь в силу (7 )
360 ТЕОРИЯ ПРОВЕРКИ ГИПОТЕЗ [ГЛ. з
а 1^ 7~~Т, С т —— , СС2^ — — --
1 1" « 1
1- СС2 1 —а 1
Приводя неравенства (8 ) к общему знаменателю и складывая
их, получим также
г 9
а.1 + a 2 oci -f- a 2.
Таким образом,
/ если а ( малы, то критерии бр' будет иметь
значения а*, которые в сумме не превышают a i + a 2, и каждое
9
из а* может превышать а, лишь незначительно и в известных
нам пределах.
П р и м е р 1. Пусть xf имеет биномиальное распределение
с вероятностью успеха р. Задача состоит в проверке гипотезы
//\ — i p — p j против Н 2 — {р = р2), Pi<Pz. В этом случае
/,т = ”n = С M L -р.) У ” ( l ~ p , Y
/i (X) рЧп ^ _ Pi)n~Tb V*4 С1 *4) / \ 1- Pi / ’
где г|„ есть число успехов в п испытаниях. Для значений p t —
— 0,05, р2 = 0,17, cti = 0,05, a 2= 0,10 получаем *) — 0,105, Г 2 =
= 18, a i - 0,031, a i == 0,099,
Mjv (6Гр) = 31,4, M2v (6Г,) = 30,0.
С другой стороны, процедура с фиксированным объемом выбор
ки и вероятностями ошибок 1-го и 2-го рода 0,05 и 0,10 требует
71 = 57 наблюдений. Таким образом, последовательная процедура
в .этом примере почти вдвое сокращает среднее число наблю
дений.
Л. Вычисление параметров наилучшего последовательного критерия.
Соотношения (7), (8) дают возможность устанавливать некоторое соответ
ствие между границей Г н вероятностями ошибок сс,(бг). Рассмотрим те
перь задачу расчета критерия 6г более подробно,
а) Точаые формулы. Обозначил!
М х») ._ . ,
Ol = G 0 J. (Ю)
Далее, для значенийfV^v, г = 1 ,2 , v = v ( 6r), в силу тождества Вальда
паходим
M4(Zv) = Ml*1Miv, i = l , 2.
В ряде случаев правые части в формулах (9) — (11) могут быть най-
дТГпы в явном виде. Эти формулы оказываются весьма полезными и в при
ближенных вычислениях.
3G2 ТЕОРИЯ ПРОВЕРКИ ГИПОТЕЗ [ГЛ. 3
Л к
M1V~ W11
T' M2V~ м2Т11 (15>
В основе этих формул также лежит пренебрежение второй границей (их
можно получить и с помощью приближений » M^l (Л^ л; Л ./М ^ . Пос
леднее соотношение имеет место в силу теоремы восстановления ( [ 11] ) ) .
Учет следующих но порядку малости членов в (11) дает
МГ = М Д Г К + “ . (а2 - Л ) +.МЩ),
, «в)
= "М^~ (^2 ~ а2 (А2 "~^l) _г~^ 2^2)’
где а,- определяются приближениями (12), (13), значения —
— lim {АЛ могут быть пайдеиы методами гл. 10 в [11].
Рассмотрим теперь неравенства (8). Так как у {Л 1) ^ 0 . %(А2) ^ 0 , то
эти неравенства следуют нз (9), (10), если /(Л,-) заменить на 0. Стало
быть, точность этих неравенств определяется погрешностью, вызываемой
такой заменой.
Если случайные величины г,- ограничены, Ьг егг г, ^ Ь2, то, очевидно,
Х(Л2) ^ Ъ2, у (Л i) ^ Ьи и. наряду с (5), (0) могут быть выписаны обратные
неравенства. Имепыо,
«1 (6г) = - а г),
а2(бг)>ГеЧ1" 06!)* 1
ь (1
где i]n есть число успехов в п испытаниях. Это значит, что для Р,-—
распределения принимает значение b2 = In (pdpi) ~ 1,224 с вероятностью
1 ~ Р2
p-i, и значение — In ^"ZTp— ~ — 0,135 с вероятностью 1 — д,, i = 1, 2.
Отсюда находим
= — 0,067, M2zx = 0,096, еЬ* = 3,400, Л = 0,874.
Это дает довольно точные границы для значения = 0,105. В пашем слу
чае
А г = In « — 2,254, А2 = 1п Г2 ш 2,890.
Отсюда, используя приближенные формулы (15), получим для M^v', г—
— 1, 2 , значения
-4'1/M 1z1 - 33,639, = 30’108-
Мы видим, что даже довольно грубые приближения, такие как (15), да
ют правильное представленпе о величинах M^v'. Результаты будут значи
тельно более точными, если воспользоваться формулами (16).
я т = Л ° ’ 6СЛН
[1 в противном случае!
Очевидпо, что я есть критерий уровня 1 — е.
Так же, как и в § 3, можно ввести понятие критерия асимп
тотического уровня 1 — е, для которого
l i m P 1 ( d ( P 1, P * ) > c ) = e. • (2)
оо
К (х)= 2 ( - 1)'*еГ!,Ай.
К — — со
будет равна
р (Р ) = Р (rfK Щ , Р * ) > с) = Р (sup | F»)( -
С ( Р ) = § ( F ( t ) - F P ( t ) fd F ( t )
24 д . А. Боровков
870 ТЕОРИЯ ПРОВЕРКИ ГИПОТЕЗ [ГЛ. 3
Стало быть, т|я — 4р„.€=> Фо,^ так что в силу теорем непрерывно
сти из (7) получаем
V п {nM n- 1J2 — 1) £=> ф 0д.
Это эквивалентно утверждению теоремы. '<
Приведем теперь соображения, показывающие, что критерий Морана
является состоятельным. Рассмотрим статистику (б) для X ^ Р, где Р от
лично от Pi. О д н о и з распределений Pi или Р мы можем, не ограничивая
общности, считать равномерным. Пусть это будет Р. Относительно F мы
предположим для простоты, что существует непрерывная плотность /(/) =
— сосредоточенная на [0, 1}. Тогда для X U0 ± главная часть п Мп
будет равна
71 77+1
" 2 [/ (*«.+«) Ы + » - *<«)]2 = " 2 [/ ( № ,+ ,) № . + + • (*>
А =0 а fc = l
2 f W n ) l l / ‘n. (9)
А=1
Используя снова закон больших чисел (или неравенство Чебышева), полу
чим, что это выражение сходится но вероятности к
Главная часть второй суммы здесь равпа 2п 2 Р' (х(а>) (x(a+i)— х (А))2’ или,
/1=0
24*
372 ТЕОРИЯ ПРОВЕРКИ ГИПОТЕЗ [ГЛ. 3
2 а ; - '( « » ) 6t / n - f i J р' ( 0 dt = 0.
h—1
Последнее слагаемое в ( 11) также сходится но вероятности к пулю, так
как имеет главную часть, совпадающую по распределению с
п
1 2 (
У п /t=i
1
или с ----- \ [pr ->-0. Сказанное озпачаст, что для функции F ви-
УпJ
о
да (10) статистика п3/2М п12 у п будет им сто то же предельное распреде
ление Ф0, 1, что и для F(t) — t. <]
Следует отметить, что из этого факта нельзя делать поспешных выво
дов о том, что критерий Морана плох. Дело в том, что, не различая близких
гипотез вида (10), критерий Мораиа различает гипотезы (такжо в извест
ном смысле близкие), которые другие критерии, рассмотренные в этом па
раграфе, различить ие могут. Речь идет о гипотезах для плотностей.
Рассмотрим гипотезу I I 0 = { АуЕЕ Р}, где распределение Р имеет плот-
пость
(2 при 2кЛп < t < (2А- -|- 1) Дп,
f (t) = {О при (2к + 1) Дп < t < (2к + 2) Дп, /Г = ° ’ U • ' ■1 Л U
Л
где Да = ;—г, N — N n > 0—целое/ Тогда при Д,> = о («“ '■'*) функция рас—
2Л
пределения Fi>(l) , соответствующая распределению Р, будет обладать свой
ством
s u p | Fp {I) — 11 = о (и- 1 '2).
Это значит, что гипотеза Hi как гипотеза для .функции распределения бу
дет настолько близкой к —{А (ЕЕ II0 1 что критерии Колмогорова
и со2 асимптотически их различать пе будут (предельное значениемощ
ности в точке Р будет совпадать с предельным уровнем критерия). Од
нако как гипотезы для плотностей гипотезы И t и Hi существенно раз
личны, так как sup | /(/) — 1 | — 1. Поскольку х 0) — 0, х(п+1) — 1, то для
А^ЕЕР статистика М п будет превосходить величину AftN = Дп/2. Стало
быть, при п/N — 2/г.Дп оо с Р-вероятносгыо, равной 1, мы будем иметь
nAf оо.
1 q (х ) = J* U И Q ( d t ) . (1)
мощного критерия.
Аналогичные выражения мы можем записать для к. о. и.
который принимает IIQ при выполпешш (2 ):
f o t ( A ) “ v 11 I V \ T \ e 7
АСИМПТОТИЧЕСКИ ОПТИМАЛЬНЫЕ КРИТЕРИИ 375
а 2 (я) - а 2 (я с) ~
= (2n)-ft/2 J = (2n)"wW V * .
{lyl2^*e}
Найдем теперь асимптотическое поведение а 2Ы). Обозначим
А п = (Аг: я<з=^я}. В сплу леммы 1 Ре1 (Дг)->-0. Поэтому из тео
ремы 2.29.5 вытекает, что при любом фиксированном N
SUP P oW T t M " ) - * 0- (fly
|wKN v'
+ J q ( t) P t (A „ )d t+ _ j _?(«)Р,(?(Х)<ё)<й.
p —()11<Л’/1 ,/7Г Jt—O j|> i V / P n
АСИМПТОТИЧЕСКИ ОПТИМАЛЬНЫЕ КРИТЕРИИ 377
(14)
Г
где, очевидно, he = Xt/ 2, Ф 0>1 ((— Я£/2,Х е;2)) = 1 — е. Мы видим,
что соответствующий (14) критерий л ', асимптотически эквива
лентный л, можно интерпретировать так: я.'(Х) — 1, если 0 j не
попало в доверительный интервал асимптотического уровня 1 — в
для параметра 0 , построенный с помощью о. м. п. 0*.
Такая же интерпретация сохранится, очевидно, п в много
мерном случае; доверительные множества при этом будут иметь
форму эллипсоидов:
(S* - е) / (§*) (о* - e f <
где с — hEl 2 .
Из оценки (10) следует, что существует N > 0, такое что
справедливо
lim sup sup Мол (X) ^ е.
w-»oo Q sO j
j* ехр |Г 1 (У ~ и) I (У - - u f ] П2 (du)
1 2
г (Y) = 4 -------------------------------------^ --------- > с, (8)
[ 1
(У - и) I (У -- и ) Т }пг (du)
J 4 L 2
где с — се выбирается из условия
J Ф(у, с) П1 (dy) = е, ф(v, с) = Р(г(У)> с), (9)
I ^9 + u !Y n ^
Т(Х) = 8' +,|/” ’
± >
~ —Q1
Ото означает, что n QlQ0 e K p, ^ KE .
Надо доказать теперь, что для любого критерия л* е К а
lim inf ^ inf Мел (X) — inf М е л * ( Х ) \ ^ 0 .
n-> oo v 0-30.7 0€=02 J
Имеем
lim sup inf М0л* (X) ^ lim su p Мел* (Ar) < lim sup Mq2KqiQo (X).
n-»<x> 0S02 тг-»о о n -» o o
(13)
Последнее неравенство справедливо в силу байесовостп
(т. е. минимальности + (1 — дх) Mq2(1 — Л ф ^ ) при
соответствующем - qA и того, что lim sup IVIq^* (X) ^ е,
lim MQl Лф1(?2 = е.
§ 14] БЛИЗКИЕ СЛОЖНЫЕ ГИПОТЕЗЫ 387
sup exp
u>v2 ) x p { ~ 4 — 1 F » }
= A , ( 0 + e!f) (X).
sup exp
ф ( - у (Т' аГ I + e‘Л ч ]
(5)
(6)
(?)
и является асимптотически минимаксным критерием асимптоти
ческого уровня 1 — е для проверки гипотез Я, и Я 2, определен
ных в (4). Случайные величины в (7) независимы, 1г£=Фол*
Гарантированная предельная мощность критериев я, (5), (6 ) рав
на Рсв {Ь).
Д о к а з а т е л ь с т в о . Задача В здесь будет состоять в про
верке по наблюдению Y (= Фv,E, гипотезы = { | у | ^ а) против
[ У I ^}- 3 примере 9.1 мы видели, что в этой задаче суще
ствует минимаксный критерий уровня 1 —е, который имеет вид
§ 15] ОПТИМАЛЬНОСТЬ КРИТЕРИЯ ОТНОШЕНИЯ ПРАВДОПОДОБИЯ
(8)
т = т« - 1/2, т = ( ^ 7")т
(11)
Р = Р0 -г б/Г~1/2}
У0 {{и', 0)) - ( 6' + б', и ' ) - | (и', и') -!- (I и' |2 + I б I2) еп (X, и', б). (14)
Из (13), (14) следует, что максимальные значения Y0(u) и Y0((u', 0)) до
стигаются соответственно при
« = №» + «) (« + '»(•*.«>)■
( 10/
и, = ( Й + в ' ) . ( Я + е? ><Х»
ре<р) ре(Р)
где р„ ( Х, б) . ----->-0, t'lp (X, б ) ------ vO равномерно по б, |б | < б „Ул/2. Надо
лишь заметить, чго вероятность больших зиачепий | £ „ + б | равномерно
мала, так как t n + б Фй /? равномерно но б, |б | < б„У«, и 1*о(1 s « “У*
+ б | > б„}'п) ->~0 равномерно по б, | 6 | < б„ Ул/2.^
398 ТЕОРИЯ ПРОВЕРКИ ГИПОТЕЗ 1ГЛ 3
{ Х) = sup W X) = s „ “ / o ( ( “ '.0 » =
равномерно по б.
Так как при 0 — g(a) с необходимостью б" = 0, то отсюда следует ут
верждение теоремы относительно статистики 2 In R t (X).
Вспомним теперь, что (см. теорему 2.29.3) = u*(£ + en (X, б)), гдо
и* = ( р*— р)У«, р * — о. м. п._для параметра р. Отсюда и изравенства
р 0 = 0 , полагая б* = (р* — ро)]'Ч получим
Л (Х ) = П е Г . (1)
i= l
s 161 КРИТЕРИЙ xs И СГРУППИРОВАННЫЕ ДАННЫЕ 401
хг о о = 2 пр.
я критическое множество критерия %z (область приема IL) име
ет вид
Г (Х )> с,
где с выбирается по заданному уровню значимости.
Рассмотрим более внимательно сформулированную выше зада
чу о проверке гипотезы / / t = (0 =/>} против //2 = (0 Ф р).
Ясно, что распределения {Ве} образуют параметрическое се
мейство, зависящее от к — (г — 1)-мерного параметра (6 1т 6r-i);
. Г—1
значение 6Г определяется равенством 0r = 1 — 2 Вектор
г— 1
(G1? . . 0r_i), так же, как и (01т . . 0Г), мы будем обозначать бук
вой 0. Недоразумений от этого не возпикпет. Область 0 представ-
?•—1
.ляет из себя симплекс 0 ,-^ 0 , i — 1, . . г —1, в * ^ 1- Логариф-
г=1
мическая функция правдоподобия Ь (Х , 0 ) равна
0
l (X, 0) = 2 In 0„ = 2 г (XI, 0). (2 )
lt= l
1 + 2 £ ) & У = ( п
3=1 3=1
г— 1 1 ' г= 1 *
где
tr — — S, 2 ^ = 0. (10)
<«>
i = i 1 1
2 ' (12 )
h (Y) = П
г—1
ер П л Г \
г—1
Мх2 (X) = г — 1,
DX2(X) = 2 ( r - l ) + + 2
\г=1
Промежутки 0—1 .1—2 2 - 3 3 - 4 4—5 5—6 8—7 7—8 8—9 9—10 10—11 11—12
на циферблате
Число наблю 41 34 54 39 49 45 41 33 37 41 47 39
дений
2 Vi I n —
nP i(a*)
0 А в АВ Всего
в
0—1 1—2 2—3 >3 V.
i•
>4 39 98 31 14 182
V .
■} 0110 10928 5173 3016 25203
27*
412
ТЕОРИЯ ПРОВЕРНИ ГИПОТЕЗ [ГЛ. 3
общности, а — 0, получим
У >» (^ е* И Fo (* ))=
= _ / (ж - 0) ] td [ У п (F* (t ) - F q ( о ) ] ч- г (0*, 0, Ж) -
Далее, функционал
N
н у У п ) = sl[P wn И — f ( x ~ Q) j wn (0 dt
-N
при любом N > 0 является непрерывным в равномерной метрике. Замена
псремсипой ж на (у) = 0 + F-1 (у), которую естественно сделать для
примепенпя теоремы 1.6.3, этого факта не меняет. Поэтому в силу назван
ной теоремы
N
р F (F (ж - 0)) + / (ж - 0) j (F (t - 0 )) dt
-N
Чтобы доказать требуемое соотпоптепио
D n =» sup j w° (F (ж — 0)) -|- / (ж — 0) J w° (F (t — 0)) dt |
414 ТЕОРИЯ ПРОВЕРКИ ГИПОТЕЗ [ГЛ. 3
(о (0* — 0) -»-0 ,
Рв
остается убедиться, что интеграл в (4) вместе с интегралом ^ w° (F {t)) dt
[ dt.
— ОО
Б силу соотношений Мк° (s) w° (и) = min (s, и) -J- su ^ 2 min (s, и) при
s ^ 1, н ^ i, имеем
-N \2 —N —Лг
^ w° (F (t)) rfM < 2 | | min {F (t), F (s)) dtds =
~ —OO—oo
—N —N
4 [ ( — t —A ' ) f ( t ) A < - 8 р ^ (* )< М -* 0
—OO —oo
при Л7—> oo, так как ( FdF (i) < oo. Аналогично рассматриваются остальные
интегралы. <]
2)Пусть теперь проверяется гипотеза Ре* О еЛ , 0>О, где Р е ( Л) =
= Р(Л/0), А с :/?. Обозначим снова через F функцию распределения, соот
ветствующую Р, и положим
При t О
= s up| , o“ ( F ( £ ) ) + i / ( | ) j < o , - (F ( « ) ) , « .
а ** = -7 ~ г 2 (О
h=l
где 0 < д < 1 , г — \ / р — целое число. При р — 1/2 оценка а**
превращается в выборочпую медиану Z* = £i/2.
Ограничимся пока случаем р = 1/2. Имеем при п i
(а* — а) V п (=> Ф 2, Од = i*t2f (t)dt. (2) -
o.Oj J
а** 11пр
_о х(/<ь (4)
k—np+i
разброс которого также сближается при малых р с разбросом
б
Од оценки а*.
Отметим, далее, что свойства оцепки а* = х мало зависят от
изменений Р, сохраняющих дисперсию ol — ( t-f{V)dt , и, в част
ности, от локальных изменений fit) в точке t = 0. В этом смысле
она устойчива. Но свойство оптимальности этой оценки, имеющее
место для Р = Ф 2* неустойчиво. Действительно, пусть при ма-
лом е > 0
Р = (1 — е)Ф а, I +• eUa-е,а + е.
« - - ^ 2 < * « -;) * . •
О
Поэтому
где Si, «S’л- — элементы '©(e). Так как P* (S h) — >-P ( S h), то отсюда
у ж е без труда получаем (2) (ср. с доказательством теоремы 1.2.2А).
Второе утверждение теоремы 3 почти очевидно. Пусть дано е > 0 и
пусть ©,(£[) и ©г(ь’2) — аппроксимирующие классы для ЗИ и St2 соответ-
422 ПРИЛОЖЕНИЕ I
Выбором б правая часть этого неравенства может быть сделана сколь угод
но малой.
Далее, Р абсолютно непрерывна относительно р. Поэтому, для задан
ного £ можно найти 7 — 7 (e), такое что su p P (A ) <С е. Если теперь б вы-
p(A)<Y
брать так, чтобы ф(2б|'/н, М) ■< 7, то получим
Р (A2 — A i ) < е. О
С л е д с т в и е 2. Класс <5 всех выпуклых множеств коисчио-аппрокси-
мирусм и, следовательно, для абсолютно непрерывных Р
sup | Р* (В) Р {В) J . ъО,
.
11 11
Л Р II Л О Ж Е II И Е II
ФУНКЦИОНАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА
ДЛЯ ЭМПИРИЧЕСКИХ ПРОЦЕССОВ
/ (и/1)
Для доказательства теоремы нам понадобятся дво леммы.
Л е м м а 1. Конечномерные распределения процессов w n слабо сходятся
при п-+-оо к соответствующим распределениям процесса w°.
Д о к а з а т е л ь с т в о . Рассмотрим случайные (лг + 1)-мерные векторы
Через ги° обозначим аналогичный вектор для процесса w°(l). В силу вто
рой теоремы непрерывности, для доказательства леммы нам достаточно
показать, что ivn ^> w °.
Найдем характеристические функции w n н ю°. Для вектора u = ( u Q, . . .
. . и т) имеем
,.о»Т
“т = схр {-.т 2 _ г/)2 л;}= “ р {“ т (2 “>
?Ai - р2)}- (1>
, и У п 4- n In Г 1 + 2 ( + О ( .- W ) ) J =
L 7=*о J
VI
= — iU
[
Сравппвая с (1), мы видим, что при гс -> оо
(2 >
Остается воспользоваться теоремой пепрерьтвпостп для характеристиче
ских функций мпогомерных распредслспий (см. [11], стр. 148). <]
Л е м м а 2. Д л я любого г > 0
lim sup Р ((Од (wv) > е ) -*■ 0 (3 )
<ofl = m ax
ft—i I14
.,771
Возьмем здесь первое слагаемое. Нетрудпо видеть, что при I > 3 со
бытие
28 А. А. Боровков
426 ПРИЛОЖЕНИЕ II
... ,
п ^—К ^ — J j есть частота попадания элементов выборки в
интервал длины 2~г. Другими словами, это есть сумма S n случайных вели
чин в схеме Бернулли с я испытаниями и вероятностью исхода 1, равной
р = 2~т.Так как (см. [11], стр. 105)
М(S n — яр)4= п (р (1 — р)4 -j- (1 — р) р 4) -р Зя (я — 1) р2(1 — р)2< пр |-Зя2р2,
то по неравенству типа Чебышева
lim sup Р ( ш ^ ^ е) ^ с —
Зто выражение может быть выбором I (или Д) сделано сколь угодно малым.
Оценим теперь второе слагаемое в (4), не превосходящее
(0)
tfK W fW - (8)
Кроме того, из непрерывности ю° п функционала / следует, что
I wд — Ыд (w°) -> 0 при Д -*0, (9)>
Аналогично находим
“’.у.г (ч = л / [ К м - 0 - ( 4 (о -4)] =
■ 1Ч 2
= 1/а^.х (*) + V 1 —« ы>у (0* (12)
где и ы ? г (0 — эмпирические процессы, соответствующие выборкам
Л' н Y.
Так как {од (а: + У) ^ сод(я) + w&(l/), то из (12) и леммы 2 сразу вы
текает аналог леммы 2 для процесса w x , y (?): для любого е > О
lim sup Р (сод (wх у) > е) -> 0.
П-*оо ’
Сходимость конечно-мерных распределении юх , у и w° такж е выте
кает из (12). Действительно, обозначим через w х у , w x , и>у векторы, по
строенные по процессам wX Y (t), wx (t), wy (?) точно так же, как строил
ся вектор ю п по процессу w n (t). Тогда, используя независимость X п Y и
доказательство леммы 1, получим
П Р И Л О Ж Е Н И Е III
свойства у сло вн ы х м а тем а ти чески х о ж и д а н и й
С еойство 1Ь д о к а з ы в а е т с я т очн о т а к ж е .
' Чтобы доказать свойство 1с, положим для краткости 1^ = М (!$/&)•
Тогда для любого А ^ 31
J f ^ P - М ( f t ; А ) = М (1х; Л) < М (12; А) = j g d p ,
А А
J
А
, j М (/в |/ й ) dp = j i Bi d v = J = J m g /s o d p - [ 1в щ ъ № ) dp.
A A AB AB A
Отсюда и пз лпнейпостп у. м. о. следует, что утверждение справедливо п
для любых простых функций тр
Если 6 О, ц ^ 0, то, взяв последовательность простых функции 0 ^
^ ц n f Ц и пользуясь теоремой о монотонной сходимости в равенстве
’М 01„г/*) = ЧПМ(Б/Я),
м164к °о.
разности п суммы имели смысл, нужно требовать существования М 11 [
6. Неравенство Коши — Буняковского
М (1 ,1 ,/я ) < [ м ( 5 5 /и ) м ( 5 | / « ) ] 1/а
Ф(“ .Л п)= 2 -Ф
k (< о, 0*Н*а-
В силу свойства 5 отсюда следует выполпетше (3) для функций ц„. Оста
ется воспользоваться теоремой о монотонной сходимости (свойство 4) в
равенстве
М(ф(®. 11п)/Я)==,Ф(<>),'П11).
II Р II Л О Ж Е II II Е IV
ФАКТОРИЗАЦИОННАЯ ТЕОРЕМА НЕЙМАНА — ФИШЕРА
^ = "717 ^ = ^ S^ h^ п*в' ^
Доказательству теоремы 1 мы предпошлем два вспомогательных ут
верждения. Введем в рассмотрение
У с л о в и е (D). Семейство & = {Ре}е-=в удовлетворяет условию (А*)
(т. е. доминируется мерой л ), где вероятностная мера л имеет вид
ч > о . ' 2 ч - ‘-
i i
Т е о р е м а 2. Условие (А,,) необходимо и достаточно для выполне
ния условия (D).
Д о к а з а т е л ь с т в о . Необходимость очевидна. Докажем достаточ
ность. Не ограничивая общпостн можно считать, что р — вероятностная ме
ра. Действительно, вместо р всегда можно ввести меру
* 2'('№ )
где {В) образуют разбиение пространства .86, такое что p ( # j) <
/ = 1, 2, ..._
Пусть & есть класс всех вероятностных мер вида Р — 2 е
•с{> 0, ^ с{ — 1. Очевидно, & cz<P и & такж е удовлетворяет условию (А,,).
Обозначим р — с/Р/с/р н рассмотрим класс © множеств С е й , для ко
торых существует Р & 5 9, такое что р(х) > 0 п. в. па С, Р(С) > 0 . Пусть
С и С-i, . . . — последовательность множеств из 6, такая что
Р (Ci) SUP в (О -
се©
432 ПРИЛОЖЕНИЕ IV
2
п р и к а к п х -п и б у д ь С |> 0, Очевидно, что р (0> > 0 н а С0 и, стало
быть, С0 е
Мы докажем утверждение теоремы, если установим, что Р (0>(Л) = 0
влечет за собой Р(Л ) = 0 для всех Р е Л Это будет означать абсолютную
непрерывность Ре относительно Я — Р (0) и выполнение условия (D).
Итак, пусть Р<0>(Л) = 0 , и Р есть любой другой элемепт 9*. Обозначим
С = {ж: р(х) > 0}. Требуемое утверждение будет вытекать нз следующих
трех соотношений:
Р (Л С0) = 0, Р (А С0С) = 0 , Р (А СоС) = 0,
где Б означает дополнение к В. Первое нз этпх соотношений вытекает из
того, что Р<°>(ЛС0) = 0, р<°>(х) > 0 па С0 и, стало быть, р(ИС0) = 0 . Вто
рое следует из того, что р(х) = 0 на С. Чтобы доказать _третье соотноше
ние, допустим, что оно неверно. Тогда, полагая R — АС0С, мы получим
р (R) > 0, \х (Со U Я) — р (Со) > 0. Но это противоречит равенству
р ( С ) = sup р (С),
07 С'<=©
поскольку С0 е В е ©, С0 U И е <3
Итак, мы установили, что при выполпешш условия (Л^) существует
мера Я, при которой выполнено условие (D).
Т е о р е м а 3. Статистика S является достаточной тогда и только
тогда, когда существует измеримая функция ge(s), такая что
d P fl
(х) = £ 6 (S (х)) п. в. [Я]. (2>
с1К
Доказательство. Для любого измеримого В cz R1 обозначим
{В) = (я <= 9?: S {х) е В) е и рассмотрим распределенпе G9 н а
В 1 статнстикп S, индуцированное распределением Р 0:
Ло е о (6') выполпеио
J Р (А/ S (ж)) Р 0 (dx) = Ре (*4 П А0).
А0
Отсюда следует также, что
Р (А/ S (х)) Я (dx) = Я (Л П Л0).
Ап
Это означает, что P (A/S) является одновременно условной вероятностью от
носительно распределения Я. Мы обозначим эту вероятность как у. м. о.
Ел ( / д / 5 ) индпкатора 1 а .
Из (1) при А 0 = R 1 получаем в силу свойств у. м. о.
Г 0 (А) = j Р (A IS (х)) Р 0 (dx) = МВР (A /S (X)) =
М0 ( W 5)’
i = ме ( I A/S) - Л = м 0 (1A /S ) г0
Аналогично в силу (3) на о (5)
I V П . Н.
d P fi
gQ(S(x)) = ^ ± {Х )ф 0 .
dX
где следует положить gQ(s) = гр (G, s), (х) — h (х). Обратно, если спра
ведливо (1), то
f/P
-щг = 2 с* ~ щ г ~ (0р 5 t o ) h to = r (s t o ) h to-
Поэтому, если r(S (x )) > 0, то
, ф ___ (6, S (x))
dX dp, dX г (S (я)) *
dP0
Если r ( S ( x ) ) = 0 , то - (x) можно определять произвольным образом,
оА
так как Я-мера и, следовательно, Ре-мера множества таких точек х равиа
нулю. Полагая £e(s) = \|)(0, s)/r(s) и применяя теорему 3, мы получим, что
S — достаточная статистика. <]
П Р И Л О Ж Е Н И Е V
ЗАКОН БОЛЬШИХ ЧИСЕЛ П ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА.
РАВНОМЕРНЫЕ ВАРИАНТЫ
П
Обозначим t n ~ 2 ^ п1
h=I
Теорема 1. Пусть
,гМ| Sft.nl = йп < я < 00’
,гМ(1 £ л ,эт|; lSft.nl > т) - ^ ° - (1)
при п —*■оо при любом х > 0. Тогда для любого е > О
Р ( |5 » | > е) 0-
РАВНОМЕРНЫЕ ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ 435
M6jf» = 0 , М | ^ , г| 2 < о о .
п
Ооозначкм <7^ Kji &j,n*
5=1
Т е о р е м а 2. Пусть выполнены условия Пиидеберга
^ ^ Ф0,а2‘
С л е д с т в и е 1 (обычная центральная предельная теорема). Если
£ь • — последовательность независимых одинаково распределенных
43 6 ПРИЛОЖЕНИЕ V
Фп (0 СХР Т }
при п —*■ОО.
Воспользуемся одпомерным вариаптом теоремы. 1, доказанным в [И ].
Функции ф п (0 п фи (0 можно рассматривать как характеристические функ
ции
М
Е“п—
0, пМ(|®п)2==иМ(gj>п,о))2=соо2сот соо2о>т.
Выполнение условия Линдеберга следует из очевидного неравенства
»м ((5 i,n ’ tt) 2: I (?!,« ’ ©) | > т ) < nM ( | l l n J2; | l , i n | > т ).
s«(°)
равномерно по О е ©о.
Сп(0) = —7 Г ' - а (°)->0
11 Ро (2)
р
м
г( »(0« ) к к ,
— — I > е; > 6 (3)
при всех п.
чины
Рассмотрим случайные величины
а (ХР °«) - Я(°п)
(IIs"» Н
.7= 1
(*>
sup м 0 (a) (XV 0); | а5 ( х ^ 0) | > N) ^ 0
о*(в„) = » м вД в Е 1 , „ - о !. (С,)
п
Тогда наш е допущение о невыполнении (5) будет означать, что 2 п
н е будет сближаться по распределению с Ф 0. Но это невозможно в
о,о •
силу теоремы 2, так как %}, п удовлетворяют условиям этой теоремы. Дей
ствительно, в силу (6) достаточно проверить условие Линдеберга. Для мно
жеств Ai, п — { i а ;(х ь 07г) | > тУп/l) находим
1оц (О)
sup P e M i n ) < sup 3— -»-0
es0 o J e*=0o лт-
i .
яр и n —
> oo. Используя тот факт, что { | 5 i , » l > T }<= U A i, получаем
i= l ’
П Р И Л О Ж Е II И Е VI
НЕКОТОРЫЕ УТВЕРЖДЕНИЯ, ОТНОСЯЩИЕСЯ К ИНТЕГРАЛАМ,
ЗАВИСЯЩИМ ОТ ПАРАМЕТРА
1. Теоремы о сходимости интегралов, зависящих от параметра. Пусть
у ) ) — семейство измеримых функций, заданных на измеримом про
странство с мерой v на нем. Нас будут интересовать условия, при
которых
j Ф (*. У) v {dy) -+ J ф (0, у) v {dy) при t 0. (1)
[ф(г/)г(<7(/)<оо.
Тогда для выполнения (1) необходимо и достаточно, чтобы
( Ф (*. у ) 1 д {1) (у) v Ш -*■0 пРи 1 0- (2>
непрерывна по 0.
Д о к а з а т е л ь с т в о . Используем теорему 1 при ‘У = 9?п , у = х т
V— р п , -ф (*, ж) = л (ж) f t (ж), Л (I) — (ж: f t (ж) < 2/0 (ж)}. Очевидно,- что ус
ловия 1), 2) выполнены. Так как для я (ж) = 1 функцияМ ея(Х ) == 1 непре
рывна, то выполнено (см. (2))
\ f t (ж) цп {dx) -Ь 0
хтли)
при t 0. Но по теореме 1 отсюда следует непрерывность М0я {X) для
любой ограниченной функции я. О
Если речь вести лишь о достаточном условии для сходимости (1) в слу
чае т|:(£, у) г)Д0, у) и. в. при I -*■ 0, то в качестве такового можпо исполь
зовать равномерную сходимость интегралов в (1). Последнюю можно опре
делить как существование конечной меры А, такой что неравенство
ц л ) < б = 6(e) влечет за собой sup ^ |i]'(f, у)|v (ф /)< е для заданного е > 0.
1 А
Если существует интегрируемая мажоранта ф (//) = s n p ф(г, у), то та-
t
кая мера А всегда существует: достаточно положить А (Л) = ф (»/) v {dy),
А
2. Следствия условий (В). Мы докажем здесь лемму 2.16.1 и равном
ную сходимость интеграла 7(0):
sup М0 ( | V (ха, 0) I2; i V (хх , 0) | > N ) '-*■0 , (3>
G '
ш ПРИЛОЖЕНИЕ V I
J /е И Д ^ х ) = 0. (5)
П
Т ак как V (X, 0) = У] V (х,-, 0) есть сумма пезавпепмых случайных вели-
i=l
чип с пулевым средним (см. (5)), то
DqL ' (X, 0) = М0 ( V (X, 0))2 = нМе (V (х1? 0))2 = п1 (0). (6)
при б —*■0.
Итак, мы доказали (4) в предположении, что 1п (6) непрерывно. Но
при п — 1, / п (0) = /( 0 ) , и это предположение выполнено в силу Условий
(Я). Стало быть, (4) верно при п = 1 и, стало быть, верно (51. Но из (5)
следует соотношение (6), означающее непрерывность /(о ). Теорема
доказана.
Т е о р е м а 3. Если множество 0 компактно, функция у / е (х) для
[р] п. в. значений х непрерывно дифференцируема по 0, то непрерывность
7(0) имеет место тогда и только тогда, когда выполнено (3).
Теорема означает, что непрерывность 7(0) в условии (Я) можно заме
нить условием (3).
Д о к а з а т е л ь с т в о . Допустим, что /(0 ) непрерывна, а (3) не вы-
чолпепо. Тогда существует ' у > 0 , и последовательности г - + 0 е 0 , N t «о,
29 А , А . Боровков
442 ПРИЛОЖЕНИЕ VI
такие что
т (t) = МJ | V (х2, t) j2; V (х ; , t) > TVj > f (9)
j /е (*•) Р idx) = 0
и пам достаточно доказать, что при £-> 0
ОТНОШЕНИЕ ПРАВДОПОДОБИЯ В МНОГОМЕРНОМ СЛУЧАЕ
J / 4 = Л - Д у (1.
П Р И Л О Ж Е Н И Е VII
НЕРАВЕНСТВА ДЛЯ РАСПРЕДЕЛЕНИЯ ОТНОШЕНИЯ
ПРАВДОПОДОБИЯ В МНОГОМЕРНОМ СЛУЧАЕ
у = s u p M e | V ( х х , 0 ) |s < оо (3 )
29* ' •
444 ПРИЛОЖЕНИЕ V II
М 2 < сЛ’п*'2,
ft=x
М 2 5* = 2 (4)
h=l ft j,...,ftn
где суммирование ведется по всем целым А-,, А„, таким что 2 /‘Ч =
г
= я, ^ 1 = 1 исключаются, так как = 0). По неравенству Гельдера
л'ч/* _ ,*/'/■
и, стало быть,
h;/s
П K jl< n v = у.
Доказательство.
М
01р =М0|Д-U(X, +и)Z1'8(и)
(и) Is 0
а,
‘Г = 2 - 7 7 - ’ *т = С*Г- ---■ *” )• i0 = 0. (5)
Г—1
так что Р" есть двоичное приближение П | г — t m\ < 2“ my / ~
/ у \ / л -(- £Д N
Обозпачим ф (0 = j . Тогда
СХ)
ф (/) = ф (о) + 2 (<р Н — ф О”1-1)).
7П = 1
4 46 ПРИЛОЖЕНИЕ V II
ф ( 0 < s * а - д ) я т = *>
771=0 ~ ( 8)
sup Ф (0 < «•
1=К0,1
Обратимся теперь непосредственно к утверждению леммы. Нам надо
оценить
Pfi ( sup Z {v,' V n) > е*\ = p e ( sup - ф {t) ^ a \ (9)
J )
при a = ez/s. Неравенство, стоящее под знаком вероятности, означает на
рушение (8) и, стало быть, влечет за собой нарушение одного из неравенств
(6), (7). Следовательно, вероятность (9) оценивается суммой вероятностей
°° / \
:[yTi2m ) C" v*
Следовательно, двойная сумма в (10) будет оцениваться значением
ОО
2 2 - n ( s - h\ - m\ ( 11)
m—i
h—s
Выберем q— 2 2S < 1 . Тогда ряд в (11) будет сходиться, и все выражение
(11) будет иметь вид CA,*^Asa~®. Первое слагаемое в (10) оценивается в
силу теоремы 2.28.1 и неравенства Чеоышева:
Полагая Д=е ЯП2£Г(0), С4*># упитывая, что а~а — е~1 п считая, не ограни-
ОТНОШЕНИЕ ПРАВДОПОДОБИЯ В МНОГОМЕРНОМ СЛУЧАЕ 447
Ф
Pe’f sllP % (f/ У й ) ^ ez\ ^ ck rh~ l c h ysy {е~ г' 2 e-z ) e~r 2f’g(()\
Р 0 ( sup Z ( г /Д /п) > ez) < cf{ch sy (e z/2 -f-e z) (r г-j- j ) h г е (г+Л2Р?(в)#
\M 5^ ’ j=0
Т ак как sup (г +
r,j
и J
. j
« -М е ж г + Д » ^ ]/» ^
j
е-а*е>Д/,
ограничены постоянной c(p £ (0 )), зависящей лишь от Р£(0), то полученпое
выражение не превосходит cfl $ус ((3£.(0)) е_ г" ^ (6)/2 (e- r ''2 -f- е~ г), где
С(Р#(6)) < с (РёО < °°> если #(0) > g > 0 прп всех 0. <j
Таблица I. Нормальное распределение Ф0д
X 0 i 2 3 4
Т а б л и ц а I (п р о д о л ж е н и е )
V 1 5 1 1 7 1 8 9
Ф (Яе) = Ф 0Д ((Яе? ° ° ) ) = £•
Таблица II
Таблица III
1 2 3 4 5
Т а б л и ц а III (п родолж ен и е)
h
6 7 8 9 10
X
- ■ 8
,2381 ,3326 ,4335 ,5342 ,6288
9 ,1736 ,2527 ,3423 ,4373 ,5321
10 ,1246 ,1886 ,2650 ,3505 ,4405
11 ,0884 ,1386 ,2017 ,2757 ,3575
12 ,0620 ,1006 ,1512 ,2133 ,2851
13 ,0430 ,0721 ,1119 ,1626 ,2237
14 ,0296 ,0512 ,0818 ,1223 ,1730
15 ,0203 ,0360 ,0592 ,0909 ,1321
16 ,0138 ,0251 ,0424 ,0669 ,0996
17 ,0093 ,0174 ,0301 ,0487 ,0744
18 ,0062 ,0120 ,0212 ,0352 ,0550
19 ,0042 ,0082 ,0149 ,0252 ,0403
20 ,0028 ,0056 ,0103 ,0179 ,0193 -
21 ,0018 ,0038 ,0072 ,0127 ,0211
22 ,0012 ,0025 ,0049 ,0084 ,0151
23 ,0008 ,0017 ,0034 ,0062 ,0108 *
24 ,0005 ,0011 ,0023 ,0043 ,0076
25 ,0003 ,0008 ,0016 ,0030 ,0054
26 ,0002 ,0005 ,0011 ' ,0020 ,0037
27 . ,0002 ,0003 ,0007 ,0014 ,0026
28 ,0001 ,0002 ,0004 ,0010 ,0018
29 ,0001 ,0002 ,0003 ,0007 ,0013
30 ,0001 ,0002 ,0004 ,0009
'
452 ТАБЛИЦА I I I
11 12 13 14 15
16 17 18 19 20 Нй0(х)
ОО
Таблица IV
1 2 3 4 5
Таблица IV (продолжение)
1 2 3 4 5
Т а б л п ц а IV (продолжение)
С 7 8 9 19
Т аб л и ц а IV (продолжение)
и 12 13 14 15
Таблица IV (продолжение)
16 17 - 18 19 20
Г Л А В А 1
Г Лл В л 2
§ 2. Некоторые другие параметрические семейства описаны в книге
Уилкса [61]. Весьма полное исследование распределении членов вариацион
ного ряда выполнено Б. В. Гнеденко. Полное изложение результатов и об
ширную библиографию по этому поводу можно найти в книге Дейвида [25].
§ 4. Метод моментов исторически является первым регулярным мето
дом построения оценок. Оп был предложен К. Пирсоном в 1894 году,
§ 5. Метод минимума х 2 был предложен Р. Фишером в 1922 году.
§ 6. Метод максимального правдоподобия в частных случаях приме
нялся еще Гауссом. Как общий метод получения оценок он был предложен
Р. Фишером в краткой заметке в 1912 году. Позднее, в 1925 году в клас
сической работе [65] им ж е были изучены асимптотические свойства о. м. it.
§§ 7, 8. Излагаемые подходы к сравнению оценок являю тся общепри
нятыми. Доказательство леммы 2.7.3 заимствовано из [37]. Понятие эффек
тивной оцепки было введено Фишером в 1922 году в [64].
§§9, 10. Фундаментальное понятие условного математического ожида
н и я было введено А. Н. Колмогоровым в 1933 году в классической работе
[35]. Свойства условных распределений детально изучены в [22], [29], [79].
§ 11. Байесовский подход широко использовался еще в прошлом веке Лан-
ласозЕ, Этот подход подтвергался критике со стороны Фишера, и в 20-х,
30-х годах нашего столетия центр тяжести исследований переместился на
эффективные и асимптотически эффективные оценки. Затем, но мере того,
к ак стала осознаваться фундаментальная роль байесовского подхода, инте
рес к нему вновь стал возрастать.
„ Понятие минимаксной оценки вошло в математическую статистику вме
сте с теоретико-игровым подходом, развитым в работах Бореля (1921) и
Дж. Неймана (1928), теоремы 2.11.1—2.11.3 были получены Ходжесом и Ло
маном [70].
§ 12. Фундаментальное понятие достаточной статистики было введено
Р. Фишером в [64] в 1922 году. Р. Фишер [64] и позже 10. Нейман [45]
предложили простой критерий, обнаруживающий существование и вид доста
точной статистики. Этот критерий носит название факторизационной теоремы
Неймана — Фишера и представлеп в теореме 2.12.1. Строгое теоретико-мно
жественное доказательство теоремы Неймана — Фишера было получено
лишь в 1949 году Халмошем и Сэвиджем [68]. •
§ 13. Понятие достаточной о-алгебры широ, чем понятие достаточной
статистики. Необходимые и достаточные условия для их совпадения при
ведены в [30]. Конструкция достаточных разбиений и теорема 2.13.1 свя
заны с работой Лемана и Шеффе [41], посвященной выяснению условий
существования и построению мннимальпых достаточных статистик. К рат
кое изложение этой статьи можно найти в [30]. Доказательство теоремы
2.13.2 принадлежит И. С. Борисову.
§ 14. Теорема 2.14.1 была получена независимо Блекуэлом [6] (1947),
Рао [53] (1945), [54| (1949) и Колмогоровым [34] (1950). Теорема 2.14.3
принадлежит Рао [54] (1949) и Блекуэлу [6] (1947).
§ 15. Экспоненциальное семейство упоминалось еще Фишером в [61].
Теоретическое значение этого семейства было осозыапо п 30-х годах в р а
ботах Питмена, Купмопа, Дармуа. Именами последних иногда и называют
экспоненциальное семейство. Теорема 2.15.2 доказана Леманом ([40],
стр. 183).
§§ 16, 17. Неравенство Р а о — Крамера иногда называют такж е неравен
ством информации. Оно принадлежит по-с.уществу Фишеру [65], хотя в
приводимой форме он о‘было получено независимо Фреше [67] в 19-43 году,
Рао [52] в 1945 году и Крамером [36] в 1946 году.
Условия регулярности, нужные дли выполнения неравенства, в руко
водствах но математической статистике трактуются не всегда аккуратно.
Мы имеем в. виду условия, обеспечивающие законность дифференцирова
ния по параметру под знаком интеграла. Доказательство этой законности
БИБЛИОГРАФИЧЕСКИЕ ЗАМЕЧАНИЯ 459
часто содержит пробелы (см., например, [30]), либо отсутствует вовсе (на
пример, в [19]). В ряде случаев она оговаривается в виде условия ([1 9 ]),
что неудобно для проверки в реальных задачах.
Условия регулярности, принятые в книге, весьма просты, хотя, но-ви
димому, не являю тся наиболее общими (ср. с [31]). Тот факт, что при этих
условиях можно дифференцировать под знаком интеграла, доказан в При
ложении VI, написанном на основе результатов А. И. Сахапенко.
Различные обобщения неравенства Рао — Крамера см. в [30], [74]. По
нятие информации (Фишера) было введено в [65]. При доказательстве тео
рем 2.16.1А и 2.17.1 мы следуем книгам [30], [31].
§§ 18, 19. Идея использования инвариантных соображений принадлежит
Хотеллингу и Питмену. Значительный вклад в разработку теории внес
С. Стейн. Основное содержание теоремы 2.18.1 принадлежит Питмеиу. При
ее доказательстве мы использовали изложение в [30], [31]. Минимаксность
оценки Питмена была установлена Гиршиком и Сэвиджем.
§ 20. Результаты этого параграфа были получены автором совместно
с А. И. Саханеико [13]. Некоторые неравенства при более жестких огра
ничениях можно получить также из работ [24], [73].
§ 21. Расстояние К ульбака— Лейб гере в параметрическом случае назы
вается также функцией информации Кульбака — Лепблера. К этому расстоя
нию независимым образом пришел И. Н. Санов при описании вероятнос
тей больших уклонений эмпирического распределения. Идея широкого ис
пользования расстояния Хеллннгера для изучения свойств отношения
правдоподобия нами заимствована из книги Йбрагимова и Хасьминского
[31]. На результатах этой книги базируются и доказательства основных
теорем § 23. Доказательство теоремы 2.21.3 было существенно упрощено
А. И. Саханепко.
§ 22. Теорема 2.22.1 была установлена Чепменом п Роббинсом в 1951 го
ду в [75] и Кифером в 1952 году в [32].
§§ 23—25. Излагается материал лекций, сильно усовершенствованный
после появления книги Ибрагимова.и Хасьминского [31]. Основные усорер-
шенствования связаны с систематическим использованием расстояния Хел-
лингера для оценки M^Z* “(и).Предложение использовать ^Me|( Z 3 4(ы)У|<йг
для оценки sup Z(u) (см. теоремы 2.23.1, 2.23.2) принадлежит А. И. Саха-
U
пенко. Асимптотическая нормальность и асимптотическая эффективность
о. м. п. была установлена еще Фишером [65]. Весьма общие условия асимп
тотической нормальности о. м. н. получены в [31].
Асимптотическая нормальность апостериорной плотности (или отно
ш ения правдоподобия) была обнаружена С. И. Бернштейном в 1927 году.
Теорема 2.25.4 принадлежит Бахадуру [1]. Асимптотическая байесовость и
минимаксность о. м. п. легко получаются благодаря результатам § 2.20. Ра
нее асимптотическая байесовость о. м. п. устанавливалась при более жест
ких ограничениях на плотность априорного распределения.
При доказательстве теорем 2.24J, 2.24.2 мы использовали некоторые
усовершенствования, предложенные А. II. Саханенко.
§ 26. Излагается один из вариантов численного метода Ньютона — Раф-
сопа отыскания экстремума функции. Более подробное изложение см. в
[30]. Пример 3 заимствован из книги Рао [54].
§ 27. Исследование состоятельности о. м. п. было начато в 30-х, 40-х го
дах в работах Дуба [28], Вальда [17], Вольфовица [21J, Крамера [37].
Основные условия состоятельности в [17] включают в себя (помимо усло
вий (Ай), (Ас), (А0)) принадлежность f t (x) классу D0 и интегрируемость
J 1n /f ( .r ) /0(j)|»№ ).
сходимость
ГЛАВА 3
Первые отдельные применения статистических критериев восходят к
Лапласу (конец 18 века). Систематическое использование критериев для
проверки гипотез начинается с работ К. Пирсона, предложившего в 1900 го
ду критерий х 2- Фундаментальные понятия ошибок первого и второго рода
были введены Нейманом и Пирсоном в 1928 году в [47]. Этими же автора
ми впервые была осознана роль альтернатив для рационального выбора
критерия. В итоговой работе Неймана и Пирсона [48] развита теории
р. н.м. к.
Систематическое изложение теории проверки гипотез содержится в
книге Лемана [40].
§§ 1—3. Фундаментальная лемма Неймана — Пирсона получена в [48].
Теоремы 3.1.1, 3.1.2 можно извлечь из книги Блскуэла и Гиршика [7]. Тео
рема 3.2.1 содержится в книге Лемана [40]. Теорема 3.3.1 о больших укло
нениях принадлежит Крамеру (см. [11]). Оценка качества критериев, сви-
занная с вероятностями больших уклонений, легла в основу понятия эф
фективности критерия но Бахадуру. Итоги исследований в этом направле
нии изложены в [3].
Роль статистики эффективного вклада была отмечена еще в 1925 году
в работе Фишера [65]. В дальнейшем подход, связанный с рассмотрением
близких гипотез, интенсивно развивался в работах Ло Кама, Русаса, Чиби-
сова (см. такж е комментарии к §§ 3.14, 3.15).
§ 4. И злагаемая общая концепция статистических критериев является
общепринятой (см. [37], [40]). Понятие р .н .м . к.было введено Нейманом
и Пирсоном в [48]. Байесовский подход использовался еще Лапласом в
19 веке.
§§ 5—8. Осповные результаты этих параграфов взяты из книги Лема
на [40]. Изложение такж е близко к этой книге, но отличается тем, что
основано на байесовском подходе, а не на обобщенной лемме Неймана —
БИБЛИОГРАФИЧЕСКИЕ ЗАМЕЧАНИЯ 4G1
Пирсона (лемма 3.5.2, см. такж е [40]). Это упрощает изложение и делает
его более цельным.
По поводу доверительных множеств см. комментарии к §§ 2.31, 3.32.
О возможности перенесения основных результатов на случайные про
цессы см. книгу Гренандера [23].
§ 9. Теорема 3.9.1 принадлежит Ходжесу и Леману [70].
§ 10. Фундаментальная роль отношения правдоподобия в математиче
ской статистике была выяснена в работах Неймана и Пирсона [47], [48].
К. о. п. посвящена обширная литература. Попытки установить тс или иные
свойства асимптотической оптимальности этого критерия содержатся в ра
ботах [2], [17], [49], [01], [69].
§ 11. Основной вклад в развитие теории последовательного анализа
принадлежит Вальду [18]. Наиболее компактное изложение главных ре
зультатов, которому мы следуем в кппге, можно найти в [40].
§ 12. По поводу критериев Колмогорова и to2 см. § 1.8 и комментарии
к нему. О некоторых модификациях критерия Колмогорова, дающих наи
большую возможную мощность, см. [15]. Критерий Морана был предложен
в [44]. Его мощность для близких альтернатив изучалась в [20]. [70].
§ 13. Асимптотическая байесовость к. о. п. установлена в работе авто
ра [10]. Результаты о предельном распределении отношения правдоподо
бия при основной гипотезе принадлежат Уилксу [60] и Вальду [16] (см.
такж е книгу Уилкса [61]). Идея замены сложной гипотезы усредненной
использовалась Вальдом. Асимптотический вид байесовских критериев со
держится в [42]. См. такж е комментарии к §§ 28, 29 гл. 2.
§§ 14, 15. Основные идеи, связанные с отысканием асимптотически оп
тимальных тестов для близких гипотез, изложены в работах Вальда [16],
Ле Кама, Русаса (см. книгу Русаса [57]), Чпбисова [77]. О возможности
перенесения основных результатов на случай бесконечномерного парамет
ра (на случайные процессы) см. [14]. Форма изложения §§ 14, 15 с цити
рованными работами связана мало. Редукция исходной задачи А к задаче
В для параметра нормального распределения, при отыскании оптимальных
критериев для основных типов задач, рассмотренных в § 14, содержится
в работе Вальда [16]. Утверждение теоремы 3.15.4 о распределении стати
стики 2 ln fli(X ) при гипотезе-Я, можно найти в [61]. См. также, коммен
тарии к §§ 28, 29 главы 2.
§§ 16, 17. Критерий у 2 был предложен К. Пирсоном в 1900 году. Ему
посвящена обширная литература (см., например, специальную монографии»
Ланкастера [39]). Обсуждение различных свойств оптимальпост и см. в [1GJ,
[49], [61], [69] и др. О поведении мощности критерия х2 иРн увеличении
числа групп см., например, [12], [78]. Примеры 3.16.1, 3.17.2 заимствова
ны из книги Крамера [37], пример 3.17.1 из книги Рао [54].
§ 18. Начальный этап в изучении устойчивости статистических реше
ний проследить трудно. Более поздние исследования имеют в своей осно
ве работы Тыоки, Ходжеса, Лемана. Обстоятельный обзор этого направле
ния представлен в работе Хыобера [72].
При сосгавлении таблиц I —IV использовалась книга Большева и Смир
нова [8].
ЛИТЕРАТУРА
несмещенное 332
Доверительный интервал 254 Лемма Неймана — Ппрсопа 282
Достаточная оценка 140 — — — обобщенная 313
— статистика 127 Логарифмическая функция правдо
— о-алгебра 133 ' подобия 89
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 4 71