Ru
Общероссийский математический портал
Параметры загрузки:
IP: 209.205.217.124
20 июля 2022 г., 11:37:16
КАЗАНСКИЙ ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ
ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. В. И. УЛЬЯНОВА-ЛЕНИНА
Том. 125, кн. 6 Ученые запаска 1965
И. Н. ВОЛОДИН
ВВЕДЕНИЕ
Довольно часто на практике мы располагаем большим числом
малых выборок, причем все эти выборки есть результат наблюдения
одного и того же явления, протекающего при различных внешних
условиях.
Примером таких выборок "могут служить данные о сроках службы
однотипных изделий, эксплуатируемых на разных предприятиях; точ
ность измерений, производимых одним и тем же прибором при раз
личных условиях измерений; механические характеристики, снятые
с различных участков однотипных изделий; наконец, нестабильность
условий, при которых извлекается выборка, заставляет нас разбивать
выборку на небольшие группы.
Ввиду малости каждой выборки трудно что-либо сказать о каж
дой в отдельности генеральной совокупности, из которой извлечена
выборка. Однако вполне разумно высказать гипотезу, что все эти
выборки подчиняются одному и тому же закону распределения, за
висящему от некоторого числа параметров, которые могут быть раз
личными для разных выборок.
Таким образом, перед нами стоит задача проверки статистиче
ской гипотезы о том, что все выборки принадлежат некоторому
классу генеральных совокупностей, подчиняющихся одному и тому
же закону распределения и отличающихся между собой разве лишь
значениями параметров этого распределения, которые нам неизвестны,
и относительно их никаких гипотез не высказывается.
Дадим более строгую формулировку этой задачи.
Дано 5 выборок объёма пх,..., ns:
хп , ..., xin^ (/ = 1,..., s).
(ц у\
\ т
П S
2 I
Гипотетическое распределение всегда будем обозначать через
JF(P, X), а соответствующую функцию плотности через / ф , х), при
этом av — v-ый выборочный момент, /rcv — v-ый выборочный централь
ный момент.
Через Р(А/И) будем обозначать вероятность события А в пред
положении справедливости гипотезы Н.
4
— нормальная (0,1) функция распределения. Г (и) и В(и, г>) — соот
ветственно гамма- и бэта-функции Эйлера,
Г(v i 1)
С"
Г (и +- 1)Г(и — и + 1)
dx
С =-. — ф(1) = 0-577216 -~ постоянная Эйлера.
Глава I
eg (л:) 4 d
где g(x) — монотонная функция и g"1 — функция, обратная к ней.
Следовательно, в этом случае задача отыскания инвариантных ста
тистик сводится к отысканию инвариантов группы дробно-линейных
преобразований.
П р и м е р . Пусть случайная величина имеет распределение типа
^\\~) г Наиболее распространенные распределения этого типа—
распределение Вейбулла и Паретто. Тогда g(x) = In x и С = In 5 имеет
распределение типа р(*'
\ ь
Все статистики, инвариантные относительно преобразования xi—>
Y . /у
—>— , ( * = 1 , ..., п) есть некоторые функции от п — 2 переменных:
х х
Х2 — Х\ п _i ~~ \
и
1 — > ••• » ип—2 —
х x
Хп \ %п -l
poi
1 1
где с при заданном уровне значимости е находится из уравнения
P{t>c\H0\ = i.
Вероятность ошибки второго рода, то есть вероятность принять
гипотезу Я0 в случае, когда справедлива гипотеза На , равна
a) = / > { T < c j # a }.
Обозначим через ат, о^ рз соответственно среднее значение, дис
персию и третий абсолютный центральный момент случайной вели
чины In pJPo в предположении справедливости гипотезы Hz, (т = 0, а)
и пусть:
A. В выборочном пространстве, индуцированном статистикой т^.,
найдется множество Xt такое, что pai(vi)>0 для всех ri.^-Xi и всех
а в некоторой окрестности точки 0.
B. Случайная величина т асимптотически нормальна с парамет-
s s
рами т т = 2 а т / и
^ " S 0 ? / (ДЛЯ этого достаточно потребовать вы-
1 1
полнение условия Ляпунова, 110], стр. 241): lim /?х/бт = 0, где /?* =
1
C. Функции pai{r^ ( * = l , . . . , s ) и их частные производные до
второго порядка включительно непрерывны по а в окрестности точки
a - 0.
D. Функции [чМ, a)fpa/(vj), (v = 0, l, 2) интегрируемы равномерно
при всех а из некоторой окрестности точки ог==0.
Тогда [15]
2аа ~ - 2а0 ~ * ~ ^ = а*М0 {[(^- In P a (l))J} + О И , 0 Л)
p 3 a-pg = a W o { [ ( ^ l n / i e ( 4 ) ) o , J | + Q(a4)f
где знак ~ означает асимптотическое равенство при а—»0.
При я близких к нулю, отбрасывая члены порядка О (а3) и по
лагая
а м 1прМ
'= * °{(т. )$'
запишем следующие выражения для вероятностей ошибок первого
и второго рода:
Ев/
1
с+
е= 1 Ф +.?о(*. с>»
•":5>
(L2)
со = ф I _L_ + ? (S> C),
j/s«
где 9о и ?в ПРИ выполнении условия 5 стремятся к нулю при s—+oo.
В этом случае при достаточно больших s, отбрасывая 9о> получаем
выражение для с:
* = '-
••-*4[&""-)J}-
Тогда
*. + С \з 1
и общий объём наблюдательного материала, необходимого для раз
личения гипотез Н0 и На по выборкам объема п, равен
*=«~(-Ц^-)Ч, *,,—£- (1.4)
З а м е ч а н и е . В случае выборок разного объёма положим
M[(i'"'-)JI-
Если сл = max с не зависит от 5, то (1.4) можно рассматривать как
верхнюю оценку необходимого объёма наблюдательного материала.
Введем еще один показатель эффективности при выборках оди
накового объёма (см. [6], § 6).
Пусть по одной выборке объёма N
х1У...,х~ (1.5)
мы хотим различить две гипотезы:
Я0 — выборка (1.5) есть N наблюдений случайной величины S,
имеющей функцию плотности /0(fJ, х);
На — выборка (1.5) есть N наблюдений случайной величины S,
имеющей функцию плотности / а (Р, х).
Параметр (J предполагается известным.
Тогда, при некоторых ограничениях на. плотность / а (Э,х), число
наблюдений, необходимых для различения гипотез Я0 и Яа при за
данных s и о), определяется по формуле (см. [15], § 1):
л-(-4^)4.
где »-»(?)-.*„{[(£in/.)J].
Введем величину
Г, = In ,
п с»
W (Х V/ о /АЧ ' " ' Т+ЛГ<Г1
= — ( « - 1 ) ^ , ( ^ . - 1 ) [1+0(а)],
й(*/)-й№)-т л »{Е^-т- 1 т 1л П +
1
S'.('H,^(^J
Для того, чтобы выяснить смысл коэффициента в правой части
этой формулы, положим Xj = . • >=\s = \. Согласно формулам (1.6) и (1.7)
е-п\ УП У , если верна Я 0 ,
У-
п
СУ (1 — аХ)~*~ (ак)>\ если верна Я , .
— + *'- 1
Поэтому
и, значит,
М,1%т~\)}~8Г1^~^(±^-у, (. = 0, а).
1
]\ = sn^ — , (а —* 0)
№ П-1 \ а )
Если бы для различения Я 0 и Я а использовалась одна единствен
ная выборка объема Л, то легко показать, что статистика
лг
Т = In Р а (к) - In Р0 (к), (к = S * , )
1
|ПП
/=1 А=1
/о On/» */*)
(2.1)
In - > с.
/= 1 А=1 /n(?J/. */*)
Таким образом, задача отыскания инвариантных статистик заме
нилась задачей отыскания подходящих оценок мешающего параметра.
Найдем такие оценки в случае гипотетического распределения вида
,/х — а
) при условии, что у этого распределения существуют и
конечны первые два момента.
Оценивая а и b по методу моментов, то есть решая относи
тельно а и b систему
ос
X — а
J'" ( dx = а2у
7/ = In (2.2)
получаем требуемую критическую область т = V] Т/ > с-
В дальнейшем для простоты будет рассматриваться случай
равных выборок. Исследование неравных выборок можно провести
по той же схеме, что и в § 1.1.
А. А. Петров [6] в предположении существования третьего
абсолютного момента случайной величины 7/ как при справедливости
гипотезы // 0 , так и при справедливости гипотезы На, установил
следующую формулу для оценки числа выборок, необходимых для
различения гипотез Н0 и Я а при заданных вероятностях ошибок
первого и второго рода:
*е б 0 ь t* б« (2.3)
Д а — #о
X - ( ^ ) ' ' -
ж ^-/.(-.^^)Ls rf-'11 / a (•**)
J
В случае гипотетического распределения вида F*(x — a)—
yk(a, Х) = та + xk~ x, а в случае F* (— )—yk(a, X) = та 4*- .
\&/ л*
Как и в § 1.1, имеет смысл ввести величину
sn = Ьп.пВ = ся9, сп = п-Вя,
К
N
2 1 (П + (Я + 3 ) (Я + 1)2 (Я 3 ) (П + 5 )
S ~ (^ + *ю) ^ ^ +
(2.4)
Пусть tk = — . Тем же методом, что и в § 2.1, получаем:
Ъ = 2 In [1 + а,Я, (О + а2Я2 (/,) + /? (а, tk)\ =
= в1ЕЯ, (tk) + а2 Е Я2 ( ^ + max (orf, еф S /?, (а, /ft),
т Ч т Н ' *.*>в.
альтернатива #« , а = ( а и ?2)
\«2 + 1
bJ \ bJ ft /a, + 1 \ V&/
4<х2 + 1 )
15
Это распределение, введенное Стейси [14], содержит в себе как
частный случай гамма-распределение (а2 = 0), распределение Вейбулла
(aj == а2) и многие другие.
В соответствии с § 2.1 имеем для мешающего параметра оценку
fte = — , где
W 0 = 1,
О П
( / t - 1 ) (2n + 1) n i ~ i
+ a; — T — - я ф (л)~
ni 1 6
71 (/I f 1) I- (2.5)
Имеем:
ч 1
Ti = /t(a t + 1) In *г+^ +«ln «+
'a, + 1 '
\a2 + 1 / \a2 + 1 /
»)tl/ ou-t-1
a,S In 4^
«1 + 1 Л 4f
*2 + 1 /
L \«2 + 1 / J
получаем
« = «Ы. <* = 0, а),
а. — Оо = Af. { т*} — ЛГо
Разложим ?й и / а (х) в ряд Тейлора в окрестности точки (0, 0):
/« (х) = е-* [1 + а, (С + In х) + а2 (1 — С - A- In JC) -f
+ max(a2, оф/?(а, x)],
I = a, [ J In x„ - n In (5>A) - 2 ^ 1 - a 2 S ^ In 4 1 +
(f-0"',
с. = ( — - 1 1 9
= -^-.
А-495.-2 17
И/
81
0 0 0 0 1 0 С О О О Ч О С Д ^ О : Ю > - О С О С О Ч О ) С Л ^ С О Ю
оооооооооооооооооооооо»—чо
G5 0 J О СО ^ <-> Q >-'-^OiCOOJt^^O^COO^-^tOCO^Crtai
II*
'ЮЬОЬОКЭСО^ОСл
о
О^ЮЮС04^^СЛСлСлСЪО>^С»СООЮСлС04^Сп(ХКЭ
О05О004^СЛ"0>—'Hf^CDb^cOC^CnCTiCOOOCOCD-ObO^OO
оооооооооооооооооооооо
b b b b b b b b o ^ t - ' ^ M Ml M s M t O t o 1 C d ^ i o o :
•Й*СЛСГ>СЪ-^ООСОСОСОО>— *-*l 04^Cn^'— СЛ4^СООЗОС
<-*05000СД050^00С000000005СОО(ООСдООСХ! II -
оосс-о^-о^сосоюослоо^со^юоооо О ц,
Ч 0 ) Ю Ю С л С л Ю ' - 0 0 С 0 0 0 С л С 0 О С л Ю ^ н - 0 0 О О 5 0 0
о«
О CD
ОС04^СЛООО»-ЧОС04^а5000СО^ЮОЮ^ООООО о
Онй*4^С0ОС0СПСл^С04^С0^^СЪсО0>ЮСЪСХЭС0О
ОСЛООСЛ«-ЮС00^01^00000ЮФ.СОС005ЧОСОО
4
Ю Ю
С Л О О О — Ю Ю С О С О ^ ^ С Л С л С ^ О О С О О Ю О Ю С л О Ч ^
ОоЮ^4^СлС©ЮС^ОСЛ>-^с0^ОС0С0СЛнР^С^00ЮС0С7>
ел»—^сл04^4^оо^^соаэослсо^юсъсо»^а>а>-^ 11
1
сяо^оюос^оооо^ччч'Ч-очюосоооюоюсла)
СЛООСО^СЛ-^-^ООСОСОО»—1Ю4^О500»—'СОСХЭСЛСЛГО^СО
О С п с ^ 4 ^ С л ^ Ю С л н - О ^ ^ О ^ 4 ^ С л Г О ^ 0 5 й ^ С Г ) 0 0 а 1 С 0
О О О О О О О О О О О О О О О О О О О О О О » - ^ » - '
05CT3G^C^<^C^O^O^C5G50^050^0^0^"^'<l'<J"<lfc<IOOOOOCo
^Сл<ССЪ10Ь04^^0СО^Ю^4^»-^ОСХ5СЪелЮСО^ООО
О Ф С О Ю Ч Ч Ю С Й С О О Ю С О С О О О С л О О О Ч ь - ' ^ Ч ^ II CD
СлО\
О 4 ^ ^ О ) Ч 0 0 С 0 С £ ) О » 1- - » - 1 Ю С 0 ^ а 1 Ч ' - - Ю О 5 » - ' 0 0 О ^ С д
40000COC04^CO*'»- 0005CJ;cOi-'OOOCnOOCOi-'^bO
^СЛ^СОЮОО^СООО^СОС^С^С^Ф-ЮНЙ-^ОООСЛО^»—'
СоООСОСОСОО^С^4^4^4^4^4^4^4^4^4^ь^4^СлСлСл0200|4^ о
^ G > 4 0 0 0 0 C D C 0 O O O i - l t O t O W ^ 0 i O i 0 0 O ^ C D C ) 0 a i t O я
^ О С 0 О Ч Ч С 0 Ю 0 5 00СлОСй00ЮС0 0 5 а к 0 Ю ^ Ю Ю ^
С О О С Л С Я О Ю С О С О О О С О О Ю ^ Ч С Л С П С О С Л С П О С ' - ' С Л — СО
ОоаЮОС^СпОСОСОСлОО)ЮСоОСоа;СОС^СЛ^Сл4^С^
II * f
рёй
4 ^ £=» В
COtT щ
чоооооооосооюазююсоооооо»-» * Ю СО СЛ СО ОО
СОСЛОООСОЮЮСО^Ф-О^ЧОООЮСЯООЮООСЛЧООСОО
СОС75СП»—'СГ.ООСО^-' - ^ » - ^ С О - < 1 Ф - С л О > - * 4 ^ 0 ^ 1 С Т ) О С Г ! ^
0 ; О С о С Л С Л ^ Ю К Э С о К 3 ^ 4 * - " * - 4 0 5 ' - - а 5 СП С Т 5 С Л 0 0 » — ' С О С 0 4 ^
ID
М)-ЬОЮЮЮЮМЮЬЗЮЮК:Ю10СОСОСОСОС0^4^СЯОО
^ С С О » - 4 Ю С 0 4 ^ С Л С Л С Л С Л 0 5 Ч Ч С О О > - ' Ю ^ Ч О С Л ^ О
О С О С О О О С 47 5 С О Ю » - А С Л * < | С О » — ^ с О ^ м О Ч О О н - ^ C D ^ о
00^СлОЧ»- 004^СЛСГ;<100^СОО»-'ОЮСЮЮ^С0»-'
2
' Ю Ю Ю Ю Ю М Ю О : С О С Л
О С 0 4 ^ С Л С 7 5 С Т ) - < 1 ^ 1 0 0 0 0 0 0 С Х ) С О С О О » — ' K D С 0 4 ^ С^ОО Ю С О Ч
О ^ ^ С Л ^ С Л Ю С О ^ о о ^ С П С О с О ^ ^ О Ю ^ С О О ^ С о О ^ - 1
В случае различения экспоненциального типа и тина Вейбулла
(ai = а 2 ):
П —-1 /т£ \_
с„ = п + 1 \ 6 п 7и2 6
~ + (1~С)2
о
kn =
/I — 1 /712 1 \
1, /eoo = i + 4-(i-c)2
П + 1\ б ^ /I /
/1-1
Г ( и
V а2+ 1
(ff.,)"
= («2 + D' «1+1
/«t + 1 \
Г"
\«2 + 1 / 1 + S Ф ) МП +1
в (Я, а)
где
'(•••>-*{№).+-.(^)J}-
= ^{e1[Sin^-«in(i + 2^)] +
1
п—1
2 ** in **
+ а2/г In 1
1 /г—1
2 1 ^ In л ^
= 0? I «i [2 In xk — /г In (SAT^I] + V* Tin (EJCA)
2л* )•
( " £ • 1 п л ) = я* ^+пС+^1п ч
~ я 1п ^ ^
что с точностью до неслучайных слагаемых совпадает с главными
членами разложения (2.6) при «2 = 0. Следовательно, значения сп и kn
и при уел вной критической области остаются прежними.
§ 2.4. Различение равномерного типа
и близкого к нему бэта-типа
Гипотеза Н0:
If (£Л = 1, 0<х<Ь,
b J0\ b J b'
гипотеза // а , a = (al5 a2):
bJa\bJ b В(Я1 + 1, a 3 +l) 4 6 / \ b)
Оценка для мешающего параметра &* = т а х ^ , ... , xtt) = х(пК
Покажем, что объем наблюдений, необходимый для различения
вышеприведенных гипотез, выражается формулой:
N~(t, + t„)2 " + «| + 2a j a a (l-|)]x
п-\\
п—\
± 1
xU
I
+ a!(l
1
\
+ -
г L * ]
n — \Ldi
+ -r
п +-1
п(п — 1)
3 (я — 2)
4/7 ( / г - 1 )
3
2 (л —1)2
1 я*
п — 1 6
fc=l 1= 1
Имеем:
Т/ = (л - 1) In Г (a, + <x2 + 2) - (n - 1) In Г (a2 + 1) -
n-l n-\
_ > _ 1 ) 1 п Г ( а 2 + 1)+ « ^ 1 ^ + ^ 1 0 ( 1 - f - ) ,
1 1
20
где xv ..., х„_1<х(п).
= ф (2) - <J» (1) + In л = 1 + In x,
d<Xi
<r=0
din/.
Ф (2) - Ф(1) + In (1 - *) = 1 + In (1 - x).
«=0
Следовательно,
1 1
a Л+ 1ПХ
X l( J] *) + «2 (^ + J ] 1П (1 - ЛГА))1}
02 = f ( a + l ) , a2 = f ( l ) = | ,
О
=7lf(l)-
s[ 7-1п/.(Л(«,^))'
-2ехрГф(1) + ^ (1)^-Л Ф'(1) + 1 *"(1) ^*~*
2 |ЛбГ(!) 5
7- , n AW а=0 б
ЗАКЛЮЧЕНИЕ
2"^
м
><
J П/о(М/*)<«о(Э)
В случае, когда /?а(3) и /?0(Р) а priori неизвестны, можно рас
смотреть оценки мешающего параметра по каждой выборке в пред
положении справедливости гипотез Н0 и На и затем по выборкам
?о/ и К/» ( ^ 1» *•• ' 5) высказывать какие-либо гипотезы относительно
/?о(Р) и Я.(Р).
ЛИТЕРАТУРА
1. N. А г l e y . On the distribution of relative errors from a normal population of
errors, K. Danske Vid. Selsk., Mat-fys. Medd., 18, 3, (1940).
2. W. G. D i x o n . Analysis Extreme Values, Ann. of Math. Stat., 21, (1950),
488-506.
3. W. G. D i x о n. Ratios Involving Extreme Values, Ann. of Math. Stat., 22,
(1951), 6 8 - 7 8 .
4. А. А. П е т р о в . Проверка гипотезы о нормальности распределений по малым
выборкам. ДАН СССР, 76, (1951), 355-358.
5. А, А, П е т р о в . Проверка гипотезы о типе распределения по данным малых
выборок. Московский Инженерно-физический институт. Сборник научных работ
кафедры математики. Атомиздат, 1, (1958), 121—136.
6. А. А. П е т р о в . Проверка статистических гипотез о типе распределения но
малым выборкам. Теория вероятностей и ее применение, 1, 2, (1956), 248—271.
7. И. Н. В о л о д и н . Проверка гипотезы нормальности распределения по малым
выборкам (многомерный случай). Вероятностные методы и кибернетика, Казань, 3,
(1964), 2 1 - 2 5 .
8. Л. П. Э й з е н х а р т . Непрерывные группы преобразований. ГИИЛ, (1947).
9. Н. Г. Ч е б о т а р е в . Теория групп Ли. ГИТТЛ, (1940).
10. Г. К р а м е р . Математические методы статистики. ГИИЛ, Москва, (1948).
11. W. W e i b u l l . Statistic function of distribution with wide sphere of aplication,
W. Journ of Applied. Mechanics, 18, 3, (1951).
12. M. G r e e n w o o d , G. U. G u 1 e. An Inquiry into the Nature of Frequency
Distribution Representative of Multiple Happeninge, Journ. Roy. Stat. Soc, 83, (1920),
255-279.
13. G. P o l y a . Sur quelques points de la theoric cles probabilites, Annales de
e'Institut Heari Poincare, 1, (1930), 117—161.
14. E. W. S t a c y . A generalization of the gamma distribution, Ann. Math. Stat., 33,
3, (1962), 1187-1192.
15. С. А. А й в а з я н. Сравнение оптимальных свойств критериев Неймана —
Пирсона и Вальда. Теория вероятностей и ее применение, 4, 1, (1956), 86—93.
16. Э. Л е м а н . Проверка статистических гипотез. Изд-во „Наука", (1964).
Статья поступила 10/XI 1964 года.