Академический Документы
Профессиональный Документы
Культура Документы
Ïóñòü èìååòñÿ âûáîðêà èç ãåíåðàëüíîé ñîâîêóïíîñòè ðàçìåðà n òàêàÿ îðìóëèðîâêà óæå îçíà÷àåò ïðè-
íÿòèå ñïåöèàëüíûõ óñëîâèé ñòàòèñòè÷åñêîé ìîäåëè, à èìåííî:
Íàëè÷èå íåêîòîðîé ñëó÷àéíîé âåëè÷èíû (âàðèàíò ñëó÷àéíîãî âåêòîðà) ξ : Ω → R, óíêöèÿ ðàñïðåäåëåíèÿ
Fξ êîòîðîé íàì íå ïîëíîñòüþ èçâåñòíà, à õàðàêòåðèçóåòñÿ ëèøü ïðèíàäëåæíîñòüþ ê íåêîòîðîìó êëàññó F
ðàñïðåäåëåíèé,
Íàëè÷èå ìîäåëè ïîâòîðåíèé (òî åñòü ïîñëåäîâàòåëüíîñòè ξ1 , ξ2 , . . . íåçàâèñèìûõ è ðàñïðåäåëåííûõ òàê æå êàê
ξ ), çàäàþùèõ ìåðó íà ïðîñòðàíñòâå R∞ .
Íàëè÷èå êîíå÷íîé ïîñëåäîâàòåëüíîñòè ÷èñåë ξ1 (ω1 ), ξ2 (ω2 ), . . . ξn (ωn ), êîòîðàÿ, ñîáñòâåííî, è íàçûâàåòñÿ âû-
áîðêîé.
1
Ñèìóëÿöèÿ äàííûõ
Ïîäðàçóìåâàåòñÿ, ÷òî äàííûå äëÿ çàäà÷è âîçíèêàþò èçâíå: ýòî çàêàç îáùåñòâà ñïåöèàëèñòó ïî îáðàáîòêå. Ïðåä-
ïîëîæåíèÿ î òîì êàê óñòðîåíû äàííûå íå âñåãäà îãîâàðèâàþò ñïåöèèêó, íàïðèìåð â èçìåðåíèÿõ ìîæåò ñî-
äåðæàòüñÿ çíà÷èòåëüíàÿ îøèáêà, ïðèðîäà êîòîðîé çàêàç÷èêó íåèçâåñòíà è îí î íåé ìîæåò íè÷åãî è íå çíàòü.
Èññëåäîâàíèå òîãî, êàê ïîâëèÿåò êîíêðåòíàÿ îøèáêà íà îòâåò îñòàåòñÿ ýêñïåðòó, ïðè÷åì ÷àñòî îòâåò ñëîæíî äàòü
â àíàëèòè÷åñêèõ òåðìèíàõ. Çäåñü ÷àñòî ïðèìåíÿþò ìåòîä, èçâåñòíûé ïîä íàçâàíèåì boot-strap, çàêëþ÷àþùèéñÿ
â ãåíåðàöèè ñèíòåòè÷åñêèõ äàííûõ (íàïðèìåð, âêëþ÷àþùèõ îøèáêó êîíêðåòíîãî âèäà) è ïîâòîðåíèé ñòàòèñòè-
÷åñêèõ âû÷èñëåíèé ïðèìåíèòåëüíî ê ñèíòåòè÷åñêèì äàííûì. Íåîáõîäèìûé íàâûê çäåñü óìåíèå ïîñòðîèòü
ïðè ïîìîùè êîìïüþòåðà âûáîðêó çíà÷åíèé ñëó÷àéíîé âåëè÷èíû, èíûìè ñëîâàìè, óìåíèå ñîçäàòü âûáîðêó ïî
èçâåñòíîìó ðàñïðåäåëåíèþ Fξ (x). Ê ýòîìó óìåíèþ, â ñâîþ î÷åðåäü, ïðèëàãàåòñÿ óìåíèå ïðîêîíòðîëèðîâàòü ñâîè
äåéñòâèÿ, óáåäèòüñÿ â òîì, ÷òî ñèíòåòè÷åñêèå äàííûå äåéñòâèòåëüíî ðàñïðåäåëåíû êàê íàäî è äåéñòâèòåëüíî
íåçàâèñèìû. Äëÿ íåêîòîðûõ òèïîâ ðàñïðåäåëåíèé ãåíåðàòîðû ñîîòâåòñòâóþùèõ âûáîðîê óæå ðåàëèçîâàíû â
áèáëèîòåêå ïðîöåäóð, íî áåçóñëîâíî íàäî ïîíèìàòü, êàê äåéñòâîâàòü è â íåñòàíäàðòíîì ñëó÷àå.
Èòàê, äëÿ âûáîðêè xi1 , xi2 , . . . xin ñòàòèñòè÷åñêàÿ îðìóëà ïðåäëîæèò âû÷èñëåíèå çíà÷åíèÿ Z(xi1 , xi2 , . . . xin ),
ÿñíî, ÷òî äëÿ äðóãîé âûáîðêè èç òîé æå ãåíåðàëüíîé ñîâîêóïíîñòè âû÷èñëåííîå çíà÷åíèå ìîæåò îòëè÷àòüñÿ.
Òàêèì îáðàçîì, Z(xi1 , xi2 , . . . xin ) çàäàåò ñëó÷àéíóþ âåëè÷èíó, ïîòîìó ÷òî àðãóìåíòû áåðóòñÿ èç ïðîñòðàíñòâà
Rn ñ âåðîÿòíîñòíîé ìåðîé: (xi1 , xi2 , . . . xin ) ∈ Rn .
Òàêèì îáðàçîì ìû ñòàëêèâàåìñÿ ñ èññëåäîâàíèåì ñëó÷àéíûõ âåëè÷èí, ïîñòðîåííûõ ïî ñëó÷àéíîìó âåêòîðó
(êîòîðûé, â ñâîþ î÷åðåäü, ïîñòðîåí ñîãëàñíî ñõåìå ïîâòîðíûõ íåçàâèñèìûõ ïîâòîðåíèé. ×òîáû ïðîéòè ïî ýòîìó
ïóòè íåîáõîäèìî óìåòü êàæäûé ðàç ïîëó÷àòü îðìóëó äëÿ ñîîòâåòñòâóþùèõ ðàñïðåäåëåíèé.
Äðóãèå ðåêîìåíäàöèè ïîñòðîåíèÿ ãèñòîãðàìì ñîñòîÿò â âûáîðå îïòèìàëüíîãî ðàçìåðà h èíòåðâàëà áèíèðîâàíèÿ,
òîãäà ÷èñëî áèíîâ âîçíèêíåò êàê ðåçóëüòàò äåëåíèÿ ðàçáðîñà âñåé âûáîðêè íà âåëè÷èíó áèíà.
h i
Ïðàâèëî Ñêîòòà h = s∗ · 3.49
√3 n (D.S ott, 1979)
h i
Ïðàâèëî Ôðèäìàíà h = ∗
q0.75 ∗
− q0.25 √2
3 n (Freedman and Dia onis, 1981)
çäåñü êâàäðàòíûå ñêîáêè îáîçíà÷àþò öåëóþ ÷àñòü, à s∗ è qt∗ - âû÷èñëåííûå ïî âûáîðêå ñîîòâåòñòâåííî ýì-
ïèðè÷åñêóþ äèñïåðñèþ1 è t-êâàíòèëè.  ëþáîì ñëó÷àå âèäíî, ÷òî êîëè÷åñòâî áèíîâ â òèïîâîé ãèñòîãðàììå
ñîâñåì íåìíîãî. Âäîáàâîê, îðìóëà Ñêîòòà ïðåäëàãàåò îðèåíòèðîâàòüñÿ íà îðìóëó âåëè÷èíû ýìïèðè÷åñêîé
äèñïåðñèè, ïðèìåíÿòü êîòîðóþ ê íåèçâåñòíûì äàííûì îïàñíî.
1Î òèïè÷íûõ ñòàòèñòè÷åñêèõ õàðàêòåðèñòèêàõ ðå÷ü ïîéäåò äàëåå. Ïîêà æå ïðèìåì, ÷òî ýìïèðè÷åñêóþ äèñïåðñèþ ìîæíî îïðå-
äåëèòü ÷åðåç ñðåäíåå x̄ âûáîðêè îðìóëîé
1 X 1 X 2
n n
S2 = (xk − x̄)2 = x − (x̄)2
n k=1 n k=1 k
2
Ïðèìåð: èíîãäà ñòàòèñòè÷åñêèå îðìóëû âûäàþò ñòðàííûå îòâåòû
Âûáåðåì äîñòàòî÷íî ðåàëèñòè÷íûé îáúåì äàííûõ, íàïðèìåð, N = 1000. Ñãåíåðèðóåì N ñëó÷àéíûõ (ðàâíîìåð-
íûõ) ÷èñåë αi íà èíòåðâàëå [0, 1] è ðàññìîòðèì äàííûå ωi = 1/αi . Íåò íèêàêèõ ïðîáëåì ñ òåì, ÷òîáû âû÷èñëèòü
àðèìåòè÷åñêîå ñðåäíåå âñåõ αi è âñåõ ωi . Îäíàêî, åñëè âû ïðîäåëàåòå ýòîò ýêñïåðèìåíò íåñêîëüêî ðàç, òî
ïîëó÷àþùèåñÿ îòâåòû âàñ óäèâÿò. Îáúÿñíèòå, â ÷åì çäåñü äåëî.
Âñå äàííûå â çàäà÷å ïîëó÷åíû êîìïüþòåðíîé ñèìóëÿöèåé, çàïèñàíû â òåêñòîâîì îðìàòå ïî êîëîíêàì, àéë
Zoopark.txt âûëîæåí íà ßíäåêñ-äèñê https://disk.yandex.ru/d/snty0o9oGSMP7A. Ñïèñîê âîçìîæíûõ ïëîò-
√
íîñòåé ê çàäà÷å ñëåäóþùèé: γ1 + γ2 + γ3 , |η|, γ , eη , | γγ12 |. Çäåñü îáîçíà÷åíèÿ γ óêàçûâàåò íà ïîêàçàòåëüíîå
ðàñïðåäåëåíèå, γi íåçàâèñèìû, è η óêàçûâàåò íà ãàóññîâî ðàñïðåäåëåíèå ñ ìàòåìàòè÷åñêèì îæèäàíèåì 0.
1. Äëÿ âûáîðîê èç ðàçíûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé è íàáîðà ñîîòâåòñòâóþùèõ èì ïëîòíîñòåé óêàçàòü
âçàèìíûå ñîîòâåòñòâèÿ.
2. Äëÿ êàæäîé âûáîðêè óêàçàòü (ýâðèñòè÷åñêèå) àðãóìåíòû â ïîëüçó ñóùåñòâîâàíèÿ èëè íåñóùåñòâîâàíèÿ
ïåðâûõ äâóõ ìîìåíòîâ ó èññëåäóåìîé ñëó÷àéíîé âåëè÷èíû.
àçóìååòñÿ, òàêàÿ çàäà÷à ó÷åáíàÿ: äëÿ ñèìóëÿöèè äàííûõ èñïîëüçîâàëèñü òî÷íûå îðìóëû, çàäàþùèå çàêîí
ðàñïðåäåëåíèÿ. Â ðåàëüíîé æèçíè â äàííûõ âñåãäà ïðèñóòñòâóþò ñòîðîííèå ýåêòû, íàñêîëüêî îíè ñóùåñòâåí-
íû ïîêàæåò äàëüíåéøèé êîëè÷åñòâåííûé ñòàòèñòè÷åñêèé àíàëèç. Íà äåëå èñêóññòâî îáðàáîò÷èêà çàêëþ÷àåòñÿ
â óìåíèè ïðåäâèäåòü ìîäåëü (òî åñòü ñõåìó ïîâòîðíûõ íåçàâèñèìûõ ïîâòîðåíèé) íà îñíîâå ïîíèìàíèÿ ïðîèñ-
õîæäåíèÿ äàííûõ, ãðàè÷åñêèé àíàëèç âàæåí, íî èì íå îãðàíè÷èâàþòñÿ. Íà ïðåäâàðèòåëüíîì äëÿ ïðèìåíåíèÿ
ñòàòèñòè÷åñêîé òåîðèè ýòàïå îáû÷íî åñòü íåñêîëüêî âîçìîæíîñòåé è ñ ïîìîùüþ êîëè÷åñòâåííûõ ìåòîäîâ ñòà-
òèñòèêè íàäî åùå èõ ñðàâíèâàòü êàê àëüòåðíàòèâíûå ãèïîòåçû.
0
0.9 10 0
0.8 −0.5
0.7
−1
0.6
−1.5
0.5
−1
10 −2
0.4
−2.5
0.3
−3
0.2
0.1 −3.5
−2
0 10 −4
1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 0.2 0.3 0.4 0.5 0.6 0.7 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6
10 10 10 10 10 10
3
Êàê âûãëÿäèò ãðàèê çàâèñèìîñòè y = 1
xm â áèëîãàðèìè÷åñêîé øêàëå?. Óêàçàòü êîýèöèåíò íàêëîíà.
Íà èñ(1) òðè êðèâûå õàðàêòåðèçóþùèå ðàçíûå òèïû óáûâàíèÿ ïîëèíîìèàëüíîãî (ñèíèé), ýêñïîíåíöè-
àëüíîãî (êðàñíûé) è ñâåðõýêñïîíåíöèàëüíîãî (÷åðíûé) èçîáðàæåíû â ëèíåéíîé, ïîëóëîãàðèìè÷åñêîé è
áèëîãàðèìè÷åñêîé øêàëàõ. Îáúÿñíèòü êàêàÿ êàðòèíêà ñîîòâåòñòâóåò êàêîìó òèïó èçîáðàæåíèþ.
1.4.1 Óïðàæíåíèå
Äîãàäàéòåñü, êàê â óêàçàííîé ñèòóàöèè ïîëó÷èòü (ïðèáëèæåííî) çíà÷åíèÿ êâàíòèëÿ, íàïðèìåð, äëÿ t = 0.95?
Âàðèàíòû èíäåêñèðóþòñÿ çíà÷åíèÿìè îïöèé À (òèï ðàñïðåäåëåíèÿ), n (ðàçìåð âûáîðêè), C (ñïîñîá ïîñòðîåíèÿ
\
ãèñòîãðàììû), D (ñïîñîá âû÷èñëåíèÿ D [n,m] )
Âàðèàíòû çíà÷åíèé n
1. n = 1000
2. n = 100
Âàðèàíòû çíà÷åíèé C
4
\
Âàðèàíòû ïðàâèë D äëÿ âû÷èñëåíèÿ D [n,m]
P |wi −pi |
4. D=4. D[n,m] = pi
i
P (wi −pi )2
5. D=5. D[n,m] = pi (1−pi )
i
1.4.3 Çàäà÷à
Êàê (è íàäî ëè) èçìåíèòü êðèòåðèé, åñëè ïðîâåðÿåòñÿ ãèïîòåçà î òîì, ÷òî çàäàííàÿ âûáîðêà âçÿòà èç (ñîîòâåò-
ñòâåííî ñì.âàðèàíò çíà÷åíèÿ À )
1. À=0. àâíîìåðíîãî ðàñïðåäåëåíèÿ íà [0, B] B 6= 1?
2. À=1. Êâàäðàòíîãî êîðíÿ èç ðàâíîìåðíîãî ðàñïðåäåëåíèÿ íà [0, B] B 6= 1?
(åå âåðñèè Dn+ è Dn− èñïîëüçîâàëèñü Ñìèðíîâûì äëÿ ìåð â îáëàñòÿõ {x|Fn∗ (x) > Fξ (x)} è {x|Fn∗ (x) < Fξ (x)} )
√
lim P nDn > z = K(z)
n→∞
( P
∞ 2 2
2 k=1 (−1)k−1 e−2k z , z>0
K(z) =
0 z 6 0,
Ïîñòðîèâ (ïðèáëèçèòåëüíî) ãðàèê K(z) ëåãêî óáåäèòüñÿ, ÷òî ýòî ìîíîòîííàÿ óíêöèÿ ñ K(0) = 1 è K(+∞) =
0. Ñõîäèìîñòü ïî n ê ïðåäåëó î÷åíü áûñòðàÿ (ñëåäóåò èç äîêàçàòåëüñòâà òåîðåìû Êîëìîãîðîâà, êîòîðîå ìû
íå ðàçáèðàëè), òåì ñàìûì íàì ïî÷òè èçâåñòíû óíêöèè ðàñïðåäåëåíèÿ ñëó÷àéíûõ âåëè÷èí Dn .  òåðìèíàõ
óíêöèè K(z) ìîæíî ñîðìóëèðîâàòü ïðàâèëî, êîãäà íà äàííîì óðîâíå çíà÷èìîñòè íàäî îòâåðãíóòü ãèïîòåçó
î ñîîòâåòñòâèè ðà ïðåäåëåíèÿ è âûáîðêè, òî åñòü óòâåðæäàòü î ìàëîâåðîÿòíîñòè íàáëþäàåìîãî â ýêñïåðèìåíòå
çíà÷åíèÿ Dobserved: √ √
P (Dn > Dobserved ) ≈ K Dobserved · ( n + 0.12 + 0.11/ n)
√ √
Ñòðàííîå
√ âûðàæåíèå ( n + 0.12 + 0.11/ n) îòðàæàåò ïîïðàâêè íàñêîëüêî òî÷íî ïðè êîíêðåòíîì n âåðîÿòíîñòü
P (Dn n > z) îïèñûâàåòñÿ ïðåäåëüíîé îðìóëîé K(z).
×àùå âñåãî êðèòåðèé Êîëìîãîðîâà-Ñìèðíîâà èñïîëüçóåòñÿ äëÿ ñëåäóþùåé çàäà÷è: îïðîâåðãàåòñÿ ëè íà
äàííîì óðîâíå çíà÷èìîñòè, ÷òî äâå âûáîðêè äëèíîþ â n1 è n2 îòñ÷åòîâ âçÿòû èç îäíîé ãåíåðàëüíîé ñîâî-
êóïíîñòè (à ïðî ãèïîòåòè÷åñêîå ðàñïðåäåëåíèå íå ãîâîðèòñÿ íè÷åãî, êðîìå åãî íåïðåðûâíîñòè)?  åå (ïî÷òè
5
î÷åâèäíîì) ðåøåíèè òàêæå çàäåéñòâîâàíî ðàññòîÿíèå Dn1 ,n2 ìåæäó äâóìÿ ñòóïåí÷àòûìè ãðàèêàìè è äàëåå
ðàáîòàåò ïðàêòè÷åñêè òà æå ñàìàÿ îðìóëà, íî â ó÷èòûâàþùåì ðàçíèöó äëèí âûáîðîê âèäå:
√ √ n1 n2
P (Dn1 ,n2 > Dobserved) ≈ K Dobserved · ( M + 0.12 + 0.11/ M ) M=
n1 + n2
 êîíêðåòíûõ êîìïüþòåðíûõ ðåàëèçàöèÿõ îáû÷íî íå ïðèõîäèòñÿ âû÷èñëÿòü ðàññòîÿíèå ñàìîìó ñîîòâåòñòâó-
þùàÿ áèáëèîòå÷íàÿ óíêöèÿ ïðîäåëàåò âñå çà âàñ.
Èç-çà òîãî, ÷òî ìåòîä îñíîâàí íà ìàêñèìàëüíîì îòêëîíåíèè äâóõ óíêöèé ðàñïðåäåëåíèÿ, ÿñíî, ÷òî ìàê-
ñèìàëüíîå îòêëîíåíèå íàáëþäàåòñÿ ñêîðåå â öåíòðàëüíîé ÷àñòè ðàñïðåäåëåíèÿ (áëèæå ê ìåäèàíå íåèçâåñòíîãî
ðàñïðåäåëåíèÿ), à íå íà êîíöàõ, ãäå ãðàèêè âûïîëàæèâàþòñÿ. åçóëüòàòîì ÿâëÿåòñÿ òî, ÷òî òåñò Êîëìîãîðîâà-
Ñìèðíîâà ýåêòèâíî ðàçáèðàåòñÿ ñ îòëè÷èÿìè òèïà ñäâèãà ðàñïðåäåëåíèÿ, íî õóæå ÷óâñòâóåò ðàçíèöó íà
õâîñòàõ ðàñïðåäåëåíèé. Âàæíàÿ ìîäèèêàöèÿ òåñòà Êîëìîãîðîâà-Ñìèðíîâà íàçûâàåòñÿ òåñòîì Àíäåðñîíà-
Äàðëèíãà è îñíîâàíà íà âû÷èñëåíèè ïî âûáîðêå âìåñòî supx |Fn∗ (x) − Fξ (x)| âåëè÷èíû
|F ∗ (x) − Fξ (x)|
D̃n = sup p n
x Fξ (x)(1 − Fξ (x))
Äëÿ ýòèõ ìåð òàêæå ðàññ÷èòàíû ðàñïðåäåëåíèÿ è òåñò Àíäåðñîíà-Äàðëèíãà ïî àêòó îêàçàëñÿ áîëåå ÷óâñòâè-
òåëüíûì ê îòêëîíåíèÿì íà õâîñòàõ ðàñïðåäåëåíèÿ, ÷åì â ñåðåäèíå. Áåññìûñëåííî ñòàâèòü âîïðîñ êàêîé òåñò
ëó÷øå ïîòîìó ÷òî íàèáîëåå ïðàâèëüíûì áóäåò ïðèìåíèòü íåñêîëüêî òåñòîâ íå îòâåðãíåò ëè ãèïîòåçó õîòü îäèí
èç íèõ. Âïðî÷åì, çäåñü ïîÿâëÿåòñÿ òðóäíûé âîïðîñ îá óðîâíå çíà÷èìîñòè ïðèìåíåíèÿ íåñêîëüêèõ òåñòîâ ñðàçó
è î ïðèáëèæåíèÿõ â èñïîëüçóåìûõ ðàñ÷åòíûõ îðìóëàõ.  íàøåì ââîäíîì êóðñå ìû ýòî íå ðàññìàòðèâàåì, íî
â ïðèíöèïå ýòî âïîëíå ìàòåìàòè÷åñêè êîððåêòíûé âîïðîñ.
Êàê óæå ñêàçàíî âûøå ñòàíäàðòíàÿ çàäà÷à íåïàðàìåòðè÷åñêîé ñòàòèñòèêè âîçíèêàåò, êîãäà äàíû äâå âûáîðêè
(âîçìîæíî ðàçíîãî îáúåìà) èç, âîîáùå ãîâîðÿ, ðàçíûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé è íàäî íà äàííîì óðîâíå
çíà÷èìîñòè ñäåëàòü ñòàòèñòè÷åñêèå âûâîäû ñîâïàäàþò ëè ýòè äâå ãåíåðàëüíûå ñîâîêóïíîñòè. äëèíû âûáîðêè
àè îðìû ðàñïðåäåëåíèÿ  ÷àñòíîñòè âåðíåìñÿ ê çàäà÷å 1.3.13 .
1. Ïðèìåíèòü êîìïüþòåðíûå ñèìóëÿöèè è íà óðîâíå çíà÷èìîñòè 0.95 ìåòîäîì Êîëìîãîðîâà-Ñìèðíîâà âîç-
íèêøèå ó âàñ èç ïðåäâàðèòåëüíîãî ðàññìîòðåíèÿ ïÿòü ãèïîòåç î ðàñïðåäåëåíèÿõ â çàäà÷å 1.3.1. àçóìååò-
ñÿ, çäåñü âñòàåò âîïðîñ î ïàðàìåòðàõ ñèìóëÿöèè, Îáùèé ïîäõîä áóäåò ðàññìîòðåí ïîçæå, ïîêà ïðèâåäåì
íåñêîëüêî çíà÷åíèé, êîòîðûå íàäî èñïîëüçîâàòü äëÿ ïîäñòàíîâêè â ñèìóëÿöèè (êóäà êàêîé ðàçáåðèòåñü,
ïîæàëóéñòà, ñàìîñòîÿòåëüíî): 1, 0.3 1.5,
2. Êîìïüþòåðíûå ýêñïåðèìåíòû, ïîêàçûâàþùèå ðîëü ïàðàìåòðîâ ðàñïðåäåëåíèÿ è ïðèáëèæåíèé ïðåäåëüíîãî
ïåðåõîäà â êðèòåðèè KS. Çàîäíî ýòî äàåò îïûò ïðàêòè÷åñêîãî ïðèìåíåíèÿ êðèòåðèÿ KS (ïîñêîëüêó òåîðèÿ
íàì â ïðèíöèïå èçâåñòíà).
(a) Ïîäãîòîâüòå 1000 âûáîðîê äëèíû 100 çíà÷åíèé ñëó÷àéíîé âåëè÷èíû, ðàñïðåäåëåííîé êàê N (0, 1) è
ñîñ÷èòàéòå 95% ãðàíèöó îòêëîíåíèÿ ýìïèðè÷åñêèõ óíêöèé ðàñïðåäåëåíèÿ îò òåîðåòè÷åñêîé óíê-
öèè ðàñïðåäåëåíèÿ. Âû÷èñëèòå è íàðèñóéòå ãðàèê ãðàíèö, ãäå ïî êðèòåðèþ Ê-Ñ äîëæíû ëåæàòü
95% ýìïèðè÷åñêèõ óíêöèé ðàñïðåäåëåíèÿ âûáîðêè äëèíû 100 çíà÷åíèé çíà÷åíèé ñëó÷àéíîé âåëè-
÷èíû, ðàñïðåäåëåííîé êàê N (0, 1). Ñðàâíèòå âåëè÷èíó ýòèõ ãðàíèö ñ òåì, ÷òî ïðåäëàãàåò ïðåäåëüíàÿ
óíêöèÿ Êîëìîãîðîâà (òî åñòü ïðè n → ∞.
3 å÷ü î çàäà÷å ¾äëÿ âûáîðîê èç ðàçíûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé è íàáîðà ñîîòâåòñòâóþùèõ èì ïëîòíîñòåé óêàçàòü âçàèìíûå
ñîîòâåòñòâèÿ¿
6
(b) Ïîäãîòîâüòå 1000 âûáîðîê äëèíû 25 çíà÷åíèé ñëó÷àéíîé âåëè÷èíû, ðàñïðåäåëåííîé êàê N (0, 1) è
ñîñ÷èòàéòå 95% ãðàíèöó îòêëîíåíèÿ ýìïèðè÷åñêèõ óíêöèé ðàñïðåäåëåíèÿ îò òåîðåòè÷åñêîé óíê-
öèè ðàñïðåäåëåíèÿ. Âû÷èñëèòå è íàðèñóéòå ãðàèê ãðàíèö, ãäå ïî êðèòåðèþ Ê-Ñ äîëæíû ëåæàòü
95% ýìïèðè÷åñêèõ óíêöèé ðàñïðåäåëåíèÿ âûáîðêè äëèíû 25 çíà÷åíèé çíà÷åíèé ñëó÷àéíîé âåëè÷è-
íû, ðàñïðåäåëåííîé êàê N (0, 1). Ñðàâíèòå âåëè÷èíó ýòèõ ãðàíèö ñ òåì, ÷òî ïðåäëàãàåò ïðåäåëüíàÿ
óíêöèÿ Êîëìîãîðîâà (òî åñòü ïðè n → ∞.
( ) Ïîäãîòîâüòå 1000 âûáîðîê äëèíû 100 çíà÷åíèé ñëó÷àéíîé âåëè÷èíû, ðàñïðåäåëåííîé ïî çàêîíó Êî-
øè ñ ïàðàìåòðîì 1 è ñîñ÷èòàéòå 95% ãðàíèöó îòêëîíåíèÿ ýìïèðè÷åñêèõ óíêöèé ðàñïðåäåëåíèÿ îò
òåîðåòè÷åñêîé óíêöèè ðàñïðåäåëåíèÿ. Âû÷èñëèòå è íàðèñóéòå ãðàèê ãðàíèö, ãäå ïî êðèòåðèþ Ê-Ñ
äîëæíû ëåæàòü 95% ýìïèðè÷åñêèõ óíêöèé ðàñïðåäåëåíèÿ âûáîðêè äëèíû 100 çíà÷åíèé çíà÷åíèé
ñëó÷àéíîé âåëè÷èíû, ðàñïðåäåëåííîé ïî çàêîíó Êîøè ñ ïàðàìåòðîì 1. Ñðàâíèòå âåëè÷èíó ýòèõ ãðà-
íèö ñ òåì, ÷òî ïðåäëàãàåò ïðåäåëüíàÿ óíêöèÿ Êîëìîãîðîâà (òî åñòü ïðè n → ∞.
(d) Ïîäãîòîâüòå 1000 âûáîðîê äëèíû 50 çíà÷åíèé ñëó÷àéíîé âåëè÷èíû, ðàñïðåäåëåííîé ïî çàêîíó Êîøè ñ
ïàðàìåòðîì 1 è ñîñ÷èòàéòå 95% ãðàíèöó îòêëîíåíèÿ ýìïèðè÷åñêèõ óíêöèéà ÷òî îáðàòèòü âíèìàíèå
ðàñïðåäåëåíèÿ îò òåîðåòè÷åñêîé óíêöèè ðàñïðåäåëåíèÿ. Âû÷èñëèòå è íàðèñóéòå ãðàèê ãðàíèö,
ãäå ïî êðèòåðèþ Ê-Ñ äîëæíû ëåæàòü 95% ýìïèðè÷åñêèõ óíêöèé ðàñïðåäåëåíèÿ âûáîðêè äëèíû 50
çíà÷åíèé çíà÷åíèé ñëó÷àéíîé âåëè÷èíû, ðàñïðåäåëåííîé ïî çàêîíó Êîøè ñ ïàðàìåòðîì 1.Ñðàâíèòå
âåëè÷èíó ýòèõ ãðàíèö ñ òåì, ÷òî ïðåäëàãàåò ïðåäåëüíàÿ óíêöèÿ Êîëìîãîðîâà (òî åñòü ïðè n → ∞.
2.2.2 Çàìå÷àíèå
 êîìïüþòåðíîé ðåàëèçàöèè ðåøåíèÿ èìååòñÿ íå âïîëíå î÷åâèäíûé øàã: âû÷èñëåíèå òî÷íîé âåðõíåé ãðàíè
ðàññòîÿíèé ìåæäó ïîñòðîåííîé ïî âûáîðêå ñòóïåí÷àòîé óíêöèåé è ïîñòðîåííîé ïî ÿâíîìó óðàâíåíèþ íåïðå-
ðûâíîé óíêöèåé Fξ (x) òðåáóåò, âîîáùå ãîâîðÿ, ñðàâíåíèÿ çíà÷åíèé â áåñêîíå÷íîì íàáîðå àðãóìåíòîâ. Íî
íåïðåðûâíàÿ óíêöèÿ Fξ (x) íèãäå íå óáûâàåò, ïîýòîìó íà êàæäîé ñòóïåíüêå ìàêñèìàëüíîå ðàññòîÿíèå ìåæäó
ãðàèêàìè çàâåäîìî äîñòèãàåòñÿ ëèáî íà ïðàâîì êîíöå ñòóïåíüêè, ëèáî ðàâíî ïðåäåëó ðàññòîÿíèé ïðè àðãóìåí-
òàõ ñòðåìÿùèõñÿ ê ëåâîìó êîíöó ñòóïåíüêè. Íî íåîáõîäèìî ëè íàì âû÷èñëÿòü ïðåäåëû ïðè ó÷åòå ðàññòîÿíèé?
Îáðàòèòå âíèìàíèå, ÷òî ñòóïåíüêè êàæäûé ðàç ïîäíèìàþòñÿ íà âûñîòó 1/n ïîñêîëüêó ìû â ýòîé çàäà÷å çà-
íèìàåìñÿ âûáîðêàìè â êëàññå íåïðåðûâíûõ ðàñïðåäåëåíèé è ïîëó÷èòü äâà ñîâåðøåííî îäèíàêîâûõ çíà÷åíèÿ â
òàêîé âûáîðêå ìîæíî ëèøü ñ âåðîÿòíîñòüþ íîëü. Îòñþäà ñëåäóåò, ÷òî ñâåðêó ðàññòîÿíèé íàäî âåñòè âñå-òàêè
ïî âñåì òî÷êàì ðàçðûâà ñòóïåí÷àòîé óíêöèè, íî äåëàòü ýòî ãðàìîòíî ñ ó÷åòîì òàêæå è âåëè÷èíû 1/n.
Êðèòåðèé çíàêîâ
7
Áîëåå âíèìàòåëüíûé âçãëÿä íà òåñò ïîêàçûâàåò, ÷òî òóò ïðîâåðÿþò ëèøü ãèïîòåçó î ðàâåíñòâå ìåäèàí
ó äâóõ íåçàâèñèìûõ êîìïîíåíò íåïðåðûâíîãî ñëó÷àéíîãî âåêòîðà, ïðîåöèðóÿ ýòó çàäà÷ó íà ïðî-
âåðêó ãèïîòåçû î çíà÷åíèè ïàðàìåòðà áèíîìèàëüíîé ñëó÷àéíîé âåëè÷èíû, îïðåäåëÿåìîé ÷èñëîì
ïîÿâëåíèÿ ïîëîæèòåëüíûõ ðàçíîñòåé ìåæäó êîìïîíåíòàìè â âûáîðêå ñëó÷àéíîãî âåêòîðà.  ñëó÷àå
äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí íóæíà äîïîëíèòåëüíàÿ àêêóðàòíîñòü â îðìóëèðîâêå ãèïîòåç è àëüòåðíàòèâ.
àññìîòðåííûé âûøå òåñò èìåë â âèäó ïàðó àëüòåðíàòèâ H0 : p+ = 1/2 è H1 : p+ 6= 1/2.
Ïîñêîëüêó ðåàëüíî òåñòèðóåòñÿ ëèøü äèñêðåòíîå áèíîìèàëüíîå ðàñïðåäåëåíèå, ìîæíî ðàññìàòðèâàòü è èíûå
ïàðû àëüòåðíàòèâ äëÿ çíà÷åíèé åãî ïàðàìåòðà p+ :
Pn
n
H0 : p+ 6 1/2 è H1 : p+ > 1/2 . Äëÿ îòêëîíåíèÿ ãèïîòåçû H0 íóæíî íåðàâåíñòâî 2−n k 6 α
k=r
P
r
n
H0 : p+ > 1/2 è H1 : p+ < 1/2 . Äëÿ îòêëîíåíèÿ ãèïîòåçû H0 íóæíî íåðàâåíñòâî 2−n k 6α
k=0
Ïðè áîëüøèõ çíà÷åíèÿõ n ïðÿìîé ïîäñ÷åò áèíîìèàëüíûõ êîýèöèåíòîâ íåóäîáåí è ïîòîìó èñïîëüçóþò
àïðîêñèìàöèè áèíîìèàëüíîãî çàêîíà ãàóññîâûì.
H0 : p+ 6 1/2 è H1 : p+ > 1/2 . Äëÿ îòêëîíåíèÿ ãèïîòåçû H0 íóæíî íåðàâåíñòâî r
n−r+1 > F1−α [2(n − r + 1), 2r]
H0 : p+ > 1/2 è H1 : p+ < 1/2 . Äëÿ îòêëîíåíèÿ ãèïîòåçû H0 íóæíî íåðàâåíñòâî n−r
r+1 > F1−α [2(r + 1), 2(n − r)]
H0 : p+ = 1/2 è H1 : p+ 6= 1/2 . Äëÿ îòêëîíåíèÿ ãèïîòåçû H0 äîëæíî áûòü âûïîëíåíî îäíî èç äâóõ ïðåäûäóùèõ
íåðàâåíñòâ, íî ñ çàìåíîé ïîêàçàòåëÿ êâàíòèëÿ 1 − α íà 1 − α/2
âåñ äî 68 80 92 81 70 79 78 66 57 76
âåñ ïîñëå 63 85 87 79 74 75 76 65 56 71
àíãîâûå ìåòîäû
 ïðåäûäóùåì ðàçäåëå ðàññìàòðèâàëàñü çàäà÷à î äâóõ âûáîðêàõ : îïðîâåðãàåòñÿ ëè íà äàííîì óðîâíå çíà÷è-
ìîñòè, ÷òî äâå âûáîðêè x1 , x2 , . . . xm è y1 , y2 , . . . yn âçÿòû èç îäíîé ãåíåðàëüíîé ñîâîêóïíîñòè. Â ïðèíöèïå ýòîò
âîïðîñ âåñüìà âàæåí äëÿ êëèíè÷åñêîé ìåäèöèíñêîé äèàãíîñòèêè è íåóäèâèòåëüíî, ÷òî âîçíèêëî íåñêîëüêî ìå-
òîäèê èññëåäîâàíèÿ. Âàðèàíòû ðåøåíèÿ ïðè ïîìîùè KS è êðèòåðèÿ çíàêîâ óæå îáñóæäàëèñü, ðàññìîòðèì åùå
äîñòàòî÷íî ýåêòèâíûé ïîäõîä Óèëêîêñîíà-Ìàííà-Óèòíè (Wil oxon, Mann,Whitney), îí òàêæå âõîäèò, íàïðè-
ìåð, â áèáëèîòåêó ÿçûêà Python (ñì. s ipy.stats.mannwhitneyu à òàêæå s ipy.stats.wil oxon ). Ïðèìåíåíèå
â ìåäèöèíñêîé ïðàêòèêå: äëÿ êàæäîãî áîëüíîãî âû÷èñëÿåòñÿ âåëè÷èíà èçìåíåíèÿ ïðèçíàêà. Âñå èçìåíåíèÿ óïî-
ðÿäî÷èâàþò ïî àáñîëþòíîé âåëè÷èíå (áåç ó÷åòà çíàêà). Çàòåì ðàíãàì ïðèïèñûâàþò çíàê èçìåíåíèÿ è ñóììèðóþò
ýòè ¾çíàêîâûå ðàíãè¿ - â ðåçóëüòàòå ïîëó÷àåòñÿ çíà÷åíèå ñòàòèñòèêè Óèëêîêñîíà.
Ïîëíîå îáúÿñíåíèå äåòàëåé ñîîòâåòñòâóþùåãî êðèòåðèÿ äîñòàòî÷íî ãðîìîçäêî, íî ñòîèò óêàçàòü íåêîòîðûå
èäåè, íà êîòîðûõ ýòîò êðèòåðèé îñíîâàí.
8
4.1 Èäåÿ òåñòà, ðåçóëüòàòû è àëãîðèòì
Êàæäàÿ èç äâóõ âûáîðîê âîçíèêëà â ìîäåëè íåçàâèñèìûõ ïîâòîðåíèé, ñëåäîâàòåëüíî â ñîîòâåòñòâóþùèõ ãå-
íåðàëüíûõ ñîâîêóïíîñòÿõ ñ òî÷êè çðåíèÿ ìåð íåò íèêàêîé ðàçíèöû, åñëè âíóòðè âûáîðêè ìåíÿòü çíà÷åíèÿ
ïåðåñòàíîâêàìè. Òàêèõ ïåðåñòàíîâîê â ïåðâîé âûáîðêå m!, âî âòîðîé n! (ïîäõîä Óèëêîêñîíà, êàê è êðèòåðèé
çíàêîâ, â ñâîåé êëàññè÷åñêîé îðìå ïðåäïîëàãàåò íåïðåðûâíûå ðàñïðåäåëåíèÿ è ïîòîìó âûáîðêè ñ ïîâòîðåíèÿ-
ìè íåíàáëþäàåìû). Åñëè âûïîëíÿåòñÿ ãèïîòåçà H0 î òîì, ÷òî ýòè ãåíåðàëüíûå ñîâîêóïíîñòè íà ñàìîì äåëå îäíà
è òà æå, òî âûáîðêè ìîæíî ñëèòü â îäíó4 è ðàññìàòðèâàòü (m + n)! íå ìåíÿþùèõ ìåðó ïåðåñòàíîâîê â îáúåäè-
íåíèè. ×òî ìåíÿåòñÿ ïðè ïåðåñòàíîâêàõ ïîíÿòü ëåãêî: åñëè â îäíîì âàðèàíòå ïàðà çíà÷åíèé øëà ¾ïðàâèëüíî¿
ò.å. ïî âîçðàñòàíèþ, òî ïîñëå ïåðåñòàíîâêè îíà ìîæåò ñòàòü óæå ¾íåïðàâèëüíîé¿, ò.å. íå âîçðàñòàþùåé. Èäåÿ
êðèòåðèÿ ñîñòîèò â òîì, ÷òîáû ñðàâíèâàòü ïîêàçàòåëè îòíîñÿùèåñÿ ê ¾ïðàâèëüíûì/íåïðàâèëüíûì¿ ïàðàì, âîç-
íèêàþùèì â èñõîäíûõ âûáîðêàõ x1 , x2 , . . . xm è y1 , y2 , . . . yn . Îêàçûâàåòñÿ, ÷òî ñðàâíèâàòü ýòè ïîêàçàòåëè óäîáíî
ðàññìîòðåâ óïîðÿäî÷åíèå çíà÷åíèé ïî âîçðàñòàíèþ â îáúåäèíåííîé âûáîðêå. Ïîêàçàòåëè R1 , R2 , êîòîðûå áóäóò
îñíîâîé êðèòåðèÿ, îíè ââîäÿòñÿ òàê: äëÿ êàæäîãî çíà÷åíèÿ xi èç ïåðâîé âûáîðêè Pm âîçíèêàåò ïîðÿäêîâûé íî-
ìåð ri ýòîãî çíà÷åíèÿ
P â îáúåäèíåííîé óïîðÿäî÷åííîé âûáîðêå. Ýòî äàåò R 1 = k=1 rk , àíàëîãè÷íûì îáðàçîì
îïðåäåëÿþò R2 = nk=1 rk . Â çàâèñèìîñòè îò ðàçìåðà âûáîðêè èìåþòñÿ äâà ïîäõîäà:
1. Äëÿ ìàëåíüêèõ âûáîðîê n ∼ 25 êðèòåðèé Óèëêîêñîíà, â êîòîðîì êðèòè÷åñêàÿ îáëàñòü ÿâíî ñîñ÷èòàíà
ïî êîìáèíàòîðíûì îðìóëàì. Òåñò Óèëêîêñîíà òàêæå èíîãäà íàçûâàåòñÿ êðèòåðèåì Ìàííà-Óèòíè äëÿ
ìàëûõ âûáîðîê.
2. Äëÿ áîëüøèõ âûáîðîê U-êðèòåðèé Ìàííà-Óèòíè, èñïîëüçóþùèé àïïðîêñèìàöèþ ðàñïðåäåëåíèÿ ñîîòâåò-
ñòâóþùåé ñòàòèñòèêè
Èìåííî, Ìàíí, Óèòíè â ñåðåäèíå ÕÕ âåêà ïîêàçàëè, ÷òî ïðè áîëüøèõ m, n ðàñïðåäåëåíèå ñòàòèñòèêè U
1 1
U = min R1 − m(m + 1), R2 − n(n + 1)
2 2
áûñòðî ñõîäèòñÿ ê ãàóññîâó çàêîíó ñ ìàò.îæèäàíèåì mn/2 è äèñïåðñèåé (m + n + 1)mn/12 è, ñòàëî áûòü, åñ-
ëè çíà÷åíèÿ U îêàçàëèñü ìàðãèíàëüíûìè (= ëåæàùèìè íà õâîñòàõ óíêöèè ãàóññîâîé ïëîòíîñòè), òî íóæíî
îòáðàñûâàòü íóëåâóþ ãèïîòåçó H0 . Áîëåå òî÷íî, ïðè çàäàííîì óðîâíå çíà÷èìîñòè α ãèïîòåçà H0 îòêëîíÿåòñÿ,
åñëè âû÷èñëåííîå ïî âûáîðêå çíà÷åíèå
U − mn
Z ∗ = p mn 2
12 (m + n + 1)
ïî àáñîëþòíîé âåëè÷èíå áîëüøå êâàíòèëÿ q1−α/2 äëÿ íîðìàëüíîãî çàêîíà N (0, 1) (ýòî ò.í. äâóñòîðîííèé êðè-
òåðèé, ïðåäïîëàãàþùèé àëüòåðíàòèâó ¾âûáîðêè èñõîäíî âçÿòû èç ðàçíûõ, îòëè÷àþùèõñÿ ðàñïðåäåëåíèÿìè,
ãåíåðàëüíûõ ñîâîêóïíîñòåé¿ äëÿ H0 .
Çàìå÷àíèå  èçëîæåííîì òåñòå ðå÷ü øëà íå î âûáîðêå ïàð ó ñëó÷àéíîãî âåêòîðà, à î ñðàâíåíèè ñâîéñòâ äâóõ
âûáîðîê òî åñòü ïîñòàíîâêà âîïðîñà îòëè÷àåòñÿ îò àíàëîãè÷íîé â ðàíåå èçëîæåííîì òåñòå çíàêîâ.
×àñòî ýòè æå òåñòû ìîæíî âñòðåòèòü è ïðè ñðàâíåíèè ìåäèàí mx , my ó äâóõ âûáîðîê. Ôîðìàëüíî, ðàçóìååò-
ñÿ, îáúåäèíÿòü ñàìè âûáîðêè â òàêîì ñëó÷àå íåëüçÿ, íî ïîñêîëüêó â ïîñòðîåíèè ñòàòèñòèê ðåàëüíî èñïîëüçóþòñÿ
íå ñàìè ÷èñëà, à èõ ðàíãè, òî ïðîâåðÿþò ïàðó àëüòåðíàòèâ: H0 óòâåðæäàåò, ÷òî ìåäèàíû mx 6 my , àëüòåðíàòèâà
H1 óòâåðæäàåò, ÷òî mx > my .  ýòîì ñëó÷àå íóæåí îäíîñòîðîííèé êðèòåðèé.
9
4.3 Î ïðåîáðàçîâàíèèÿõ è ðàíãàõ
 èçëîæåííîì òåñòå èñïîëüçîâàëè ïîðÿäêîâûå íîìåðà â âûáîðêå âìåñòî ðàññìîòðåíèÿ èñõîäíûõ çíà÷åíèé. Ýòîò
ïðèåì ïîëåçåí è â äðóãèõ ñèòóàöèÿõ, íàïðèìåð ïðè îöåíèâàíèè ïî âûáîðêàì ìåðû çàâèñèìîñòè äâóõ ðàçíûõ
ñëó÷àéíûõ âåëè÷èí.
Êàê èçâåñòíî, â òåîðèè âåðîÿòíîñòåé åñòü ïîíÿòèå íåçàâèñèìîñòè, à çàâèñèìîñòü îçíà÷àåò íàðóøåíèå ñâîé-
ñòâà íåçàâèñèìîñòè. Åñëè îãðàíè÷èâàòüñÿ ñëó÷àéíûìè âåëè÷èíàìè ñ êîíå÷íûìè ïåðâûì è âòîðûì ìîìåíòîì,
òî äëÿ çàâèñèìûõ ñëó÷àéíûõ âåëè÷èí âîçíèêàåò äîñòàòî÷íûé ïðèçíàê çàâèñèìîñòè êîýèöèåíò êîððåëÿ-
öèè, êîòîðûé äîïóñêàåò ãåîìåòðè÷åñêóþ òðàêòîâêó â òåðìèíàõ êîñèíóñà óãëà ìåæäó âåêòîðàìè â ëèíåéíîì
ïðîñòðàíñòâå òàêèõ ñëó÷àéíûõ âåëè÷èí. Åñëè, íàïðèìåð, äâà âåêòîðà ïàðàëëåëüíû è, ñòàëî áûòü, ïðîïîðöè-
îíàëüíû (çàâèñèìû), òî êîýèöèåíò êîððåëÿöèè îêàçûâàåòñÿ ïî ìîäóëþ ðàâíûì 1, à ïî ïîñòðîåíèþ ýòîãî
ëèíåéíîãî ïðîñòðàíñòâà ñî ñêàëÿðíûì ïðîèçâåäåíèåì, íåçàâèñèìûå ñ.â. îêàæóòñÿ îðòîãîíàëüíû è òåì ñàìûì,
êîýèöèåíò êîððåëÿöèè áóäåò íóëåì.
Òàêèì îáðàçîì, îöåíêà êîýèöèåíòà êîððåëÿöèè ïî âûáîðêå ïðàêòè÷åñêè âàæíàÿ è ÷àñòî âñòðå÷àþùàÿñÿ
çàäà÷à. Èíòóèòèâíî êàæåòñÿ äîâîëüíî î÷åâèäíîé îöåíêà Ïèðñîíà (Pearson) äëÿ ρ, ñêîíñòðóèðîâàííàÿ ïî plug-in
îöåíêàì ìàòåìàòè÷åñêîãî îæèäàíèÿ è äèñïåðñèè êîìïîíåíò ñëó÷àéíîãî âåêòîðà (ξ, η):
P
[(xk − x̄)(yk − ȳ)]
ρ̂ = pP k P
2 2
k (xk − x̄) k (yk − ȳ)
10
à âûáîðî÷íûå îðìóëû âûøå áóäóò ñîîòâåòñòâåííî îöåíêàìè ýòèõ âåëè÷èí. Çäåñü ìû ýòî îñòàâëÿåì áåç äîêà-
çàòåëüñòâà, ññûëêà íà ñòàòüþ doi: 10.1016/j.jspi.2006.06.045
4.4 Óïðàæíåíèÿ
Ïðèãîòîâüòå âûáîðêó X èç 999 çíà÷åíèé ñëó÷àéíîãî âåêòîðà (α, β) ñ íåçàâèñèìûìè è ðàâíîìåðíî ðàñïðåäåëåí-
íûìè íà [0, 1] êîìïîíåíòàìè.
1. Äîáàâüòå â èñõîäíóþ âûáîðêó X ïàðó çíà÷åíèé (âûáðîñ) (100, 100) ýòî áóäåò ìíîæåñòâî äàííûõ Y è
âû÷èñëèòå äëÿ ìíîæåñòâà äàííûõ Y çíà÷åíèÿ êîýèöèåíòà êîððåëÿöèè ïî îðìóëå Ïèðñîíà.
2. Äîáàâüòå â âûáîðêó X ïàðó çíà÷åíèé (âûáðîñ) (5, 5) ýòî áóäåò ìíîæåñòâî äàííûõ Y è âû÷èñëèòå äëÿ
ìíîæåñòâà äàííûõ Y çíà÷åíèÿ ïî îðìóëå Ïèðñîíà.
3. Äîáàâüòå â èñõîäíóþ âûáîðêó X ïàðó çíà÷åíèé (âûáðîñ) (100, 100) ýòî áóäåò ìíîæåñòâî äàííûõ Y è
âû÷èñëèòå äëÿ ìíîæåñòâà äàííûõ Y çíà÷åíèÿ êîýèöèåíòà êîððåëÿöèè ïî îðìóëå Ñïèðìåíà.
4. Äîáàâüòå â âûáîðêó X ïàðó çíà÷åíèé (âûáðîñ) (5, 5) ýòî áóäåò ìíîæåñòâî äàííûõ Y è âû÷èñëèòå äëÿ
ìíîæåñòâà äàííûõ Y çíà÷åíèÿ ïî îðìóëå Ñïèðìåíà.
5. Ñðàâíèòå ñ îòâåòàìè ïî îðìóëå Ïèðñîíà.
5 Íàïðèìåð, ïðè m = 1 ñèñòåìà èíòåðâàëîâ áèíèðîâàíèÿ â êîëè÷åñòâå k øòóê îïðåäåëÿåò ãèñòîãðàììó, òî åñòü íàáîð èç k
âåëè÷èí, îòâå÷àþùèõ ¾÷èñëó óñïåõîâ ïîïàäàíèÿ â êàæäûé áèí¿
11
îáðàçîì, ñòàòèñòè÷åñêàÿ ïðîâåðêà êàæäîãî èç áèíîìèàëüíûõ çàêîíîâ ïðè äîñòàòî÷íî áîëüøîé äëèíå n èñõîäíîé
âûáîðêè ñâÿçàíà ñ îäíèì è òåì æå ðàñïðåäåëåíèåì N (0, 1). Ïðè èêñèðîâàííîé âûáîðêå ïðèáëèæåíèå êàæäîé
êîìïîíåíòû ïðåäåëüíûì ãàóññîâûì çàêîíîì èìååò ðàçíóþ òî÷íîñòü, íî âîçìîæíà (áëàãîäàðÿ ðåçóëüòàòó áðè-
òàíñêîãî áèîëîãà è ñòàòèñòèêà îíàëüäà Ôèøåðà) è îäíîâðåìåííàÿ ïðîâåðêà ãèïîòåç îáî âñåõ âåðîÿòíîñòÿõ pi (è
òåì ñàìûì ïðîâåðêà ãèïîòåçû î ïàðàìåòðàõ ðàñïðåäåëåíèÿ α ~ ) ñ èñïîëüçîâàíèåì îöåíêè äëÿ êîìáèíàöèè ýòèõ
áèíîìèàëüíûõ çàêîíîâ. Îöåíêà âûáðàíà òàê, ÷òî îíà ñõîäèòñÿ ïî ðàñïðåäåëåíèþ ê ðàñïðåäåëåíèþ χ2 áûñòðåå,
÷åì ñõîäèìîñòü ê ãàóññîâûì ðàñïðåäåëåíèÿì â êàæäîé èç êîìïîíåíò ( äîñòàòî÷íî äëèííîå äîêàçàòåëüñòâî ýòî-
ãî àêòà åñòü â êíèãå Âàí äåð Âàðäåí "Ìàòåìàòè÷åñêàÿ ñòàòèñòèêà"). Äëÿ íå î÷åíü áîëüøèõ n èñïîëüçîâàíèå
ïðåäåëüíîãî χ2 -ðàñïðåäåëåíèÿ áóäåò çàâåäîìî íåòî÷íûì, ïîýòîìó íàðÿäó ñ òåñòîì χ2 èìååò ìåñòî òåñò Ôèøåðà,
îñíîâàííûé íà îðìóëàõ ñîîòâåòñòâóþùèõ áèíîìèàëüíûõ ðàñïðåäåëåíèé.
Ïðîâåðêà ãèïîòåçû î íåçàâèñèìîñòè êîìïîíåíò ñëó÷àéíîãî âåêòîðà (χ2 -òåñò Ïèðñîíà) Ïåðåñ÷èòàåì
(èñïîëüçóÿ ïîäõîäÿùèå èíòåðâàëû áèíèðîâàíèÿ) âûáîðêó êîìïîíåíò â âûáîðêó ïàð (i, j) äèñêðåòíûõ ñëó÷àé-
íûõ âåëè÷èí, ïîëó÷àåì òàáëèöó ÷èñåë ni,j , îòâå÷àþùèõ êîëè÷åñòâàì íàáëþäåíèé ïàð çíà÷åíèé:
1 2 ... k
1 n1,1 n1,2 . . . n1,k
2 n2,1 n2,2 . . . n2,k
... ... ... ... ...
l nl,1 nl,2 . . . nl,k
P
Îáîçíà÷èì ñóììû ÷èñåë ni,j ïî ñòðîêàì è ïî ñòîëáöàì ñîîòâåòñòâåííî ÷åðåç Ni è Mj , ïóñòü mi,j = Ni Mj / ni,j
Îöåíêîé D îòêëîíåíèÿ îò íåçàâèñèìîñòè (àíàëîãè÷íîé ðàññòîÿíèþ â ïðåäûäóùåì ïðèìåðå) áóäåò
Xl X k
(ni,j − mi,j )2
D=
i=1 j=1
mi,j
Òàêæå äîñòàòî÷íî èçâåñòíû ïðèìåíåíèÿ ìåòîäà χ2 ê ðàññìàòðèâàåìûì ðàíåå çàäà÷àì ðàçëè÷åíèÿ äâóõ ðàñ-
ïðåäåëåíèé, ïðîâåðêàì ãèïîòåç î ñîâïàäåíèè ïàðàìåòðîâ è ò ï.
Èç êóðñà Òåîðèÿ Âåðîÿòíîñòåé íàì èçâåñòíî îïðåäåëåíèå ñòàòèñòè÷åñêîé çàâèñèìîñòè êàê ¾íå íåçàâèñìîñòè¿,
÷òî óêàçûâàåò íà âîçìîæíîñòü èñïîëüçîâàíèÿ â êðèòåðèè õàðàêòåðèñòèê íåçàâèñèìîñòè, íàïðèìåð, êîýè-
öèåíòà êîððåëÿöèè.  òåîðèè êîýèöèåíò êîððåëÿöèè äîëæåí áûòü íóëåâûì äëÿ íåçàâèñèìûõ ñëó÷àéíûõ
12
âåëè÷èí, ñëåäîâàòåëüíî, åñëè îöåíêà êîýèöèåíòà êîððåëÿöèè ïî âûáîðêå óêàçûâàåò íà òî, ÷òî îí íå ÿâëÿåò-
ñÿ ìàëûì, òî ãèïîòåçó î íåçàâèñèìîñòè íàäî îòâåðãíóòü. Âîïðîñ îá óðîâíå çíà÷åíèé îöåíî÷íîãî êîýèöèåíòà
êîððåëÿöèè ìîæåò áûòü àíàëèòè÷åñêè ðàçðåøåí â ñëó÷àå áîëüøèõ ãàóññîâûõ âûáîðîê.
q1−ǫ/2 , èìååì
s s !
nS 2 nS 2 nS 2
1 − ǫ = P qǫ/2 6 2 6 q1−ǫ/2 è 1−ǫ=P 6t6
t q1−ǫ/2 qǫ/2
6 Ñèìóëÿöèîííûå ìåòîäû
Øàã 2: Âìåñòî èíòåãðèðîâàíèÿ àïðîêñèìèðóåì çíà÷åíèÿ DFξ∗ (Tn ) ñ ïîìîùüþ ñèìóëÿöèé âûáîðîê. Íà ýòîì øàãå
ñèìóëÿöèé ìîæíî ñäåëàòü ìíîãî, òàê ÷òî ìîæíî íàäåÿòüñÿ, ÷òî èòîãîâàÿ àïðîêñèìàöèÿ áóäåò äîñòàòî÷íî
òî÷íîé.
13
Ïðèìåð Ïóñòü Tn = x̄, òîãäà ïîñëå ïåðâîãî øàãà ñðàçó èìååì âû÷èñëåíèå èíòåãðàëà ïî ñòóïåí÷àòîé óíêöèè
P
ðàñïðåäåëåíèÿ: DFξ∗ (Tn ) = S 2 /n, ãäå S 2 = n−1 i (xi − x̄)2 . Íî ýòî ïîòîìó ÷òî îðìóëà g â âûðàæåíèè äëÿ
îêàçàëàñü î÷åíü ïðîñòà, à â îáùåì ñëó÷àå óíêöèîíàëà ïðîñòîé îðìóëû äëÿ DFξ∗ (Tn ) ìîæåò è íå áûòü è òîãäà
ïîíàäîáèòñÿ øàã 2.
Î ãåíåðàöèè äèñêðåòíûõ çàêîíîâ Óêàçàííûé ìåòîä òðåáóåò ñèìóëÿöèè äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí ñ
α a1 a2 . . . am
êîíå÷íûì ÷èñëîì çíà÷åíèé Êàê ýòî äåëàåòñÿ: ñíà÷àëà íàäî ðàçáèòü áîëüøîé îòðåçîê íà
p1 p2 . . . pm
ñèñòåìó ìåíüøèõ, äëèíû êîòîðûõ ïðîïîðöèîíàëüíû p1 , p2 , . . . pm è ñèìóëèðîâàòü ðàâíîìåðíîå ðàñïðåäåëåíèå
òîãäà ÷àñòîòû ïîïàäàíèÿ â ìåíüøèå îòðåçêè ñòàòèñòè÷åñêè ñîîòâåòñòâóþò p1 , p2 , . . . pm . Îñòàëîñü ñîïîñòàâèòü
òî÷êàì ïîïàâøåé â îòðåçîê ñ íîìåðîì k çíà÷åíèå ak .
Áîëåå óäîáíàÿ âåðñèÿ áóòñòðàïà Â ïðèâåäåííîì ïðèìåðå ñèìóëÿöèÿ äàííûõ áûëà îñíîâàíà íà åäèíñòâåí-
íîé (ñòóïåí÷àòîé) óíêöèè Fn∗ (x) ýòî íàèáîëåå íåïðèÿòíûé íåïàðàìåòðè÷åñêèé ñëó÷àé, êîãäà îòñóòñòâóþò
áîëåå òî÷íûå ãèïîòåçû î ðàñïðåäåëåíèè. àçóìååòñÿ, â ïàðàìåòðè÷åñêîì ñëó÷àå íàäî îðãàíèçîâàòü ãåíåðàöèþ â
ñîãëàñèè ñ ãèïîòåòè÷åñêîé óíêöèåé ðàñïðåäåëåíèÿ Fξ (x), ÷òî ïðàêòè÷åñêè ñîîòâåòñòâóåò îöåíèâàíèþ, òîëüêî
âåðîÿòíîñòè çàìåíåíû íà ÷àñòîòû. Ïðè ýòîì â ñëó÷àå íåïðåðûâíîãî ðàñïðåäåëåíèÿ íå âîçíèêàåò îãðàíè÷åíèé
íà âåëè÷èíó N .
Áîëåå îáùèì îáðàçîì áóòñòðàïîì ÷àñòî íàçûâàþò ïîäñ÷åò âåðîÿòíîñòíûõ õàðàêòåðèñòèê (íàïðèìåð, ìî-
ìåíòîâ èëè êâàíòèëåé) ñ ïîìîùüþ áîëüøîé ñåðèè ñèìóëÿöèé ñ ïîñëåäóþùèì îöåíèâàíèåì âåðîÿòíîñòåé ÷åðåç
íàáëþäàåìûå â áîëüøîé ñåðèè ÷àñòîò. Èìåííî òàêîé ïîäõîä áûë èñïîëüçîâàí íàìè ðàíåå, òàê ÷òî ìîæíî ñ÷è-
òàòü, ÷òî ñ ïðèìåíåíèåì áóòñòðàïà çíàêîìñòâî óæå ñîñòîÿëîñü.
Ïðîñòåéøèé ìåòîä çàêëþ÷åí â îðìóëå (êàê âñåãäà zα/2 îáîçíà÷àåò êâàíòèëü íîðìàëüíîãî ðàñïðåäåëåíèÿ
N (0, 1)
T̂n ± zα/2 se
b boot
Åñëè èçíà÷àëüíî ξ íå ÿâëÿëàñü ãàóññîâîé ñëó÷àéíîé âåëè÷èíîé, òî òî÷íîñòü ýòîé îðìóëû íå âïîëíå ÿñíà.
Èäåÿ çàêëþ÷àåòñÿ â òîì, ÷òîáû ñíà÷àëà íåïîñðåäñòâåííî ñèìóëèðîâàòü çíà÷åíèÿ Tn , îïèðàÿñü íà áîëüøîé
çàïàñ âûáîðîê, ïîëó÷åííûõ ëèáî â ñîãëàñèè ñ ïðåäïîëîæèòåëüíûì çàêîíîì ðàñïðåäåëåíèÿ Fξ (x), ëèáî íà Fn∗ (x)
à ïîòîì âûáðàòü êîíöû èíòåðâàëà â ñîîòâåòñòâèè ñ ïîäñ÷èòàííûìè ïî ñèìóëÿöèÿì êâàíòèëÿì.
14
6.2.3 Äðóãèå ìåòîäû
Äîñòàòî÷íîå ÷èñëî ðàçíûõ ïîäõîäîâ ê ïîñòðîåíèþ äîâåðèòåëüíûõ èíòåðâàëîâ ìîæíî ñîîðóäèòü, ìåíÿÿ âà-
ðèàíòû êàê ñèìóëèðóåòñÿ çíà÷åíèå Tn : êàêèå ïðè ýòîì ðàññìàòðèâàþòñÿ ìåðû (íàïðèìåð, Fξ (x) èëè Fn∗ (x) ),
îïèðàåìñÿ ëè ìû íà êâàíòèëè äëÿ îïðåäåëåíèÿ êîíöîâ èíòåðâàëà èëè èñïîëüçóåì òî÷å÷íûå îöåíêè ñòàíäàðòíîé
îøèáêè, âàðèàíòû ïðîñ÷åòà ýòîé ñòàíäàðòíîé îøèáêè è.ò.ä.).
Ïðè ýòîì Tei íàçûâàþòñÿ ïñåâäîçíà÷åíèÿìè. Ñëåäóåò ïîìíèòü îäíàêî, ÷òî òàê óñòðîåííûå îöåíêè íå îáÿçàòåëüíî
ÿâëÿþòñÿ ñîñòîÿòåëüíûìè, òî åñòü ïðè n → ∞ íå îáÿçàòåëüíî ñõîäÿòñÿ ïî âåðîÿòíîñòè ê èñòèííûì çíà÷åíèÿì
ïàðàìåòðà.
7 Ñìåñè ðàñïðåäåëåíèé
Òåîðèÿ, ñ êîòîðîé äî ñèõ ïîð âû ñòàëêèâàëèñü, íàöåëåíà íà ïðèìåíåíèÿ, òî åñòü íà àíàëèç ðåàëüíûõ äàííûõ
èçìåðåíèé.  áîëüøèíñòâå ïðèìåðîâ èäåò î äîâîëüíî òîíêèõ ñâîéñòâàõ âûáîðêè çíà÷åíèé, íî íåîáõîäèìî ðàç
è íàâñåãäà îòìåòèòü ñëåäóþùåå: ìàòåìàòè÷åñêàÿ ñòàòèñòèêà âñåãäà îïåðèðóåò ñ äàííûìè êðàéíå ñïåöèàëüíîãî
âèäà, à èìåííî ïîëó÷åííûõ â ðàìêàõ îäèíàêîâûõ ïîâòîðíûõ è íåçàâèñèìûõ èçìåðåíèé, íà ïðàêòèêå ïðî-
âåðêà ïîäîáíîãî ðîäà îãðàíè÷åíèé íà äàííûå åäâà ëè âîçìîæíà. Òàêèì îáðàçîì, íåâûïîëíåíèå â ðåàëüíûõ
äàííûõ ñâîéñòâ, êîòîðûå îæèäàþòñÿ îò âûáîðêè, ìîæåò ñèëüíî ïîâëèÿòü íà àíàëèç è íà âûâîäû.  ïðàêòè÷å-
ñêèõ ñèòóàöèÿõ ñëåäóåò âñåãäà ïðîäóìûâàòü ñëåäóþùèé âîïðîñ: íà êàêîì îñíîâàíèè ìû ïðåäïîëîæèëè,
15
÷òî èìåþùèåñÿ äàííûå ñâÿçàíû ñ èêñèðîâàííûì (÷àñòî ãàóññîâûì) çàêîíîì ðàñïðåäåëåíèÿ òàê,
÷òî íàì îñòàåòñÿ ëèøü îöåíèâàòü íåèçâåñòíûå ïàðàìåòðû ýòîãî çàêîíà. àçóìååòñÿ, åñëè ïðèíÿòü,
÷òî â ïîñëåäîâàòåëüíîñòè èçìåðåíèé (x1 , x2 , . . . xn ) çíà÷åíèÿ âîçíèêàþò èç ñîâåðøåííî íåèçâåñòíûõ ñëó÷àé-
íûõ âåëè÷èí, òî ñòàíîâèòñÿ íåïîíÿòíî, ÷åì èìåííî ñòàòèñòè÷åñêèå ìåòîäû ìîãóò çäåñü ïîìî÷ü. Ïîýòîìó ðàñ-
ñìîòðèì ïðîìåæóòî÷íóþ ðåàëèñòè÷åñêóþ ñèòóàöèþ, êîãäà â ïîñëåäîâàòåëüíîñòè èçìåðåíèé ìû èìååì äåëî
ñî ñëó÷àéíûìè âåëè÷èíàìè èç íåêîòîðîãî ñåìåéñòâà ðàñïðåäåëåíèé, ïðè÷åì ýòî ñåìåéñòâî ìîæåò áûòü ïàðà-
ìåòðèçîâàíî (îáû÷íî çíà÷åíèÿìè èç R). Îäíà èç ñîîòâåòñòâóþùèõ ìàòåìàòè÷åñêèõ ìîäåëåé çäåñü íàçûâàåòñÿ
Ñìåñü èëè ðàíäîìèçàöèÿ, à åå ïðàêòè÷åñêèé ñìûñë ñëåäóþùèé: â ïðîöåññå èçìåðåíèÿ ìû èìååì äåëî ñî
çíà÷åíèÿìè ñëó÷àéíûõ âåëè÷èí èç íåêîòîðîãî ïàðàìåòðèçîâàííîãî ñåìåéñòâà {ξt } îäíîòèïíûõ
ðàñïðåäåëåíèé, ïðè÷åì ïàðàìåòð t çäåñü èçìåíÿåòñÿ òàêæå ñëó÷àéíî è íåçàâèñèìî . Êàæäîå ïî-
6
ñëåäîâàòåëüíîå èçìåðåíèå ïîëó÷åíî êàê xk = θ(ω) = ξβ(ω) (ω), ïðè ýòîì èìåþòñÿ ãèïîòåçû îòíîñèòåëüíî çàêîíîâ
ðàñïðåäåëåíèÿ ñëó÷àéíûõ âåëè÷èí β è ξ òàê, ÷òî ìîæíî ðàññìàòðèâàòü çàäà÷ó î (íå)îòáðàñûâàíèè ýòèõ ãèïîòåç
íà íåêîòîðîì äîâåðèòåëüíîì óðîâíå.
Îêàçûâàåòñÿ, ÷òî â ýòîì ñëó÷àå äàííûå ïðåäñòàâëÿþò âûáîðêó çíà÷åíèé ñëó÷àéíîé âåëè÷èíû θ, ðàñïðåäå-
ëåíèå êîòîðîé è íàçûâàåòñÿ ñìåñüþ ðàñïðåäåëåíèé. Òåì ñàìûì ìû îêàçûâàåìñÿ â ðàìêàõ îáû÷íîãî ñòàòèñòè-
÷åñêîãî ïîäõîäà è ïðîâåðÿåì ãèïîòåçó î ðàñïðåäåëåíèè, îòâå÷àþùåì êîíêðåòíîìó òèïó ñìåñè. Âíà÷àëå áîëåå
âíèìàòåëüíî ðàçáåðåì îïðåäåëåíèå, êîòîðîå áûëî â ëåêöèÿõ.
Ïðîâåðüòå, ÷òî óíêöèÿ w(x) ñàìà ÿâëÿåòñÿ óíêöèåé ïëîòíîñòè ñëó÷àéíîé âåëè÷èíû, òî åñòü w(x) =
fθ (x).
Äëÿ òîãî, ÷òîáû åå ÿâíî âû÷èñëèòü ñëåäóåò ðàññìàòðèâàòü ðàñïðåäåëåíèå ñëó÷àéíîãî âåêòîðà íà x, y -ïëîñêîñòè
ñ ñîîòâåòñòâóþùåé ìåðîé. Íàïðèìåð, åñëè α ñ.â. ñ ïëîòíîñòüþ fα (x) = v(x) òîãäà äëÿ èêñèðîâàííîãî çíà÷åíèÿ
ïàðàìåòðà t > 0 ñ.â. α/t èìååò ïëîòíîñòü v(xt)t. àññìàòðèâàÿ ïàðàìåòð t êàê çíà÷åíèå (íåçàâèñèìîé) ñëó÷àéíîé
âåëè÷èíû γ ñ ïëîòíîñòüþ u ìû ïîëó÷àåì îðìóëó äëÿ ïëîòíîñòè îòíîøåíèÿ ñëó÷àéíûõ âåëè÷èí α/γ , êîòîðàÿ
ìîæåò áûòü èíòåðïðåòèðîâàíà êàê ïëîòíîñòü ñìåñè ïåðåøêàëèðîâàííûõ ïîñðåäñòâîì ñëó÷àéíîãî ìàñøòàáíîãî
ïàðàìåòðà γ ñëó÷àéíûõ âåëè÷èí α:
Z∞
w(x) = v(xt)tu(t)dt
0
16
-2 -1 1 2
1
0.5 0.1
-2 -1 0 1 2 0.01
èñ. 2: åçóëüòàò ðàâíîìåðíîãî ïåðåìåøèâàíèÿ äåâÿòè íåçàâèñèìûõ ãàóññîâñêèõ ñëó÷àéíûõ âåëè÷èí ñ íóëå-
âûì ìàòåìàòè÷åñêèì îæèäàíèåì è ñòàíäàðòíûìè óêëîíåíèÿìè σ = 0.1, . . . 0.9. ñïëîøíîé ëèíèåé ïîêàçàíà ñî-
2
1 P9
îòâåòñòâóþùàÿ óíêöèÿ ïëîòíîñòè w(x) = 9 m=1 m√2π exp − 2 m
10 1 10x
, ïóíêòèðîì ïîê è îðìàëèçìàçàíà
ïëîòíîñòü àïïðîêñèìèðóþùåãî ðàñïðåäåëåíèÿ Ëàïëàñà 1.3 exp (−2.6|x|). Ñëåâà: ëèíåéíûé ìàñøòàá, ñïðàâà: ïî-
ëóëîãàðèìè÷åñêèé ìàñøòàá
4. Êàê óáåäèòüñÿ íàãëÿäíûì îáðàçîì, ÷òî ïîëó÷èâøàÿñÿ îðìà ãèñòîãðàììû îòëè÷àåòñÿ îò ãàóññèàíû? (ïîä-
ñêàçêó ñì. íà êàðòèíêå èñ 2 ñïðàâà)
5. Îòëè÷èå îðìû êðèâîé íà èñ 2 îò ãàóññèàíû ñâÿçàíî ñ èñïîëüçóåìîé ýêîíîìèñòàìè (è íå òîëüêî) âåëè-
÷èíîé êóðòîçèñà, êîòîðàÿ âû÷èñëÿåòñÿ êàê îòíîøåíèå ÷åòâåðòîãî öåíòðàëüíîãî ìîìåíòà ðàñïðåäåëåíèÿ ê
êâàäðàòó äèñïåðñèè. Íàéäèòå ñîîòâåòñòâåííî êóðòîçèñû ãàóññèàíû N (0, 1) è êðèâîé ïëîòíîñòè ðàñïðåäå-
ëåíèÿ Ëàïëàñà exp (−2|x|).
6. Ñîðìóëèðóéòå íåïðåðûâíóþ âåðñèþ óêàçàííîãî ïðèìåðà, â êîòîðîé ñ.â. β ðàâíîìåðíî ðàñïðåäåëåíà íà
îòðåçêå [0, 1]. Íàéäèòå ÿâíûé âèä ïëîòíîñòè ξβ â ýòîì ñëó÷àå. åøåíèå ìîæíî íàéòè â ñëåäóþùåì ðàçäåëå.
Cëîæèëîñü, ÷òî ñòàòèñòèêà íà ïðàêòèêå ÷àùå âñåãî èñïîëüçóåòñÿ â ïðèìåíåíèè ê âûáîðêàì ãàóññîâîé ñëó-
÷àéíîé âåëè÷èíû. Êàê óæå ãîâîðèëîñü âûøå, áîëåå ðåàëèñòè÷íûé ñëó÷àé îòâå÷àåò âûáîðêàì èç ñåìåéñòâà ñëó-
÷àéíî øêàëèðîâàííûõ ãàóññîâûõ ñëó÷àéíûõ âåëè÷èí. Ìû ðàññìîòðèì çäåñü íåñêîëüêî ïðèìåðîâ âû÷èñëåíèé
äëÿ ñèòóàöèè, êîãäà âñå ãàóññîâû ñëó÷àéíûå âåëè÷èíû èìåþò íóëåâîå ìàòåìàòè÷åñêîå îæèäàíèå; ýòî òèïè÷íàÿ
ñèòóàöèÿ ïðè èçìåðåíèè òî÷íîñòè ïîêàçàíèé ïðèáîðà â óñëîâèÿõ âëèÿíèÿ íà íåãî âíåøíèõ âîçäåéñòâèé.
17
3
-2 -1 1 2
0.1
1
-2 -1 0 1 2 0.01
2
èñ. 3: ðàèêè ïëîòíîñòè fθ (x) = √18π Γ 0, x2 äëÿ ðàâíîìåðíîé ñìåñè öåíòðèðîâàííûõ ãàóññîâûõ ðàñïðåäå-
ëåíèé Îáðàòèòå âíèìàíèå íà áåñêîíå÷íîå çíà÷åíèå ïëîòíîñòè ïðè íóëåâîì x. Ñëåâà: ëèíåéíàÿ øêàëà, ñïðàâà:
(äåñÿòè÷íàÿ) ïîëóëîãàðèìè÷åñêàÿ øêàëà. Îáðàòèòå âíèìàíèå íà íåïîõîæåñòü íà ïëîòíîñòü ðàñïðåäåëåíèÿ
Ëàïëàñà.
Zc Z∞
1 1 x2 −1 1 1
√ exp − 2 y dy = √ exp − (xu) u−1 du
2
c 2π 2y c 2π 2
0 1/c
à âòîðàÿ t = 2 (xu) :
1 2
Z∞ Z∞
1 1 1 1 x2
√ exp − (xu) u−1 du = √
2
t −1
exp(−t)dt = √ Γ 0, 2
c 2π 2 2c 2π c 8π 2c
1/c x2 /(2c2 )
Çàïèøåì ðàññóæäåíèå î ñâÿçè ñìåñåé ñ ïëîòíîñòüþ îòíîøåíèÿ ñ.â íà ñëó÷àé ñìåøèâàíèÿ ñåìåéñòâà öåíòðèðî-
âàííûõ ãàóññîâûõ ðàñïðåäåëåíèé fσ = N (0, σ 2 ) ñ ïîìîùüþ ñ.â. β > 0:
Z∞
1 1 x2 −1
fθ (x) = √ exp − 2 t fβ (t)dt
2π 2t
0
Z∞
1 1 2 2
= √ exp − y x ygη (y)dy
2π 2
0
18
Åñëè ðàññìîòðåòü ïîñëåäîâàòåëüíûå ìàëûå ñìåøèâàíèÿ, òî åñòü êàæäàÿ ñìåøèâàþùàÿ ñ.â. β > 0 èìååò
ïëîòíîñòü fβ ∼ 0 âíå [1 − ε, 1 + ε] äëÿ íåêîòîðîãî ìàëîãî çíà÷åíèÿ ε. Èíûìè ñëîâàìè, ìû ìîæåì ïðåäïîëàãàòü,
÷òî β = eδ ãäå ìàòåìàòè÷åñêîå îæèäàíèå E(δ) ∼ 0 è äèñïåðñèÿ D(δ) ∼ ε2 . Äëÿ ïîñëåäîâàòåëüíîñòè òàêèõ ìàëûõ
ñìåøèâàíèé (ñ íåçàâèñèìûìè βi ) ìû èìååì îòíîøåíèå
α α
= − Pm δ (5)
η1 · η2 . . . · ηm e i i
Pm
Íî â äîñòàòî÷íî ñëàáûõ îáùèõ ïðåäïîëîæåíèÿõ
p ðàñïðåäåëåíèå ñóììû i δi áûñòðî ñõîäèòñÿ ê ðàñïðåäåëåíèþ
P m 2
N (a, s2 ) with a ∼ 0 ïðè ýòîì s ∼ i εi , òàêèì îáðàçîì, ñëó÷àé ïîñëåäîâàòåëüíîñòè ìàëûõ ïðîèçâîëüíûõ
ñìåøèâàíèé ìîæåò áûòü àïïðîêñèìèðîâàíà ñ ïîìîùüþ ïëîòíîñòè
Z∞
1 x2 1 ln2 t
fθ (x) = √ exp − 2 2 √ exp − 2 dt (6)
tσ 2π 2t σ ts 2π 2s
0
Åñëè â ðåàëüíîé ñèòóàöèè äàííûå äåéñòâèòåëüíî âîçíèêëè êàê ðåçóëüòàò ìíîãèõ ìàëûõ ñìåøèâàíèé, òî ýòà
îðìóëà çàäàåò ïðàâäîïîäîáíóþ ìîäåëü ðàñïðåäåëåíèÿ θ äëÿ äàëüíåéøåé ñòàòèñòè÷åñêîé ïðîâåðêè. Òî÷å÷íàÿ
îöåíêà ïàðàìåòðîâ s è σ ìîæåò áûòü ïîëó÷åíà èçâåñòíûì â ñòàòèñòèêå ¾ìåòîäîì ìîìåíòîâ¿, à èìåííî:
Z
+∞
Íà ïðàêòèêå, èñïîëüçóÿ äàííûå, íàäî ïîëó÷èòü îöåíêè ìîìåíòîâ Eθ2 , E|θ| à çàòåì ÷åðåç íèõ âûðàçèòü ñîá-
ñòâåííî íåîòðèöàòåëüíûå ïàðàìåòðû s σ
8 Ìîäåëèðîâàíèå äàííûõ
19
ïðèíöèïà ìàêñèìóìà ïðàâäîïîäîáèÿ, à èìåííî ëîãàðèìè÷åñêàÿ óíêöèÿ ïðàâäîïîäîáèÿ (äëÿ ãàóññîâîé âû-
áîðêè) äîëæíà îáðàùàòüñÿ â ìàêñèìóì íà âûáîðêå ε1 , ε1 , . . . εn
n 2
1X yi − f (xi , b0 , b1 , b2 , . . . bm )
l(b1 , b2 , . . . bm ) = − → max
2 i=1 σ
è íàçûâàåòñÿ ìåòîäîì íàèìåíüøèõ êâàäðàòîâ (ÌÍÊ). ïðè÷åì òðàäèöèîííî èñïîëüçóþò îáîçíà÷åíèå, ñîâïàäàþ-
ùåå ñ îáîçíà÷åíèåì ñëó÷àéíîé âåëè÷èíû (÷òî âíîñèò ïóòàíèöó äëÿ íåîèòîâ). Çàìåòèì, ÷òî ïîñëåäíåå óñëîâèå
ìèíèìóìà çàâèñÿùåãî îò ïàðàìåòðîâ (b0 , b1 , b2 , . . . bm ) âûðàæåíèÿ (äëÿ êîòîðîãî òðàäèöèîííî èñïîëüçóþò ïî÷òè
òî æå ñàìîå îáîçíà÷åíèå χ
b2 , ÷òî è äëÿ ñëó÷àéíîé âåëè÷èíû) ïðèâîäèò ê ñèñòåìå óðàâíåíèé:
2
∂χ b (b0 ,b1 ,b2 ,...bm )
2 ∂b0 =0
∂ χb (b0 ,b1 ,b2 ,...bm )
∂b2 =0
. . .
... ...
∂ χb2 (b0 ,b1 ,b2 ,...bm )
∂bm =0
1. Âûáîðêà ε1 , ε1 , . . . εn ñëó÷àéíîé ãàóññîâîé âåëè÷èíû, ðàñïðåäåëåííîé êàê N (0, 20), n = 100, (b0 , b1 , b2 ) =
(2.0, −1.0, 0.5), òî÷êè xi âûáèðàþòñÿ ñ ðàâíûì øàãîì íà îòðåçêå [2, 5], à âîññòàíàâëèâàþòñÿ ïàðàìåòðû
ïîëèíîìà ïåðâîãî ïîðÿäêà. Îïðîâåðãàåòñÿ ëè ñèìóëèðîâàííûìè äàííûìè ìîäåëü ïåðâîãî ïîðÿäêà?
2. Âûáîðêà ε1 , ε1 , . . . εn ñëó÷àéíîé ãàóññîâîé âåëè÷èíû, ðàñïðåäåëåííîé êàê N (0, 20), n = 100, äëÿ ñèìóëÿ-
öèè èñïîëüçóåòñÿ ïîëèíîì ïåðâîãî ïîðÿäêà (b0 , b1 ) = (2.0, −1.0), òî÷êè xi âûáèðàþòñÿ ñ ðàâíûì øàãîì íà
îòðåçêå [2, 5], à âîññòàíàâëèâàþòñÿ ïàðàìåòðû ïîëèíîìà âòîðîãî ïîðÿäêà. Îïðîâåðãàåòñÿ ëè ñèìóëèðîâàí-
íûìè äàííûìè ìîäåëü âòîðîãî ïîðÿäêà?
3. Âûáîðêà ε1 , ε1 , . . . εn ñëó÷àéíîé ãàóññîâîé âåëè÷èíû, ðàñïðåäåëåííîé êàê N (0, 20), n = 200, (b0 , b1 , b2 ) =
(2.0, −1.0, 0.5), òî÷êè xi èç ðàâíîìåðíîãî íà îòðåçêå [2, 5] ðàñïðåäåëåíèÿ, à âîññòàíàâëèâàþòñÿ ïàðàìåòðû
ïîëèíîìà ïåðâîãî ïîðÿäêà. Îïðîâåðãàåòñÿ ëè ñèìóëèðîâàííûìè äàííûìè ìîäåëü ïåðâîãî ïîðÿäêà?
4. Âûáîðêà ε1 , ε1 , . . . εn ñëó÷àéíîé ãàóññîâîé âåëè÷èíû, ðàñïðåäåëåííîé êàê N (0, 20), n = 200, äëÿ ñèìóëÿöèè
èñïîëüçóåòñÿ ïîëèíîì ïåðâîãî ïîðÿäêà (b0 , b1 ) = (2.0, −1.0), òî÷êè xi èç ðàâíîìåðíîãî íà îòðåçêå [2, 5]
ðàñïðåäåëåíèÿ, à âîññòàíàâëèâàþòñÿ ïàðàìåòðû ïîëèíîìà âòîðîãî ïîðÿäêà. Îïðîâåðãàåòñÿ ëè ñèìóëèðî-
âàííûìè äàííûìè ìîäåëü âòîðîãî ïîðÿäêà?
20