Вы находитесь на странице: 1из 20

1 Ââåäåíèå: ïðèíöèïû ðàáîòû ñ äàííûìè â ñòàòèñòèêå

Ïóñòü èìååòñÿ âûáîðêà èç ãåíåðàëüíîé ñîâîêóïíîñòè ðàçìåðà n  òàêàÿ îðìóëèðîâêà óæå îçíà÷àåò ïðè-
íÿòèå ñïåöèàëüíûõ óñëîâèé ñòàòèñòè÷åñêîé ìîäåëè, à èìåííî:
Íàëè÷èå íåêîòîðîé ñëó÷àéíîé âåëè÷èíû (âàðèàíò  ñëó÷àéíîãî âåêòîðà) ξ : Ω → R, óíêöèÿ ðàñïðåäåëåíèÿ
Fξ êîòîðîé íàì íå ïîëíîñòüþ èçâåñòíà, à õàðàêòåðèçóåòñÿ ëèøü ïðèíàäëåæíîñòüþ ê íåêîòîðîìó êëàññó F
ðàñïðåäåëåíèé,
Íàëè÷èå ìîäåëè ïîâòîðåíèé (òî åñòü ïîñëåäîâàòåëüíîñòè ξ1 , ξ2 , . . . íåçàâèñèìûõ è ðàñïðåäåëåííûõ òàê æå êàê
ξ ), çàäàþùèõ ìåðó íà ïðîñòðàíñòâå R∞ .
Íàëè÷èå êîíå÷íîé ïîñëåäîâàòåëüíîñòè ÷èñåë ξ1 (ω1 ), ξ2 (ω2 ), . . . ξn (ωn ), êîòîðàÿ, ñîáñòâåííî, è íàçûâàåòñÿ âû-
áîðêîé.

1.1 Òèïè÷íûå çàäà÷è ìàòåìàòè÷åñêîé ñòàòèñòèêè


Òèïè÷íûå çàäà÷è ìàòåìàòè÷åñêîé ñòàòèñòèêè òàêîâû: ïî çàäàííîé âûáîðêå
Îïðåäåëèòü óíêöèþ ðàñïðåäåëåíèÿ Fξ
Îïðåäåëèòü ïëîòíîñòü ðàñïðåäåëåíèÿ fξ (â ïðåäïîëîæåíèè, ÷òî òàêîâàÿ ñóùåñòâóåò).
Îïðåäåëèòü ÷èñëîâîé óíêöèîíàë T (ξ), íàïðèìåð, îïðåäåëèòü ìàòåìàòè÷åñêîå îæèäàíèå E(ξ)
(èëè ðàçîáðàòüñÿ, ñóùåñòâóåò ëè òàêîâîé)
Íåïàðàìåòðè÷åñêàÿ ðåãðåññèÿ Ïî âûáîðêå ïàð (x1 , y1 ), (x2 , y2 ) . . . (xn , yn ) çíà÷åíèé ñëó÷àéíîãî âåêòîðà (ξ, η)
îïðåäåëèòü óíêöèþ ðåãðåññèè r(x) = E(ηkξ = x).
Ëèíåéíàÿ ðåãðåññèÿ â êîððåëÿöèîííîé òåîðèè. Ïóñòü ξ = (α, β) äâóìåðíûé ãàóññîâñêèé âåêòîð, ïðè÷åì
β = cα̇ + d + ǫ, ãäå c, d âåùåñòâåííûå ÷èñëà, à ǫ  âåëè÷èíà ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì. Îöåíèòü
ïî âûáîðêå èç âåêòîðà (x1 , y1 ), (x2 , y2 ) . . . (xn , yn ) çíà÷åíèÿ c, d.
Îñíîâíàÿ çàäà÷à êîððåëÿöèîííîé òåîðèè. Ïî âûáîðêå, îòâå÷àþùåé ìíîãîìåðíîìó ãàóññîâñêîìó ðàñïðå-
äåëåíèþ, îïðåäåëèòü íàáîð åãî ïàðàìåòðîâ.
Íàïîìíèì, ÷òî çà ñëîâîì ¾îïðåäåëèòü¿ ïîäðàçóìåâàåòñÿ äàòü ñòàòèñòè÷åñêèé ñïîñîá îïèñàíèÿ ñ óêàçàíèåì
âåðîÿòíîñòåé ïîïàäàíèÿ èñêîìîãî îáúåêòà â çàäàííûé êëàññ çíà÷åíèé.

1.2 Íåîðìàëüíî î ïðàêòè÷åñêèõ íàâûêàõ


Ìåòîäû ìàòåìàòè÷åñêîé ñòàòèñòèêè òðåáóþò äîñòàòî÷íî äëèííûõ, ïîðîþ ãðîìîçäêèõ âû÷èñëåíèé. àçóìååò-
ñÿ, ÷òî ÷åëîâå÷åñòâî èñïîëüçóåò äëÿ ýòèõ öåëåé êîìïüþòåðû è âîçíèêàåò åñòåñòâåííûé âîïðîñ î íàèëó÷øèõ
ïðîãðàììíûõ ïàêåòàõ äëÿ òàêèõ âû÷èñëåíèé (èõ íåìàëî, íî îíè áûñòðî óñòàðåâàþò â îñíîâíîì èç-çà ðàç-
âèòèÿ îïåðàöèîííûõ ñèñòåì è ãðàèêè). Äîñòàòî÷íî äîëãîå âðåìÿ âåäóùèå ïîçèöèè äëÿ ðàáîòû ñ äàííûìè
çàíèìàë MATLAB, îäíàêî êîììåðöèàëèçàöèÿ ðàçðàáîò÷èêîâ â íàñòîÿùåå âðåìÿ íå ïîçâîëÿåò åãî èñïîëüçî-
âàòü øèðîêî. Äëÿ ó÷åáíûõ öåëåé âïîëíå ãîäèòñÿ ñâîáîäíî ðàñïðîñòðàíÿåìûé ïàêåò OCTAVE, êîòîðûé ñ òî÷êè
çðåíèÿ ïîëüçîâàòåëÿ åñòü òîò æå MATLAB (ðàçëè÷èÿ âèäíû òîëüêî ïðè ðàáîòå ñ î÷åíü áîëüøèìè ìàññèâà-
ìè äàííûõ).  íàñòîÿùèé ìîìåíò èññëåäîâàòåëè BigData â îñíîâíîì èñïîëüçóþò PYTHON è R, ïðè÷åì ýòè
äâà ÿçûêà ïðîãðàììèðîâàíèÿ äëÿ çàäà÷ ñòàòèñòèêè óñïåøíî êîíêóðèðóþò ( î ÷åì èìååòñÿ ñïåöèàëüíîå ðàñ-
ñóæäåíèå https://opensour e. om/arti le/16/11/python-vs-r-ma hine-learning-data-analysis). Ñ òî÷êè
çðåíèÿ îáó÷åíèÿ ìåòîäàì ñîâåðøåííî íåâàæíî, êàêîé èìåííî ÿçûê âûáðàòü, ãëàâíîå ÷òîáû áûëà âîçìîæíîñòü
îïåðèðîâàòü ñ äàííûìè íå îòâëåêàÿñü íà òåõíè÷åñêèå äåòàëè. Îñíîâíûå ïðèåìû âû÷èñëåíèé ñ äàííûìè äàâíî
àëãîðèòìèçèðîâàíû è íà ïðàêòèêå òðåáóåòñÿ ëèøü ïîíèìàíèå òîãî, êàêóþ óíêöèþ èç áèáëèîòåêè ïðîöåäóð
íàäî ïðèìåíèòü. Îäíàêî ñåðüåçíàÿ òðóäíîñòü ñîñðåäîòî÷åíà èìåííî â ïîíèìàíèè: âñåãäà åñòü íåñêîëüêî âîç-
ìîæíîñòåé äåéñòâèÿ è íåòî÷íîå çíàíèå ãðàíèö ïðèìåíèìîñòè ìåòîäà ëåãêî ïðèâåäåò ê áåññìûñëåííîìó îòâåòó.
Íàïðèìåð, îðìóëà äëÿ îöåíêè ìàòåìàòè÷åñêîãî îæèäàíèÿ E(ξ) ÷åðåçâû÷àéíî ïðîñòà (âçÿòü ñðåäíåå çíà÷åíèå
ïî âûáîðêå), íî ìû-òî çíàåì, ÷òî ìàòåìàòè÷åñêîå îæèäàíèå â êàêîì-ëèáî êëàññå F ðàñïðåäåëåíèé âïîëíå ìî-
æåò è íå ñóùåñòâîâàòü  à êàê òîãäà áûòü ñ ïîëó÷åííûì îòâåòîì? Îñíîâíîé ïðèíöèï çàêëþ÷àåòñÿ â òîì, ÷òî
âäîáàâîê ê áèáëèîòå÷íîé óíêöèè (ðåàëèçóþùåé ñòàòèñòè÷åñêóþ îðìóëó èç ñïðàâî÷íèêà) íóæíî åùå çíàòü
íåñêîëüêî ïðèåìîâ äëÿ êîíòðîëÿ ñâîèõ äåéñòâèé, îáñóæäåíèå ñìûñëà ïðèìåíåíèÿ îðìóë ñòàòèñòèêè è êîí-
òðîëüíûõ äåéñòâèé ñîñòàâëÿåò çíà÷èòåëüíóþ ÷àñòü íàøåãî êóðñà. Âîò äâà âàæíåéøèõ íàâûêà ïðè ïðàêòè÷åñêîé
ðàáîòå ìåòîäàìè ìàòåìàòè÷åñêîé ñòàòèñòèêè.

1
Ñèìóëÿöèÿ äàííûõ

Ïîäðàçóìåâàåòñÿ, ÷òî äàííûå äëÿ çàäà÷è âîçíèêàþò èçâíå: ýòî çàêàç îáùåñòâà ñïåöèàëèñòó ïî îáðàáîòêå. Ïðåä-
ïîëîæåíèÿ î òîì êàê óñòðîåíû äàííûå íå âñåãäà îãîâàðèâàþò ñïåöèèêó, íàïðèìåð â èçìåðåíèÿõ ìîæåò ñî-
äåðæàòüñÿ çíà÷èòåëüíàÿ îøèáêà, ïðèðîäà êîòîðîé çàêàç÷èêó íåèçâåñòíà è îí î íåé ìîæåò íè÷åãî è íå çíàòü.
Èññëåäîâàíèå òîãî, êàê ïîâëèÿåò êîíêðåòíàÿ îøèáêà íà îòâåò îñòàåòñÿ ýêñïåðòó, ïðè÷åì ÷àñòî îòâåò ñëîæíî äàòü
â àíàëèòè÷åñêèõ òåðìèíàõ. Çäåñü ÷àñòî ïðèìåíÿþò ìåòîä, èçâåñòíûé ïîä íàçâàíèåì boot-strap, çàêëþ÷àþùèéñÿ
â ãåíåðàöèè ñèíòåòè÷åñêèõ äàííûõ (íàïðèìåð, âêëþ÷àþùèõ îøèáêó êîíêðåòíîãî âèäà) è ïîâòîðåíèé ñòàòèñòè-
÷åñêèõ âû÷èñëåíèé ïðèìåíèòåëüíî ê ñèíòåòè÷åñêèì äàííûì. Íåîáõîäèìûé íàâûê çäåñü  óìåíèå ïîñòðîèòü
ïðè ïîìîùè êîìïüþòåðà âûáîðêó çíà÷åíèé ñëó÷àéíîé âåëè÷èíû, èíûìè ñëîâàìè, óìåíèå ñîçäàòü âûáîðêó ïî
èçâåñòíîìó ðàñïðåäåëåíèþ Fξ (x). Ê ýòîìó óìåíèþ, â ñâîþ î÷åðåäü, ïðèëàãàåòñÿ óìåíèå ïðîêîíòðîëèðîâàòü ñâîè
äåéñòâèÿ, óáåäèòüñÿ â òîì, ÷òî ñèíòåòè÷åñêèå äàííûå äåéñòâèòåëüíî ðàñïðåäåëåíû êàê íàäî è äåéñòâèòåëüíî
íåçàâèñèìû. Äëÿ íåêîòîðûõ òèïîâ ðàñïðåäåëåíèé ãåíåðàòîðû ñîîòâåòñòâóþùèõ âûáîðîê óæå ðåàëèçîâàíû â
áèáëèîòåêå ïðîöåäóð, íî áåçóñëîâíî íàäî ïîíèìàòü, êàê äåéñòâîâàòü è â íåñòàíäàðòíîì ñëó÷àå.

Ôîðìóëû ïðåîáðàçîâàíèÿ çàêîíîâ ðàñïðåäåëåíèÿ

Èòàê, äëÿ âûáîðêè xi1 , xi2 , . . . xin ñòàòèñòè÷åñêàÿ îðìóëà ïðåäëîæèò âû÷èñëåíèå çíà÷åíèÿ Z(xi1 , xi2 , . . . xin ),
ÿñíî, ÷òî äëÿ äðóãîé âûáîðêè èç òîé æå ãåíåðàëüíîé ñîâîêóïíîñòè âû÷èñëåííîå çíà÷åíèå ìîæåò îòëè÷àòüñÿ.
Òàêèì îáðàçîì, Z(xi1 , xi2 , . . . xin ) çàäàåò ñëó÷àéíóþ âåëè÷èíó, ïîòîìó ÷òî àðãóìåíòû áåðóòñÿ èç ïðîñòðàíñòâà
Rn ñ âåðîÿòíîñòíîé ìåðîé: (xi1 , xi2 , . . . xin ) ∈ Rn .
Òàêèì îáðàçîì ìû ñòàëêèâàåìñÿ ñ èññëåäîâàíèåì ñëó÷àéíûõ âåëè÷èí, ïîñòðîåííûõ ïî ñëó÷àéíîìó âåêòîðó
(êîòîðûé, â ñâîþ î÷åðåäü, ïîñòðîåí ñîãëàñíî ñõåìå ïîâòîðíûõ íåçàâèñèìûõ ïîâòîðåíèé. ×òîáû ïðîéòè ïî ýòîìó
ïóòè íåîáõîäèìî óìåòü êàæäûé ðàç ïîëó÷àòü îðìóëó äëÿ ñîîòâåòñòâóþùèõ ðàñïðåäåëåíèé.

1.3 èïîòåçû î ðàñïðåäåëåíèÿõ. Ïðåäâàðèòåëüíûé ãðàè÷åñêèé àíàëèç


å÷ü èäåò îá óìåíèè ñ ïîìîùüþ íàãëÿäíî äåìîíñòðèðóåìûõ îñîáåííîñòåé èíòåðïðåòèðîâàòü îðìàëüíûå ñâîé-
ñòâà äàííûõ. Ýòîò ýòàï ïðè ðàáîòå ñ äàííûìè îðìàëüíî ãîâîðÿ, íå âõîäèò â ìàòåìàòè÷åñêóþ ñòàòèñòèêó,
îäíàêî íà ïðàêòèêå îí î÷åíü âàæåí, ïîñêîëüêó ïðîâåðÿåò (íà ýâðèñòè÷åñêîì óðîâíå) ïðåäïîëîæåíèå î òîì, ÷òî
èçó÷àåìûå äàííûå âîçíèêëè â ïðîöåññå íåçàâèñèìûõ ïîâòîðåíèé ýêñïåðèìåíòà ñî ñëó÷àéíûì èñõîäîì.
Òðàäèöèîííûé, âñåì çíàêîìûé ïîäõîä, ñîñòîèò â èñïîëüçîâàíèè ãèñòîãðàìì. Çäåñü åñòü íàä ÷åì ïîäóìàòü:
ãèñòîãðàììû ñòðîèòñÿ, èñõîäÿ èç íåêîòîðîãî ðàçóìíîãî ÷èñëà áèíîâ íà îñè, ïðè÷åì ðàçóìíûì ÷èñëîì áèíîâ
òðàäèöèîííî íàçûâàþò òî, êîòîðîå ïîäõîäèò äëÿ îäíîìîäàëüíûõ ðàñïðåäåëåíèé, òèïà ãàóññîâà ðàñïðåäåëåíèÿ.
 ÷àñòíîñòè, øèðîêî ðàñïðîñòðàíåíû ñëåäóþùèå ðåêîìåíäàöèè äëÿ âûáîðà ÷èñëà áèíîâ k ó âûáîðêè ðàçìåðà
n
h√ i
n
Ïðàâèëî Áîëüøîãî Ïàëüöà k = 3 (îëüêëîð)

Ïðàâèëî Ñòåðäæåñà k = 1 + [log2 n] (H.Sturges, 1926)

Äðóãèå ðåêîìåíäàöèè ïîñòðîåíèÿ ãèñòîãðàìì ñîñòîÿò â âûáîðå îïòèìàëüíîãî ðàçìåðà h èíòåðâàëà áèíèðîâàíèÿ,
òîãäà ÷èñëî áèíîâ âîçíèêíåò êàê ðåçóëüòàò äåëåíèÿ ðàçáðîñà âñåé âûáîðêè íà âåëè÷èíó áèíà.
h i
Ïðàâèëî Ñêîòòà h = s∗ · 3.49
√3 n (D.S ott, 1979)
h  i
Ïðàâèëî Ôðèäìàíà h = ∗
q0.75 ∗
− q0.25 √2
3 n (Freedman and Dia onis, 1981)

çäåñü êâàäðàòíûå ñêîáêè îáîçíà÷àþò öåëóþ ÷àñòü, à s∗ è qt∗ - âû÷èñëåííûå ïî âûáîðêå ñîîòâåòñòâåííî ýì-
ïèðè÷åñêóþ äèñïåðñèþ1 è t-êâàíòèëè.  ëþáîì ñëó÷àå âèäíî, ÷òî êîëè÷åñòâî áèíîâ â òèïîâîé ãèñòîãðàììå
ñîâñåì íåìíîãî. Âäîáàâîê, îðìóëà Ñêîòòà ïðåäëàãàåò îðèåíòèðîâàòüñÿ íà îðìóëó âåëè÷èíû ýìïèðè÷åñêîé
äèñïåðñèè, ïðèìåíÿòü êîòîðóþ ê íåèçâåñòíûì äàííûì îïàñíî.
1Î òèïè÷íûõ ñòàòèñòè÷åñêèõ õàðàêòåðèñòèêàõ ðå÷ü ïîéäåò äàëåå. Ïîêà æå ïðèìåì, ÷òî ýìïèðè÷åñêóþ äèñïåðñèþ ìîæíî îïðå-
äåëèòü ÷åðåç ñðåäíåå x̄ âûáîðêè îðìóëîé

1 X 1 X 2
n n
S2 = (xk − x̄)2 = x − (x̄)2
n k=1 n k=1 k

2
Ïðèìåð: èíîãäà ñòàòèñòè÷åñêèå îðìóëû âûäàþò ñòðàííûå îòâåòû

Âûáåðåì äîñòàòî÷íî ðåàëèñòè÷íûé îáúåì äàííûõ, íàïðèìåð, N = 1000. Ñãåíåðèðóåì N ñëó÷àéíûõ (ðàâíîìåð-
íûõ) ÷èñåë αi íà èíòåðâàëå [0, 1] è ðàññìîòðèì äàííûå ωi = 1/αi . Íåò íèêàêèõ ïðîáëåì ñ òåì, ÷òîáû âû÷èñëèòü
àðèìåòè÷åñêîå ñðåäíåå âñåõ αi è âñåõ ωi . Îäíàêî, åñëè âû ïðîäåëàåòå ýòîò ýêñïåðèìåíò íåñêîëüêî ðàç, òî
ïîëó÷àþùèåñÿ îòâåòû âàñ óäèâÿò. Îáúÿñíèòå, â ÷åì çäåñü äåëî.

1.3.1 Çàäà÷à: óêàçàòü êàêèå îðìóëû ìîãóò ñîîòâåòñòâîâàòü äàííûì

Âñå äàííûå â çàäà÷å ïîëó÷åíû êîìïüþòåðíîé ñèìóëÿöèåé, çàïèñàíû â òåêñòîâîì îðìàòå ïî êîëîíêàì, àéë
Zoopark.txt âûëîæåí íà ßíäåêñ-äèñê https://disk.yandex.ru/d/snty0o9oGSMP7A. Ñïèñîê âîçìîæíûõ ïëîò-

íîñòåé ê çàäà÷å ñëåäóþùèé: γ1 + γ2 + γ3 , |η|, γ , eη , | γγ12 |. Çäåñü îáîçíà÷åíèÿ γ óêàçûâàåò íà ïîêàçàòåëüíîå
ðàñïðåäåëåíèå, γi íåçàâèñèìû, è η óêàçûâàåò íà ãàóññîâî ðàñïðåäåëåíèå ñ ìàòåìàòè÷åñêèì îæèäàíèåì 0.
1. Äëÿ âûáîðîê èç ðàçíûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé è íàáîðà ñîîòâåòñòâóþùèõ èì ïëîòíîñòåé óêàçàòü
âçàèìíûå ñîîòâåòñòâèÿ.
2. Äëÿ êàæäîé âûáîðêè óêàçàòü (ýâðèñòè÷åñêèå) àðãóìåíòû â ïîëüçó ñóùåñòâîâàíèÿ èëè íåñóùåñòâîâàíèÿ
ïåðâûõ äâóõ ìîìåíòîâ ó èññëåäóåìîé ñëó÷àéíîé âåëè÷èíû.
àçóìååòñÿ, òàêàÿ çàäà÷à  ó÷åáíàÿ: äëÿ ñèìóëÿöèè äàííûõ èñïîëüçîâàëèñü òî÷íûå îðìóëû, çàäàþùèå çàêîí
ðàñïðåäåëåíèÿ. Â ðåàëüíîé æèçíè â äàííûõ âñåãäà ïðèñóòñòâóþò ñòîðîííèå ýåêòû, íàñêîëüêî îíè ñóùåñòâåí-
íû ïîêàæåò äàëüíåéøèé êîëè÷åñòâåííûé ñòàòèñòè÷åñêèé àíàëèç. Íà äåëå èñêóññòâî îáðàáîò÷èêà çàêëþ÷àåòñÿ
â óìåíèè ïðåäâèäåòü ìîäåëü (òî åñòü ñõåìó ïîâòîðíûõ íåçàâèñèìûõ ïîâòîðåíèé) íà îñíîâå ïîíèìàíèÿ ïðîèñ-
õîæäåíèÿ äàííûõ, ãðàè÷åñêèé àíàëèç âàæåí, íî èì íå îãðàíè÷èâàþòñÿ. Íà ïðåäâàðèòåëüíîì äëÿ ïðèìåíåíèÿ
ñòàòèñòè÷åñêîé òåîðèè ýòàïå îáû÷íî åñòü íåñêîëüêî âîçìîæíîñòåé è ñ ïîìîùüþ êîëè÷åñòâåííûõ ìåòîäîâ ñòà-
òèñòèêè íàäî åùå èõ ñðàâíèâàòü êàê àëüòåðíàòèâíûå ãèïîòåçû.

Íåêîòîðûå óêàçàíèÿ ê çàäà÷å

Îäíèì èç ðàçëè÷àþùèõ ñâîéñòâ ðàñïðåäåëåíèé ÿâëÿåòñÿ àñèìïòîòèêà óáûâàíèÿ èõ ïëîòíîñòè ðàñïðåäåëåíèÿ


íà áåñêîíå÷íîñòè. Îöåíèòü àñèìïòîòèêó, èñïîëüçóÿ òîëüêî ãèñòîãðàììû, ñîâñåì äàæå íåïðîñòî: äåéñòâèòåëüíî,
ãèñòîãðàììû ñòðîèòñÿ, èñõîäÿ èç ìàëîãî ÷èñëà áèíîâ íà îñè, è äëÿ îöåíêè àñèìïòîòèêè óáûâàíèÿ íà áåñêîíå÷-
íîñòè ýòèõ áèíîâ â òèïîâîé ãèñòîãðàììå áóäåò ñîâñåì íåìíîãî.
Ëó÷øå îáñòîèò äåëî, åñëè îáðàòèòüñÿ ê ýìïèðè÷åñêîé óíêöèè ðàñïðåäåëåíèÿ Fn∗ , ïîñòðîåííûé ïî âûáîðêå
ãðàèê êîòîðîé ñîäåðæèò n õàðàêòåðíûõ òî÷åê-ñòóïåíåê. Ñâÿçü ñ àñèìïòîòèêîé óáûâàíèÿ ïëîòíîñòè óíêöèè
ðàñïðåäåëåíèÿ fξ (x) ÿñíà èç ðåøåíèÿ ñëåäóþùåé âñïîìîãàòåëüíîé çàäà÷è:
ˆ Êàê óáûâàåò íà áåñêîíå÷íîñòè óíêöèÿ 1−Fξ (x) (Fξ (x)  óíêöèÿ ðàñïðåäåëåíèÿ ), åñëè ñîîòâåòñòâóþùàÿ
ïëîòíîñòü ðàñïðåäåëåíèÿ fξ (x) óáûâàåò êàê y = x1m ?
Äëÿ âèçóàëüíîãî àíàëèçà àñèìïòîòèê óáûâàíèÿ êëþ÷åâîå ñîîáðàæåíèå ñâÿçàíî ñ îòðèñîâêîé ãðàèêîâ â
ëîãàðèìè÷åñêîé øêàëå ïî îäíîé èëè îáîèì îñÿì. Âîò ñåðèÿ âñïîìîãàòåëüíûõ óïðàæíåíèé äëÿ ïîíèìàíèÿ
ýòîãî ïðàêòè÷åñêîãî ïðèåìà.

0
0.9 10 0

0.8 −0.5

0.7
−1

0.6
−1.5
0.5
−1
10 −2
0.4
−2.5
0.3

−3
0.2

0.1 −3.5

−2
0 10 −4
1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 0.2 0.3 0.4 0.5 0.6 0.7 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6
10 10 10 10 10 10

èñ. 1: Âèä ãðàèêîâ ïîëèíîìèàëüíîãî (ñèíèé), ýêñïîíåíöèàëüíîãî (êðàñíûé) è ñâåðõýêñïîíåíöèàëüíîãî (÷åð-


íûé) óáûâàíèÿ â ðàçíûõ øêàëàõ: ëèíåéíîé, ïîëóëîãàðèìè÷åñêîé è áèëîãàðèìè÷åñêîé øêàëàõ.

3
ˆ Êàê âûãëÿäèò ãðàèê çàâèñèìîñòè y = 1
xm â áèëîãàðèìè÷åñêîé øêàëå?. Óêàçàòü êîýèöèåíò íàêëîíà.
ˆ Íà èñ(1) òðè êðèâûå õàðàêòåðèçóþùèå ðàçíûå òèïû óáûâàíèÿ  ïîëèíîìèàëüíîãî (ñèíèé), ýêñïîíåíöè-
àëüíîãî (êðàñíûé) è ñâåðõýêñïîíåíöèàëüíîãî (÷åðíûé) èçîáðàæåíû â ëèíåéíîé, ïîëóëîãàðèìè÷åñêîé è
áèëîãàðèìè÷åñêîé øêàëàõ. Îáúÿñíèòü êàêàÿ êàðòèíêà ñîîòâåòñòâóåò êàêîìó òèïó èçîáðàæåíèþ.

1.4 Êàê ñàìîìó ñîçäàòü ñòàòèñòè÷åñêèé òåñò


Âîò êàê ìîæíî ñîçäàòü ñîçäàòü òåñò äëÿ ïðîâåðêè ãèïîòåçû î òîì, ÷òî âûáîðêà y1 , y2 , . . . yn ðàçìåðà n âçÿòà
èç ãåíåðàëüíîé ñîâîêóïíîñòè ðàñïðåäåëåíèé ñ ïëîòíîñòüþ2 fξ (x).
Ñõåìà ïðèìåíåíèÿ òåñòà:
1. Íà îòðåçêå [min(yk ), max(yk )] ñòðîèì íîðìàëèçîâàííóþ (òî åñòü èç ÷àñòîò, à íå èç ÷èñëà ïîïàäàíèé â
ñåãìåíò) ãèñòîãðàììó èç m ñòîëáèêîâ.
\
2. Ïî íåêîòîðîìó (ñì.íèæå) ïðàâèëó ïîäñ÷èòûâàåòñÿ ðàññòîÿíèå D [n,m] ìåæäó ÷àñòîòàìè èç íîðìàëèçîâàí-
íîé ãèñòîãðàììû è òåîðåòè÷åñêèìè âåðîÿòíîñòÿìè.
3. Äëÿ ìàëîãî ǫ êðèòåðèé íà ñîîòâåòñòâóþùåì óðîâíå çíà÷èìîñòè 1 − ǫ ïðèìåíÿåòñÿ òàê: åñëè ðàññòîÿíèå
D\[n,m] > q1−ǫ , òî ãèïîòåçó îòâåðãàþò (èçìåðåííîå ðàññòîÿíèå ñëèøêîì âåëèêî, à ýòî ìàëîâåðîÿòíî, åñëè
âûáîðêà è âïðàâäó âçÿòà èç ðàñïðåäåëåíèÿ ñ.â fξ (x)), çäåñü êîíå÷íî q1−ǫ - ýòî êâàíòèëü ðàñïðåäåëåíèÿ
ñòàòèñòèêè D[n,m]
Òàêèì îáðàçîì, äëÿ çàäàííûõ fξ (x), n, m îñòàëîñü òîëüêî ñîñòàâèòü òàáëèöó (ïðèáëèæåííûõ) çíà÷åíèé
êâàíòèëåé q1−ǫ ðàñïðåäåëåíèÿ ñòàòèñòèêè D[n,m] . Âû äîëæíû ðàññ÷èòàòü çíà÷åíèÿ êâàíòèëåé äëÿ ǫ = 0.1, 0.05
è óêàçàòü (ïðèáëèæåííî) îðìó óíêöèè ïëîòíîñòè ðàñïðåäåëåíèÿ ñòàòèñòèêè D[n,m] .
Íî îòêóäà æå âçÿòü çíà÷åíèÿ, ïðåäïîëîæèòåëüíî çàâèñÿùèõ îò n, m è fξ (x)) êâàíòèëåé? Ýòîò ýòàï áûë áû
ñàìûì òðóäîåìêèì ïðè àíàëèòè÷åñêîì âûâîäå, íî â íàøå êîìïüþòåðíóþ ýïîõó ìîæíî ïîñòóïèòü èíà÷å.

1.4.1 Óïðàæíåíèå

Äîãàäàéòåñü, êàê â óêàçàííîé ñèòóàöèè ïîëó÷èòü (ïðèáëèæåííî) çíà÷åíèÿ êâàíòèëÿ, íàïðèìåð, äëÿ t = 0.95?

1.4.2 Çàäàíèå ñ âàðèàíòàìè òåñòà

Âàðèàíòû èíäåêñèðóþòñÿ çíà÷åíèÿìè îïöèé À (òèï ðàñïðåäåëåíèÿ), n (ðàçìåð âûáîðêè), C (ñïîñîá ïîñòðîåíèÿ
\
ãèñòîãðàììû), D (ñïîñîá âû÷èñëåíèÿ D [n,m] )

Âàðèàíòû ïëîòíîñòåé fξ (x) ãèïîòåòè÷åñêîãî ðàñïðåäåëåíèÿ

1. À=0. àâíîìåðíîå ðàñïðåäåëåíèå íà [0, 1]


2. À=1. Êâàäðàòíûé êîðåíü èç ðàâíîìåðíîãî ðàñïðåäåëåíèÿ íà [0, 1]

Âàðèàíòû çíà÷åíèé n

1. n = 1000
2. n = 100

Âàðèàíòû çíà÷åíèé C

1. C=0. ×èñëî ñòîëáèêîâ m âûáèðàåòñÿ ïî ïðàâèëó Áîëüøîãî Ïàëüöà


2. C=1. ×èñëî ñòîëáèêîâ m âûáèðàåòñÿ ïî ïðàâèëó Ñòåðäæåñà
2 óâû, íî äåéñòâèÿ, ðåàëèçóþùèå ýòîò ñàìîäåëüíûé òåñò, çàâèñÿò îò ðàñïðåäåëåíèÿ. Òî åñòü ýòî íåóäîáíûé òåñò, ïî ñðàâíåíèþ,
ñêàæåì, ñ òåñòîì Êîëìîãîðîâà-Ñìèðíîâà.

4
\
Âàðèàíòû ïðàâèë D äëÿ âû÷èñëåíèÿ D [n,m]

 ñëåäóþùèõ îðìóëàõ wi  ÷àñòîòà ïîïàäàíèÿ â i-é ñåãìåíò áèíèðîâàíèÿ, òî åñòü â (xi−1 , xi ], i = 1, . . . m, à


ñîîòâåòñòâåííî pi = P (ξ ∈ (xi−1 , xi ]).
1. D=1. D[n,m] = max|wi − pi |
i
P
2. D=2. D[n,m] = |wi − pi |
i
rP
3. D=3. D[n,m] = (wi − pi )2
i

P |wi −pi |
4. D=4. D[n,m] = pi
i
P (wi −pi )2
5. D=5. D[n,m] = pi (1−pi )
i

1.4.3 Çàäà÷à

Êàê (è íàäî ëè) èçìåíèòü êðèòåðèé, åñëè ïðîâåðÿåòñÿ ãèïîòåçà î òîì, ÷òî çàäàííàÿ âûáîðêà âçÿòà èç (ñîîòâåò-
ñòâåííî ñì.âàðèàíò çíà÷åíèÿ À )
1. À=0. àâíîìåðíîãî ðàñïðåäåëåíèÿ íà [0, B] B 6= 1?
2. À=1. Êâàäðàòíîãî êîðíÿ èç ðàâíîìåðíîãî ðàñïðåäåëåíèÿ íà [0, B] B 6= 1?

2 Ïðàêòè÷åñêèå ìåòîäû íåïàðàìåòðè÷åñêîé ñòàòèñòèêè

2.1 Îïèñàíèå òåñòà


Òåñò Êîëìîãîðîâà-Ñìèðíîâà (KS) ïðèìåíèì ê ðàñïðåäåëåíèÿì íåïðåðûâíîé ñëó÷àéíîé âåëè÷èíû ξ (íî íå âåê-
òîðà!), òî åñòü ìîæíî ñ÷èòàòü, ÷òî âûáîðêà ñîñòîèò èç íå ïîâòîðÿþùèõñÿ ÷èñëîâûõ âåëè÷èí. Ïî n-âûáîðêå
ñòðîèòñÿ ýìïèðè÷åñêàÿ óíêöèÿ ðàñïðåäåëåíèÿ Fn∗ (x): äëÿ äåéñòâèòåëüíîãî y ∈ R ïîëîæèì Fn∗ (y) ðàâíûì 1/n
óìíîæåííîìó íà ÷èñëó òåõ xi â íàáîðå x1 , x2 , . . . xn , êîòîðûå ìåíüøå ëèáî ðàâíû y . Äëÿ ñðàâíåíèÿ ïîëó÷åííîé
ñòóïåí÷àòîé óíêöèè ñ óíêöèåé ðàñïðåäåëåíèÿ Fξ (x) èñïîëüçóåòñÿ ìåðà Dn :

Dn = sup|Fn∗ (x) − Fξ (x)|


x

(åå âåðñèè Dn+ è Dn− èñïîëüçîâàëèñü Ñìèðíîâûì äëÿ ìåð â îáëàñòÿõ {x|Fn∗ (x) > Fξ (x)} è {x|Fn∗ (x) < Fξ (x)} )
√ 
lim P nDn > z = K(z)
n→∞
( P
∞ 2 2
2 k=1 (−1)k−1 e−2k z , z>0
K(z) =
0 z 6 0,

Ïîñòðîèâ (ïðèáëèçèòåëüíî) ãðàèê K(z) ëåãêî óáåäèòüñÿ, ÷òî ýòî ìîíîòîííàÿ óíêöèÿ ñ K(0) = 1 è K(+∞) =
0. Ñõîäèìîñòü ïî n ê ïðåäåëó î÷åíü áûñòðàÿ (ñëåäóåò èç äîêàçàòåëüñòâà òåîðåìû Êîëìîãîðîâà, êîòîðîå ìû
íå ðàçáèðàëè), òåì ñàìûì íàì ïî÷òè èçâåñòíû óíêöèè ðàñïðåäåëåíèÿ ñëó÷àéíûõ âåëè÷èí Dn .  òåðìèíàõ
óíêöèè K(z) ìîæíî ñîðìóëèðîâàòü ïðàâèëî, êîãäà íà äàííîì óðîâíå çíà÷èìîñòè íàäî îòâåðãíóòü ãèïîòåçó
î ñîîòâåòñòâèè ðà ïðåäåëåíèÿ è âûáîðêè, òî åñòü óòâåðæäàòü î ìàëîâåðîÿòíîñòè íàáëþäàåìîãî â ýêñïåðèìåíòå
çíà÷åíèÿ Dobserved: √ √ 
P (Dn > Dobserved ) ≈ K Dobserved · ( n + 0.12 + 0.11/ n)
√ √
Ñòðàííîå
√ âûðàæåíèå ( n + 0.12 + 0.11/ n) îòðàæàåò ïîïðàâêè íàñêîëüêî òî÷íî ïðè êîíêðåòíîì n âåðîÿòíîñòü
P (Dn n > z) îïèñûâàåòñÿ ïðåäåëüíîé îðìóëîé K(z).
×àùå âñåãî êðèòåðèé Êîëìîãîðîâà-Ñìèðíîâà èñïîëüçóåòñÿ äëÿ ñëåäóþùåé çàäà÷è: îïðîâåðãàåòñÿ ëè íà
äàííîì óðîâíå çíà÷èìîñòè, ÷òî äâå âûáîðêè äëèíîþ â n1 è n2 îòñ÷åòîâ âçÿòû èç îäíîé ãåíåðàëüíîé ñîâî-
êóïíîñòè (à ïðî ãèïîòåòè÷åñêîå ðàñïðåäåëåíèå íå ãîâîðèòñÿ íè÷åãî, êðîìå åãî íåïðåðûâíîñòè)?  åå (ïî÷òè

5
î÷åâèäíîì) ðåøåíèè òàêæå çàäåéñòâîâàíî ðàññòîÿíèå Dn1 ,n2 ìåæäó äâóìÿ ñòóïåí÷àòûìè ãðàèêàìè è äàëåå
ðàáîòàåò ïðàêòè÷åñêè òà æå ñàìàÿ îðìóëà, íî â ó÷èòûâàþùåì ðàçíèöó äëèí âûáîðîê âèäå:
 √ √  n1 n2
P (Dn1 ,n2 > Dobserved) ≈ K Dobserved · ( M + 0.12 + 0.11/ M ) M=
n1 + n2
 êîíêðåòíûõ êîìïüþòåðíûõ ðåàëèçàöèÿõ îáû÷íî íå ïðèõîäèòñÿ âû÷èñëÿòü ðàññòîÿíèå ñàìîìó  ñîîòâåòñòâó-
þùàÿ áèáëèîòå÷íàÿ óíêöèÿ ïðîäåëàåò âñå çà âàñ.
Èç-çà òîãî, ÷òî ìåòîä îñíîâàí íà ìàêñèìàëüíîì îòêëîíåíèè äâóõ óíêöèé ðàñïðåäåëåíèÿ, ÿñíî, ÷òî ìàê-
ñèìàëüíîå îòêëîíåíèå íàáëþäàåòñÿ ñêîðåå â öåíòðàëüíîé ÷àñòè ðàñïðåäåëåíèÿ (áëèæå ê ìåäèàíå íåèçâåñòíîãî
ðàñïðåäåëåíèÿ), à íå íà êîíöàõ, ãäå ãðàèêè âûïîëàæèâàþòñÿ. åçóëüòàòîì ÿâëÿåòñÿ òî, ÷òî òåñò Êîëìîãîðîâà-
Ñìèðíîâà ýåêòèâíî ðàçáèðàåòñÿ ñ îòëè÷èÿìè òèïà ñäâèãà ðàñïðåäåëåíèÿ, íî õóæå ÷óâñòâóåò ðàçíèöó íà
õâîñòàõ ðàñïðåäåëåíèé. Âàæíàÿ ìîäèèêàöèÿ òåñòà Êîëìîãîðîâà-Ñìèðíîâà íàçûâàåòñÿ òåñòîì Àíäåðñîíà-
Äàðëèíãà è îñíîâàíà íà âû÷èñëåíèè ïî âûáîðêå âìåñòî supx |Fn∗ (x) − Fξ (x)| âåëè÷èíû

|F ∗ (x) − Fξ (x)|
D̃n = sup p n
x Fξ (x)(1 − Fξ (x))

èëè (â çàâèñèìîñòè îò âåðñèè)


Z
+∞
˜ = |F ∗ (x) − Fξ (x)|
D̃ n p n dx
Fξ (x)(1 − Fξ (x))
−∞

Äëÿ ýòèõ ìåð òàêæå ðàññ÷èòàíû ðàñïðåäåëåíèÿ è òåñò Àíäåðñîíà-Äàðëèíãà ïî àêòó îêàçàëñÿ áîëåå ÷óâñòâè-
òåëüíûì ê îòêëîíåíèÿì íà õâîñòàõ ðàñïðåäåëåíèÿ, ÷åì â ñåðåäèíå. Áåññìûñëåííî ñòàâèòü âîïðîñ êàêîé òåñò
ëó÷øå ïîòîìó ÷òî íàèáîëåå ïðàâèëüíûì áóäåò ïðèìåíèòü íåñêîëüêî òåñòîâ  íå îòâåðãíåò ëè ãèïîòåçó õîòü îäèí
èç íèõ. Âïðî÷åì, çäåñü ïîÿâëÿåòñÿ òðóäíûé âîïðîñ îá óðîâíå çíà÷èìîñòè ïðèìåíåíèÿ íåñêîëüêèõ òåñòîâ ñðàçó
è î ïðèáëèæåíèÿõ â èñïîëüçóåìûõ ðàñ÷åòíûõ îðìóëàõ.  íàøåì ââîäíîì êóðñå ìû ýòî íå ðàññìàòðèâàåì, íî
â ïðèíöèïå ýòî âïîëíå ìàòåìàòè÷åñêè êîððåêòíûé âîïðîñ.

2.2 Óïðàæíåíèÿ íà êðèòåðèé Êîëìîãîðîâà-Ñìèðíîâà


2.2.1 Åùå ðàç î ðàñïîçíàâàíèè ãèïîòåç

Êàê óæå ñêàçàíî âûøå ñòàíäàðòíàÿ çàäà÷à íåïàðàìåòðè÷åñêîé ñòàòèñòèêè âîçíèêàåò, êîãäà äàíû äâå âûáîðêè
(âîçìîæíî ðàçíîãî îáúåìà) èç, âîîáùå ãîâîðÿ, ðàçíûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé è íàäî íà äàííîì óðîâíå
çíà÷èìîñòè ñäåëàòü ñòàòèñòè÷åñêèå âûâîäû ñîâïàäàþò ëè ýòè äâå ãåíåðàëüíûå ñîâîêóïíîñòè. äëèíû âûáîðêè
àè îðìû ðàñïðåäåëåíèÿ  ÷àñòíîñòè âåðíåìñÿ ê çàäà÷å 1.3.13 .
1. Ïðèìåíèòü êîìïüþòåðíûå ñèìóëÿöèè è íà óðîâíå çíà÷èìîñòè 0.95 ìåòîäîì Êîëìîãîðîâà-Ñìèðíîâà âîç-
íèêøèå ó âàñ èç ïðåäâàðèòåëüíîãî ðàññìîòðåíèÿ ïÿòü ãèïîòåç î ðàñïðåäåëåíèÿõ â çàäà÷å 1.3.1. àçóìååò-
ñÿ, çäåñü âñòàåò âîïðîñ î ïàðàìåòðàõ ñèìóëÿöèè, Îáùèé ïîäõîä áóäåò ðàññìîòðåí ïîçæå, ïîêà ïðèâåäåì
íåñêîëüêî çíà÷åíèé, êîòîðûå íàäî èñïîëüçîâàòü äëÿ ïîäñòàíîâêè â ñèìóëÿöèè (êóäà êàêîé ðàçáåðèòåñü,
ïîæàëóéñòà, ñàìîñòîÿòåëüíî): 1, 0.3 1.5,
2. Êîìïüþòåðíûå ýêñïåðèìåíòû, ïîêàçûâàþùèå ðîëü ïàðàìåòðîâ ðàñïðåäåëåíèÿ è ïðèáëèæåíèé ïðåäåëüíîãî
ïåðåõîäà â êðèòåðèè KS. Çàîäíî ýòî äàåò îïûò ïðàêòè÷åñêîãî ïðèìåíåíèÿ êðèòåðèÿ KS (ïîñêîëüêó òåîðèÿ
íàì â ïðèíöèïå èçâåñòíà).

(a) Ïîäãîòîâüòå 1000 âûáîðîê äëèíû 100 çíà÷åíèé ñëó÷àéíîé âåëè÷èíû, ðàñïðåäåëåííîé êàê N (0, 1) è
ñîñ÷èòàéòå 95% ãðàíèöó îòêëîíåíèÿ ýìïèðè÷åñêèõ óíêöèé ðàñïðåäåëåíèÿ îò òåîðåòè÷åñêîé óíê-
öèè ðàñïðåäåëåíèÿ. Âû÷èñëèòå è íàðèñóéòå ãðàèê ãðàíèö, ãäå ïî êðèòåðèþ Ê-Ñ äîëæíû ëåæàòü
95% ýìïèðè÷åñêèõ óíêöèé ðàñïðåäåëåíèÿ âûáîðêè äëèíû 100 çíà÷åíèé çíà÷åíèé ñëó÷àéíîé âåëè-
÷èíû, ðàñïðåäåëåííîé êàê N (0, 1). Ñðàâíèòå âåëè÷èíó ýòèõ ãðàíèö ñ òåì, ÷òî ïðåäëàãàåò ïðåäåëüíàÿ
óíêöèÿ Êîëìîãîðîâà (òî åñòü ïðè n → ∞.
3 å÷ü î çàäà÷å ¾äëÿ âûáîðîê èç ðàçíûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé è íàáîðà ñîîòâåòñòâóþùèõ èì ïëîòíîñòåé óêàçàòü âçàèìíûå
ñîîòâåòñòâèÿ¿

6
(b) Ïîäãîòîâüòå 1000 âûáîðîê äëèíû 25 çíà÷åíèé ñëó÷àéíîé âåëè÷èíû, ðàñïðåäåëåííîé êàê N (0, 1) è
ñîñ÷èòàéòå 95% ãðàíèöó îòêëîíåíèÿ ýìïèðè÷åñêèõ óíêöèé ðàñïðåäåëåíèÿ îò òåîðåòè÷åñêîé óíê-
öèè ðàñïðåäåëåíèÿ. Âû÷èñëèòå è íàðèñóéòå ãðàèê ãðàíèö, ãäå ïî êðèòåðèþ Ê-Ñ äîëæíû ëåæàòü
95% ýìïèðè÷åñêèõ óíêöèé ðàñïðåäåëåíèÿ âûáîðêè äëèíû 25 çíà÷åíèé çíà÷åíèé ñëó÷àéíîé âåëè÷è-
íû, ðàñïðåäåëåííîé êàê N (0, 1). Ñðàâíèòå âåëè÷èíó ýòèõ ãðàíèö ñ òåì, ÷òî ïðåäëàãàåò ïðåäåëüíàÿ
óíêöèÿ Êîëìîãîðîâà (òî åñòü ïðè n → ∞.
( ) Ïîäãîòîâüòå 1000 âûáîðîê äëèíû 100 çíà÷åíèé ñëó÷àéíîé âåëè÷èíû, ðàñïðåäåëåííîé ïî çàêîíó Êî-
øè ñ ïàðàìåòðîì 1 è ñîñ÷èòàéòå 95% ãðàíèöó îòêëîíåíèÿ ýìïèðè÷åñêèõ óíêöèé ðàñïðåäåëåíèÿ îò
òåîðåòè÷åñêîé óíêöèè ðàñïðåäåëåíèÿ. Âû÷èñëèòå è íàðèñóéòå ãðàèê ãðàíèö, ãäå ïî êðèòåðèþ Ê-Ñ
äîëæíû ëåæàòü 95% ýìïèðè÷åñêèõ óíêöèé ðàñïðåäåëåíèÿ âûáîðêè äëèíû 100 çíà÷åíèé çíà÷åíèé
ñëó÷àéíîé âåëè÷èíû, ðàñïðåäåëåííîé ïî çàêîíó Êîøè ñ ïàðàìåòðîì 1. Ñðàâíèòå âåëè÷èíó ýòèõ ãðà-
íèö ñ òåì, ÷òî ïðåäëàãàåò ïðåäåëüíàÿ óíêöèÿ Êîëìîãîðîâà (òî åñòü ïðè n → ∞.
(d) Ïîäãîòîâüòå 1000 âûáîðîê äëèíû 50 çíà÷åíèé ñëó÷àéíîé âåëè÷èíû, ðàñïðåäåëåííîé ïî çàêîíó Êîøè ñ
ïàðàìåòðîì 1 è ñîñ÷èòàéòå 95% ãðàíèöó îòêëîíåíèÿ ýìïèðè÷åñêèõ óíêöèéà ÷òî îáðàòèòü âíèìàíèå
ðàñïðåäåëåíèÿ îò òåîðåòè÷åñêîé óíêöèè ðàñïðåäåëåíèÿ. Âû÷èñëèòå è íàðèñóéòå ãðàèê ãðàíèö,
ãäå ïî êðèòåðèþ Ê-Ñ äîëæíû ëåæàòü 95% ýìïèðè÷åñêèõ óíêöèé ðàñïðåäåëåíèÿ âûáîðêè äëèíû 50
çíà÷åíèé çíà÷åíèé ñëó÷àéíîé âåëè÷èíû, ðàñïðåäåëåííîé ïî çàêîíó Êîøè ñ ïàðàìåòðîì 1.Ñðàâíèòå
âåëè÷èíó ýòèõ ãðàíèö ñ òåì, ÷òî ïðåäëàãàåò ïðåäåëüíàÿ óíêöèÿ Êîëìîãîðîâà (òî åñòü ïðè n → ∞.

2.2.2 Çàìå÷àíèå

 êîìïüþòåðíîé ðåàëèçàöèè ðåøåíèÿ èìååòñÿ íå âïîëíå î÷åâèäíûé øàã: âû÷èñëåíèå òî÷íîé âåðõíåé ãðàíè
ðàññòîÿíèé ìåæäó ïîñòðîåííîé ïî âûáîðêå ñòóïåí÷àòîé óíêöèåé è ïîñòðîåííîé ïî ÿâíîìó óðàâíåíèþ íåïðå-
ðûâíîé óíêöèåé Fξ (x) òðåáóåò, âîîáùå ãîâîðÿ, ñðàâíåíèÿ çíà÷åíèé â áåñêîíå÷íîì íàáîðå àðãóìåíòîâ. Íî
íåïðåðûâíàÿ óíêöèÿ Fξ (x) íèãäå íå óáûâàåò, ïîýòîìó íà êàæäîé ñòóïåíüêå ìàêñèìàëüíîå ðàññòîÿíèå ìåæäó
ãðàèêàìè çàâåäîìî äîñòèãàåòñÿ ëèáî íà ïðàâîì êîíöå ñòóïåíüêè, ëèáî ðàâíî ïðåäåëó ðàññòîÿíèé ïðè àðãóìåí-
òàõ ñòðåìÿùèõñÿ ê ëåâîìó êîíöó ñòóïåíüêè. Íî íåîáõîäèìî ëè íàì âû÷èñëÿòü ïðåäåëû ïðè ó÷åòå ðàññòîÿíèé?
Îáðàòèòå âíèìàíèå, ÷òî ñòóïåíüêè êàæäûé ðàç ïîäíèìàþòñÿ íà âûñîòó 1/n ïîñêîëüêó ìû â ýòîé çàäà÷å çà-
íèìàåìñÿ âûáîðêàìè â êëàññå íåïðåðûâíûõ ðàñïðåäåëåíèé è ïîëó÷èòü äâà ñîâåðøåííî îäèíàêîâûõ çíà÷åíèÿ â
òàêîé âûáîðêå ìîæíî ëèøü ñ âåðîÿòíîñòüþ íîëü. Îòñþäà ñëåäóåò, ÷òî ñâåðêó ðàññòîÿíèé íàäî âåñòè âñå-òàêè
ïî âñåì òî÷êàì ðàçðûâà ñòóïåí÷àòîé óíêöèè, íî äåëàòü ýòî ãðàìîòíî ñ ó÷åòîì òàêæå è âåëè÷èíû 1/n.

3 Ïðàêòè÷åñêèå ìåòîäû íåïàðàìåòðè÷åñêîé ñòàòèñòèêè.

Êðèòåðèé çíàêîâ

Äîñòàòî÷íî ÷àñòîå èñïîëüçîâàíèå íåïàðàìåòðè÷åñêîé ñòàòèñòèêè ñâÿçàíî ñî ñëåäóþùåé çàäà÷åé: îïðîâåðãàåòñÿ


ëè íà äàííîì óðîâíå çíà÷èìîñòè, ÷òî äâå âûáîðêè x1 , x2 , . . . xn è y1 , y2 , . . . yn ðàâíîé äëèíû âçÿòû èç îäíîé
ãåíåðàëüíîé ñîâîêóïíîñòè (à ïðî ãèïîòåòè÷åñêîå ðàñïðåäåëåíèå íå ãîâîðèòñÿ íè÷åãî, êðîìå íåïðåðûâíîñòè)?
Ìû óæå âèäåëè, êàê ê ýòîìó âîïðîñó ìîæíî ïîäñòóïèòüñÿ êðèòåðèåì Êîëìîãîðîâà-Ñìèðíîâà, îäíàêî åñòü è
áîëåå ãðóáûå, íî ïðîñòûå ìåòîäû, òàêèå êàê êðèòåðèé çíàêîâ.

3.1 Îïèñàíèå òåñòà


Åñëè ñðàâíèâàåìûå âûáîðêè íå ïåðåñåêàþòñÿ è âçÿòû èç îäíîé ãåíåðàëüíîé ñîâîêóïíîñòè, òî âåðîÿòíîñòè ïî-
ÿâëåíèÿ ïîëîæèòåëüíûõ è îòðèöàòåëüíûõ ðàçíîñòåé xi − yi äîëæíû áûòü ðàâíû. Íóëåâûå ðàçíîñòè íå äîëæíû
íàáëþäàòüñÿ â ñèëó íåïðåðûâíîñòè èçó÷àåìîé ñëó÷àéíîé âåëè÷èíû, òàêèì îáðàçîì
1
P (xi − yi > 0) = P (xi − yi < 0) =
2
ñëåäîâàòåëüíî, íàäî ïðîâåðÿòü, ÷òî ÷èñëî ïîëîæèòåëüíûõ ðàçíîñòåé èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðà-
ìåòðîì p+ = 12 , àëüòåðíàòèâîé ÷åìó âûñòóïàþò óñëîâèå: p+ > 21 èëè p+ < 21 . Ïðè çàäàííîì óðîâíå çíà÷èìîñòè
α ãèïîòåçó î p+ = 12 íàäî îòêëîíèòü, åñëè íàáëþäàåòñÿ àíîìàëüíî áîëüøîå èëè àíîìàëüíî ìàëîå ÷èñëî r ïîëî-
æèòåëüíûõ ðàçíîñòåé.  òåðìèíàõ ðàñïðåäåëåíèÿ Áåðíóëëè äëÿ îòêëîíåíèÿ ãèïîòåçû íà óðîâíå çíà÷èìîñòè α
äîëæíî áûòü âûïîëíåíî îäíî èç íåðàâåíñòâ:
Xn   Xr  
−n n α −n n α
2 6 2 6
k 2 k 2
k=r k=0

7
Áîëåå âíèìàòåëüíûé âçãëÿä íà òåñò ïîêàçûâàåò, ÷òî òóò ïðîâåðÿþò ëèøü ãèïîòåçó î ðàâåíñòâå ìåäèàí
ó äâóõ íåçàâèñèìûõ êîìïîíåíò íåïðåðûâíîãî ñëó÷àéíîãî âåêòîðà, ïðîåöèðóÿ ýòó çàäà÷ó íà ïðî-
âåðêó ãèïîòåçû î çíà÷åíèè ïàðàìåòðà áèíîìèàëüíîé ñëó÷àéíîé âåëè÷èíû, îïðåäåëÿåìîé ÷èñëîì
ïîÿâëåíèÿ ïîëîæèòåëüíûõ ðàçíîñòåé ìåæäó êîìïîíåíòàìè â âûáîðêå ñëó÷àéíîãî âåêòîðà.  ñëó÷àå
äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí íóæíà äîïîëíèòåëüíàÿ àêêóðàòíîñòü â îðìóëèðîâêå ãèïîòåç è àëüòåðíàòèâ.
àññìîòðåííûé âûøå òåñò èìåë â âèäó ïàðó àëüòåðíàòèâ H0 : p+ = 1/2 è H1 : p+ 6= 1/2.
Ïîñêîëüêó ðåàëüíî òåñòèðóåòñÿ ëèøü äèñêðåòíîå áèíîìèàëüíîå ðàñïðåäåëåíèå, ìîæíî ðàññìàòðèâàòü è èíûå
ïàðû àëüòåðíàòèâ äëÿ çíà÷åíèé åãî ïàðàìåòðà p+ :
Pn
n

H0 : p+ 6 1/2 è H1 : p+ > 1/2 . Äëÿ îòêëîíåíèÿ ãèïîòåçû H0 íóæíî íåðàâåíñòâî 2−n k 6 α
k=r

P
r 
n
H0 : p+ > 1/2 è H1 : p+ < 1/2 . Äëÿ îòêëîíåíèÿ ãèïîòåçû H0 íóæíî íåðàâåíñòâî 2−n k 6α
k=0

Ïðè áîëüøèõ çíà÷åíèÿõ n ïðÿìîé ïîäñ÷åò áèíîìèàëüíûõ êîýèöèåíòîâ íåóäîáåí è ïîòîìó èñïîëüçóþò
àïðîêñèìàöèè áèíîìèàëüíîãî çàêîíà ãàóññîâûì.
H0 : p+ 6 1/2 è H1 : p+ > 1/2 . Äëÿ îòêëîíåíèÿ ãèïîòåçû H0 íóæíî íåðàâåíñòâî r
n−r+1 > F1−α [2(n − r + 1), 2r]

H0 : p+ > 1/2 è H1 : p+ < 1/2 . Äëÿ îòêëîíåíèÿ ãèïîòåçû H0 íóæíî íåðàâåíñòâî n−r
r+1 > F1−α [2(r + 1), 2(n − r)]
H0 : p+ = 1/2 è H1 : p+ 6= 1/2 . Äëÿ îòêëîíåíèÿ ãèïîòåçû H0 äîëæíî áûòü âûïîëíåíî îäíî èç äâóõ ïðåäûäóùèõ
íåðàâåíñòâ, íî ñ çàìåíîé ïîêàçàòåëÿ êâàíòèëÿ 1 − α íà 1 − α/2

3.2 Ïðèìåðû è çàäà÷è


Êàê è âñåãäà, âû÷èñëåíèÿ çà íàñ äåëàåò êîìïüþòåð, âîò ññûëêà íà ñîîòâåòñòâóþùóþ óíêöèþ ÿçûêà python
statsmodels.stats.des riptivestats.sign_test
ˆ Êîìïüþòåðíûé ýêñïåðèìåíò: çàìåòèò ëè íà óðîâíå α = 0.05 êðèòåðèé çíàêîâ ðàçíèöó äâóõ ðàâíîìåðíûõ
ðàñïðåäåëåíèé ñîîòâåòñòâåííî íà îòðåçêàõ [0.0, 0.95] è [0.0, 1.0] ïðè âûáîðêàõ äëèíîé 100? Ïðè âûáîðêàõ
äëèíîé 1000?
Ïî àêòó ýòîò äîâîëüíî ãðóáûé íåïàðàìåòðè÷åñêèé êðèòåðèé èñïîëüçóþò â ìåäèöèíñêîé ñòàòèñòèêå, ãäå
ýêñïåðèìåíòû íà ëþäÿõ è âäîáàâîê äîðîãèå. Ïðè ýòîì âìåñòî íåçàâèñèìûõ ïîâòîðåíèé îäíîãî ýêñïåðèìåíòà
ðàññìàòðèâàþò ïîêàçàòåëè ó ðàçíûõ ëþäåé  âåñüìà ñïîðíî, â êàêèõ ñëó÷àÿõ ìîæíî ëè ýòî îòîæäåñòâëÿòü. Â
äàííîì ñëó÷àå ãðóáûé òåñò çàìåòèò òîëüêî ñèëüíûå îòëè÷èÿ.
ˆ àññìàòðèâàþò âëèÿíèå êóðñà ÁÀÄ íà ñíèæåíèå âåñà ó äåñÿòè èñïûòóåìûõ

âåñ äî 68 80 92 81 70 79 78 66 57 76
âåñ ïîñëå 63 85 87 79 74 75 76 65 56 71

Ïðîâåðèòü íà óðîâíå α = 0.1, âëèÿåò ëè êóðñ è êàê?

4 Ïðàêòè÷åñêèå ìåòîäû íåïàðàìåòðè÷åñêîé ñòàòèñòèêè.

àíãîâûå ìåòîäû

 ïðåäûäóùåì ðàçäåëå ðàññìàòðèâàëàñü çàäà÷à î äâóõ âûáîðêàõ : îïðîâåðãàåòñÿ ëè íà äàííîì óðîâíå çíà÷è-
ìîñòè, ÷òî äâå âûáîðêè x1 , x2 , . . . xm è y1 , y2 , . . . yn âçÿòû èç îäíîé ãåíåðàëüíîé ñîâîêóïíîñòè. Â ïðèíöèïå ýòîò
âîïðîñ âåñüìà âàæåí äëÿ êëèíè÷åñêîé ìåäèöèíñêîé äèàãíîñòèêè è íåóäèâèòåëüíî, ÷òî âîçíèêëî íåñêîëüêî ìå-
òîäèê èññëåäîâàíèÿ. Âàðèàíòû ðåøåíèÿ ïðè ïîìîùè KS è êðèòåðèÿ çíàêîâ óæå îáñóæäàëèñü, ðàññìîòðèì åùå
äîñòàòî÷íî ýåêòèâíûé ïîäõîä Óèëêîêñîíà-Ìàííà-Óèòíè (Wil oxon, Mann,Whitney), îí òàêæå âõîäèò, íàïðè-
ìåð, â áèáëèîòåêó ÿçûêà Python (ñì. s ipy.stats.mannwhitneyu à òàêæå s ipy.stats.wil oxon ). Ïðèìåíåíèå
â ìåäèöèíñêîé ïðàêòèêå: äëÿ êàæäîãî áîëüíîãî âû÷èñëÿåòñÿ âåëè÷èíà èçìåíåíèÿ ïðèçíàêà. Âñå èçìåíåíèÿ óïî-
ðÿäî÷èâàþò ïî àáñîëþòíîé âåëè÷èíå (áåç ó÷åòà çíàêà). Çàòåì ðàíãàì ïðèïèñûâàþò çíàê èçìåíåíèÿ è ñóììèðóþò
ýòè ¾çíàêîâûå ðàíãè¿ - â ðåçóëüòàòå ïîëó÷àåòñÿ çíà÷åíèå ñòàòèñòèêè Óèëêîêñîíà.
Ïîëíîå îáúÿñíåíèå äåòàëåé ñîîòâåòñòâóþùåãî êðèòåðèÿ äîñòàòî÷íî ãðîìîçäêî, íî ñòîèò óêàçàòü íåêîòîðûå
èäåè, íà êîòîðûõ ýòîò êðèòåðèé îñíîâàí.

8
4.1 Èäåÿ òåñòà, ðåçóëüòàòû è àëãîðèòì
Êàæäàÿ èç äâóõ âûáîðîê âîçíèêëà â ìîäåëè íåçàâèñèìûõ ïîâòîðåíèé, ñëåäîâàòåëüíî â ñîîòâåòñòâóþùèõ ãå-
íåðàëüíûõ ñîâîêóïíîñòÿõ ñ òî÷êè çðåíèÿ ìåð íåò íèêàêîé ðàçíèöû, åñëè âíóòðè âûáîðêè ìåíÿòü çíà÷åíèÿ
ïåðåñòàíîâêàìè. Òàêèõ ïåðåñòàíîâîê â ïåðâîé âûáîðêå m!, âî âòîðîé  n! (ïîäõîä Óèëêîêñîíà, êàê è êðèòåðèé
çíàêîâ, â ñâîåé êëàññè÷åñêîé îðìå ïðåäïîëàãàåò íåïðåðûâíûå ðàñïðåäåëåíèÿ è ïîòîìó âûáîðêè ñ ïîâòîðåíèÿ-
ìè íåíàáëþäàåìû). Åñëè âûïîëíÿåòñÿ ãèïîòåçà H0 î òîì, ÷òî ýòè ãåíåðàëüíûå ñîâîêóïíîñòè íà ñàìîì äåëå îäíà
è òà æå, òî âûáîðêè ìîæíî ñëèòü â îäíó4 è ðàññìàòðèâàòü (m + n)! íå ìåíÿþùèõ ìåðó ïåðåñòàíîâîê â îáúåäè-
íåíèè. ×òî ìåíÿåòñÿ ïðè ïåðåñòàíîâêàõ ïîíÿòü ëåãêî: åñëè â îäíîì âàðèàíòå ïàðà çíà÷åíèé øëà ¾ïðàâèëüíî¿
ò.å. ïî âîçðàñòàíèþ, òî ïîñëå ïåðåñòàíîâêè îíà ìîæåò ñòàòü óæå ¾íåïðàâèëüíîé¿, ò.å. íå âîçðàñòàþùåé. Èäåÿ
êðèòåðèÿ ñîñòîèò â òîì, ÷òîáû ñðàâíèâàòü ïîêàçàòåëè îòíîñÿùèåñÿ ê ¾ïðàâèëüíûì/íåïðàâèëüíûì¿ ïàðàì, âîç-
íèêàþùèì â èñõîäíûõ âûáîðêàõ x1 , x2 , . . . xm è y1 , y2 , . . . yn . Îêàçûâàåòñÿ, ÷òî ñðàâíèâàòü ýòè ïîêàçàòåëè óäîáíî
ðàññìîòðåâ óïîðÿäî÷åíèå çíà÷åíèé ïî âîçðàñòàíèþ â îáúåäèíåííîé âûáîðêå. Ïîêàçàòåëè R1 , R2 , êîòîðûå áóäóò
îñíîâîé êðèòåðèÿ, îíè ââîäÿòñÿ òàê: äëÿ êàæäîãî çíà÷åíèÿ xi èç ïåðâîé âûáîðêè Pm âîçíèêàåò ïîðÿäêîâûé íî-
ìåð ri ýòîãî çíà÷åíèÿ
P â îáúåäèíåííîé óïîðÿäî÷åííîé âûáîðêå. Ýòî äàåò R 1 = k=1 rk , àíàëîãè÷íûì îáðàçîì
îïðåäåëÿþò R2 = nk=1 rk . Â çàâèñèìîñòè îò ðàçìåðà âûáîðêè èìåþòñÿ äâà ïîäõîäà:
1. Äëÿ ìàëåíüêèõ âûáîðîê n ∼ 25 êðèòåðèé Óèëêîêñîíà, â êîòîðîì êðèòè÷åñêàÿ îáëàñòü ÿâíî ñîñ÷èòàíà
ïî êîìáèíàòîðíûì îðìóëàì. Òåñò Óèëêîêñîíà òàêæå èíîãäà íàçûâàåòñÿ êðèòåðèåì Ìàííà-Óèòíè äëÿ
ìàëûõ âûáîðîê.
2. Äëÿ áîëüøèõ âûáîðîê U-êðèòåðèé Ìàííà-Óèòíè, èñïîëüçóþùèé àïïðîêñèìàöèþ ðàñïðåäåëåíèÿ ñîîòâåò-
ñòâóþùåé ñòàòèñòèêè
Èìåííî, Ìàíí, Óèòíè â ñåðåäèíå ÕÕ âåêà ïîêàçàëè, ÷òî ïðè áîëüøèõ m, n ðàñïðåäåëåíèå ñòàòèñòèêè U
 
1 1
U = min R1 − m(m + 1), R2 − n(n + 1)
2 2

áûñòðî ñõîäèòñÿ ê ãàóññîâó çàêîíó ñ ìàò.îæèäàíèåì mn/2 è äèñïåðñèåé (m + n + 1)mn/12 è, ñòàëî áûòü, åñ-
ëè çíà÷åíèÿ U îêàçàëèñü ìàðãèíàëüíûìè (= ëåæàùèìè íà õâîñòàõ óíêöèè ãàóññîâîé ïëîòíîñòè), òî íóæíî
îòáðàñûâàòü íóëåâóþ ãèïîòåçó H0 . Áîëåå òî÷íî, ïðè çàäàííîì óðîâíå çíà÷èìîñòè α ãèïîòåçà H0 îòêëîíÿåòñÿ,
åñëè âû÷èñëåííîå ïî âûáîðêå çíà÷åíèå
U − mn
Z ∗ = p mn 2

12 (m + n + 1)
ïî àáñîëþòíîé âåëè÷èíå áîëüøå êâàíòèëÿ q1−α/2 äëÿ íîðìàëüíîãî çàêîíà N (0, 1) (ýòî ò.í. äâóñòîðîííèé êðè-
òåðèé, ïðåäïîëàãàþùèé àëüòåðíàòèâó ¾âûáîðêè èñõîäíî âçÿòû èç ðàçíûõ, îòëè÷àþùèõñÿ ðàñïðåäåëåíèÿìè,
ãåíåðàëüíûõ ñîâîêóïíîñòåé¿ äëÿ H0 .

Çàìå÷àíèå  èçëîæåííîì òåñòå ðå÷ü øëà íå î âûáîðêå ïàð ó ñëó÷àéíîãî âåêòîðà, à î ñðàâíåíèè ñâîéñòâ äâóõ
âûáîðîê  òî åñòü ïîñòàíîâêà âîïðîñà îòëè÷àåòñÿ îò àíàëîãè÷íîé â ðàíåå èçëîæåííîì òåñòå çíàêîâ.
×àñòî ýòè æå òåñòû ìîæíî âñòðåòèòü è ïðè ñðàâíåíèè ìåäèàí mx , my ó äâóõ âûáîðîê. Ôîðìàëüíî, ðàçóìååò-
ñÿ, îáúåäèíÿòü ñàìè âûáîðêè â òàêîì ñëó÷àå íåëüçÿ, íî ïîñêîëüêó â ïîñòðîåíèè ñòàòèñòèê ðåàëüíî èñïîëüçóþòñÿ
íå ñàìè ÷èñëà, à èõ ðàíãè, òî ïðîâåðÿþò ïàðó àëüòåðíàòèâ: H0 óòâåðæäàåò, ÷òî ìåäèàíû mx 6 my , àëüòåðíàòèâà
H1 óòâåðæäàåò, ÷òî mx > my .  ýòîì ñëó÷àå íóæåí îäíîñòîðîííèé êðèòåðèé.

4.2 Óïðàæíåíèÿ è çàäà÷è


1. Äëÿ âûáîðîê S_04_001.dat è S_04_003.dat êðèòåðèåì Ìàííà è Óèòíè íà óðîâíå çíà÷èìîñòè 0.05 ïðîâå-
ðèòü ãèïîòåçó, ÷òî îíè âçÿòû èç îäíîãî ðàñïðåäåëåíèÿ.
2. Càìîñòîÿòåëüíî ðàçîáðàòüñÿ êàê óñòðîåíà ñòàòèñòèêà (îðìóëà) äëÿ îäíîñòîðîííåãî êðèòåðèåÿ Ìàííà-
Óèòíè. Ñîîòâåòñòâóþùåå ïðàâèëî òîæå îïèðàåòñÿ ïðè áîëüøèõ m, n íà êâàíòèëè ãàóññîâñêîãî çàêîíà: íî â
÷åì èìåííî îòëè÷èå ïðàâèëà, äëÿ ïàðû àëüòåðíàòèâ mx 6 my è mx > my îò ïðàâèëà äëÿ ïàðû àëüòåðíàòèâ
mx < my è mx > my ?
3. Äëÿ âûáîðîê S_04_001.dat è S_04_003.dat ïîäõîäÿùèì êðèòåðèåì íà óðîâíå çíà÷èìîñòè 0.01 ïðîâåðèòü
ãèïîòåçó, ÷òî ìåäèàíà ïåðâîãî ðàñïðåäåëåíèÿ íå ïðåâîñõîäèò ìåäèàíû âòîðîãî.
4 Ïîíÿòíî, ÷òî âíå ýòîé ãèïîòåçû îáúåäèíåíèå âûáîðîê ìîæåò âîîáùå ãîâîðÿ ïðèâåñòè ê ñàìûì ïàðàäîêñàëüíûì ïîñëåäñòâèÿì!

9
4.3 Î ïðåîáðàçîâàíèèÿõ è ðàíãàõ
 èçëîæåííîì òåñòå èñïîëüçîâàëè ïîðÿäêîâûå íîìåðà â âûáîðêå âìåñòî ðàññìîòðåíèÿ èñõîäíûõ çíà÷åíèé. Ýòîò
ïðèåì ïîëåçåí è â äðóãèõ ñèòóàöèÿõ, íàïðèìåð ïðè îöåíèâàíèè ïî âûáîðêàì ìåðû çàâèñèìîñòè äâóõ ðàçíûõ
ñëó÷àéíûõ âåëè÷èí.
Êàê èçâåñòíî, â òåîðèè âåðîÿòíîñòåé åñòü ïîíÿòèå íåçàâèñèìîñòè, à çàâèñèìîñòü îçíà÷àåò íàðóøåíèå ñâîé-
ñòâà íåçàâèñèìîñòè. Åñëè îãðàíè÷èâàòüñÿ ñëó÷àéíûìè âåëè÷èíàìè ñ êîíå÷íûìè ïåðâûì è âòîðûì ìîìåíòîì,
òî äëÿ çàâèñèìûõ ñëó÷àéíûõ âåëè÷èí âîçíèêàåò äîñòàòî÷íûé ïðèçíàê çàâèñèìîñòè  êîýèöèåíò êîððåëÿ-
öèè, êîòîðûé äîïóñêàåò ãåîìåòðè÷åñêóþ òðàêòîâêó â òåðìèíàõ êîñèíóñà óãëà ìåæäó âåêòîðàìè â ëèíåéíîì
ïðîñòðàíñòâå òàêèõ ñëó÷àéíûõ âåëè÷èí. Åñëè, íàïðèìåð, äâà âåêòîðà ïàðàëëåëüíû è, ñòàëî áûòü, ïðîïîðöè-
îíàëüíû (çàâèñèìû), òî êîýèöèåíò êîððåëÿöèè îêàçûâàåòñÿ ïî ìîäóëþ ðàâíûì 1, à ïî ïîñòðîåíèþ ýòîãî
ëèíåéíîãî ïðîñòðàíñòâà ñî ñêàëÿðíûì ïðîèçâåäåíèåì, íåçàâèñèìûå ñ.â. îêàæóòñÿ îðòîãîíàëüíû è òåì ñàìûì,
êîýèöèåíò êîððåëÿöèè áóäåò íóëåì.
Òàêèì îáðàçîì, îöåíêà êîýèöèåíòà êîððåëÿöèè ïî âûáîðêå  ïðàêòè÷åñêè âàæíàÿ è ÷àñòî âñòðå÷àþùàÿñÿ
çàäà÷à. Èíòóèòèâíî êàæåòñÿ äîâîëüíî î÷åâèäíîé îöåíêà Ïèðñîíà (Pearson) äëÿ ρ, ñêîíñòðóèðîâàííàÿ ïî plug-in
îöåíêàì ìàòåìàòè÷åñêîãî îæèäàíèÿ è äèñïåðñèè êîìïîíåíò ñëó÷àéíîãî âåêòîðà (ξ, η):
P
[(xk − x̄)(yk − ȳ)]
ρ̂ = pP k P
2 2
k (xk − x̄) k (yk − ȳ)

(ïîäðàçóìåâàåòñÿ, ÷òî âûáîðêà çíà÷åíèé âåêòîðà ñîñòîèò èç ïàð (xi , yi )).


Îäíàêî ýòà èíòóèòèâíî ïîíÿòíàÿ îðìóëà íà ïðàêòèêå îáëàäàåò ñòàòèñòè÷åñêè íåïðèÿòíûìè ñâîéñòâàìè,
÷òî è ïîêàçûâàáò ïåðâûå äâà óïðàæíåíèÿ èç ðàçäåëà 4.4 íèæå. Èç íèõ ïîíÿòíî, ÷òî ïðîáëåìíîå ïîâåäåíèå ñâÿ-
çàíî ñ ýåêòîì ìàñøòàáà âûáðîñà. Èäåÿ, ïîõîæàÿ íà òó, ÷òî èñïîëüçîâàëàñü â êðèòåðèÿõ Óèëêîêñîíà, Ìàííà
è Óèòíè ïîäñêàçûâàåò ýåêò óíè÷òîæåíèÿ ìàñøòàáà ïî ñõåìå: âûáîðêà ïàð çíà÷åíèé (xi , yi ) âåêòîðà (α, β)
òðàíñîðìèðóþòñÿ â âûáîðêó ïàð Fn∗ (xi ), G∗n (yi ), ãäå Fn∗ , G∗n ñîîòâåòñòâåííî ýìïèðè÷åñêèå óíêöèè ðàñïðåäåëå-
íèÿ êîîðäèíàò âåêòîðà. Èíûìè ñëîâàìè, âìåñòî êîýèöèåíòà êîððåëÿöèè ρα,β âû÷èñëÿþò ïî îðìóëå Ïèðñîíà
îöåíêó äëÿ ρFα (α),Fβ (β) . Îòâåò íàçûâàåòñÿ îöåíêîé êîýèöèåíòà êîððåëÿöèè ïî Ñïèðìåíó (Spearman) ρ̂s . å-
çóëüòàò ïðåîáðàçîâàíèÿ ñëó÷àéíîãî âåêòîðà (α, β) ê âåêòîðó (Fα (α), Fβ (β)) íàçûâàåòñÿ (äâóìåðíîé) êîïóëîé è
äîñòàòî÷íî ÷àñòî âñòðå÷àåòñÿ â ñòàòèñòè÷åñêîì àíàëèçå ìíîãîìåðíûõ äàííûõ.
×àñòî âñòðå÷àåòñÿ òàêæå åùå îäíà õàðàêòåðèñòèêà çàâèñèìîñòè, ïîñòðîåííàÿ â äóõå êðèòåðèÿ çíàêîâ  îíà
íàçûâàåòñÿ êîððåëÿöèîííûì êîýèöèåíòîì τ Êåíäàëëà (Kendall Correlation Coe ient) è âû÷èñëÿåòñÿ ïî
îðìóëå
2 X
τ̂ = sign(xi − xj )sign(yi − yj )
n(n − 1) i<j
Òàê æå êàê è äëÿ ïðèâû÷íîãî êîýèöèåíòà êîððåëÿöèè â ñëó÷àå ëèíåéíîé ñâÿçè äâóõ âûáîðîê ñëó÷àéíûõ
âåëè÷èí τ̂ ïðèíèìàåò çíà÷åíèÿ ±1, íàïðîòèâ äëÿ âûáîðîê èç íåçàâèñèìûõ ñ.â. çíà÷åíèå τ̂ ìàëî (â ñìûñëå
êîíöåíòðàöèè çíà÷åíèé âáëèçè íóëÿ).
 ÿçûêå python âñå íåîáõîäèìûå âû÷èñëåíèÿ, ðàçóìååòñÿ, ðåàëèçîâàíû è âêëþ÷åíû â s ipy.stats. Íåïðè-
ÿòíîñòü: êîððåëÿöèîííûé êîýèöèåíò Êåíäàëëà îïðåäåëåí â ðàçíûõ ìåñòàõ ïî-ðàçíîìó.  ÷àñò-
íîñòè â python îí îïðåäåëÿåòñÿ ïî óìîë÷àíèþ ÍÅ ÒÀÊ. À êàê? àçáåðèòåñü ïî s ipy.stats è áóäüòå
âíèìàòåëüíû, åñëè âäðóã ïðèäåòñÿ ðåàëüíî âû÷èñëÿòü åãî.
Ïðè âû÷èñëåíèÿõ ìû ïîëó÷àåì ñëó÷àéíóþ âåëè÷èíó, êîòîðàÿ ïîìîãàåò ðåøàòü âîïðîñ î ãèïîòåçå íåçàâèñèìî-
ñòè. Ñëåäîâàòåëüíî, íà ïðàêòèêå íåîáõîäèìî çíàòü, ïîïàëî ëè íàøå âû÷èñëåíèå ñîîòâåòñòâóþùåé ñòàòèñòèêè â
êðèòè÷åñêóþ îáëàñòü, óñòàíîâëåííóþ äëÿ äàííîé çíà÷èìîñòè êðèòåðèÿ. Ïîýòîìó áèáëèîòå÷íàÿ óíêöèÿ òàêæå
âû÷èñëÿåò ñîîòâåòñòâóþùèé êâàíòèëü è ïîêàçûâàåò ñëåäóåò ëè îòâåðãíóòü ãèïîòåçó î íåçàâèñèìîñòè. àçáåðè-
òåñü ñàìîñòîÿòåëüíî, êàê èñïîëüçîâàòü ýòè ïðàâèëà äëÿ âñåõ òðåõ îöåíîê çàâèñèìîñòè, óêàçàííûõ âûøå.
 ñëó÷àå íåïðåðûâíîãî ñëó÷àéíîãî âåêòîðà (α, β) èìåþùåãî ïëîòíîñòü ìîæíî åùå óêàçàòü àíàëèòè÷åñêèå
îðìóëû äëÿ êîýèöèåíòîâ êîððåëÿöèè Ñïèðìåíà ρs è Êåíäàëëà ρτ , à èìåííî, ðàññìîòðèì äâóìåðíóþ êî-
ïóëó, ïîñòðîåííóþ ïî ñëó÷àéíîìó âåêòîðó  ýòî ñëó÷àéíûé âåêòîð ñ íîñèòåëåì [0, 1] × [0, 1] b äâóìåðíîé
äèåðåíöèèðóåìîé óíêöèåé ðàñïðåäåëåíèÿ C(x, y). Òîãäà
ZZ
ρs = 12 [C(x, y)] dxdy − 3
[0,1]2
ZZ  
∂C ∂C
ρτ = 1 − 4 (x, y) + (x, y) dxdy
∂x ∂y
[0,1]2

10
à âûáîðî÷íûå îðìóëû âûøå áóäóò ñîîòâåòñòâåííî îöåíêàìè ýòèõ âåëè÷èí. Çäåñü ìû ýòî îñòàâëÿåì áåç äîêà-
çàòåëüñòâà, ññûëêà íà ñòàòüþ doi: 10.1016/j.jspi.2006.06.045

4.4 Óïðàæíåíèÿ
Ïðèãîòîâüòå âûáîðêó X èç 999 çíà÷åíèé ñëó÷àéíîãî âåêòîðà (α, β) ñ íåçàâèñèìûìè è ðàâíîìåðíî ðàñïðåäåëåí-
íûìè íà [0, 1] êîìïîíåíòàìè.
1. Äîáàâüòå â èñõîäíóþ âûáîðêó X ïàðó çíà÷åíèé (âûáðîñ) (100, 100)  ýòî áóäåò ìíîæåñòâî äàííûõ Y è
âû÷èñëèòå äëÿ ìíîæåñòâà äàííûõ Y çíà÷åíèÿ êîýèöèåíòà êîððåëÿöèè ïî îðìóëå Ïèðñîíà.
2. Äîáàâüòå â âûáîðêó X ïàðó çíà÷åíèé (âûáðîñ) (5, 5)  ýòî áóäåò ìíîæåñòâî äàííûõ Y è âû÷èñëèòå äëÿ
ìíîæåñòâà äàííûõ Y çíà÷åíèÿ ïî îðìóëå Ïèðñîíà.
3. Äîáàâüòå â èñõîäíóþ âûáîðêó X ïàðó çíà÷åíèé (âûáðîñ) (100, 100)  ýòî áóäåò ìíîæåñòâî äàííûõ Y è
âû÷èñëèòå äëÿ ìíîæåñòâà äàííûõ Y çíà÷åíèÿ êîýèöèåíòà êîððåëÿöèè ïî îðìóëå Ñïèðìåíà.
4. Äîáàâüòå â âûáîðêó X ïàðó çíà÷åíèé (âûáðîñ) (5, 5)  ýòî áóäåò ìíîæåñòâî äàííûõ Y è âû÷èñëèòå äëÿ
ìíîæåñòâà äàííûõ Y çíà÷åíèÿ ïî îðìóëå Ñïèðìåíà.
5. Ñðàâíèòå ñ îòâåòàìè ïî îðìóëå Ïèðñîíà.

5 Íåïðåðûâíûå è äèñêðåòíûå ìîäåëè. Èñïîëüçîâàíèå χ2


Íàïîìíèì, ÷òî ðàñïðåäåëåíèå ñóììû k êâàäðàòîâ íåçàâèñèìûõ íîðìàëüíûõ ñëó÷àéíûõ âåëè÷èí (òî åñòü òåõ,
÷òî ðàñïðåäåëåíû êàê N (0, 1)) íàçûâàåòñÿ ðàñïðåäåëåíèåì χ2 ñ k ñòåïåíÿìè ñâîáîäû. Â ëåêöèÿõ áûëà ïîêàçàíà
ñâÿçü ïëîòíîñòè ðàñïðåäåëåíèÿ χ2 ñ ïëîòíîñòÿìè ñåìåéñòâà ãàììà-ðàñïðåäåëåíèé
1 r r−1 −bx
f[b,r] (x) = b x e
Γ(r)
Èìåííî, ïîñëå íåïîñðåäñòâåííîé ïðîâåðêè òîãî, ÷òî ïëîòíîñòü ðàñïðåäåëåíèÿ êâàäðàòà íîðìàëüíîé ñëó÷àéíîé
âåëè÷èíû N (0, 1) ñîâïàäàåò ñ ñ f[ 12 , 21 ] (x) íàäî áûëî âîñïîëüçîâàòüñÿ ñâîéñòâîì çàìêíóòîñòè ñåìåéñòâà ãàììà-
ïëîòíîñòåé îòíîñèòåëüíî îïåðàöèè ñâåðòêè (êàê èçâåñòíî, îòâå÷àþùåé îïåðàöèè ñóììèðîâàíèÿ íåçàâèñèìûõ
ñëó÷àéíûõ âåëè÷èí):
f[b,r1 ] ∗ f[b,r2 ] = f[b,r1 +r2 ]
Ïîýòîìó ïëîòíîñòü ðàñïðåäåëåíèÿ χ2 ñ k ñòåïåíÿìè ñâîáîäû âûðàæàåòñÿ îðìóëîé
1 − k k −1 − x
fχ2k (x) = f[ 1 , k ] (x) = 2 2x2 e 2
2 2
Γ( k2 )

5.1 Îò íåïðåðûâíîñòè ê äèñêðåòíîñòè


àíåå áûëè ïðèìåðû ñòàòèñòè÷åñêèõ ìåòîäîâ, îñíîâàíûõ íà ïðåîáðàçîâàíèÿõ èñõîäíûõ âûáîðîê ê ¾áîëåå ïðî-
ñòîìó¿ òèïó: çàìåíà íà ïîñëåäîâàòåëüíîñòè èç íóëåé è åäèíèö â êðèòåðèè çíàêîâ, ðàíãîâûå ìåòîäû. Åùå îäèí
ïîõîæèé âàðèàíò ñâÿçàí ñ î÷åíü èçâåñòíûì ìåòîäîì χ2 (è åãî áîëåå òî÷íîé âåðñèåé äëÿ íå ñëèøêîì áîëüøèõ
âûáîðîê), åãî îñíîâà â ãðóïïèðîâàíèè äàííûõ, êîòîðîå â ÷àñòíîñòè ïîëîæåíî â îñíîâó ïîñòðîåíèÿ ãèñòîãðàìì.
Èìåííî, åñëè çàèêñèðîâàòü ñèñòåìó ïîäìíîæåñòâ-áèíîâ Ui ⊂ Rm , i = 1, . . . k , òî n-âûáîðêà ñëó÷àéíîãî âåê-
~ : Ω → Rm ïîðîæäàåò n-âûáîðêó èç ñëó÷àéíîãî âåêòîðà β~ : Ω → Rk , ñ áèíîìèàëüíî ðàñïðåäåëåííûìè
òîðà α
êîìïîíåíòàìè5 , êàæäîå áèíîìèàëüíîå ðàñïðåäåëåíèå õàðàêòåðèçóåòñÿ ïàðàìåòðàìè n, pi ãäå pi = P (ξ ∈ Ui ).
×àñòîòà ïîïàäàíèÿ â êàæäûé áèí â ýòîì ñëó÷àå ÿâëÿåòñÿ îöåíêîé (íåèçâåñòíîãî âîîáùå ãîâîðÿ) ïàðàìåòðà
pi äëÿ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ βi , îòâå÷àþùåãî i-é êîìïîíåíòå âåêòîðà β ~ . Ïðåäïîëîæåíèÿ î õàðàêòå-
ðå ðàñïðåäåëåíèÿ α~ îïðåäåëÿþò ïðåäïîëîæåíèÿ î âåëè÷èíå pi è îïðîâåðæåíèå ãèïîòåçû î âåëè÷èíå pi âëå÷åò
îïðîâåðæåíèå ãèïîòåçû î ðàñïðåäåëåíèè α~.
Ìåòîäû îöåíêè ïàðàìåòðà áèíîìèàëüíîãî ðàñïðåäåëåíèÿ äîñòàòî÷íî íåñëîæíû, âäîáàâîê äëÿ áèíîìèàëü-
íîãî çàêîíà èìååò ìåñòî ÖÏÒ, à èìåííî ñõîäèìîñòü ïî ðàñïðåäåëåíèþ îòíîøåíèÿ √ βi −np ê N (0, 1). Òàêèì
np(1−pi )

5 Íàïðèìåð, ïðè m = 1 ñèñòåìà èíòåðâàëîâ áèíèðîâàíèÿ â êîëè÷åñòâå k øòóê îïðåäåëÿåò ãèñòîãðàììó, òî åñòü íàáîð èç k
âåëè÷èí, îòâå÷àþùèõ ¾÷èñëó óñïåõîâ ïîïàäàíèÿ â êàæäûé áèí¿

11
îáðàçîì, ñòàòèñòè÷åñêàÿ ïðîâåðêà êàæäîãî èç áèíîìèàëüíûõ çàêîíîâ ïðè äîñòàòî÷íî áîëüøîé äëèíå n èñõîäíîé
âûáîðêè ñâÿçàíà ñ îäíèì è òåì æå ðàñïðåäåëåíèåì N (0, 1). Ïðè èêñèðîâàííîé âûáîðêå ïðèáëèæåíèå êàæäîé
êîìïîíåíòû ïðåäåëüíûì ãàóññîâûì çàêîíîì èìååò ðàçíóþ òî÷íîñòü, íî âîçìîæíà (áëàãîäàðÿ ðåçóëüòàòó áðè-
òàíñêîãî áèîëîãà è ñòàòèñòèêà îíàëüäà Ôèøåðà) è îäíîâðåìåííàÿ ïðîâåðêà ãèïîòåç îáî âñåõ âåðîÿòíîñòÿõ pi (è
òåì ñàìûì ïðîâåðêà ãèïîòåçû î ïàðàìåòðàõ ðàñïðåäåëåíèÿ α ~ ) ñ èñïîëüçîâàíèåì îöåíêè äëÿ êîìáèíàöèè ýòèõ
áèíîìèàëüíûõ çàêîíîâ. Îöåíêà âûáðàíà òàê, ÷òî îíà ñõîäèòñÿ ïî ðàñïðåäåëåíèþ ê ðàñïðåäåëåíèþ χ2 áûñòðåå,
÷åì ñõîäèìîñòü ê ãàóññîâûì ðàñïðåäåëåíèÿì â êàæäîé èç êîìïîíåíò ( äîñòàòî÷íî äëèííîå äîêàçàòåëüñòâî ýòî-
ãî àêòà åñòü â êíèãå Âàí äåð Âàðäåí "Ìàòåìàòè÷åñêàÿ ñòàòèñòèêà"). Äëÿ íå î÷åíü áîëüøèõ n èñïîëüçîâàíèå
ïðåäåëüíîãî χ2 -ðàñïðåäåëåíèÿ áóäåò çàâåäîìî íåòî÷íûì, ïîýòîìó íàðÿäó ñ òåñòîì χ2 èìååò ìåñòî òåñò Ôèøåðà,
îñíîâàííûé íà îðìóëàõ ñîîòâåòñòâóþùèõ áèíîìèàëüíûõ ðàñïðåäåëåíèé.

5.2 Èñïîëüçîâàíèå êðèòåðèÿ χ2


Ïðîâåðêà çàêîíà ðàñïðåäåëåíèÿ Åñëè çàêîí Fξ (x) ïðåäïîëàãàåòñÿ èçâåñòíûì, òî äëÿ çàäàííîé ñèñòåìû èç
k ïîëóèíòåðâàëîâ áèíèðîâàíèÿ Ui ⊂ R âîçìîæíî îïðåäåëèòü òåîðåòè÷åñêèå âåðîÿòíîñòè pi = P (ξ ∈ Ui ). Äëÿ
âûáîðêè x1 , . . . xn ðàçîáúåì ïðîìåæóòîê [xmin , xmax ] íà èíòåðâàëû áèíèðîâàíèÿ è óêàæåì ÷èñëà ïîïàäàíèé ni
â ñîîòâåòñòâóþùèé ïîëóèíòåðâàë  îòëè÷èÿ îò ïîñòðîåíèÿ òðàäèöèîííî ïîíèìàåìîé ãèñòîãðàììû â òîì, ÷òî
èíòåðâàëû áèíèðîâàíèÿ íå îáÿçàíû áûòü ðàâíîé äëèíû. Ïîñêîëüêó ìû õîòåëè áû èñïîëüçîâàòü ïðèáëèæåíèÿ
ÖÏÒ, òî èíòåðâàëû áèíèðîâàíèÿ ñëåäóåò âûáèðàòü òàê, ÷òîáû ëþáîå npi áûëî áû ïî êðàéíåé ìåðå íå ìåíåå 5.
Ïîäîáíî òîìó, êàê ýòî äåëàëîñü â Êîíòðîëüíîé àáîòå, âåëè÷èíà ¾ðàññòîÿíèÿ¿ D âû÷èñëÿåòñÿ ïî îðìóëå
k
X (ni − npi )2
D=
i=1
npi

èïîòåçà î ñîîòâåòñòâèè ðàñïðåäåëåíèÿ òåîðåòè÷åñêîé îðìóëå îòêëîíÿåòñÿ íà óðîâíå çíà÷èìîñòè 1 − ǫ, åñëè D


ïðåâîñõîäèò 1 − ǫ-êâàíòèëü äëÿ χ2 - ðàñïðåäåëåíèÿ k − 1 ñòåïåíüþ ñâîáîäû. Åñòåñòâåííûé âîïðîñ: ïî÷åìó k − 1,
êîãäà ÷èñëî ñëàãàåìûõ â îðìóëå ðàâíî k ? Îáúÿñíåíèå â òîì, ÷òî n1 +. . .+nk = n è òåì ñàìûì â îðìóëå èìååòñÿ
çàâèñèìîñòü ìåæäó ñëàãàåìûìè, à â ðàñïðåäåëåíèè χ2 k ñòåïåíÿìè ñâîáîäû ïðåäïîëàãàëîñü k íåçàâèñèìûõ
ñëàãàåìûõ. Áîëåå òîãî, åñëè ãèïîòåçà î ðàñïðåäåëåíèè ïàðàìåòðè÷åñêàÿ è l íåîáõîäèìûõ çíà÷åíèé ïàðàìåòðîâ
âçÿòû èç îöåíîê ïî òîé æå âûáîðêå, òî êîëè÷åñòâî ñòåïåíåé ñâîáîäû äëÿ χ2 - ðàñïðåäåëåíèÿ íàäî âçÿòü åùå
ìåíüøèì, à èìåííî k − l − 1.

Ïðîâåðêà ãèïîòåçû î íåçàâèñèìîñòè êîìïîíåíò ñëó÷àéíîãî âåêòîðà (χ2 -òåñò Ïèðñîíà) Ïåðåñ÷èòàåì
(èñïîëüçóÿ ïîäõîäÿùèå èíòåðâàëû áèíèðîâàíèÿ) âûáîðêó êîìïîíåíò â âûáîðêó ïàð (i, j) äèñêðåòíûõ ñëó÷àé-
íûõ âåëè÷èí, ïîëó÷àåì òàáëèöó ÷èñåë ni,j , îòâå÷àþùèõ êîëè÷åñòâàì íàáëþäåíèé ïàð çíà÷åíèé:
1 2 ... k
1 n1,1 n1,2 . . . n1,k
2 n2,1 n2,2 . . . n2,k
... ... ... ... ...
l nl,1 nl,2 . . . nl,k
P
Îáîçíà÷èì ñóììû ÷èñåë ni,j ïî ñòðîêàì è ïî ñòîëáöàì ñîîòâåòñòâåííî ÷åðåç Ni è Mj , ïóñòü mi,j = Ni Mj / ni,j
Îöåíêîé D îòêëîíåíèÿ îò íåçàâèñèìîñòè (àíàëîãè÷íîé ðàññòîÿíèþ â ïðåäûäóùåì ïðèìåðå) áóäåò

Xl X k
(ni,j − mi,j )2
D=
i=1 j=1
mi,j

Ïî àíàëîãèè ñ ïðåäûäóùèì ïðèìåðîì ãèïîòåçà î íåçàâèñèìîñòè îòâåðãàåòñÿ íà óðîâíå çíà÷èìîñòè íà óðîâíå


çíà÷èìîñòè 1 − ǫ, åñëè D ïðåâîñõîäèò 1 − ǫ-êâàíòèëü äëÿ χ2 - ðàñïðåäåëåíèÿ (k − 1)(l − 1) ñòåïåíüþ ñâîáîäû.

Òàêæå äîñòàòî÷íî èçâåñòíû ïðèìåíåíèÿ ìåòîäà χ2 ê ðàññìàòðèâàåìûì ðàíåå çàäà÷àì ðàçëè÷åíèÿ äâóõ ðàñ-
ïðåäåëåíèé, ïðîâåðêàì ãèïîòåç î ñîâïàäåíèè ïàðàìåòðîâ è ò ï.

5.2.1 Êîå-÷òî åùå î ïðîâåðêå ãèïîòåçû íåçàâèñèìîñòè

Èç êóðñà Òåîðèÿ Âåðîÿòíîñòåé íàì èçâåñòíî îïðåäåëåíèå ñòàòèñòè÷åñêîé çàâèñèìîñòè êàê ¾íå íåçàâèñìîñòè¿,
÷òî óêàçûâàåò íà âîçìîæíîñòü èñïîëüçîâàíèÿ â êðèòåðèè õàðàêòåðèñòèê íåçàâèñèìîñòè, íàïðèìåð, êîýè-
öèåíòà êîððåëÿöèè.  òåîðèè êîýèöèåíò êîððåëÿöèè äîëæåí áûòü íóëåâûì äëÿ íåçàâèñèìûõ ñëó÷àéíûõ

12
âåëè÷èí, ñëåäîâàòåëüíî, åñëè îöåíêà êîýèöèåíòà êîððåëÿöèè ïî âûáîðêå óêàçûâàåò íà òî, ÷òî îí íå ÿâëÿåò-
ñÿ ìàëûì, òî ãèïîòåçó î íåçàâèñèìîñòè íàäî îòâåðãíóòü. Âîïðîñ îá óðîâíå çíà÷åíèé îöåíî÷íîãî êîýèöèåíòà
êîððåëÿöèè ìîæåò áûòü àíàëèòè÷åñêè ðàçðåøåí â ñëó÷àå áîëüøèõ ãàóññîâûõ âûáîðîê.

5.3 Èñïîëüçîâàíèå χ2 äëÿ äîâåðèòåëüíîãî èíòåðâàëà


Äëÿ ãàóññîâûõ âûáîðîê N (a, t) ñ èçâåñòíûì ïàðàìåòðîì a è íåèçâåñòíûì çíà÷åíèåì ïàðàìåòðà t ïîñòðîåíèå
äîâåðèòåëüíîãî èíòåðâàëà äëÿ t åñòåñòâåííûì îáðàçîì ïðèâîäèò ê ðàñïðåäåëåíèþ χ2 . Äåéñòâèòåëüíî, âûáðàâ
îöåíêó äèñïåðñèþ êàê
n
1X
S2 = (xi − a)2
n i=1
2
âèäèì, ÷òî nS t2 ðàñïðåäåëåíà ïî çàêîíó χ ñ n ñòåïåíÿìè ñâîáîäû. Òàêèì îáðàçîì, âûáèðàÿ êâàíòèëè qǫ/2 è
2

q1−ǫ/2 , èìååì
  s s !
nS 2 nS 2 nS 2
1 − ǫ = P qǫ/2 6 2 6 q1−ǫ/2 è 1−ǫ=P 6t6
t q1−ǫ/2 qǫ/2

5.4 Êîìïüþòåðíûå ýêñïåðèìåíòû


Ïîëîæèì ðàçìåð âûáîðêè N = 100 è ïîñòðîèì âûáîðêó äëèíû N ñëó÷àéíîãî âåêòîðà ñ êîìïîíåíòàìè, ðàâ-
íîìåðíî ðàñïðåäåëåííûìè íà îòðåçêàõ [0, 1] è [1, 3] ñîîòâåòñòâåííî. Âûáåðåì ïî 7 (ò.å. ïî ïðàâèëó Ñòåðäæåñà
) ðàâíûõ èíòåðâàëîâ áèíèðîâàíèÿ Ui , Vj ñîîòâåòñòâåííî íà [0, 1] è íà [1, 3]. (Âíèìàíèå: ýòî ÍÅ òå èíòåðâàëû,
êîòîðûå ïðåäëàãàåò àâòîìàòè÷åñêàÿ ãèñòîãðàììà, ò.ê. îíà èñïîëüçóåò ìàêñèìàëüíîå è ìèíèìàëüíîå çíà÷åíèå â
âûáîðêàõ!), è ñîñ÷èòàåì âåëè÷èíó D â òåñòå Ïèðñîíà, à òàêæå àáñîëþòíîå çíà÷åíèå |r| êîýèöèåíòà êîððåëÿ-
öèè (ïî îðìóëå Ïèðñîíà).
Ïîâòîðèì ýòî 10000 ðàç è îïðåäåëèì ñîîòâåòñòâóþùèå êâàíòèëè D0.95 |r|0.95 .
1. Ñðàâíèòå ïîëó÷åííîå çíà÷åíèå D0.95 ñ êâàíòèëåì ðàñïðåäåëåíèÿ χ2 ñ íóæíûì ÷èñëîì ñòåïåíåé ñâîáîäû
(äëÿ ïîñëåäíåãî â Ñåòè åñòü êàëüêóëÿòîð: www.so s istatisti s. om/pvalues/ hidistribution.aspx).
2. Ñðàâíèòå ïîëó÷åííîå çíà÷åíèå |r|0.95 è √1
N
= 0.1

6 Ñèìóëÿöèîííûå ìåòîäû

Ìû êîðîòêî ïîçíàêîìèìñÿ ñ äâóìÿ ÷àñòî âñòðå÷àþùèìèñÿ àïïðîêñèìàöèîííûìè ïðèåìàìè, ïîçâîëÿþùèìè


äåëàòü îöåíêè õàðàêòåðèñòèê òî÷å÷íûõ è èíòåðâàëüíûõ îöåíîê, êîìïüþòåðíàÿ ðåàëèçàöèÿ êîòîðûõ äîñòóïíà
â ÿçûêå python è íå òîëüêî.

6.1 Bootstrap (Ìåòîä áóòñòðàïà)


Áóòñòðàï - ýòî ìåòîä îöåíêè ñòàíäàðòíûõ îøèáîê è âû÷èñëåíèé äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ ñòàòèñòè÷å-
ñêèõ óíêöèîíàëîâ. Êîìïüþòåðíàÿ ðåàëèçàöèÿ îîòâåòñòâåííî ìîæåò áûòü íàéäåíà çäåñü s ipy.stats.bootstrap.
Ïóñòü ðàññìàòðèâàåòñÿ óíêöèîíàë Tn = g(x1 , x2 , . . . xn ) íà âûáîðêàõ (íàïîìíèì, òàêèå óíêöèîíàëû íàçûâà-
þòñÿ ñòàòèñòèêàìè), ìåðà íà âûáîðêàõ âûâîäèòñÿ èç íåèçâåñòíîé óíêöèè ðàñïðåäåëåíèÿ Fξ (x), ÷òî âîîáùå
ãîâîðÿ ïðåïÿòñòâóåò ïðÿìîìó âû÷èñëåíèþ âåðîÿòíîñòíûõ õàðàêòåðèñòèê ñëó÷àéíîé âåëè÷èíû g(ξ1 , ξ2 , . . . ξn )
è, ñòàëî áûòü, ïðåïÿòñòâóåò âû÷èñëåíèþ äèñïåðñèè îöåíêè x̄ äëÿ ñðåäíåãî (ñâÿçàííîé êàê ðàç ñî ñòàíäàðòíîé
îøèáêîé). ×òîáû ïîä÷åðêíóòü ðîëü êîíêðåòíîé óíêöèè ðàñïðåäåëåíèÿ â âû÷èñëåíèè (èíòåãðèðîâàíèåì ïî
ìåðå) ýòîé õàðàêòåðèñòèêè èñïîëüçóåì îáîçíà÷åíèå DFξ (Tn ).
Èäåÿ áóòñòðàïà íà ïðèìåðå âû÷èñëåíèÿ äèñïåðñèè ïî åäèíñòâåííîé âûáîðêå ñîñòîèò èç äâóõ øàãîâ:
Øàã 1: Îöåíèì DFξ (Tn ) ñ ïîìîùüþ ýìïèðè÷åñêîé óíêöèè ðàñïðåäåëåíèÿ Fn∗ (x), òî åñòü âîñïîëüçóåìñÿ çíà-
÷åíèåì DFξ∗ (Tn ), êîòîðîå ñâÿçàíî ñ èíòåãðèðîâàíèåì óæå ïî äèñêðåòíîé ìåðå. Ïðèáëèæåíèå DFξ (Tn ) ñ
ïîìîùüþ DFξ∗ (Tn ) ìîæåò áûòü íå ñòîëü õîðîøåå, íî è åãî åùå íàäî âû÷èñëèòü.

Øàã 2: Âìåñòî èíòåãðèðîâàíèÿ àïðîêñèìèðóåì çíà÷åíèÿ DFξ∗ (Tn ) ñ ïîìîùüþ ñèìóëÿöèé âûáîðîê. Íà ýòîì øàãå
ñèìóëÿöèé ìîæíî ñäåëàòü ìíîãî, òàê ÷òî ìîæíî íàäåÿòüñÿ, ÷òî èòîãîâàÿ àïðîêñèìàöèÿ áóäåò äîñòàòî÷íî
òî÷íîé.

13
Ïðèìåð Ïóñòü Tn = x̄, òîãäà ïîñëå ïåðâîãî øàãà ñðàçó èìååì âû÷èñëåíèå èíòåãðàëà ïî ñòóïåí÷àòîé óíêöèè
P
ðàñïðåäåëåíèÿ: DFξ∗ (Tn ) = S 2 /n, ãäå S 2 = n−1 i (xi − x̄)2 . Íî ýòî ïîòîìó ÷òî îðìóëà g â âûðàæåíèè äëÿ
îêàçàëàñü î÷åíü ïðîñòà, à â îáùåì ñëó÷àå óíêöèîíàëà ïðîñòîé îðìóëû äëÿ DFξ∗ (Tn ) ìîæåò è íå áûòü è òîãäà
ïîíàäîáèòñÿ øàã 2.

Âîò êàê âûãëÿäèò øàã 2:


1. Ñèìóëèðóåì âûáîðêó x̃1 , x̃2 , . . . x̃n äèñêðåòíîé ñëó÷àéíîé âåëè÷èíû ñ äèñêðåòíîé óíêöèåé ðàñïðåäåëåíèÿ
Fn∗ (x) (ðàçóìååòñÿ, â íåé áóäóò ïðåäñòàâëåíû ñ ïîâòîðåíèÿìè ëèøü íåêîòîðûå èç âåëè÷èí x1 , x2 , . . . xn .
¾îïðåäåëèòü¿
2. Âû÷èñëèì óíêöèîíàë T̃n = g(x̃1 , x̃2 , . . . x̃n )
3. Ñäåëàåì ïðåäûäóùèå äâà øàãà N ðàç, ãäå N âåëèêî, âîçíèêíóò ÷èñëà T̃n,1 , T̃n,2 , . . . T̃n,N , êîòîðûå ïî ñóòè
áóäóò âûáîðêîé, êîòîðóþ è áóäåì èñïîëüçîâàòü äëÿ îöåíêè âåðîÿòíîñòíûõ õàðàêòåðèñòèê Tn .
4. Ïîëîæèì çíà÷åíèå áóòñòðàï-äèñïåðñèè se
b boot
 2
N
X N
X
b boot = N −1
se T̃n,i − N −1 T̃n,j 
i=1 j=1

ˆ Êàêîâî íàèáîëüøåå çíà÷åíèå N â îïèñàííîì âûøå ìåòîäå?

Î ãåíåðàöèè äèñêðåòíûõ çàêîíîâ Óêàçàííûé ìåòîä òðåáóåò ñèìóëÿöèè äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí ñ
α a1 a2 . . . am
êîíå÷íûì ÷èñëîì çíà÷åíèé Êàê ýòî äåëàåòñÿ: ñíà÷àëà íàäî ðàçáèòü áîëüøîé îòðåçîê íà
p1 p2 . . . pm
ñèñòåìó ìåíüøèõ, äëèíû êîòîðûõ ïðîïîðöèîíàëüíû p1 , p2 , . . . pm è ñèìóëèðîâàòü ðàâíîìåðíîå ðàñïðåäåëåíèå 
òîãäà ÷àñòîòû ïîïàäàíèÿ â ìåíüøèå îòðåçêè ñòàòèñòè÷åñêè ñîîòâåòñòâóþò p1 , p2 , . . . pm . Îñòàëîñü ñîïîñòàâèòü
òî÷êàì ïîïàâøåé â îòðåçîê ñ íîìåðîì k çíà÷åíèå ak .

Áîëåå óäîáíàÿ âåðñèÿ áóòñòðàïà Â ïðèâåäåííîì ïðèìåðå ñèìóëÿöèÿ äàííûõ áûëà îñíîâàíà íà åäèíñòâåí-
íîé (ñòóïåí÷àòîé) óíêöèè Fn∗ (x)  ýòî íàèáîëåå íåïðèÿòíûé íåïàðàìåòðè÷åñêèé ñëó÷àé, êîãäà îòñóòñòâóþò
áîëåå òî÷íûå ãèïîòåçû î ðàñïðåäåëåíèè. àçóìååòñÿ, â ïàðàìåòðè÷åñêîì ñëó÷àå íàäî îðãàíèçîâàòü ãåíåðàöèþ â
ñîãëàñèè ñ ãèïîòåòè÷åñêîé óíêöèåé ðàñïðåäåëåíèÿ Fξ (x), ÷òî ïðàêòè÷åñêè ñîîòâåòñòâóåò îöåíèâàíèþ, òîëüêî
âåðîÿòíîñòè çàìåíåíû íà ÷àñòîòû. Ïðè ýòîì â ñëó÷àå íåïðåðûâíîãî ðàñïðåäåëåíèÿ íå âîçíèêàåò îãðàíè÷åíèé
íà âåëè÷èíó N .

Áîëåå îáùèì îáðàçîì áóòñòðàïîì ÷àñòî íàçûâàþò ïîäñ÷åò âåðîÿòíîñòíûõ õàðàêòåðèñòèê (íàïðèìåð, ìî-
ìåíòîâ èëè êâàíòèëåé) ñ ïîìîùüþ áîëüøîé ñåðèè ñèìóëÿöèé ñ ïîñëåäóþùèì îöåíèâàíèåì âåðîÿòíîñòåé ÷åðåç
íàáëþäàåìûå â áîëüøîé ñåðèè ÷àñòîò. Èìåííî òàêîé ïîäõîä áûë èñïîëüçîâàí íàìè ðàíåå, òàê ÷òî ìîæíî ñ÷è-
òàòü, ÷òî ñ ïðèìåíåíèåì áóòñòðàïà çíàêîìñòâî óæå ñîñòîÿëîñü.

6.2 Äîâåðèòåëüíûå èíòåðâàëû è áóòñòðàï


Èìååòñÿ íåñêîëüêî âàðèàíòîâ ïîäñ÷åòà äîâåðèòåëüíûõ èíòåðâàëîâ ìåòîäîì áóòñòðàïà.

6.2.1 àóññîâ ìåòîä

Ïðîñòåéøèé ìåòîä çàêëþ÷åí â îðìóëå (êàê âñåãäà zα/2 îáîçíà÷àåò êâàíòèëü íîðìàëüíîãî ðàñïðåäåëåíèÿ
N (0, 1)
T̂n ± zα/2 se
b boot
Åñëè èçíà÷àëüíî ξ íå ÿâëÿëàñü ãàóññîâîé ñëó÷àéíîé âåëè÷èíîé, òî òî÷íîñòü ýòîé îðìóëû íå âïîëíå ÿñíà.

6.2.2 Ìåòîä êâàíòèëåé

Èäåÿ çàêëþ÷àåòñÿ â òîì, ÷òîáû ñíà÷àëà íåïîñðåäñòâåííî ñèìóëèðîâàòü çíà÷åíèÿ Tn , îïèðàÿñü íà áîëüøîé
çàïàñ âûáîðîê, ïîëó÷åííûõ ëèáî â ñîãëàñèè ñ ïðåäïîëîæèòåëüíûì çàêîíîì ðàñïðåäåëåíèÿ Fξ (x), ëèáî íà Fn∗ (x)
à ïîòîì âûáðàòü êîíöû èíòåðâàëà â ñîîòâåòñòâèè ñ ïîäñ÷èòàííûìè ïî ñèìóëÿöèÿì êâàíòèëÿì.

14
6.2.3 Äðóãèå ìåòîäû

Äîñòàòî÷íîå ÷èñëî ðàçíûõ ïîäõîäîâ ê ïîñòðîåíèþ äîâåðèòåëüíûõ èíòåðâàëîâ ìîæíî ñîîðóäèòü, ìåíÿÿ âà-
ðèàíòû êàê ñèìóëèðóåòñÿ çíà÷åíèå Tn : êàêèå ïðè ýòîì ðàññìàòðèâàþòñÿ ìåðû (íàïðèìåð, Fξ (x) èëè Fn∗ (x) ),
îïèðàåìñÿ ëè ìû íà êâàíòèëè äëÿ îïðåäåëåíèÿ êîíöîâ èíòåðâàëà èëè èñïîëüçóåì òî÷å÷íûå îöåíêè ñòàíäàðòíîé
îøèáêè, âàðèàíòû ïðîñ÷åòà ýòîé ñòàíäàðòíîé îøèáêè è.ò.ä.).

6.3 Óïðàæíåíèÿ. Áóòñòðàï ïî âûáîðêå.


1. Ïóñòü x1 , x2 , . . . xn âûáîðêà èç ãàóññîâà çàêîíà ñ σ = 1 è íåèçâåñòíûì a. àññìîòðèì ñòàòèñòèêó θ =
exp(x̄), êîòîðóþ ìû ñîáèðàåìñÿ èñïîëüçîâàòü äëÿ îöåíêè ïàðàìåòðà ea . Ïîäãîòîâüòå âûáîðêó äëèíû 100
ñ èñïîëüçîâàíèåì a = 5. Ìåòîäîì áóòñòðàïà ïî âûáîðêå îïðåäåëèòå se b boot è 95% äîâåðèòåëüíûé èíòåðâàë
äëÿ ïàðàìåòðà ea . Íàðèñóéòå ãèñòîãðàììó âîçíèêàþùèõ â ïðîöåññå áóòñòðàïà çíà÷åíèé θb è ñðàâíèòå ñ
¾èñòèííîé¿ èñòèííîé ãèñòîãðàììîé äëÿ ñòàòèñòèêè θ = exp(x̄) ïîëó÷åííîé ïîñðåäñòâîì ìîäåëèðîâàíèÿ
ìíîãèõ ãàóññîâûõ âûáîðîê ñ a = 5.
2. Ïóñòü x1 , x2 , . . . xn âûáîðêà èç ðàâíîìåðíîãî íà [0, C] çàêîíà (C  ïàðàìåòð). Ñîçäàéòå âûáîðêó äëèíû 50
äëÿ C = 1. Ïîëîæèì ñòàòèñòèêó θ = max(xi ), êîòîðóþ ìû ñîáèðàåìñÿ èñïîëüçîâàòü äëÿ îöåíêè ïàðàìåòðà
C . Íàðèñóéòå ãèñòîãðàììó âîçíèêàþùèõ â ïðîöåññå áóòñòðàïà çíà÷åíèé θb è ñðàâíèòå ñ ¾èñòèííîé¿ ãèñòî-
ãðàììîé äëÿ ñòàòèñòèêè θ ïîëó÷åííîé ïîñðåäñòâîì ìîäåëèðîâàíèÿ ìíîãèõ ðàâíîìåðíûõ âûáîðîê ñ C = 1.
Íàéäèòå àíàëèòè÷åñêîå âûðàæåíèå äëÿ ïëîòíîñòè fθ .

6.4 Ja kknife (Ìåòîä ñêëàäíîãî íîæà)


Ñòàòèñòè÷åñêèå ìåòîäû îáðàáîòêè äàííûõ èñïîëüçóþò îðìóëû, êîòîðûå âîîáùå ãîâîðÿ ïðèìåíèìû ïðè ðàç-
íûõ äëèíàõ âûáîðîê è â ïðèíöèïå äîëæíû ðàáîòàòü òî÷íåå ñ óâåëè÷åíèåì äëèí ðàññìàòðèâàåìûõ âûáîðîê. Òà-
êèì îáðàçîì, æåëàÿ ÷òî-ëèáî âûÿñíèòü î ðàñïðåäåëåíèè ñòàòèñòèêè Tn , áûëî áû óäîáíî îïèðàòüñÿ íà áîëüøîå
÷èñëî n-âûáîðîê, ïîñòðîåííûõ â ñîîòâåòñòâèè ñ ðàññìàòðèâàåìûìè ãèïîòåçàìè. Èíîãäà îäíàêî ýòî îêàçûâàåòñÿ
òðóäíîðåàëèçóåìûì (íàïðèìåð, åñëè ãèïîòåçà î ðàñïðåäåëåíèè ïàðàìåòðè÷åñêàÿ è îöåíêà ïàðàìåòðà âûãëÿäèò
ñëîæíîé) è òîãäà èñïîëüçóþò èäåþ ¾ñêëàäíîãî íîæà¿, íàðåçàþùåãî èç âûáîðêè äëèíû n ìíîæåñòâî áîëåå êî-
ðîòêèõ âûáîðîê, ïîëó÷åííûõ óäàëåíèåì îäíîãî èëè íåñêîëüêèõ ÷èñåë â èñõîäíîé âûáîðêå.  íåêîòîðîì ñìûñëå,
ýòî òàêîé ¾áóòñòðàï äëÿ áåäíûõ¿: ñîâîêóïíîñòü âîçìîæíûõ âûáîðîê äëÿ íàõîæäåíèÿ ñòàòèñòè÷åñêèõ õàðàê-
òåðèñòèê ðàñïðåäåëåíèÿ ïîðîæäåíà èñõîäíîé n-âûáîðêîé. Äàëåå ñâîéñòâà îöåíî÷íîé îðèóëû äëÿ Tn âûâîäÿò
(íàïðèìåð, óñðåäíåíèåì) èç ïîëó÷àåìûõ çíà÷åíèé Tn−1 . Ñîîòâåòñòâóþùàÿ êîìïüþòåðíàÿ ðåàëèçàöèÿ ìîæåò
áûòü íàéäåíà çäåñü çäåñü https://do s.astropy.org/en/stable/api/astropy.stats.ja kknife_stats.html.
Ïðèìåð Ïóñòü Tn = T (x1 , x2 , . . . xn ) çàäàåò îöåíêó íóæíîé íàì âåëè÷èíû θ, íàïîìíèì, ÷òî ñìåùåíèåì îöåíêè
íàçûâàåòñÿ bias(Tn ) = E(Tn ) − θ. Ñðåäè ðàíåå ðàññìàòðèâàåìûõ îöåíî÷íûõ îðìóë äîñòàòî÷íî ÷àñòî ñìåùå-
íèå èìååò ïîðÿäîê 1/n. Îöåíêè Tja k íà îñíîâå ìåòîäà íîæà â ýòèõ ñëó÷àÿõ èìåþò (åñëè èìåþò) ñìåùåíèå
êâàäðàòè÷íîãî ïîðÿäêà 1/n2 .
àññìîòðèì îöåíêè Tn,hii , ïîëó÷åííûå íà n−1-âûáîðêàõ, ïîñòðîåííûõ èç èñõîäíîé áåç xi . Îïðåäåëèì îöåíêè
n n
1Xe 1 X 
Tei = nTn − (n − 1)Tn,hii ; Tja k = Ti = nTn − (n − 1)Tn,hii
n i=1 n i=1

Ïðè ýòîì Tei íàçûâàþòñÿ ïñåâäîçíà÷åíèÿìè. Ñëåäóåò ïîìíèòü îäíàêî, ÷òî òàê óñòðîåííûå îöåíêè íå îáÿçàòåëüíî
ÿâëÿþòñÿ ñîñòîÿòåëüíûìè, òî åñòü ïðè n → ∞ íå îáÿçàòåëüíî ñõîäÿòñÿ ïî âåðîÿòíîñòè ê èñòèííûì çíà÷åíèÿì
ïàðàìåòðà.

7 Ñìåñè ðàñïðåäåëåíèé

Òåîðèÿ, ñ êîòîðîé äî ñèõ ïîð âû ñòàëêèâàëèñü, íàöåëåíà íà ïðèìåíåíèÿ, òî åñòü íà àíàëèç ðåàëüíûõ äàííûõ
èçìåðåíèé.  áîëüøèíñòâå ïðèìåðîâ èäåò î äîâîëüíî òîíêèõ ñâîéñòâàõ âûáîðêè çíà÷åíèé, íî íåîáõîäèìî ðàç
è íàâñåãäà îòìåòèòü ñëåäóþùåå: ìàòåìàòè÷åñêàÿ ñòàòèñòèêà âñåãäà îïåðèðóåò ñ äàííûìè êðàéíå ñïåöèàëüíîãî
âèäà, à èìåííî ïîëó÷åííûõ â ðàìêàõ îäèíàêîâûõ ïîâòîðíûõ è íåçàâèñèìûõ èçìåðåíèé,  íà ïðàêòèêå ïðî-
âåðêà ïîäîáíîãî ðîäà îãðàíè÷åíèé íà äàííûå åäâà ëè âîçìîæíà. Òàêèì îáðàçîì, íåâûïîëíåíèå â ðåàëüíûõ
äàííûõ ñâîéñòâ, êîòîðûå îæèäàþòñÿ îò âûáîðêè, ìîæåò ñèëüíî ïîâëèÿòü íà àíàëèç è íà âûâîäû.  ïðàêòè÷å-
ñêèõ ñèòóàöèÿõ ñëåäóåò âñåãäà ïðîäóìûâàòü ñëåäóþùèé âîïðîñ: íà êàêîì îñíîâàíèè ìû ïðåäïîëîæèëè,

15
÷òî èìåþùèåñÿ äàííûå ñâÿçàíû ñ èêñèðîâàííûì (÷àñòî ãàóññîâûì) çàêîíîì ðàñïðåäåëåíèÿ òàê,
÷òî íàì îñòàåòñÿ ëèøü îöåíèâàòü íåèçâåñòíûå ïàðàìåòðû ýòîãî çàêîíà. àçóìååòñÿ, åñëè ïðèíÿòü,
÷òî â ïîñëåäîâàòåëüíîñòè èçìåðåíèé (x1 , x2 , . . . xn ) çíà÷åíèÿ âîçíèêàþò èç ñîâåðøåííî íåèçâåñòíûõ ñëó÷àé-
íûõ âåëè÷èí, òî ñòàíîâèòñÿ íåïîíÿòíî, ÷åì èìåííî ñòàòèñòè÷åñêèå ìåòîäû ìîãóò çäåñü ïîìî÷ü. Ïîýòîìó ðàñ-
ñìîòðèì ïðîìåæóòî÷íóþ ðåàëèñòè÷åñêóþ ñèòóàöèþ, êîãäà â ïîñëåäîâàòåëüíîñòè èçìåðåíèé ìû èìååì äåëî
ñî ñëó÷àéíûìè âåëè÷èíàìè èç íåêîòîðîãî ñåìåéñòâà ðàñïðåäåëåíèé, ïðè÷åì ýòî ñåìåéñòâî ìîæåò áûòü ïàðà-
ìåòðèçîâàíî (îáû÷íî çíà÷åíèÿìè èç R). Îäíà èç ñîîòâåòñòâóþùèõ ìàòåìàòè÷åñêèõ ìîäåëåé çäåñü íàçûâàåòñÿ
Ñìåñü èëè ðàíäîìèçàöèÿ, à åå ïðàêòè÷åñêèé ñìûñë ñëåäóþùèé: â ïðîöåññå èçìåðåíèÿ ìû èìååì äåëî ñî
çíà÷åíèÿìè ñëó÷àéíûõ âåëè÷èí èç íåêîòîðîãî ïàðàìåòðèçîâàííîãî ñåìåéñòâà {ξt } îäíîòèïíûõ
ðàñïðåäåëåíèé, ïðè÷åì ïàðàìåòð t çäåñü èçìåíÿåòñÿ òàêæå ñëó÷àéíî è íåçàâèñèìî . Êàæäîå ïî-
6
ñëåäîâàòåëüíîå èçìåðåíèå ïîëó÷åíî êàê xk = θ(ω) = ξβ(ω) (ω), ïðè ýòîì èìåþòñÿ ãèïîòåçû îòíîñèòåëüíî çàêîíîâ
ðàñïðåäåëåíèÿ ñëó÷àéíûõ âåëè÷èí β è ξ òàê, ÷òî ìîæíî ðàññìàòðèâàòü çàäà÷ó î (íå)îòáðàñûâàíèè ýòèõ ãèïîòåç
íà íåêîòîðîì äîâåðèòåëüíîì óðîâíå.
Îêàçûâàåòñÿ, ÷òî â ýòîì ñëó÷àå äàííûå ïðåäñòàâëÿþò âûáîðêó çíà÷åíèé ñëó÷àéíîé âåëè÷èíû θ, ðàñïðåäå-
ëåíèå êîòîðîé è íàçûâàåòñÿ ñìåñüþ ðàñïðåäåëåíèé. Òåì ñàìûì ìû îêàçûâàåìñÿ â ðàìêàõ îáû÷íîãî ñòàòèñòè-
÷åñêîãî ïîäõîäà è ïðîâåðÿåì ãèïîòåçó î ðàñïðåäåëåíèè, îòâå÷àþùåì êîíêðåòíîìó òèïó ñìåñè. Âíà÷àëå áîëåå
âíèìàòåëüíî ðàçáåðåì îïðåäåëåíèå, êîòîðîå áûëî â ëåêöèÿõ.

7.1 Ñìåñü íåñêîëüêèõ çàêîíîâ ðàñïðåäåëåíèÿ


Îïðåäåëåíèå àíäîìèçàöèåé èëè ñìåñüþ ñåìåéñòâà ïëîòíîñòåé {v(x, y)}y (îòâå÷àþùèõ ñëó÷àéíûì âåëè÷èíàì
ñî çíà÷åíèÿìè R, ïàðàìåòðèçîâàííûì y ∈ R ïðè ïîìîùè ïëîòíîñòè u(y)) íàçûâàåòñÿ óíêöèÿ
Z∞
w(x) = v(x, t)u(t)dt (1)
−∞

ˆ Ïðîâåðüòå, ÷òî óíêöèÿ w(x) ñàìà ÿâëÿåòñÿ óíêöèåé ïëîòíîñòè ñëó÷àéíîé âåëè÷èíû, òî åñòü w(x) =
fθ (x).

Äëÿ òîãî, ÷òîáû åå ÿâíî âû÷èñëèòü ñëåäóåò ðàññìàòðèâàòü ðàñïðåäåëåíèå ñëó÷àéíîãî âåêòîðà íà x, y -ïëîñêîñòè
ñ ñîîòâåòñòâóþùåé ìåðîé. Íàïðèìåð, åñëè α ñ.â. ñ ïëîòíîñòüþ fα (x) = v(x) òîãäà äëÿ èêñèðîâàííîãî çíà÷åíèÿ
ïàðàìåòðà t > 0 ñ.â. α/t èìååò ïëîòíîñòü v(xt)t. àññìàòðèâàÿ ïàðàìåòð t êàê çíà÷åíèå (íåçàâèñèìîé) ñëó÷àéíîé
âåëè÷èíû γ ñ ïëîòíîñòüþ u ìû ïîëó÷àåì îðìóëó äëÿ ïëîòíîñòè îòíîøåíèÿ ñëó÷àéíûõ âåëè÷èí α/γ , êîòîðàÿ
ìîæåò áûòü èíòåðïðåòèðîâàíà êàê ïëîòíîñòü ñìåñè ïåðåøêàëèðîâàííûõ ïîñðåäñòâîì ñëó÷àéíîãî ìàñøòàáíîãî
ïàðàìåòðà γ ñëó÷àéíûõ âåëè÷èí α:
Z∞
w(x) = v(xt)tu(t)dt
0

7.2 Çàäà÷è è ïðèìåðû


1. Íàéòè ïëîòíîñòü ñìåñè íåçàâèñèìûõ ðàâíîìåðíûõ íà [0, t] ñëó÷àéíûõ âåëè÷èí, åñëè ïàðàìåòð t > 0 ðàâ-
íîìåðíûé íà (0, 1).
2. Íàéòè ïëîòíîñòü ñìåñè íåçàâèñèìûõ ðàâíîìåðíûõ íà [−t, t] ñëó÷àéíûõ âåëè÷èí, åñëè êâàäðàò ïàðàìåòðà
t > 0 ðàâíîìåðåí íà (0, 1).
3. Ïóñòü β ðàñïðåäåëåíà äèñêðåòíî â ñîîòâåòñòâèè ñ òàáëè÷êîé:

β 0.1 0.2 ... 0.9


1/9 1/9 ... 1/9

à ñëó÷àéíàÿ âåëè÷èíà ξβ  ãàóññîâà N (0, β 2 ) ò.å. ìàòåìàòè÷åñêèì îæèäàíèåì 0 è σ âçÿòûì èç çíà÷åíèé


ñ.â.β .Ïðè ïîìîùè êîìïüþòåðà ïîñòðîéòå âûáîðêó â 20000 çíà÷åíèé ñëó÷àéíîé âåëè÷èíû ξβ , íàðèñóéòå
ñîîòâåòñòâóþùóþ ãèñòîãðàììó â ëèíåéíîì è ïîëóëîãàðèìè÷åñêîì ìàñøòàáàõ ( ñì. òàêæå íà êàðòèíêå
èñ 2 ëåâûé ãðàèê).
6 Äëÿ ñèòóàöèé, êîãäà ïàðàìåòð èçìåíÿåòñÿ íå ñëó÷àéíî, èìååòñÿ äðóãàÿ ìîäåëü, îíà îòíîñèòñÿ ê ñòàòèñòèêå ñëó÷àéíûõ ïðîöåññîâ

16
-2 -1 1 2
1

0.5 0.1

-2 -1 0 1 2 0.01

èñ. 2: åçóëüòàò ðàâíîìåðíîãî ïåðåìåøèâàíèÿ äåâÿòè íåçàâèñèìûõ ãàóññîâñêèõ ñëó÷àéíûõ âåëè÷èí ñ íóëå-
âûì ìàòåìàòè÷åñêèì îæèäàíèåì è ñòàíäàðòíûìè óêëîíåíèÿìè  σ = 0.1, . . . 0.9. ñïëîøíîé ëèíèåé ïîêàçàíà ñî-
2 
1 P9
îòâåòñòâóþùàÿ óíêöèÿ ïëîòíîñòè w(x) = 9 m=1 m√2π exp − 2 m
10 1 10x
, ïóíêòèðîì ïîê è îðìàëèçìàçàíà
ïëîòíîñòü àïïðîêñèìèðóþùåãî ðàñïðåäåëåíèÿ Ëàïëàñà 1.3 exp (−2.6|x|). Ñëåâà: ëèíåéíûé ìàñøòàá, ñïðàâà: ïî-
ëóëîãàðèìè÷åñêèé ìàñøòàá

4. Êàê óáåäèòüñÿ íàãëÿäíûì îáðàçîì, ÷òî ïîëó÷èâøàÿñÿ îðìà ãèñòîãðàììû îòëè÷àåòñÿ îò ãàóññèàíû? (ïîä-
ñêàçêó ñì. íà êàðòèíêå èñ 2 ñïðàâà)
5. Îòëè÷èå îðìû êðèâîé íà èñ 2 îò ãàóññèàíû ñâÿçàíî ñ èñïîëüçóåìîé ýêîíîìèñòàìè (è íå òîëüêî) âåëè-
÷èíîé êóðòîçèñà, êîòîðàÿ âû÷èñëÿåòñÿ êàê îòíîøåíèå ÷åòâåðòîãî öåíòðàëüíîãî ìîìåíòà ðàñïðåäåëåíèÿ ê
êâàäðàòó äèñïåðñèè. Íàéäèòå ñîîòâåòñòâåííî êóðòîçèñû ãàóññèàíû N (0, 1) è êðèâîé ïëîòíîñòè ðàñïðåäå-
ëåíèÿ Ëàïëàñà exp (−2|x|).
6. Ñîðìóëèðóéòå íåïðåðûâíóþ âåðñèþ óêàçàííîãî ïðèìåðà, â êîòîðîé ñ.â. β ðàâíîìåðíî ðàñïðåäåëåíà íà
îòðåçêå [0, 1]. Íàéäèòå ÿâíûé âèä ïëîòíîñòè ξβ â ýòîì ñëó÷àå. åøåíèå ìîæíî íàéòè â ñëåäóþùåì ðàçäåëå.

Cëîæèëîñü, ÷òî ñòàòèñòèêà íà ïðàêòèêå ÷àùå âñåãî èñïîëüçóåòñÿ â ïðèìåíåíèè ê âûáîðêàì ãàóññîâîé ñëó-
÷àéíîé âåëè÷èíû. Êàê óæå ãîâîðèëîñü âûøå, áîëåå ðåàëèñòè÷íûé ñëó÷àé îòâå÷àåò âûáîðêàì èç ñåìåéñòâà ñëó-
÷àéíî øêàëèðîâàííûõ ãàóññîâûõ ñëó÷àéíûõ âåëè÷èí. Ìû ðàññìîòðèì çäåñü íåñêîëüêî ïðèìåðîâ âû÷èñëåíèé
äëÿ ñèòóàöèè, êîãäà âñå ãàóññîâû ñëó÷àéíûå âåëè÷èíû èìåþò íóëåâîå ìàòåìàòè÷åñêîå îæèäàíèå; ýòî òèïè÷íàÿ
ñèòóàöèÿ ïðè èçìåðåíèè òî÷íîñòè ïîêàçàíèé ïðèáîðà â óñëîâèÿõ âëèÿíèÿ íà íåãî âíåøíèõ âîçäåéñòâèé.

7.3 Ïðèìåðû ñìåñåé è ñîîòâåòñòâóþùèõ âû÷èñëåíèé


7.3.1 àâíîìåðíàÿ ñìåñü

àññìîòðèì äîñòàòî÷íî èäåàëèçèðîâàííóþ ìîäåëü - ðàâíîìåðíîå ñìåøèâàíèå ãàóññîâûõ ðàñïðåäåëåíèé ïî-


ñðåäñòâîì ðàâíîìåðíî ðàñïðåäåëåííîé íà îòðåçêå ñëó÷àéíîé âåëè÷èíû ñ ïëîòíîñòüþ
(
1/c 0 ≤ y ≤ c
fβ (y) = (2)
0 y>c
R∞
Ïîêàæåì, ÷òî â ýòîì ñëó÷àå fθ (x) ìîæíî âûðàçèòü â òåðìèíàõ íåïîëíîé àììà-óíêöèè Γ(a, c) = c ta−1 exp(−t)dt
ïîñëå äâóõ ïîäñòàíîâîê â îáùåé èíòåãðàëüíîé îðìóëå 1. Ïåðâàÿ ïîäñòàíîâêà y = u−1 :

17
3

-2 -1 1 2

0.1
1

-2 -1 0 1 2 0.01

 2

èñ. 3: ðàèêè ïëîòíîñòè fθ (x) = √18π Γ 0, x2 äëÿ ðàâíîìåðíîé ñìåñè öåíòðèðîâàííûõ ãàóññîâûõ ðàñïðåäå-
ëåíèé Îáðàòèòå âíèìàíèå íà áåñêîíå÷íîå çíà÷åíèå ïëîòíîñòè ïðè íóëåâîì x. Ñëåâà: ëèíåéíàÿ øêàëà, ñïðàâà:
(äåñÿòè÷íàÿ) ïîëóëîãàðèìè÷åñêàÿ øêàëà. Îáðàòèòå âíèìàíèå íà íåïîõîæåñòü íà ïëîòíîñòü ðàñïðåäåëåíèÿ
Ëàïëàñà.

Zc   Z∞  
1 1 x2 −1 1 1
√ exp − 2 y dy = √ exp − (xu) u−1 du
2
c 2π 2y c 2π 2
0 1/c

à âòîðàÿ t = 2 (xu) :
1 2

Z∞   Z∞  
1 1 1 1 x2
√ exp − (xu) u−1 du = √
2
t −1
exp(−t)dt = √ Γ 0, 2
c 2π 2 2c 2π c 8π 2c
1/c x2 /(2c2 )

 ðåçóëüòàòå ïðèõîäèì ê âûðàæåíèþ


 
1 x2
fθ (x) = √ Γ 0, 2 (3)
c 8π 2c

 ÷àñòíîñòè, ïðè c = 1 ñìåñü öåíòðèðîâàííûõ ãàóññîâûõ ðàñïðåäåëåíèé ñ ðàíîìåðíî âàðüèðóþùèìèñÿ ìåæäó


0 è 1 ñòàíäàðòíûìè óêëîíåíèÿìè äàåò âûðàæåíèå
 
1 x2
fθ (x) = √ Γ 0, (4)
8π 2

7.3.2 åçóëüòàò ïîñëåäîâàòåëüíûõ ñìåøèâàíèé

Çàïèøåì ðàññóæäåíèå î ñâÿçè ñìåñåé ñ ïëîòíîñòüþ îòíîøåíèÿ ñ.â íà ñëó÷àé ñìåøèâàíèÿ ñåìåéñòâà öåíòðèðî-
âàííûõ ãàóññîâûõ ðàñïðåäåëåíèé fσ = N (0, σ 2 ) ñ ïîìîùüþ ñ.â. β > 0:
Z∞  
1 1 x2 −1
fθ (x) = √ exp − 2 t fβ (t)dt
2π 2t
0
Z∞  
1 1 2 2
= √ exp − y x ygη (y)dy
2π 2
0

18
Åñëè ðàññìîòðåòü ïîñëåäîâàòåëüíûå ìàëûå ñìåøèâàíèÿ, òî åñòü êàæäàÿ ñìåøèâàþùàÿ ñ.â. β > 0 èìååò
ïëîòíîñòü fβ ∼ 0 âíå [1 − ε, 1 + ε] äëÿ íåêîòîðîãî ìàëîãî çíà÷åíèÿ ε. Èíûìè ñëîâàìè, ìû ìîæåì ïðåäïîëàãàòü,
÷òî β = eδ ãäå ìàòåìàòè÷åñêîå îæèäàíèå E(δ) ∼ 0 è äèñïåðñèÿ D(δ) ∼ ε2 . Äëÿ ïîñëåäîâàòåëüíîñòè òàêèõ ìàëûõ
ñìåøèâàíèé (ñ íåçàâèñèìûìè βi ) ìû èìååì îòíîøåíèå
α α
= − Pm δ (5)
η1 · η2 . . . · ηm e i i

Pm
Íî â äîñòàòî÷íî ñëàáûõ îáùèõ ïðåäïîëîæåíèÿõ
p ðàñïðåäåëåíèå ñóììû i δi áûñòðî ñõîäèòñÿ ê ðàñïðåäåëåíèþ
P m 2
N (a, s2 ) with a ∼ 0 ïðè ýòîì s ∼ i εi , òàêèì îáðàçîì, ñëó÷àé ïîñëåäîâàòåëüíîñòè ìàëûõ ïðîèçâîëüíûõ
ñìåøèâàíèé ìîæåò áûòü àïïðîêñèìèðîâàíà ñ ïîìîùüþ ïëîòíîñòè
Z∞    
1 x2 1 ln2 t
fθ (x) = √ exp − 2 2 √ exp − 2 dt (6)
tσ 2π 2t σ ts 2π 2s
0

Åñëè â ðåàëüíîé ñèòóàöèè äàííûå äåéñòâèòåëüíî âîçíèêëè êàê ðåçóëüòàò ìíîãèõ ìàëûõ ñìåøèâàíèé, òî ýòà
îðìóëà çàäàåò ïðàâäîïîäîáíóþ ìîäåëü ðàñïðåäåëåíèÿ θ äëÿ äàëüíåéøåé ñòàòèñòè÷åñêîé ïðîâåðêè. Òî÷å÷íàÿ
îöåíêà ïàðàìåòðîâ s è σ ìîæåò áûòü ïîëó÷åíà èçâåñòíûì â ñòàòèñòèêå ¾ìåòîäîì ìîìåíòîâ¿, à èìåííî:

Z
+∞

E|θ| = |x|fθ (x)dx


−∞
 +∞   
Z∞ Z  ln2 t
1 1 x2   exp − 2s2
=  |x| √ exp − 2 2 dx · √ dt
tσ 2π 2t σ ts 2π
0 −∞
Z∞ r   r
2 1 ln2 t 2
= σ · t √ exp − 2 dt = σ Eβ
π ts 2π 2s π
0
r
2 s2 /2
=σ e
π
Z
+∞ Z∞  
2 1 ln2 t
Eθ = x fθ (x)dx = Eα2 · t2 √ exp − 2 dt
2
ts 2π 2s
−∞ 0
2 2 2 2s2
=σ Eβ = σ e

åøàÿ ýòó ñèñòåìó ïîëó÷èì âûðàæåíèÿ äëÿ ïàðàìåòðîâ


(
s2 = ln π2 + ln Eθ2 − 2 ln E|θ|
π2 (E|θ|)4 (7)
σ2 = 4 · Eθ 2

Íà ïðàêòèêå, èñïîëüçóÿ äàííûå, íàäî ïîëó÷èòü îöåíêè ìîìåíòîâ Eθ2 , E|θ| à çàòåì ÷åðåç íèõ âûðàçèòü ñîá-
ñòâåííî íåîòðèöàòåëüíûå ïàðàìåòðû s σ

8 Ìîäåëèðîâàíèå äàííûõ

Ìû ðàññìîòðèì êàíîíè÷åñêóþ çàäà÷ó îïèñàíèÿ ýêñïåðèìåíòàëüíûõ äàííûõ óíêöèîíàëüíîé çàâèñèìîñòüþ.


 ïðîñòåéøåì (îäíîìåðíîì ñëó÷àå) ðå÷ü èäåò î ïîèñêå â çàäàííîì êëàññå óíêöèè y = f (x) òàêîé, ÷òî îíà
íàèáîëåå òî÷íî õàðàêòåðèçóåò äàííûå âèäà (xi , yi ), i = 1, 2, . . . n. Äëÿ íà÷àëà ñëåäóåò ïîíèìàòü, ÷òî ê òàêîé
îðìóëèðîâêå íåîáõîäèìî äîáàâèòü óêàçàíèå, ÷òî îçíà÷àåò íàèáîëåå òî÷íî; òåì ñàìûì íàäî ñîðìóëèðîâàòü
ìàòåìàòè÷åñêóþ ìîäåëü äàííûõ, òðàäèöèîííûé ïîäõîä çäåñü ñîñòîèò â âåðîÿòíîñòíîé èíòåðïðåòàöèè äàííûõ,
à èìåííî ïðè ëþáîì n
yi = f (xi ) + εi , ∀i
ãäå ε1 , ε1 , . . . εn  âûáîðêà çíà÷åíèé ãàóññîâîé ñëó÷àéíîé âåëè÷èíû, N (0, σ), à óíêöèÿ f (x) èçâåñòíà ñ òî÷-
íîñòüþ äî ïàðàìåòðîâ (b0 , b1 , b2 , . . . bm ). Ïîèñê êîíêðåòíîãî íàáîðà ïàðàìåòðîâ â ýòèõ óñëîâèÿõ âûâîäèòñÿ èç

19
ïðèíöèïà ìàêñèìóìà ïðàâäîïîäîáèÿ, à èìåííî ëîãàðèìè÷åñêàÿ óíêöèÿ ïðàâäîïîäîáèÿ (äëÿ ãàóññîâîé âû-
áîðêè) äîëæíà îáðàùàòüñÿ â ìàêñèìóì íà âûáîðêå ε1 , ε1 , . . . εn
n  2
1X yi − f (xi , b0 , b1 , b2 , . . . bm )
l(b1 , b2 , . . . bm ) = − → max
2 i=1 σ

èëè, ÷òî ðàâíîñèëüíî, ìîæíî èñïîëüçîâàòü óñëîâèå


Xn  2
yi − f (xi , b0 , b1 , b2 , . . . bm )
→ min
i=1
σ

è íàçûâàåòñÿ ìåòîäîì íàèìåíüøèõ êâàäðàòîâ (ÌÍÊ). ïðè÷åì òðàäèöèîííî èñïîëüçóþò îáîçíà÷åíèå, ñîâïàäàþ-
ùåå ñ îáîçíà÷åíèåì ñëó÷àéíîé âåëè÷èíû (÷òî âíîñèò ïóòàíèöó äëÿ íåîèòîâ). Çàìåòèì, ÷òî ïîñëåäíåå óñëîâèå
ìèíèìóìà çàâèñÿùåãî îò ïàðàìåòðîâ (b0 , b1 , b2 , . . . bm ) âûðàæåíèÿ (äëÿ êîòîðîãî òðàäèöèîííî èñïîëüçóþò ïî÷òè
òî æå ñàìîå îáîçíà÷åíèå χ
b2 , ÷òî è äëÿ ñëó÷àéíîé âåëè÷èíû) ïðèâîäèò ê ñèñòåìå óðàâíåíèé:
 2
 ∂χ b (b0 ,b1 ,b2 ,...bm )

 2 ∂b0 =0

 ∂ χb (b0 ,b1 ,b2 ,...bm )
∂b2 =0
. . .
 ... ...


 ∂ χb2 (b0 ,b1 ,b2 ,...bm )
∂bm =0

Íà ñàìîì äåëå, â ñëó÷àå ïîëèíîìèàëüíîé óíêöèè f (x) = b0 xm + b1 xm−1 + . . . + bm ñîîòâåòñòâóþùàÿ ñèñòåìà


áåç îñîáåííîãî òðóäà ìîæåò áûòü ðåøåíà, è ýòî ðåøåíèå îîðìëåíî â ÿçûêàõ python è MATLAB áèáëèîòå÷íîé
óíêöèåé polyfit(X,Y,m). Ïðè ýòîì øèðîêèå êðóãè îáùåñòâåííîñòè ñêëîííû ñ÷èòàòü, ÷òî ìåòîäîì ÌÍÊ ìîæ-
íî ïîëüçîâàòüñÿ áåç îãðàíè÷åíèé, ïîëó÷àÿ èç íåãî ¾íàèëó÷øèé ïîëèíîì¿ ïðèáëèæàþùèé çàâèñèìîñòü ìåæäó
àðãóìåíòàìè y è x ïî äàííûì ÷àñòè÷íûõ èçìåðåíèé ýòîé çàâèñèìîñòè ñ íåêîòîðûìè îøèáêàìè. Ñëåäóåò âåñüìà
îñòîðîæíî îòíîñèòüñÿ ê èñïîëüçîâàíèþ ÌÍÊ âíå óêàçàííûõ âûøå ïðåäïîëîæåíèé î ìîäåëè, ÷òî áóäåò âèäíî
èç ñåðèè óïðàæíåíèé íèæå.
 êà÷åñòâå ïîñëåäíåãî çàìå÷àíèÿ çàìåòèì, ÷òî â óñëîâèÿõ ìîäåëè, â ñîãëàñèè ñ ïðèíöèïîì ïðîâåðêè ãèïî-
òåç, ìîæíî óêàçàòü, îïðîâåðãàþò ëè êîíêðåòíûå äàííûå ìîäåëü: äåéñòâèòåëüíî, åñëè èçìåðåííîå â ìèíèìóìå
çíà÷åíèå χb2 ïðåâîñõîäèò êâàíòèëü q1−t , òî ãèïîòåçó î ñîîòâåòñòâèè äàííûõ è ìîäåëè íà óðîâíå çíà÷èìîñòè t
ñëåäóåò îòâåðãíóòü.

8.1 Êîìïüþòåðíûå ýêñïåðèìåíòû äëÿ ÌÍÊ


Íàïèøèòå ïðîãðàììó ñèìóëÿöèè n äàííûõ âèäà yi = b0 xm m−1
i + b1 xi + . . . + bm + ǫi äëÿ xi ∈ [A, B] è âûáîðêè
çíà÷åíèé ε1 , ε1 , . . . εn ñëó÷àéíîé âåëè÷èíû, ñ òåì, ÷òîáû ïðèìåíèòü ê íèì ìåòîä ÌÍÊ è ñðàâíèòü òî÷íîñòü
íàéäåííûõ ïàðàìåòðîâ (b̂0 , b̂1 , . . . b̂m ) ñ çàëîæåííûìè â ìîäåëü ïàðàìåòðàìè (b0 , b1 , . . . bm ). Îáúÿñíèòü, â êàêèõ
ñëó÷àÿõ ìîäåëü äàííîãî ïîðÿäêà ïîäòâåðæäàåòñÿ èëè îïðîâåðãàåòñÿ.

1. Âûáîðêà ε1 , ε1 , . . . εn ñëó÷àéíîé ãàóññîâîé âåëè÷èíû, ðàñïðåäåëåííîé êàê N (0, 20), n = 100, (b0 , b1 , b2 ) =
(2.0, −1.0, 0.5), òî÷êè xi âûáèðàþòñÿ ñ ðàâíûì øàãîì íà îòðåçêå [2, 5], à âîññòàíàâëèâàþòñÿ ïàðàìåòðû
ïîëèíîìà ïåðâîãî ïîðÿäêà. Îïðîâåðãàåòñÿ ëè ñèìóëèðîâàííûìè äàííûìè ìîäåëü ïåðâîãî ïîðÿäêà?
2. Âûáîðêà ε1 , ε1 , . . . εn ñëó÷àéíîé ãàóññîâîé âåëè÷èíû, ðàñïðåäåëåííîé êàê N (0, 20), n = 100, äëÿ ñèìóëÿ-
öèè èñïîëüçóåòñÿ ïîëèíîì ïåðâîãî ïîðÿäêà (b0 , b1 ) = (2.0, −1.0), òî÷êè xi âûáèðàþòñÿ ñ ðàâíûì øàãîì íà
îòðåçêå [2, 5], à âîññòàíàâëèâàþòñÿ ïàðàìåòðû ïîëèíîìà âòîðîãî ïîðÿäêà. Îïðîâåðãàåòñÿ ëè ñèìóëèðîâàí-
íûìè äàííûìè ìîäåëü âòîðîãî ïîðÿäêà?
3. Âûáîðêà ε1 , ε1 , . . . εn ñëó÷àéíîé ãàóññîâîé âåëè÷èíû, ðàñïðåäåëåííîé êàê N (0, 20), n = 200, (b0 , b1 , b2 ) =
(2.0, −1.0, 0.5), òî÷êè xi èç ðàâíîìåðíîãî íà îòðåçêå [2, 5] ðàñïðåäåëåíèÿ, à âîññòàíàâëèâàþòñÿ ïàðàìåòðû
ïîëèíîìà ïåðâîãî ïîðÿäêà. Îïðîâåðãàåòñÿ ëè ñèìóëèðîâàííûìè äàííûìè ìîäåëü ïåðâîãî ïîðÿäêà?
4. Âûáîðêà ε1 , ε1 , . . . εn ñëó÷àéíîé ãàóññîâîé âåëè÷èíû, ðàñïðåäåëåííîé êàê N (0, 20), n = 200, äëÿ ñèìóëÿöèè
èñïîëüçóåòñÿ ïîëèíîì ïåðâîãî ïîðÿäêà (b0 , b1 ) = (2.0, −1.0), òî÷êè xi èç ðàâíîìåðíîãî íà îòðåçêå [2, 5]
ðàñïðåäåëåíèÿ, à âîññòàíàâëèâàþòñÿ ïàðàìåòðû ïîëèíîìà âòîðîãî ïîðÿäêà. Îïðîâåðãàåòñÿ ëè ñèìóëèðî-
âàííûìè äàííûìè ìîäåëü âòîðîãî ïîðÿäêà?

20

Вам также может понравиться