Вы находитесь на странице: 1из 4

Îá èñïîëüçîâàíèè èíôîðìàöèîííîãî êðèòåðèÿ ïðîâåðêè ãèïîòåç î çàêîíå ðàñïðåäåëåíèÿ îøèáîê èçìåðåíèÿ

ÓÄÊ 532.696.1

Ã.È. Ìàíêî, À.À. Äîâãîïîëàÿ

ÎÁ ÈÑÏÎËÜÇÎÂÀÍÈÈ ÈÍÔÎÐÌÀÖÈÎÍÍÎÃÎ ÊÐÈÒÅÐÈß ÏÐÎÂÅÐÊÈ


ÃÈÏÎÒÅÇ Î ÇÀÊÎÍÅ ÐÀÑÏÐÅÄÅËÅÍÈß ÎØÈÁÎÊ ÈÇÌÅÐÅÍÈß
ÃÂÓÇ «Óêðàèíñêèé ãîñóäàðñòâåííûé õèìèêî-òåõíîëîãè÷åñêèé óíèâåðñèòåò», ã. Äíåïðîïåòðîâñê

Ðàññìîòðåíû âîïðîñû èñïîëüçîâàíèÿ èíôîðìàöèîííûõ êðèòåðèåâ ñîãëàñèÿ. Îïè-


ñàíû ñïîñîáû îïðåäåëåíèÿ êðèòè÷åñêîé îáëàñòè ìåòîäîì ñòàòèñòè÷åñêîãî ìîäå-
ëèðîâàíèÿ. Ïðåäëîæåíû ìåòîäû ïîëó÷åíèÿ êðèòè÷åñêèõ çíà÷åíèé èíôîðìàöèîí-
íûõ êðèòåðèåâ ïðîâåðêè ãèïîòåç î çàêîíàõ ðàñïðåäåëåíèÿ îøèáîê èçìåðåíèé.

Essentially, all models are wrong, but some are useful.


George E. P. Box

Ïîñòàíîâêà ïðîáëåìû Àíàëèç èçâåñòíûõ èññëåäîâàíèé è ïóáëèêàöèé


Ïðè èññëåäîâàíèè ìåòðîëîãè÷åñêèõ õàðàê- Ïîïûòêè èñïîëüçîâàíèÿ èíôîðìàöèîííûõ
òåðèñòèê ñðåäñòâ èçìåðåíèÿ òðåáóåòñÿ çíàíèå çà- ïîäõîäîâ ïðè ðåøåíèè çàäà÷ ïðîâåðêè ñòàòèñòè-
êîíîâ ðàñïðåäåëåíèÿ îøèáîê èçìåðåíèé. Âî ìíî- ÷åñêèõ ãèïîòåç äåëàëèñü íåîäíîêðàòíî. Òàê, Êóëü-
ãèõ ñëó÷àÿõ ðàñïðåäåëåíèå îøèáîê îêàçûâàåòñÿ áàê [2] ïðåäëîæèë ðàññìàòðèâàòü ëîãàðèôì îòíî-
äàë¸êèì îò íîðìàëüíîãî. Ïðèõîäèòñÿ ïîäáèðàòü øåíèÿ ïëîòíîñòåé âåðîÿòíîñòåé f1(x) è f2(x), ñîîò-
çàêîí ðàñïðåäåëåíèÿ, îáåñïå÷èâàþùèé áîëåå àäåê- âåòñòâóþùèõ äâóì àëüòåðíàòèâíûì ãèïîòåçàì H1
âàòíûå ðåçóëüòàòû èññëåäîâàíèé. Ýêñïåðèìåíòàëü- è H2, êàê èíôîðìàöèþ â òî÷êå íàáëþäåíèÿ x äëÿ
íûì ïóòåì ïîëó÷àåòñÿ âûáîðêà çíà÷åíèé îøè- ðàçëè÷åíèÿ â ïîëüçó H1 ïðîòèâ H2. Òîãäà ñðåäíÿÿ
áîê, ñòðîèòñÿ ãèñòîãðàììà è âûïîëíÿåòñÿ ïðî- äëÿ âñåãî ìíîæåñòâà X={x} èíôîðìàöèÿ îò íà-
âåðêà íà ñîîòâåòñòâèå òîìó èëè èíîìó òåîðåòè- áëþäåíèÿ îòíîñèòåëüíî âåðîÿòíîñòíîé ìåðû µ2
÷åñêîìó çàêîíó, ÷òî îïðåäåëÿåòñÿ ñ ïîìîùüþ êðè- (ñîîòâåòñòâóþùåé ãèïîòåçå H2) äëÿ ðàçëè÷åíèÿ â
òåðèåâ ñîãëàñèÿ.  êà÷åñòâå êðèòåðèåâ ñîãëàñèÿ ïîëüçó H1 ïðîòèâ H2, îïðåäåëÿåòñÿ ôîðìóëîé
îáû÷íî èñïîëüçóþòñÿ ñòàòèñòèêè – ôóíêöèè îò
âûáîðî÷íûõ çíà÷åíèé [1].
f 2 (x)
Øèðîêî èñïîëüçóåìûå êðèòåðèè ñîãëàñèÿ I(2 :1) = ∫ f 2 ( x ) log dλ( x ),
èìåþò ðÿä íåäîñòàòêîâ, íàëàãàþùèõ îïðåäåëåí- f1 (x)
íûå îãðàíè÷åíèÿ ïðè èõ èñïîëüçîâàíèè. Îáùåé
õàðàêòåðíîé îñîáåííîñòüþ âñåõ òàêèõ êðèòåðèåâ ãäå λ – ìîæåò áûòü ìåðîé µ1 èëè µ2 èëè (µ1+µ2)/2.
ÿâëÿåòñÿ òî, ÷òî îíè ïîçâîëÿþò ëèøü óñòàíîâèòü, Â ðàçâèòèå èäåé Êóëüáàêà â ðàáîòå [3] ïðåä-
èìåþòñÿ ëè îñíîâàíèÿ îòâåðãíóòü ïðîâåðÿåìóþ ëîæåíî îïðåäåëÿòü íà èíòåðâàëå U ðàñõîæäåíèå
ãèïîòåçó. Åñëè îñíîâàíèé íåò, òî ìàòåìàòè÷åñêàÿ ìåæäó ïëîòíîñòüþ âåðîÿòíîñòåé f(x) è å¸ îöåí-
ñòàòèñòèêà ðåêîìåíäóåò ïðîâîäèòü äîïîëíèòåëü- êîé f*(x), âû÷èñëåííîé ïî âûáîðêå {xi, i=1,2,…,N},
íûå èññëåäîâàíèÿ. ñ ïîìîùüþ óñëîâíîé àïîñòåðèîðíîé ýíòðîïèè HN,
Èçâåñòíî, ÷òî ðåøåíèå ìíîãèõ ïðîáëåì ñòà- êîòîðàÿ îñòàåòñÿ ïîñëå îáðàáîòêè âûáîðêè è ïî-
òèñòè÷åñêîãî àíàëèçà âîçìîæíî ïðè èñïîëüçîâà- ñòðîåíèÿ îöåíêè f*(x):
íèè èíôîðìàöèîííîãî ïîäõîäà. Ýòî îòìåòèëè
ìíîãèå èññëåäîâàòåëè, íà÷èíàÿ ñ Í. Âèíåðà è Ê. f *( x )
H N = ∫ f *( x ) log dx.
Øåííîíà. U
f (x)
© Ã.È. Ìàíêî, À.À. Äîâãîïîëàÿ, 2013

ISSN 0321-4095. Âîïðîñû õèìèè è õèìè÷åñêîé òåõíîëîãèè, 2013, ¹1 181


Ã.È. Ìàíêî, À.À. Äîâãîïîëàÿ
Àíàëîãè÷íî îïðåäåëÿåòñÿ óñëîâíàÿ àïðèîð- Ïîñêîëüêó ýòà âåëè÷èíà îòðèöàòåëüíàÿ, ñëå-
íàÿ ýíòðîïèÿ, âû÷èñëÿåìàÿ ñ èñïîëüçîâàíèåì àï- äóåò ãîâîðèòü î äåçèíôîðìàöèè, ñîäåðæàùåéñÿ â
ðèîðíîé ïëîòíîñòè f0(x): ïðîâåðÿåìîé ãèïîòåçå. Ñðàâíèâàÿ êîëè÷åñòâî äå-
çèíôîðìàöèè, âíîñèìîé ðàçíûìè ãèïîòåçàì, ìîæ-
f 0 (x) íî âûáðàòü îïòèìàëüíûé çàêîí ðàñïðåäåëåíèÿ,
H 0 = ∫ f 0 ( x ) log dx.
U
f (x) íàèëó÷øèì îáðàçîì àïïðîêñèìèðóþùèé ðåçóëü-
òàòû ýêñïåðèìåíòàëüíûõ èññëåäîâàíèé.
Òîãäà ðàçíîñòü àïðèîðíîé è àïîñòåðèîðíîé Äëÿ ïðàêòè÷åñêîãî ïðèìåíåíèÿ òàêîãî èí-
ýíòðîïèé äàåò âåëè÷èíó óñëîâíîé èíôîðìàöèè, ôîðìàöèîííîãî êðèòåðèÿ ïðîâåðêè ãèïîòåç î çà-
èçâëåêàåìîé èç âûáîðêè ïóòåì âû÷èñëåíèÿ îöåíêè êîíàõ ðàñïðåäåëåíèÿ â [4] ïðåäëàãàåòñÿ èñïîëüçî-
f*(x). âàòü ñëåäóþùóþ ñòàòèñòèêó:
 ðàáîòå [4] ñäåëàíà ïîïûòêà âûðàáîòàòü îá-
ùèé ôîðìàëèçîâàííûé ïîäõîä ê âûáîðó ñòàòèñ- 1 νj
òèêè, ïîçâîëÿþùèé ðàçðàáàòûâàòü íîâûå áîëåå
δ= ∑
n j
ν j log
nq j
, (5)
ñîâåðøåííûå êðèòåðèè ñîãëàñèÿ íà îñíîâå èñïîëü-
çîâàíèÿ ïîíÿòèÿ íåîðãàíèçîâàííîñòè Þ.Ì. Ãîð-
ñêîãî [5]. Íåîðãàíèçîâàííîñòü – îáîáùåííàÿ ìåðà ãäå nj – ÷èñëî ðåàëèçàöèé âûáîðêè, ïîïàäàþùèõ
ðàçëè÷èÿ êàêîãî-ëèáî ýëåìåíòà xj â îòíîøåíèè â j-òûé èíòåðâàë.
ýòàëîíà ïîðÿäêà xýò, êîòîðàÿ ñòðåìèòñÿ ê íóëþ Ôîðìóëèðîâêà öåëè ñòàòüè
ïðè xj→xýò . Ÿ ìîæíî ðàññìàòðèâàòü êàê âçâå- Öåëüþ äàííîé ðàáîòû ÿâëÿåòñÿ èññëåäîâà-
øåííóþ ïî âåðîÿòíîñòÿì Pj íåêîòîðóþ ôóíêöèþ íèå èíôîðìàöèîííîãî êðèòåðèÿ ñîãëàñèÿ (5) è
ïàðàìåòðà Pj, îöåíèâàþùåãî ñòåïåíü îòëè÷èÿ xj îò âûðàáîòêà ïðàêòè÷åñêèõ ðåêîìåíäàöèé ïî åãî èñ-
xýò. Ïî Ãîðñêîìó, äëÿ áîëüøèíñòâà çàäà÷ îöåíêè ïîëüçîâàíèþ äëÿ ïðîâåðêè ñòàòèñòè÷åñêèõ ãèïî-
íåîðãàíèçîâàííîñòè äîñòàòî÷íî èñïîëüçîâàòü îäíó òåç î çàêîíàõ ðàñïðåäåëåíèÿ îøèáîê èçìåðåíèé.
èç ÷åòûðåõ ôóíêöèîíàëüíûõ çàâèñèìîñòåé: ëè- Èçëîæåíèå îñíîâíîãî ìàòåðèàëà
íåéíóþ, ñòåïåííóþ, ëîãàðèôìè÷åñêóþ èëè ýêñ- Êàê ïîêàçàíî â [3], ïðè âû÷èñëåíèè çíà÷å-
ïîíåíöèàëüíóþ: íèÿ èíôîðìàöèîííîãî êðèòåðèÿ ïîëó÷àåòñÿ ñëó-
÷àéíîå âûáîðî÷íîå çíà÷åíèå, ïî êîòîðîìó íåëüçÿ
O = k∑ P jÐ j ; ñäåëàòü îïðåäåëåííîãî âûâîäà îòíîñèòåëüíî êà-
(1)
j ÷åñòâà àíàëèçà. Ïðèìåíåíèå èíôîðìàöèîííûõ
õàðàêòåðèñòèê ñòàëêèâàåòñÿ ñ ïðîáëåìîé îòûñêà-
O = k ∑ P jÐ ij ; íèÿ ðàñïðåäåëåíèÿ ñëó÷àéíûõ çíà÷åíèé êðèòåðèÿ,
j
(2) ÷òî îñîáåííî çàòðóäíèòåëüíî ïðè òåîðåòè÷åñêèõ
èññëåäîâàíèÿõ. Ïîýòîìó èíôîðìàöèîííûå êðè-
òåðèè ñîãëàñèÿ äî ñèõ ïîð íå íàøëè ïðàêòè÷åñêî-
O = k ∑ P j log Ð j ;
(3) ãî ïðèìåíåíèÿ à ìàòåìàòè÷åñêîé ñòàòèñòèêå.
j
Òåì íå ìåíåå, âû÷èñëèòåëüíûå ìîùíîñòè
ñîâðåìåííûõ êîìïüþòåðîâ ïîçâîëÿþò ðåøàòü
O = k ∑ P j exp(Ð j − C ). ìíîãèå çàäà÷è ïóòåì ñòàòèñòè÷åñêîãî ýêñïåðèìåí-
(4)
j òà. Íîðìàòèâíûé äîêóìåíò Ð 50.1.037-2002 [7]
Òîãäà, ïðèíÿâ â (1) â êà÷åñòâå ïàðàìåòðà Pj ðåêîìåíäóåò ñëåäóþùåå: åñëè äëÿ îïèñàíèÿ âû-
ìàêñèìóì àáñîëþòíîé âåëè÷èíû ðàçíîñòè ðåàëü- áîðêè èñïîëüçóåòñÿ çàêîí ðàñïðåäåëåíèÿ âåðîÿò-
íîé è ãèïîòåòè÷åñêîé ôóíêöèé ðàñïðåäåëåíèÿ, íîñòåé
 F(x, è) è íàéäåíû îöåíêè åãî ïàðàìåòðîâ
ïîëó÷èì ïðè k=1 âûðàæåíèå êðèòåðèÿ ñîãëàñèÿ θ , à äëÿ ïðîâåðêè
 ñëîæíîé ãèïîòåçû H 0 :
Êîëìîãîðîâà. Ïîëîæèâ â (2) çíà÷åíèå Pj ðàâíûì F(x)∈{F(x, θ ), θ ∈Q} èññëåäîâàòåëþ íåèçâåñòíî
îòíîøåíèþ êâàäðàòà ðàçíîñòè ðåàëüíûõ è ãèïî- ðàñïðåäåëåíèå ñòàòèñòèêè ñîîòâåòñòâóþùåãî êðè-
òåòè÷åñêèõ ÷àñòîò ïîïàäàíèÿ çíà÷åíèé ñëó÷àéíîé òåðèÿ ñîãëàñèÿ, öåëåñîîáðàçíî âîñïîëüçîâàòüñÿ
âåëè÷èíû â j-é èíòåðâàë äèàïàçîíà å¸ èçìåíåíèÿ ìåòîäèêîé êîìïüþòåðíîãî àíàëèçà ñòàòèñòè÷åñ-
ê ãèïîòåòè÷åñêîé ÷àñòîòå è ïðèíÿâ âñå Pj=1/m êèõ çàêîíîìåðíîñòåé, õîðîøî çàðåêîìåíäîâàâøåé
(m – ÷èñëî èíòåðâàëîâ), áóäåì èìåòü ïðè k=ò, ñåáÿ ïðè ìîäåëèðîâàíèè ðàñïðåäåëåíèé ñòàòèñ-
i=2 âûðàæåíèå äëÿ êðèòåðèÿ ñîãëàñèÿ χ2. Ïðèíè- òèê êðèòåðèåâ.
ìàÿ â (3) çà ïàðàìåòð Pj îòíîøåíèå ðåàëüíûõ âå- Äëÿ ýòîãî ñëåäóåò â ñîîòâåòñòâèè ñ çàêîíîì
ðîÿòíîñòåé ðàñïðåäåëåíèÿ pj ê ãèïîòåòè÷åñêèì qj , F(x,q) ñìîäåëèðîâàòü N âûáîðîê òîãî æå îáúåìà
ïîëó÷àåì ôîðìóëó ïîëåçíîé èíôîðìàöèè Áîí- n, ÷òî è âûáîðêà, äëÿ êîòîðîé íåîáõîäèìî
 ïðîâå-
ãàðäà [6]: ðèòü ãèïîòåçó H0: F(x)∈{F(x, θ ), θ ∈Q}. Äàëåå äëÿ
êàæäîé èç N âûáîðîê âû÷èñëèòü îöåíêè òåõ æå
pj ïàðàìåòðîâ çàêîíà, à çàòåì çíà÷åíèå ñòàòèñòèêè S
I ï = ∑ p j log . ñîîòâåòñòâóþùåãî êðèòåðèÿ ñîãëàñèÿ. Â ðåçóëüòà-
j qj
òå áóäåò ïîëó÷åíà âûáîðêà çíà÷åíèé ñòàòèñòèêè

182 ISSN 0321-4095. Âîïðîñû õèìèè è õèìè÷åñêîé òåõíîëîãèè, 2013, ¹1


Îá èñïîëüçîâàíèè èíôîðìàöèîííîãî êðèòåðèÿ ïðîâåðêè ãèïîòåç î çàêîíå ðàñïðåäåëåíèÿ îøèáîê èçìåðåíèÿ
S1,S2,...,SN ñ çàêîíîì ðàñïðåäåëåíèÿ G(Sn½H0) äëÿ ùåííàÿ àñèììåòðèÿ skewness è íåñìåùåííûé ýê-
ïðîâåðÿåìîé ãèïîòåçû H0. Ïî ýòîé âûáîðêå ïðè ñöåññ kurtosis). Êðèòè÷åñêîå çíà÷åíèå áûëî îïðå-
äîñòàòî÷íî áîëüøîì N ìîæíî ïîñòðîèòü äîñòà- äåëåíî êàê êâàíòèëü óðîâíÿ 0,01 ñ ïîìîùüþ ôóí-
òî÷íî ãëàäêóþ ýìïèðè÷åñêóþ ôóíêöèþ ðàñïðå- êöèè prctile. Ïðèìåð ðåçóëüòàòîâ ðàñ÷åòîâ äëÿ
äåëåíèÿ GN(Sn½H0), êîòîðîé ìîæíî íåïîñðåäñòâåí- îáîáùåííîãî ðàñïðåäåëåíèÿ Ïàðåòî (Generalized
íî âîñïîëüçîâàòüñÿ äëÿ âûâîäà î òîì, ñëåäóåò ëè Pareto) ïîêàçàí íà ðèñ. 1, çíà÷åíèÿ êðèòåðèÿ ñî-
ïðèíèìàòü ãèïîòåçó H0. Îòêëîíåíèÿ ñìîäåëèðî- ãëàñèÿ ïðèâåäåíû â òàáë. 1.
âàííîãî ðàñïðåäåëåíèÿ îò òåîðåòè÷åñêîãî ïðè
N=2000 îáû÷íî èìåþò ïîðÿäîê ≈±0,015. Ïðè íå- Ãèñòîãðàììà ýêñïåðèìåíòàëüíûõ äàííûõ
Ðàñïðåäåëåíèå çíà÷åíèé êðèòåðèÿ

îáõîäèìîñòè, ìîæíî ïîñòðîèòü ïðèáëèæåííóþ 60


100

àíàëèòè÷åñêóþ ìîäåëü, àïïðîêñèìèðóþùóþ 40


80
GN(Sn½H0), è òîãäà óæå, îïèðàÿñü íà ýòó ìîäåëü, 20

ïðèíèìàòü ðåøåíèå îòíîñèòåëüíî ïðîâåðÿåìîé 0 60

ãèïîòåçû. -0.02 0 0.02 0.04 0.06

Ððàñïðåäåëåíèå Ïàðåòî - òåîðåòè÷åñêàÿ êðèâàÿ


Øèðîêèå âîçìîæíîñòè äëÿ ñòàòèñòè÷åñêîãî 150 40

ìîäåëèðîâàíèÿ îáåñïå÷èâàåò ïðîãðàììíûé ïàêåò 100


20
Statistics Toolbox ñèñòåìû MATLAB, êîòîðûé è 50

áûë èñïîëüçîâàí äëÿ èññëåäîâàíèÿ èíôîðìàöè- 0 0


îííîãî êðèòåðèÿ ñîãëàñèÿ (5). -0.02 0 0.02 0.04 0.06 0 1 2 3 4

Ãèñòîãðàììà òåîðåòè÷åñêîãî ðàñïðåäåëåíèÿ Ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè êðèòåðèÿ


Îáðàáàòûâàëàñü âûáîðêà èç 100 çíà÷åíèé 60
MO = 1.5291
îøèáîê èçìåðåíèÿ öèôðîâûì âîëüòìåòðîì îá- 40 CKÎ = 0.44797

ðàçöîâîãî ïåðåìåííîãî íàïðÿæåíèÿ 10 Â, ãåíåðè- 20


Àñèììåòðèÿ = 0.53515
Ýêñöåññ = 0.75056
ðóåìîãî óñòàíîâêîé ïîâåðêè âîëüòìåòðîâ Â1-20. 0
Êðèòè÷åñêîå çíà÷åíèå = 0.64369

Ñðåäñòâàìè ÿçûêà ñèñòåìû MATLAB áûëà -0.02 0 0.02


Êðèòåðèé = 0.1406
0.04 0.06

ñîçäàíà ïðîãðàììà, ðåàëèçóþùàÿ ïðîöåññ ñòàòèñ-


òè÷åñêîãî ìîäåëèðîâàíèÿ ñ èñïîëüçîâàíèåì ñëå-
Ðèñ. 1.
äóþùèõ çàêîíîâ ðàñïðåäåëåíèÿ (â ñêîáêàõ óêàçàí
ïðåôèêñ äëÿ èìåí ôóíêöèé ïàêåòà Statistics Òàáëèöà 1
Toolbox): Çíà÷åíèÿ èíôîðìàöèîííîãî êðèòåðèÿ ñîãëàñèÿ
à) íîðìàëüíîå ðàñïðåäåëåíèå (norm);
á) ðàñïðåäåëåíèå Ðåëåÿ (rayl); Çàêîí Çíà÷åíèå êðèòåðèÿ Êðèòè÷åñêîå
â) ýêñïîíåíöèàëüíîå ðàñïðåäåëåíèå (exp); ðàñïðåäåëåíèÿ ñîãëàñèÿ çíà÷åíèå
ã) ðàñïðåäåëåíèå Âåéáóëëà (wbl); Ðåëåÿ 1,25 0,72
ä) îáîáùåííîå ðàñïðåäåëåíèå Ïàðåòî (gp). Íîðìàëüíûé 0,49 0,45
Äàëåå ïðåôèêñ äëÿ èìåí ôóíêöèé áóäåì â Ýêñïîíåíöèàëüíûé 0,17 0,57
îáùåì âèäå îáîçíà÷àòü áóêâàìè pref. Âåéáóëëà 0,16 0,55
Ñ ïîìîùüþ ôóíêöèè preffit(x) áûëè îïðåäå- Generalized Pareto 0,14 0,64
ëåíû ïàðàìåòðû ðàñïðåäåëåíèÿ parmhat, ñ ïîìî-
ùüþ ôóíêöèè prefpdf(x,muhat) ñãåíåðèðîâàíà âû- Àíàëèç ðåçóëüòàòîâ ðàñ÷åòîâ ïîêàçûâàåò, ÷òî
áîðêà ãèïîòåòè÷åñêèõ çíà÷åíèé îøèáêè è ïîñò- ãèïîòåçû î ðàñïðåäåëåíèè Ðåëåÿ è íîðìàëüíîì
ðîåíà ñîîòâåòñòâóþùàÿ òåîðåòè÷åñêàÿ êðèâàÿ. Ïî ðàñïðåäåëåíèè îøèáîê èçìåðåíèÿ äîëæíû áûòü
âûáîðêàì ýêñïåðèìåíòàëüíûõ è òåîðåòè÷åñêèõ îòâåðãíóòû. Íàèìåíüøóþ äåçèíôîðìàöèþ âíî-
çíà÷åíèé ïîñòðîåíû ñîîòâåòñòâóþùèå ãèñòîãðàì- ñèò ïðèíÿòèå ãèïîòåçû îá îáîáùåííîì ðàñïðåäå-
ìû. Ïî ôîðìóëå (5) ðàññ÷èòàíî çíà÷åíèå èíôîð- ëåíèè Ïàðåòî. È ýòî ìîæíî áûëî îæèäàòü, ïî-
ìàöèîííîãî êðèòåðèÿ ñîãëàñèÿ. ñêîëüêó ôîðìà ãèñòîãðàììû ýêñïåðèìåíòàëüíûõ
Èññëåäîâàíèå ðàñïðåäåëåíèÿ âåðîÿòíîñòåé äàííûõ õàðàêòåðíà äëÿ ðàñïðåäåëåíèé ñ «òÿæåëû-
çíà÷åíèé èíôîðìàöèîííîãî êðèòåðèÿ ïðîâîäè- ìè õâîñòàìè» (heavy tails) – ýòî ðàñïðåäåëåíèå,
ëîñü ìåòîäîì Ìîíòå-Êàðëî. Ãåíåðèðîâàëàñü âû- õâîñò êîòîðîãî íåëüçÿ «îòðåçàòü», ò.ê. íåëüçÿ ïðå-
áîðêà ñëó÷àéíûõ çíà÷åíèé vj, äëÿ êîòîðûõ îïðå- íåáðå÷ü ñóùåñòâåííîé ÷àñòüþ îøèáîê èçìåðåíèé.
äåëÿëîñü çíà÷åíèå êðèòåðèÿ d, è òàê ïîâòîðÿëîñü Òàêèå ðàñïðåäåëåíèÿ ÷àñòî îïèñûâàþòñÿ îáîáùåí-
3000 ðàç. Ýòî ñ çàïàñîì ïðåâûøàåò ðåêîìåíäî- íûì ðàñïðåäåëåíèåì Ïàðåòî, èìåþùèì ñëåäóþ-
âàííîå â [7] ÷èñëî N=2000. Äëÿ ïîëó÷åííîé òà- ùóþ ïëîòíîñòü:
êèì îáðàçîì âûáîðêè çíà÷åíèé êðèòåðèÿ ñ ïîìî-
⎛ 1⎞
ùüþ ñðåäñòâ Statistics Toolbox áûëà ïîñòðîåíà ãè- ⎜ −1− ⎟
1 ⎛ k ( x − θ) ⎞ ⎝ k⎠
ñòîãðàììà ñ íàëîæåííîé íà íåå êðèâîé ôóíêöèè f ( x ) = ⎜1+ ⎟ , a > 0.
ïëîòíîñòè ðàñïðåäåëåíèÿ íîðìàëüíîãî çàêîíà σ⎝ σ ⎠
(ôóíêöèÿ histfit), ðàññ÷èòàíû ïåðâûå ÷åòûðå ìî-
ìåíòà ðàñïðåäåëåíèÿ (ìàòåìàòè÷åñêîå îæèäàíèå Çäåñü σ – ïàðàìåòð ìàñøòàáà, k – ïàðàìåòð
mean, ñðåäíåêâàäðàòè÷íîå îòêëîíåíèå std, íåñìå- ôîðìû, θ – ïîðîã.  íàøåì èññëåäîâàíèè

ISSN 0321-4095. Âîïðîñû õèìèè è õèìè÷åñêîé òåõíîëîãèè, 2013, ¹1 183


Ã.È. Ìàíêî, À.À. Äîâãîïîëàÿ
σ=0,0078, k=0,2721, θ=–0,0033. òè ìàëûõ çíà÷åíèé êðèòåðèÿ (5) êðèâûå ïëîòíîñ-
Î õàðàêòåðå ðàñïðåäåëåíèÿ èíôîðìàöèîííîãî òè ýòèõ ðàñïðåäåëåíèé ìàëî îòëè÷àþòñÿ îò êðè-
êðèòåðèÿ ñîãëàñèÿ (ïðàâûé ãðàôèê íà ðèñ. 1) ìîæ- âîé íîðìàëüíîãî ðàñïðåäåëåíèÿ (ðèñ. 3), à êâàí-
íî ñäåëàòü ñëåäóþùèå âûâîäû. Ðàñïðåäåëåíèå òèëè óðîâíÿ 0,05 ïðàêòè÷åñêè ðàâíû äëÿ ýòèõ
èìååò âûðàæåííóþ àñèììåòðèþ è íåáîëüøîé ïî- ðàñïðåäåëåíèé (ñì. ïîñëåäíþþ êîëîíêó òàáë. 2).
ëîæèòåëüíûé ýêñöåññ. Òàêóþ êàðòèíó ìîãóò äàòü Ýòî äàåò îñíîâàíèå èñïîëüçîâàòü òàáëèöû çíà÷å-
ëîãíîðìàëüíîå ðàñïðåäåëåíèå, ãàììà-ðàñïðåäåëå- íèé ôóíêöèè íîðìàëüíîãî ðàñïðåäåëåíèÿ äëÿ
íèå, ðàñïðåäåëåíèå Âåéáóëëà, îáîáùåííîå ðàñïðå- îïðåäåëåíèÿ êðèòè÷åñêèõ çíà÷åíèé èíôîðìàöè-
äåëåíèå ýêñòðåìàëüíîãî çíà÷åíèÿ (Generalized îííîãî êðèòåðèÿ ñîãëàñèÿ.
extreme value). Âñå ýòè ãèïîòåçû áûëè ïðîâåðåíû
ñ ïîìîùüþ èíôîðìàöèîííîãî êðèòåðèÿ. Ðåçóëü-
òàòû ðàñ÷åòîâ ñâåäåíû â òàáë. 2. Ïðèìåð ðåçóëü-
òàòîâ ðàñ÷åòîâ ïîêàçàí íà ðèñ. 2.

Ãèñòîãðàììà äàííûõ ñòàòèñòè÷åñêîão ýêñïåðèìåíòà:


800

600

400

200

0
0 0.5 1 1.5 2 2.5 3 3.5 4
Ðèñ. 3.
Ãàììà-ðàñïðåäåëåíèå - òåîðåòè÷åñêàÿ êðèâàÿ: Âûâîä
1
Äëÿ ïðîâåðêè ãèïîòåç î çàêîíàõ ðàñïðåäåëå-
íèÿ îøèáîê èçìåðåíèé öåëåñîîáðàçíî èñïîëüçî-
0.5 âàíèå èíôîðìàöèîííîãî êðèòåðèÿ ñîãëàñèÿ íà
îñíîâå ñòàòèñòèêè (5). Ýòî ïîçâîëÿåò ñðàâíèâàòü
0 àïïðîêñèìèðóþùèå ðàñïðåäåëåíèÿ ïî ñòåïåíè èõ
0 0.5 1 1.5 2 2.5 3 3.5 4
Ïàðàìåòðû ðàñïðåäåëåíèÿ: 11.7167, 0.13244
àäåêâàòíîñòè ýêñïåðèìåíòàëüíûì äàííûì. Îïðå-
Ãèñòîãðàììà òåîðåòè÷åñêîãî ðàñïðåäåëåíèÿ: äåëåíèå êðèòè÷åñêîé îáëàñòè âîçìîæíî êàê ìåòî-
800
äîì ïðîâåäåíèÿ ñòàòèñòè÷åñêîãî ýêñïåðèìåíòà, òàê
600
è ñ èñïîëüçîâàíèåì òàáëèö çíà÷åíèé ôóíêöèè
400 íîðìàëüíîãî ðàñïðåäåëåíèÿ.
200

0
0 0.5 1 1.5 2 2.5 3 3.5 4
Êðèòåðèé = 0.0056391
ÑÏÈÑÎÊ ËÈÒÅÐÀÒÓÐÛ

1. Ñïðàâî÷íèê ïî òåîðèè âåðîÿòíîñòåé è ìàòåìàòè-


Ðèñ. 2 ÷åñêîé ñòàòèñòèêå / Â.Ñ. Êîðîëþê, Í.È. Ïîðòåíêî, À.Â. Ñêî-
ðîõîä, À.Ô. Òóðáèí. – Ê.: Íàóê. äóìêà, 1978. – 582 ñ.
Òàáëèöà 2 2. Êóëüáàê Ñ. Òåîðèÿ èíôîðìàöèè è ñòàòèñòèêà: ïåð.ñ
Ðåçóëüòàòû ïðîâåðêè ãèïîòåç î ðàñïðåäåëåíèè àíãë. – Ì.: Íàóêà, 1967. – 408 ñ.
êðèòåðèÿ (5) 3. Ãàñêàðîâ Ä.Â., Øàïîâàëîâ Â.È. Ìàëàÿ âûáîðêà. –
Ì.: Ñòàòèñòèêà, 1968. – 248 ñ.
Çíà÷åíèå 4. Êàôàðîâ Â.Â., Ìåøàëêèí Â.Ï., Ìàíêî Ã.È. Èíôîð-
Êâàíòèëü
Çàêîí ðàñïðåäåëåíèÿ êðèòåðèÿ ìàöèîííûé êðèòåðèé ïðîâåðêè ãèïîòåç î çàêîíàõ ðàñïðå-
óðîâíÿ 0,05
ñîãëàñèÿ äåëåíèÿ õàðàêòåðèñòèê íàäåæíîñòè // Äîêëàäû ÀÍ ÑÑÑÐ.
Âåéáóëëà 0,0222 0,1331 – 1979. – Ò.9. – ¹ 4. – Ñ.923-927.
Ëîãíîðìàëüíûé 0,0196 0,1298 5. Ãîðñêèé Þ.Ì. Èíôîðìàöèîííûå àñïåêòû óïðàâëå-
Íîðìàëüíûé 0,0117 0,1302 íèÿ è ìîäåëèðîâàíèÿ. – Ì.: Íàóêà, 1978. – 223 ñ.
Ãàììà-ðàñïðåäåëåíèå 0,0056 0,1331 6. Áîíãàðä Ì. Ì. Ïðîáëåìû óçíàâàíèÿ. – Ì.: Íàóêà,
Generalized extreme value 0,0033 0,1374 1967. – 320 ñ.
7. Ð 50.1.037-2002 Ðåêîìåíäàöèè ïî ñòàíäàðòèçàöèè.
Êàê âèäèì, íàèëó÷øóþ àïïðîêñèìàöèþ îáåñ- Ïðàâèëà ïðîâåðêè ñîãëàñèÿ îïûòíîãî ðàñïðåäåëåíèÿ ñ òå-
ïå÷èâàþò ãàììà-ðàñïðåäåëåíèå è îáîáùåííîå ðàñ- îðåòè÷åñêèì : ìåòîäè÷åñêèå ðåêîìåíäàöèè. – Íîâîñèáèðñê:
ïðåäåëåíèå ýêñòðåìàëüíîãî çíà÷åíèÿ. Îäíàêî, êàê Èçä-âî ÍÃÒÓ, 2002. – 153 ñ.
ïîêàçàëè äîïîëíèòåëüíûå èññëåäîâàíèÿ, â îáëàñ-
Ïîñòóïèëà â ðåäàêöèþ 5.12.2012

184 ISSN 0321-4095. Âîïðîñû õèìèè è õèìè÷åñêîé òåõíîëîãèè, 2013, ¹1