Академический Документы
Профессиональный Документы
Культура Документы
анализ
Подход
с использованием
ЭВМ
S ta tis tic a l A n a ly s is
A Computer Oriented Approach
Second E d itio n
A. A. Afifi
U niversity of California, Los Angeles
S. P . Azen
U niversity of Southern California, Los Angeles
Academic Press
N ew Y ork-S an Francisco-London
1979
A Subsidiary of Harcourt Brace Jovanovich, Publishers
А . А ф и ф и ,
С . Э й зе н
Статистический
анализ
П о д х о д
с и с п о л ь з о в а н и е м
Э В М
Перевод с английского
И. С. Енюкова и
И. Д. Новикова
под редакцией
Г. П. Башарина
¿¿О Щ 32 у
ММ
Афифи А ., Эйзен С.
Статистический анализ: Подход с использованием ЭВМ. Пер.
с англ. — М.: Мир, 1982. — 488 с., ил.
Монография американских ученых, рассчитанная на читателей, знакомых
с основами математической сгатистики, но не имеющих опыта работы с ЭВМ и не
знающих программирования. Изложение ориентировано на применение пакетов
прикладных программ, приведены примеры из биологии, медицины, гуманитар
ных наук.
Для математиков-прикладников, научных работников, использующих ста
тистический анализ, для аспирантов и студентов университетов.
ИБ № 2953
С дано в набор 11.01.82. Подписано к печати 30.08.82. Формат 6 0 x 9 0 7 ц .
Б у м а га типографская № 2. Гарнитура литературная. Печать высокая.
У е л . печ. л . 30,50. Уел. кр.-отт. 3 0 ,5 0 .Уч.-изд. л. 28,51 . Изд. № 1/1730.
Тираж 15 ООО экз. Зак. № 70. Цена 2 р . 20 к.
И ЗД А Т Е Л Ь С Т В О «МИР», 129820, Москва, И-110, ГСП, 1-й Рижский пер., 2.
Ленинградская типография № 6 ордена Трудового Красного Знамени
Л енинградского объединения «Техническая книга» им. Евгении*Соколовой
Сою зполиграфпрома при Государственном комитете СССР по делам издательств,
полиграф ии и книжной торговли. 193144, г. Ленинград, ул. Моисеенко, 10.
П а м я ти м о е го о тц а
Вена, Австрия
1977
П редисловие к первом у и здан и ю
Приложение I
Глава 1
Глава 2
Предисловие к первому изданию 11
Приложение I
Глава 1
Глава 2
Глава 1
Глава 1
БЛАГОДАРНОСТИ
Мы хотим особо поблагодарить наших сгудентов Такамуру Аси-
кагу, Энтони Аурьеима, Стьюарта Била, Чарли Бревермана,
И кбала Ф ахм и, Томаса Фарвера, Рональда Хасса, Винни Л и,
Д ж одж а М ейера, Сьюзан Сакс и Джирму Вольд-Цадик за их
зам еч ан и я, критику и помощь в проведении многих вычислений,
вошедших в книгу. Мы благодарим также Ширли Эйзен и Коллин
Гиллен Эйзен за их редакторскую й техническую помощь.
Мы признательны профессору Ричарду Беллману из Универ
ситета Ю ж ной Калифорнии за его интерес, поддержку и советы
по отбору материала для книги. Н аш а признательность адресо
вана т а к ж е Вирджинии Зойтл и Лиону Повандру, без админи
стративны х талантов которых трудно было бы собрать все воедино.
Мы искренне благодарим такж е замечательных машинисток,
которые непостижимым образом переводили наши закорючки
в р еал ьн ы е с л о в а — Энн Эйземан, Бетги Хорват, Кэй Ислейб,
Д ж ордж и Лам, Джин Рот, К эти Скофильд и Шэри Уилкокс.
Больш инство данных, использованных в примерах, почерп
нуто из совместных работ А. Афифи с отделом исследования
шока У ниверситета Ю жной Калифорнии. Понимание нюансов
в данных, обсуждаемых в книге, во многом явилось следствием
наших обсуждений и совместной работы с докторами Максом
Вейлем и Гербертом Шубином из этого отдела. Им мы выражаем
свою особую признательность.
Кроме того, мы рады поблагодарить Норму Пэлли и Д эвида
Эрбека из того же отдела за важные обсуждения разделов книги,
относящ ихся к обработке данных, а также профессора В ирдж и
нию К л а р к из Калифорнийского университета в Лос-Анджелесе
за другие полезные дискуссии:.
Д а н н ы е примера 1.4.2 и многих задач в тексте книги поме
щены с лю безного разрешения доктора Дж она Чепмена и гос
пожи Энн Каулсон из того же университета.
П едислбвие к первому изданию 13
1 .3 . П рограм м н ое о б есп еч ен и е
ПАКЕТ РАЗРАБОТЧИК
1. STATPACK 2 — на А П Л К. W . S m illie, Dept, of Computing Sci
e n c e , U n iv. of Alberta, Edmonton,
A lb erta , Canada
2. MANOVA — программы D ea n J. C lyde, Clyde Computing Ser-
многомерного статистиче v ic e , 9555 N . Kendall Dr., Miami,
ского анализа Florida
3. PSTAT — ориентирован R o n a ld Buhler, Princeton U niv. Com-
ный на пользователя p u te r Center, Princeton, New Jersey
язык статистического
анализа
1.4. П о д г о т о в к а д а н н ы х д л я п а к е т о в п р о г р а м м
3 8 6 0 3 8 6
7 2 3 2 ит 7 2 3 2
2 4 0 0 2 4
Столбец 1 2 3 4 5
3 8 6
7 2 3 2
2 4
Столбец 1 2 3 4 5 6
7 2 3 . 2 0
3 8 . 6 0
0 . 2 4
Столбец 1 2 3 4 5
7 2 3 . 2
3 8 . 6
0 . 2 4 0
С то лб е ц 1 2 3 4 5
7 2 3 2 0
3 8 6 0
0 2 4
Столбец 1 2 3 4 5
7 2 3 2 0
3 8 6 0
0 2 4 0
S E¡X s с
и Л\
F Т fr AGE HT 1 = M р 1YPF SP МАР нR DP MV :> в s / с I АТ МСТ ио PVT FС 1Clb ь\ с t
(cm) 2 =F V
1S ?
—
3; 1 )
-4 -
— /
- —1 -, —
1 1
77—79 Пробел
80 Вид карты 1 — I n it Н ет П оряд. 1 — начальная, 2
2 — F in a l конечная
Таблица 1.4.2
Данные из примера 1.4.1 (набор данных А)
Survival]
=Fina1
■+- 'S
P a tie n t
S ho ck
H eight
luit
M VP
MC T
<
М АР
Typu
Hgb
PV I
<U X M H
Hct
RCI
Û.
c: CO О. te СЛ О Д
ID
cZ
•< <
s> со 3Z О CD О < 3
Т— со
537 37 171 1 г 1*9 115 76 97 36 182 355 82 156 *0 507 ?34 127 390 1
537 37 171 1 г ** Ю6 10* 86 30 182 519 63 138 50 507 2 3 4 107 325 2
5*6 50 175 1 г 1*6 l o i 76 7* 80 169 *05 56 125 0 64* 239 13* *10 1
5*6 50 175 1 г 125 85 77 61 *6 171 383 72 150 *0 6 4 4 2 3 9 101 330 2
63* 52 185 13 г 112 67 73 49 150 200 380 82 151 0 525 152 92 280 1
63* 52 185 3 г 89 ** 57 30 12* 202 25 3 90 170 к 525 1*5 89 2 6 0 2
583 68 1 6 9 21 г 95 65 97 53 131 17* 1*0 1*9 4* 6 0 *58 2 6 0 12* 4 0 0 1
583 68 169 21 г 12* 76 87 56 8 2 173 137 1*6 4 1 1 381 5 3 2 199 132 355 2
58b 73 155 21 2 15* 97 78 67 55 167 36 5 10* 167 0 *30 130 390 281 1
585 73 155 21 г 160 Ю8 85 7* 69 1 6 7 36 5 89 16* 150 *30 2 8 I 116 350 2
651 31 170 1 г 131 82 1? 9 70 5 7 176 183 48 173 0 223 370 123 *60 1
651 3i 170 1 г 16* 10* 112 82 9* 1 7 6 3»* 70 131 *3 3 9 6 178 118 *10 2
6*9 29 1 7 0 1 2 146 loo 54 7* 6 8 181 135 81 152 0 386 210 133 *10 1
6*9 29 170 1 2 120 93 101 79 * 181 260 79 1 6 2 30 393 1*3 13* 360 2
2=Final
1=Init
685 *0 1 8 3 11 2 108 73 28 59 95 195 2 3 * 147 2 7 8 0 7 1 5 247 100 3 4 0
635 •*♦0 183 И 2 109 75 77 60 93 195 2 8 0 147 2 6 7 0 ’ 15 2*7 100 34 0
2 А.Лфифи, С. Эйзен
Продолжение табл. 1.4.2
-м 'а
с -с X > - I
МУ Р
с
ВЭА
МАР
мст
НдЬ
РУ1
нн
ЯС1
АТ
ОР
оп
0) > о
Нс(
НИ
•й о
ЭР
сэт О = сГ
п *- с ’ш <-0 5 ? 11 Л
“• (Л
2=Final
a v Q J
P atient
> a_
MVP
> 0
MCT
1=Imt
_> O.
BSA
<
H gb
<=L
PVI
Q) Q_
AT
Height
RCI
Hct
on
HR
SP
ZT>
ID
cn
< cn 3 O O
5 75 69 150 23 4 82 5 9 126 *8 80 155 141 12* ■290 0 333 169 120 370
5 75 69 150 23 4 63 5 2 1 35 * 7 29 151 1 55 128 252 11 333 169 103 350
2 *
Продолжение табл. 1.4.2
!=Рта1
*1пК
у
МУР
-С
МСТ
о X»
МАР
ВБА
РУ1
ИР*
АТ
ТО !
ОР
&
вех
Не!
>
ОЛ
СЗ-Э стэ
ЭР
О*
С!
«=с о «о- X
л: с-О
MV P
о
BSA
1-Н
МАР
м ст
H gb
X
PVI
PH
Cü i— 0_
RCI
АТ
on
CL
HR
•Si Q аз .ЕР О О
^ ы <С ‘5 ю гз СО
г X — C\J
Т абли ца 1.4.3
Описание переменных примера 1.4.2 (набор данных В)
ь(/>
~ I X
Ь— 01 0
со < со 1 ста
>- (Г
ш > СЕ
С5
О (Л со ы 5
со (Л
х X
о о
со со
>- се >-
со ш со
со
1со
— -С X — 0I
1сл +->
ф ф СП
О 1(Л- -с О . сг 1сл
— _с
1л сто ш со о 1 0"5 о
ш (У) С_) С
ЭЕ Я
о < ою >
‘5 сс Ч1 >- У-*
О со о и: 1 со СО со 3 1 о
9 VIQ
оооооооооооооооооооооооооооосооо о о о о о о о о о о о о о о о о о о
LT/000000^CTi^-‘ O f Y' 00 O ,v' f T) O r0 ^ О «J ч/ ''i u' i ' i ' л «— r^fuoorv On(MT'nNrf (VJWnoCN(\l
}Ч6!ЭМ оО СГ> (Г\ Ю (Г> ГП -Д -Г со -í- X)1
Л O N CUOOIO 4- 00 --- - ~ f\i mA
Í с о ш ю о м п о о о о оJ ru
ОО nj О
СМ—
rui'
Продолжение
ís v ia
130
148
120
I Щ o - t O O O O O O LO O O 0 1 Л » 0 Сl 00 О О О Ю O O 00 o a i t
IS A S ■ninfuf^-r^sooj—
ioo(Vjojoo-4-cr.rufvj^*f,r)»-'ajoo-í- oo^in—
•( «ru •
da гэ mj ^ H(\jn n hí и mmrooj n
1
2
3
и ( м ^ ro a i n r u - ' . H - í n f v ) ^ ^ oj ^ ai
SO oOOOliOoOcOOOoOOOoOoOoOtOOOnonaONoOoOOOCGCOOOOOOOUOOOOOOO оооосооооооооооопоооомоооосооосооо
o
6
8
3S (\1 и П П 1ЛС1 ^ ^ П Л П '» 'Л 'т1 ' , т 'т1 ПП ímcimr'inwi’iLnnj ^■^■naicvjrnrnmroaj(vjc\j'-rr'<v)")ojro
3
5
*
оОоСГ|С
o ol ( oM not VoJ o- ' "o- < ol / lof y oí ' oVÜor\j o- I oO o•-<o-fl О о оТ''Л
оГо01оЛГП
о о^-0
о ОО О«-« О(Vi OJo cr>
o o o o o o o o o o o o o o
>ruО0Оm0 Оm0 f\Jlf
13o
210
гбо
H 0 -d 3 S
(viai^cuojaiairofuru^rvjfvimrvjcvj a.'f’o^orurvjajrvjrvjrvjm mmrvj rvi — •(Л
rvj OJlOsOOCVl OÍVJlD Ю00 o w
(\.'r\j(vjPi(\jm(\jH aj — m
-i n ín o f f í m o - í О с im iO fO -
138
150
157
}Ч6!ЭМ • Ш o - t o> -r m oo in vo ~r oo oci o * -i -» r - —o <
< (VI (VI (
^ч6|эн
70
66
66
ísv ia
84
8o
7o
J.5A5
13o
100
lio
da os roruro^mrvjromro - icnronoj-a-nm-í-ro^Hn-í-rvjainrvjnro-í- rvjojrvjívjojromcu -í-ro.
1
3
3
эбу
46
36
2o
198
199
200
0SDJ
44 Гл. 1. Введение в анализ данных
то
a) A4, А 6 озн ачает сч и ты в ан и е M A LE,FEM A LE;
b) 2A3.A4 озн ачает сч и ты в ан и е M A L ,EFE,M A L E.
1.5. К р и т е р и и о ц е н к и
п акетов с т а т и с т и ч е с к и х програм м
* 1. 6 . Д р у г и е п р и м е н е н и я Э В М к ак средства
статистического ан ал и за
ti = u jv r,-/v,
и б у д е т иском ой выборкой.
Ч т о б ы п о луч и ть случайную выборку объема п из р асп р ед ел е
н и я F (vb v2), выберем и ъ ..., и п случайно из х2 ( v j , a v i t vn —
с л у ч а й н о и з х 2 (v2). Тогда w x, . . . , wn, где
и б у д е т иском ой выборкой.
1 .7 . П р о в е р к а д а н н ы х
Рис. 1.7.1. Факсимиле вывода последовательных (по столбцам) частотных таблиц, полученного по программе ВЛШР40.
VARIABLENUMBER. . 2 MAXIMUM 79.0000000 H
NAME .. MINIMUM 1.0000000 H
NUMBEROF DISTINCTVALUES 79 RANGE 78.0000000 H HHHHH
NUMBEROF VALUESCOUNTED. 816 MEDIAN 44.0000000 HHH HHHHHH EACH"H”
NUMBEROFVALUES NOTCOUNTED 0 MODE 46.OOOO0C0* HHHHHHHHHHHHH REPRESENTS
MEAN 42.2414093 HHHHHHHHHHHHHHHH 5.70
ST.DEV 17.9847565 H HIIHHHHHHHHHKHHHHHH COUNTS
S.E.M. 0.6295926 HHHHHHHHHHHHHHHHHHHHHHH
НННННННННННННННННННННИННН
HHHHHHHHHHHHHHHHHHHKHHHHHHHH
—НАХ
• FIRST OF MORETHANONEM ODE
PERCENTS PERCENTS PERCENTS PERCENTS
VALUE СОUNГ CELL CUM VALUE COUNT CELL cum VALUE COUNT CELL CUM VALUE COUNT CELL CUM
1. 1 0.1 0.1 21. 20 2.5 14.2 41. 14 1.7 45.2 61. 11 1.3 84.-V
2. 1 0.1 0.2 22. 16 2.0 16.2 42. 19 2.3 47.5 62. 11 1.3 85.8
3. 1 0.1 0.4 23. 18 2.2 18.4 43. 14 1.7 49.3 63. 14 1.7 87.5
4. 1 0.1 0.5 24. 12 1.5 19.9 44. 14 1.7 51.0 64. 13 1.6 89.1
5. 4 0.5 1.0 25. 12 1.5 21.3 45. 16 2.0 52.9 65. 7 0.9 90.0
6. 53 0.6 1.6 26. 13 1.6 22.9 46. 23 2.8 55.8 66. 8 1.0 90.9
7. 0.4 2.0 27. 17 2.1 25.0 47. 23 2.8 58.6 67. 8 1.0 91.9
8.' 6 0. 7 2.7 28. 11 1.3 26.3 48. 20 2.5 61.0 68. 9 1.1 93.0
9. 6 0.7 3.4 29. 13 1.6 27.9 49. 14 1.7 62.7 69. 9 1.1 94. L
10. 7 0.9 4.3 30. 14 1.7 29.7 50. 14 1.7 64.5 70. 8 1.0 95.1
11. 6 0.7 5.0 31. 12 1.5 31.1 51. 14 1.7 66.2 71. 7 0.9 96.0
12. 10 1.2 6.3 32. 11 1.3 32.5 52. 15 1.8 68.0 72. 4 0.5 96.4
13. 5 0.6 6.9 33. 9 1.1 33.6 53. 15 1.8 69.9 73. 4 0.5 96.9
14. 7 0.9 7.7 34. 10 1.2 34.8 54. 19 2.3 72.2 74. 7 0.9 97.8
15. 7 0.9 6.6 35. 11 1.3 36.2 55. 14 Д.7 ’ 73.9 75. 4 0.5 98.3
16. 5 0.6 9.2 36. lO l.a 37.4 S6 . 12 1.s 75.4 76. 3 o.<* 98. 7
17. 6 0.7 9.9 37. 16 2.0 39.3 57. 16 2.0 77.3 77. 3 0.4 99.0
18. 4 0.5 10.4 38. 11 1.3 40.7 58. 17 2.1 79.4 78. 3 0.4 99.4
19. 7 0.9 11.3 39. 15 l.B 42.5 59. 14 1.7 81.1 79. 5 0.6 100.0
20. 4 0.5 11.8 40. 8 1.0 43.5 60. 16 2.0 83.1
1 .7 .2 . Д ескриптивны е программ ы .
Проверка непрерывных переменных
Рассмотрим теперь н е п р е р ы в н у ю случайную величину X и м н о
ж ество х ъ х п и з п н аб лю д ен и й . Типичная д ескрип ти вн ая
программа вы б и р ает & н еп ер есекаю щ и х ся интервалов [сх, с2),
[с2, с 3) , . . . , [с*,, сй+1) о д и н ак о в о й длины , покры ваю щ их всю
наблюдаемую о б л а с т ь . Эти и н те р в а л ы назы ваю тся и н т е р в а л а м и
г р у п п и р о в к и , а их ч и с л о за д а е т с я исследователем заран ее с п о
мощью у п р ав л яю щ ей кар ты и л и вы числяется программой. Н а
пример, в одном из ал го р и т м о в Н определяется из условия
£ = целая ч а с т ь (10 1§ /г),
причем д о п о л н и тел ьн о п р е д п о л а га е т с я , что 5 < £ с 30.
П осле того к а к и н т е р в а л ы гр у п п и р о в к и выбраны, подсчиты
ваю тся частоты f i ч и с л а н аб лю д ен и й , попавш их в интервал \ с п
с;+1)> 1 = 1> к . Р е з у л ь т а т ы м о г у т быть выведены на печать
в виде ч а с т о т н о й т а б л и ц ы ти п а приведенной здесь и/или в виде
граф ика. Н а этом г р а ф и к е
по одной из осей о т к л а д ы - Имя переменной
ваю тся интервалы груп
пировки, Б0 другой — ча- И н тер в ал группировки Частота
сготы. Т акие г р а ф и к и на- [ с ъ с 2)
зываю тся (ч а с т о т н ы м и ) Гс с 1 !
г и с т о г р а м м а м и , а и х вы- 2’ ^
вод н а печать в ы п о л н я
ется разными сп о со б ам и .
Н апри м ер, их можно в ы в о - '
дить с помощью п о сл ед о в а- Iе*’ С к* 1’ '*
тельности звездочек ( а ) и
(Ъ), в виде столбиков и з еди ни ц ( с ) или в виде настоящ их столбиков
((1). В примерах н а с т о я щ е г о р а з д е л а будем использовать именно
эту последнюю ф о р м у п р е д с т а в л е н и я к а к наиболее удобную.
ние с рис. 1.7.3 показы вает, что логарифмическая зам ена изменяет
асимметрию д ан н ы х. Поэтому представляется разумным исполь
зовать именно логариф м холестерина, а не сам холестерин в после-
о о
X X
о о
о о
О О
о о
-I *
Итоги по
А 1 2 3 с строкам
1 /и А 2 / 1 3 • /,с /..
2 /2, /22 / 2 3 - /з . Г2.
3 /з 1 Уз2 /зз • /зс /з.
Итоги по
столбцом / 1 ).2 /з •- /с п
37 779 816
62 Гл. 1. Введение в анализ данных
80.500 • • 60.500
79-500 / 1— 79. 5оо
78.500 - 1 1 — 78.500
77.500 - 1 77.500
76.500 • 1 1 « 76.500
75.500 - 1 1 1 1 - 75.500
7^.500 - 1 221131 1 31 21 1 2 - 74.500
73.500 - 1 2 31 1 1 1 - 73.500
72 .500 - 1 1 1 23 2153 5 31413 51 1 1 11 - 72.500
71.500 • 1 12 1113211221213 11 22 1111 1 1 »71.500
70.500 - 1 31 622 3163321 2 2 1 - 70. 500
69.500 - _1 224323153 23372421 2 - 69.500
68.500 - 5 2113 574725412 33131 111 1 - 68.500
67.500 - 1 1 21462816525325 3132 1 1 - 67.500
66.500 • 132336938476 41242411 2 1 1 1 1 1 1 1 • 66.500
65.500 - 1 116429619 773314212 1 1 3 - 65.500
64.500 - 1 356437936455321331 111 1 2 11 1 - 64.500
63.500 - 13 2 524524614 31 2 23 1 1111 _ 63.500
62.500 - 1 16116596М29 1 1 1 11 ^ -\ - 62.500
61.500 • 1 111232 2 1 2111 1 ( i) . 61 500
60-500 - 11 1 31 41411 1 111 11111 Ч_У _ 60. 500
59.500 - 1 111 11 1 1 1 1 - 59 500
— 58-5О0 1 1 _ 5в500
$ 1 1 - 57.500
±. *.Ь 00 • 1 1 1 1 1 * 56.500
55.500 - 55. 500
54.500 • 54.500
53.500 - 53.500
52.500 - 52.550000
51.500 -
50.500 1 1
11 .
_
51
50 500
49.500 - 1 1 _ 49 5оо
48.500
48.500
47.500 - 47. 500
46.500 »
46 500
45.500 -
45.500
44.500 -
44.500
43.500 -
43.500
42.500 -
42.500
41.500 *
41.500
40.500 -
40.500
39.500 -
39.500
38.500 -
38.500
37.500 -
37.500
36.600 •
36.500
35.500 -
35.S00
34.500
33.500
-
-
34.500
33.500
ALBUMIN ( m g / 100ml)
Рис. 1.7.7. Диаграмма рассеяния для переменных «общий белок» и «альбумин»
У праж нения
в ы в о д ы
2 .1 . П р о г р а м м ы п о д с ч е т а ч а с т о т . А н а л и з д и с к р е т н ы х
перем енны х
/
66 Гл. 2. Элементарные статистические выводы
Но \ р ~ р 0 Я ,: р > р0 р = X М '.Р о )
*= Г
Н 1: р < р 0 Р = Т. М '.Р о )
1= 0
Н 1: р Ф р 0 Р = 2 пип ( £ Ь„(¡,Ро), Т.
\.= о
н =
с
где zi _JL есть ЮО ( l -----| " ) ' я процентиль распределения N (О, 1).
5 > Г = 1 ,
¿=1
мы используем к р и т е р и й у}. Ожидаемые частоты ег,
при выполнении гипотезы Н 0 равны
е,- = п р \ 0 ), 1 = 1 ..........Л- (2.1.7)
Статистика к р и т е р и я %2 имеет вид
■ei)2 (2 . 1.8)
i=i
и при р асп р ед ел ен а приблизительно по %2 с v = k — 1 степе
нями свободы. А л ь тер н ати вн ая гипотеза # i состоит в том, что
некоторые из р ав ен ств p i = р \ 0) не верны. P -значением здесь
является площ адь сп рава от точки %о под функцией плотности
распределения %2 (А — 1) (табл. 3, прилож ение II). Мы отвергаем
# 0, если Р < а .
Замечания 2 .1 .1 . 1. Е сли k = 2, то применение критерия %2
дает другой способ п роверки гипотезы Н 0 : р = р 0 против гипотезы
Н г \ р Ф р 0 по ср авн ен и ю с обсуждавшимся в разд. 2.1.1. В самом
2.2. Д е с к р и п т и в н ы е п р о гр ам м ы . А н али з н е п р е р ы в н ы х
перем енны х
В н асто я щ ем разделе обсудим часто используемые программы из
ПСП — т а к называемые «дескриптивные программы». Д л я любой
перем енной X — дискретной или непрерывной — дескриптивная
програм м а просм атривает множество из п наблюдений и вы числяет
табли цу ч а сто т, строит гистограмму и вы числяет такие выборочные
статистики, к ак среднее, медиану, дисперсию и т. д. По этой
и н ф о р м ац и и исследователь мож ет сделать некоторы е выводы
о п о п у л я ц и и . Н апример, он может проверить гипотезу о среднем
и д и с п е р с и и популяции, оценить ее процентили, проверить, не
я в л я е т ся л и распределение популяции нормальным и т. д. Т ак к а к
теори я э т о г о раздела относится, к ак правило, к случаю, когда X
н еп р ер ы вн о , то сделаем основной упор н а анализ непрерывных
н аблю ден и й.
30 -
25 - 24
20 -
15 _ у/ / , 14
У А V/.-'
V. >
10 /У / 8
777
5
5 ----- /У / / / А,
■ .'//V 1 1
п . г—п____________ 1___ I_______ I---;---1---:--- — х
“ О 5 10 15 20 2 5 30 35 4 0 45 50 55 60 65 70 75 80
В р е м я появления ( с )
Р и с.2.2.1. Гистограмма времени появления для 53 критически больных пациентов.
35.71 0.3571
о
31.25 I 0.3125
26.79 « 0.2679
1
22.32 ч 0.2232
1 17.86 § 0.1786
ч
13.39 | 0.1339
а
8.93 | 0.0893
4.46 <1 0.0446
О 0
2 3 4 5 6 7
Сердечный инЬекс, л/(минмг)
Рис. 2.2.2. Гистограммы сердечного индекса для 112 критически больных па
циентов .
о п р ед ел яе тся к а к производительность сердца (л/мин), поделенная
н а п л о щ ад ь поверхности тела (м2).
С ердечны й индекс X Н а рис. 2.2.2 изображены три вида ги
стограмм X д л я п = 112 пациентов в к р и
Интервал Чаете тическом состоянии. Таблица частот, по ко
[0, 1) 10 торой построена гистограмма, приводится
слева. По-видимому, здесь нет грубых ош и
и , 2) 40 бок,так к а к все д ан ны е л е к а т в обычном ди-
[2, 3) 25 апазонеизм еряем ой величины. Полигон ча
[3, 4) 20 стот так ж е изображ ен на рис. 2.2.2. Вы
борочной модой является х — 1.5.
[4, 5) 10
[5, 6) 5 Третье применение гистограммы —
построение э м п и р и ч е с к о ю р а с п р е д е л е н и я
[6, 7) 0 к а к оценки распределения популяции.
[7, 8) 2 Это мож но сделать прямо по гистограмме
2.2. А нализ непрерывных переменных 73
или п о н е н о р м и р о в а н н о й э м п и р и ч е с к о й ф у н к ц и и р а с п р е д е л е н и я ( Ф Р ) .
В разд. 2.2.2 м ы обсудим критерии согласия, основанные на
гистограмме или на эмпирической ФР. В настоящем разделе
опишем п остроен и е этой Ф Р, а такж е оценку процентилей истин
ного р асп р ед елен и я.
Пусть
*
^1 = 0 , ^ 2 = /ъ ? 3 = /1 + /2..........^+1 = Е /«• ¿=1
Тогда — число индивидуумов, со значениями X менее —
называется н а к о п л е н н о й ч а с т о т о й в с,-, г — 1, ..., к . Н е н о р м и р о
ванной эм пирической Ф Р *) называется ломаная, соединяющ ая
точки (сь Т^), (с2) Р 2), (сА+1, РА+1) (рис. 2.2.3). Л ом аная,
1 00
90 -
^ 80 -
1 70
о
§ 60 -
£ 50
40 /
Процентильный 30 ]
ране 2 “ 20 /
10 /)
• 0 ¿г 1 1 1 1
С 1 2 3 4 5 6 7
т 70-я процентиль
Рис. 2.2.4. Процентная нормированная эмпирическая функция распределения
для гипотетической выборки.
’ (2 -2 •1)
5 = + К * 2-
( 2 . 2 . 2)
(2.2.3)
76 Гл. 2. Элементарные статистические выводы
П реобразо
вание Выборочное среднее
01 = и 3/(о 2)3/2
и коэф ф ициент эксцесса
Р-2= Р4/(о2)2,
где ¡лi есть ¿ - й центральный момент в популяции. Если плотность
р асп р ед ел ен и я симметрична, то = 0. Если плотность имеет
2.2. А нализ непрерывных переменных 77
2 . 2 . 2 . Согласие
Х о = 2 ( ^ - / , № (2.2.7)
£=1
1, X (n ) ^ oo.
Заметим, ч т о эта Ф Р имеет скачок величины 1¡ п в каждой
точке с абсциссой x h в то время к а к введенная в разд. 2.2.1 Ф Р
имеет скач ки р азл и чн ой величины на каждом интервале груп пи
ровки. С татистикой кри тери я явл яется
Ца/ЗлюЪ. ОтиЪ.
Интервал частота частота
группировки Г F, F,
*„ = у 'п , (2 .2 . 12 )
Рис. 2.2.5. Критические области для гипотезы Н0: р = р0 для неизвестной дис
персии и3, а — альтернатива Ну. р, > |х0; Ь — альтернатива Ну. [г < р0; с — аль
тернатива Ну. ц Ф р0.
И нтервальной оценкой для р служ ит 100 (1 — а) %-ный
доверительный интервал
(х — ¿х_(а/2)(« — 1 )-^ = , X + ¿!_(а/2) (« — 1) | , (2.2.13)
а
Б
о
'Е
о
5
1д с ер д е ч н о го и н Ь е к с а
Р«7 = ^ 7 . ¿ ,/ = 1 , 2 . (2.3.1)
— И
п к.=\
*? = — I.
к= 1
(2 -3-2)
где
^з * * /з
^•2 ***** /2 * * * */ 2
* * * /1 **/■'
г0 = ( ( х , . - х 2. ) - 6 ) / ( 8р ] / - ! - + - 1 ) , (2.3 5)
2.3. Анализ двух непрерывных случайных величин 91
где
зо
26
25
Ж
1 20
О 17 Ж
е '5 11
о g т .Щ
^ 10
5
Ж ИРш 5
о
1
... ш Щ
- 0.6 - о .з о О.З 0.6 09 1.2 1.5
ь
Рис. 2.3.1. Гистограммы величины десятичного логарифма лактата для 111 кри-
тйчески больных пациентов, сгруппированных по исходу, а — умершие: У = 1,
хи = 0 . 6 8 5 , = 0.326, «1 = 41; b — выжившие: 7 = 2, х2. = 0.399, s2 = 0.383,
п2 = 70.
а зн ач ен и е ¿-статистики равно
t _ 0 .6 9 5 — 0.399 — 4 14
Нулевая Альтернативная
гипотеза гипотеза Р-эначение
Н е з а в и с и м о с т ь в ы б о р о к
Р а в е н
с т в о
д и с п е р
с и й Н е т
Да
Критерий
отношения Двухвыборочный t -критерий Среднее± sd
дисперсий ' t -критерий Уэлча
Случайная
величина F Р t Р t р Группа I Группа Ж
4.55 0.02 - 0.03 0.98 -0.04 0.97 10.4 + 9.9 10.5 + 4.6
1.3« 0.53 - 1.63 0.11 - 1.52 0.15 18.6 + 15.2 27.4 + 17.4
*3 2.15 0.09 - 2.13 0.04 - 1.74 0.10 8.2 ± 10.6. 16.9 ± 15.6
2 .4 . Д е с к р и п т и в н ы е п р о г р а м м ы с р а с с л о е н и е м д а н н ы х .
А н али з р > 2 н е п р е р ы в н ы х сл у ч ай н ы х величин
Индивидуум Данные
1 xllt x2i, . . . , х1а
2 Xi2 , %22’ ■• • >Хр2
Корреляционная
Ковариационная м ат р и ц а матрица
1 r l2 ■■■ Г >Р
Si i = -'ч2 S12 ''' ■
‘i ip
S21 S 2 2 ~ S2 2 '" s 2p
r 2l 1 Г 2р
J
* * * 2 i
Spl sp2 ''‘ spp = SP /p i ГР 2
Ковариационная м ат рица
X, X2 *4 *5
*1 817.9 410.3 556.8 719.9 415.6
Корреляционная матрица
X, Хг Х3 Х4 х,
1.000 0.839 0.927 0.871 0.753
х2 1.000 0.967 0.778 0.828
X, 1.000 0.845 0.852
х> 1.000 0.8} 7
1.000
*|- = 4 - £ и / . ^ “ ¡г -Ц Х К * / - и ) \ ¿= 1 (2-4.3)
щ ;-= 1 — 1 /=1
Пример 2 .4 .2 . В эксп ер и м ен те х) с крысами изучалось сравни
тельное влияние 21 л е к а р с т в а на количество X соляной кислоты
(НС1), выделяемой в ж е л у д к е кры сы . К аж дое лекарство давали
определенной сл уч а й н о й вы бор ке крыс, а двадцать вторая вы
борка служ ила для к о н т р о л я . С ледовательн о, здесь число п оп у
ляций р = 22, причем №г — поп ул яц и я всех крыс, получивш их
1-е лекарство, / = 1 , 2 , ..., 2 1 , а №22 — контрольная выборка.
Результаты наблю дений обозначим через хи , / = 1, ..., щ , I =
= 1, ..., 22. П олагая У = ¿, е сл и х и принадлежит ¿-й выборке,
можно с помощью д е ск р и п т и в н о й программы построить ги сто
граммы для каждой вы бо р ки и вы числить выборочные статистики.
В следующей таблице приводятся значения выборочных средних х 1.
в горядке их во зр астан и я и соответствую щ ие значения объемов пг.
7 22 73.73 8 14 333.29
15 25 146.32 11 27 341.30
6 13 147.92 5 32 374.06
14 18 165.61 4 8 412.13
3 8 191.13 1 (контр.) 71 417.32
13 17 213.47 21 16 459.81
18 17 224.41 10 19 460.37
9 14 263.86 22 19 477.53
19 14 303.14 17 18 484.61
12 15 313.20 20 18 507.56
2 6 329.83 16 19 566.37
I, /=
где 12 (\ы ) есть 1 ° ° I 1 — (а/ 2)]-я процентиль ¿-распределения
Стьюдента с v w степенями свободы.
I ] с{Х1. ± 5 , (2.4.9)
(=1
гд е
р
п - р ) ^ - ^ - , (2.4.10)
1=1
а « (р, п. — р) е с т ь 100 (1 — а)-я процентиль распределения
Т7 (р, п — р). Е сли э т о т интервал не содержит 0, то Н 0 отвергается
с уровнем а. Этот п р о ц есс повторяется для каждой интересующей
нас линейной ком бинации, причем общим для всех критериев
уровнем значимости остается а.
Н а практике обы чно проводятся сравнения контрастов в сред-
р
них. Контрастом н азы вается линейная комбинация средних
¿=1
Р
коэффициенты котор ой удовлетворяю т условию Д] = 0. К аж -
г=1
дый контраст пропорционален разности между взвешенными
тт ¡Ят —¡— М.о ,а 3 “ Ь ^ 4 ~Ь ^ 5
средними от ср ед н и х . Например, ц.х — ¡х2, — -ф----- 1
--------3-------
и т. д.
Метод Шеффё д л я контрастов имеет следующий вид. Д ля
р
проверки гипотезы Н 0: 2] == 0 против альтернативы Н±:
¿=1
р
X/ =/= 0 нужно образовать доверительный интервал
1=1
2 ± 5, (2.4.11)
¿=\
104 Гл. 2. Элементарные статистические выводы
где
р
S 2 = (p - 1 ) M S V fh -a (/0 — 1 , n — p) 1 ц (2-4.12)
1=1
а Fi-а (р — 1 » л — р) есть 1 0 0 (1 — а)-я процентиль распреде
ления F ( р -— 1, п — р). Если этот интервал не содержит 0, то Н а
отвер гается с уровнем значимости а . Э тот процесс повторяется
для к а ж д о го представляющего интерес контраста, причем общий
для в сех критериев уровень значимости остается равным а .
В т о р а я процедура множественного сравнения — метод Тьюки
(Scheffe (1959), Tukey (1949b)), который применим только для
кон трастов и только в случае равных объемов выборок, т. е. при
р
пх — п2 = ■■• = пр — т. Д л я проверки гипотезы Н 0: 2 =
1=1
р
? = 4 <71- £ I Ь |, (2.4.14)
а q ^ a е с т ь (100 (1 — а)-я процентиль распределения стьюденти-
зованного размаха с р и v = п — р степенями свободы (приложе
ние II, т а б л . 7 ) х). Если этот интервал не содержит 0, то Н 0 от
вергается с уровнем значимости а . Этот процесс повторяется для
каж дого представляющего интерес контраста, причем общим
для все с критериев уровнем значимости остается а.
Т р е т ь е й процедурой является множественный, t -метод. П усть
k — ч и с л о заранее выбранных контрастов. Тогда для проверки
р р
гипотезы Л 0: 2 ^¡,ui = 0 против альтернативы Н х. 2 Ф 0
£=1 i=i
следует п остр ои ть приближенный доверительный интервал
р
< 4 _ / V
/ , k i X i . z b t \ —(a/2k) (vw) "I/
MSw 2 j ^ T ’ (2-4Л5)
_________ i'=l £=1
*) Ст ью дент изовант й размах с р и v степенями свободы определяется сле
дующим образом. Пусть Ylf Y2, ..., Y p — независимые случайные величины
с распределением N (ц^, а |), a W — их размах, т. е. W = max Y £ — min Yt ,
i i
Если s | с v степенями свободы есть независимая несмещенная оценка а2у , то рас
пределение W lsy и будет распределением стьюдентизованного размаха с р и v
степенями свободы.
2.4. А нализ 2 непрерывных случайных величин 105
- (— 676.2, — 11.0).
Т а б л и ц а 2 .4 .2
Номер 7 15 6 14 3 1 3 18 9 19 12 2 3 11 5 4 1 21 10 22 17 20 16
опыта -------------------------------------------------------:------- ----
Подмножество 1
Группа: GRPOl GRP02 GRP06 GRP04 GRP05 GRP07
Среднее: 242.2*797 251.6667 26 0.0000 262.1025 267.5999 273.5000
Подмножествп 2
Группа: GRP06 GRP04 GRP05 GRP07 GRP03
Среднее- 260.0 000 262.1025 2 67.5999 273.5000 274.6294
2 .5 . П р о г р а м м ы п е р е к р е с т н о г о т а б у л и р о в а н и я .
А н а л и з таблиц соп ряж ен н ости п р и зн ако в
В разд. 1.7.4 программы перекрестного табулирования рассма
т р и в а л и с ь к а к средство одновременной проверки д в у х перемен
ных. О б су ж д е н и е статистической проверки гипотез было отложено
до этого разд ела. Напомним, что каждый элемент выборки одно
врем енно классифицировался с помощью д вух факторов (или
признаков)'. А (г классов или уровней) и В ( с классов). Это позво
лило п о л у ч и т ь гХ с-таблицу сопряженности признаков для вы
борки о б ъ е м а п из популяции где обозначает число индиви
дуум ов с г'-м уровнем признака А и /-м уровнем признака В, —
общее ч и с л о индивидуумов в строке а /./ — в столбце /, г =
1 , ..., / 1 , . .., с.
П осл е построения этой таблицы можно проверить гипотезы
о ф а к т о р а х Л и б . В се эти гипотезы можно сформулировать
в те р м и н а х независимости факторов А и В. В эгом контексте
н езави си м о сть означает, что доля общего числа индивидуумов
в с т р о к е , принадлежащая произвольному, но фиксированному
стол бц у, о д н а и та же для всех строк, и что доля общего числа
и н д и ви д уум о в в столбце, принадлежащая произвольной, но фик
с и р о в а н н о й строке, одна и та ж е для всех столбцов.
В н е к о т о р ы х ситуациях уровни одного фактора (например, А)
я в л я ю тся непересекающимися подпопуляциями И71( № г, ..., 47г
п о п у л я ц и и Ш. В этом случае гипотезу независимости можно
ф о р м ул и р о в ать и как гипотезу об однородности фактора В по
отн ош ен и ю к уровням фактора А . Рассмотрим теперь несколько
п ри м еров, иллюстрирующих указанные различия.
2 .5 .1 . Г и п о те з ы об однородности
1 = Муж.
А = Пол
2 = Жен.
1 = Муж.
А = Пол
2 = Жен.
А = Тип шока 3
В = Возрастная группа
1 2 3
1 = Муж.
А = Пол
2 = Жен.
Здесь
гипотезой об однородности будет Ы0: р п = р 21, р 12 =
= Р -22> Р\з = Ргз, а гипотезой о независимости — возрастная
группа и пол для данной популяции независимы.
2.5. Анализ та б л и ц сопряженности признаков 111
1 = Есть
А = Цианоз
2= Нет
до 30
более 45
112 Гл. 2. Элементарные статисгические выводы
(2.5.2)
Исход
Суммы
Шок Выжили Умерли по строкам
Суммы по столбцам 40 37 77
хЬ == 1.71, V= 4
Курящие 4 16 20
А = Привычка
к курению
Некурящие 1 21 22
Всего 5 37 42
116 Гл. 2. Элементарные статистические выводи
Курящие 5 15 20
А = Привычка
к курению
Некурящие О 22 22
Всего 5 37 42
(2.6.7)
A S E ( n = + ( l - n { ¿ + X + _L + 7L )
0 ~ /п/гг^/н/гь (2.6 .8 )
для котор ого
Значени е Р-значение
Статистика d= A4F. 2 (двусто -
роннее)
Таблица 2.6.1
Относительный риск ненормальной функции у курящих
по сравнению с некурящими
Ненормально 2 16 4 22
Нормально
64 83 46 193
66 99 50 215
P=Z> I fu ( £ S M ,
í=1 /=1 \k>i />/ / (2.6.14)
г с
Q = £ 2 Л/ ( £ £ f k i ) .
i'=l /=1 \k>i l<j )
П о л а га я S = P — Q, вычислим
, = s | { [ 4 - n ( n - l ) - T x] [ 4 - „ ( n - l ) - T 2] j 1 / 2 , (2.6.15)
где
fl
i
ГЛ3 — Я - £ (/? — f/-)] j £ (/•/-/■/)]
ir (2 .6 .20 )
При этом
A S E (/•*) = ((1 - r¡)/(n - 2))1/2. (2.6.21)
в= a n 2
1 2 3 4
1 55 8 6 2 71
.4= FEV, 2 8 33 10 2 53
3 5 10 39 6 60
4 3 2 7 22 34
71 53 62 32
ОС
К»
= 0-626, A S E (т с) = 0.046.
Упорядо- Сямме-
ченность грия Мера
Хв = . (2 .6 . 22 )
г * = ( 2 у ( р Ь М - Е А ) 1 ( ‘- у р Ъ у
Ее МП-оценкой с л у ж и т
В — Бронхит
Есть Нет
Некурящий 5 20 25
Курящ ий 15 10 25
30 70 100
Д ля оценки к
’ в зам ети м , что максимальными элементами строк
являются соответственно 20, 4 0 и 15, а максимальная сумма эле
ментов одного сто л б ц а равна гпах /./ = /.2 = 70, так что 1 В =
= (20 -Ь 40 + 15 — 70)/(100 — 70) = 0.167.
Для оценки заметим, ч т о доли максимальных элементов
строки равны соответственно 20/25, 40/50 и 15/25, а сумма долей
элементов м аксим ального (второго) столбца равна 20/25 + 40/50+
+ 10/25 = 100/50 = 2 по ср авн ен и ю с 5/25 + 10/50 + 15/25 = 1
для первого столбца. П оэтом у
128 Гл. 2. Элементарные статистические выводы
Д ля оценки %в используем
2 max fif
+ Д] max f i f — max /.y. — max /¿.
L = b i _ i ------- i = l 1 --------- ‘ ----------‘------ . (2.6.25)
2n — max f • — max f {- ' '
i i
Пример 2 .6 .4 (продолжение). В предыдущем примере
n t = P r { a 1 = o :2 или Ьх = Ь2\
— соответственно вероятн ости т о г о , что два индивидуума имеют
тот ж е самый п о р я д о к , различны й порядок или их классы для А
или В совпадают. С ом ер (Som ers (1962)) предложил меру свя зан
ности D:
Ад = ( П 5 — IId) Д 1 - £ р ? . ) . (2.6.27)
b = an2
1 2 3 4
1 8 5 3 3 19
А = FEVj 2 0 8 1 0 9
3 0 4 14 4 22
8 17 18 7 50
Д ля вычисления dB и G сначала вычислим
Д = 2Р = 2[8(31) + 5(19) + 3(4) + 8(18) + 1(4)] = 1006,
Pá = 2Q = 2[3(27) + 3(12) + 1 ( 4 ) ] = 242
Полное Неполное
выздоров выздоров Б Сомера
ление, % ление, %
Сильная слабость в
дистальной части верхних ко 61.1 90.9 0.25 *
нечностей
дистальной части нижних ко 66.7 100.0 0.31 **
нечностей
Отсутствие глубокого сухожиль
ного рефлекса в
верхних конечностях 41.2 72.7 —0.23
нижних конечностях 64.7 90.9 —0.24 *
* Р < 0.05.
•* Р < 0.01.
2 .7 . Р о б а с т н ы е оценки
2 .7 .1 . Винзоризованны е оценки
s| = _ Ц - £ : ( Z i - Z f . (2.7.2)
п 1 i= i
Приближенный 100 (1 — а) %--ный g -винзоризованный довери
тельный интервал для среднего
¿i-c« / 2) (h — 1) [ y z r r ] , (2.7.3)
уп
где Л = п — 2 g. Д л я п р о в ер к и гип отезы Н 0 : р = р 0 соответству
ющий g^вuнзopuзoвaнны-й одност оронний 1-критерий использует
статистику
^ = (Н — 1 ) У п ( г — р)/(п— 1)хг, (2.7.4)
а приближенное Р -значение п о л уч ае тся из распределения Стью-
дента с Н — 1 = п — 2 g — 1 степеням и свободы.
134 Гл. 2. Элементарные статистические выводы
2 .7 .2 . Усеченные оценки
У сеч ен н ы е оценки среднего получаются отбрасыванием ^ крайних
наблю дений с обоих концов упорядоченной выборки у х с у 2
. . . С у п . Таки м образом, а -усеченная оценка среднего ^ равна
т (« ) = — 2 (2.7.5)
( = т (а) ~ ^ , (2.7.8)
<а)
О при у > 8 . 5 .
У праж нения
Раздел 2.1
2.1.1. а) В примере 2 .1 .1 положим п = 10 и г = 4. Вычислите Я-зна-
чение при гипотезе Я0: /> = 0.1 против односторонней альтернативы Н^.
р >0.1.
138 Гл. 2. Элементарные статистические выводы
Раздел 2.3
2.3.1. Проверьте гипотезу Н0: \\у = 0.466 против альтернативы Нг : <
< 0.466, если
a) t = —1.2, п = 10;
b) t = - 2 .3 , п = 10;
c) t = -f 1.2, п = 10.
Считайте, как и в примере 2.2.2, что sy — 0.261.
Упражнения 139
X = Вес У = Холе
Диагно ч Случай в 1962 г. стерин
в 1962 г.
Раздел 2.4
2.4.1 (набор данных А). Используя программу описания расслоенных дан
ных, постройте гистограммы начального и конечного распределения величин
МАР, МСТ, U O и Hgb для подгрупп с различными исходами. У каких пере
менных разница между двумя группами значима?
2.4.2 (набор данных А). Постройте гистограммы возраста для подгрупп
с различным типом шока. Существует ли значимая разница между различными
типами шока в зависимости от возраста? Используя метод множественных срав
нений Шеффё, выделите пары подгрупп, средний возраст в которых значимо
различен (на уровне а = 0.05).
2.4.3 (набор данных В). Для каждой непрерывной переменной постройте
гистограммы д л я подгрупп с различным исходом. Для каких переменных раз
личия средних значений между подпопуляциями умерших и выживших пациен
тов значимы?
2.4.4 (набор данных В). Решите упр. 2.4.3, разбивая популяцию по со
циально-экономическому положению. Найдите множество доверительных интер
валов для величины систолического давления в 1950 г. для контрастов а) Ц!—
и b) -g- (|хх -f—ц2 + (¿з) — ■g* ((-l4 H—М-в)> используя три различных метода. Про
комментируйте полученные результаты.
2.4.5 (набор данных В). Решите упр. 2.4.3, разбив пациентов на группы
по лечащим врачам, проводившим обследование в 1950 г. Существуют ли значи
мые различия между исследователями?
Раздел 2.5
2.5.1 (набор данных В). Проверьте независимость исходам социально-эко
номического положения.
2.5.2 (набор данных В). Проверьте независимость социально-экономиче
ского положения и клинического состояния (1950).
2.5.3 (набор данных В). Проверьте независимость исхода и клинического
состояния в 1950 г.
2.5.4 (набор данных В). Используя оценки 20-й, 40-й, 60-й и 80-й процен-
тилей, разделите диапазон изменения систолического давления (1950) на пять
интервалов. Затем, применяя критерий х2> проверьте независимость этой вели
чины от а) исхода и Ь) социально-экономического положения.
2.5.5 (набор данных В). Используя критерий х2> проверьте независимость
величин систолического давления в 1950 и 1962 гг.
2.5.6 (набор данных В). Проверьте независимость веса и холестерина сы
воротки (1950). (Указание : воспользуйтесь интервалами, аналогичными интер
валам, построенным в упр. 2.5.4.)
Раздел 2.6
2.6.1 (набор данных В). Для величин, указанных в упр. 2.5.4, вычислите
все меры связанности, описанные в разд. 2.6, и воспользуйтесь ими для проверки
гипотезы о независимости. Объясните результаты.
2.6.2 (набор данных В). Решите задачу 2.5.5, используя вместо критерия х2
другие меры связанности, как это делалось в разд. 2.6.
Раздел 2.7
2.7.1 (набор данных А). Используя начальные значения величин HR, АТ
и МСТ для всех пациентов, вычислите обычное среднее, винзоризованное среднее,
усеченное среднее и М-оценку Хампеля. Какой способ оценки среднего вы пред
почтете? Почему?
3
Р егресси он н ы й и корреляционный
ан ал и зы
— х) (У1 — у)
г = /I
i= 1 п "11/2
(3 .1 .1 )
2 (*£ — *)2 Ц (г/г — у )2
¿=i !=i
Е сл и аб со л ю тн ая в ел и ч и н а к о э ф ф и ц и е н т а к о р р е л я ц и и в е л и к а (это
б удет о б с у ж д а т ь с я в р азд . 3 . 1 . 4 ) , э т о о б о с н о в а н н о у к а з ы в а е т н а
си л ьн у ю л и н е й н у ю з а в и с и м о с т ь м е ж д у п ер ем ен н ы м и .
В н ек о то р ы х П С П п р о г р а м м ы д л я анализа к о р реляций в ы ч и с л я
ют к о р р е л я ц и ю м е ж д у X и У и с т р о я т д и а г р а м м у р а с с е я н и я о д
новрем енн о. Э ти п р о г р а м м ы , ес л и о н и д о п у с к а ю т п р е о б р а з о в а н и е
п р и зн ако в, в частности, п о л езн ы д л я в ы я в л ен и я ли н ей н ой за в и
сим ости. Т а к , п р и одном п р о г о н е т а к о й п р о гр а м м ы и с с л е д о в а т е л ь
м ож ет п о л у ч и ть к о р р е л я ц и и и д и а г р а м м ы р а с с е я н и я д л я л ю б о й
ком бин ац ии п реоб разован и й X и У, наприм ер (X , lo g У),
(log X , У ), (log X , lo g У), С / Х , lo g У) и т. д. П р е о б р а з о в а н и е ,
д л я ко то р о го п о л у ч а е т с я н а и б о л ь ш е е по а б со л ю тн о й в е л и ч и н е
зн ач ен и е к о эф ф и ц и ен та к о р р е л я ц и и , б у д е т т е м п р е о б р а зо в а н и е м ,
котором у с о о тв етств у ет н а и б о л е е с и л ь н а я л и н е й н а я за в и с и м о с т ь .
Т аки м об р азо м , е с л и , н а п р и м е р , н а и б о л ь ш и м п о абсол ю тн ой в е л и
ч ине я в л я е т с я к о э ф ф и ц и е н т к о р р е л я ц и и м е ж д у X и lo g У, т о
соответству ю щ ая д и а г р а м м а р а с с е я н и я п о к а ж е т н а и б о л е е я р к о
вы р аж ен н у ю э м п и р и ч е с к у ю л и н е й н у ю за в и с и м о с т ь . П р и в е д е м
теперь т р и п р и м е р а , к о т о р ы е б у д у т а н а л и з и р о в а т ь с я в это й г л а в е .
П рим ер 3 .1 .1 . К а л и б р у е т с я п р и б о р д л я и зм е р е н и я к о н ц е н т р а
ции м олочной к и с л о т ы в к р о в и . И с с л е д о в а т е л ь и с п о л ь з у е т п = 20
о б разц о в (в ы б о р о к ) с и з в е с т н о й к о н ц е н т р а ц и е й и зат ем в ы ч и с л я е т
ко н ц ен тр ац и ю , о п р е д е л е н н у ю и с сл ед у ем ы м п р и б о р о м . П у с т ь X
144 Гл. 3. Регрессионный и корреляционный анализы
22
г
о Ч/— 30 45
З а м е ч а н и е 3 .1 .1 . П р о гр а м м а к о р р е л я ц и о н н о г о а н а л и з а м о ж е т
б ы ть и с п о л ь з о в а н а п ри о п р ед ел ен и и н а и л у ч ш его п р е д и к то р а д л я Y
и з н а б о р а р перем ен н ы х Х и Х 2, Х р. П е р е м е н н а я Х г, и м ею щ ая
н а и б о л ь ш у ю (по абсолю тной в ел и ч и н е) к о р р ел я ц и ю с Y, им еет
и н а и б о л е е с и л ь н у ю линейную зав и си м о сть с Y . Т а к а я п р о ц е д у р а
я в л я е т с я п е р в ы м ш аго м п р о ц ед у р ы т а к н азы ваем ой пошаговой
р е гр е с с и и , к о т о р а я будет р ассм о тр ен а в р азд . 3 .3 .
Е с л и п р е д п о л а г а е т с я л и н е й н а я зав и си м о сть м еж ду Y и X, то
т е о р е т и ч е с к а я м одель за д а е т с я у р а в н е н и я м и
Hi — Рэ “Н Р л i = 1, (3.1 .2)
3.1. Линейная регрессия и корреляционный анализ 147
Н ай д ем т е п е р ь о ц е н к у н еи зв естн ы х зн ач ен и й и (5Ъ о с н о в а н
ную н а им ею щ ейся у н а с в ы б о р ке об ъ ем а п. Н аи л у ч ш и е о ц е н к и Ь0
и д л я р0 и п о л у ч а ю т с я м и н и м и зац и ей соответствен н о по (50
и (5Х суммы квадратов отклонений
5 = £ (У1 ~ Ро - ( № (3-1.4)
¿=1
Эти о ц ен к и н а зы в а ю тс я оценками наименьших квадратов и д аю т с я
ф о рм улам и
Ь0 = У — Ьхх , (3.1.5)
п п
£ (*г — х) У1 2 (*1 ~ *) (У‘ - у)
* = -------------------- . (3.1.6)
2 (XI - х)* 2 (XI - ху
¿= 1 ¿= 1
148 Гл. 3. Регрессионный и корреляционный анализы
П р я м а я н аи м ен ьш и х к в а д р а т о в д о с т а в л я е т м ин им ум сум м е к в а д -
П
и зм еренн ая при бо р о м , а X — и з в е с т н а я к о н ц ен т р ац и я м ол оч
ной ки слоты . П р о г р а м м о й р е г р е с с и о н н о г о а н а л и з а бы ли вы чи слен ы
оценки р0 и п о п = 20 н а б л ю д е н и я м , что д ал о Ь0 = 0 .1 5 9
и Ьх = 1.227. Т а к и м о б р а з о м , п р я м а я н а и м е н ь ш и х к в а д р а т о в есть
у = 0.15 9 1.227а:. Е с л и X = 1, т о у = 1.39, есл и ж е X = 10,
то у = 12.43. Э та п р я м а я г р а ф и ч е с к и п р е д с т а в л е н а н а р и с. 3 .1 .1 .
Д л я п р а к ти ч е с к и х ц е л е й ж е л а т е л ь н о п р е д с к а з а т ь истин ную к о н
цен траци ю X по н а б л ю д а е м о й к о н ц е н т р а ц и и У. Д л я это го н у ж н о
обратить о ц ен ку р е г р е с с и о н н о г о у р а в н е н и я , что д ает д л я оц ен ки
X по У у р а в н е н и е £ = (у — 0 .1 5 9 )/1 .2 2 7 .
где
w¡ = х { — х и ро = Ро + Р ^ -
В этом с л у ч а е о ц е н к о й н а и м е н ь ш и х к в а д р а т о в д л я рг о стается
но оценкой н а и м е н ь ш и х к в а д р а т о в д л я р 'б у д е т т е п е р ь Ь'0 = у.
П ракти ч еско е и т е о р е т и ч е с к о е п р е и м у щ е с т в о т а к о г о п р ед ставл ен и я
состоит в том, что о ц е н к и у п Ь1 н е к о р р е л и р о в а н н ы .
4. Е сл и известно, ч т о р0 = 0, т о м о ж н о и с п о л ь з о в а т ь модель
вида г/г = {кг- + е:, I = 1, ... , п. В п р о г р а м м а х м н о ги х ПСП
предусм отрена в о з м о ж н о с т ь принудит ельного проведения линии
регрессии через начало координат.
щ ей л и н е й н о й м одели, о б ы ч н ая несм ещ ен н ая о ц ен ка д л я а 2 о п
р е д е л я е т с я ч ер ез дисперсию оценки
п
2 — Ь0 — ¡№ )2
«2 ¿= 1 /о 1 п\
П о л о ж и т е л ь н ы й к в а д р а тн ы й к о р е н ь из этой величины н а зы в а ю т
ст ан дарт ной ошибкой оценки. Обе эти величины , к а к п р а в и л о ,
п е ч а т а ю т с я в вы ход ны х д ан н ы х . Д и с п е р си ю оц ен ки м ож но т а к ж е
н а й т и и з таблицы дисперсионного анализа, к о т о р ая во м ногих с л у
ч а я х в ы в о д и т с я на п е ч а ть (см. г а б л . З .1 .1 .). В ел и ч и н а в2 и д ен ти ч н а
Таблица 3.1.1
Таблица д и сп ер си он н ого анализа для простой линейной регрессии
п
Р егр есси я 550 = £
¿=1
( 0 / - ■у)2 \>с = 1 МБо = 3 3 0
0
_М Б 0
МБК
О тклонение п МБ* = =
от регрес - ББ« = 2 (т - £ ;)2 = п—2
сии ¿=1
я '7
п
Полная ББт
2
»=1
( ш — У) 2 vx = п — 1
Д л я п р о в е р к и ги п о т е зы о том, что п р о с т а я л и н ей н ая р е г р е с с и я
У по X о т с у т с т в у е т , т. е. гипотезы Н 0 : рх = 0 п ротив а л ь т е р
нативы # х : Ф= 0 , мы и сп о льзу ем /-'■отношение из т аб л и ц ы д и с
персион ного а н а л и з а
/^о= МБо/МЭк ==МБо/я3. (3.1.11)
Е сл и в ер н а г и п о т е з а Н 0, то им еет /-’-р асп ред ел ен и е с = 1
и vR = п — 2 с т еп е н я м и свободы. Р -зн а ч е н и е есть п л о щ ад ь
области под к р и в о й п лотн ости р а с п р е д ел е н и я Т7 (гс , ук ) с п р а в а
от ^ 0 . М ы о т в е р г а е м Я 0, есл и Р м еньш е, чем у р о в ен ь зн ач и м о сти а .
Е сл и Н0 п р и н и м а е т с я , то н аи лу ч ш ей о ц ен ко й У при лю бом X = х
б у д ет средн ее з н а ч е н и е у.
Е сли о ш и б к и п р е д п о л а га ю т с я н о р м ал ьн ы м и , м ож но п р о в е р и т ь
д ополнительны е ги п о т е зы и построить д о в ер и тел ьн ы е и н те р в а л ы .
Д л я п р о вер к и Н 0 : ¡3, = (З'/” , где р',0’ — ко н стан та, и с п о л ь зу е м
стати сти к у
¿о = - ^ —Щ г > ' (З Л 1 2 )
где
У{Ь1) = - 1Г-^ ---------• (3-1 1 3 )
£ (*, - X)*
1=1
В вы воде п р о г р а м м р егр есси о н н о го а н а л и з а вел и ч и н а [У (Ьл) V'2
ч асто н а зы в а е т с я стандартной ошибкой коэффициента регргссии.
Е с л и гипотеза Л 0 в е р н а , то имеет ¿-распределени е С тью д ен та
с у к = п — 2 с т е п е н я м и свободы . Р -з н а ч е н и е за в и с и т от ви д а а л ь
терн ати вн о й г и п о т е зы , что видно из пр и веден н ой н и ж е т а б л и ц ы .
Ь1 ± У у ( Ь 1) Ь _ (а/2)( п - 2 ) . (3 .1.14)
Д л я п р о в е р к и ги п о тезы Я 0 : ро = Р‘0), где ро — к о н с т а н т а ,
исп ользуем с т а т и с т и к у
152 Гл. 3. Регрессионный и корреляционный анализы
где
П
1= 1
У%) = п (3.1.16)
п I ] (*1 — *)г
(3 .1 .1 7 )
П р и в е д е м т е п е р ь два д о в ер и тел ь н ы х и н т е р в а л а , о сн о в ан н ы х
н а о ц е н к е у (см. зам ечан и е 3 .1 .2 .2 ). Е с л и у = Ь0 4- Ьхх и н т е р
п р е т и р у е т с я к а к о ц е н к а единственного зн а ч е н и я У п р и X = х,
то 100 (1 — а ) %-ный доверительный интервал для У о п р ед е л я е т ся
вы раж ением
0 ± я П + 4 - + - - ■■* Т / 2 ^ 1 _ (а / 2 ) ( п — 2 ) . ( 3 . 1 . 1 8 )
2 (*«• — *)2
Е с л и , с д р у г о й стороны , у и н те р п р ет и р у ет с я к а к о ц е н к а сред
него значения V при задан ном зн ач ен и и X = х, то 100 (1 — а ) % -
ный доверительный интервал есть
Г 1 (х _х)2 "11/2
У ±3 - (х х)------ Ь - 1щт( п - 2 ) . (3.1.19)
£ (*£ — X)2
В ы бор д о в е р и т е л ь н о го и н те р в а л а з а в и с и т от того, к а к и с п о л ь
зу е т с я о ц е н к а # и ссл едо вател ем . З ам ети м , что к о гд а х у д а л я е т с я
от х , д о в е р и т е л ь н ы й и н тер в ал у в е л и ч и в а е т с я , т. е . н а ш а о ц ен к а
п
с т а н о в и т с я м ен ее точной. К р о м е того, есл и п и £ (хг — х )2 в е
1=1
л и к и , то в ы р а ж е н и е (3.1.18) а п п р о к с и м и р у ет с я «быстрым» д о в е р и
т ел ь н ы м и н т е р в а л о м г /± 5 /1 _ (а / 2) (п — 2). П оэтом у в д ей ств и тел ь н о
м ож н о н а з ы в а т ь «стан дартной ош и б ко й о ц е н к и у».
д еск р и п ти в н у ю п р о г р а м м у . С п о м о щ ью ти п и ч н о й д еск р и п т и в н о й
програм м ы м ож н о п о л у ч и т ь
/2 П
*• У’ = ~тпгт~У!
1=1
(х ‘ - *)2
’4 „ X
1=1
^ ~ ^)2’
1= 1
Т огда
5.
Ьг = , Ь0 = у — ^дс,
я
Б Б о = (п — 1) Ь^'х, Б Э т =- (я — 1 ) ьу , ББи = 5 5 т — ББ о,
« — м э к — (лг _ 2 ) >
Полная 814.044 19
Д л я п р о в е р к и гипотезы , ч то п р я м а я регресси и п р о х о д и т ч ер е з
н а ч а л о к о о р д и н а т, т. е. ги п о тезы Н 0: (50 = 0 п ротив Н х: ро Ф О,
п о с т р о и м 95 % -ны й д о в ер и те л ь н ы й и н те р в ал д л я ро, что д а е т
0 .1 5 9 =ь 2 .1 0 (0.396) = (— 0.573, 0 .991), где [V (Ь,)]1'2 = 0 .3 9 6 , а
4 .9 7 5 ( 1 8 ) = 2 .1 0 . Г а к к а к это т и н те р в а л вкл ю ч ает н у л ь , г и п о т е за
Н0 приним ается.
Д л я 9 5 % -н о го и н те р в а л а д л я ср едн его зн ач ен и я У п р и X = 7 .7
з а м е т и м , что оц ен ка средн его зн а ч е н и я ¥ есть у = 0.159 4-
+ 1 .2 2 7 (7 .7 ) = 9.61. Т а к к а к х = 6 . 7 и £ (я, — х)2 = 526,
п олучаем
В э т о м р а з д е л е мы о б су д и м , к а к и м об р азо м п р о в ер и гь а д е к в а т н о с т ь
м о д е л и п р о сто й линей ной р егр есси и . П од а д ек в атн о стью м о д ел и
п р о с т о й л и н е й н о й р егр есси и п о д р а зу м е в а ет с я , что н и к а к а я д р у г а я
м о д е л ь не д а с т значим ого у л у ч ш е н и я в п р е д с к а за н и и К .П у с т ь , н а
п р и м е р , и ссл ед о в ател ь п о ж е л а л п р о в е р и ть , значим о ли у л у ч ш а е т с я
п р е д с к а з а н и е У с пом ощ ью модели полиномиальной регрессии у 1 =
= Ро - Ь р 1* + Р 2Л-2 + . . . 4 - $тХт + ^ ДЛЯ НвКОТОрОГО П З г 2 . Н у Л в -
во й г и п о т е з о й в этом с л у ч а е б удет Я 0: |32 = ... = р т = 0 (см.
р а з д . 3 .2 ) .
Е с л и в с е п зн ач ен и й хъ х2, ..., х п д л я X р азл и ч н ы (т ак что
н е и м е е т с я д в у х зн ач ен и й из У с о динаковы м зн ач ен и ем X ), то
м о ж н о п р о в ести л и ш ь о гр ан и ч ен н у ю п р о в е р к у а д е к в атн о сти л и
н е й н о й м одели (к а к есл и бы им елось одно и зм ер ен и е). С д р у г о й
с т о р о н ы , е с л и д ля н ек о то р ы х значений: из X и м еется б о л ее чем
по о д н о м у зн ач ен и ю из У , то можно провери ть г и п о т е зу , что
н и к а к а я а л ь т е р н а т и в н а я м одель н е д ает зн ач и м о го у л у ч ш е н и я
п р е д с к а з а н и я У по ср авн ен и ю с м оделью п р о сто й л и н е й н о й р е
г р е с с и и . С т а т и с т и к а к р и т е р и я есть ещ е одно ^ -о тн о ш е н и е, к о т о р о е
п о л у ч а е т с я и з табл и ц ы д и сп ер си о н н о го а н а л и з а сл ед у ю щ и м о б
р азо м .
П р е д п о л о ж и м , что им еется к р азл и ч н ы х зн ач ен и й д л я X , н а
при м ер хъ хк. Д а л е е , п р е д п о л о ж и м , что д л я к а ж д о г о из
э т и х лгг- и м еется п1 наблю дений у п , //¡2 , ..., г/,„. п ерем ен н ой У,
к
/ = 1 , к. П у с г ь пг > 1 д л я н е к о т о р о г о I, и п у с т ь 2 п 1 = п-
3.1. Линейная регрессия и корреляционный анализ 155
Таблица З А .2
Расш иренный дисперсионный анализ для простой линейной регрессии
к "1
Регресси я (д1 — д . . у г'о = 1 М5{2) =
1=1 / = 1
О тклонение к п1
ЗБд МБд
от р е г р е с ЬЬа = Ц 5] (У г - 9 ¿)2 v A = * — 2 МБ д = — -
сии А VA р ° - МВт,,
¿=1 /=1
к
В нутри
групп ^ ^ ( У 11 — У с )2 — п — ки М
ЛДо\у
С = -------
SSw
!=1 /= 1
к
П олная 55Т = Ц 2 ( У ц - У - У \ т= п — 1
£=1 /=1
З а м е ч а н и е 3 .1 .4 . Т а б л и ц а д л я р а с ш и р е н н о го д и сп ер си о н н о го
а н а л и з а м ож ет бы ть п о л у ч ен а посредством ком б и н ац и и вы ходны х
д ан н ы х п р о гр а м м ы р егр есси и и д ес к р и п т и в н о й п рограм м ы с р а с
с л о е н и е м д а н н ы х следую щ и м о б разом . С пом ощ ью програм м ы
р е г р е с с и и о п р е д е л я е м зн а ч е н и я Б Б о, г 0 , М5[>, 5 8 к , 5 5 т, л»к
и vт (см . таб л . 3 .1 .1 ). П р и м е н я я теп ер ь д еск р и п ти вн у ю п р о гр ам м у
с р а с с л о е н и е м , стр ати ф и ц и р у ем зн а ч е н и я У, согласн о зн а ч е н и я м X ,
и и з т а б л и ц ы о д н о ф ак го р н о го д и сп ер си о н н ого а н а л и з а пол уч и м
в н у т р и г р у п п о в ы е сум м ы к в а д р а то в S S W и ч и сл а степ ен ей с в о
боды v w . В зя в соответствую щ ие р а зн о с ти , пол уч и м ББд = Б 5 К —
— и \к = Эти в е л и ч и н ы затем п орож д аю т
т а б л . 3 .1 .2 .
Т аб л и ц а р а с ш и р е н н о г о д и с п е р с и о н н о г о а н а л и з а п р и вед ен а н и
ж е . З а м е т и м , что 5 5 к = 2 0 .9 4 5 = и v R = 18 = уа +
+ л\у. Т а к к а к = 1.27 < /^.аь (3, 15), н у л е в а я ги п о теза п р и
н и м ае т ся .
Сумма Ч и сл о Средний ^ -о тн о -
Источник дисперсии квадра степеней квадрат шение
тов свободы
П олная 814.044 19
3 .1 .4 . Коэффициент корреляции
В этом р а зд е л е о б с у ж д а е т с я в ы б о р о ч н ы й и п о п у л я ц и о н н ы й к о э ф ф и
циенты к о р р е л я ц и и . Э т и в е л и ч и н ы б ы ли введены в г л . 2 к а к
меры л и н ей н о й з а в и с и м о с т и м е ж д у д в у м я перем енн ы м и . К а к
было у к а з а н о р а н е е , с т а т и с т и ч е с к и е в ы в о д ы о тн оси тел ьн о п о п у л я
ц и он н ого ко эф ф иц иента к о р р е л я ц и и м о ж н о с д е л а т ь , т о л ь к о если
и Л и У с у т ь с л у ч ай н ы е в е л и ч и н ы . В ч астн о сти , е сл и совм естн ое
р асп р ед ел ен и е X и У есть д в у м е р н о е н о р м а л ь н о е р а с п р е д ел е н и е ,
п оп у л я ц и о н н ы й к о э ф ф и ц и е н т к о р р е л я ц и и и м одель л и н ей н о й р е г
рессии со о тн о сятся с э т и м р а с п р е д е л е н и е м весьм а ин тересн ы м о б
р азо м . О братим ся т е п е р ь к с о о т в е т с т в у ю щ е й теори и .
П редп олож им , что с л у ч а й н ы е в е л и ч и н ы X и У имею т д в у
м ерное н о р м а л ь н о е р а с п р е д е л е н и е . П у с т ь ц А и \х,у б у д у т с р е д
ними д л я п о п у л я ц и и , а о ! и — д и с п е р с и я м и X и У. П о
п у л я ц и о н н у ю к о в а р и а ц и ю X и У о б о з н а ч и м ч ерез аху. Т о гд а
простой (и л и с м е ш а н н ы й м ом ент) коэффициент корреляции м е
ж д у X и У есть
Р = о ху1{ах Оу). (3.1.25)
Этот коэф ф иц иент есть м е р а л и н е й н о й за в и с и м о ст и м еж ду X и У.
З н а ч е н и я р за к л ю ч е н ы в п р е д е л а х о т — 1 до + 1 . П о л о ж и тел ь н о е
зн а ч е н и е р у к а з ы в а е т , что У и м еет т е н д е н ц и ю в о зр а с т а т ь совм естно
с А , в то врем я к а к о т р и ц а т е л ь н о е р у к а з ы в а е т н а тен ден ц и ю У
к у б ы ван и ю с р о сто м X . Э к с т р е м а л ь н ы е зн а ч е н и я р = + 1 с о о т
ве т ст в у ю т полной л и н е й н о й з а в и с и м о с т и м еж д у X и У, т а к что
п р и д ан н о м X = х з н а ч е н и е У т о ч н о о п р ед ел ен о .
Д л я д ан н о го з н а ч е н и я Х = х и м е е т с я п о д п о п у л я ц и я зн ач ен и й У,
соответствую щ и х X = х . И х р а с п р е д е л е н и е , назы ваем ое услов
ным распределением У п р и данном X — х, е с ть о д н ом ерн ое н о р м а л ь
н о е р а сп р е д ел е н и е со с р е д н и м
(%•* = И-у Н----- (х — И*)- (3.1.26)
^ V*
158 Гл. 3. Регрессионный и корреляционный анализы
И з э т о г о р ав ен ств а мы по л у ч аем
р2 = (о2у — о*)/ст|, (3 .1.29)
о т к у д а с л е д у е т , что к в а д р а г коэф ф иц иента к о р р ел я ц и и "'р ав ен д о л е
д и с п е р с и и У, объ ясн ен н о й зн а н и е м X .
О п р е д е л и м теп ер ь с л у ч ай н у ю вел и ч и н у е = У — \лу.х, к о т о р а я
и з м е р я е т о ткл о н ен и е У от ее средн его зн а ч е н и я п ри ф и к с и р о в ан н о м
X = х. У с л о в н о е р ас п р е д ел е н и е е при д ан н о м X = х есть н о р
м а л ь н о е р а с п р е д е л е н и е со ср едн и м зн ач ен и ем 0 и ди сп ерси ей ст2.
П о это м у мож но зап и сать
Ро = Ни — ^Цх, = (3.1.31)
°Х
s xy = 0 .1 1 0 1 , /- = 0.9039.
И с п о л ь зу я за м е ч а н и е 3 .1 .3 , п олучаем из эти х д ан н ы х
61 = 0.8 7 9 , Ь0 - 0 .9 3 2 , S S D = 10.359, S S T = 12.669,
р = - ^ ( 3 .1 .3 2 )
ау
^ = 4 |п4 ^ <а134)
и д и сп ер си еи
2 1
(3.1.35)
°» = т ^ т -
С тати сти к о й к р и те р и я я в л я е т с я
г= "~ . (3.1.36)
Е сл и Н 0 в е р н а , а я в е л и к о , то р асп р ед ел ен и е 2 а п п р о к с и м и р у е т с я
п оср ед ство м N (0, 1). Р -зн а ч е н и е зависи т от а л ь т е р н а т и в н о й г и
потезы и Н 0 о т в е р га е т с я , есл и Р <1 а.
З д е с ь 1 0 0 (1 — а.) %-ным доверительным интервалом для
я в л я е т с я (ох, v2), где
VI = V — Сто?! _ (а/2) И У2 = V Оа? 1 _ (а/2)- (3.1.37)
П р и м е н я я о б р атн о е п р е о б р а зо в а н и е Ф и ш ера, п о л у ч и м
е2о- 1 (3.1.38)
г =
е2и+ 1
Это п о з в о л я е т , о б р а щ а я т а б л . 8, п р и л о ж е н и е I I , п о л у ч а т ь
д о в ер и те л ьн ы е и н те р в а л ы для р. Д о в е р и т е л ь н ы й и н т е р в а л м ож ет
бы ть т а к ж е и с п о л ьзо в ан д л я п р о в ер к и ги п отезы Н0: р = р 0
3.1. Линейная регрессия и корреляционный анализ 161
0.0 0 100
+ 0.2 4 98
+ 0.4 16 92
+ 0.6 36 80
+ 0.8 64 60
+ 0.9 8 1 44
+ 0.95 90 31
±0.99 98 14
6 А. Афифи, С. Эйзен
162 Гл. 3. Регрессионный и корреляционный анализы
П р и м е р 3 .1 .2 ( продолжение). В ы борочны й к о эф ф и ц и ен т к о р
р е л я ц и и г м е ж д у p H вен о зн о й [и а р т ер и а л ь н о й к р о в и р а в е н
0 .9 0 3 9 . Г и п о т е з а Н 0: р = 0 (т. е. незави си м ость X и У) о т в е р г а
е т с я н а осн о ве ^ -о т н о ш е н и я д и сп ер си о н н ого а н а л и з а , т а к к а к Р =
= 4 7 0 .9 , и л и ¿-кри тери я (зам ечан и е 3 .1 .5 .3 ). З н а ч е н и е t 0 есть
0.9039 К ТоЗ _ 01 7
¿о — — — — ¿1. / .
1 /1 - 0 .8 1 7 0
З а м е т и м , ч т о ( 2 1 .7)2 = 4 7 0 .9 .
Д л я о п р е д е л е н и я 95 % -ного д о в ер и тел ьн о го и н т е р в а л а д л я р
с н а ч а л а н а х о д и м (таб л . 8, п р и л о ж е н и е II)
1 , 1.904 , ,по
Х}~ 2 0.095 — 1-493.
О т к у д а , и с п о л ь з у я в ы р а ж е н и е (3.1.37), п о л уч аем
и х = 1.493 — 1 .9 6 / ] /1 0 5 = 1.302 и
и , = 1.493 + 1 .9 6 / К Ю5 = 1.684.
3 .1 .5 . А н ал и з остатко в
необходим ы м п р е о б р а з о в а н и е п е р е м е н н о й V. Г р аф и к, п о к а зы в а ю
щ ий линейны й т р е н д (р и с. 3.1 .6 , с ) , д а е т осн о ван и е д ля введ ен и я
в м одель д о п о л н и т е л ь н о й н е за в и с и м о й перем енной (см. р а зд . 3 .2
£/ Л
У -Х и л и У
Л-..1 .
- X ил и У - X или ?
Рис. 3.1.6. П рим еры граф иков о статк о в, а — адекватная модель; Ь •— гетеро-
скедастичность; с — линейная незави си м ая переменная; й — линейная или ква
дратичная н езависим ая переменная.
о м н ож ествен н о й р е гр е с с и и ). Г р а ф и к в и д а, п р ед ставл ен н о го н а
р и с. 3 .1 .6 , й, у к а з ы в а е т , что в м о д е л ь д о л ж е н бы ть д о б авл ен л и
нейны й или к в а д р а т и ч н ы й ч л е н .
Д л я п р о в е р к и н о р м ал ьн о сти е г, 1 = 1, ..., п, подходи т г и с т о
гр ам м а Н о р м а л ь н о с т ь м ож ет б ы т ь т а к ж е п ро вер ен а с пом ощ ью
к р и те р и е в с о г л а с и я .
Время или
положение
* •
В р ем я или
~положение
• •
Рис. 3.1.7. П рим еры отсутствия случай н ости, а — сезонный тренд, Ь — линей
ный тренд.
6*
164 Гл. 3. Регрессиэнный и корреляционный анализы
Е с л и д а н н ы е у п о ряд очены н ек о то р ы м о б р а з о м (н а п р и м е р , п о
с л е д о в а т е л ь н о с т ь т о ч е к па в р ем ен и или по р а с п о л о ж е н и ю ), т о
гр а ф и к о с т а т к о в dt в том ж е сам ом п о р я д к е , в к о то р о м с о б и р а л и с ь
д ан н ы е, п о з в о л я е т п р о в е р и ть с л у ч а й н о с ть . Е и п о те зу о с л у ч а й н о с т и
м ож н о о т в е р г н у т ь , если в ы я в л ен тр ен д , п ри чем т р е н д м о ж е т и м еть
к а к с езо н н ы й , т а к и л и н ей н ы й х а р а к т е р , см. рис. 3 .1 .7 , а и Ь.
Д а л ь н е й ш е е обсуж ден ие и р ассм о тр ен и е этих в о п р о с о в с о
д е р ж и т с я у A n sc o m b e (1961), A nsco m b e, T u k ey (1953), B o x , W a t
so n , (1962), D r a p e r , S m ith (1968).
В э т о м ^ у р а в н е н и и н ек о то р ы е н езав и си м ы е п ерем ен н ы е м о г у т б ы ть
ф у н к ц и я м и д р у г и х перем енн ы х и л и д р у г д р у г а . Н а п р и м е р , у =
= Ро + Рх s i n z x -f р2 cos гх + е есть м одель м н о ж ес т в е н н о й л и
нейной р е г р е с с и и с х х = s i n z x и х г — cos гх. В ч ас т н о с т и , есл и
x¡ = х с, i = 1 ......... р, п о л у ч ается модель полиномиальной регрессии
У = Ро “Ь Pi* + Рг*2 + ' ‘ ■ ~Ь РрХр + е. (3.2.3)
3.2. Множественная линейная регрессия и корреляции 165
Н а к о н е ц , н у ж н о п о м н и т ь , что с л о в о « л и н ей н ая » п о д р а зу м е в а е т
л и н е й н о с т ь о т н о с и т е л ь н о п а р а м е т р о в , но не по отнош ению к н е
зави си м ы м п е р е м е н н ы м . Т а к , у = |30 + s in ( Р л ) + Рг* 2 н е я в
л я е т с я л и ней ной ф у н к ц и е й п а р а м е т р о в .
В этом р а зд е л е р а с с м а т р и в а е т с я м о д е л ь м нож ественн ой л и н е й
ной р егр есси и , з а д а н н о й в о б щ е м в и д е у р а в н е н и е м (3 .2 .2 ). Х о т я
д л я о п и сан и я м н о г и х р е а л ь н ы х с и т у а ц и й б о л ее п одходящ им и я в л я
ю тся н елин ейны е м о д е л и (р а з д . 3 . 4 ) , л и н е й н а я м одель м о ж ет б ы ть
п о л е зн а п о к р а й н е й м е р е к а к п е р в о е п р и б л и ж е н и е к н ел и н ей н о й
м одел и . Р а зд е л 3 .2 .1 п о с в я щ е н о ц е н к е п а р а м ет р о в , в р а зд . 3 .2 .2
п р ед став л ен ы р а з л и ч н ы е к р и т е р и и д л я п р о в е р к и гипотез и д о в е
р и т е л ь н ы е и н т е р в а л ы , с о д е р ж а щ и е эт и п арам етры . Р а з д е л ы
3 .2 .3 — 3 .2 .5 с о д е р ж а т м а т е р и а л п о т е о р и и и оц ен иванию д в у х м ер
а с с о ц и а ц и и и ли з а в и с и м о с т и м е ж д у У и незави си м ы м и п е р е м е н
ными — т а к н а з ы в а е м ы м и м н о ж е с т в е н н ы м и частны м к о э ф ф и ц и
ентам и к о р р е л я ц и и . П о с к о л ь к у м н о г и е в ы р а ж е н и я в эт о й г л а в е
я в л я ю т с я сл и ш ко м г р о м о з д к и м и , чтоб ы и х м ож но бы ло п р е д с т а
ви ть в простом в и д е , ч и т а т е л и , м а т е м а т и ч е с к и б олее и с к у ш ен н ы е,
н ай д у т м атри чн ую з а п и с ь эти х в ы р а ж е н и й в р а зд е л а х , п о м е ч е н
ны х звездочкой.
5 = 2 (Ус - р„ - Р а - -------------(3 .2 .5 )
¡=1
обы чно н азы в аю тся (частными) коэффициентами регрессии и
с о д е р ж а т с я в вы ход ны х д ан н ы х п р о гр ам м ы . И ногда о ц е н к а Ь(>
н а з ы в а е т с я свободным членом, константой и л и смещением по у .
О ц е н к а у р а в н е н и я м н о ж еств ен н о й л и н е й н о й регресси и (и л и п л о
с к о с т ь наименьших квадратов) м ож ет бы ть за п и с ан а в в и д е
У = К -+- М х Н-------+ Ьрхр ■ (3 .2 .6 )
(М а т р и ч н ы е в ы р а ж е н и я д л я М Н К -о ц е н о к приведены в з а м е ч а
ни и 3 .2 .1 .1 .)
З а м е т и м , что сум м а к в а д р а то в о ткл о н ен и й 5 я в л я е т с я м ерой
о ш и б к и , с в я за н н о й с «подгонкой» вы б о р о чн ы х д ан н ы х п о ср ед ство м
м одели л и н ей н о й р егр есси и ; М Н К -о ц е н к и м и н и м и зи р у ю т э т у
о ш и б к у . Д а л е е , 6г- суть несм ещ енны е о ц ен ки д л я |3; , г = 0, 1, ..., р ,
и вы раж аю тся линейны м и ф ункциям и наб л ю д ен и й у 1} ...
. . . , у п. Н а к о н е ц , из теорем ы Г а у с с а — М ар ко в а (р а зд . 4 .1 ) с л е
д у е т , ч т о п р е д с к а за н н о е зн а ч е н и е у им еет м и н и м ал ьн у ю д и с п е р с и ю
д л я д а н н ы х х ъ ..., х„ среди всех л и н ей н ы х но Х ъ ..., Х п п р е
дикторов ¥.
В в ы х о д н ы х д ан н ы х п р о гр а м м м но ж ествен н ой л и н е й н о й р е г
р е с с и и о б ы ч н о с о д е р ж а тс я ещ е ч еты р е величины . П е р в а я , н а з ы в а
е м а я ост ат очной суммой квадратов (или ошибок) 5 Б К, есть з н а ч е
н и е Б , к о т о р о е п о л у ч ается при п о д стан о в ке М Н К -о ц ен о к в м ес то
п а р а м е т р о в , т. е.
Таблица 3.2.1.
Таблица дисперсионного а н а л и за для модели множественной линейной
регрессии
р - 1
З а м е ч а н и я 3 .2 .1 . ★ ! . П р е д с т а в и м теп ер ь м одел ь и М Н К -
о ц е н к и в м атр и чн ы х о б о з н а ч е н и я х . Э то п р ед ставл ен и е есть с п е
ц и а л ь н ы й с л у ч а й м а т е р и а л а , р ас с м атр и в а е м о го в р а з д . 4.1.
168 Гл. 3. Регрессионный и корреляционный анализы
*11 Лр1
X = *12 Х р1
*1п *” Хрп
М Н К -о ц е н к а м и д л я рь ..., р„
б удут, к а к и ран ьш е, Ъъ ..., Ьр,
в то в р е м я к а к М Н К -о ц е н к о й д л я Р^ будет Ьо = у . П р е и м у щ ес тв о
это й м о д е л и за к л ю ч а е т с я в том, что о ц е н к и Ьх, ..., Ь„ не к о р р е л и -
р о в а н ы с Ьо. М о ж н о п о к а з а т ь , что это у п р о щ а е т н а х о ж д е н и е д о в е
р и т е л ь н ы х и н те р в а л о в д л я п р е д с к а за н н о г о зн а ч е н и я у = у +
+ К (хх — х х) + ... + Ьр ( х р — х р ).
3. В м а т р и ч н ы х о б о зн а ч е н и я х ц е н т р и р о в а н н а я м одель в ы
г л я д и т сл ед у ю щ и м о б р а зо м . П у с т ь А есгь р X р-м ат рица сумм
квадрат ов и смещенных произведений отклонений с эл ем ен там и
П
Яц = I ] (■*1к — X¡) {к¡к — х 3), г, / = 1, а § есть (р Х 1)-вектор
к=\
3.2. Множественная линейная регрессия и корреляции 169
П рим ер 3 .2 .1 . Э к с п е р и м е н т а л ь н о и з у ч а л о с ь о к т а н о в о е число
б е н зи н а , с о д е р ж а щ е г о р а зл и ч н ы е к о н ц е н т р а ц и и д в у х д о б а в о к А
и В. П у с т ь У — о к т а н о в о е ч и сл о , — п р о ц ен т первой д о б а в к и и
Х г — процент в т о р о й д о б а в к и . П р е д п о л а г а л о с ь , что эф ф екты
д о б ав о к А п В с к л а д ы в а ю т с я , т а к ч т о д л я о п и с ан и я за в и си м о с ти ¥
от Х г и Хц и с п о л ь з о в а л а с ь м н о ж е с т в е н н а я л и н е й н а я р е г р е с с и я
У = Ро + Р л + $ 2хг + е - К а ж д а я из д в у х н езави си м ы х п е р е м е н
ны х п р и н и м ал а одно и з ч ет ы р е х ф и к с и р о в а н н ы х зн ач ен и й , а з н а ч е
ние У о п р е д е л ял о с ь д л я каж д о й к о м б и н а ц и и зн ач ен и й Х г = хг
и Х 2 = хг. А н а л и з и р у е м ы е д а н н ы е п р и в е д е н ы в таб л и ц е.
*2 У *1 *2 у
2 96.3 4 2 96.2
3 95.7 3 100.1
4 99.9 4 103.2
5 99.4 5 104.3
2 95.1 5 2 97.8
3 97.8 3 102.2
4 99.3 4 104.7
5 104.9 5 108.8
С пом ощ ью п р о г р а м м ы м н о ж е с т в е н н о й р е г р е с с и и из П С П б ы ли
п о л у ч ен ы оц ен ки Ь0 = 8 4 .5 5 3 , Ъх = 1.833 и Ь2 = 2 .6 8 3 . Т а к и м
о б р азо м , о ц ен к а у р а в н е н и я м н о ж е с т в е н н о й регр есси и есть у =
= 8 4 .5 5 3 + 1 .8 3 3 ^ + - 2 .6 8 3 х 2. Т а б л и ц а д и сп ер си о н н о го а н а л и з а
д л я это го п р и м ер а и м е е т с л е д у ю щ и й вид:
а Р -з н а ч е н и е п о л у ч а е т с я с п о м о щ ь ю к р и в о й плотности р а с п р е д е л е
н и я I (у к) в з а в и с и м о с т и о т а л ь т е р н а т и в н о й гипотезы .
Т р у д н е е п р о в е р и т ь п р о м е ж у т о ч н у ю ги п о тезу о р ав ен стве н ул ю
н е к о т о р о г о п о д м н о ж е с т в а из т ко эф ф и ц и ен то в. Б е з п отери о б щ н о
сти п р е д п о л о ж и м , что п о д м н о ж е с т в о со сто и т из первы х т коэф ф и
ц и ен то в ..., Р,1(. Т о г д а п р о в е р к а ги п о тезы Н0: = ... = р т =
= 0 э к в и в а л е н т н а п р о в е р к е ги п о т е зы о том , что «т п ерем енн ы х
Х и ..., Х т не у л у ч ш а ю т п р е д с к а з а н и е У о тн о си тел ьн о п р е д с к а з а
н и я , п о л у ч а ем о го с п о м о щ ь ю р е г р е с с и и У по Х т+1, ..., Х ру>. Д л я
п р о в е р к и Н 0 с н а ч а л а в ы ч и с л и м р е г р е с с и ю У по перем ен н ы м
Х ,п+1, . . . , Х р и и з а н а л и з а с о о т в е т с т в у ю щ е й таб л и ц ы д и с п е р с и о н
н ого а н а л и з а п о л у ч и м о с т а т о ч н у ю су м м у к в а д р а то в . З а т ем
в ы ч и с л и м р е г р е с с и ю У по в с е м у н а б о р у п ерем енн ы х Х г, ..., Х т, ...
..., Х р. О с т а т о ч н у ю су м м у к в а д р а т о в и с р ед н и й к в а д р а т д л я это го
с л у ч а я о б о з н а ч и м ч ер е з БЭр. и М 5 К со о тветственно. Т о гд а с т а т и
с ти к а кри тери я д л я Н 0 им еет вид
К лП я • (3 -2 Л 4 )
172 Гл. 3. Регрессионный и корреляционный анализы
*1 1 .8 3 3 0 .3 1 1 2 3 4 .6 9 0 .001
*2 2 .6 8 3 0 .3 1 1 2 7 4 .3 3 0.001
И т а к , ги п о теза Я 0: = 0 о т в е р г а е т с я , р ав н о к а к и ги п о т еза Я 0:
р2 = 0. С л е д о в а т е л ь н о , Х г д ает з н а ч и м о е у л у ч ш ен и е п р е д с к а за н и я
У по ср ав н ен и ю с п р е д с к а з а н и е м , п о л у ч а ем ы м с помощ ью р е гр ес си и
У т о л ь к о по Х 2; с о о т в е т с т в е н н о Л^2 з н а ч и м о у л у ч ш ае т п р е д с к а за н и е
У по ср ав н ен и ю с п р е д с к а з а н и е м У с пом ощ ью р егресси и ¥ т о л ь к о
по Х г . С лучай п р о в е р к и г и п о т е з ы о то м , что все коэф ф и ц и ен ты ,
в х о д я щ и е в п о д м н о ж е с т в о и з т = 2 коэф ф и ц и ен тов, р авн ы н ул ю ,
б у д ет рассм о тр ен в п р и м е р е 3 .2 .3 .
Д л я 95 % -н о г о д о в е р и т е л ь н о г о и н т е р в а л а д ля ¡За имеем
1.833 ± 0.3112 ( 2 .1 6 0 ) = (1 .1 6 1 , 2 .5 0 5 ), где ¿„.975 (13) = 2.160. Д о
в ер и тел ьн ы й и н т е р в а л д л я (32 п о л у ч а е т с я т а к и м ж е об разом .
Н а к о н е ц , д л я п р о в е р к и г и п о т е з ы Н 0: р2 = 3.0 п роти в Н х:
Р2 < 3.0 при у р о в н е сх = 0 .0 5 и з в ы р а ж е н и я (3.2.13) в ы ч и с л я е т с я
в ел и ч и н а / = (2 .6 8 3 — 3 .0 0 0 ) /0 .3 1 12 = — 1.019. Это зн а ч ен и е
ср а в н и в а е т с я с п р о ц е н т и л я м и ¿ - р а с п р е д е л е н и я С тью дента с \'к =
= 13 степ еням с в о б о д ы . Т а к к а к а л ь т е р н а т и в а о д н о сто р о н н я я ,
имеем Р > 0 .1 0 и г и п о т е з а Н и п р и н и м а е т с я .
гд е у к, к. = 0, ..., р, — н еи зв естн ы е п а р а м е т р ы и е1 — н е з а в и с и
мы е с л у ч а й н ы е ош ибки, р а с п р е д ел е н н ы е по з а к о н у N (О, а 2).
М Н К - о ц е н к и ск д л я -у* и п р о в е р к а ги п о тез сл едую т из р а зв и т о й
вы ш е т е о р и и п о сл е зам ен ы х3 и (3/г н а г3 и -у* соответствен н о. П р е и м у
щ еств о с т а н д а р т и з а ц и и со сто и т в томе, что ух, . . . , у р и зм е р я ю т
т е п е р ь с т е п е н ь и зм ен ен и я в одной и той ж е ш к а л е . Это п о зв о л я е т
д е л а т ь в ы в о д ы о в л и я н и и н езав и си м ы х п ер ем ен н ы х ..., 2 р (или,
ч то э к в и в а л е н т н о , Х и ..., Х р). Т а к , б о л ьш о е зн ач ен и е с3 у к а зы в а е т
н а в ы с о к у ю степень в л и я н и я (или Х }), / = 1, р.
3 .2 .3 . М н о ж е с т в е н н ы й к о э ф ф и ц и е н т кор рел яц и и
В это м и следую щ ем р а з д е л а х б у д ет р а с с м ат р и в а т ь с я т е о р е т и ч е
с к о е о б о с н о в а н и е м одели м н о ж ествен н о й л и н ей н о й р егресси и . Эта
т е о р и я п р е д п о л а г а е т , что все р + 1 п ер ем ен н ы е У, Х и ..., Х р с у т ь
с л у ч а й н ы е в ел и ч и н ы , им ею щ ие совм естн ое м н огом ерн ое н о р м а л ь
н о е р а с п р е д е л е н и е . В этом р а з д е л е б удет п о к азан о , что среднее
з н а ч е н и е у с л о в н о го р а с п р е д е л е н и я У п р и д ан н ы х зн а ч е н и я х
Х г = хг, ..., Х р = хр о п р е д е л я е т с я ф у н к ц и е й м нож ественн ой л и
н е й н о й р е г р е с с и и ¡30 + ргхх + ... + $рх р. Э то п р и во д и т к модели
м н о ж е с т в е н н о й л и н ей н о й р е гр е с си и , в к о т о р о й д и сп ер си я ош ибки
<т2 е с т ь ф у н к ц и я ди сп ер си и с п е р е м е н н о й У и вел и ч и н ы , н а з ы в а е
мой м н о ж е с т в е н н ы м ко эф ф и ц и ен то м к о р р е л я ц и и . Д л я о зн а к о м л е
н и я с к о н ц е п ц и я м и м ногом ерного стати сти ч еско го а н а л и з а ч и
т а т е л ь м о ж е т в о с п о л ь зо в а т ь с я р а з д . 1 .1 .6 , п р и л о ж е н и е I.
П у с т ь , м н огом ерн ое н о р м а л ь н о е р а с п р е д ел е н и е У , Х х, . .., Х р
им еет с р е д н и е \ху , ц 15 ..., и дисперсии , о'1 ..., о 2р с о о т в е т
ствен но. О б о зн а ч и м ¡совариацию У с 1 ; ч ер ез ау1 и к о в а р и а ц и ю
г,
Х г с Х 3 ч е р е з в ц д л я / = 1, ..., р. О п р ед ел и м д а л е е ко эф ф и ц и ен ты
корреляции
9у*1 — с г ^ 'К а , ') 11 Р*г*;- — о,//((Т.-ст,).
Д л я д а н н ы х зн ач ен и й Х х = хх, ..., Х р = хр су щ ес тв у е т п о д м н о
ж ес т в о с о о т в е т с т в у ю щ и х зн ач ен и й У. И х р асп р е д ел е н и е , н а з ы в а е
мое условным распределением У при данных Х х = х1г .. . , Х Р = х р,
я в л я е т с я н орм альн ы м со средним зн а ч е н и е м
гд е ру .х1...х — п о л о ж и т е л ь н ы й к в а д р а т н ы й к о р е н ь из р \ Х1. -
н а зы в а е т с я множ ественным коэффициентом корреляции м еж ду
У и Х х, ... , Х р.
Е с л и в в е с ти с л у ч а й н у ю в е л и ч и н у е = У — |¿У.Х1...Х , то
у сл о в н о е р а с п р е д е л е н и е е п р и д а н н ы х Х х = хъ ..., Х р = хр б у д ет
N (0, ст2). И с п о л ь з у я у с л о в н о е р ас п р е д ел е н и е м ож но н а п и с а т ь
У — Ро + Р Л . “Ь ' * ' “Ь %хр “Ь е’ (3 .2 .1 7 )
где
Ро = \*-у — Р1 И1 — ‘ * • — РрМр (3 .2 .1 8 )
и е р а с п р е д е л е н о по N (О , о 2). З а м е т и м , что у р ав н е н и е (3.2.17)
им еет тот ж е в и д , что и м о д е л ь м н о ж ествен н о й линей ной регр есси и
(3.2.2).
З а м е ч а н и е 3 .2 .4 . 1. М н о ж е с т в е н н ы й коэф ф ициент к о р р е л я ц и и
Ру.х х я в л я е т с я м ер о й л и н е й н о й зав и си м о сти м еж ду У и н аб ором
перем енны х {Х г, . .., Х р\ , п р и чем 0 < руХ1...Хр < 1- Н у л е в о е
зн а ч е н и е э т о г о к о э ф ф и ц и е н т а у к а з ы в а е т , что У не за в и с и т (л и
нейно) о т н а б о р а п е р е м е н н ы х {Х ъ ..., .Хг }, а зн ач ен и е 1 у к а зы в а е т
н а п о л н у ю л и н е й н у ю з а в и с и м о с т ь , п ри к о торой п ер ем ен н ая У
точн о р а в н а л и н е й н о й к о м б и н а ц и и перем енны х Х ъ ..., Х р.
2. Р а з р е ш а я у р а в н е н и е (3 .2 .1 6 ) отн о си тел ьн о м н ож ествен н ого
к о эф ф и ц и ен та к о р р е л я ц и и , п о л у ч аем
?ухг . . . *р = К - 0 У о*.
И т а к , к в а д р а т м н о ж е с т в е н н о г о ко эф ф и ц и ен та к о р р е л я ц и и равен
доле дисперсии У, «объясненной » регрессионной зависимостью
с Х и ..., Х г .
3. М н о ж е с т в е н н ы й к о э ф ф и ц и е н т к о р р е л я ц и и н еотри ц ател ен по
о п р ед ел ен и ю . Т а к , в с л у ч а е д в у м е р н о го н о р м ал ьн о го р а с п р е д е л е
н и я (р = 1) и м еем
Рг/»-*1 = Р хгч/ = I Рх1У|>
где рх,,; — п р о с т о й к о э ф ф и ц и е н т к о р р е л я ц и и м еж д у Х х и У.
4. К о г д а р = 2 , в ы р а ж е н и е (3 .2 .1 5 ) м ож но за п и с а т ь в ви д е
¿ V * ,* , = 1'» г $1 ( * 1 — МО + Р2 ( * 2 — И2)-
Г раф и к это го у р а в н е н и я е с т ь п л о с к о с т ь (н азы ваем ая плоскостью
регрессии У по Х г и X 2) в п р о с т р а н с т в е , определенном к о о р д и н а т
ными осям и х и х2 и 11ц.Х1Х2. П р и р > 2 г р аф и к , о п ред ел яем ы й
у р ав н ен и е м (3 .2 .1 5 ) , б у д е т г и п е р п л о ск о с ть ю в (р + 1)-м ерном
п р о стр ан ств е, о п р е д е л е н н о м о с я м и х\, ..., хр и цу.Ж1...х .
5. М н о ж е с тв е н н ы й к о э ф ф и ц и е н т к о р р е л я ц и и есть м а к с и м а л ь
ное зн а ч е н и е п р о с т о г о к о э ф ф и ц и е н т а к о р р е л я ц и и м е ж д у У и
л и н ей н о й к о м б и н а ц и е й X х , . .., X ,. Б о л е е то го, \ьу.Х1...х я в л я е т с я
176 Гл. 3. Регрессионный и корреляционный анализы
3 .2 .4 * Ч а с т н ы й к о э ф ф и ц и е н т кор р ел яц и и
В э т о м р а з д е л е р а с с м ат р и в а е т с я ещ е один ко эф ф и ц и ен т к о р р е л я
ци и, н а зы в а е м ы й ч астн ы м коэф ф иц иентом к о р р е л я ц и и , которы й
и с п о л ь з у е т с я к а к м е р а л и н ей н о й за в и с и м о с т и м еж д у д в у м я каки м и -
л и б о п ер ем ен н ы м и из У , Х и ..., Х р п о сл е в ы ч и та н и я «эффекта»,
о б у с л о в л е н н о г о в заи м о д ей ств и ем э т и х д в у х п ерем ен н ы х с н е к о то
ры м н е п у с т ы м под м н о ж ество м из о с т а в ш и х с я р — 1 п ерем ен н ы х.
В ч а с т н о с т и , т а к и м образом м о ж н о и зм е р я т ь зав и с и м о ст ь м еж ду У
и н е з а в и с и м о й п е р е м е н н о й Х т п о сл е у ч ета л и н ей н о й зав и си м о сти
У о т н е к о т о р о г о п о д м н ож ества к п ер ем ен н ы х , со д ер ж ащ его с я
с р е д и р — 1 н еза в и с и м ы х п ер ем ен н ы х Х и г = 1, ..., р, / Ф т.
Э ту л и н е й н у ю за в и с и м о с т ь У о т п о д м н о ж ес тв а к п ер ем ен н ы х и
н а з ы в а ю т «эф ф ектом» п о д м н о ж еств а, о ко то р о м у п о м и н ал о сь вы ш е.
Т е о р и я ч а с т н о г о коэф ф и ц и ен та к о р р е л я ц и и о сн о в а н а , к а к будет
п о к а з а н о д а л е е , н а и зу ч ен и и д в у х у с л о в н ы х р ас п р ед ел ен и й
П у с т ь I и к — д в е к а к и е -л и б о п ерем ен н ы е из н а б о р а У,
Х 1у . . . , Х р и с — н е к о то р о е н еп у сто е п о д м н о ж ество из о с т ав ш и х с я
р — 1 п е р е м е н н ы х . О п р ед ел и м в е л и ч и н ы = I— и =
= к — \1 Н.С. З д е с ь ц; .с, |аа .с — с о о тв етс тв е н н о у сл о в н ы е о ж и д а е
м ы е з н а ч е н и я I и к п р и д ан ном с. З а м е т и м , что — сл у ч ай н ы е
в е л и ч и н ы , т а к к а к они суть ф у н к ц и и с л у ч а й н ы х в ел и ч и н и з с.
Частный коэффициент корреляции между I и к при. фиксированных
значениях переменных из с есть
Р/Л-г = рг,гг ) (3.2.19
гд е р 2,гг — п р о с т о й коэф ф иц иент к о р р е л я ц и и м еж ду 1 Х и г 2.
В э т о м и с л е д у ю щ е м р а з д е л а х б у д у т р а с с м а т р и в а т ь с я д в а частны х
с л у ч а я . В п е р в о м с л у ч а е / = У, Н = Х т, т = 1, р, а с состав
л я ю т все о с т а в ш и е с я р — 1 н е за в и си м ы е п ерем ен н ы е. С о о тв ет
с т в у ю щ и й ч а с т н ы й коэф ф ициент к о р р е л я ц и и будет о б о зн ач аться
3.2. М ножественная линейная регрессия и корреляции 177
ч е р е з рухп.-с- В о в т о р о м с л у ч а е т а к ж е / = У, И. = Х т, а с есть
п о д м н о ж еств о , с о с т о я щ е е из п е р в ы х £ н езави си м ы х перем ен н ы х
{А^, Х г, ..., Х к \, г д е 1 < ^ < и с р , а частны й коэф ф и ц и ен т
к о р р е л я ц и и б у дет о б о з н а ч а т ь с я ч е р е з рУхт х1...хк - В ообщ е, есл и
в с с о д е р ж и т с я к п е р е м е н н ы х , о с о о т в е т с т в у ю щ е м частном к о э ф ф и
ц и ен те к о р р е л я ц и и г о в о р и т с я , ч т о это коэф ф иц иент й-го порядка.
З а м е ч а н и я 3 . 2 . 5 . 1. Ч астн ы й ко эф ф и ц и ен т к о р р е л я ц и и р /Л.с
е с т ь м е р а л и н е й н о й з а в и с и м о с т и м е ж д у / и /г, когд а вел и ч и н ы
п ерем ен н ы х из с ф и к с и р о в а н ы . З н а ч е н и я этого к о эф ф и ц и ен та
к о р р е л я ц и и з а к л ю ч е н ы м еж д у — 1 и + 1 ; зн а ч е н и е н у л ь у к а з ы в а е т
н а т о , ч то / и Н н е з а в и с и м ы , ко гд а в е л и ч и н ы перем енн ы х в с ф и к с и
рованы .
2. И меет место с л е д у ю щ е е т о ж д е с т в о м еж д у м н ож ествен н ы м и
ч астн ы м к о э ф ф и ц и е н т а м и к о р р е л я ц и и д л я н аб о р а п ерем ен н ы х У,
Х 1г ..., Х к_г, Х к, & = 2, ..., р:
гд е с состоит из в сех о с т а в ш и х с я р — 1 п ер ем ен н ы х , а V (Х т | с) —
у с л о в н а я д и сп ер си я Х т при ф и к с и р о в а н н ы х зн а ч е н и я х п е р е м е н
н ы х из с. П оэтом у п р о в е р к а г и п о т е з ы = 0 эквивалентна п р о
в е р к е гипотезы р¡« -с = 0. что б у д е т и с п о л ь зо в а н о в сл ед у ю щ ем
р а зд ел е .
4. Ч астн ы е к о э ф ф и ц и е н т ы к о р р е л я ц и и м огут бы ть в ы ч и с л ен ы
н а о с н о в е р е к у р р е н т н ы х с о о т н о ш е н и й сл еду ю щ и м о б р азо м . Е с л и
1 , к п с 1 — три р а з л и ч н ы е перем ени ы э из м н о ж е с т в а ( У, Х х, . . . , Х„],
то в се частны е к о э ф ф и ц и е н т ы к о р р е л я ц и и п ервого п о р я д к а д а ю т с я
вы раж ен и ем
р ¿¡1.(1 —
К 1- р?^)
178 Гл. 3. Регрессионный и корреляционный анализы
П р и м е р 3 .2 .2 . В эт о м п р и м ер е п р о д о л ж ен о и зуч ен и е д ан н ы х ,
п р и в е д е н н ы х в при м ере 2 .4 .1 . У п = 141 б ольн ого было п роведено
п о п я т ь и з м е р е н и й (в мм р т . ст.) а р т ер и а л ь н о го д а в л е н и я с и с п о л ь
з о в а н и е м в н у т р и а р т е р и а л ь н о г о к а т е т е р а и м етода ком п ресси он н ой
м а н ж е т ы . В с е п я т ь п ерем енн ы х я в л я ю т с я случай н ы м и . С помощ ью
3.2. Множественная линейная регрессия и корреляции 179
„ Выборочное Выборочные
Метод П еременная среднее стандартны е
отклон ен и я
К о р р е л я ц и о н н а я м атр и ц а
*2 *3 *4 *5
*1 ’ 1.000 0.839 0.971 0.871 0.753
*4 1.000 0.837
^5 1.000
Е сл и теп ер ь с р а в н и т ь э т у в е л и ч и н у Р с п р о ц ен т и л ям и р а с п р е д е л е
ни я Б (2, 137), п о л у ч и м , что Р - з н а ч е н и е м ен ьш е, чем 0.05; с л е д о в а
т ел ь н о , п ер ем ен н ая и /и л и Х 3 зн а ч и м о у л у ч ш а е т п р е д с к а з а н и е
У, основан н о е т о л ь к о н а и с п о л ь з о в а н и и Х х. Н ак о н е ц , 95 % -н ы й
д овери тел ьн ы й и н т е р в а л д л я |3Х е с ть 0 .5 9 7 ± 0.136 (1.97) =
= (0.32 9 , 0.865), г д е /0.97о ( I 37) = I - 9 7 - А н ал о ги ч н о м ож н о в ы
ч и с л и т ь д о в е р и т е л ь н ы е и н т е р в а л ы д л я р2 и рз. А н а л и з п р и м е р а
б удет п р о д о л ж ен в э т о й г л а в е .
m = 1, . . , * р . (3.2.24)
С по м о щ ью п р о гр а м м регр есси о н н о го а н а л и з а м ож но о ц е н и т ь ,
н а п р и м е р , с л е д у ю щ и е частны е к о р р е л я ц и и : а) м еж ду У и Х т п р и
ф и к с и р о в а н н ы х з н а ч е н и я х н екоторого подм нож ества из £ п е р е
м ен н ы х , в ы б р а н н ы х из р — 1 о с т ав ш и х с я п ерем енн ы х (£ <;_
< р — 1); Ь) м е ж д у Х г и Х 2 п ри ф и кси р о ван н о м з н а ч е н и и У,
а т а к ж е и л ю б ы е д р у г и е коэф ф ициенты частн ой к о р р е л я ц и и . Д л я
это го н ео б х о д и м о л и ш ь и зм ен ить п о р я д о к перем енны х, п е р е о п р е
д ел и ть н е за в и с и м у ю перем енн ую и ном ера зави си м ы х п ер е м ен н ы х .
Р ас с м о тр и м т е п е р ь р а зл и ч н ы е способы п о л у ч ен и я о ц е н к и
п р о и зв о л ь н о г о ч ас т н о го коэф ф иц иента к о р р е л я ц и и . П у с т ь I и
1г — п а р а п е р е м е н н ы х из У, Х ъ ..., Х р, а с — неп устое п о д м н о
ж ес т в о и з о с т а в ш и х с я перем енны х. О ц ен к у д л я р ¡ь-с о б о зн ач и м
ч ер е з Гц,.с. Т о г д а н ек о то р ы е методы п о л у ч ен и я к а к о й -л и б о и ли
всех оцен ок т а к о в ы :
1. П р и м е н е н и е пр о гр ам м ы частной к о р р е л я ц и и из к а к о го -л и б о
ПСП.
2. Р у ч н о е и л и п р о гр ам м н о е вы чи сл ен и е соотв етству ю щ его
к о эф ф и ц и ен та с по м о щ ью р е к у р р е н тн о го соотнош ен ия, п р и в е д е н
н ого в з а м е ч а н и и 3 .2 .5 .4 . Н а ч а л ь н ы е зн а ч е н и я — просты е к о э ф ф и
ц и енты к о р р е л я ц и и , со д ер ж ащ и еся в вы ходны х дан н ы х п р о гр а м м
м н о ж ес т в е н н о й л и н е й н о й р егресси и или д еск р и п ти вн ы х п р о гр ам м .
3. В р а з д . 3 .3 б у д е т р ассм о тр ен а п р о ц ед у р а пош аговой р е г р е с
сии , к о т о р а я в ы ч и с л я е т у р а в н е н и я м нож ественн ой л и н ей н о й
р егр е сси и по ш а г а м . Н а к аж д о м ш аге в о зн и к а ет некоторое п о д м н о
ж е ст в о с н е за в и с и м ы х перем енн ы х, в х о д ящ и х в у р ав н ен и е р е г р е с
сии, и п р и ф и к с и р о в а н н ы х зн а ч е н и я х перем енны х из с в ы ч и с л я ю тс я
коэф ф иц иенты ч астн о й к о р р е л я ц и и м еж д у У и каж д о й н е за в и си м о й
п ерем енн ой, не в х о д я щ е й в у р а в н е н и е регресси и . П о с к о л ь к у
и м еется в о з м о ж н о с т ь п р и н у д и тел ь н о вкл ю ч и ть в у р ав н ен и е р е г р е с
сии п е р е д н а ч а л о м о т б о р а п р о и зв о л ьн о е подм нож ество п ер ем ен н ы х
(зам еч а н и е 3 .3 .1 .4 ) , то , и с п о л ь зу я эти пр о гр ам м ы , м ож н о п о л у ч и т ь
все частн ы е ко эф ф и ц и ен ты к о р р е л я ц и и м еж ду У и о став ш и м и ся
перем енны м и п р и ф и к си р о в ан н ы х зн а ч е н и я х перем енны х из с.
Ч а с тн ы е к о эф ф и ц и ен ты к о р р е л я ц и й и сп о льзую тся в сл ед у ю щ и х
ц е л я х . В о -п е р в ы х , коэф ф иц иент тух .с, где с есть подм нож ество-
всех р — 1 н е за в и с и м ы х перем ен н ы х, и ск л ю ч ая Х т, т — 1, ..., р,
есть м е р а л и н е й н о й зави си м о сти У о т Х т после вы ч и тан и я эф ф ек т а,
о б у с л о в л е н н о го зав и си м о стью эт и х перем енн ы х с перем енн ы м и
из с. Ч ем б л и ж е а б с о л ю т н а я в е л и ч и н а это го коэф ф иц иента к 1, тем
с и л ь н е е за в и с и м о с т ь . П р о в е р к а гипотезы о том, что п р и ф и к с и р о
в а н н ы х з н а ч е н и я х п ер ем ен н ы х из с о б у сл овл ен н ы й Х т в к л а д
в п р е д с к а з а н и е У н езн ач и м , т. е. р ух .с — 0, э к в и в а л е н т н а
п р о в е р к е ги п о т е зы Н 0: р т = 0. Д л я п р о в е р к и последней м ож н о
п р и м ен и ть л и б о Р -к р и т е р и й (3 .2 .1 1 ), либо /-к р и те р и й (3 .2 .1 2 ).
В о -в то р ы х , к о э ф ф и ц и е н т гух .с > где с — н екоторое п о д м н о ж е с т в о
184 Гл. 3. Регрессионный и корреляционный анализы
s =
где s2 — о с тато ч н ы й ср е д н и й к в а д р а т M SR из т аб л и ц ы д и с п е р с и о н
ного а н а л и з а 3 .2 .1 , a s | — о ц е н к а д и сл ер си и Y.
2. П р о с т о й коэф ф и ц и ен т к о р р е л я ц и и м е ж д у н аб лю д аем ы м и
зн а ч е н и я м и y¡ и п р ед ск азан н ы м и y¡, i — 1, ..., п, э к в и в ал ен т ен
вы бо р о чн о м у м н о ж еств ен н о м у коэф ф ициенту к о р р е л я ц и и гу . , . -х .
3. Т а к к а к м н о ж ествен н ы й ко эф ф и ц и ен т к о р р е л я ц и и и н в а
р и а н те н о т н о с и т е л ь н о н ев ы р о ж д ен н ы х п р е о б р а зо в а н и й , его о ц е н к и ,
п о л у ч ен н ы е д л я исх о д н о й « ц ен три рован ной» и « стан дарти зован н ой »
м оделей, р а в н ы .
★ 4. И с п о л ь зу е м т е п е р ь м атр и ч н ы е о б о зн а ч е н и я . П у с т ь Z =
= ( ¥ , Х г, . . . , Х РУ — в е к т о р с л у ч а й н ы х п ерем ен н ы х р а зм е р н о ст и
(Р + 1) X 1. П р е д п о л о ж и м , что эт о т в екто р им еет м н огом ерн ое
н о р м а л ь н о е р а с п р е д е л е н и е с в е к т о р о м ср едн и х зн ач ен и й Е (Z) =
3.2. Множественная линейная регрессия и корреляции 185
к»
а у1
—
СТ> '2 ' ' « у .
V _
а у 1
« V а \2 • ■ ° 1 р
°У Р СТ2 Р • ■ ^
или, что эк в и в а л е н т н о ,
Р у х 1 ... X
1
•
0 -12
т
*•*
а
<?1к
е
* • В .
| * 1к <Г2* О к\
П ри это м 2 ^ ^ = .
У с л о в н о е р ас п р е д ел е н и е \ ¥ х при ф и к си р о в а н н ы х зн а ч е н и я х
э л е м е н т о в \У 2, нап ри м ер, W 2 — \у 2, б у д ет д ву м ер н ы м н о р м а л ь н ы м
■с в е к т о р о м средн их зн а ч е н и й
Е ( \¥ 0 + 2 ^ 2 - ^ [у/г - Е (\¥,)),
'к о т о р ы й н а зы в а е т с я условным математическим ожиданием XVг
п р и з а д а н н о м зн ач ен и и W 2 = \у 2 и к о в а р и а ц и о н н о й м атр и ц ей
2 2 0г,1ш22 Ш
2 к,22 а ,гШ1 —
* - 4 - 2 - •
1= 1
а н е с м е щ е н н о й оц ен кой д л я 2 , — м атр и ц а
Ц £ (г,- -
П— 1 ; = 1
г)(ц - г) =
5>1 5 1~ 5 12 5 1р
Н 0 п р и н и м а л а с ь . С д р у го й сто р о н ы , м ож н о в о с п о л ь зо в а т ь с я
■статистикой (3.2.25) с I = У, /г = Х г и с = что д ае т
_ — 0.035 ]/~ 141 - 2 — 2 _ _ п .,
~~ V 1 — (— 0 .0 3 5 ) 2
Г и п о т е з а Я 0 с н о в а п р и н и м а е тс я.
И с п о л ь з у я за м еч ан и е 3 .2 .5 .4 , м о ж н о п о л у ч и т ь зн а ч ен и е гуХ2.Х1Хз
и з п р о сты х коэф ф иц иентов к о р р е л я ц и и следую щ и м о б р азо м .
¿ П о л а га я , что I — У, И = Х 2, с = Х х я й = Х 3, им еем
= 0 .8 4 5 - 0 . 8 7 1 (0 .9 2 7 ) ,=
уХз 1 \ Г \ — ( 0 .8 7 1 ) 2 V 1 — ( 0 .9 2 7 ) 2
_ 0 .7 7 8 - 0 . 8 7 1 (0 .8 3 9 ) _ п 177
Г у Хг ' Х1 1^1 _ ( 0 .8 7 1 ) 2 V 1 — ( 0 .8 3 9 ) 2 ‘ '
0 .9 6 7 — 0 .9 2 7 (0 .8 3 9 ) Л по„
Гх.х.х. = — = 0 .9 2 7 ,
V I — ( 0 .9 2 7 ) 2 V 1 — ( 0 .8 3 9 ) 2
т д е обы чны е коэф ф иц иенты к о р р е л я ц и и
гт = 0 .8 7 1 , гух, = 0 .7 7 8 , гуХа = 0 .8 4 5 ,
г*,*, = 0 .8 3 9 , гя л = 0 .9 2 7 , г*2, 3 = 0.967
в зя т ы и з к о р р е л я ц и о н н о й м атр и ц ы п р и м ер а 3 .2 .2 (с У = Х 4) .
И т а к , им еем
V * гу х 3- х 1 V * гх 2х г - х 1
_________0 .1 7 7 — 0 .2 0 4 (0 .9 2 7 ) = __п ^
— V 1 — ( 0 .2 0 4 ) 2 V 1 — ( 0 .9 2 7 )2
С лучайная
вели ч и н а С реднее ± sd ГУ.,
У 39.2 + 14.1 — .
+ 8 .8 7 9 л :5 + 0 . 1 б и о — 4 .7 2 2 .
М нож ествен н ы й к о э ф ф и ц и е н т к о р р е л я ц и и р а в е н 0 .6 4 , с л е д о в а
т е л ь н о , о б ъ я с н е н н а я д о л я д и с п е р с и и п ер ем ен н о й У с о с т а в л я е т
4 1 % . С огласн о з а м е ч а н и ю 3 .2 .4 .6 , и з д р у г о й и н т е р п р ет а ц и и э т о г о
ко эф ф и ц и ен та с л е д у е т , ч то не м е н е е чем (1 — 0.41 ) '/2 = 0 .7 7
с т а н д а р т н о г о о т к л о н е н и я У о с т а л о с ь н е о б ъ я сн е н н ы м .
З н а ч е н и я ¿ -с т а т и с т и к и д л я п р о в е р к и ги п о т е зы Я 0: Рг == 0
с у т ь 18.2, 29.0, 11.2, 1 5 .6 , 2 1 .9 и 1 7 .7 д л я £ = 1, ..., 6. В се эти
ве л и ч и н ы значим ы с Р < ¡ 0 .0 0 1 . П о э т о м у ни о д н а и з п ер ем ен н ы *
н е м о ж е т быть у д а л е н а к а к б е с п о л е з н а я д л я а н а л и з а .
И з п р и веден н о го в ы ш е у р а в н е н и я д л я у с л е д у е т , что ¡) у в е л и ч е
н и е д и а с то л и ч е с к о го д а в л е н и я н а 1 м м рт. ст. п р и в о д и т к у в е л и ч е
н и ю к а ж у щ е го с я в о з р а с т а н а 0 .2 2 г о д а , п ) у вел и ч ен и ю к о н ц е н т р а
190 Гл. 3. Регрессионный к корреляционный аиализы
Е (4 - й ^ у / £ ¿1 (3 .2 .2 7 )
г '= 2 / ¡= 1
к о т о р у ю м о ж н о и с п о л ь з о в а т ь д л я п р о в ер к и гип отез о к о р р е л и р о -
в а н н о с т и е1.
П р и м е р 3 .2 .5 . А в то м ати ч ески й а н а л и за т о р и зо б р а ж е н и й бы л
и с п о л ь з о в а н д л я подсчета к о л и ч е с т в а п о л о ж и т е л ь н ы х к л е т о к
а л ь в е о л я р н ы х стен о к, с о д е р ж а щ и х л а к т а т д е г и д р о ге н а зы (пн евм о-
ц и ты т и п а 2) в л е г к и х гр у п п ы м орски х сви н о к , о б р а б о т а н н ы х
2 р р ш д в у о к и с и азо та (А геп е / а1. (1977с)). Р е з у л ь т а т ы а в т о м а т и
ч е с к о й о б р а б о т к и к а ж д о г о из 141 с л а й д а к а р т и н ы , п о л у ч ен н о й под
3.2. Множественная линейная регрессия и корреляции 191
м и к р о с к о п о м , с р а в н и в а л и с ь с р е зу л ь т а т а м и ручной о б р аб о т к и
эти х ж е с л а й д о в . Т а к к а к полученны е ч и с л а бы ли в е л и к и , о н и
о б р а б а т ы в а л и с ь к а к зн ач ен и я неп р ер ы вн ы х п ерем ен н ы х с и с п о л ь
зо в а н и е м к о р р е л я ц и о н н о г о и р егр есси о н н о го а н а л и зо в . Х о тя
коэф ф и ц и ен т к о р р е л я ц и и о к а з а л с я вы соки м (г = 0.8, Р < 10 6),
на г р а ф и к е о с т ат к о в (рис. 3.2.1) видно, что на ни ж н ем и в е р х н е м
в у д а л е н и и и з вы б о р ки эл ем ен то в с о тсу тству ю щ и м зн ач ен и е м X
(а н а л и з и р у е м о й п ерем енн ой). О д н а к о с и т у а ц и я м е н я е т с я я р я
и с п о л ь з о в а н и и су щ ествен н о м н о го м ер н ы х м етодов а н а л и з а , т. е.
к о гд а д л я к а ж д о г о эл е м е н т а в ы б о р к и и м еется р наб лю д аем ы х
п ер ем ен н ы х Х х, ..., Х р. Т е п е р ь , есл и э л ем ен т вы б о р ки им еет
о т су тс т в у ю щ е е зн а ч е н и е , с к а ж е м , д л я перем енн ой Х х, удаление-
этого э л е м е н т а в ы б о р к и и з а н а л и з а н е я в л я е т с я необходим ы м ,
п о с к о л ь к у о н о п р и в о д и т к п о те р е и н ф о р м ац и и о п ерем енн ы х
Х г, ... , Х Р, д о с т а в л я е м о й этим эл ем ен то м . Т а к к а к м н ож ествен н ы й
л и н ей н ы й р е гр е с си о н н ы й а н а л и з, р а в н о к а к и д р у ги е м ногом ерны е
п р о ц ед у р ы (гл . 5) о сн о в ан ы н а в е к т о р е ср ед н и х и. и м а т р и ц е
к о в а р и а ц и й 2 , м о ж н о о став и ть это т эл е м е н т в вы б о р ке и и с п о л ь
зо в а т ь и м ею щ и еся в нем и зм е р е н и я д л я в ы ч и с л е н и я о ц ен о к в е к т о р а
средн и х х и м атр и ц ы к о в а р и а ц и й Б.
Р а с с м о тр и м т е п е р ь р а зл и ч н ы е м етоды о ц е н и в а н и я ¡и, и 2 (или,,
что э к в и в а л е н т н о , м а тр и ц ы к о р р е л я ц и й К ), к о гд а о тсутствую т н е
ко то р ы е з н а ч е н и я (обзор л и т е р а т у р ы по этом у в о п р о су см . в А № ,
Е1аэЬо!{ (1966)). П у с т ь щ — ч и сл о эл ем ен то в вы б о р к и , у к о т о р ы х
и звестн о зн а ч е н и е Х ь, Пц — ч и сл о эл ем ен то в, у к о то р ы х и зв естн ы
зн а ч е н и я о б еи х перем ен н ы х Х 1 и Х 3, а пс — число к о м п л ек тн ы х
эл е м е н т о в , в к о то р ы х и зм ерены зн а ч е н и я в с е х п ерем ен н ы х Х ъ
Х р (щ, Пц, пс < п, п — объем в ы б о р к и , I, / = 1, р, I Ф /).
П р и в ед ем т е п е р ь нек о то р ы е м етоды п о л у ч е н и я х и Б (и л и К).
М етод 1. Д л я вы ч и сл ен и я о ц ен о к х и 5 и сп о л ьзу ю т ся т о л ь к о
пс к о м п л е к т н ы х эл ем ен то в . Э тот м етод н а з ы в а е т с я м етодом удале
ния элементов.
М ет од 2. Д л я п о л у ч ен и я и с п о л ь зу ю т ся пг н аб лю д ений .
В м есто о тсу тств у ю щ и х зн а ч е н и й пер ем ен н ой Х 1 п о д ста в л я е т ся
вел и ч и н а х ;. З а т е м , и с п о л ь зу я у к о м п л ек т о в ан н у ю т а к и м о б разом
в ы б о р к у о б ъ ем а п, п о л у ч аю т х и Б. Э тот м етод н а зы вается м етодом
подстановки среднего.
М етод 3. И с п о л ь зу е т с я щ наб л ю д ен и й д л я п о л у ч ен и я х 1 и $
и Пц н а б л ю д е н и й — д л я вы ч и сл ен и я Эц. Э ти ст ат и ст и к и с л у ж а т
ком п о н ен там и х и 8.
М етод 4. И с п о л ь зу е т с я п г наб л ю д ен и й д л я п о л у ч ен и я х 1 и §
и Пц н аб л ю д ен и й — д л я в ы ч и с л ен и я Гц. З а т е м зн ач ен и е вы чис
л я е т с я к а к Бц = Гц-з1-Б}, в чем и со сто и т отл и ч и е д а н н о го м етода
от п р ед ы д у щ его . М етоды 3 и 4 н о с я т н а з в а н и е методов попарного
вычеркивания.
М етод 5. И с п о л ь зу е т с я пс к о м п л ек т н ы х эл ем ен тов д л я о ц е н к и
р егр е с си и к а к о й -л и б о п ерем енн ой по всем о стал ьн ы м перем ен н ы м .
3.2. Множественная линейная регрессия и корреляции 193
Метод 6. В о т л и ч и е о т м е т о д а 5 д л я п р е д с к а за н и я з н а ч е н и я ,
н ап р и м ер Х г , и с п о л ь з у е т с я л и б о о д н а п е р е м е н н ая из Х 2, ... , Х р,
н аи бол ее к о р р е л и р о в а н н а я с А ^ , и л и н ек о торое п од м н ож ество
перем енны х из Х г, Х р. М е т о д ы 5 и 6 н о с я т н а зв а н и я м етодов
подстановки регрессии.
О сновной н е д о с т а т о к лю б о го из п ер еч и сл ен н ы х методов с в я за н
с тем , что их с т а т и с т и ч е с к и е с в о й с т в а з а р едк и м исклю чением
н еи звестн ы (A fifi, E la ^ h o f f (1 9 6 6 , 1969а, b)). К р о м е того, п р и м ен е
ние т а к и х м етодов ч а с т о п р и в о д и т к см ещ енны м о ц ен кам . У ч и т ы
вая все это м о ж н о д а т ь с л е д у ю щ у ю р еко м ен д ац и ю иссл едовател ю :
элементы выборки и / и л и переменные с отсутствующими значе
ниями должны быть уд а л е н ы т а к , чтобы обеспечить баланс между
оставшимся числом переменны х и оставшимся числом элементов,
т. е. м а к с и м и з и р о в а т ь ч и с л о к о м п л е к т н ы х элем ентов вы б о р к и .
С л едовател ьн о , если э л е м е н т с о д е р ж и т м ного п р о п у с к о в , его н у ж н о
у д ал и ть . С д р у г о й с т о р о н ы , с л е д у е т у д а л и т ь перем ен н ую , если ее
з н а ч е н и е н еи звестн о д л я б о л ь ш и н с т в а эл ем ен тов. П осл е это го
м ож н о обы чны м о б р а з о м и с п о л ь з о в а т ь м етод н аи м ен ьш и х к в а д р а
тов и л и проц едуры м н о г о м е р н о г о с тати сти ч еск о го а н а л и з а , о п и
санны е в гл . 3 и 5.
З ам еч ан и я 3 .2 .7 . 1 . В б о л ь ш и н с т в е П С П им еется в о зм о ж н о сть
при м ен ить м етод у д а л е н и я э л е м е н т о в .
2. В некоторы х п р о г р а м м а х с у щ е с т в у ет во зм о ж н о сть и с
п о л ьзо в а н и я метода п о п а р н о г о в ы ч е р к и в а н и я (н ап р и м ер , S P S S
R E G R E S S IO N ). Э т о т м ето д м о ж н о и с п о л ь з о в а т ь , к о гд а им еется
больш ое число э л е м е н т о в с н е б о л ь ш и м ко л и ч ество м отсу тству ю щ и х
зн а ч е н и й и м етод у д а л е н и я э л е м е н т о в ч р езм ер н о со к р а щ а е т объем
вы б о р к и . И с с л е д о в а т е л ь д о л ж е н о т д а в а т ь себе отчет в том , что п ри
этом во зм о ж н о в о з н и к н о в е н и е н е к о т о р ы х в ы ч и с л и те л ьн ы х н е
сообразн остей ( т а к и х , к а к о т р и ц а т е л ь н о е зн а ч ен и е сум м ы к в а д р а
тов и ли /■'-критерия). К р о м е т о г о , п р и и с п о л ь зо в ан и и это го м етода
н еп рим еним а о б ы ч н а я т е о р и я с т а т и с т и ч е с к и х вы водов.
Пример 3 .2 .6 . П р и в е д е м п р и м е р п р а к т и ч е с к о г о п р и м ен ен и я
регресси и д л я о ц е н к и о т с у т с т в у ю щ и х зн а ч е н и й . В м о н и то р н о й
системе н аб л ю д ен и я з а б о л ь н ы м и п о с т о я н н о по зн а ч е н и я м вел и ч и н
си стол и ческ о го д а в л е н и я X (мм. р т. ст.) и p H а р т е р и а л ь н о й к р о в и
7 А. Афифи С. Эйзен
194 Гл. 3. Регрессионный и корреляционный анализы
Р е з у л ь т а т ы м о д ел и р о в ан и я п о к а за л и , что о ц ен к а о т с у т с т в у ю
щ и х з н а ч е н и й п р и в о д и т к зн ач и м о м у у л учш ен и ю по ср а в н е н и ю
с и с п о л ь з о в а н и е м м етода 6. Т ак к а к в ел и ч и н а коэф ф иц иента к о р р е
л я ц и и м е ж д у ¥ и X (с и л ь н а я к о р р е л я ц и я ) б о л ьш е вели ч и н ы к о р р е
л я ц и и м е ж д у 7 и / (с л а б а я к о р р е л я ц и я ), то и с п о л ь зо в ан и е р е г р е с
сии ¥ п о X п ред п о ч ти тел ьн ее. П о д стан о вк а ср ед н и х зн ач ен и й не
р е к о м е н д у е т с я (А геп а1. (1972)).
Во м н о г и х с л у ч а я х п р и м ен ен и я р егр есси о н н о го а н а л и з а э к с п е р и
м ен тато р н е им еет д о статочн ой и н ф о р м ац и и о п о р я д к е н езави си м ы х
п е р е м е н н ы х Х х, Х 2, . . . , Х Р по и х в а ж н о ст и д л я п р е д с к а за н и я
н е з а в и с и м о й перем енн ой ¥ . П р о в е р к а ги п о т езы /Г0: р г = О д л я
к а ж д о й п е р е м е н н о й А г-, 1 = 1, . . . , р, т а к к е не д а е т т а к о й и н ф о р м а
ции. Т а к , в п р и м ер е 3 .2 .3 о т в е р га е т с я ги п о т е за ^ = 0 и в то ж е
врем я п р и н и м а ю т с я ги п о тезы |33 = 0 и р3 = 0. Э то м ож ет п ри вести
к н е в е р н о м у за к л ю ч е н и ю , что д л я п р е д с к а за н и я У в а ж н а т о л ь к о
п е р е м е н н а я Х х.
П о с к о л ь к у стат и с т и к о й , и зм ер яю щ ей эф ф екти вн ость н а б о р а
н е з а в и с и м ы х перем енн ы х к а к п р ед и к то р о в , с л у ж и т м н о ж ес тв ен
ный к о э ф ф и ц и е н т к о р р е л я ц и и , о д н о из р еш ен и й у п о м я н у то й вы ш е
п р о б л е м ы сво ди тся к р егр есси и ¥ по всем возм ож н ы м подм но
ж е с т в а м н е за в и с и м ы х перем енны х и вы б ору н аи л у ч ш его подм но
ж е с т в а с о г л а с н о следую щ ей п р о ц ед у р е. С реди всех под м н ож еств
3.3. Пош аговая регрессия 195
3 .3 .1 . Пошаговые процедуры
Ш аг 0. В ы ч и с л я ю т с я просты е ко эф ф и ц и ен ты к о р р е л я ц и и гух
и вели ч и н ы F -в к л ю ч е н и я Fyx д л я i = 1, ..., р. (Зам ети м , что
простой коэф ф ициент к о р р е л я ц и и есть частн ы й коэф ф и ц и ен т
к о р р е л я ц и и п р и k = О и пустом н а б о р е с.) С тати сти к а к р и т е р и я
д ается вы р аж ен и ем
Р у Ч = г\х . (П - 2 ) / ( 1 - 4 * . ) , (3.3.3)
Ш а ги 4, 5 . . . Р е к у р р е н т н о п о в т о р я е тс я ш аг 3. Ш а г S в ы п о л н я е тся
а) е с л и /-в к л ю ч е н и я д л я всех п ерем ен н ы х, не в х о д я щ и х в L,
м е н ь ш е у с тан о в л ен н о го м иним ум а, Ь) если д л я всех перем ен н ы х
и з L з н а ч е н и е F -у д ал ен и я б ольш е у стан о в л ен н о го м ин им ум а и ли
с) ч и с л о вкл ю ч ен н ы х перем енны х р а в н о р.
3.3. Пошаговая регрессия I Я9
Шаг 5 . С у м м ар н ая т а б л и ц а п е ч а та е т с я , к а к п р ав и л о , по з а п р о с у
п о л ь зо в а т е л я . Д л я к а ж д о го ш а г а п еч атается номер ш а г а , номер
вкл ю ч ен н ы х и у д а л е н н ы х перем енн ы х, зн ач ен и я /"-вк л ю ч ен и я и
.Р -уд ален и я и м н о ж еств ен н о го коэф ф ициента к о р р е л я ц и и м еж д у
У и вкл ю чен н ы м и перем енны м и.
З а м е ч а н и е 3 .3 .1 . В п р о гр а м м а х пош аговой р е г р е с си и б о л ь
ш и н с т в а П С П им еется в о зм о ж н о с ть обязательного вк л ю ч е н и я
п е р с п е к т и в н ы х перем енн ы х в у р ав н ен и е р егр есси и . С этой цел ью
п о л ь з о в а т е л ь с помощ ью соответствую щ его вход н ого п а р ам ет р а,
н а з ы в а е м о г о уровнем принудительного включения, за д а е т д л я
к а ж д о й п е р е м е н н о й либо и н стр у к ц и ю , с л е д у е т ли в к л ю ч и ть эту
п е р е м е н н у ю н езави си м о от вел и ч и н ы ее /- в к л ю ч е н и я , либо п р и о
р и т е т ее в к л ю ч е н и я в у р а в н е н и е р егр есси и относительно д р у ги х
п е р е м е н н ы х . Т аки м о б р азо м , п о л ь з о в а т е л ь им еет в о зм о ж н о сть
у п р а в л я т ь отбором перем ен н ы х (в о тли чи е от оп и сан н ого вы ш е с т а
т и с т и ч е с к и о б осн ованного отбора) и первы м и в к л ю ч а т ь в у р а в н е
н и е р е г р е с с и и те перем енны е, к о т о р ы е п р ед став л я ю т ся н аи б о л ее
п е р с п е к т и в н ы м и . П о ш аго в а я п р о ц ед у р а п р и м ен я ется т о гд а т о л ь к о
к тем п е р е м е н н ы м , к о то р ы е о с т ал и сь «свободными» или д л я к о т о
р ы х н е з а д а н у р о в е н ь п р и н у д и т ел ьн о го в к л ю ч е н и я . З а м е т и м , что
п р и п р и н у д и т е л ь н о м вкл ю ч ен и и в у р а в н е н и е р егр е сси и всех н е
з а в и с и м ы х перем енны х п о ш а г о в а я р е г р е с с и я м ож ет б ы ть о с у щ е
с т в л е н а с п о м о щ ь ю п р ограм м ы м н ож ествен н ой р егресси и .
3 .3 .2 . П р а в и л а остан о вки
Н и ж е р а с с м а т р и в а ю т с я т р и п р а в и л а д л я оп ред ел ен и я ч и сл а
п р е д и к т о р о в , о то бр ан н ы х в «наилучш ее» у р а в н ен и е р е гр ес си и .
С т андарт н ое правило, ко то р о е р е а л и зо в а н о в больш и н стве п р о
г р а м м п о ш а г о в о й р егр есси и , о с у щ е с т в л я ет к о н тр о л ь ч и с л а п е р е
м е н н ы х с п о м о щ ь ю в ел и ч и н ы , н азы ваем ой допустимый минимум
F -включения., зн а ч е н и е к о то р о й я в л я е т с я входны м п а р а м е т р о м
п р о г р а м м ы . К а к у к а зы в а л о с ь вы ш е, в ел и ч и н е м ин им ум а / - в к л ю
ч ен и я с о о т в е т с т в у е т в е л и ч и н а м ак си м у м а у р о в н я зн ач и м о сти а,
что в с и м в о л ь н ы х о б о зн а ч е н и я х в ы г л я д и т т а к : min F - r k -лючрния =
= / i - а (1. д л я н ек о то р о го ч и сл а степеней свободы v. О бы чно
п о л а г а ю т v = п — р — 1, а реко м ен д у ем ое зн ач ен и е а с о с т а в л я е т
0 .1 5 (что б у д е т о б су ж д а т ь с я н и ж е), х о гя многие п о л ьзо в ател и
у с т а н а в л и в а ю т а = 0.05.
и п о л ь зо в а т е л ь д о л ж е н о б р а т и т ь с я к д р у ги м методам а н а л и з а
своих д ан н ы х . В п р о т и в н о м с л у ч а е Н = {X ,,}.
b) Н а ш аге 2 б ы л а д о б а в л е н а п ер ем ен н ая X i2. Е сл и д л я нее
/•в к л ю ч е н и я < m in / - в к л ю ч е н и я , 'т о Н состоит то л ь к о из п е р е
м енной X it и н а и л у ч ш а я р е г р е с с и я п о л у ч ен а на ш аге 1. В п р о
тивном случае Н — Х , 2\.
c) Д л я к а ж д о г о д а л ь н е й ш е г о ш а г а п ри у д ал ен и и п ерем ен н ой
из Н п р о и сх о ди т п ер ех о д н а сл ед у ю щ и й ш аг. С д р у г о й сторон ы ,
при в кл ю чен и и н е к о т о р о й п ер ем ен н о й п р о и зв о д и тся с р а в н е н и е
зн а ч е н и я / в к л ю ч е н и я с п о р о г о м . Е с л и в ел и ч и н а /-в к л ю ч е н и я
зн а ч и м а , Н р а с ш и р я е т с я д о б а в л е н и е м этой перем енной и п р о и с
ход и т переход н а с л е д у ю щ и й ш а г . В п р отивн ом с л у ч ае п р о и сх о д и т
о с тан о в к а п р о ц ед у р ы , а н а и л у ч ш и м б удет набор, пол уч ен н ы й н а
преды дущ ем ш аге .
(3.3.8)
(1 4 1 — 3 — 1) (0 .7 6 9 1 — 0 .7 5 8 6 ) _ о 11
( 3 - 1 ) 1 -0 .7 6 9 1 ~ ’
( 1 4 1 — 3 — 1) ( 0 . 7 6 9 1 — 0 .7 68 8 ) _ 01 о
( 3 - 2) (1 -0 .7 6 9 1 ) ’
lJ i — 0i ©¿е 03* 1 +
д = 1 .3 7 0 7 + 1.8925е-°-1580*,
Т а б л и ц а 3 .4 .1
Среднеквадратичная
Итерация ошибка 0, 4 вз
которая незначима.
Приближенным 95 %-ным доверительным интервалом для 03
будет
H+ R^HR,
*2
Остаточная
Итерация симма 2 6
:квадратов S
0 0.000926 0.1250 0.2860
1 0.000697 0.1368 0.20S7
2 0.000575 0.1688 0.1458
3 0.000130 0.1755 0.1537
4 0.000130 0.1758 0.1531
5 0.000130 0.1758 0.1531
для / = 1, ...,
И в этом случае МНК-оценки параметров получаются численно
с помощью итерационного процесса. Как и раньше, для работы
программы необходимо задать начальные значения параметров,
их верхние и нижние границы и подпрограммы для вычисления
фуикции / ( ) и ее производных. Кроме того, пользователь дол
жен задать и подпрограмму для проверки выполнения ограниче
ний и иногда первых производных от функции, описывающей
ограничения.
В выходные данные включаются оценки параметров, асимпто
тические дисперсии и стандартные отклонения оценок у¡.
№ У *2 *3
1 0.8 - 0 .2 9 3 3.397 -2 .1 7 3
2 0.8 . 2.558 -3 .5 6 7 10.833
3 -1 .0 1.724 1.137 - 2 6 .6 7 8
4 1.0 2.129 -4 .1 1 9 0.000
5 0.7 1.954 3.568 10.233
6 1.0 2.390 0 .3 83 - 3 5 .9 0 2
7 1.0 - 0 .9 7 2 0.463 -1 8 .8 5 1
8 0 .6 0.753 1.590 -2 5 .9 3 0
9 0 .3 0.513 0 .108 -2 8 .7 9 9
10 0.5 -0 .5 7 5 0.105 - 2 8 .4 4 7
11 - 3 .5 -6 .5 9 1 10.274 -8 .9 9 0
12 -6 .0 -2 9 .0 4 4 2 8 .4 5 6 - 1 0 .8 3 3
13 -8 .5 - 2 2 .1 5 7 2 3 .7 0 7 -4 .4 9 8
14 -2 .5 -2 .3 3 7 0 .6 20 1.753
15 -3 .0 -1 .0 4 8 1.237 7.550
16 6.0 -1 .4 6 4 - 1.620 -1 1 .7 6 4
17 -9 .0 - 1 9 .9 3 0 19.425 -6 .9 6 6
18 6 .0 14.099 -1 2 .7 4 7 9.439
19 7.0 16.421 - 1 5 .0 4 5 5.403
20 6.0 17.377 -1 4 .4 1 9 1.106
21 4.3 12.705 - 9.238 10.160
22 3.8 11.590 -1 1 .2 1 8 5.874
23 4.2 18.322 -2 0 .4 2 0 4.738
24 6.0 17.817 -1 8 .2 1 4 4.738
25 4 .6 14.177 -1 2 .5 0 7 2.259
26 4.0 14.877 12.679 0 .0 00
5У . = Х , 1— 1, 2, 3; -¡£- = 1.
др1 ~ ’ ’ ’ Зр4
Р| 0 .6 6 0 9 ± 0.01797
Рг 0 .3 3 9 1 ± 0.01797
Рз 0 .0 0 0 0 ± 0.0 00 0 0
Р* -0 .1 4 7 9 + 0 .4 36 0 0
Упраж нения
Замечание.Набор данных А — это д а н н ы е из примера 1.4.1, табл. 1.4.1 и 1.4.2.
Набор данных В — это д а н н ы е из пр им ера 1 .4 .2 , табл. 1.4.3 и 1.4.4.
Раздел 3.1
3.1.1 (набор данных В ). П ост р ой те диаграмму рассеяния для перемен*
ных У — систолическое д а в л е н и е (1962) и X — систолическое давление (1950).
Убедитесь, чсто линейная зависимость является разумной аппроксимацией.
Оцените средние, д и с п е р с и и , ковар и ац и и и коэффициент корреляции между
У и X.
3 .1 .2 (набор данны х В ) . Д л я дан н ы х из уп р . 3.2.1 проверьте гипотезу неза
висимости X к У и вы числите 95 % -ны й доверительный интервал для коэффи
циента корреляции.
3 .1 .3 (набор данны х В ) , а) В ы п олни те уп р . 3 .1 .1 , используя вместо вели
чины систолического д а в л е н и я величины диастолического давления ф Р ) .
b) Вычислите оценку л и н и и р егр есси и К по X и нанесите ее на диаграмму
рассеяния.
c) Вычислите 95 % -н ы й д овер ительны й интервал для среднего значения Б Р
(1962) у тех ин диви дуум ов, д л я которы х значение Б Р в 1950 г. составляло 75.
с!) Вычислите 90 % -н ы й интервал о ц е н к и О Р (1962) для тех индивидуумов,
у которых ОР (1950) с о ст а в л я л о 80.
е) Проведите п р и бл и ж ен н ы е гр ан и ц ы 95 % -ной доверительной полосы для
линии, полученной в п. Ь ) .
Раздел 3.2
3.2.1 (набор данны х А ) . а) И с п о л ь зу я данные первичного обследования для
всех больны х, оцените м н ож еств ен н ую л и н е й н у ю регрессию У по Х 1г Х г и Х 3,
где У = Р У 1, Хх = И а , Х 2 = Н ёЬ , Х а = Н сЬ
Ь) Проверьте ги п о т езу о том, что У не зависит от Х 1: Х 2 и Х 3.
3.2.2 (набор данны х А ) . Д л я данных и з уп р . 3.2.1: а) получите 95 %-ные д о
верительные интервалы о т д е л ь н о д л я , р2 и Рз-
b) получите 95 % -ны е довер и тел ьн ы е интервалы одновременно для {$1 ,
Рг и Рз!
c) сравните п. а) и Ь ).
218 Гл. 3. Регрессионный и корреляционный анализы
3.2.3 (набор данных; А). Для данных из упр. 3.2.1: а) вычислите 95 %-ный
доверительный интервал для среднего значения У при Х1 = 21, Х 2 = 12, Х3 =
= 32;
b) вычислите 90 % ный интервал для оценки величины Г при тех же самых
значениях -X; = 1 , 2 , 3, что и в п. а);
c) сравните п. а) и Ь).
3.2.4 (набор данных А). Для данных из упр. 3.2.1: а) оцените множествен
ный коэффициент корреляции между У и Х 2, Х 3\
b) о ц е н и те м н ож ествен н ы й коэф ф иц иент к о р р ел яц и и м еж ду V и Х^,
c) проверьте, улучшает ли предсказание У добавление Х 2 и Х 3 к Х± как
независимых переменных.
3.2.5 (набор данных А). Для данных из упр. 3.2.1: а) оцените частный коэф
фициент корреляции между У и каждой из переменных X, при фиксированных
двух других переменных, £ = 1 , 2 , 3;
Ь) вычислите совместный 95 %-ный доверительный интервал для трех част
ных коэффициентов корреляции, оцененных в п. а). [ У к а з а н и е : используйте ин
тервалы, вычисленные в упр. 3.2.2 (Ь), и соотношение, приведенное в замеча
нии 3.2.5.3. ]
Р азд ел 3 .3
Р аздел 3.4
3.4.1 (набор данных А), а) Используя данные первичного обследования для
всех больных, постройте диаграмму рассеяния на плоскости У = С1 и X = АТ.
Получите оценку линии регрессии для двух моделей
1) + Р Л + + е ., £= 1 ...........п,
Разделы 3 .1 — 3.3
Используя набор данных для задачи мембранного переноса (пример 3.4.3),
ответьте на следующие вопросы.
1) Применив программу линейной регрессии, оцените в отдельности регрес
сию зависимой переменной по каждой из трех независимых переменных и сде
лайте выводы по каждому анализу так, как указано ниже. Обязательно получите
графические результаты, включая графики остатков и законы распределения.
a) Каковы уравнения наименьших квадратов?
b) Как точны оценки коэффициента регрессии?
Ответ на это дайте в терминах стандартной ошибки коэффициента регрессии,
коэффициента вариации и 95 %-ного доверительного интервала для истин
ного коэффициента регрессии. [Указание: коэффициент вариации равен
умноженному на 1 0 0 отношению стандартного отклонения оценки к величине
оценки.]
c) Каково качество подгонки? Ответ дайте с использованием коэффициента
множественной корреляции и графиков.
(1) Является ли независимая переменная значимым предиктором для зави
симой переменной? Если нет, что является наилучшей оценкой для значений
независимой геременной?
220 Гл. 3. Регрессионный и корреляционный анализы
е) В к а к о й м е р е в ы п о л н я ю т с я п р е д п о л о ж е н и я р е г р е с с и о н н о й м о д е л и —
р авен ство д и сп ер си й и н орм альн ость ош и бок? Н еоб хо д и м о л и и сп ол ьзован и е
п р еобр азован и й д л я у л у ч ш ен и я со гл аси я с м оделью ?
Г) К а к а я и з н е з а в и с и м ы х п е р е м е н н ы х я в л я е т с я н а и л у ч ш и м , в т о р ы м п о к а
ч е ст в у и сам ы м плохи м п р ед и к то р о м ? П о ч ем у?
2) П р и м ен и в п р огр ам м у м нож ественной линейной р егр есси и , п ол учи те
р егр есси ю зав и си м о й п ерем ен н ой п о всем тр ем н езав и си м ы м перем ен н ы м .
a) В ы п и ш и т е у р а в н е н и я н а и м е н ь ш и х к в а д р а т о в .
b ) Н а с к о л ь к о то ч н ы о ц ен ки коэф ф иц иентов р егр есси и ?
c) К а к о в о к а ч е с тв о п од гон к и ?
с!) Я в л я ю т с я л и в се т р и н е з а в и с и м ы е п е р е м е н н ы е в с о в о к у п н о с т и з н а ч и м ы м
п р ед и к тором д л я зави си м ой п ерем енной ?
е) Я в л я е т с я л и к а ж д а я и з н е з а в и с и м ы х п е р е м е н н ы х зн ач и м ы м п р е д и к т о р о м
д л я У при ф и кси р ован н ы х о стал ьн ы х д в у х незави сим ы х п ер ем ен н ы х?
0 О б суд и те п р и ем л ем ость п р едп ол ож ен и й л и н ей н ой р егр есси о н н о й м одели .
3) В о с п о л ь з о в а в ш и с ь п р о гр ам м о й п о ш а го в о й р е гр е с с и и , п р о в е д и т е п о ш а
го в ую р егр есси ю с прим енени ем ч еты р ех п р ави л о стан о вк и . О д и н ак овы л и « наи
лучш ие» у р а в н е н и я во в с е х ч еты р ех сл у ч а я х ? С р авн и те эта р е зул ь та ты с и сти н
ным н аи л уч ш и м ур авн ен и ем .
Р а з д е л 3 .4
[ н ] = 1.7 [ Н ] = 4 х 10" 9 И
X
Ш (г) г К Н (*) !
1) О п р е д е л и т е д л я к а ж д о й к о н ц е н т р а ц и и [Н ] н а ч а л ь н ы е з н а ч е н и я А и В.
[ У к а з а н и е : п о л о ж и т е 1— у о о и / = 1 / В . ]
2) Л и н е а р и з у й т е ф у н к ц и ю Ц А , В ) = А ( 1 — е~
В{) в окрестн ости н ачал ь
ны х значени й А 0 и В 0.
3) П р и м е н и в п р о гр а м м у н е л и н ей н о й р е г р е с с и и , н а й д и те о ц ен к и д л я А и В
д л я к аж д ой кон ц ен трац и и [ Н ] . О тветьте н а сл ед ую щ и е воп р осы отн оси тел ьн о
к а ж д о го из п о л уч ен н ы х ур авн ен и й р егр есси и .
Упражнения 221
a) К а к о в а т о ч н о с т ь п о л у ч е н н ы х о ц е н о к ?
b) К а к о в о к ач ество п о д го н к и ?
c) Н а с к о л ь к о п р и е м л е м ы п р е д п о л о ж е н и я м о д е л и : г о м о с к е д а с т и ч н о с т ь , н о р
м альность и т. д.
4) П р о в е р ь т е г и п о т е з у о т о м , ч т о д л я р а з л и ч н ы х к о н ц е н т р а ц и й в е л и ч и н ы А
и В значи м о о тл и ч н ы .
5) О ц е н и т е и /г2 д л я к а ж д о й и з к о н ц е н т р а ц и й .
Разд елы 3 .2 и 3 .4
Уровень Уровень
НораЬреналин 'И о р а ' д р е и а л и н
натрия натрия
Р а з д е л 3 .4
В рем я 0 .1 0 0 .2 5 0 .5 0 1 .0 0 1 .5 0 2 .0 0 4 .0 0 8 .0 0 1 2 .0 0 2 4 .0 0 4 8 .0 0
Н аблю даем ая 1 8 .7 1 6 .9 1 4 .5 1 1 .1 8 .9 7 .5 5 .2 3 .6 2 .6 1 .0 0 .2
концентраци я
4
Д и сп ер си он н ы й ан али з
£ Ф = £ , СД , (4.1.5)
¿=1 1=1
где с1 — известные постоянные, I = 1, р . Поскольку 0г- ли-
р
нейно зависит о т у 19 у 1П то и 5] линейно зависит от наблю-
¿=1
дений у . Важность метода наименьших квадратов состоит в том,
8 А. Афифи, С. Эйзен
226 Гл. 4. Дисперсионный анализ
41 Xр 1
(Х')ихР =
Чл
S = £ {у, — Ро — Р л )2
i=i
по р0 и Pj. Эти оценки однозначно задаются равенствами (см.
(3.1.5) и (3.1.6))
П
£ (*/ — х)"У1
К = у — М и = -------------------------.
£ (xi - *)2
i=i
Несмещенной оценкой для дисперсии ст2 служит
Ро + 2(5Х= Ро + 2fj.
A
¡=i
i и А г= 2
í^ j+ i
-£-=**•
Р , --- - „
где \|з = 2 ] сгв;> а ^(4‘) — оценка дисперсии 1р. Поскольку оценка
¿=1
г); линейно зависит от наблюдений, то ее можно записать в виде
П
с известными постоянными аг-. Отсюда имеем
1=1
У (ф) = а2 £ я?, (4.1.10)
1=1
^ ) = 52 £ а ? . (4.1.11)
£=1
где
Соу (ф) = а 2В. ★
230 Гл. 4. Дисперсионный анализ
и (XI X)2
1=1
V (ф)
I] ( Х, - - Х) 2 Ц (х,- —х)2
Ь/=1
Б Б н = (Б Б к - 5 Б К) = Й £ (** ~ *)
1«=1
Отсюда
р? 21 (*<■- *)7>
■Р= „ 1-1-----------------» где у , = Р0 +
23 ( У 1 - к ) * Ц п - 2)
1=1
Б Б К = 2 : ( У с ~ У х ? + 23 ( У 1 ~ У 2) 2.
¿=1 ¡=л,-)-1
4 .1 . Основы теории общей линейной модели 233
х) Э т а г и п о т е з а о т л и ч а е т с я о т п р и н я т о й ф о р м ы Н 0 : 0,- = 0 . Н о , с д е л а в з а
м ену = Эх, ,и2 = 01 + 02 . п р и в е д е м н а ш у г и п о т е з у к в и д у Н 0 : 02 = 0 .
234 Гл. 4. Дисперсионный анализ
1-я
п о о л о п у л я ц и я /*
м ( к . б гА / \ у \ / \
У
/ с \\ /
VI« \ «3 / \
/ \ / 1ог2
У V У
1 1 1
МодельI
Модель Л
Р и с . 4 .2 .1 . С равнени е факторов, описываемых м оделью ! и моделью II. Модель I —•
п р ов ер я ется гипотеза Я 0: |ха = (,12 = ц3 = (г или а.г = а2 = а3= 0; значе
н и я ¡д1; (х2 и Цз выбираются по плану. Модель II — проверяется гипотеза Я 0:
сг^ = 0; т у т г, т з выбираются случайно.
4 .2 . Однофакторный дисперсионный анализ 237
М ежду I сс
уровнями БЭв = У] - У - )2 ув = / - 1 МЭВ = ^ Р = ^
(группами) ¿= 1 'Ув
В нутри 1 ■*I МБ^ ==
уровней ЭБр = 2 ] (УЦ — Уг-)2 ^ = п—I _ _ Я**
(групп) г= 1 / = 1 ~
О, »2 о} о,
Д и с п е р с и о н н ы й ан ализ
П олная 18.2890 35
Т а б л и ц а 4 .2 .2
E M S дл я о д н о ф а к т о р н о й м одели ди сп ер си он н ого ан ал иза
(м о д е л и I и I I )
М еж ду уровн ей а, , 02 + k ö a2
(гр уп п ) 0 + / - 1 [ с м . ( 4 .2 . 1 2 ) 1
(4.2.12)
если J x — ... = J , = J , то k = J .
Используя эти величины, легко выписать несмещенную оценку
для сг|. В самом деле, разность межуровневого EMS и внутри
уровневого EMS для модели II равна k a l. Поэтому несмещенная
оценка ста имеет вид
a l = ( MSB - M S r)/6, (4.2.13)
где, как и в табл. 4.2.1, MSß и MSR обозначают соответственно
среднее значение межуровневого и внутриуровневого квадратов.
Оказывается, что для проверки гипотезы Н 0: = 0 можно
воспользоваться тем же самым /^-отношением, что и в случае
фиксированных эффектов. В более сложных случаях для задан
ного критерия проверки гипотез соответствующее отношение
такж е можно выразить через EMS (см. замечание 4.2.1).
Е ^ = о, /=2 1 р,- = о,
¿=1
1 J
2 (сф),7 = о,
¿=1
/ = 1 ............У; 2/=1(сф )г/ = 0, ¿ = 1,...,/. (4.3.2)
/
Ф актор/! БЭд = 2 (# < ••— У - - ) 2 УА = ^— 1 М Бд = — -
1=1 Ха
Ф ак тор В ББв = 1К 2 (# •/ • — У - У2 хв — J — 1 М Бв = — ^
У=1 Гв
/ J
Взаим одей- 35ав = К У] У \(д ц — VAв = Мс _^ав
стви е А В £ = 1 У" = ( / — 1 ) ( 7 — 1) М Ьав ~ ^
— Ус - — У ч- Л -У - )2
I V к
О с т а т о к (о ш и б - ББк = £ И 2 <Лф — ^ и ( К _ х) м5 =
ка) ¿=1 7 = 1 /е= 1 к ' ’
— Уи У
\ J К
Полная 53т = 5] ^ I ] (Уч'Ь хТ = и К — 1
1 = 1 / = 1 /¡= 1
—У - ) 2
248 Гл. 4. Дисперсионный анализ
Т а б л и ц а 4 .3 .2
Н абор д а н н ы х
Диета Средние
------- по
Пол D, D, ст рокам
Р езультаты ди сп ер си он н ого ан ал и за
Источник Число
дисперсии SS степеней MS
свободы
Полная 11.8586 23 —
П роверка гипотез
А о 2 + K a lb + J K o ?
/-1
В а 1 + K a l b + 1 К о ь2
/ - I
* Х авдгу
AB а 2 + K a lb
(/ -1 ) (J —о
R а 2 а г
(4.3.5)
252 Гл. 4. Дисперсионный анализ
M S ,* M S .4 M S»
£ =
f
M S* M S ,e M S ,B
'w'-
V, = 1 — 1 Vl = J - 1
1
п =
Vl = /■ /(К - ]) V2 = ( / - 1) (J- 1) v2 = ( /- 1 )( 7 - 1 )
Без объединения V, = 81 v2 = 4
сл
ОО
н
С объединением vp = 85
4.3. Двухфакторный дисперсионный анализ 253
Я 0: ^ = 0. Но' аь2 = 0
ь
II
о
<3
F = 0.03
к.
оо
Г = 23.2
II
VI =3 V, =3 VI = 1
у2 = 16 у2 = з у2 = 3
N5 Р < 0.005 Р < 0.005
— У -]\-У -)2
I
П олная 58 т = ^ (У 1 , — У - У ч т = и ~ 1
¿=1 /=1
4 .3 . Двухфакторный дисперсионный анализ 255
О ж и д ан и я ср едн и х к в а д р а то в
для неповторяем ы х двухф акторн ы х планов
с ф и кси р ован н ы м и и сл у ч ай н ы м и эф ф ектам и
А а 2 + а*6 + / а *
° + 1 -1
В 1 У— 1
o2+ olb+ Iol
R а2 °2+ ölh
представляет собой несмещенную оценку дисперсии а2. Однако
в случае модели II мы не сможем оценить эту дисперсию а2, если
только не предположим, что о \ ь = 0. Оценки для дисперсий о1
и сг{ задаются формулами
д2a ^ ( f A S A - m R)/J, 61 = (МБя - МБ*)//.
(4,3.10)
Наконец, /‘'-отношения для проверки гипотез приведены
в табл. 4.3.7. Р-значение равно площади справа от величины Р
Т абл и ц а 4 .3 .7
Модель
I: Н0 : все а- = 0 Н, : все ß;. = 0
Модель
II: Н0 : о2а = 0 Я„ : 4 = 0
т в
M SR M SR
vt = / — 1 v2 - J—1
v, = ( / - ! ) ( / - ! ) v2 = (/_ !)(/_ !)
~ 23 ^3 (# 0 — У ’. — У .1~ \~ у .У >
1=1 /=1
= 55ав ЗБд.
Статистика, лежащая в основе критерия для проверки гипотезы
об отсутствии взаимодействий, равна
Р = (// —/ —У) 55а/55к.
.Р-значение равно площади справа от точки ^ под кривой плот
ности распределения Р (1, / / —■/—/) .
Набор данных
Диета Средние по
Пол строкам у,.
А О, О.
Д исперсионны й анализ
Источник: Ч и сло
д и сп ер си и ^ степеней МБ
свободы
Д иета 2 .1 8 6 0 3 0 .7 2 8 7
П ол 0 .3 9 9 6 1 0.3996
Д иета X пол 0 .6 7 0 9 3 0.2236
(о ст ат о к )
П олная 3 .2 5 6 5 7
Таблица С
П роверка г и п о т е з
Я 0: в с е а , — 0 Н0: все р . = 0
О тсутствие д и ф ф е р е н ц и а л ь н ы х О тсутств и е дифференциаль-
эф ф е к то в диеты ны х эффектов пола
Р = 3 .2 6 /=■== 1 .7 9
= 3 V I == 1
~ 3 V , -= 3
ЫБ N3
О ж идан и я ср ед н и х к в а д р а то в для см еш ан н ой
д вухф актор н ой м одели
Источник EMS
дисперсии (смешанная модель)
А : М одель I (м е ж д у об р а - ¡® ?
боткам и ) т / __ i
R а2
Источник EMS
дисперсии смешанная модель
А: модель I
В: модель II о2 + IKo 1
АВ: смешанная + Ко2
аЬ
И а2
v, = (/ -1)(У -1) y, = J — 1 Vi = / — 1
v2 = IJ(K-l) Vl = IJ ( K - 1) .»* = ( / - ! ) ( / - 1)
р = 0.03 ^ = 2 .4 8 F = 23.2
\,1= 3 =3 у1= 1
у2 = 16 у2= 16 у2 = 3
* N5 N5 Р < 0.025
4.3. Д вухф акторны й дисперсионны й анализ 261
Источник Ч и сло
дисперсии ЭБ степ ен ей МБ Р р
сво б од ы
Полная 18 .2 8 9 0 35
Ф актор Л = 1 К У , (£,■•■ — у - - У 2 \А = 1— 1 М ЭЛ =
(=1-
ft) R 1 J M S ß (Л ) =
(в н у т р и A )SSB <Л> = К h £ (УН- - У1- )2 (Л) = I (J — 1) = SSB(A)
t—1/—l vB сл)
Т а б л и ц а 4 .3 .1 2
JK % а2
А О2 + К в \ (а) + К J a \
а + ^ а Ь(я) 1 / _ ]
R а2 п2
р M S ß (А ) т А
M SR М Б я (Л )
7
V! = /— 1
?*
II
iH
v2 = I J ( К — 1) У2 = / ( 1 — 1)
Таблица А
Набор данных
Диета
О, Ог Оз о*
Таблица В
Источник Число
дисперсии ээ степеней мэ Р
свободы
Д иета 3 .7 1 1 3 1 .2 3 7 8 .1 4 < 0 .0 0 5
О б ъ е к т (д и е та ) 1 .8 2 8 12 0 .1 5 2 0 .2 0 N5
О статок ' 1 2 .0 2 0 16 0 .7 5 1
П олная 1 7 .5 5 9 31
Метод
Метод
Метод
Метод
1- К
1 к
Р и с . 4 .3 . 1 . С р а в н е н и е м о д е л е й : а — о д н о ф а к т о р н ы й п л а н (/ = 2 , — 2 , У2
= 3 )" Ь — п л а н р а н д о м и з и р о в а н н ы х б л о к о в ( / = 2 , У = 2 ); с — п л а н с г р у п п и
ровкой ( / = 2 , 7 = 2 , К и зм е р е н и й ); й — п о втор я ем ы й д в у х ф а к то р н ы й план
(1 = 2, ] = 2 , /С и з м е р е н и й ) .
так что
(4-4.3)
С матерью О т д е л ь н о от м а т е р и
Ф актор А г Ф актор Л 3: пери од Ф а к т о р А 3:
от к о н ц а вскармливания з р е л о с т и ____________ п е р и о д з р е л о с т и
до созревания
совместно
совместно
раздель
раздель
приплод
приплод
ЯЩИКОВ
ЯЩИКОВ
система
система
но
но
Л1 15.187 1 15.187
л2 1.541 1 1.541
^3 43.058 2 21.529
А 1А 2 3.741 1 3.741
з 1.974 2 0.987
А ¡А 3 2.280 2 1.140
0.405 2 0.203
Остаток 14.085 36 0.391
Полная 82.271 47
Таблица С
Проверка гипотез
у, = 2 >-1 = 2 у, = 2
у2 = 36 у2 = 36 у2 = 36
N5 N5 N5
1. П л а н ы с р а н д о м и з и р о в а н н ы м и б л о к а м и . М одель с рандом и
зи р о в а н н ы м и блоками, описываемую уравнением (4.3.11), можно
о б р аб ат ы в а т ь к ак ф акторны й план с двум я факторами и N = 1
н аб лю д ен и ем для каж дой пары уровней. Соответствующую т а б
л и ц у д и сперси онн ого ан ал и за выдает лю бая ф акторная програм м а,
а зн а ч е н и я средних квадратов вы числяю тся по ф орм улам из
табл. 4 .3 .8 .
М одель повторяемого п лан а с рандомизированны м и блокам и,
оп исы ваем ую уравнением (4.3.12), можно рассм атривать к а к п о
в то р яем ы й двухф акторны й п лан с N > 1 и обрабаты вать любой
ф ак то р н о й программой, допускающ ей повторение наблю дений.
Е сл и п р о гр ам м а не д опускает повторений, мы переф орм улируем
м одель следующим образом: А г — фактор «способ обработки»,
А 2 — ф актор «блок» и А 3 — фактор «повторения». И сп ол ьзуя
ф ак то р н у ю программу д л я трехф акторного п лан а, мы можем
п р ед ст ав и т ь остаточную сумму квадратов исходной модели в виде
S S r = S S ^3~г 5 5 л ,л 3 — S S A tA t -f- S S ^ y ij/V (4.4.4)
где в ел и ч и н ы , фигурирую щ ие в правой части, берутся просто из
т а б л и ц ы дисперсионного ан ал и за для трехф акторного п лан а.
А н а л о г и ч н а я ф орм ула справедлива и для остаточного числа
степ ен ей свободы. Величины EMS задаю тся по формулам
таб л . 4г.3.9.
4.4. Общая программа факторного планирования 273
3. П л а н с р а с щ е п л е н н ы м и б л о к а м и . В этой ситуации мы р а с
полагаем / j видами о б р а б о т к и (ф а к то р Л 5), / 2 подвидами обработки
(фактор 42) и / 3 б л о к а м и (ф а к то р Л 3) (B row nlee (1965)). К аж ды й
блок делится на 1 г од нород н ы х уч астк о в, а каждый участок — на
/ 2 подучастков. В н у т р и к а ж д о г о б лока уровни ф актора A t с л у
чайно р асп р ед ел я ю тся по у ч а с т к а м , а внутри уч астка уровни
ф актора Л 2 случайно р а с п р е д е л я ю т с я по подучасткам. Н апри м ер,
один блок в случае / 3 — 3 , / 2 = 2 мож ет быть устроен так, как
п оказано в след ую щ ей т а б л и ц е , в которой индекс i j обозначает
уровень ф актора j , / = 1, 2 .
Участок 1 У часток 2 У часток 3
= 2 1\ = 3 ¿i = 1 П одучасток 1
¿2 = 2 i2= 2 ¿2 = 1
г\ == 2 4 = 3 4= 1
Подучасток 2
i2 = 1 ¿2 = 1 ('2 = 2
Блок
Т а б л и ц а 4 .4 .1
А 3 (блоки) = 2 ] (У- ‘з ~ У -У ^А 3 = ¡з — * МЧ
А г (вид обра-
ботки) = I] (в и - —у - У = / Х— 1 МБл, а2 + /-дет? + / а/ 3
К (1) (ошибка 2 {у ‘ 1 - ь ~ у ^
сг2 + / 2а?
участка) V 1’ = ( / 1 - 1 ) ( / з - 1 )
— У - 1 3 + У - - ) '2
А 2 (подвид об
^Л2= /г —1 МБл2
работки) 5^ 2 = I ] ( у - ‘ Г ~ У ■•)2 °а+л<^,д. + / 1/8^ ! ! 2)/ ‘
(видХ = 2 (У‘ 1г2' У‘ 1 ' '
^Л^а 7 (/1 —1) (/2 —1) МЭл,А„_ „2 1 1 2 2 К “*)2‘1<2
X подвид)
— 9ч2- + /Э(/1-1 )(/2-1 )'
А 2А 3 (подвидХ 55^2^3 2 ( У '‘ & з У"Ь>
''’ЛоЛз — (/2 —О (/з —1)
X блок) — у- 12- + £•• )2
М 5А цА3 а2 + /1°Га2аз
К (ошибка под- ==Бвт —(сумма всех М5Й оа
участка) предыдущих ББ) ^ = (/1-1) (/2-1) (/з—1)
И 0: H 0 : все ( x , a 2) ,¡l2 = 0 H a : вс е ( a 2) ¡ 2 = 0
< » = °
r MS.
F —
MS r MS r M S ,,^ ,
MSRd) ■ р . M S-. r - M S *3
F =
MS r MS r<i > MSr.,)
Т а б л и ц а 4 .4 .3
А г Ах
1 2 3 1 2 3
1 2 3 2 1 3
а Ь с а' Ь' с'
2 3 1 1 3 2
А1 1
е / С1' е' Г
3 1 2 3 2 [
9 И / в' И’
Т а б л и ц а 4 .4 .4
а 2 -)-
^ ( т х Л ) — £■•<•))* ^ . 'Е ( « | А
Аг = 1 ~ ■1 М Б Л1
1 / - 1
а 2 -(-
А 2 (У -1 2- — У - - О ) 2 уа 2 = I — 1 М Б л .,
+ / — 1
11
а2
^3 55^з = / 2 ( у - и * ) — у ■■<■■))* * А з = 1 ~ 1 + / — 1
>)
О ст а т о к Б Б к = Б х — ( 5 5 Л1 + = ( / - 1)Х М 5К а2
+ X (/ — 2 )
П о л н а я
58т = 2 £ £ (% *2 сы ~
¿1 12 *3 Л’Х = /2 — 1
- У Л ))2
Т аблица 4 .4 .5
Н 0: все = О Н 0: в се ( а 2) ; 2 = О Н 0: все ( а 3) 1д = О
23 1 2
/ С1 е
2 3 1
3 Л / 9
Режим Животное рн
Животное
1 2 3
Таблица С
Сумма Число
И сточник
квадратов степеней
дисперсии
свободы
^1 0.8570 2
Л2 0.0111 2
/4]Л2 0.0439 4
О статок 0.0650 9
П олная 0.0970 17
Таблица И
*1 0 .8 5 7 0 2 0.4285
Аг (-А{) 0 .0 5 5 0 6 0.0092
О статок 0 .0 6 5 0 9 0.0072
П ол н а я 0 .9 7 7 0 17
Таблица Е
(нет р а з л и ч и й м еж д у (нет д и ф ф е р е н ц и ал ь н ы х
ж и в о т н ы м и п р и одном эффектов режима)
ре^киме)
„ 0 .0 0 9 2 , „ „ 0.4285 .„ .
Р ~ 0 .0 0 7 2 ~ ‘ -3 0.0092 " ' 46'6
<м
= 6
II
СО
= 6
II
< ю
N5 Р < 0.001
К юнтрш7/> 15 30 45 60 75
Источник Число
дисперсии БЭ степеней мэ Р
свободы
Ч а (ВС) — + У а в ~Ь Уа С + 'VЛВС■
Ш аг 2. Из д о п о л н и те л ь н о го у с л о в и я получаем
а .л = — 2 о с 1 — 2 а 2.
У и = а , + *>,„ у 12 = р + «1 + е 12,
У н = У +- а 2 + е 21, у 22 + а2 + е22,
У з1 = /I + «з + ем = 2 а , — 2а 2 + е 31,
Уь = М
- + (— 2) ei + (— 2) 6-2 + е „
г д е коэф ф и ци ен ты х при 0Хи 02 определены моделью, построенной
на ш а г е 2 .
Ш а г 4 и з а м е ч а н и е 4 . 5 . 1 . 3 . П рограм ма множественной л и н ей
ной р е г р е с с и и , которой заданы исходные данны е (см. слева),
вычислит нуж ны е величины SSR h v r . К ром е того,
У *2 мы П0ЛУЧИИ оценки (д., 0Х h J 2 . В обозначениях
j 0 исходной модели й 1= 01, а 2= 02 и а 3= — 2а х — 2а 2.
yi j 0 Ш а г 5 . П роверяется гипотеза Н 0: а х = а 2 =
У2 q j = сх3 = 0 , г. е. отсутствие дифференциальных эф-
q j фектов, связан ны х с фактором А . Д л я перемен-
ных 0 это экви вал ен тн о гипотезе Н „ : 0, = 02=О .
У5 ~
^ гг
~
П оскольку гипотеза состоит в равенстве нулю
всех 0Ь воспользуемся «исключением из правила»
д л я ш а г а 5. Сумма S S r равн а полной сумме квадратов в таблице
ANOVA. для множественной регрессии ш ага 4, a v'R = п — 1 = 4 .
М ож но и по-другому: разн ость S S r — SSR представляет собой
сум му к в ад р ато в , a v R — vR = 3 — число степеней свободы,
о п р ед ел я е м ы е регрессией.
Уц == И а» + ß/ + e¡¡, ¿ = 1, 2 , /=1,2,3.
У 12 = “Ь а х + ß2 + е12>
У н = Н- — а 1 + ßl + е21>
Угг = — « i + ß2 + е22,
Уь ~ У 2 2 Уч = Уг.>'
10 А. Афифи, С. Эйзен
290 Гл. 4. Дисперсионный анализ
А 1 2
Vil + Vai + Vsi = Via ~r V22 + V32 = V11 4" У12= V21 + V22 = V31 + Vs2=0
Ш а г 2. И спользуя дополнительны е услови я, получаем
оса = сс^ сх2 , Ь2 = Ь х,
М о д е л ь приведется к виду
Ук = И
- = 1014" 002Н- Юз 104 0964~ek> k — 1>2,
Уз — И' 4" 001 4~ 102 4" 103 4~ 0^4 4" 105 4~ е3>
к У ■»•г *3 ХЛ Л-5
1 17.5 i 0 1 1 0
2 16.2 i 0 1 1 0
3 13.2 i 1 1
4 12.8 - 1 - 1 1 —1 -1
5 10.4 - 1 - 1 1 —1 -1
6 9.9 - 1 - 1 1 —1 -1
7 IO. 1 i 0 -1 - 1 0
8 8.6 i 0 -1 -1 0
9 II .3 i 0 —1 -1 0
10 5.4 0 1 -1 0 -1
11 3.7 0 1 —1 0 -1
12 10.3 - 1 - 1 -1 1 1
Удалить SSH =, vH =
Источник Гипотеза из ио-
дисперсии «0 ходных SSr VR = SSß —10.757 = v'r - 6
данных
Таблица В
Дисперсионный анализ
П олная 146.699 11
Источник Ч и сло
дисперсии SS степеней MS F Р
свободы
Диета 4 .2 1 1 2 3 1.40 3 7 2 .9 7 NS
Пол 0 .6 7 53 1 0 .6 7 5 3 1.4 3 NS
Диета X пол 0 .130 4 3 0.0 435 < 1 NS
Остаток 13 .2 5 1 1 28 0 .4 733
Полная 18.2680 35
* ••= 4 -2 2*"*
1=1 /=1 1=1
Т ак ая м о д е л ь назы вается м о д е л ь ю о д н о ф а к т о р н о г о к о в а р и а ц и о н
ного а н а л и за . О на рассм атривает //-е наблю дение к а к сумму ген е
р ал ьн о го ср ед н его р, фиксированного дифференциального эффек
та а г, о п р ед ел яем о го г-м уровнем ф актора А , члена |3 ( Х ц — х . . ) ,
о б у сл о в л е н н о го линейной связью измерений у и и Х ц , и ошибки
е ц . О тм ети м , что соотнош ения (4.6.3) можно представить и в виде
м одели о д н о ф акторн ого дисперсионного ан ал и за
У*/ =*Р 4 ~ а 1 Н- е а> ¿ = 1, • • • , / , / = 1,...,/,, (4.6.4)
в которой
Уц = Р (Х ц - X . . )
Уц — (4.6.5)
п о л у ч а е т с я из у ц после учета линейной регрессии по Х ц . Таким
образом , сс, мож но считать истинным дифференциальным эффек
том от г -г о уровня ф актора А после учета линейной регрессии по
со п у тств у ю щ ей переменной.
4.6. Ковариационный анализ 297
Здесь
J J. I 3 .
ЕШ = 2 I I (*/, - ХиУ и Еху = 2 I ! (х„ - *г.) (Уц — У!.)-
1=1 ¡ = 1 1=1 /=1
/ / 1
М еж ду уровням и = 1— 1 м ** = 2 Л- (*<• — .) 2 = 2 Л ' (•*£• — * ••)(# £ • — </• ) №уу — £ Л ' (У1-— У- ) 2
(средними) ¿=1 1= 1 ¿= 1
/ у. 7 уг ' *1
В нутри уровней Л’Е = и — / Ехх = 2 2 (хч - * ,- ) 2 Е*г/ = 2 2 (ХЧ = Ц 2 {уц — У1 -)г
(средних) ¿=1 /= 1 1=11=1 1= 1 /= 1
1 з1
П ол н ая = п— 1 Тдгл; £ 2 (**/ — ¿ . . ) 2 ^ху = 2 2 (ХЦ Х. . )(уц у. ) Т уу = И 2 (Уч' — У' )2
1= 1 /= 1 1=11=1 1=1 1 = 1
300 Гл. 4. Дисперсионный анализ
Тренировочные группы -
V-», У)
д л я испытуемых 1 2 3 4 (контроль)
Таблица В
Ковариационный анализ
С уммы квад ратов
Ч исло и см еш анн ы х п рои зведен и й
И сточник
дисперсии степен ей
свободы X X Х У У У
Таблица 4.6.2
Р азб иен ие остаточной и п о л н о й сумм к в а д р а т о в
квадратов ° р е г р е с с и е ” аЯ О тк л о н ен и е от регрессии
И сточн и к (т а б л . 4 .6 .1 )
дисперсии
ст.св. ст. св. ББ ст. св. ББ т
Е2 Е2ху
Внутри 1 ху
гЕ— 1
р
УЕ Е УУ
Ехх ^ УУ ~ р м бе
уровней ^ XX
(остаточ
ная)
Тху
2 т2
П олная \'т Т уу \’х — 1 т1УУ ХУ
—
Тхх 1 XX
Разность Ум = — Му у - МБм
для провер —
ки различий
Т2
ху | Е2ху
между скор- ТXX 1 Ехх
ректирован-
ными
средними
/^ М ^ /М Б е, (4.6.16)
р = - ^ т г (4-6 Л ?)
имеет / ’-р асп р ед ел ен и е с числами степеней свободы 1 я v E — 1.
Р -з н а ч е н и е равн о площ ади сп рава от точки / под кривой п л о т
ности р а с п р е д е л е н и я / (1, — 1).
Т и п и ч н ы е программы ковариационного ан али за, в ходящ и е
в П С П , в ы д а ю т на печать табл. 4.6.2 и л а ее часть, а так ж е вы чи с
л яю т и п е ч а т а ю т четыре /-о тн о ш ен и я.
Сумма
И с то ч ь г ик квад О пределяем ая О тк л о н ен и е от р егр е сси и
дисперсии ратов регресси ей
Таблица 4.6,3
Выдача программы ВЛШР1У
Ч исло
И сточник дисперсии степеней МБ
свободы
Таблица А
Набор данных
X у X у X V .X
У
4.079 4.158 4.368 4.322 4.169 4.102 4.928 4.829
4.859 4.877 5.668 5.617 5.709 5.582 5.608 5.400
3.540 3.576 3.752 3.720 4.416 4.339 4.940 4.799
5.047 5.078 5.848 5.797 5.666 5.585 5.291 5.167
3.298 3.315 3.802 3.773 4.123 4.049 4.674 4.565
4.679 4.702 4.844 4.800 5.059 4.987 5.038 4.933
2.870 2.901 3.578 3.539 4.403 4.322 4.905 4.762
4.648 4.718 5.393 5.317 4.496 4.383 5.208 5.080
3.847 3.880 4.374 4.343 4.688 4.623 4.806 4.709
Число
Источник д и сп ер си и степеней мэ Р
свободы
Сумма квадратов
Источник
дисперсии
BM DP2V SP S S SAS ст. св.
Упражнения
Раздел 4 . 2
4.2.1. Чтобы определить возможное влияние наследственности на величину
а р тер и ал ь н о го давления, исследовались различия артериального давления между
тремя вы б орк ам и крыс различных семейств. Из каждого семейства выбиралось
по 10 к р ы с и у каждой крысы измерялось артериальное давление в мм рт. ст.
В ы борочны е средние для семейств А, В к С оказались равными хА = 84.5,
х — 8 8 .0 и хс — 91.1. «Внутригрупповая сумма квадратов» равна 270.
a) С оставьте таблицу однофакторного дисперсионного ан ал и за.
b) П р о в е р ь т е гипотезу о том, что все различия между семействами незна
чимы.
c) П р о в ер ь те гипотезу о том, что различие меж ду семействами В и С незна
чимо, сч и т а я , что проводилось только это сравнение.
сЬ О б су д и те проверку других гиттотеч о разл и чи ях меж ду семействами.
4.2.2. На сборочном конвейере большой фабрики занято много рабочих.
И з них сл учай н ы м образом были зы браны четверо, и у каждого из четверых
несколько раз измерялось время сборки определенной детали в минутах. Данные
приведены в следующей таблице.
Рабочие
1 2 3 4
t
Упражнения 309
Раздел 4.3
Диета
Мать 1 2 3
П рибавка П рибавка
Д и ета- М ать в весе Д иета М а ть в весе
(г) (г)
1 1 11.8 2 1 7.4
10.5 9.7
12.5 8.2
2 12.3 2 7.2
15.5 8.6
11.4 7.1
Д и е та
Л е к а р с тв о 1 2 3
Раздел 4.4
Автомобиль
< 1 2 3 4
(Ь ) (а) М) (с)
2.12 1.73 1.65 1.89
(а) № (с) (Ы
1.85 1.93 2.24 2 .5 2
Упражнения 311
Раздел 4 .5
Раздел 4 .6
Д р угие наборы д а н н ы х
Разделы 4 .2 —4.4
1 1 1 1 80 3 1 1 1 . 75
1 2 1 2 8? 3 1 1 2 75
1 1 -у 1 105 3 1 '2 1 105
1 1 2 2 105 3 1 2 2 •105
1 1 3 1 85 3 1 3 1 105
1 1 3 9 85 3 3 о 105
1 1 4 1 95 3 1 4 1 100
1 1 4 о 95 3 1 4 -> 95
1 2 1 1 85 3 2 1 1 90
1 2 1 2 83 3 2 1 2 90
1 2 2 1 105 3 2 2 1 110
1 2 2 2 105 3 2 2 2 110
1 2 3 1 90 3 2 3 1 90
1 2* 3 2 90 3 2 3 2 90
1 2 4 1 100 3 2 4 1 90
1 2 4 2 100 3 2 4 2 ’90
2 1 1 1 75 4 1 1 1 80
2 1 1 2 95 4 1 1 2 • 75
2 1 2 1 110 4 1 2 1 100
2 1 2 2 105 4 1 2 2 100
2 1 3 1 95 4 1 3 1 95
2 1 3 2 100 4 1 3 2 90
2 1 4 1 95 4 1 4 1 95
2 1 4 о 100 4 1 ’4 2 90
2 2 1 1 85 4 2 1 1 75
2 2 1 2 90 4 О 1 о 75
2 2 2 1 100 4 7 2 1 100
Л 2 2 2 100 4 2 2 т 100
2 2 3 1 95 4 2 3 1 95
2 2 3 2 90 4 2 3 2 95
2 2 4 1 110 4 2 4 1 95
2 2 4 2 100 4 2 4 2 95
с т а т и с т и ч е с к о г о а н а л и за
|х „ (5.1.2)
г=1
К
э = ¿ т 2 (Хг - *) (х*' ~ *)'■ (5 -1
г=1
р \ № <5 1 -5>
ОбслеЪов ание 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Х,: систп. Ъавл. 154 136 91 125 133 125 93 80 132 107 142 115 114 120 141
Хг -. Ъиасгп. Ъавл. 108 90 54 89 93 77 43 50 125 76 96 74 79 71 90
(5.2.2)
(5.2.4)
5.2. Проверка гипотез о векторах средних 319
р2 — в интервал
а в е л и ч и н а рх — 2 ¡х2 — в интервал
120.6 — 2 (79.7) ±
= ( — 50.1, — 27.5).
*= (У х - # 2 ) / ] Л р (« Г 1-!- П 2 1) ,
5 = 2 - !) + (п 2 - 1 )в я], (5.2.5)
5.2. Проверка ги п о т е з о векторах средних 321
где
"1
Г = »1 + »2 — Р - I 72 (5 2 .8)
(«1 + "2 — 2) р '
У а, (хи — хи )
1=1
1/ 2;
У д -Д 1’, п 1 + п , - р ~ 1) У ; х ; а д , .а ,
¿=1 /=1
где 5^- — элементы м а т р и ц ы 8. О б щ и й у ро вен ь значимости д л я
всех комбинаций а ъ . . . , а р равен 1 — а . Н ап ри м ер, довери тел ь
ный интервал д л я р,1г- — }х2; и м е е т вид
(хи — х 21) ±
1 1 А. Афифи, С. Эйзен
322 Гл. 5. Методы многомерного статистического анализа
и ж Ц72. если
2<с, (5.3.3)
гд е с — п о ст о я н н ая . Т о г д а зад ач а будет сведена к определению
значений а х........ а п и с , м и н и м и зи р у ю щ и х вероятность ошибочной
класси ф и кац и и. В н а ч а л е будем вы бирать эти постоянные на
интуитивном у р о в н е , а з а т е м покаж ем , что получивш аяся п ро
ц едура к л асси ф и к ац и и о п т и м а л ь н а .
Е сли наблю ден и е х п о с т у п и л о из W ,, то величина г имеет
нормальное р а с п р е д е л е н и е со средним
Ь = Е a # i/ (5-3.4)
/= 1
и дисперсией
£2 = S а/Н-2/ (5.3.6)
/= 1
и с той ж е д и сп ер си ей ст|. И меет смысл вы брать таки е a l t а р,
при которых и £, б ы л и бы к а к мож но больш е удалены д руг
от д р у га о тн о си тел ьн о сг|. Д л я этого введем расстояние М ахала-
нобиса
д 3 ;= g i - E i ) * .. (5.3.7)
Р г ( Г , | х ) = — n , i L P[ (Х1 , iw w / — 1, 2, (5.3.10)
' 11 > cfx Р г (х | Wi) -|- <7а P r (х | №2)
справедливо д л я л ю б о г о р ас п р е д е л е н и я величин х.
Если х имеет м н о го м ер н о е н о р м ал ь н о е распределение N (jli15 2 )
или N ( ц 2 , 2 ) , то Р г (х W x ) и P r (х W 2) мож но зам енить с о
ответственно на п л о тн о сти р асп р ед ел ен и й fi(x ) и f 2 (х). В р е зу л ь
тате получим
Рг(Ц7, I х) - , l q. i í ‘ { x \, , , / = 1, 2. (5.3.11)
v 11 ' + 9 а /2 00
Байесовская процедура классиф икации состоит в отнесении в е к
т о р а наблю дений х к W x, если
P r (W7! | х) З г Р г ( № 2 |х ),
и к W 2, если
P r (U7XI х) < P r (W .2 1х).
П одставляя в эти н ер ав ен ств а зн ач ен и я апостериорны х вероят
ностей из (5.3.11), п о л у ч аем сл ед ую щ ее п равило классификации:
х относится к п о п у л я ц и и W х , если
Ы х (х))/С<7г/2 (х )) ^ 1 - (5.3.12)
и к TF2, если
Ш х (*))/(<7«Л (х)) < i • (5.3.13)
М ожно показать, к а к это сд ел ан о , наприм ер, в работах R ao
(1965), A nderson (1958), что т а к а я п роцедура миним изирует
ож идаем ую вероят ност ь ош ибочной классиф икации
qx )—<72 Рг (1 | 2).
Рг (2 11) — (5.3.14)
Заметим, что эта вел и чи н а я в л я е т с я вероятностью того, что
объект, п р и н ад л еж а щ и й к п о п у л я ц и и W u ошибочно классиф ици
руется, к ак п р и н ад л еж а щ и й W . ¿ , или наоборот, объект из W 2
ошибочно о тн о си тся к W t .
А л гебраи чески м и п р ео б р азо в ан и я м и неравенства (5.3.12) можно
показать, что б а й е с о в с к а я п р о ц е д у р а экви вален тн а отнесению х
к W l t если
£ a . x¡ ^ b + Í L + In ( - J - ) , (5.3.15)
1=1
и к W 2, если
(5.3.17)
и к W 2, если
(5.3.18)
(5.3.20)
и
(5.3.21)
где
д- _ | п foC ( И 2)
(5.3.22)
?iC (2 11) ’
а А2 з а д а е т с я равенством (5.3.7). Заметим, что, когда С (1 | 2) =
= С ( 2 | 1) и Я1 = q, = V2,
(5.3.23)
и к в п р о ти вн ом сл уч ае.
П у с т ь и м е е т с я о бъект, к о т о р о м у соответствует в е к т о р на б л ю д е н и й
х = (лг1( лг2, . . . , хРУ. Т ребу ется отнести его н а о с н о в е этих н а б л ю
д е н и й к п о п у л я ц и и Wx с р а с п р е д ел е н и е м N (¡ufx l , 2 рхр) ил и
к W.2: N ( ц г " Л 2 РХР). П р е д п о л а г а е т с я , что изве с т н ы а п р и о р н ы е
в е р о я т н о с т и и стоимости ош ибочной к л а с с и ф и к а ц и и , но с р е д н и е
jult ¡u2 и м а т р и ц а к о в а р и а ц и й 2 не и зв е ст н ы . Е с л и х ц , . .. , x ini
и х 2ь • • • , х 2Пг — н езави си м ы е с л у ч а й н ы е в ы б о р к и и з п о п у л я
ц и й W 1 и: W2 с оответственно, то м о ж н о о ц е н и т ь |иг- вы б ор очны м
в ектором : с р е д н и х к,- = (хп , xip) ' , i = 1, 2 (см. (5.2.7)), а 2 —
о б ъ е д и н е н н о й вы боро чно й к о в а р и а ц и о н н о й м а тр и ц е й S = (sJk),
/ = 1, . . . , р , k = \ , .. . , р; см. (5.2.5). В т а к о й с и т у а ц и и н е в о з
м о ж н о н а й т и п р о ц е д у р у к л а с с и ф и к а ц и и , к о т о р а я б ы л а бы о п т и
м а л ь н о й в с м ы с л е стоим о сти о ш ибочной к л а с с и ф и к а ц и и (5.3.19).
О д н а к о м о ж н о п о к а з а т ь (A n derson (1958, т е ор ем а 6 .5 .1 )), что если
п а р а м е т р ы в об общ енно й б ай е с о в ск о й п р о ц е д у р е (5 .3 .1 7 )— (5.3.18)
з а м е н и т ь их с о с т о я т е л ь н ы м и оц ен кам и , то б р е з у л ь т а т е о ж и д а е м а я
с т о и м о с т ь о ш ибочной к л а с с и ф и к а ц и и б уд е т у б ы в а т ь п р и л х и я 2 ->
- > оо. П о с к о л ь к у приведенны е вы ш е о ц е н к и с о с т о я т е л ь н ы , обоб
щенная п р о ц е д у р а байесовской классификации на основе оценок
п арам ет ров з а к л ю ч а е т с я в следую щ ем: в н а ч а л е р е ш а е т с я систем а
у р а в н е н и й (5 .3 .8 ) с за м е н о й н а хи , i — 1, 2, / = 1......... р,
и з а м е н о й o jm н а sJm, т = 1, ..., р. З а т е м п о л у ч е н н ы е о ц е н к и
к о э ф ф и ц и е н т о в а х, . . . , а.р (обозначим их аъ ..., ар) и с п о л ь з у ю т с я
д л я о п р е д е л е н и я з н а ч е н и я д и с к р и м и н а н т н о й ф у н к ц и и zu (5.3.1)
д л я к а ж д о г о в е к т о р а н а б л ю д е н и й xih I = 1, .. . , nL. Д а л е е
заданны е ф о р м у л а м и (5 .3 .4 ), (5.3 .6 ), о ц ен и в а ю т с я величинами
ni
^ = (5 -3 -24)
1 /=1
si = V 2 ajsjma m. (5.3.25)
¡=1 ;га=1
5.3. Классификация в случае двух популяций 329
Т а к и м образом, о б о б щ е н н а я б а й е с о в с к а я п р о ц е д у р а о ц е н и в а н и я
со сто и т в о т н е с е н и и х = (х1, . . . , хр)' к № 1г если
р
я в л я е т с я о ц е н к о й д л я А2 (см. ( 5 . 3 . 7 ) ) .
В результате р а б о т ы п р о гр а м м дискриминантного анализа,
как пр а в и ло , п о л у ч а е м с л е д у ю щ е е : а) о ц е н к и ко эф ф иц иенто в
д и с к р и м и н а н т н о й ф у н к ц и и а и . . . , ар; Ь) зн а ч е н и е д и с к р и м и н а н т
ной ф у н к ц и и ги д л я к а ж д о г о в е к т о р а н аб л ю д е н и й х,7 , г = 1, 2,
I = 1, ..., п\ с) в ы б о р о ч н ы е с р е д н и е и г 2; с1) вы б ор очно е р а с
стояние М а х а л а н о б и с а О 2. Эта и н ф о р м а ц и я д о ст а т о ч н а д л я з а
писи п р о ц е д у р ы к л а с с и ф и к а ц и и (5 .3 .2 6 ).
З ам е ч а н и я 5 . 3 . 2 . 1 . Е с л и , к а к и в с л у ч а е с известны м и п а р а
метрами, к о э ф ф и ц и е н т ы а ь ..., ар и м е ю т общий п о л о ж и т е л ь н ы й
м нож итель, в е л и ч и н а
С ( 1 12)
К = 1п <?1 С (2 | 1)
д о л ж н а быть т о ж е у м н о ж е н а н а н е г о . В н е к о то р ы х п р о г р а м м а х
объединенные д и с п е р с и и и к о в а р и а ц и и в системе у р а в н е н и й (5.3.8)
за м еняю тся н а с у м м ы к в а д р а т о в и с м е ш а н н ы е п р о и зв е д е н и я о т
кл о н ен и й с о о т в е т с т в е н н о . В р е з у л ь т а т е коэфф ициенты д и с к р и м и
нантной ф у н к ц и и а 1, . . . , ар д е л я т с я н а ^ + « 2 — 2. С л е д о в а т е л ьн о ,
в е л и ч и н у К н е о б х о д и м о т а к ж е р а з д е л и т ь на пг + — 2.
2. Ч асто б ы в а е т с л о ж н о о п р е д е л и т ь а п р и о р н ы е в е р о я т н о с т и
и ^2. Е с л и с л у ч а й н ы е в ы б о р к и о б ъ е м а п1 и гг2 б ер у т ся с о о т в ет с т
в енн о из п о п у л я ц и й \Х71 и то и Цг м о ж н о о цен ить в е л и ч и н а м и
+ л 2) и <72 = + « г )-
3. В р е з у л ь т а т е р а б о т ы п р о г р а м м ы д и с к р и м и н а н т н о г о а н а л и з а
об ы чно в ы во д и тс я з н а ч е н и е Р - с т а т и с т и к и
«1 + «2 — Р — 1 П1П2 О 2,
(«1 + пг — 2) р Л! + Я2
к о т о р о е м о ж н о и с п о л ь з о в а т ь д л я п р о в е р к и г и по тезы Я 0: А2 = 0.
Ч и с л а степеней с в о б о д ы Б р а в н ы р и п 1 + п2 — р — 1 ■ П о с к о л ь к у
последняя э к в и в а л е н т н а ги п о тезе ¡иц = ц 2, эта с т а т и с т и к а
и д ен т и ч н а /‘’- с т а т и с т и к е ( 5 . 2 . 8 ) . И м е н н о на т а к о й способ в ы ч и с
л е н и я /•’-статистики д е л а е т с я с с ы л к а в за м е ч а н и и 5.2.3 .2 .
330 Гл. 5. Методы многомерного статистического анализа
» 1 + п2 — р — 3
Д2 =
Я 1 -М 2— 2
5. Д и с к р и м и н а н т н ы й а н а л и з д л я д в у х п о п у л я ц и й м ожно осу
щ е с т в и т ь п р и помощ и п р о г р а м м ы м н ож ес т в е н н ой р е г р е сси и . Д л я
э т о г о в к а ч е с т в е за в и с и м о й переменной надо в з я т ь ве л и ч и н у
V = п 2 / ( « 1 4- щ ), е с л и о б ъ е к т п р и н а д л е ж и т п о п у л я ц и и и
У = — г г г1(пг + я 2), е с л и б ер е т ся о б ъ е к т и з Й72. Н е за в и с и м ы м и
п е р е м е н н ы м и я в л я ю т с я в е к т о р ы Х ъ ..., Х р. О б ъ е к т относится
к п о п у л я ц и и '№1 пр и у ^ 0, в п р о т и вн о м с л у ч а е — к О ценка
р а с с т о я н и я М а х а л а н о б и с а О'1 м о ж е т б ы т ь п о л у ч е н а по ф о рм уле
Л 2_ ( « ! + % ) (П!-)-П2— 2)
” (1 - Я 2) гцп 2
П р и м е р 5 . 3 . 3 . П р и по м ещ ении па ц и е н т о в в к р и ти ч е с к о м с о
с т о я н и и в о т д е л е н и е ин тен си вн ой т е р а п и и ж е л а т е л ь н о к л а с с и ф и
ц и р о в а т ь их н а «тяжело» и «менее т я ж е л о » б о л ь н ы х . П о с к о л ь к у
в е р о я т н о с т ь смерти т я ж е л о б о л ь н ы х п ац иенто в в е л и к а , п о п у л я
ц и я « т я ж е л о больных» у с л о в н о н а з ы в а е т с я «н ев ы ж и в ш и е» ,а п о
п у л я ц и я «менее т я ж е л о б ольн ы х» — «выжившие». Т а к и м об разом,
к п о п у л я ц и и Wx о т н о с я тс я в ы ж и в ш и е пац иенты , а к п о п у л я ц и и
W2 — у м е р ш и е На р а з л и ч н ы х с т а д и я х лечения со б и р а ю т с я д а н
ны е о и х с остоян ии. В этом п р и м е р е д л я н а и л у ч ш е г о р а зд е л е н и я
д в у х п о п у л я ц и й и с п о л ь з о в а л и с ь вы б о р к и по н а б л ю д е н и я м , с о б
ранным н е п осред ствен но п ер ед в ы зд ор ов лен и ем и л и смертью
больного.
У п2 = 7 0 в ы ж и в ш и х и п2 = 43 у м е р ш и х п а ц и е н т о в п р о в о
д и л и с ь и з м е р е н и я 13 ф и зи о л о г и ч е с к и х п а р а м е т р о в . С ю да в к л ю ч а
л и с ь : а р т е р и а л ь н о е и в е н о зн о е д а в л е н и я , изм е ре н и е к р о в о т о к а ,
о п р е д е л е н и е с о с т а в л я ю щ и х к р о в и , д и у р е з . С о г л а сн о зам ечан и ю
5 .3 .2 .2 , м о ж н о о цен ить qx в е л и ч и н о й = 70/113 и q2 — в е л и ч и
ной <7 2 = 43/1 13. В е л и ч и н ы С (2 1) и С (1 | 2) бы ли в з я т ы р а в
ными 1, п о с к о л ь к у нет о б ъ е к т и в н ы х осн ов ан и й д л я п р и с в о ен и я
им д р у г и х з н а ч е н и й .
П р и и сп о л ь зо в ан и и программы дискриминантного анализа,
п о д с т а в л я ю щ е й в систем у у р а в н е н и й (5.3.8) сум м ы к в а д р а т о в
и с м е ш а н н ы е п р о и зв е д е н и я о т к л о н е н и й вместо д и с п е р с и й и ко-
5.3. Классификация в случае двух популяций 331
а _х _ ^ ( 0 .3 7 4 8 7 + 0.28851) _ 0 _0 0 4 4 2 = Q.32727,
i= l
и к W2 — в п р о т и в н о м с л у ч а е .
Н а к о н е ц , д л я п р о в е р к и г и по тезы Я 0: Д2 = 0, или, что то ж е
сам ое, Я 0: ,их = ¡и2, в о с п о л ь з у е м с я зн а ч е н и е м F -стати сти к и , в ы
ч исл яем ы м п р о г р а м м о й : F (13, 99) = 17.52. П о с л е д н ее зн ач и м о
с Р < 0 .0 0 1 .
В примере 5 .5 .3 п р и в о д и т с я метод к л а с с и ф и к а ц и и , и с п о л ь з у
ю щ и й п о втор н ы е н а б л ю д е н и я н а д с о сто я н и е м п ац и ен тов .
5 .3 . 3 . Вычисление в е р о я т н о с т е й о ш ибочной кл а с с и ф и к а ц и и
В с л у ч а е к о г д а п а р а м е т р ы р а с п р е д е л е н и й известны , зн а ч е н и я
веро ятн о стей о ш и б о ч н о й к л а с с и ф и к а ц и и Р г (2 1) и Рг (1 | 2)
д а ю т с я (формулами (5 .3 .2 0 ) — (5.3.21). В с л у чае, когд а п а р а м е т р ы
оц е н и в аю тс я , с у щ е с т в у е т н е с к о л ь к о способов о ц е н ки э т и х в е р о я т
ностей. П р е и м у щ е с т в а и не д о с та т ки т а к и х способов б у д у т р а с
с м о трен ы н и ж е . Б о л е е п о д р обн о об этом см. H ills (1966) и L a-
c h e u b r u e h , M ic k e y (1968).
Метед 1. П о с к о л ь к у D 2 я в л я е т с я о ц е н к о й А2, в ф о р м у л а х
(5.3.20) и (5.3.21) м о ж н о за м е н и т ь Д 2 на D 2. С ледует, о д н а к о ,
зам ети ть , что т а к и е о ц е н к и б у д у т см ещ ен ны м и, т. е. д е й с т в и т е л ь н а я
в ер оя тн ость о ш и б о ч н о й к л а с с и ф и к а ц и и будет в с р е д н е м б о л ьш е ,
чем т а к а я о ц е н ка . П р е и м у щ е с т в о м м е тод а я в л я е т с я п р о с т о т а т а
к и х оценок: их л е г к о п о л у ч и т ь по р е з у л ь т а т а м работы п р о г р а м м ы .
Метод 2. Этот м е т о д состои т в к л а с с и ф и к а ц и и к а ж д о г о э л е
м е н т а вы б ор ки о б ъ е м а пх и з п о п у л я ц и и Wr и в ы б о р к и объема п2
332 Гл. 5. Методы многомерного статистического анализа
из W 2 с о г л а с н о в ы р а ж е н и ю (5.3.26). Если т 1 — ч и сл о н а б л ю д е
н и й из Wx , о т н е с е н н ы х к W2, и т.г — ч и сл о н аб л ю д е н и й из W2,
к л а с с и ф и ц и р о в а н н ы х в W lt т о Р г (2 | 1) = т11п1 и P r (1 | 2) =
= m j п.г . Э т о т метод д ае т б о л ь ш е е смещение, чем п ре д ы ду щ и й ,
и, е с л и п р о г р а м м о й не в ы в о д я т с я з н а ч е н и я д и с к р и м и н а н т н о й
ф у н к ц и и д л я к а ж д о г о н а б л ю д е н и я , им т р у д н о п о л ь з о в а т ь с я .
Метод 3. Э тот метод состоит в р а з д е л е н и и в ы б о р к и из п х
наблю дений из популяции н а д в е п од вы борки. Н а б л ю д е н и я из
п е р в о й п о д в ы б о р к и и с п о л ьзу ю т с я д л я вы ч и с л ен и я д и с к р и м и н а н т
ной ф у н к ц и и , а члены в тор ой п о д в ы б о р к и к л а с с и ф и ц и р у ю т с я
с о г л а с н о п р о ц е д у р е , п о л у ч е н н о й по пер вой по д в ы б о р к е . Д о л я
н е в е р н о к л а с с и ф и ц и р о в а н н ы х об ъектов я в л я е т с я оцен кой в е р о я т
но с т и о ш и б о ч н о й к л а с с и ф и к а ц и и . Этот метод об лад ает тем п р е и м у
щ ес т в о м , ч т о д а е т несмещ енны е о ц е н к и , но они имеют б о л ьш и е
д и с п е р с и и , чем оценки, п ол уч ен н ы е по первы м д в у м методам.
Д р у г о й н е д о с т а т о к этого м етод а состоит в том, что не сущ ес т ву е т
с т а н д а р т н о г о спосо б а д е л е н и я вы б о рки.
Метод 4. L a c h e n b r u c h (1967) п р е д л о ж и л п р о ц е д у р у с к о л ь
з я щ е г о э к з а м е н а . И з п е р в о й в ы б о р к и и с к л ю ч а е т с я п ер в о е н а б л ю
д е н и е , и д и с к р и м и н а н т н а я ф у н к ц и я с т р о и т ся по о с т ав ш и м с я
н а б л ю д е н и я м . З а т е м к л а с с и ф и ц и р у е т с я ис к л ю ч ен н о е н аб л ю д ение.
П р о ц е д у р а п о в т о р я е тс я д л я к а ж д о г о ч л е н а п е р в о й в ы б о р к и . Д о л я
н е в е р н о к л а с с и ф и ц и р о в а н н ы х о б ъектов я в л я е т с я о ц е н к о й в е л и
ч и н ы Р г (2 | 1). Т а ж е п р о ц е д у р а п р и м е н я е т с я к о в то рой в ы б о р к е
д л я о ц е н к и Рг (1 | 2). М етодом М о н т е -К а р л о L a c h e n b r u c h , M ic k e y
(1968) п о к а з а л и , что см е щ е н и е т а к и х о ц е н о к п р е н еб р е ж и м о м ало.
Метод 5 . Э то т мегод а н а л о г и ч е н методу 1, т о л ь к о о ц е н к а D 2
з а м е н я е т с я на А2. С р а в н е н и е всех п р и в ед е н н ы х вы ш е методов
м о ж н о н а й т и в ра б о т е L a c h e n b r u c h (1975).
Пример 5 .3 .3 ( продолжение). Применяя первый метод пр и
D 2 = 9 . 5 8 5 8 8 и К = — 0.4 9, п о л у ч и м Р г (2 | 1) = Ф (— 1.71) =
= 0 .0 4 4 и Р г (1 | 2) = Ф (— 1.39) = 0 .082. И с п о л ь з у я 113 з н а ч е
ни й д и с к р и м и н а н т н о й ф у н к ц и и , вторы м методом п о л у ч и м = 5
и т 2 = 4. С л е д о в а т е л ь н о , Р г (2 | 1) = 5 /7 0 = 0.071 и Р г (1 | 2) =
= 4 /4 3 = 0 . 0 9 3 . Д л я р е а л и з а ц и и т р е т ь е г о и ч етв ерто го методов
требую тся специальны е программы.
XI + х2
Р = Р г (С Н О |х ) = 1
Коэффициенты
Мужчины Женщины
Мужчины Женщины
Децили^ Ожидае Наблюдае Ожидае Наблюдае
риска Р мое мое мое мое
10 90.5 82 70.4 54
9 47.1 44 24.7 23
8 32.6 31 15.0 21
25.0 9.8 14
6 19.7 22 6.5 5
5 15.0 20 4.4 6
4 11.5 В 3.2 2
3 8.6 10 2.3 0
2 60 5 1.7 3
1 3.4 0 1.1 1
Р а з д е л 5.4.1 п о с в я щ е н о б щ е м у с л у ч а ю к л а с с и ф и к а ц и и , когд а
объекты в п о п у л я ц и я х р асп р ед ел ен ы произвольно и п а р а
м етры известны; в р а з д . 5 .4 .2 р а с с м а т р и в а е т с я с л у ч а й , ко гд а
распределения в ^ с ч и т а ю т с я м н о г о м е р н ы м и н ор м а л ьн ы м и ;
в р а з д . 5.4.3 п р е д с т а в л е н а з а д а ч а к л а с с и ф и к а ц и и в с л у ч а е п о п у
ляции с биномиальным распределением.
я в л я е т с я м а к с и м а л ь н о й , г = 1, ... , к. ( Е с л и о д и н ак о в ы й м а к
с и м ум достигается к а к в так и в то х относится к или
№,-,.) В е л и ч и н а ( 5 . 4 . 1 ) н а з ы в а е т с я значением дискриминантной
функции для 1-й популяции. Б а й е с о в с к а я п р о ц е д у р а м и н и м и зи
р у е т ожидаемую стоимость ошибочной классификации
(5.4.2)
К о г д а стоимость о ш и б о чн ой к л а с с и ф и к а ц и и не им еет з н а ч е
н и я , все С (1 | /) п о л а г а ю т с я р а в н ы м и и п р о ц е д у р а Б а й е с а о т н о
сит х к ^ ¿ , если
ЯЛс (х) (5.4.3)
имеет м а к с и м а л ь н о е з н а ч е н и е , г = 1, Т а к и м о б р аз о м , м и н и
м и зи р у е т с я о ж и д а е м а я вероятность ошибочной классификации
(5.4.4)
(5.4.5)
д о сти га ет м а к с и м у м а .
336 Гл. 5. Методы многомерного статистического анализа
5 . 4 . 2 . К л а с с и ф и к а ц и я в сл у ч а е п оп уляц ии
с м н о г о м е р н ы м и н о р м а л ьн ы м и ра с п ре д ел е н и я м и
В з а м е ч а н и и 5 .4 .1 .6 эт и у р а в н е н и я о т н о с и т е л ь н о к о э ф ф и ц и е н
тов а а , а 1а и к о н с т а н т ы у 1 п р и в о д я т с я в м а т р и ч н о й форме.
И т а к , в е к т о р наб л ю д ений х о т н о с и т с я к п о п у л я ц и и если з н а
ч е н и е 6, я в л я е т с я м а к с и м а л ь н ы м среди всех / = 1 к. А п о с т е
р и о р н а я в е р о я т н о с т ь (5.4.5) п р и н и м а е т вид
к
Р г ( ^ | х ) = Л -1 Е е 6/, 1 = 1 , . . . , Л. (5.4.7)
/=1
5 = ( Б К - 1) $ ) / ( £ " * - * ) • (5-4-8)
З ам е ч а н и я 5 . 4 . 1 . 1 . Н е к о т о р ы е п р о г р а м м ы в ы в о д ят на печать
таблицу результатов классификации, с о д е р ж а щ у ю ч и с л о ди
векторов x jm в ы б о р ки : и з Wj, о т н е с е н н ы х к W¡, т = 1, n¡,
i, j = 1, . .., k. З а м е т и м , что 2 í = i пи = пз — объем /- й в ы б о р к и ,
/ = 1, ... , k. С п о м о щ ь ю э т о й т а б л и ц ы м о ж н о оц е н и ть ве р о я тн о с ть
ошибочной к л а с с и ф и к а ц и и
Р г (* I Í ) ~ -ТГ> l’ Í ^ 1......... k ’ 1 ^ /■
Х о т я п ол уч ен н ы е о ц е н к и я в л я ю т с я см е щ е н н ы м и , в с л у ч а е k
п о п у л я ц и й все д р у г и е о ц е н к и э т и х в е р о я т н о с т е й тр е б у ю т с л о ж
ных вы чи сл ен ий.
2. В н е к о т о р ы х п р о г р а м м а х в ы ч и с л я е т с я т а к н а зы в а ем о е
обобщенное расстояние М ахаланобиса V — об общ ение в е л и ч и н ы D 2.
Оно м о ж ет б ы т ь и с п о л ь з о в а н о д л я п р о в е р к и г ипотезы Н0:
= ■■■ — цк. Е с л и г и п о т е з а Я 0 в е р н а , а объемы вы б о р о к щ с т р е
м я т с я к оо , то р а с п р е д е л е н и е в е л и ч и н ы V с трем и тся к %2 с р ( k — 1)
степ еням и свободы. Т а к и м о б р а з о м , п р и б л и ж е н н а я п р о в е р к а г и
потезы # 0 с ос то и т в т ом , что г и п о т е з а о т ве р га е т с я п р и %2 >
> l í - a (р (k — 1)).
3. З ам етим , ч т о п р о в е р к а г и п о т е з ы Н 0: jaj = • • • = ft* я в
л я е т с я м ногом ерны м а н а л о г о м о д н о ф а к т о р н о г о д и сп ер си о н н ого
а н а л и з а . Т е о р и я п р о в е р к и э т о й и б о л е е о б щ и х гипотез р а с с м а
т р и в а е т с я в м н о г о м е р н о м д и с п е р с и о н н о м а н а л и з е A n d e r s o n (1958),
R a o (1965). М н о г и е п р о г р а м м ы в ы в о д я т на п еч ать т а к н а з ы в а е
м у ю U -статистику, к о т о р а я я в л я е т с я точной д л я п р о в е р к и
ги п о т е зы Н0. В в и д у с л о ж н о с т и р а с п р е д е л е н и я в е л и ч и н ы U н а
п е ч а ть вы водится ее F -аппроксимация и соответствую щ ее ч и сл о
степеней свободы. Т а к о й к р и т е р и й я в л я е т с я точн ы м д л я р = 1 , 2
при лю бы х k, и л и ж е п р и k = 2 д л я л ю б ы х р.
338 Гл. 5, Методы многомерного статистического анализа
4. П р о г р а м м ы , п р е д п о л а г а ю щ и е , что все ^ п о п а р н о р а в н ы
д л я I = 1, &, м о ж н о и с п о л ь з о в а т ь и в с л у ч а е , к о г д а это у с л о
в и е не в ы п о л н я е т с я . Д л я эт о г о с л е д у е т при в ы в о д е п о с т о я н н ы х с,-
(см. п. Ь)) п р и б а в л я т ь к ним в е л и ч и н ы 1п ^ -. К о ц ен ке з н а ч е н и я
д и с к р и м и н а н т н о й ф у н к ц и и д л я к а ж д о г о в е к т о р а х 1т с л е ду ет
т а к ж е п р и б а в и т ь 1п (см. п. с)). В п. е) т р е б у е т с я п р ои зв ести
п е р е к л а с с и ф и к а ц и ю : в е к т о р х1т о т н о с и т с я к той п о п у л я ц и и , д л я
к о т о р о й м о д и ф и ц и р о в а н н а я д и с к р и м и н а н т н а я ф у н к ц и я имеет н а и
б о л ь ш е е зн а ч е н и е .
5. В этом р а з д е л е п р е д п о л а г а л о с ь , что к ^ 2 и стои м ости о ш и
б о ч н о й к л а с с и ф и к а ц и и равны. Е с л и к = 2 , то п р о д е д у р а сводится
к сравнению
р р
(Л-1 — Е @1
/=1
~Ь ^1 ^ (¡х С £¿2 “ Е
/=1
(¿2¡ X ; —|—С<) —|- 1п Оо-
причем
«/1
1 г Ч'' -1
= 1 " ‘ м( и Т Р ! 2а Мг. 1= 1 ,- .,к .
_ос,-р_
А налогично, о цен ки (5.4.9) д и с к р и м и н а н т н ы х ф у н к ц и й п р и н и
мают в и д
= ( х ^ - 1) х - 4 х ^ х г + 1п <?£,
и
И наконец, м атри чн о е выражение для У (зам е ч а н и е 5.4.1.2 )
им е е т в и д
к
V = £ Я; (х,- — х ) ' Б -1 (х, — х),
¡=1
5.4. Классификация в случае к популяций 339
г де
х = ( Е
1=1
1 1 ! «(•
/ / i=i
Н а ин туи ти вном у р о в н е в е л и ч и н у V м о ж н о и н т е р п р е т и р о в а т ь к а к
в зв е ш ен н у ю с у м м у « р асстояни й» от в е к т о р о в ср е д н и х к а ж д о й
г р у п п ы х ; до о б щ е г о в е к т о р а с р е д н и х х. ★
7. В с л у ч а е к о г д а не в ы п о л н я е т с я п р е д п о л о ж е н и е о р а в е н
ств е к о в а р и а ц и о н н ы х м а т р и ц , т. е. к а ж д а я п о п у л я ц и я Wi имеет
р а с п р е д е л е н и е N (¡it,, 2 0 Дл я <■— 1, •••, можно получить к в а
д р а т и ч н у ю д и с к р и м и н а н т н у ю ф у н к ц и ю (R a o (1965, с. 488)).
Е с л и плотности fi (х) н е и зв е ст н ы , д л я к л а с с и ф и к а ц и и в е к т о р а х
сл едует п о л ь з о в а т ь с я н е п а р а м е т р и ч е с к о й п р о ц е д у р о й (F ix , H odges
(1951, 1952)) и P a l m e r s h e i m (1970).
Таблица 5.4.1
Коэффициенты зн ач ен и й линейной дискриминантной функции
для популяции и з примера 5.4.1
Таблица 5.4.2
dx = 0 .3 3 9 % - + - • • • + 0 .1 96 х4 — 26.827. В т а б л . 5 . 4 . 2 р е з у л ь т а т о в
к л а с с и ф и к а ц и и п 13 = 3, н а п р и м е р , о зн а ч а е т , что т р о е и з д в ад ц а ти
б о л ь н ы х , п р и н а д л е ж а щ и х в ы б о р к е из п о п у л я ц и и Ws, отн о с я тс я
к W v С л е д о в а т е л ь н о , Рг (V3) = 3/20. Д л я п р о в е р к и г ипотезы Н 0:
4 x1 4x1 ^
jui = • • • = ¡ц6Л бы ло в ы чи сл ен о з н а ч е н и е F — 4.21 с 20 и
345.9 с т е п е н я м и свободы. (Зам ети м , что дро бное ч и сл о степеней
свободы п о я в и л о с ь и з -з а т о го , чго F я в л я е т с я а п п р о к с и м а ц и е й
¿ /- с т а т и с т и к и .) П о т а б л и ц е ^ - р а с п р е д е л е н и я н ах од и м f 0.999 (20,
345.9) ^ 2 .5 . С л едо вател ьн о, г и п о т е з а Н 0 д о л ж н а бы ть о т в е р г
нута при Р -< 0 .0 0 1 .
С л у ч а й о т н е с е н и я о б ъ е к т а к одной из k п о п у л я ц и й с б и н о м и а л ь
ными р а с п р е д е л е н и я м и р а с с м а т р и в а л с я в при м ере 5.3 .2 . Н у ж н о
отнести п а ц и е н т а к одной из k к а т е г о р и й б о л ь н ы х в за ви с и м о с т и
от п р о я в л е н и я р симптомов. В общем с л у ч а е т р е бу ется к л а с с и ф и
ц и р о в а т ь о б ъ е к т н а основе н а л и ч и я и л и о т с у т с т в и я р событий.
О п р е д е л и м д л я к а ж д о г о /-го с о б ы т и я , / = 1, ..., р, с л у ч а й н у ю
величину
( 1, если с обы тие / имеет место,
X 'i = [ 0,
п если собы
^ тие /• о т су тств ует. (5.4.11)
Е с л и п р е д п о л о ж и т ь н е з а в и с и м о с т ь Х ъ . . . , Х р , то совместный
з а к о н р а с п р е д е л е н и я /, (х) д л я \У£ м о ж н о з а п и с а т ь в виде
Р г ( ^ ,.|х ) 1 (5.4.14)
к 1 - Х/
т =1
П Рт'О-Рт/)
В е к т о р х относится к т а к о й п о п у л я ц и и для которой вели
чина Р г ( И Р , |х ) м а к с и м а л ь н а .
¡= 1
Р г ( Г ,|х ;
к г р х• 1— х •
V Г~[ ( (1
т= 1
Л и .
П
1/=1
1 1\ Пт' \
/ \ 1 Пт' )
пт )
1
П о с к о л ь к у п р е д п о л о ж е н и е о н е з а в и с и м о с т и симптомов на
п р а к т и к е в б о л ь ш и н с т в е с л у ч а е в н е в ы п о л н я е т с я , то, ко гд а вс е ^
р ав н ы , д л я к л а с с и ф и к а ц и и и с п о л ь з у е т с я д р у г а я п р о ц е д у р а , к о
т о р а я д л я любой в о з м о ж н о й к о м б и н а ц и и симптомов в ы ч и с л яе т
соответствую щ ую д о л ю о б ъ е к т о в в к а ж д о й вы б ор ке. Н о в ы й объект,
за д а в а е м ы й к о м б и н а ц и е й с и м п т о м о в , от н о с и т с я к п о п у л я ц и и ,
342 Гл. 5. Методы многомерного статистического анализа
Симптомы Wi
ООО 0 .1 0 0 .2 0
100 0 .1 0 0.15
0 10 0 .2 0 0 .1 0
001 0 .1 0 0.15
110 0 .2 0 0 .1 0
101 0 .1 0 0 .20
он 0 .1 0 0.05
111 0 .1 0 0.05
П р и м е р 5 .4 .2 . В этом п р и м ер е п р е д с та в л е н а г р а ф и ч е с к а я
форма б ай есо вск о й процедуры классификации. Т а к назы вае
мый н о м о гр а ф часто об л е гч а ет в р а ч а м д и а г н о с т и к у (L u s te d
(1968)).
Н а о с н о в е в е к г о р а на б л ю д е н и й х = (jclf ... , хр)' т е ч е н и я б е
р е м е н н о с т и , родов и к о р м л е н и я детей, и м е в ш и х пр и р о ж д е н и и
м а л е н ь к и й : в ес ( < 1 5 0 0 г), т р е б о в а л о с ь п р е д с к а за т ь и х п с и х о м о
то р н о е р а з в и т и е к одном у году. К а ж д а я п р е д и к т о р н а я п е р е м е н
н а я x lt i = 1, ..., р , и м е л а б и н о м и а л ь н о е р а сп р е д ел е н и е . У детей
в в о з р а с т е одного г о д а м ож н о о п р е д е л и т ь индекс п с и х ом о торн ого
р а з в и т и я ( P D I ) со гл асн о ш к а л е детского р а з в и т и я Б е й л и ( B a y le y
(1969)). О б л а с т ь зн а ч е н и й P D I б ы л а р а з б и т а на д ве части: при
P D I 5 * 85 с чи тал ос ь, ч то р е б е н о к п р и н а д л е ж и т к п о п у л я ц и и
д ет е й с н о р м а л ь н ы м р а зв и т и е м , P D I < 8 5 о п р е д е л я л п о п у л я ц и ю
W2 д е т е й с н е н о р м а л ь н ы м ил и п а т о л о г и ч е с к и м р а з в и т и е м (более
п о д р о б н о с м . A zen et al. (1979)).
Т е о р е м у Б а й е с а д л я в ы ч и с л ен и я а п о с т е р и о р н ы х в е р о я т н о с т е й
м о ж н о з а п и с а т ь с л е д у ю щ и м об разом :
* < П Рг ( * / 1wi)
P r (W, 1х) = — -------------------_
2 <7« П Рг (X, \ W m )
тшш 1 L /= 1
для 1 = 1, 2. Если в з я т ь л о га р и ф м отнош ения д в у х а п о с т е р и о р -
5.4. Классификация в случае к популяций 343
ных в е р о я т н о с т е й , то м ож но п о л у ч и т ь
z = l o g [ P r ( r 1 | x ) / P r ( V 1 |x )] =
00
J---------0.1
1---------Ü2 0.3
---------0.4
1----------05
1---------061---------G7
;---------0.S
1---------0.9 1.0 Р'
1----------1 1----------1
-СО -095 - 060 -0.37 —018 -0 0 0 10 0 37 0.60 0.95 СО /
Таблица В
Пример
Д л я и с п о л ь з о в а н и я эгой м о д е л и т р е б у е т с я с л о ж и т ь веса,
с о о т в е т с т в у ю щ и е д а н н ы м х: р а с с м а т р и в а е м о г о м л а д е н ц а , и най ти
т о ч к у , с о о т в е т с т в у ю щ у ю п о л у ч е н н о м у з н а ч е н и ю суммы н а номо-
г р а ф е рис. 5 .4 .1 . Н а п р и м е р , д л я м л а д е н ц а , д ан н ы е к о т о р о г о п р и
в е д е н ы в т а б л . В , г = 0.305. П о н о м о гр а ф у Рг(Ц7о | х) с о с т а в
л я е т о к о л о 0 .7 0 . Это б ольш е 0.5 и д л я т а к о г о р е б е н к а будет п р е д
с к а з а н о н е н о р м а л ь н о е психомоторное р а зви т и е .
к р и те р и и о д н о ф а к т о р н о г о д и с п е р с и о н н о г о а н а л и з а . В об оих
с л у ч а я х F - c т a т и c т и к a н а з ы в а е т с я « ^ - в к л ю ч е н и я » перем енны х,
не вош едш их в и с к о м о е п о д м н о ж е с т в о и «/•’-у д ал е н и я » в ы б р а н н ы х
переменных.
В сущ н о сти л о г и к а п о ш а г о в о г о а н а л и з а т а к о в а : в н а ч а л е о п р е
д ел я е т с я п е р е м е н н а я , д л я которой с р е д н и е з н а ч е н и я в й п о п у л я
ц и я х « наи более р а з л и ч н ы » . Д л я к а ж д о й перем енной р а з л и ч и е
и зм е р я е т ся с п о м о щ ью / ’’- с т а т и с т и к и о д н о ф а к т о р н о г о д и с п е р с и о н
ного а н а л и з а и в ы б и р а е т с я ( и л и включается) т а п е р е м е н н а я ,
которой с о о т в е т с т в у е т н а и б о л ь ш е е з н а ч е н и е /7. Н а к а ж д о м ш а г е
процедуры р а с с м а т р и в а е т с я у с л о в н о е распределен ие каж дой пере
менной, не в к л ю ч е н н о й в п о д м н о ж е с т в о , п р и за д а н н ы х в к л ю ч е н
ные переменных.
Из числа не в к л ю ч е н н ы х п е р е м е н н ы х о п р е д е л я е т с я п е р е м е н
ная, д ля которой с р е д н и е з н а ч е н и я у сл о вн ы х распределений
в А п о п у л я ц и я х « н а и б о л е е р а з л и ч н ы » . Э то р а з л и ч и е и зм е р я е т с я
с пом ощ ью ^ - с т а т и с т и к и о д н о ф а к т о р н о г о д и с п е р с и о н н о г о а н а л и з а .
П р оцесс з а в е р ш а е т с я , к о г д а н и о д н а из о с т а в ш и х с я п е р е м е н н ы х
не в но си т з н а ч и м о г о в к л а д а в р а з д е л е н и е & п о п у л я ц и й . К а к и
в по ш аго во й р е г р е с с и и , п о л ь з о в а т е л ь в ы б и р а е т д о пусти м ы й м и
ним ум F -включения, с о о т в е т с т в у ю щ и й м а к с и м а л ь н о м у у р о в н ю а
(стан дартное з н а ч е н и е р а в н о 4 .0 ) и м и н и м у м ^ - у д а л е н и я ( с т а н
д ар т н о е зн а ч е н и е р а в н о 3 .9 ), п р и ч е м м и н и м у м ^ - у д а л е н и я д о л ж е н
быть м еньш е, чем м и н и м у м / • '- в к л ю ч е н и я .
Р а с с м о тр и м п о ш а г о в у ю п р о ц е д у р у б о л е е подробно. П у с т ь
Хах1, ..., х?,*.1 — с л у ч а й н а я в ы б о р к а и з / = 1, ..., к. Т огда ,
и с п о л ь з у я о б о з н а ч е н и я и о п р е д е л е н и я р а з д . 5 .4 , м о ж н о о п и с а т ь
по ш а го ву ю п р о ц е д у р у с л е д у ю щ и м о б р а з о м .
Шаг 0. Д л я к а ж д о й п е р е м е н н о й X / = 1, ..., р, а н а л о г и ч н о
^ - с т а т и с т и к е д л я п р о в е р к и г и п о т е з ы Я 0: [х1;- = • • • = ¡х^ в о д н о
факторном д и с п е р с и о н н о м а н а л и з е вы чи сляется статистика F-
в к л ю ч е н и я с 6 — 1 и п — & с т е п е н я м и с во бод ы . Е с л и вс е з н а ч е
н и я / ’’-в к л ю ч е н и я м е н ь ш е п р и н я т о г о м и н и м у м а , то с ч и т а е т с я , что
н и о д н а п е р е м е н н а я н е вноси т в е с о м о г о в к л а д а в р а з д е л е н и е
популяций.
Шаг 1. П е р е м е н н а я Х ц , к о т о р о й с о о т в е т с т в у е т н а и б о л ь ш е е з н а
ч ен и е F - в к л ю ч e н и я , с ч и т а е т с я п е р в о й . Д л я к а ж д о й п о п у л я ц и и
1 = 1, о ц е н и в а е т с я коэф ф иц иент и определяется постоянная
л и н е й н о й д и с к р и м и н а н т н о й ф у н к ц и и . К р о м е того, в ы ч и с л я е т с я
т а б л и ц а р е з у л ь т а т о в к л а с с и ф и к а ц и и , ¿ /-с т а т и с т и к а и ее F -аппрок
симация. В ы ч и с л я е т с я т а к ж е з н а ч е н и е F - y д a л e н и я с /г — 1 и
п — к степенями с в о б о д ы д л я п е р е м е н н о й Х ]Ъ которое равно
з н а ч е н и ю F - в к л ю ч e н и я . З а т е м н а х о д и т с я з н а ч е н и е F -в к л ю ч e н и я
е й — 1 и п — й — 1 степ ен ям и свободы д ля каж дой из пере
346 Гл. 5. Методы многомерного статистического анализа
к а ж д о й п е р е м е н н о й , не в к л ю ч е н н о й в L. Т а к и м образом, п р о в е
р я е т с я г и п о т е з а Н 0: ¡.ii/.(o = - •• = (**/.(/), где (.1,7 .</> о б о з н а
чает среднее у с л о в н о г о р а с п р е д е л е н и я пе ре м е н н о й X j в при
ф икси ро ван н ы х з н а ч е н и я х всех п е р е м е н н ы х из L , i = 1, ..., k,
j = 1, ... , р, X j не п р и н а д л е ж и т L .
Шаги 4, 5, . . . .Ш а г 3 п о в т о р я е т с я р е к у р р е н т н о . К о г д а / - в к л ю
чен ия с т а н о в я т с я м е н ь ш е з а д а н н о г о м и н и м у м а д л я всех п е р е м е н
ных, не в к л ю ч е н н ы х в L, и л и к о г д а вс е перем енн ы е о к а зы в а ю т с я
в кл ю чен н ы м и в и с к о м о е п о д м н о ж е с т в о и зн а ч е н и е / - у д а л е н и я
стан овится м е н ь ш е з а д а н н о г о м и н и м у м а , в ы п о л н я е т с я ш а г S.
В н е к о то р ы х п р о г р а м м а х р е к у р р е н т н а я п р о ц е д у р а о с т а н а в л и
в а е т с я т а к ж е и в то м с л у ч а е , к о г д а I = m in (п г), i = 1, .. . , k.
Шсг S. Н а э т о м ш а г е д л я к а ж д о г о в е к т о р а \ lm, т = 1, ...,
i = 1, .. . , k, п р о и з в о д и т с я в ы ч и с л е н и е ап о с т е р и о р н ы х в е р о я т
ностей его п р и н а д л е ж н о с т и к п о п у л я ц и я м ..., W,.. Н а о с н о в а
нии эти х в е р о я т н о с т е й к а ж д ы й о б ъ е к т к л а с с и ф и ц и р у е т с я к а к
п р и н а д л е ж а щ и й о д н о й из п о п у л я ц и й и с о с т а в л я е т с я т а б л и ц а
результатов к л а с с и ф и к а ц и и .
О бычно по т р е б о в а н и ю п о л ь з о в а т е л я м о ж н о вы вести н а печ ать
таблицу, в к о т о р о й о то б р а ж аю т ся д ей стви я процедуры н а каж дом
ш а г е . К р о м е т о г о , н а к а ж д о м ш а г е в ы в о д я т с я сл е д у ю щ и е в е л и
чины : номер ш а г а , в к л ю ч е н н ы е и у д а л е н н ы е перем енны е, з н а ч е
ния статистик / - в к л ю ч е н и я и / - у д а л е н и я , ¿/-с та ти с ти к а и ее
/-ап п р о к с и м а ц и я .
За м е ч а н и я 5 . 5 . 1 . 1. Это з а м е ч а н и е сп р а в е д л и в о т о л ь к о д л я
с л у ч а я k = 2.
a) Д и с к р и м и н а н т н а я ф у н к ц и я (5 .3 .2 6 ) п о л у ч а ет с я к а к р а з
ность двух ди скри м и н ан тн ы х ф у н к ц и й д ля разных популяций
(см. 5.4.9), т. е . а, = а и — а г1 и (% + ¿ 2) / 2 = С 2 — Сг.
b) К а к у ж е б ы л о отмечено, / - а п п р о к с и м а ц и я с т ат и с т и к и U,
по стро енная п о q перем енны м в с л у ч а е д в у х кл а сс о в , я в л я е т с я
точной. Б ол ее т о г о , и с п о л ь з у я з н а ч е н и е / , м о ж н о п о л у ч и т ь оцен ку
расстояния М а х а л а н о б и с а D \ д л я q переменных
р = пг + п . - р - ^ 2 (Р р - Д ^>
р—Я (пх + п2) («! + п2 - 2) 4 - п ^ п р 2^
п р и в ы п о л н е н и и гипотезы Н 0 имеет р а с п р е д е л е н и е / (р —
п1 4- «г — Р — !)• Г и п о те за о т в е р г а е г с я , когда / > /! _ « (р — <7 ,
П 1 + Щ — Р —- 1)- Этот к р и т е р и й м о ж е т б ы ть и с п о л ь з о в а н в п р о
ц е д у р е о т б о р а «наилучш его» н а б о р а п е рем енн ы х. Д л я эт ого надо
в к а ч е с т в е м и н и м у м а в з я т ь м а л у ю в е л и ч и н у д л я /- в к л ю ч е н и я
( = 0 . 0 1 ) и е щ е м еньш ую д л я / - у д а л е н и я ( = 0 . 0 0 5 ) . П р и этом б у д у т
о т б р а с ы в а т ь с я т о л ь к о с и л ьн о к о р р е л и р о в а н н ы е перем енны е. З а
т е м с и с п о л ь з о в а н и е м сводной т а б л и ц ы работы п р о ц е д у р ы с л е
д у е т п р о и з в е с т и п о ш а г о в у ю п р о в е р к у ги п о тез Н 0: Д | = Ар,
<7=1, р — 1. «Н а и л у ч ш и й » н а б о р п р и з н а к о в п о л у ч а е т с я п еред
ш а г о м с п е р в ы м н е зн а чи м ы м р е зу л ь т а т о м . З ам етим , что этот к р и
т е р и й а н а л о г и ч е н п р а в и л у ос т ан о в к и , о сн о в ан н о м у н а и с п о л ь
з о в а н и и в е л и ч и н ы Я 2 в п о ш а г о в о й р ег р е с си и .
2. К а к и в сл у ч а е п о ш а го в о й р е г р е с с и и , п о л ь з о в а т е л ь м о ж ет
с а м в к л ю ч и т ь определен ны е п ерем ен н ы е в п р о ц е д у р у к л а с с и ф и
кации. П о сл е этого пош аговая п роц едура применяется к остав
шимся перем енны м.
П рим ер 5 . 5 . 1 . П о ш аго в ы й д и с к р и м и н а н т н ы й а н а л и з п ри м е
н я л с я к п о д м н о ж е с т в у р — 4 пер е м е н н ы х из п р и м ер а 5.3.3. Б ы л и
с о б р а н ы д а н н ы е о и, = 70 б о л ь н ы х из п о п у л я ц и и выживших
и о я 2 = 4 3 б о л ь н ы х из п о п у л я ц и и Ц72 у м е р ш и х . П е р е м е н н ы м и
бы ли: Х г —- с р е д н е е а р т е р и а л ь н о е д а в л е н и е (мм. р т. ст.), Х 2 —
среднее в е н о з н о е д а в л е н и е (мм. рт. ст .), Х 3 — д и у р е з (см3/ч),
Х 4 — л о г а р и ф м ин дек са об ъем а п л а з м ы (м л/кг) И с п о л ь з о в а л а с ь
п р о г р а м м а п о ш а г о в о г о д и с к р и м и н а н т н о г о а н а л и з а с м иним ум ом
/ - в к л ю ч е н и я = / 0.95 (1, оо) = 4 и д л я / - у д а л е н и я = 3 . 9 , т. е.
нем ного м е н ь ш и м , чем ве л и ч и н а п о р о г а д л я / - в к л ю ч е н и я . С о о т ве т
ственно д л я ш а г о в п р оц еду ры , о п и с ан н ы х выше, б ы ли п о л уч ен ы
сл е д у ю щ и е р е з у л ь т а т ы .
Шаг 0. / - в к л ю ч е н и я со с т еп е н я м и свободы 1 и 111 д л я к а ж д о й
пер ем енн о й с л е д у ю щ и е :
П еременная Хг Х2 Хя Л4
^-вклю чен и я 131.41 14.06 22.01 2.49
П о с к о л ь к у т р и значения / - в к л ю ч е н и я бо льш е п р и н я т о г о м и н и
мума, п е р е х о д и м к ш а г у 1.
Шаг 1. П е р е м е н н а я в ы б и р ается в качестве перв ой , п о
с к о л ь к у о н а и м е е т н аи бо л ьш ее з н а ч е н и е / - в к л ю ч е н и я . Д л я к а ж -
5.5. Пошаговый дискриминантный анализ 349
дой п о п у л я ц и и б ы л а п о л у ч е н а о ц е н к а к оэф ф и ц и ен та д и с к р и м и
нан тн ого у р а в н е н и я и п о с т о я н н о й :
щ ап с,
0.262 -11.627
УУ2 0.141 -3.383
И', \у2
И'', 60 10
Щ 8 35
Н а п е р в о м ш а г е з н а ч е н и е / - а п п р о к с и м а ц и и ¿ /-статистик и, т а к
ж е к а к и / - в к л ю ч е н и я и / - у д а л е н и я д л я Х 1г р а в н о 131.41 с ч и с
л ом степеней с в о б о д ы 1 и 111. Д л я Х 2, Х 3 и X , б ы л и в ы ч и с л ен ы
зн а ч е н и я / - в к л ю ч е н и я с 1 и П О с т е п е н я м и свободы:
П ер ем ен н ая Х3 Х4
/•■-включения 1 0 .5 5 9.52 17.35
В се о н и б о л ь ш е м и н и м у м а , п о э т о м у п е р е х о д и м к о в т о ро м у ш а г у .
Шаг 2. П о с к о л ь к у п е р е м е н н о й X 4 соо т вет с т в у е т м а к с и м а л ь н о е
зн а ч е н и е / - в к л ю ч е н и я , е е в ы б и р а ю т в ка ч е с тв е второй п е р е м е н
ной, в к л ю ч е н н о й в п р о ц е д у р у к л а с с и ф и к а ц и и . О ц е н ки к о э ф ф и
циентов д и с к р и м и н а н т н о й ф у н к ц и и и п о с т о я н н ы е д л я к а ж д о й
п о п у л я ц и и им ею т в и д
Б ы ла получена т а б л и ц а к л а с с и ф и к а ц и и
И /, \У2
63 7
\Уг 6 37
350 Гл. 5. Методы многомерного статистического анализа
И н а к о н е ц , д л я пер ем ен н ы х Х 2 и Х 3 б ы л и о п р е д е л е н ы с л едую щ и е
з н а ч е н и я / - в к л ю ч е н и я с 1 и 109 с т е п е н я м и свободы:
Переменная Х2 Хя
F -вклю чения 9.55 8.97
Ш а г 3. а) Т е п е р ь L = | Х Ь Х 4} и / = 2. П о с к о л ь к у зн а ч е н и я
с т а т и с т и к и / - у д а л е н и я д л я Х х и Х 4, а т а к ж е з н а ч е н и я / - в к л ю
ч е н и я б о л ь ш е с о о т в етству ю щ и х м и н и м у м о в , м нож ество L д о
п о л н я е т с я пе ре м е н н о й с н а и б о л ь ш и м зн а ч е н и е м / - в к л ю ч е н и я .
Т а к и м о б р а з о м , L = {Хь Х 2, Х 4) и / = 3.
Ь) О ц е н к и коэфф ициентов л и н е й н о й д и с к р и м и н а н т н о й ф у н к
ци и и: с о о т в ет с т в у ю щ и е п о с т о я н н ы е п р и в о д я т с я в следую щ ей т а б
лице:
W; ап а,2' ац с,-
Т а б л и ц а к л а с с и ф и к а ц и и имеет в и д
Wt W2
67 3
7 36
И н а к о н е ц , зн а ч е н и е с т ат и с т и к и / - в к л ю ч е н и я с 1 и 108 степеням и
с в о б о д ы д л я Х 3 р а в н о 7.49.
Ш а г 4. а) П о с к о л ь к у в с е з н а ч е н и я с т а т и с т и к / - у д а л е н и я
и / - в к л ю ч е н и я б о льш е со ответствую щ их п р и н я т ы х м иним ум ов,
им еем / = { Х ъ Х 2, Х 3, ХА] и 1 = ( .
5.5. Пошаговый дискриминантный анализ 351
Ь) Д л я к а ж д о й п о п у л я ц и и о ц е н к и коэфф ициентов д и с к р и м и
н а н тн о й ф у н к ц и и и п о с т о я н н ы е п р и в о д я т с я в сл еду ю щ ей т абл иц е:
W¡ w2
W¡ 67 3
W2 6 37
^ - а п п р о к с и м а ц и я ¿ / - с т а т и с т и к и с 4 и 108 с т еп е н я м и свободы
р а в н а 52.39. Д л я к а ж д о й п е р е м е н н о й из L зн а ч е н и я с т а т и с т и к и
F -у д ал е н и я с 1 и 108 с т е п е н я м и свободы п р и в о д я т с я в сл е д у ю щ е й
табл иц е:
Переменная Хг Х2 Х3 Х4
F -удаления 129.31 8.06 7.49 15.76
П о с к о л ь к у все з н а ч е н и я с т а т и с т и к и F -уд ал ен и я б о л ь ш е п р и н я
т о го м и н и м у м а и все п е р е м е н н ы е в о ш л и в L , с л е д у е т п е р е й т и
к ш а г ^ S.
Шаг S . « Н а и л у ч ш е е » д и с к р и м и н а н т н о е у р а в н е н и е за д а е т с я
коэф ф и ц и ен там и , п о л у ч е н н ы м и на ш а г е 4. Н и ж е п р и в о д и т с я
т а б л и ц а р е з у л ь т а т о в р а б о т ы п р о ц е д у р ы пош агового д и к р и м и н а н т -
н о го а н а л и з а .
J Переменная F
Номер и
шага Vi Vz
включаемая удаляемая включения удаления
П о с к о л ь к у 6 = 2, м о ж н о п р и м е н и т ь за м е ч а н и е 5 .5 .1 .1 . О ц е н к а
л и н е й н о й д и с к р и м и н а н т н о й ф у н к ц и и (5.3.26) п о л у ч а е т с я п о д с т а
н о в к о й к о э ф ф и ц и е н т о в и п о с т о я н н ы х , н а й денн ы х н а ш а г е 4.
Т а к и м о б р а з о м , в е к т о р н а б л ю д е н и й х относится к п о п у л я ц и и
если г = 0 .1 5 1 л :!— 0 . 1 9 1лг2 + 0 .0 0 7 х 3 + 1 3 .152х4 2 г 3 1 .6 6 8 , п р и
Чх = 7г = х/ , .
352 Гл. 5. Методы многомерного статистического анализа
F- аппрокс и мац ия
Шаг q и V F F0 .95(4 - q. 108)
В с и л у того что д л я п о л у ч е н и я т а б л и ц к л а с с и ф и к а ц и и о ж о г о в ы х
больных в м ед и ц и н е традиционно использовался пробит-
анализ (F in ney ( 1 9 7 1 ) ) , с п о м о щ ь ю п р о г р а м м ы G L IM (N e id e r
(1976)) по п о л у ч е н н ы м 6 п е р е м е н н ы м с т р о и л о с ь м н ого ф а кто рн о е
п р о б и т -у р а в н е н и е . Б ы л а п о л у ч е н а м о д е л ь ви д а Р = Ф 1 (Z),
где Z = — 3.9 + 0 . 0 3 6 (Х„ + Х 2) + 0 .5 2 Х 3 + 0 .5 6 Х 4 + 0 .0 2 8 Х 5 +
- f 0 . 4 0 X g, а Ф 1 — обратная к функции р а с п р е д ел е н и я
J f ( о, )•
М о д ель была п р и м е н е н а д ля к л а с с и ф и к а ц и и гипотетического
п а ц и е н т а 3 2 л ет с о б щ е й п л о щ а д ь ю о ж о г а 44 %, с п л ощ адью о ж о г а
третьей степени 22 % , не и м е в ш е г о д о п о л н и т е л ь н ы х о с л о ж н е н и й .
В е л и ч и н а Z р а в н а — 0 . 5 5 , и, с л е д о в а т е л ь н о , в ер о я тн о с ть ф а т а л ь
ного исхода Р р а в н а Ф 1 (— 0 . 5 5 ) = 0 .2 9 . Д л я этого б о л ь н о г о
было п р е д с к а з а н о в ы з д о р о в л е н и е .
В рабо те Z a w a c k i e t al. (1979) б ы л о п о к а з а н о , что т а к а я ш е с т и
ф акт о р н а я модель и м е е т л у ч ш у ю с п о с о б н о с т ь п р е д с к а з а н и я , чем
к л ассич еская д в у х ф а к т о р н а я .
-к Пример 5 . 5 . 3 . П р и п р и м е н е н и и м о н и то р н о й системы н а б л ю
дения б ольн о го б ы л о ж е л а т е л ь н о п р е д с к а з а т ь н а основе в е к т о р а
х = (л:0 , Х]_, . . . , х п)' и з п + 1 н а б л ю д е н и й , п о л у ч енны х в р а з н ы е
моменты вр ем ени, в ы з д о р о в е е т л и п а ц и е н т . В бай есовской п р о
цедуре д л я о ц е н к и к о в а р и а ц и о н н о й м а т р и ц ы 2 ра зм е р а (п + 1) X
X (п - f 1) и д в у х в е к т о р о в с р е д н и х (и х и ]и2 р а з м е р а (п + 1) х 1
каж ды й , нео б х о д и м ы б о л ь ш и е в ы б о р к и и з п о п у л я ц и й в ы ж и в ш и х
и у м е р ш и х п а ц и е н т о в ( з а м е ч а н и е 5 .3 .1 .4 ) . К о г д а число п в е л и к о ,
оценка п а р а м е т р о в с т а н о в и т с я н е в ы п о л н и м о й и п р и х оди тс я п о л ь
зо ваться д р у г и м и м е т о д а м и к л а с с и ф и к а ц и и .
В т а к о м с л у ч а е м о ж н о п р е д п о л о ж и т ь , ч то д л я д ан ного п а ц и е н т а
изменения в е к т о р а н а б л ю д е н и й и м е ю т т р е н д (наприм ер, л и н е й н ы й
или э к с п о н е н ц и а л ь н ы й ) и с т р у к т у р а к о в а р и а ц и о н н о й м а т р и ц ы 2
описывается п р о ц е с с о м а в т о р е г р е с с и и п е р в о г о п о р я д к а с п а р а
метром X. Т а к и м о б р а з о м , м о ж н о з н а ч и т е л ь н о у м е н ьш и т ь ч и с л о
оцениваемых п а р а м е т р о в . Н а п р и м е р , в с л у ч а е л и н е й н о го т р е н д а
вместо п -j- 1 п а р а м е т р а в е к т о р а с р е д н и х достаточно оц е н и ть д в а
п ар а м е т р а в е к т о р а к о э ф ф и ц и е н т о в ß = (ß 0, ß j ' , где ß„ — н а ч а л ь
ная т о ч к а , а ß t — н а к л о н л и н и и р е г р е с с и и , описываю щ ей т р е н д у
по врем ени t, t = 0, 1, ..., п .
В р я д е рабо т ( A z e n , A fifi ( 1 9 7 2 а, b) и Azen et al., (1975)) б ы л о
п о к а зан о , что з а м е н о й ве к т о р а н а б л ю д е н и й х векто ром ß м о ж н о
п о л у ч и ть э ф ф е к т и в н у ю п р о ц е д у р у к л а с с и ф и к а ц и и . Б о л е е т о го ,
б ы ла о б о сн о в а н а з а м е н а п а р а м е т р а а в т о к о р р е л я ц и и X нул е м , к о г д а
ее о ц е н к а у д о в л е т в о р я е т н е р а в е н с т в у | к | < 0 . 6 . Это п о з в о л я е т
в п р о ц е с с е о ц е н и в а н ия п р и м е н я т ь м е то д н аи м ен ьш и х к в а д р а т о в ,
и, т а к и м образом, р е ш а ю т с я п р о б л е м ы , с в я з а н н ы е с а в т о к о р р в '
л и р о в а н н о с ть ю д а н н ы х .
12 А. Афжфи, С. Эйзеы
$54 Гл. 5. Методы многомерного статистического анализа
ЧТО
c o v { Y iY j) = 0, I, / = 1 , . . р, I ф '], (5.6.1)
í v ( Y i) = £ в u. (5.6.3)
г=1 £=1
У (^1)= Л £ (5 -6 -4)
¿=1 /=1
^ ( ^ а ) = Л Г « й « 2 /^ / (5.6.5)
¿=1 /=1
12*
356 Гл. 5. Методы многомерного статистического анализа
р
достигала м аксим ального значения при условии £ а|у = 1
/=1
и соу (У ъ У 2) = 2 ; = 1 2 у= 1 а 1£а 2/ст(7 = 0. П е р в о е у с л о в и е об есп е
чивает единственность решения, а второе — некоррелированность
Ух и У2. Р е ш е н и е а 2 = ( а 21, ..., а 2р) ' я в л я е т с я собственн ы м в е к
тор ом м а т р и ц ы 2 , соответствую щ им в т о р о м у по в е л и ч и н е с о б с т в е н
ному з н а ч е н и ю . Это собственное з н а ч е н и е р а в н о д и с п е р с и и V (У 2),
а У 2 я в л я е т с я в т о р о й г л а в н о й к о м п оненто й п р и з н а к о в Х 1} ...,
..., Х р. П е р в ы е д в е гл а в н ы е к ом п о н е н ты о б ъ я с н я ю т 100 [V (Ух) +
+ V (У 2) ] / У пр о ц е н т о в о б щ е й д и с п е р с и и . П о с л е т о го к а к п о л у
чены У ъ . . . , Уч_1г д = 2, ... , р, н а й д е м п е р е м е н н у ю У9 =
р
= £ Яд/Х,-, т а к у ю , чтобы в е л и ч и н а
/=1
У (у ч) = И I ! а ? ;“ ?/0 «'/
¿=1/=а
Р
дост и гл а максимального значения при условии £ а 1/ = 1
/=1
и
р р
СОУ (У т , У?) = £ 1 = 0 д л я т = 1. •••.<? — 1 •
»=1 /=1
В р е з у л ь т а т е по л у ч и м а д = (а д1, ..., а 9Р) ' — собственн ы й в е к
тор м а т р и ц ы 2 , со о т вет с т в у ю щ и й у-му по ве л и ч и н е с обс тве н н ом у
зн а ч е н и ю , к о т о р о е равно д и сп ер си и V (У 9). Т а к и м о б р азо м , Уц
бу дет <7 -й г л а в н о й к о м п о н е н т ой и п е р е м е н н ы е Ух, . . . , У(1 б у д у т
о б ъ я с н я т ь 1 0 0 2 ?= 1 1 / (У,-У У п р о ц е н т о в общ ей д и с п е р с и и .
М о ж н о п р и в е с т и с л е д у ю щ у ю геом етри ческую и н те р п р ет а ц и ю
а н а л и з а г л а в н ы х ко м п о н е н т (см. рис. 5.6.1 д л я р = 2). П е р е м е н н ы е
Х ь ..., м о г у т быть п р е д с та в л е н ы к о о р д и н а т н ы м и о с я м и .
Н а ч а л о к о о р д и н а т н а х о д и т с я в то чк е ¡и = (1% , . . . , ¡л,,)'. Т а к и м
об р азо м , в р-мерном пространстве к а ж д а я р е а л и з а ц и я в е к т о р а
х = (хх, . . . , х р)' п р е д с т а в л я е т с я точкой с к о о р д и н а т а м и Х г =
= хи Х р = хр. В а н а л и з е г л а в н ы х к о м п о н е н т и щ е т с я т а к о й
поворот с и с т е м ы к о о р д и н а т , чтобы п е р е м е н н ая Ух, с о о т в ет с т в у ю
щ а я о д н о й и з н о в ы х к о о р д и н а т н ы х осей, им ела м а к с и м а л ь н у ю
д и с п е р с и ю , а п ер ем ен н ая У2, с о о т в ет с т в у ю щ а я д р у г о й оси, б ы ла
не к о р р е л и р о в а н а с У х и и м е л а бы при этом м а к с и м а л ь н у ю д и с п е р
сию . А н а л о г и ч н о п е р е м е н н а я У ,, с о о т вет с т в у ю щ а я новой к о о р д и
на т н о й оси с д-м ном ером , д о л ж н а быть не к о р р е л и р о в а н а с У 1?
У2, . . . , Уд_х и им еть п р и эт о м м а к с и м а л ь н у ю д и с п е р и с ю , <7 =
3, . . . , р. П у с т ь / (х) — ф у н к ц и я плотности н о р м а л ь н о г о р а с п р е
д е л е н и я с л у ч а й н о г о в е к т о р а X = ( Х ь ..., Хр) '; т о гд а н е р а в е н
ство / (х) < с, где с — н е к о т о р а я п о с т о я н н а я , о п р е д е л я е т о б л а с т ь
5.6. Анализ главны х компонент 357
а 1| '*"|+ а12^2
4- а 12Х 2 о п р е д е л я е т н а п р а в л е н и е б о л ь ш о й оси э л л и п с а , а в т о р а я
главная компонента У 2 = —)- а 22Х 2 — м ал ой оси.
К о г д а м а т р и ц а 2 н е и з в е с т н а , м о ж н о п р е д п о л о ж и т ь , что и м е
ется с л у ч а й н а я в ы б о р к а х ? * 1, ..., х „ х 1 , по к о т о р о й 2 о ц е н и в а
ется в ы б о р о ч н о й к о в а р и а ц и о н н о й м а т р и ц е й 8 . Д л я п о л у ч е н и я
оценок главных ком понент с л е д у е т п р и м е н и т ь о п и с ан н у ю вы ш е
пр о ц е д у р у к м а т р и ц е »5. В р е з у л ь т а т е п о л у ч а т с я о ц е н к и а (7 к о э ф
ф ициентов сб; у, г , / = 1, ..., р. О ц е н к о й ^-й г л а в н о й к ом п он ен ты
р
будет вектор Уд = £ ад,Х,-, где а ? = (ад1, ..., адр)' есть
/=1
^-й с о б с т в е н н ы й в е к т о р м а т р и ц ы ¿7 = 1 , .. . , р. П р и геом е тр и ч е
с ко й и н т е р п р е т а ц и и с л е д у е т з а м е н и т ь выборочными
ср едн им и х г , . . . , х„.
З а м е ч а н и я 5 . 6 . 1 . 1. Е с л и п е р е м е н н ы е Х ъ ..., Х р имеют с о в
м естное н о р м а л ь н о е р а с п р е д е л е н и е , т о г л а в н ы е компоненты в з а
им но н е з а в и с и м ы .
2. Д л я л ю б ы х д в у х н е р а в н ы х : с о б с т в е н н ы х зн а ч е н и й V (У ,)
и V ( У ;) с о о т в е т с т в у ю щ и е с о б с т в е н н ы е в е к т о р ы о б р а з у ю т п р я м о й
уго л . Это с в о й с т в о н а з ы в а е т с я ортогональностью и в ы р а ж а е т с я
358 Гл. 5. Методы многомерного статистического анализа
с л е д у ю щ и м и с о о т н о ш е н и я м ! : Ър т =\ а 1та !т = 0 , t , / = 1 , р,
i ф /. Е с л и ж е д в а собственны х з н а ч е н и я р а в н ы , то с о о т в е т с т в у
ю щ и е с о б с т в е н н ы е в е к т о р ы м о ж н о в ы б р а т ь т а к , что и о н и б у д у т
о р т о г о н а л ь н ы . Т а к и м об р азо м , можно с ч и т а т ь , что р г л а в н ы х
к о м п о н е н т в з а и м н о о р т о го н а л ь н ы .
3. Д л я п о л у ч е н и я г л а в н ы х ко м п о н е н т м о ж н о и с п о л ь з о в а т ь
вм есто к о в а р и а ц и о н н о й м а тр и ц ы к о р р е л я ц и о н н у ю . Д е й с т в и т ел ь н о ,
к о г д а р п е р е м е н н ы х и зм е р я ю т с я в р а з л и ч н ы х ед и н и ц а х , не и м е ю
щ и х м е ж д у с о б о й ни чего общего, л и н е й н ы е к о м б и н ац и и п е р е м е н
н ы х б ы в а е т т р у д н о и н т е р п р е т и р о в а т ь . В этом с л у ч а е м о ж е т помочь
с т а н д а р т и з а ц и я к а ж д о й перем енн ой, т. е. зам ен а X ,■ перем енн ой
Z i = (Х[ — р) сг,- ил и Zt = (Xi — г ) s,-, i 1 р,
п о с к о л ь к у в е л и ч и н а Z, б ез р а з м е р н а . Д а л е е сл е дуе т провести
а н а л и з с т р у к т у р ы зави си м о сти п е р е м е н н ы х Z ,, . . . , Zp, к о т о р а я
з а д а е т с я к о р р е л я ц и о н н о й м атри ц ей п е р е м е н н ы х Х и .. . , Х Р. З а
м ети м , ч т о п р и э т о м о б щ а я д и с п е р с и я V р а в н я е т с я ч и сл у п е р е м е н
н ы х р. В о б щ е м с л у ч а е гл а в н ы е ком п о н ен ты , п о л у ч а ем ы е по к о р
р е л я ц и о н н о й м а т р и ц е , о т л и ч н ы о т г л а в н ы х ко м п он ен т к о в а р и а ц и
о н н о й м а т р и ц ы . Н а с а м о м д ел е в с я к о е л и н е й н о е п р е о б р а з о в а н и е
и с х о д н ы х п е р е м е н н ы х п р и в о д и т к новым г л а в н ы м ком п онентам .
4. К о р р е л я ц и я м е ж д у перем енн ой X.i и г л а в н о й к о м п о н е н т ой
Y,- з а д а е т с я в е л и ч и н о й а п [ V (Y , ) ] 1111а1У где 0 г — с т а н д а р т н о е о т
к л о н е н и е п е р е м е н н о й X t . С л е д о в а т е л ьн о , д л я с р а в н е н и я в к л а д о в
п е р е м е н н ы х X lt . . . , Х р в Y/ с л е д у е т с р а в н и т ь в е л и ч и н ы а /г/а,-,
/= 1 , р . К о г д а и зв естна к о р р е л я ц и о н н а я м а т р и ц а , достаточн о
с р а в н и т ь к о э ф ф и ц и е н т ы а /Ч-. В этом с л у ч а е самый б о льш о й к о э ф
ф и ц и е н т п о к а з ы в а е т , к а к а я п е р е м е н н ая в н е с л а н а и б о л ь ш и й в к л а д
в /-ю г л а в н у ю компоненту.
5. В п е р в ы е а н а л и з г л а в н ы х к о м п о н е н т п о я в и л с я в работе
P e a r s o n (1901). Т а м р е ш а л а с ь з а д а ч а н а х о ж д е н и я п ря м и й , с ум м а
к в а д р а т о в п е р п е н д и к у л я р о в на к о т о р у ю из т о ч е к -р е а л и з а ц и й
в е к т о р а н а б л ю д е н и й б ы л а бы м и н и м а л ь н а . Р е ш е н и е м о к а з а л а с ь
п р я м а я , п р о х о д я щ а я ч ерез к о н е ц в е к г о р а ср е д н и х (xlt ..., х р)
и т о ч к у (ап , ... , а 1Р), ко о р д и н а ты которой равны о ц е н к а м с о о т
в е т с т в у ю щ и х коэф ф и ц и ен тов перво й г л а в н о й ком поненты .
С л е д у е т з а м е т и т ь , ч то г л а в н ы е к ом п он ен ты д а ю т эконом ию
т о л ь к о в о п и с а н и и г р у п п ы п е р е м е н н ы х , т а к к а к д л я о пр ед ел ен и я
з н а ч е н и й г л а в н ы х к о м п о нент, с о о т в ет с т в у ю щ и х р е а л и з а ц и и х =
= (х и . . . , Хр) ' , н ео б х о д и м о и з м е р я т ь все р п р и з н а к о в . Вместе
с т е м п р о ц е д у р а п о ш а г о в о го д и с к р и м и н а н т н о г о а н а л и з а д е й с т в и
т е л ь н о у м е н ь ш а е т ч исло перем енны х, зн а ч е н и я котор ы х надо
определять.
Таблица 5.6.1
Коэффициенты первы х пяти главных компонент для примера 5.6. 1
Переменная 1 2 3 4 5
14 п е р е м е н н ы х : в о з р а с т , а р т е р и а л ь н о е и ве н о зн о е д а в л е н и я , к р о
в оток, ч а с т о т а с е р д е ч н ы х с о к р а щ е н и й , ... (табл. 5.6.1). Ч е т ы р н а д
ц ать г л а в н ы х к о м п о н е н т о п р е д е л я л и с ь п р о г р а м м о й , и с п о л ь з у ю
щ ей в к а ч е с т в е и схо д но й и н ф о р м а ц и и к о р р е л я ц и о н н у ю м а тр и ц у .
Б ы л и п о л у ч е н ы с л е д у ю щ и е с о б с т в е н н ы е зн а ч е н и я :
Компонента 1 2 3 4 5 6 7
Собственное значение 3.876 3.159 1.379 1.234 1.102 0.968 0.730
Компонента 8 9 10 11 12 13 14
Собственное зн ачен и е 0.535 0.486 0.270 0.141 0.079 0.022 0.018
П о с к о л ь к у о б щ а я д и с п е р с и я V р а в н а 14 (сум м е с о б с т в е н н ы х
зн а ч е н и й ), п е р в а я к о м п о н е н т а о б ъ я с н я е т 100 (3.876)/14 = 27.7 %
всей д и с п е р с и и , в т о р а я 1 0 0 (3 .1 5 9 )/1 4 = 2 2.6 % и т. д. Д о л я о б
щей д и с п е р с и и , н а к о п л е н н а я с о о т в ет с т в у ю щ и м ч ислом п е р в ы х
г л а в н ы х к о м п о н е н т , п р и в о д и т с я в с л е д у ю щ е й т абл иц е:
Число компонент 1 2 3 4 5 6 7
Н акоп ленн ая доля 0 .2 8 0.50 0.66 0.69 0.77 0.84 0.89
Число компонент 8 9 10 11 12 13 14
Н акоп ленн ая доля 0 .9 3 0.96 0.98 0.99 1.00 1.00 1.00
Д л я и л л ю с т р а ц и и п р е д п о л о ж и м , что 0 .7 7 — д о ст а т очн ая д о л я
д и с п е р си и д л я о п и с а н и я с т р у к т у р ы и сх од н ы х перем енн ы х. Т о г д а
п е р в ы е п я т ь г л а в н ы х ком п о н е н т д а ю т д о ст а т о ч н о хо р о ш ее п р е д с т а в
л ен и е об э т и х п е р е м е н н ы х . К о эф ф и ц и е н т ы ац, г = 1, 5,
/ = 1, ... , 14, п р и в е д е н ы в т а б л . 5 .6 .1 . С л е д о в а т е л ь н о , п е р в а я
к о м п о н ен т а и м е е т вид: = — 0.0206 (возраст) + ... — 0 .4 42 3
360 Гл. 5. Методы многомерного статистического анализа
в ы б е р е м п е р е м е н н ы е , имею щ ие коэф ф и ц и ен ты к о р р е л я ц и и с г л а в
н ы м и к о м п о н е н т а м и по абсолю тн ой в е л и ч и н е ^ 0 . 4 . Н а п р и м е р ,
[V (З ^ ) ] 1 / 2 = ( 3 .8 7 6 ) 1/2 = 1.97 и п е р е м е н н а я , с о о т в етству ю щ ая
к о л и ч е с т в у г е м о г л о б и н а в кров и , имеет с п е р в о й г л а в н о й ком
п о н е н т о й У х к о э ф ф и ц и е н т к о р р е л я ц и и по модулю , р а в н ы й
| 1 . 9 7 (— 0 .4 4 6 7 ) | = 0.8 8. Семь п е рем енн ы х, пом еч енны е в пе р в о м
с т о л б ц е т а б л и ц ы н о м ерам и в к р у ж о ч к а х , у д о в л е т в о р я ю т п р а в и л у
о т б о р а . А н а л о г и ч н о , ш ес т ь п е р е м е н н ы х , пом е ч ен н ы е во в т о р о м
с т о л б ц е , им ею т к о э ф ф и ц и е н т ы к о р р е л я ц и и с У2, п р е в о с х о д я щ и е
0 .4 и т. д . Х а р а к т е р пом еченны х п е р е м е н н ы х п о д с к а зы в а е т ин те р
п р е т а ц и ю к а ж д о й ком поненты . Уъ н а п р и м е р , м о ж н о с ч и т а т ь
к о м п о н е н т о й , х а р а к т е р и з у ю щ е й с ос тав к р о в и , У., — д а в л е н и е
и к р о в о т о к , У3 — в о зр а с т , К 4 — д и у р е з , У 5 — э р и т р о ц и т а р н ы й
индекс.
^ 1 = 2 « ! / * / , • • ■, Ур = £ а Р1Х г (5.7.1)
/=1 у=1
Э ти п е р е м е н н ы е н е к о р р е л и р о в а н ы и у п о р я д о ч е н ы по уб ы ван ию
д и с п е р с и и V ( У ,), I = 1, . .. , р. К р о м е т о г о , о б щ а я д и с п е р с и я V
н е м е н я е т с я в р е з у л ь т а т е п е р е х о д а ог пер е м е н н ы х Х х......... Х р
к У 1 , .. . , Ур, т. е.
П р е о б р азу е м т е п е р ь с и с т е м у ( 5 . 7 . 1 ) т а к , чтобы к а ж д а я из и с х о д
ных п е р ем е н н ы х б ы л а в ы р а ж е н а л и н е й н о й к о м б и н ац и е й г л а в н ы х
компонент:
= !■ Р-1 / К/ , . . . , * „ = £ (5.7.3а)
/=г /=1
г д е ( 5 , / — нек о тор ы е п о с т о я н н ы е , г, / = 1, ... , ¿7 . М о ж н о п о к а з а т ь ,
что р (/ = «/,- д л я г, / = 1 , . . . , р и
* 1 =
Г « л К / , ... , = £ а ,Л '. (5 .7 .ЗЬ)
/=1 /=1
И з этой системы, н а з ы в а е м о й м о д е л ь ю г л а в н ы х ком п онент, с л е
д у ет, ч то
р
= £ <*кУ (Ук) а * /, » '# /, (5.7.4)
к= 1
Т е п е р ь , м о ж н о за п и с а т ь ф а к т о р и з а ц и ю д и с п е р с и й и к о в а р и а ц и й
и с х о д н ы х пер е м е н н ы х в виде
Оц = * а Л д Н--------Ь КтК-т, i Ф /, (5.7.8)
°!t = ~h ' • • + X"im ~Ь т £. i, j = I , р . (5.7.9)
Эти ф о р м у л ы — а н а л о ги соотнош ений (5.7.4) и (5.7.5.). В е л и ч и н а
где
¥ рх1 = (Уи . . . , У Р)', Х р х 1 = ( Х г ......... Х р)', Архр = ( « , - , ) .
Т а к и м о б р а з о м , м о д е л ь г л а в н ы х к о м п о н е н т з а п и с ы в а е т с я в виде
X. = ВУ,
где Врхр = А~* = А ', п о с к о л ь к у м а т р и ц а А о р т о г о н а л ь н а . К о
вариационную м а т р и ц у представим как
Е = А'УА,
где
У(Уг) о О
\р*р — О У(Уг) о
о О ИЛ)]
Т1 0 ■ • о"
•р>* р _ 0 т2 ■ • 0
0 0 •• V
.
5 .7 .1 . О п р е д е л е н и е г л а в н ы х факторов
В о т л и ч и е о т п р е д ы д у щ е г о р а з д е л а , где з а д а ч а с н а ч а л а р а с с м а т р и
в а л а с ь в т е р м и н а х п а р а м е т р о в п о п у л я ц и й и т о л ь к о потом в в о д и
л и с ь в ы б о р о ч н ы е о ц е н к и , в э т о м р а з д е л е с р а з у п р е д п о л а г а ет с я
РХ 1
наличие с л у ч а й н о й в ы б о р к и х р из м но го м ер ного
нормального р а сп р ед ел ен и я с в е к т о р о м с р е д н и х ¡црх 1 = ( щ , ...
..., р с) ' и к о в а р и а ц и о н н о й м а т р и ц е й 2 рхр = (ст£у) . П у с т ь Зрхр =
= (в,-;) — в ы б о р о ч н а я к о в а р и а ц и о н н а я м а т р и ц а и = (гц) —
в ы б оро чн ая к о р р е л я ц и о н н а я м а т р и ц а , где г1;- =
/, / = 1, ..., р.
П е р в о й з а д а ч е й ф а к т о р н о г о а н а л и з а я в л я е т с я о п р е д е л е н и е по
м а тр и ц е 8 или К о ц е н о к ф а к т о р н ы х н а г р у з о к Х ц и о ц е н о к /,•
364 Гл. 5. Методы многомерного статистического анализа
с п е ц и ф и ч е с к и х д и с п е р с и й тг, г = 1, ..., р , j = 1, т. С л е д у е т
з а м е т и т ь , ч т о , к а к п р а в и л о , пр ед по ч тен ие о тдается м атри ц е R,
п о с к о л ь к у и с с л е д о в а т е л и п р е и м у щ е с т ве н н о р а б о т а ю т со с т а н д а р т и
зо в а н н ы м и п е р е м е н н ы м и (см. з а м е ч а н и е 5 .6 .1 .3 ).
К а з а л о с ь бы, ч то д л я о п р е д е л ен и я у п о м я н у т ы х о ц е н о к т е о р е
т и ч е с к и о п р а в д а н н о п р и м ен е н и е метода н а и б о л ь ш е го п р а в д о п о
д о б и я . О д н а к о эт о т метод с л о ж е н д л я р е а л и з а ц и и на Э В М и п о э
т о м у он не п о л у ч и л ш и р о к о г о р а с п р о с т р а н е н и я . С у щ е с т в у е т р я д
м е т о д о в , п р и м е н и м ы х на н а с т о л ь н ы х к а л ь к у л я т о р а х , самый и з
в е с т н ы й и з к о т о р ы х — центроидный метод. К р о м е т о го , имеется
групповой центроидный метод, множественный групповой метод,
мет од сокращ ения ранга, метод ортогонализации, методы типа
метода Я к о б и , методы сокращения порядка. И х о п и с ан и е м ож н о
н а й т и в р а б о т е H o r s t (1965).
С п о я в л е н и е м Э В М чащ е всего с тал и с п о л ь з о в а т ь с я метод оп
ределения гл а вн ы х факторов, к отор ы й прим еним к а к к в ы борочны м
к о в а р и а ц и о н н ы м , т а к и к о р р е л я ц и о н н ы м м а т р и ц а м . В этом методе
п р е ж д е в с е г о о п р е д е л я ю т с я оценки р г л а в н ы х ком понент
С о г л а с н о м е т о д у о п р е д е л е н и я г л а в н ы х ф а к т о р о в , в ка ч е с тв е о б
щ и х ф а к т о р о в б ер ется т п е р в ы х г л а в н ы х компонент, в звеш ен ны х
следую щ им образом:
О ц е н к а м и ф а к т о р н ы х н а г р у з о к с л у ж а т вел ич ины
1ц = a. а [V (Y 7)]1/2, 1 = 1,...,р, j —I т , (5.7.13)
а о ц е н ки с п е ц и ф и ч е с к и х ф а к т о р о в з а д а ю т с я р а в е н с т в а м и
р
<?/ = 1 а - ц У I = 1, • • •, р. (5.7.14)
/=т-|-1
5.7. Ф акторный анализ 365
Д л я р е ш е н и я этой з а д а ч и с у щ е с т в у ю т с п е ц и а л ь н ы е п рогр а м м ы .
В ка ч е с тв е и с хо д н ой и н ф о р м а ц и и и с п о л ь з у е т с я 1) ч и с л о о б щ и х
ф а к т о р о в , 2 ) вид м а т р и ц ы , к к о т о р о й с л е д у е т при м ен ить ф актор-
цый а н а л и з , 3) о ц е н к и о б щ н о с т е й и м а к с и м а л ь н о е ч и сл о и т е р а ц и й
д л я о п р е д е л е н и я о б щ н о с т е й . Д р у г и е в о зм о ж н о с т и з а д а н и я в х о д
ных п а р а м е т р о в р а с с м а т р и в а ю т с я в с л е дую щ ем р а зд ел е . Н и ж е
опи сываю тся н е к о т о р ы е п о д р о б н о с т и и с п о л ь з о в а н и я вх од но й и н
ф орм ац ии.
1) Ч и с л о о б щ и х факторов о п р е д е л я е т с я целым числ ом т
или п о с т о я н н о й с. В по сл ед нем с л у ч а е т п о л а г а е т с я р а в н ы м ч и с
лу с обств енн ы х з н а ч е н и й , п р е в о с х о д я щ и х с.
2) Ф а к т о р н ы й а н а л и з м о ж н о п р и м е н я т ь к а) к о в а р и а ц и о н н о й
м атр и ц е , Ь) к о в а р и а ц и о н н о й м а т р и ц е отно с и т е л ьн о н а ч а л а к о о р
д инат, с) к о р р е л я ц и о н н о й м а т р и ц е , с1 ) к о р р е л я ц и о н н о й м а тр и ц е
отно сител ьно н а ч а л а к о о р д и н а т и л и е) м а т р и ц е ф а к т о р н ы х н а г р у
зок .
3) Н а п о м н и м , ч т о в а н а л и з е г л а в н ы х ком п о нент с о х р а н я е т с я
д и с п е р с и я , с о д е р ж а щ а я с я в о б щ и х ф а к т о р а х (г л а в н ы х ко м п он ен
т ах). В ф ак т о р н о м а н а л и з е ч а с т о т р е б у е т с я п о л у ч и т ь оцен ки об-
р
щ и х ф ак т о р о в , с о х р а н я ю щ и е о б щ н о с т ь 2 ] Щ, ил и всю д и сперсию
¿=1
общ их факторов. Э т о н у ж н о , н а п р и м е р , д ля прилож ений в пси
х о л о г и и и в з а д а ч а х , с в я з а н н ы х с оп ре д е л ен и е м к у л ь т у р н о г о
у р о в н я . Поэтому п о л ь з о в а т е л ь м о ж е т о п р е д е л и т ь н а ч а л ь н ы е оцен ки
общ н остей вс е х и с х о д н ы х п е р е м е н н ы х и м а к с и м а л ь н о допустим ое
366 Гл. 5. Методы многомерного статистического анализа
З а м е ч а н и я 5 .7 . 2 . 1. П р и о п р е д е л ен и и ч и с л а т общ их ф а к т о
р о в п о л ь з о в а т е л ь м о ж е т р у к о в о д с т в о в а т ь с я , н а п р и м е р , с л еду ю
щими кри тери ям и .
a) Ч и с л о с у щ е с т в е н н ы х ф а к т о р о в м о ж н о о ц е н и т ь из с о д е р ж а
тельны х соображ ений.
b) П р и и с п о л ь з о в а н и и о бы чной к о р р е л я ц и о н н о й м а т р и ц ы р е к о
м е н д у е т с я в ка ч е с тв е т б р а т ь ч и с л о собственн ы х зн а ч е н и й , б о л ь
ш и х л и б о р а в н ы х е ди ниц е.
c) К а к и в а н а л и з е г л а в н ы х ком п онент, м о ж н о в ы б р а т ь число
ф а к т о р о в , о б ъ я с н я ю щ и х о п р е д е л ен н у ю ч асть общей дисперсии ,
и л и с у м м а р н о й общности.
2 . С т а т и с т и ч е с к и е и с с л е д о в а н и я п о к а зы в а ю т , что д и а г о н а л ь
ны е э л е м е н т ы и сх од но й м а т р и ц ы м енять не р е к о м е н д у е т с я . О д н а к о
е сл и т р е б у е т с я о став и ть с у м м а р н у ю общ ность неи зм ен н о й , к а к
п р а в и л о , в к а ч е с т в е о ц е н о к д и а г о н а л ь н ы х эл е м е н т о в м а тр и ц ы и с
п о л ь з у ю т с я к в а д р а т ы м н о ж е с т в е н н ы х коэф ф иц иентов к о р р е л я ц и и ,
а д л я к о в а р и а ц и о н н о й м а т р и ц ы — д и с п ер с и и , по л у ч е н н ы е в р е
зу л ьтате регрессии.
3. С л е д у е т п о м н и г ь, ч т о в зав и си м о с т и от в ы б о р а исходной
м атрицы м о г у т получаться различны е факторы.
4. З а м :е т и м , что, есл и пе р е м ен н ы е Х г- с т а н д а р т и з о в а н ы (т. е,
и с п о л ь з у е т с я м а т р и ц а Я), вы борочны ми к о р р е л я ц и я м и м е ж д у Х 1
и будут
с о г г /=■/) = 1ф £ ] = 1.......... р, / =;1
С л е д о в а т е л ь н о , д л я и н т е р п р е т а ц и и к а ж д о г о ф а к т о р а имеет смысл
п о л ь з о в а т ь с я п е р е м е н н ы м и с о т н о си т е л ьн о б о л ь ш и м и по абсолю т-
Таблица 5.7.1
ной в е л и ч и н е н а г р у з к а м и , т а к к а к о н и б о л ь ш е в с е г о к о р р е л и р о в а н ы
с этим ф актором.
П р и м е р 5 . 7 . 1 . Б ы л и с обр ан ы д а н н ы е о р — 13 п о к а з а т е л я х
д л я 113 б о л ь н ы х п р и и х п о с т у п л е н и и в о т д е л е н и е ин тенсивной
т е р а п и и , н а х о д я щ и х с я в к р и т и ч е с к о м со с тоя н и и . В ч и с л о п о к а з а т е
л е й в х о д и л и п е р в о н а ч а л ь н ы е и зм е р е н и я а р т е р и а л ь н о г о и в е н о з
н о г о д а в л е н и й , к р о в о т о к а , ч асто ты с ер деч н ы х с о к р а щ е н и й и о б ъ е
м ов с о с т а в л я ю щ и х к р о в и (табл. 5 .7 .1 ). Д л я о п р е д е л е н и я гл а вн ы х
ф акто р о в про гр ам м а ф акторного анали за применялась к выбороч
н о й к о р р е л я ц и о н н о й м а тр и ц е . Б ы л и р а с с м о тр е н ы сл е д у ю щ и е с л у
ч аи .
П р и м е р 5 . 7 . 1 а . Д и а г о н а л ь н ы е элем енты к о р р е л я ц и о н н о й м а
т р и ц ы бы ли о с т а в л е н ы б е з изм ен ен и й , а д о п у сти м о е ч и с л о и т е р а
ц и й з а д а в а л о с ь р а в н ы м еди ниц е. С оо тв е тс тв ен н о г л а в н ы м к о м п о
н е н т а м б ы л и п о л у ч е н ы с л е д у ю щ и е собственн ы е з н а ч е н и я :
К ом п онен та 1 2 3 4 5 6 7
С обственное значение 3.875 2.980 1.269 1.233 1.095 0.766 0.711
К ом п онен та 8 9 10 11 12 13
С обственное значение 0.507 0.290 0.150 0.084 0.023 0.019
Н а к о п л е н н ы е д о л и с у м м а р н о й д и с п е р с и и п о с о о т в ет с т в у ю щ и м к о м
п о н ен там имеют вид
К ом п онен та 1 2 3 4 5 6 7
Н ак о п л ен н а я д о л я 0.30 0.53 0.62 0.72 0.80 0.86 0.92
К ом п онен та 8 9 10 И 12 13
Н ак о п л ен н ая д о л я 0.96 0.98 0.99 0.99 1.00 1.00
Таблица А
Н агрузки для ф акторов 1— 3
Переменная 1 2 3
1 БР 0 .2 1 0 .8 3 ® - 0 .2 2
2 М АР 0.33 0 .9 0 ® - 0 .1 3
3 НЯ 0.05 -0 .0 3 0 .5 9 ®
4 ВР 0 .4 5 ® 0.83 :> -0 .0 4
5 М УР - 0 .0 7 —0.18 - 0 .3 5
6 Ь (С 1) -0 .7 0 © 0.33 -0 .1 0
7 Ь (А Х ) 0.6 1 ® -0 .4 4 (1 ) -0 .4 2 ®
8 Ь (М С Т ) 0.7 1 ® -0 .4 3 ® -0 .2 6
9 иО - 0 .1 3 0 .31 0.18
10 Ь(Р,/ 1 ) -0 .6 1 © -0 .0 3 - 0 .5 2 ®
п ь ( а с 1) 0 .4 0 ® 0.03 -0.32
12 ЩЬ 0.87® - 0 .0 0 0.15
13 На 0.88® -0.01 0.13
Пример 5 . 7 . 1Ь. В д а н н о м с л у ч а е , с о г л а с н о за м е ч а н и ю 5 .7 .2 .1 ,
в ы б и р а ю т с я о б щ и е ф а к т о р ы , с о о т в е т с т в у ю щ и е собственны м з н а
ч ен и я м , б о л ь ш и м л и б о р а в н ы м е д и н и ц е . И з а н а л и з а с о бств енн ы х
з н а ч е н и й , п р и в е д е н н ы х в п р и м е р е 5.7 .1 а, видно, что т = 5.
П е р в ы е т р и ф а к т о р а , т а к и е ж е , к а к и в преды дущ ем прим ере.
Н а г р у з к и 4 -г о и 5-го ф а к т о р о в п р и в о д я т с я в т а б л . В. Е с л и в з я т ь
в кач естве п о р о г а г = 0 .4 , то 4-й ф а к т о р б у д е т з а в и с е т ь г л а в н ы м
Таблица В
Н агрузки для факторов 4—5
Переменная 4 5
1 БР 0.15 -0 .0 9
2 МАР 0.14 -0 .0 9
3 НЯ 0 .4 8 ® 0.33
4 ЛЭР 0.13 -0 .0 7
5 МУР 0.71 ф -0 .0 3
6 Ь(С1) - 0 .0 6 0.34
7 Ь(АТ) - 0 .1 2 -0 .2 0
8 ММ СТ) 0.05 -0.21
9 ио - 0 .5 9 ® -0 .2 2
10 Ь(РУ1) - 0 .0 7 0.31
11 МЯС1) - 0 .2 3 0.69®
12 Н 8Ь - 0 .0 9 0.26
13 на - 0 .0 8 0.26
370 Гл. 5. Методы многомерного статистического анализа
о б р а з о м от частоты сердечны х с о к р а щ е н и й , в е н о зн о го д а в л е н и я
и д и у р е з а , а 5-й ф а к т о р — от эр и т р о ц и т а р н о г о и н д е к с а . З а и с к л ю
ч е н и е м п я т о г о ф а к т о р а все еще т р у д н о и н т е р п р е т и р о в а т ь п о л у ч е н
ны е р е з у л ь т а т ы .
О ц е н к и о бщ н остей д л я д в у х с л у ч а е в , при в еден н ы х вы ш е,
с о д е р ж а т с я в т а б л . С. З а м е т и м , что пр и т = 3 п ерем ен н ы е 5,
Таблица С
Оценки общностей
Переменная т= 3 тп — 5
1 БР 0.87 0.90
2 М АР 0.95 0.97
3 НЛ 0.37 0.71
4 ЮР 0.91 0.93
5 МУР 0.17 0.67
6 Ь(С1) 0.62 0.74
7 НАТ) 0.76 0.81
8 Ь(М СГ) 0.81 0 .8 6
9 ио 0.15 0.55
10 ЦРУ1) 0 .6 6 0.76
11 ьги а) 0.27 0.80
12 н вь 0.79 0.87
13 н а 0.80 0.87
Таблица О
Общие результаты
Фактор
Множественный Оценки
Переменная 1 2 3 Я2 общностей
х о ж и м и на с о о т в е т с т в у ю щ и е ф а к т о р ы из р а с с м о т р е н н ы х р а н е е
с л у ч а е в , д л я т р е т ь е г о ф а к т о р а эт о неверно. О ц е н к и общ ностей
в целом м ен ьш е, чем при и с п о л ь з о в а н и и просто к о р р е л я ц и о н н о й
м а три ц ы .
5 .7 .2 . Вращ ения ф акторов
С ледую щ и м ш а г о м п о с л е о п р е д е л е н и я ф а к т о р н ы х н а г р у з о к я в л я
ется и н т е р п р е т а ц и я к а ж д о г о ф а к т о р а . Д л я этого м о ж н о в о с п о л ь
зо в а т ьс я неоднозначностью определения факторов. П о л у ч е н н ы е
ф акт о р ы р[П)......... м о ж н о зам енить их линейными ком бина
циям и Р г, . . . , ^ т , к о т о р ы е в з а и м н о н е к о р р е л и р о в а н н ы и имеют
единичны е д и с п е р с и и . Т а к и м о б р а з о м , имеется бесконеч ное м но
ж е с т в о н а б о р о в ф а к т о р о в , у д о в л е т в о р я ю щ и х д а н н о й модели.
П роцедура п олучения н о в о г о н аб о р а факторов назы вается ортого
н ал ьн ы м в р а щ е н и е м ф а к т о р о в . П о с л е в р а щ е н и я м одель м о ж ет бы ть
з а п и с а н а в вид е
т
* 1 = 1 ¿ = 1 ........ Р, (5-7.19)
/=1
где п о с т о я н н ы е Сц р а в н ы н а г р у з к а м новых ф а к т о р о в . С л е д у е т
за м е ти ть , что в р е з у л ь т а т е о р т о г о н а л ь н о г о в р а щ е н и я ф а к т о р о в
общ ность к а ж д о й и с х о д н о й п е р е м е н н о й Х 1 ост ае т с я без и з м е н е н и я ,
т. е.
т т
}1\ = Г СЬ = I 1ф 1 = 1 , . . . , р. (5.7.20)
/=1 /=1
372 Гл. 5. Методы многомерного статистического анализа
Постоянные
/72
г д е qtij — п о с т о я н н ы е , k = \ , ..., т, / = 1, т. Д л я о б
л е г ч е н и я и н т е р п р е т а ц и и ф а к т о р о в эти п о с т о я н н ы е вы б и р а ю т с я
т а к , чтобы р е з у л ь т и р у ю щ и е н а г р у з к и им ели простую структуру.
Г р у б о г о в о р я , с т р у к т у р а ф а к т о р н ы х н а г р у з о к счи тается простой,
к о г д а б о л ь ш и н с т в о и з Сц не с л и ш к о м с и л ьн о о т л и ч а е т ся от н ул я
и л и ш ь н е к о т о р ы е из них им ею т о т н о с и т е л ьн о б о л ь ш и е зн а ч е н и я .
Ц е л ь ю проц едуры вращ ен ия является предсгавление каждой
и с х о д н о й п е р ем е н н о й одним и л и н е б о л ьш и м числом ф акто ров .
Н а г р у з к и о с т а л ь н ы х ф а к т о р о в б л и з к и к н у л ю (T h u r s to n e (1945)).
З а д а ч а и н т е р п р е т а ц и и ф а к т о р о в з н а ч и т е л ь н о о б л е г ч а ет с я п о л у
ч е н и е м п р о с т о й с т р у к т у р ы (напом н им , что, согл ас н о зам ечан ию
5 . 7 . 2 . 4 , к а ж д а я н а г р у з к а р а в н а к о эф ф и ц и ен ту к о р р е л я ц и и между
и с х о д н о й п е р е м е н н о й и соответствую щ им ф акто ро м ).
В ф а к т о р н о м а н а л и з е с у щ е с т в у е т м ного гр а ф и ч е с к и х и а н а л и
т и ч е с к и х м етодов в р а щ е н и я д л я п о л у ч е н и я пр осто й с т р у к т у р ы .
П р е в о с х о д н ы й обзор этих м етодов с о д е р ж и т с я в р аб о т е H a r m a n
(1 9 6 7 ). В а н а л и т и ч е с к и х м е т о д а х д л я п о л у ч е н и я п р осты х с т р у к
т у р ф а к т о р н ы х н а г р у з о к м и н и м и зи р у е т с я т а к н а з ы в а е м а я целе
вая функция, з а в и с я щ а я от Сц Д л я о р т о г о н а л ь н о г о в р а щ е н и я о б ы
чно используется функция
т т р
° - 2 2 2
А= 1 /=1 Li=l
¡Фк
т р
—'tn VУ VZ_i (c2
pm 1
if- c
х ч
2. ) 2
7
(5.7.23)
/=1 t=l
где
т р
(5.7.24)
/=1 i= i
5.7. Факторный анализ 373
т р
- ^ 2 2 И / - сЬ )г- (5.7.25)
/=1 ¿=1
где
£ 4 - / = 1 .••••«. (5-7.26)
В ы р а ж е н и е (5.7.25) е с т ь с у м м а д и с п е р с и й к в а д р а т о в ф а к т о р н ы х
н а г р у з о к по к а ж д о м у с т о л б ц у . Т а к и м о б р а з о м , метод «варим акс»
м а к с и м и зи р у е т р а з б р о с к в а д р а т о в н а г р у з о к д л я к а ж д о г о ф а к т о р а ,
что п р и в о д и т к у в е л и ч е н и ю б о л ь ш и х и у м е н ь ш е н и ю м а л ы х з н а ч е
ний ф а к т о р н ы х н а г р у з о к . Н о в э т о м с л у ч а е про с т а я с т р у к т у р а п о
л у ч а е т с я д л я к а ж д о г о (ф ак то ра в о т д е л ь н о с т и , то гд а к а к в методе
«кв а р т и м а к с» п р о с т а я с т р у к т у р а о п р е д е л я е т с я д л я всех ф а к т о р о в
одноврем енно.
Д о сих пор р а с с м а т р и в а л и с ь т о л ь к о о р т о г о н а л ь н ы е в р а щ е н и я
об щ и х ф а к т о р о в . С у щ е с т в у е т м н е н и е , ч то в а ж н е е п о л у ч и т ь п р о
стую с т р у к т у р у ф а к т о р н ы х н а г р у з о к , чем с о х р а н и т ь о р т о г о н а л ь
ность ф а кт о р о в. П о э т о м у у с л о в и е н е к о р р е л и р о в а н н о с т и ф а к т о р о в
о с л а б л я е т с я и и щ у т ся к о р р е л и р о в а н н ы е ф а к т о р ы Р { ^ \ •••> Рт
с единичными д и с п е р с и я м и , я в л я ю щ и е с я ли н ей н ы м и к о м б и н а
ц и ям и ф а к т о р о в Р 1г . . . , Р т. Т а к о й н а б о р ф а к т о р о в не у д о в л е т в о
р я е т ф а к т о р н о й м о д е л и (5.7.6). П р о ц е д у р а п о л у ч е н и я т а к и х
ф а к т о р о в н а з ы в а е т с я к осоугол ьн ы м вращением. М о д ель, п о л у ч а ю
щ а я с я в р е з у л ь т а т е в р а щ е н и я , е щ е м о ж е т бы ть п р е д с т а в л е н а у р а в
н е н и я м и (5.7.19) с п о с т о я н н ы м и Сц, I = 1, . .. , р, / = 1, ..., т,
з а д а в а е м ы м и ф о р м у л о й (5 .7 .2 1 ). П о с к о л ь к у п о л у ч е н н ы е ф а к т о р ы
м о гут бы ть к о р р е л и р о в а н н ы м и , и м е е т с я более ш и р о к а я об л а с т ь
и зм е н ен и я п о с т о я н н ы х /г, / = 1 , ..., т, и в свою о ч еред ь
б о л ь ш и й выбор С ц .
374 Гл. 5. Методы многомерного статистического анализа
А н а л и т и ч е с к и е методы о п р е д е л ен и я просты х ф а к т о р н ы х н а г р у
з о к с помощ ью в р а щ е н и и , м и н и м и зи р у ю щ и х ф у н к ц и ю G (см.
( 5 . 7 . 2 2 ) ) , н а з ы в а ю т с я прямыми методами «облимин» (подробности
см. J e n n r i c h , S a m p so n (1966)). В р а б о т е H a r m a n ) (1967, с. 336)
п р е д л а г а е т с я и зм е н я т ь у от — оо до 0. Ч ем м еньш е у, тем более
к о р р е л и р о в а н н ы м и б у д у т п о л у ч е н н ы е ф а кто ры . П р и у = 0 п о л у
ч а е т с я прямой метод «кварт имию , п р е д с т а в л я ю щ и й собой к о с о
у г о л ь н ы й а н а л о г м етод а « ква р т и м а к с» . О д н ак о , п о с к о л ь к у не
т р е б у е т с я н е к о р р е л и р о в а н н о с т и ф акт о р о в , этот м ето д не с в о
д и т с я к м а к с и м и з а ц и и д и сп ерси й кв а д р а т о в ф а к т о р н ы х н а г р у з о к
(5 .7 .2 3 ).
П р я м ы е методы «облимин», од н а ко , не были первы м и методами
к о с о у г о л ь н о г о метода в р а щ е н и я ф а к т о р о в . Ч т о б ы д а т ь п р е д с т а в
л е н и е о т о м , к а к и с т о р и ч е с к и р а з в и в а л и с ь эти методы, введем
н е с к о л ь к о новых; понятий.
1) П у с т ь F[r \ . .. , F^m — р е з у л ь т а т ы в р а щ е н и я ф а к т о р о в ,
т о г д а р х m -м а три ц а к о р р е л я ц и й м еж д у ним и и исходны ми п е р е
м е н н ы м и Х 1, ..., Х р н а з ы в а е т с я ф а к т о р н о й с т р у к т у р о й . С ледует
з а м е т и т ь , ч то если ф а к т о р ы , пол у ч е н н ы е в р е з у л ь т а т е в р а щ е н и я ,
не к о р р е л и р о в а н ы , т о ф а к т о р н а я с т р у к т у р а и д е н т и ч н а м а тр и ц е
ф а к т о р н ы х нагрузок.
2 ) К аж дому ф а к т о р у FtR), i = 1 , .. . , т, м о ж н о п о с т а в и т ь
в с о о т в е т с т в и е ф актор Gt не к о р р е л и р о в а н н ы й с F/ R), / = 1, ..., т,
/ ф i . В е л и ч и н ы G b . . . , Gn н а зы в а ю т с я вторичными факторами
и г о в о р я т , что они биортогональны ф а к т о р а м F\R), ..., F iR)
( T h u r s t o n e (1945)). З а м е т и м , что е с л и ф а к т о р ы F[R), F [R)
н е к о р р е л и р о в а н ы , т о G, = F\r \ i = 1, ..., т.
3) М а т р и ц а р а з м е р а р X т, у кото рой эл ем енто м Ьц с л у ж и т
к о э ф ф и ц и е н т к о р р е л я ц и и м е ж д у исходной перем енной X t и в т о
р и ч н ы м ф а к т о р о м Gj, i = 1 , .. . , р , / = 1 ......... т, н а зы в а е т с я
с т р у к т у р о й вторичных, факторов (или просто вторичной ст рук
т ур о й ) . Е с л и ф а к т о р ы , п о л у ч е н н ы е в р е з у л ь т а т е в р а щ е н и я , не
к о р р е л и р о в а н ы , то вторичная ф акторная структура совпадает
с ф а к т о р н о й структурой.
И с т о р и ч е с к и дело о б ст о я л о т а к , что посредством о р т о г о н а л ь
н ы х в р а щ е н и й п ы т а л и с ь н а й т и пр о с т у ю ф а к т о р н у ю с т р у к т у р у
( и н о г д а н а зы в а е м у ю п ро сто й с т р у к т у р о й ), тогда к а к с помощью
к о с о у г о л ь н ы х вр а щ е н и й и с к а л и п ро стую вт о р и ч н у ю с т р у к т у р у .
1 а к и м о б р а з о м , пр и к о с о у г о л ьн ы х в р а щ е н и я х м и н и м и зи р у е т с я
ц е л е в а я функция
5.7. Факторный а н а л и з 375
З а м е ч а н и е 5 . 7 . 3 . 1. У с о в е р ш е н с т в о в а н н а я п р о г р а м м а ф а к т о р
ного а н а л и з а и з П С П п о з в о л я е т п о л ь зо в а т е л ю в ы б и р а т ь способ
в р а щ е н и я из с о в о к у п н о с т и с л е д у ю щ и х в о з м о ж н ы х м етодов:
а) в р а щ е н и е не т р е б у е т с я , Ь) о р т о г о н а л ь н ы е в р а щ е н и я , с) п р я
мые в р а щ е н и я « о б л и м и н » (к о с о у г о л ь н ы е в р а щ е н и я д л я п о л у ч е н и я
простой с т р у к т у р ы ф а к т о р н ы х н а г р у з о к ) , и л и d) (непр ям ы е)
в р а щ е н и я «облимин» ( к о с о у г о л ь н ы е в р а щ е н и я д л я у п р о щ е н и я
в то рич ной с т р у к т у р ы ) . К р о м е т о го , м о ж н о будет з а д а в а т ь з н а ч е
ние у д л я ц е л е в о й ф у н к ц и и G и м а к с и м а л ь н о е д о п у с ти м о е ч и с л о
в р а щ е н и й . В р а щ е н и я в ы п о л н я ю т с я з а д ан н о е ч и сл о р а з , и л и до
тех пор, пока о т н о ш е н и е и з м е н е н и я ф у н к ц и и G к ее н а ч а л ь н о м у
зн а ч е н и ю не с т ан ет м е н ь ш е н е к о т о р о й з а р а н е е з а д а н н о й в е л и
чины.
2. Д а л ь н е й ш е е у с о в е р ш е н с т в о в а н и е состои т в том, что ф а к т о р
ные н а г р у з к и Сц м о г у т б ы т ь «нор м и ро ван ы » зам ен о й их о т н о ш е н и
ями Cijlhi, i = 1, ... , р , j = 1, ..., т. Этот п р и е м н а з ы в а е т с я
нормировкой Кайзера. В этом случае к аж д ая переменная
бу дет вносить "вк л ад с о о т в е т с т в е н н о [своей об щ н ости (K a ise r
(1958)).
Пример 5 .7 .1 а , Т р и ф а к т о р а б ы ли п о д в е р г н у т ы в р а щ е н и ю
«варимакс». П о л у ч е н н ы е ф а к т о р н ы е н а г р у з к и п р и в о д я т с я в т а б
лице. И н т е р п р е т а ц и я ф а к т о р о в д е й с т в и т е л ь н о у п р о с т и л а с ь .В ч а с т
ности, ф актор F[R) в к л ю ч а е т в себя к р о в о т о к и п о с л е д н и е т р и
перем енные. О н м о ж е т б ы т ь н а з в а н ф а к т о р о м к р о в о т о к а и с о с т а в а
к р о в и . Второй ф а к т о р с и л ь н о к о р р е л и р о в а н с т р е м я п е р е м е н н ы м и ,
со ответствую щ им и а р т е р и а л ь н ы м д а в л е н и я м , и м о ж е т б ы ть н а з
376 Гл. 5. Методы многомерного статистического анализа
Фактор
Переменная 1 г 3
1 ЭР - 0 .0 8 0 .9 3 © - 0 .0 8
2 МАР - 0 .0 4 0.97 ф 0.06
3 НЯ - 0 .22 - 0 .1 9 0 .5 3 ®
4 ОР 0.04 0 .9 3 ® 0 .2 1
5 МУР 0 .20 - 0 .1 2 - 0 .3 4
6 ЦС1) - 0 .6 3 ® 0.08 - 0 .4 8 ©
7 ЦАТ) 0 .8 6 ф - 0 .1 1 - 0 .0 2
8 ЦМ СТ) 0.88 ф - 0 .1 4 0.17
9 ио - 0 .3 2 0.21 0.08
10 Ь(РУ1) - 0.20 - 0 .1 3 - 0.78 (X)
11 Ь(ЯС1) 0 .4 6 © 0.23 - 0 .0 5
12 Н8Ь 0 .6 0 © 0.26 0 .6 0 ©
13 на 0.61 @ 0.26 0 .5 9 ®
Фактор
Переменная 1 2 3 4 5
1 вР - 0 .1 1 0 .9 4 © - 0 .0 9 0 .0 2 0.03
2 М АР - 0.01 0.98 ф - 0.00 - 0 .0 4 0.04
3 НЯ - 0 .0 8 - 0 .10 0.81 ф 0.17 0.04
4 ОР 0 .1 0 0 .9 5 © 0.09 - 0 .0 8 0.09
5 М УР 0.03 - 0.00 - 0.00 0.81 ф - 0 .1 4
6 1ДС1) - 0 .8 5 © 0.02 - 0 .1 4 0.01 0.07
7 1ДАТ) 0 .7 8 © - 0.13 - 0 .3 6 0.14 0.19
8 1ДМ СТ) 0.88 ф - 0 .1 2 - 0 .1 4 0.21 0.14
9 иО - 0 .1 5 0.14 - 0 .1 9 -0 .6 7 © - 0 .1 4
10 Ь(РУ1) - 0 .6 1 © - 0 .2 1 - 0 .4 9 © 0.27 0.18
11 иЯ С 1) 0.08 0.01 - 0 .0 9 0.02 0 .8 8 ф
12 Нё Ь 0 .6 4 © 0 .2 1 0.32 - 0 .1 6 0 .5 4 ©
1 3 На 0.65 @ 0 .2 1 0.30 - 0 .1 5 0 .5 4 ®
5.7. Ф акторный анализ 377
П о л у ч е н н ы е факторы м о ж н о и н т е р п р е т и р о в а т ь с л е дую щ и м о б р а
зом: Т7 ! * 1 — к р о в о т о к , — а р т е р и а л ь н о е давление, —
ч а с т о т а сердечных с о к р а щ е н и й и п л а з м а , — д и у р е з и / Г5 К) —
состав кро ви .
П рим ер 5 .7 .1 с . Т р и ф а к т о р а б ы л и п о д в е р г н у т ы к о с о у г о л ь
ному вращ ен и ю с и с п о л ь з о в а н и е м м е т о д а «квартим и н». П о л у ч е н н ы е
факторные нагрузки приводятся в таблице.
Ф актор
П еременная 1 2 3
1 8Р — 0.13 0 .9 4 © 0.01
2 МАР 0.00 0 .9 9 ® - 0.01
3 ня 0.27 - 0 .1 7 - 0 .2 1
4 ОР 0.17 0.91 © - 0.01
5 МУР - 0 .2 4 - 0 .0 2 0.24
6 Ь (С 1 ) - 0 .3 6 0.06 - 0 .4 8 ©
7 ЦАТ) - 0 .0 8 0 .0 2 0.92 ф
8 ]_(МСТ) 0.07 - 0 .0 2 0.91 ©
9 ир 0.00 0.13 - 0 .2 2
10 Ы Р У 1) - 0 .5 9 ® - 0 .0 4 0.01
11 Ц К С 1) 0.25 0.09 0 .1 1
12 Н8Ь 0 .9 6 ® 0 .0 1 0 .01
13 Нс1 0.95 © 0 .0 1 0.03
В о з м о ж н а с л е д у ю щ а я и н т е р п р е т а ц и я э т и х ф акт о р о в: / 7 1 Л| — с о
с тав к р о в и , — артериальное д а в л е н и е , / 7з ^ ) — к р о в о т о к .
З а м е т и м , что и н т е р п р е т а ц и я эти х ф а к т о р о в прощ е, чем в п р е д ы
д у щ и х с л у ч а я х , п о с к о л ь к у н а в р а щ е н и я б ы ли н а л о ж е н ы менее
с т р о ги е о г р а н и ч е н и я . М а т р и ц а к о р р е л я ц и й м е ж д у ф а к т о р а м и
имеет вид
1 2 3
1 1.00 0 .2 2 0 .4 9
2 0.22 1 .00 -0.12
3 0 .4 9 - 0 .1 2 1 .0 0
П ервы й и трети й ф а к т о р ы н а и б о л е е с и л ь н о к о р р е л и р о в а н ы , а
второй и т р е ти й — к о р р е л и р о в а н ы о т р и ц а т е л ь н о и с л а б е е всего.
¡J78 Гл. 5. Методы многомерного статистического анализа
5 .7 .3 . З н а ч е н и я ф акторов
Во м н о г и х с л у ч а я х т р е б у е т с я о п р е д е л и т ь значения факторов
д л я д а н н о г о в е к т о р а х = (хх, ..., х у . Н а п р и м е р , в з а д а ч е об
о п р е д е л е н и и к у л ь т у р н о г о у р о в н я с у щ е с т в у ю т д в а об щ и х ф а к т о р а :
к а ч е с т в е н н ы й и ко л и ч е с т в ен н ы й , ко т о р ы е о п и с ы в а ю т умственные
с п о с о б н о с т и студента. П о д а н н о м у в е к т о р у (хь ..., хр) р е з у л ь т а
тов т е с т а т р е б у е т с я оц е н и ть з н а ч е н и я ф а к т о р о в д л я о п и с ан и я
у м с т в е н н ы х способностей сту де н та . С тан д ар т н о го метода о ценки
з н а ч е н и й ф а к т о р о в н е с у щ е с т в у е т. К а к п р а в и л о , д л я этой цели
и с п о л ь з у е т с я техника регрессионного анализа. Если рассматривать
ф а к т о р ы к а к з а в и с и м ы е пер ем енн ы е, а исходные пер ем енн ы е X it
i — 1, . . . , р, считать н е за в и с и м ы м и , то м о ж н о за п и с а т ь следую щ и е
уравнения:
F, = 1 : Ь ^ , ■ у = 1 ........ т, (5.7.28)
А t=i
где Fj — о ц е н к а з н а ч е н и я /- ф а к т о р а , 2г — сгандартизованная
о ц е н к а з н а ч е н и я i -й п е р е м е н н о й , т. е.
X; — X; .
Zi = — Г — » 1 = 1 , . . .,р,
*I
Ьц — о ц е н к и коэфф ициентов р е г р е с с и и , и н о гд а о н и ^'назы в аю тся
коэффициентами значений факторов. Н а п ом н и м , что Ьц я в л я е т с я
ф у н к ц и е й коэф ф ициентов к о р р е л я ц и и и с х о д н ы х пер ем ен н ы х д р у г
с д р у г о м и и х к о р р е л я ц и й с общими ф а к т о р а м и (см. з а м е ч а н и е
5 .7 .4 ) . К а к п р а в и л о , п р о г р а м м ы ф а к т о р н о г о а н а л и з а д аю т в о з
м о ж н о с т ь п о л у ч и т ь зн а ч е н и я ф а к т о р о в и их коэфф ициенты д л я
всех э л е м е н т о в выборки.
З а м е ч а н и е 5 . 7 . 4 . ★ К о эф ф и ц и ен ты Ьц м огут бы ть п о л у ч е н ы
с л е д у ю щ и м о б р а з о м . П о л о ж и м bj = (Ьц, ..., boJy , \) = ( /,;, ...,
... , Ipj)' и п у с т ь R — в ы б о р о ч н а я к о р р е л я ц и о н н а я м а т р и ц а .
Т о г д а b7- = R _1ly. Б о л е е под р обн о см. H a r m a n (1967). ★
П р и м е р 5 .7 . 2 . Ф а к т о р н ы й а н а л и з д ан н ы х , с о б р а н н ы х в основ
но м у з д о р о в ы х с л у ж а щ и х (п = 388), п р и м е н я л с я д л я изуч ен и я
в з а и м о с в я з и п о к а з а т е л е й ф у н к ц и и л е г к и х , о п р е д е л ен н ы х с по
м о щ ью к р и в ы х «поток— объем» и а зо т н о г о а н а л и за одного в д о х а —
в ы д о х а . И с п о л ь з о в а л и с ь с л ед у ю щ и е переменные: ф о р с и р о в а н н а я
ж и з н е н н а я е м к о с т ь л е г к и х (FV C), м а к с и м а л ь н а я в е н т и л я ц и я
л е г к и х (Ущах), в е н т и л я ц и я на у р о в н е 50 % FV C (V50), в е н т и л я ц и я
н а у р о в н е 25 % FVC (V25), о тно ш ен ие остаточной ем кости к п о л
ной е м к о с т и л е г к и х (CC/TLC) и отнош ен ие остаточного объема
к ж и з н е н н о й емкости л е г к и х (CV/VC). П од робн ос ти и зуч ен и я
эт о й п о п у л я ц и и , а т а к ж е методы сб о р а д а н н ы х п р е д с т а в л е н ы в р а
боте A z e n et al. (1978).
5.7. Факторный анализ 379
В п р и л а г а е м о й т а б л и ц е п р и во д я т с я р е з у л ь т а т ы ф а к т о р н о г о
анализа д а н н ы х , с о б р а н н ы х у с л у ж а щ и х м у ж с к о г о по л а .
П ерем енны е, о б ъ е д и н я е м ы е ф актором (для кот о р ы х н а г р у з к и
больш е 0,5), п о д ч е р к н у т ы . П ервы й ф ак т о р о к а з а л с я с и л ьн е е
всего к о р р е л и р о в а н н ы м с Р Е У ^ РУС, У тах, Уво. У 2 5 . вто рой ф а к
тор — с СС/ТЁС и с С У /У С . Эти д в а ф а к т о р а о б ъ я с н я ю т 75 %
д и спер сии . Д л я ж е н щ и н б ы ли по лучены а н а л о г и ч н ы е р е з у л ь т а т ы .
FEV, 0.94 - 0 .3 0
FVC 0.72 - 0 .2 4
Нт „ 0.53 -0 .0 8
0.71 -0 .3 5
Уц 0.66 - 0 .4 0
CC/TLC -0 .2 8 0.84
CV/VC -0 .2 5 0.88
С огласн о п р о в е д е н н о м у а н а л и з у , д л я к а ж д о г о и н д и в и д у у м а
было определено д в а з н а ч е н и я ф ак т о р о в . П е р в ы м из н и х ( з н а ч е
ние (фактора « п о т о к — объем») бы ло сре д н ее с т а н д а р т и з о в а н н ы х
зн а ч е н и й F E V ^ F V C , V max, V 5o> У 25. вторы м (зн а ч е н и е ф а к т о р а
«остаточный объем») — средн ее стандартизованны х зн а ч е н и й
СС/ТСС и C V /V C .
С т а н д а р т и з а ц и я к а ж д о й переменной б ы л а п р о в е д е н а с и с п о л ь
зо вани ем Т-преобразования. Этот метод п о з в о л я е т п р е о б р а з о в ы
в а т ь переменные с с и л ь н о асимм етричны м ил и м у л ь т и м о д а л ь н ы м
распределен ием к н о р м а л ь н о р а с п р е д ел е н н ы м перем енны м.
Метод 7 - п р е о б р а з о в а н и я состоит в с л еду ю щ ем . Д л я за д а н н о й
п ерем енной, н а п р и м е р F E V b о б ъекты р а н ж и р у ю т с я от 1 до п
(объем выборки) с о г л а с н о ве л и ч и н е зн а ч е н и й F E V i - Д л я с о в п а д а ю
щ и х значений б е р е т с я у с р е д н е н н ы й р а н г . Т а к и м о б р азо м , к а ж д ы й
р а н г п р е в р а щ а е т с я в н а к о п л е н н у ю д о л ю ч и с л а п. П р е о б р а з о в а н н о е
зн а ч е н и е F E V ,, т а к н а з ы в а е м о е Т-значение, о п р е д е л я е т с я по ф о р
м уле
(Т-значение),- = 10 х Ф -1 (Fjri) + 50, i = 1, . , *v
П у с т ь д л я к а ж д о г о и з п о б ъ е к т о в и з м е р я ю т с я ^ п ерем ен н ы х . О б о з
начим их следую щ им образом:
И ндивиЬ уум
П ерем енн ая 1 г ■
■■ п
1 2 5’ln
У"
Р ñ.
Y = X 'ß + e, (5 . 8 . 3 )
гд е
Уц >21 • ■ V
Yпхр _ У}2 ■
Án УZn ■ Ут
5.8. Многомерный дисперсионный анализ 381
— м а тр и ц а з н а ч е н и й о т к л и к о в , ( X ' ) nxm— м а т р и ц а п л а н а р а н г а г и
ßu ßzi ßPl
ßl 2 ßl 2 ßPZ
ßl m ßz ßm
— м а т р и ц а н е и з в е с т н ы х п а р а м е т р о в . И н а к о н е ц , е " хр — м а т р и ц а ,
с т р о к и котор ой с о с т а в л я ю т с л у ч а й н у ю в ы б о р к у р а з м е р а п из
н е в ы р о ж д е н н о го о-м ер н о г о р а с п р е д е л е н и я N (0, 2 ) , где Е рхр —
к о в а р и а ц и о н н а я м а т р и ц а , а 0 рх1 — н у л е в о й ве к т о р . У р а в н е н и е
(5.8.3) я в л я е т с я ф о р м а л ь н о й з а п и с ь ю м ногом ерной обобщ енной
л и н е й н о й модели.
П ример 5 .8 .1 . Д а н н ы е д л я э т о г о п р и м е р а в з я т ы из и сследо
в а н и я , п р о в е д е н н о го н а о с н о в е с п е ц и а л ь н ы х а н к е т, за п о л н е н н ы х
н а 461 судебного и с п о л н и т е л я м у ж с к о г о п о л а в о к р у г е Л о с - А н д
ж е л е с (подробности э т о г о и с с л е д о в а н и я см. B S n i b b e e i al. (1975)).
А н к е т а F orm А (Cattel! e t al. (1 970 )) о ц е н и в а е т 16 ф а к т о р о в , х а р а к
т е р и зу ю щ и х личность о п р а ш и в а е м о г о . Б ы л о и н тер есно к л а с с и ф и
ц и р о в а т ь су деб н ы х и с п о л н и т е л е й н а 3 г р у п п ы : л а т и н о а м е р и к а н ц ы ,
(пл = 33 )( н е г р о и д ы ( п 2 = 29) и е в р о п е о и д ы ( п3 = 399). В д анном
с л у ч а е л = 461, и = 16 и — в е к т о р и з 461 н а б л ю д е н и я ¿-го
ф а к т о р а , г = 1, . . . , 1 6 .
Д л я i-ro ф а к т о р а в п р и н я т ы х о б о з н а ч е н и я х м о д е л ь им е ет вид
У{/ = ц/ х 1 + а ц Х д +• cci2X /2 + ец, i = 1 , . . . , 16, / = 1 , . . . , 461.
З д е с ь ß ; = ( ц г, а г1’ «¿г)' — в е к т о р и з т = 3 п а р а м е т р о в , соо т в ет с т
в у ю щ и й i -му ф а к т о р у . С т р о к а с н о м е р о м } м а тр и ц ы X' им еет вид
(1, X n , Ä j2), j = 1, 4 6 1, г д е п е р е м е н н ы е Х п и X j2 о п р е д е л я ю т
г р у п п у , т. е. д л я j -го и н д и в и д у у м а
(1, 0), е с л и он л а т и н о а м е р и к а н е ц ,
(Х д , X j 2) = (0, 1), е с л и он негроид,
. ( — 1, — 1), е с л и он европеоид.
З а м е т и м , что г — tn = 3 и м о д е л ь в м а т р и ч н о й ф о рм е з а п и с ы в а
е т ся следую щ и м о б р а з о м :
'1 1 0‘ ßi Hz ßlb
■у.,1 ■' Пб.1 1
«И «21 «16. 1 + е.
. у 1 1 0 «12 «22 «16,2
Yi. зз • Г16, 33
^16. 34 1 0 1
У,.34 •
^1. «2 ^16. 62 1 0 1
1 -1 -1
*i. 63 • ‘ П6, 63
5 . 8 . 1 . О ц е н к и п а р а м ет р о в
ка. о
- Т = Г ~ - ------------------------- ’ (5 -8 -5 )
где г — р а н г м а тр и ц ы X '. Н есм ещ енн о й о ц ен к о й д л я a¡j будет
ъа. п r;Y (x'y;) ß
n - r --------------- ~¡í~ r ---------- * Í, / = (5.8.6)
R0( l , l ) ЛоО.р)'
Щ <р =
R 0(p, 1) ••• R0(P,P).
с к о л ь к и х о д н о м е р н ы х г и п о т е з , к а ж д а я из к о т о р ы х д ел а е т с я о т
н о с и те л ьн о о т д е л ь н о й п е р е м е н н о й . С л е д о в а т е л ь н о , т р е б у е т с я о д
н ов ре м е н н о п р о в е р и т ь г и п о т е з ы
Я 0: H ' ß , = Sí , i = l,...,p, (5.8.7)
и л и , в более к о м п а к т н о й з а п и с и ,
H 'ß [SiS2 . . . SP1, (5.8.8)
Д л я п р о в е р к и г и п о т е з ы м о г у т б ы т ь и с п о л ь з о в а н ы р а зл и ч н ы е
ф ункции, зависящ ие о т Одним из кри тери ев может служ ить
п р о в е р к а м и н и м а л ь н о г о к о р н я ( m i n ^ ;), п о с к о л ь к у он о т р а ж а е т
м а кс и м а л ь н о е о т к л о н е н и е о т г и п о т е з ы Н 0. Д р у г и м к р и т е р и е м ,
ч асто и с п о л ь з у е м ы м в п р о г р а м м а х , я в л я е т с я A -критерий Уилкса
(W ilks (1932)):
A. (5.8.10)
З а м е ч а н и я 5 .8 .1 . 1. П у с т ь SE = R0 — матрица о с т ат о ч
н ы х сум м к в а д р а т о в и п р о и з в е д е н и й , а S H = Rj — R0 — м а т р и ц а
с у м м к в а д р а т о в и п р о и з в е д е н и й , о б у с л о в л е н н ы х откл о н е н и е м от
г и п о т е зы . Т о г д а Л * к р и т е р и й У и л к с а м о ж н о п р е д с та в и ть в виде
3&4 Гл. 5. Методы многомерного статистического анализа
А = | S E| | S H 4 - SE | 1. С у щ е ст в у ю т ещ е д в а к р и т е р и я проверки
г и п о т е з ы Н 0:
с^тах (^Н^Е
[ I "Ь с^шах (®Н^Е : )]
где с и м в о л о м c h raax о б о зн а ч е н м а к с и м а л ь н ы й х а р а к т е р и с т и ч е с к и й
корень, и
и) tr ( S h S í "1),
где t r — с л е д м а т р и ц ы (сумма д и а г о н а л ь н ы х эл е м е н т о в). П р и
р = 1 о н и с о в п а д а ю т с Л -к р и т е р и е м . В р а б о т е S m i t h et al. (1962)
п р и в о д и т с я а н а л и з э т и х трех к р и т е р и е в н а п р и м е р е ч ет ы р е х г р у п п ,
р = 11 , и п р и д в у х с о п у т с тв у ю щ и х п е р е м е н н ы х .
2. В к а ч е с т в е ещ е одного к р и т е р и я часто и с п о л ь з у е т с я с т а т и
стика Р о я
П у с т ь п и . . . , щ (п = 2 п г) — ч и сл о н а б л ю д е н и й , п о л у ч е н н ы х
и з & п о п у л я ц и й , и У1г, . . . , Ург — вы борочны е средн и е з н а ч е н и я р
п е р е м е н н ы х д л я г-й в ы б о р к и , п = 1, . . . , к. К р о м е того, пу с т ь
— м а т р и ц а остаточны х сум м к в а д р а т о в и п р о и зв е д е н и й д л я
г-й в ы б о р к и с пг — 1 с т еп е н я м и свободы . И н а к о н е ц , К , , . .. , У р —
о б щ и е с р е д н и е з н а ч е н и я , а (Бц) — н е с м е щ ен н а я о ц е н к а м а тр и ц ы
с у м м к в а д р а т о в и п р о и зв е д е н и й д л я вы б о р к и , п о л у ч е н н о й о б ъ е д и
н е н и е м в с е х и м е ю щ и х с я в ы б о р о к в о д н у . О б общ а я одном ерны й
д и с п е р с и о н н ы й а н а л и з , о п р ед ел и м
k
(5.8.11)
(5.8.13)
5.8. Многомерный дисперсионный анализ 385
М еж ду k— i (Вц)
В н утр и п— k (Щ)
П олная п — 1 (Si j)
С т а т и с т и к а Л им еет U - р а с п р е д е л е н и е с р, k — 1 и п — k степ е н я м и
свободы (A n de rso n ( 1 9 5 8 , с .191 и далее)). З а и с к л ю ч е н и е м с п е ц и
ал ьн ы х сл у ч а е в , п р о ц е н т и л и ¿ /- р а с п р е д е л е н и я б ы вает тр у д н о
вы числить и поэтому н а п р а к т и к е обы чно и с п о л ь з у е т с я одна из
двух а п п р о к с и м а ц и й . Т а к , в о п р о с о том, с л е д у е т л и о т в е р га т ь п р о
вер я е м у ю г и п о т е зу , м о ж н о р е ш и т ь с р а в н е н и е м вел и ч и н ы
Г2 = — (n — 1 — V i ( p + A ))'ln A (5.8.14)
с п р о ц е н т н ы м и ^ - р а с п р е д е л е н и я с р (k — 1) с т еп е н я м и свободы.
С д р у г о й стороны , м о ж н о и с п о л ь з о в а т ь F -а п п р о к с и м а ц и ю U ;
F= ) ( 1 ^ 1 ) , (5.8.15)
где
, 1 , . I/ р2 (k — I)2 — 4
ГП — П — 1 2- ( р + *), S у р2 (/е _ 1)2 _ 5 >
р (k - 1 )-2 „ p(k-\)
К = — ------- 4---------- И Г -------2-------•
Таблица 5.8.1
Средние и стандартные отклонения 16 личностных
факторов по группам
Группа
л, = 33 л 2 = 29 л3 = 399
Латино
Фактор американцы Негроиды Европеоиды
П р о г р а м м а в ы ч и с л я е т з н а ч е н и я с л е д у ю щ и х х а р а к г е р и с т и к : а) м а
т р и ц с у м м к в а д р а т о в и п р о и зв е д е н и й ( В ц ) и (УРц), Ь) г р у п п о в ы х
с р е д н и х к а ж д о г о и з 16 ф а к т о р о в , с) общ ей д и с п е р с и и , [ /- с т а т и
с т и к и и е е /'- а п п р о к с и м а ц и и . Р е з у л ь т а т ы р аб о т ы п р о г р а м м ы в ы
в о д я т с я в в и д е та бл и ц ы , п р и в е д ен н о й н и ж е .
/ <,-ап-
И сточник щ енной Число п рок- Ч исло
дисперсии д и сп ер и степеней сим а- степеней
сии свободы ция свободы
З а м е ч а н и я 5 . 8 . 2 . 1. О д н о ф а к т о р н ы й м н о го м е р н ы й д и с п е рс и он
ный а н а л и з м о ж н о п р о в е с т и с п о м о щ ь ю п р о г р а м м ы п р о в е р к и
общей м н о г о м е р н о й л и н е й н о й г и п о т е з ы . П р и з а д а н н о й м атри ц е
пл ан а эту п р ограм м у м о ж н о и с п о л ь з о в а т ь д л я проведения сба
л а н с и р о в а н н о г о и л и н е с б а л а н с и р о в а н н о г о м ного м ер но го д и с п е р
сио н ного или к о р р е л я ц и о н н о г о а н а л и з о в . И т а к , с пом ощ ью этой
п р огр ам м ы р е ш а е т с я з а д а ч а ( 5 . 8 . 3 ) и п р о в е р я ю т с я гипотезы,
з а д а н н ы е в в и д е ( 5 . 8 .8 ) . Н а самом д е л е п р о в е р я е т с я д а ж е более
о б щ ая г и п о т е з а в и д а
H 'ß M = | ,
где, к а к и п р е ж д е , Н ' и м е е т р а з м е р s X т и р а н г s < т, а М —
р а зм е р р X и и р а н г и < р. М а т р и ц а Н ' с л у ж и т д л я ф о р м у л и
ро в к и гипотез «между г р у п п а м и и л и о б р аб о т к а м и » , а М — д л я
ги п о т е з «м еж д у п е р е м е н н ы м и и л и о т к л и к а м и » . В п р и м ер е, о п и с а н
ном выше, м а т р и ц а Н' о п р е д е л я л а с ь д л я п р о в е р к и г и п о т е з о т н о
сительно груп п , а в к а ч е с т в е м а т р и ц ы М бы ла в зя т а единичная.
М ожно определить м а т р и ц у М и д л я п роверки гипотез о линейных
к о м б и н а ц и я х 16 ф а к т о р о в .
2. Д л я проведения о д н о ф а к т о р н о г о многомерного дисперсион
ного а н а л и з а м о ж н о т а к ж е п о л ь з о в а т ь с я п р о г р а м м а м и д и с к р и м и
н а н т н о го а н а л и з а . В р е з у л ь т а т е р а б о т ы т а к о й п р о г р а м м ы обычно
вы водится з н а ч е н и е ¿ / - с т а т и с т и к и и ее / - а п п р о к с и м а ц и и . К р о м е
того, п р о и з в о д и т с я у п о р я д о ч е н и е п е р е м е н н ы х , что д ае т в о з м о ж
ность о п р е д е л и т ь , к а к и е п е р е м е н н ы е в н о с я т зн а ч и м ы е р а зл и ч и я
(см. ра зд . 5 .5 и с л е д у ю щ и й д а л е е п р и м ер ).
Таблица 5.8.2
Пош аговы й дискриминантный анализ значений
16 личностных факторов для трех групп
д е н н о е в з а м е ч а н и и 5 .5 .1 .1 . У р о в е н ь зн а ч и м о с т и а бы л в ы б р ан
р а в н ы м 0.1 0. И з т а б л и ц ы видно, что г р у п п ы л у ч ш е всего р а з д е
л я ю т с я по п е р е м е н н о й У 8. Н а в т о р о м и е с т е стоит У 13, затем
и т. д. П у с т ь , н а п р и м е р , н а п я т о м ш аге с пом ощ ью ¿/-статистики
п р о в е р я е т с я г и п о т е з а о том, что вектор с р е д н и х ¡и = (ц 3, }г6, ц8,
F i 3 > H-ieV п р и н и м а е т о д и н а к о в ы е зн а ч е н и я д л я всех т р е х г р у п п .
Э та г и п о т е з а о т в е р г а е т с я ( / = 4 .8 1 , vx = 10, v2 = 908, р < ,
< ¡ 0 . 0 0 1 ) . К р о м е п я т и п ер е м е н н ы х , при в еден н ы х в т аб л . 5 .8 .2 ,
н и о д н а п е р е м е н н а я не вноси т зн а ч и м о го в к л а д а в р а з д е л е н и е
н а т р и г р у п п ы (п р и а = 0.10).
З а м е ч а н и е 5 . 8 . 3 . П р о г р а м м а , в ы п о л н я ю щ а я м но гом ер ны й
д и с п е р с и о н н ы й а н а л и з , н а з ы в а е т с я M A N O V A ( P s y c h o m e tr ic L a b o
r a t o r y , U n i v e r s i t y of N o r t h C a ro lin a ). С п ом о щ ью этой п р о г р а м м ы
можно п р о в о д и т ь ещ е м ногом ерны й к о в а р и а ц и о н н ы й а н а л и з ,
а т а к ж е и регрессионны й ан али з. Д л я каж дой проверяемой
м о д ел и на п е ч а т ь в ы даю тся п о л у ч е н н ы е з н а ч е н и я о д ном ерны х
и м н о г о м е р н ы х к р и т е р и е в . В многомерном сл у ч ае и с п о л ь з у ет с я
A - к р и т е р и й У и л к с а с / - а п п р о к с и м а ц и е й Р а о . К р о м е того, н а п е
ч а т ь в ы в о д я т с я к а н о н и ч е с к и е к о р р е л я ц и и м е ж д у перем ен н ы м и и
и с к у с с т в е н н ы м и пер ем енн ы м и д и с п е р с и о н н о г о а н а л и з а . П о с л е
т а б л и ц ы м ного м ерно го д и с п е р с и о н н о г о а н а л и з а печ а та ю тс я о д н о
мерные /-к р и те р и и .
П р и м е р 5 .8 .1 ( продолжение ). Д л я п р о в е о к и р а з л и ч и й м е ж д у
т р е м я г р у п п а м и н а о с н о в е з н а ч е н и й 16 л и ч н о с т н ы х ф а к т о р о в
б ы ла п р и м е н е н а п рограм м а M A N O V A . И спользовались данны е
о п = 4 6 1 с л у ж а щ е м . В т абл . 5 .8 .3 при ведены р е з у л ь т а т ы м н о г о
м е р н о г о д и с п е р с и о н н о г о а н а л и з а и 16 з н а ч е н и й к р и т е р и я д л я
о д н о м е р н о г о д и с п е р с и о н н о г о а н а л и з а . Г и п о те за о р а в ен с т в е с р е д
н и х в т р е х р а с о в ы х г р у п п а х б ы ла о т в е р гн у т а ( / = 2 .1 6 , v x = 32,
5.8. Многомерный дисперсионный анализ 389
Таблица 5.8.3
Анализ зн а ч ен и й 16 личностны х факторов, проведенный
программой M ANO VA
Гипотетический
Переменная f ,= средний Р меньше
Г(2А 5 8 ) квадрат чем
1 4.805 13.627 0.009
2 2.249 7.652 0.107
3 0.681 2.161 0.507
4 1.670 6.422 0.189
5 0.201 0.864 0.818
6 1.614 5.652 0.200
7 1.936 8.422 0.145
8 8.342 30.047 0.001
9 1.305 4.985 0.272
Ю 0 .5 3 0 1.677 0.589
И 0 .078 0.260 0.925
12 2 .208 6.938 0.111
13 4 .563 16.209 0.011
14 4 .0 8 0 19.010 0.018
15 0 .1 3 6 0.482 0.873
16 3.595 15.686 0.028
5 .8 .4 . М н о ж ест в ен н ы е ср а в н ен и я в однофакторном
м ногом ерном ди сп ер си он н ом анализе
Б р а зд . 2.4 .2 б ы л а р а с с м о т р е н а п р о ц е д у р а м н о ж ес т в е н н ы х с р а в н е
ний д л я о д н о м е р н о г о о д н о ф а к т о р н о г о д и с п е р си о н н о г о а н а л и за .
Эта п р оц едур а п р е д с т а в л я е т собой метод о п р е д е л е н и я к о н тр а с т а
в с р е д н и х з н а ч е н и я х , и з - з а к о т о р о г о о т в е р г а е т с я ги п о теза о р а
венстве с р е д н и х , е с л и о н а д е й с т в и т е л ь н о о т в е р г а е т с я . У к а з а н н а я
п р оц е д у р а о б л а д а е т т е м п р е и м у щ е с т в о м , ч то общ ий у р о в е н ь
значимости д л я в с е х п о л у ч а е м ы х д о в е р и т е л ь н ы х и н терв ал о в и з
390 Гл. 5. Методы многомерного статистического анализа
У праж нения
З ам е чан ия .. 1. Буквой А обозначается набор данных из примера 1.4.1, табл. 1.4.1
и 1.4.2, бук в ой В — набор данных из примера 1.4.2, табл. 1.4.3 и 1.4.4.
2. В наборе А все непрерывные переменные могуг считаться нормально
распределенными, кроме CI, AI, ИСТ, PV1; для последних предполагается нор
мальное распределение логарифмов. В наборе В все непрерывные переменные
также предполагаются нормально распределенными, за исключением систоличе
ского и диастолического давлений (1950 и 1962), логарифмы которых также
могут считаться нормально распределенными.
Раздел 5 . 1
5.1.1 (для работы в аудитории). Соберите данные роста, веса и возраста
у всех студентов группы мужского пола и проведите анализ выбросов. Объясните
результаты.
5 .1 .2 . Выполните упр. 5.1.1 для всех студенток группы. Имейте в виду, что
выбросы м огут появиться в результате неверных ответов.
Раздел 5 . 2
5.2.1 (набор данных А), а) Используя данные в начале лечения для всех
больных, проверьте, равен ли выборочный вектор средних с координатами Х г =
= SP , Х г = H R , Х 3 = D P, X t = MVP вектору средних для здоровых лиц,
определяемому так:
Ь) И сп ол ь зуя многомерные доверительные интервалы, определите, для
каких переменных средние значения сильно отличаются от соответствующих
значений д л я здоровых людей.
5.2.2 (набор данных А). Выполните упр. 5.2.1, испп^муя данные, собранные
в конце л ечения у выживших больных.
5 .2 .3 (табор данных А). Выполните упр. 5.2.1, используя данные, собранные
перед смертью у больных.
5.2.4 (набор данных А). Объясните результаты упр. 5.2.1, 5.2.2, 5.2.3.
5.2.5 (набор данных А), а) Определяя Х г , . . . , Х 4, как в упр. 5.2.1, про
верьте, равны ли начальные векторы средних выживших и умерших больных.
Ь) П остройте совместный 90 %-ный доверительный интервал для всех ком
понент разностей средних значений.
5.2.6 (н абор данных А). Выполните упр. 5.2.5 для данных, собранных
в конце л ечения. Сравните результаты этого и предыдущего упражнений.
Раздел 5.3
5.3.1 (набор данных В). Обозначим символом \VX подпопуляцию те х , кто
жил после 1968 г ., а \У 2 — всех прочих больных из популяции.
а) Выпиш ите байесовскую процедуру классификации до переменным: Х% —
возраст, Х 2 — логарифм систолического давления, Х 3 — логарифм диастоличе
ского давл ен и я, Х 4 — холестерин сыворотки (1950). Постройте оценки априор
ных вероятностей на основе этих данных.
Упражнения 393
Раздел 5.4
5.4.1 (набор данных А). Используйте данные, собранные в начале лечения-
Определим 1^, . . . , №в так же, к а к и в примере 5.4.1. Переменными служат
Х г = МАР, Х2 = МУР, Х 3 = 1ё С 1, Х4 = иО , Х 5 = ^ РУ1, Х в = Н£Ь, Х 1 =
= ш*.
a) Воспользуйтесь программой из какого-нибудь ПСП для получения про
цедуры классификации, предполагая равными априорные вероятности и стои
мости ошибочной классификации.
b) К какой группе следует отнести пациента со следующими данными:
Х 1 = 70, Х 2 = 10, Х 3 = 0 .3 , Х 4 = 10, Х 5 = 1.5, Х в = 10, Х 7 = 30.
c) Оцените вероятности ошибочной классификации, которые могут пред
ставлять интерес.
(1) Проверьте гипотезу о равенстве шести векторов средних,
е) Сравните результаты с примером 5.4.1.
Раздел 5.5
5.5.1 (набор данных А). Выполните упр. 5.4.1, используя программу поша
гового дискриминантного анализа. Кроме того,
Г) Определите «наилучший» для классификации набор переменных.
Раздел 5.6
5.6.1 (набор данных А). В примере 5.6.1 были получены главные компоненты
по выборочной корреляционной матрице, построенной, согласно измерениям,
в начале лечения 14 переменных для всех пациентов. Проведите анализ главных
компонент следующих данных и сравните результаты.
a) Измерения в начале лечения тех ж е переменных у выживших больных.
b) Измерения в конце лечения тех ж е переменных у выживших больных.
Сравните также результаты анализа п. а) и Ь).
5.6.2 (набор данных В). Вы полните анализ главных компонент для пере
менных: Х 1 — возраст, Х 2 — систолическое давление (1950), Х 3 — диастоличе
ское давление (1950). Интерпретируйте главные компоненты, объясняющие при
мерно 70 % общей дисперсии.
Раздел 5.7
Замечание. Формулировка упражнений, относящихся к этому разделу, за"
висит от того, какие именно программы факторного анализа имеются в распо
ряжении читателя. Можно поставить много задач, в которых наборы данных А
и В используются целиком или частично. Здесь приводятся 2 упражнения, кото
рые допускают ряд изменений.
5.7.1 (набор данных А). В примере 5.7.1 рассматриваются различные методы
факторного анализа данных п о 14 переменным, измеренным у всех больных
394 Гл. 5. Методы многомерного статистического анализа
О б зо р о с н о в н ы х понятий
1.1.3. Вероятность
В основе большей части статистической теории лежит понятие
вероятности, связанное со случайной величиной. В случае дис
кретной случайной величины ?<. вероятность того, что X прини
мает значение х, е с т ь доля рх индивидуумов в генеральной сово
купности, обладающих значением х. Запишем это отношение в виде
Рг (Л- = к) = рх. [В некоторых работах используется обозна
1) Дискретные вы борочны е п ространства вклю чаю т такж е бесконечные счет
ные множества.
2) Множество н еотриц ательны х ц е л ы х чисел является бесконечно счетным.
400 Приложение I. Обзор основных понятий
Рг ( Х £ Е ) = £ р = 2 р !). (1.1.1)
¿=1 ‘ Х1 £ Е ‘
рг | 1 — Р Р
где р — доля индивидуумов с хроническим бронхитом в генераль
ной совокупности. Э ту таблицу распределения вероятностей
дискретной случайной величины г можно также задать с помощью
закона распределения
р г (1 — р)1-* Д Л Я 2 = 0,1,
0 в остальных случаях.
Г (г)
I --------------- --------
1-/> -----------
°1 _________
О 1
а
F( z )
I -
И= £(Х) = 4 - £ Х ( 0 . (1-1.7)
¿=1
Если мы обозначим различные элементы выборочного простран
ства 5 через х 1, ..., хк (К < М), то можно записать ¡л. в виде
к
2] хкпк
ц. = £ ( * ) = ^ ---- , (1.1.8)
\ 1 = % х крх (1.1.9)
к=\ *
Это определение применимо к дискретным случайным величи
нам как в случае конечной популяции, так и в случае счетной.
Однако если IV счета а , то не существует стандартного способа
406 Приложение I. Обзор основных понятий
а в примере 1 .1.3 —
Е(2) 0(1 — Р) + 1 (р) = р.
Равенство (1.1.10) можно обобщить на случай непрерывной
случайной величины X, заменяя суммирование интегрированием,
а зак о н распределения р (х ) — на функцию плотности распределе
ния / (х) (см. замечание 1.1.2.1).
П онятие математического ожидания распространяется на про
извольную функцию g (X) от X . Математическое ожидание
Е (^ (ЛТ)) ф ункции £ (X) от случайной величины X есть среднее
значение g (X (ш)) для всех в> из №. Таким образом, для дискрет
ной случайной величины из равенства (1.1.9) получим
к
£ (£ (* )) = И £(■**) Р** (1.1.11)
й=1 я
и аналогичное соотношение для непрерывного случая.
Особый случай составляют функции £ (Л") вида Х ‘ и
[ X — Е ( X ) ] 1 для / ^ 1 . Математические ожидания Е ( X е) и
Е [ X — Е ( Х) ] с называются соответственно г-ж моментом от
носительно н у л я (или 1-м начальным моментом) и г-м моментом
относительно среднего (или 1-м центральным моментом). Второй
центральный момент называется дисперсией и обозначается через а2
или V ( X ) . Положительный квадратный корень из дисперсии
называется стандартным отклонением ст или [V (X) ]‘/2.
Заметим, что V (X) можно выразить в виде
V (X) = Е [X - Е (X)]2 = Е (X2) - [Е (X)]2. (
Таким образом, в примере 1.1.2 дисперсия равна
г ь
17(К) = Ц и ~ Е ( У ) Г Р1 = Е
а в примере 1.1 .3
у(г) = ( о - Р) Ц \ - р ) + ( \ - р г р = р { \ - р ) ,
так к а к Е (7.) = р.
1.1. Основные п о н я ти я теории вероятностей 407
£ (Х ) = | x f { x) dx.
-00
Математическое ожидание функции £ (X) есть
оо
£(ёЧХ)) = | £(х)Цх)с1х.
— оо
Х1(ии1, . . ., « » *)= Х К ) ,
Х 2(дах, . . . . ьик) = X(да2),
410 Приложение I. Обзор основных понягий
Хк Х1
(1) Т7 (х1у ..., хк) = | ... | / («!, .... ик) ... <1ик\
—оо —оо
ОО 00
е) / |
О г ) =
_[ М*1 > •••, Хк) дхх ... йхихйх1+1 ... йхк есть
—оо —оо
частная плотность распределения х г.+
Х = £ 1 Х1. (1.2.1)
£=1
Тогда А ’ — случайная величина с выборочным пространством
5 = {О, 1, ..., п\. Распределение случайной величины X назы
вается биномиальным распределением. Его закон распределения
р (г) = Р г (X = г) обозначается через Ьп (г, р) и задается фор
мулами
М г'> Р) = ( " ) Р*{1 ~ Р ) п~ 1, » = 0. 1. • ■ (1-2.2)
где
{") = » ( „ - 0 1 ■ (12' 3)
к\ = 1-2-3- ...-{к — 1)6, 0! = 1. (1.2.4)
Величина «£!» читается «& факториал», величина называется
«биномиальный коэффициент» и читается «число сочетаний из п
1.2. Наиболее употребительные одномерные распределения 415
i= 1
с законом распределения
Рг ( y = - ^ - ) = м » , Р)> ¿ = 0, . . ., п. (1.2.6)
Ее среднее и дисперсия равны соответственно р и р (1 — р)/п.
, м = 7 § Г 7 ю ,р - т ( ^ У ’
— о о -< л :< ;о о , а > 0 , — о о < {_ 1 < о о . (1.2.12)
f (г) = - ¡ т ^ г ехр ( - i r ) ’
Окончательно,
Рг (25 < Х < 5 1 ) = Рг(Х < 51) — Рг (X с 25) =
= Р г ( 2 < 1.05) — Рг (г с - 0 .2 5 ) =
= 0.8531 - 0.4013 = 0.4518.
4. Если X распределена как N (р, а 2), то при постоянных а и Ь
случайная величина ¥ = а + ЬХ имеет распределение N (а +
+ Ь\и, Ь2а2).
5. Если Х г распределена как N ([%, а2), Х 2 — как N (ц2.
о1), ..., Х к — как N ((.I*, о!) и Х ь ..., X* взаимно независимы,
ь.
то случайная величина V = а 4- 2 6г-Хг (где а , Ь х....... Ьк — кон-
¡=1
станты) также распределена по нормальному закону со средним
к. к
а+ и дисперсией 2] Ь\о]. Следовательно, линейная ком-
1=1 ¿=1
бинация независимых нормально распределенных случайных ве
личин — тоже нормально распределенная величина. Более общий
результат приведен в разд. 1.6.
6. Многие наблюдаемые явления подчиняются приблизительно
нормальному закону распределения. По этой причине основная
часть классической статисгической теории предполагает нормаль
ность рассматриваемой случайной величины. Как будет показано
далее, другое основание для поддержания предположения о нор
мальности дает нам центральная предельная теорема, а третье —
то, что некоторые полезные статистические теории не слишком
сильно зависят от этого предположения.
Пример 1.1.1 (продолжение). Чтобы сформулировать вероят
ностные утверждения относительно величины X, равной измене
нию диастолического давления вследствие приема лекарства,
врач предполагает, что X распределена нормально со средним
(.1 = 30 мм рт. ст. и стандартным отклонением а = 20 мм рт. ст.
Воспользовавшись замечанием 1.2.2.3, он может вычислить инте
ресующие его вероятности. Поскольку значения ц и сг совпадают
с использованными в этом замечании, он может сделать выводы,
что (в предположении нормальности):
a) 40.13 % его пациентов, принимающих это лекарство, пока
жут снижение систолического кровяного давления не более
25 мм рт. ст.;
b) 14.69 % его пациентов покажут снижение большее или
равное 51 мм рт. ст.;
c) 45.18 % его пациентов покажут снижение в диапазоне от
25 до 51 мм рт. ст.
Заметим, что, поскольку эти три возможности исчерпывают
все выборочное пространство, суммарный процент равен 100 %.
1.2. Н аиболее употребительные одномерные распределения 421
г - - ш - (Г2Л5а)
имеет распределение Стьюдгнта с параметром V. Параметр V
представляет собой число степеней свободы. Плотность распределе
ния Т им еет вид
/40 =
Р
\ 2 Ч
I !
( V - (■у+! )/2
V Л'Я |
'Ч
+
ф
V 2
- о о ’< ; £ < оо, V = 1, 2 , (1.2.15в)
{( *)
1.2.8. /•'-распределение
Если случайная величина и имеет распределение х2 Ю> а У —-
распределение %2 (у^) и величины и и V независимы, то случайная
величина
и/^ (1.2.16)
V/*,. ' ;
f(ш)
“ »>* 0» V, = 1, 2, . . (1.2.17)
14*
Таблица 1.2.1
Наиболее распространенные одномерные распределения
Таблица
Р аспределение Тип Закон или плотность распреЬе СреЪнее Д и спер сия в приложении П
-)!
/(.) Н е пр е р ы вн о е 5
/2](»+1)/2 V—2
1+ “
^ № 1 1 V
(г г
/г0'„1'2) Н епреры вное
уг-2 ^,(1>2-2)2(у2-4)
г ) ! ( ■ ♦ ¥ ) .............
1.3. Выборки из генеральной совокупности 425
1.2.9. Резюме
В 'табл. 1.2.1 собраны в с е восемь распределений, рассмотренных
в этом разделе. Д ля каж дого распределения приведены: его тип,
закон или плотность распределения, среднее, дисперсия и ссылка
на соответствующую таблицу в приложении II.
I I
¿=1
р = je = — V *
« ¿тЛ
1= 1
Э то— несмещенная оценка. Из центральной предельной теоремы
следует, что при больших п выборочное распределение р является
приблизительно нормальнымсо средним р и дисперсией р (1— р)/п,
т. е. р имеет приблизительно распределение N (р, р (1 — р)/п)
для больш их п.
1.4. Оценка парам етров генеральной совокупности 433
1 . 5 . П р о в е р к а г и п о т е з
# 0 верна Н 0 не верна
Ош ибка Верное
Отвергнуть Н 0 первого рода, решение,
вероятность а вероятность I- ■Р
Верное Ошибка
П ринять / / „ решение, второго рода,
вероятность 1— а вероятность р
В примере 1.1.1 обозначим через хс критическое значение х.
Д ля вычисления вероятностей а и р , связанных с этим решением,
врач изучает выборочное распределение х при условии, что верна
//„, а также выборочное распределение х. при условии, что верна Н х.
Н у л е в о е р а с п р ед е лен и е Альтернативное распред елен ие
/*“0 г ь
Область принятия Критическая область
ЛЧО,1)
Рис. 1.5 .3 . Р -зн ач ен и я для проверки гипотезы Н0: ц, = ,и,0 прн известной диспер
сии ст2. а — альтернатива Я х: u > и0; b — альтернатива Д : |х < [х0; с — аль
терн ати в а H i. ¡х =£ ц0 .
X = (1.6.1)
=Ы (1.6.3)
Г *п Хц ■ ■ х 1п-
Х ‘ *" = X» X 22 ■ ■ X 2п
(1.6.4)
.Хи X к2 ■ х 'ь ,.
4- Ц 2 ЬгЬ,о1}.
¡Ф]' / —1
4) Если Оц = 0 д л я всех г /, т. е. если 2 •— диагональная
матрица, то Х ь ..., X* взаимно независимы. В частности, если
Х г и Х ;- ( ¿ ^ у) не коррелированы , то они также и независимы.
Другие распределения могут и не обладать этим свойством.
5) Пусть Х1 = < Х 1) X ,) ', Х2 = (Х|+1, ..., Х кУ■ Тогда
условное распределение величины Х1 при условии, что X, =
— х2 = (х/+1, ..., хк)' , также явл яется многомерным нормаль
ным распределением. Компоненты вектора средних этого услов
ного распределения являются линейными комбинациями компо
нент х 2, тогда как матрица ковариаций этого условного распреде
ления не зависит от х 2 (см. замечание 1.6.1.4). Это распределение
играет важную роль в линейной регрессии (гл. 3).
2 ; „ = , “ 22 =
ь*
- Ъ 2 .
.*11 - а к. 1+- 1
4
'
_а 1, )+ 1 <?(*
+
(-V -)*]}-
1.6. Многомерное нормальное распределение 447
С татистические таблицы
Таблица I
Продолженце т а б л . 1
О
\/ \р
п
6 0 .9415 .53 14 .2621 .1780 .1 176 .0878 .0467 .0156
1 .0571 .3543 .3932 .3560 .3025 .2634 .1866 .0938
2 .0014 .09 84 .2458 .2966 .3241 .3292 .3110 .2344
3 .0000 .0146 .0819 .1318 .1852 .2195 .2765 .3125
4 .0000 .0012 .0154 .0330 .0595 .0823 .1382 .2344
5 .0000 .0001 .0015 .0044 .0102 .0165 .0369 .0938
6 .0000 .0000 .0001 .0002 .0007 .0014 .0041 .0156
7 0 •.932.1 .47 83 .2097 .1335 .0824 .0585 .0280 .0078
I .0659 .37 20 .3670 .3115 .2471 .2048 .1306 .0547
2 .0020 .1240 .2753 .3115 .3177 .3073 .2613 .1641
3 .0000 .0230 .1 147 .1730 .2269 .2561 .2903 .2734
4 .0000 .0026 .0287 .0577 .0972 .1280 .1935 .2734
5 .0000 .0002 .0043 .0115 .0250 .0384 .0774 .1641
6 .0000 .0000 .0004 .0013 .0036 .0064 .0172 .0547
7 .0000 .0000 .0000 .0001 .0002 .0005 .0016 .0078
8 0 .9227 .4305 .1678 .1001 .0576 .0390 .0168 .0039
1 .0746 .38 26 .3355 .2670 .1977 .1561 .0896 .0312
2 .0026 .1488 .2936 .3115 .2965 .2731 .2090 .1094
3 .0001 03 3! .1468 .2076 .2541 .2731 .2787 .2188
4 .0000 .0046 .0459 .0865 .1361 .1707 .2322 .2734
5 .0000 .0004 .0092 .0231 .0467 .0683 .1239 .2188
6 .0000 .0000 .0011 .0038 .0100 .0171 .0413 .1094
7 .0000 .0000 .0001 .0004 .0012 .0024 .0079 .0312
8 .0000 .0000 .0000 .0000 .0001 .0002 .0007 .0039
9 0 .9135 .38 74 .1342 .0751 .0404 .0260 .0101 .0020
1 .0830 .38 74 .3020 .2253 .1556 .1171 .0605 .0176
2 .0034 .17 22 .3020 .3003 .2668 .2341 .1612 .0703
3 .0001 .0446 .1762 .2336 .2668 .2731 .2508 .1641
4 .0000 .0074 .0661 .1 168 .1715 .2048 .2508 .2461
5 .0000 .0008 .0165 .0389 .0735 .1024 .1672 .2461
6 .0000 0001 .0028 .0087 .0210 .0341 .0743 . .1641
7 .0000 .0000 .0003 .0012 .0039 .0073 .0212 .0703
8 .0000 .0000 .0000 .0001 .0004 .0009 .0035 .0176
9 .0000 .0000 .0000 .0000 .0000 .0001 .0003 .0020
450 Приложение II. Статистические таблицы
Продолжение т а б л . 1
Таблица 2
Ф у н к ц и я р асп р ед ел ен и я N ( 0 , 1) ( р а з д . 1 . 2 . 5 ) А)
•со 01 •0 2 03 04 05 •об •0 7 08 09
П родолж ение т а б л. 2
Таблица 3
П р оц ен ти ли р а с п р е д е л е н и я %2 ( р а з д . 1 . 2 . 6 ) 1)
0.4 0
X 0.005 0.010 0 .0 2 5 0.05 0.10 0.20 0.30
П родолж ение т а б л. 3
7.8 8 10.8
1 0 .4 5 5 0.708 1 .0 7 1.64 2.71 3.84 5.02 6.63
2 1.39 1.83 2.41 3.2 2 4.61 5.99 7.38 9.21 10.6 13.8
3 2.37 2.95 3.67 4.6 4 6.25 7.81 9.35 1 1.3 12.8 16.3
4 3.36 4.0 4 4.88 5.99 7.78 9.49 11.1 13.3 14.9 18.5
5 4.35 5.13 6.06 7.29 9.24 11.1 1 2 .8 1 5 .1 16.7 20.5
6 5.35 6.21 7.23 8.56 10.6 12.6 14.4 16.8 18.5 22.5
7 6.35 7.2 8 8.38 9.8 0 12.0 14 .1 16.0 18.5 20.3 24.3
8 7.34 8.35 9.52 11.0 13.4 15.5 17 .5 20.1 22.0 26.1
9 8.34 9.41 10.7 12.2 14.7 16.9 19.0 21.7 23.6 27.9
10 9.3 4 10.5 11.8 13.4 16.0 18.3 20.5 23.2 25.2 29.6
11 10.3 1.1.5 12.9 14.6 17.3 19.7 21.9 24.7 26.8 31.3
12 11.3 12.6 14.0 15.8 18.5 21.0 23.3 26.2 28.3 3 2.9
13 12.3 13.6 1 5 .1 17.0 1 9 .8 2 2 .4 24.7 27.7 29.8 34.5
14 13.3 14.7 16.2 18.2 21.1 23.7 26.1 29.1 31.3 36.1
15 14.3 15.7 17.3 19.3 22.3 25.0 27.5 30.6 32.8 37.7
16 15.3 16.8 18.4 20.5 23.5 26.3 28.8 32.0 34.3 39.3
17 16.3 17.8 19.5 21.6 24.8 27.6 30.2 33.4 35.7 40.8
18 17.3 18.9 20.6 22.8 26.0 28.9 31.5 34.8 37.2 42.3
19 18.3 19.9 21.7 23.9 27.2 30.1 32.9 36.2 38.6 43.8
20 1 9.3 21.0 22.8 25.0 28.4 31.4 34.2 37.6 40.0 45.3
35 34.3 36.5 38.9 41.8 46.1 49.8 53.2 57.3 60.3 66.6
40 39.3 41.6 44 .2 47.3 51.8 55.8 59.3 63.7 66.8 73.4
45 44 .3 46.8 49.5 52.7 57.5 61.7 65.4 70.0 73.2 80.1
71.4 76.2 79.5 86.7
50 49.3 51.9 54.7 58.2 63.2 67.5
75 74.3 77.5 80.9 85.1 91.1 96.2 100.8 106.4 110.3 118.6
135.6 140.2 149.4
100 99.3 102.9 106.9 111.7 118.5 124.3 129.6
') Сокращ енны й вариант таблицы V из книги Hald A. «Statistical Tables and For
mulas», 1952, "Wiley, New York
Приложение 11 . С татисти ческие таблицы 455
Т аблица 4
Критические з н а ч е н и я дл я критери я согласия К олм огорова—
Смирнова (р а з д . 2 . 2 . 2 ) х)
25 21 2 2 .24 264 32
30 19 2 0 22 242 29
35 .18 .19 21 23 27
40 .2 1 .25
50 .19 .23
60 .17 .2 1
70 16 19
80 .15 .18
90 .14
100 .14
лА у / п V П V»
Таблица 5
1 ) Таблица 5 взята из табл. III книги Fisher R. A., Yates F. (1963): «Statistical
Tables fo r Biological, Agricultural and Medical Research», опубликованной издатель
ством O liver and Boyd, Edinburg, и использованной с любезного разрешения авторов
и издателей.
Т абли ц а 6
15
П роцентили Р-распределения (разд. 1.2.8) ] )
А* Афифи, С. Энзеи
90-я процентиль
1 2 3 4 5 6 7 8 9 10 12
Ж 15 20 24 30 40 60 120 00
95-я процентиль
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 00
\ \
1 161-4 199 5 215 7 224 6 230 2 234 0 236 8 238-9 240 5 241-9 243 9 245 9 248 0 249 1 250-1 251-1 252 2 253 3 254 3
2 18-51 1900 19 16 19-25 19 30 19 33 19 35 19 37 19 38 19-40 19-41 19-43 19-45 19 45 19-46 19 47 19 48 19 49 19 50
3 1013 9-55 9 28 9 12 9 01 8-94 8 89 8-85 8 81 8-79 8-74 8-70 8 66 8 64 8-62 8-59 8-57 8 55 8-53
4 7-71 6 94 6 59 6 39 6 26 6 16 6 09 6-04 6 00 6 96 5 91 5 86 5-80 5-77 5 75 5-72 5 69 5-66 5 63
5 6 6 1 5 -7 9 Я 41 5 1 9 5 05 4 95 4 88 4 -8 2 4 77 4 - 7 -» 4 -6 8 4 -0 2 4 60 •4 0 3 4 0 0 4 40 4 43 4 40 4 30
6 5-99 514 4 76 4 53 4 39 4-28 4 21 4-15 4 10 4-06 4 00 3 94 3 87 3 84 3-81 3-77 3 74 3 70 3-67
7 5-59 4-74 4-35 4-12 3-97 3-87 3 79 3 73 3 68 3 64 3 57 3 51 3 44 3 41 3 38 3 34 3 30 3 27 3 23
8 5-32 4 46 407 3 84 369 3 58 3 50 3-44 3 39 3 35 3 28 3 22 3 15 3-12 3 08 304 3 01 2 97 2-93
9 512 4-26 3 86 3 63 3 48 3 37 3-29 3-23 3-18 3 14 3-07 3 01 2 94 2 90 2 86 2 83 2 79 2 75 2-71
10 4-96 4-10 3 71 3-48 3 33 3 22 3 14 3 07 3 02 2 98 2 91 2 85 2-77 2 74 2-70 2 66 2-62 2 58 254
11 4 84 3-98 3 59 3 36 3-20 3-09 3 01 2 95 2 90 2 85 2-79 2-72 2 65 2 61 2-57 2 53 2 49 2 45 2 40
12 4 75 3 89 3 49 3-26 3 11 3 00 2 91 2-85 2 80 2 75 2 69 2-62 2-54 2 51 2-47 2 43 2 38 2 34 2 30
13 4 67 3 81 3 41 3 18 3-03 2 92 2 83 2-77 2 71 2 67 2 60 2 53 2 46 2 42 2 38 2 34 2 30 2-25 2 21
14 4 60 3 74, 3 -3 4 3 -1 1 2 96 2 85 2 76 2 70 2 6 5 2 60 2 53 2 46 2 39 2 3 5 2 31 2 27 2 22 2 18 2 13
97.5-я процентиль
1 2 3 4 5 6 7 8 9 15 24 30
X 10 12 20 40 60 120 00
1 в47 а 7Ô0 5 де4 2 900 А Q01.fi 037 1 94Я-2 956-7 963 3 968-6 976 7 984 9 993 1 997-2 1001 1006 1010 1014 1018
2 38-51 39-00 39 17 39 25 39 30 39 33 39 36 39-37 39 39 39-40 39-41 3943 39-43 39 46 30-46 30-47 39 4ß 30-40 90 50
3 17-44 16 04 15 44 15 10 14-88 14 73 14 62 14-54 14 47 14-42 14 34 14-25 14-17 14 12 14-08 14-04 13-99 13 95 13 90
4 12-22 10-65 9-98 9 60 9 36 9-20 9 07 8 98 8 90 8-84 8-75 8 66 8-56 8 51 8 46 8-41 8 36 8 31 8 26
5 1001 8 43 7-76 7 39 7-15 6 98 6 85 6-76 6 68 6-62 6-52 643 6-33 6-28 623 6 18 6 12 607 602
6 8 81 7 26 6-60 6 23 5 99 5-82 5-70 560 5 52 5-46 5-37 5-27 517 5-12 507 5-01 4-96 4-90 4-85
7 807 6-54 5 89 5 52 5 29 5 12 4 99 4 90 4 82 4-76 4-67 4 67 4-47 4-42 4 36 4 31 4-25 4-20 414
8 7 57 606 5*42 505 482 465 443 4'3б 4*30 4*20 410 100 3 95 3 89 3-84 3-78 3 73 3-67
453
9 7-21 571 508 4-72 4-48 4 32 4-20 4 10 4 03 3 96 3-87 3 77 3 67 361 356 351 3'4б 339 333
10 6 94 5 46 4 83 4-47 4-24 4-07 3 95 3 85 3-78 3-72 3-62 3-52 3-42 3-37 331 3-26 3-20 314 308
11 6-72 5-26 4-63 4-28 4 04 3-88 3-76 3-66 3-59 3-53 3 43 3 33 3 23 3 17 3-12 3-06 3 00 2-94 2-88
12 6-55 510 4-47 4 12 3-89 3 73 3 61 3-51 3 44 3-37 3-28 3-18 3 07 3-02 2-96 291 2-85 2-79 2-72
13 6 41 4-97 4-35 4-00 3-77 3 60 3-48 3 39 331 3-25 315 305 2-95 2-89 2 84 2-78 2-72 2 66 2 60
14 6-30 4-86 4-24 3-89 3-66 3-50 3-38 3-29 3 21 315 305 2-95 2-84 2-79 2-73 2 67 2 61 265 2-49
15 6-20 477 416 3 80 3 58 341 3 29 3-20 3-12 3-06 2 96 2-86 2 76 2-70 2-64 2 59 2-52 2 46 2 40
16 6 12 4-69 4-08 373 3 50 334 3 22 3-12 305 299 289 2-79 2-68 2*63 257 2-51 2 45 2-38 2-32
17 6-04 4-62 4 01 3 66 3 44 3 28 3-16 3 06 2-98 2-92 2-82 2-72 2 62 2-56 2-50 2-44 2 38 2-32 2-25
18 5-98 4 56 3-95 3 61 3 38 3 22 3-10 3 01 2 93 2-87 2-77 2 67 2 56 2-50 2-44 2 38 2-32 2-26 2 19
3-90 3 56 3-33 3 17 2 96 2-82 2-72 2 62 2 51 2 45 2 39 2 33 2-27 2-20 2-13
• 19 5-92 4 51 3 05 2-88
20 5-87 4 46 3-86 3-51 3 29 3 13 3-01 2-91 2-84 2-77 2-68 2-57 2-46 2-41 2-35 2-29 2-22 2-16 2-09
21 5 83 4-42 3-82 3 48 3 25 3 09 2-97 2-87 2-80 2-73 2 64 2-53 2 42 2-37 2-31 2 25 2-18 2-11 2-04
22 5-79 4 38 3-78 3 44 3-22 3 05 2-93 2-84 2 76 2-70 2-60 2-50 2 39 2 33 2-27 2 21 2-14 2-08 2 00
23 5-75 4 35 3 75 3 41 3 18 302 2-90 2-81 2-73 2-67 2-57 2 47 2-36 2-30 2-24 2-18 2 11 2-04 1 97
24 5-72 4-32 3 72 3 38 3 15 2 99 2 87 2-78 2-70 2 64 2 54 2 44 2 33 2-27 2-21 2 15 2-08 201 1-94
25 5 69 4-29 3 69 3 35 3 13 297 2-85 2-75 2-68 261 2 51 2 41 2 30 2-24 218 2-12 2-05 1-98 1-91
26 5 66 4-27 3 67 3 33 310 2-94 2-82 2-73 2 65 2 59 2-49 2-39 2-28 2-22 2-16 2-09 2-03 1 95 1-88
27 563 4 24 365 3 31 3-08 2-92 2-80 2-71 2-63 2-57 2 47 2 36 2 25 2 19 2 13 2 07 2-00 1 93 1-85
28 5 61 4-22 3 63 3-29 3-06 2-90 2-78 2 69 2 61 2 55 2-45 2 34 2 23 2 17 2 11 2-05 1-98 1 91 1-83
29 5 59 4 20 3 61 3 27 3-04 2-88 2-76 2 67 2-59 2-53 2 43 2-32 2 21 2-15 2-09 2-03 1-96 1-89 1-81
30 5-57 4-18 3-59 3-25 3-03 2 87 2 75 2-65 2-57 2 51 2-41 2 31 2-20 2-14 2-07 2-01 1 94 1-87 1-79
40 5-42 4-05 3 46 3 13 2 90 2-74 2 62 2 53 2-45 2-39 2-29 2-18 2-07 2-01 1-94 1-88 1-80 1-72 1-64
60 5-29 3 93 3 34 3 01 2-79 2 63 2 51 2 41 2 33 2-27 2-17 2-06 1-94 1-88 1 82 1-74 1-67 1 58 1*48
120 515 3-80 3 23 2-89 2 67 2-52 2-39 2-30 2-22 2-16 2 05 1-94 1-82 1-76 1 69 1-61 1 53 1-43 1-31
со 502 3 69 312 2 79 2-57 241 2-29 2 19 2 11 гё-05 1-94 1-83 1*71 1-64 1-57 1-48 1-39 1-27 1-00
П родолж ен ие т абл. 6
9 9 -я процент иль
\ У
\ 1 1 2 3 4 5 6 7 6 9 10 12 15 20 24 30 40 60 120 оо
V 4
i 4052 4999-5 5403 5625 5764 5859 5928 5981 6022 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366
2 98 50 99 00 99-17 99 25 99 30 99 33 99 36 99 37 99 39 9940 99-42 99-43 99-45 99-46 99-47 99-47 99 48 99-49 99 50
3 34 12 3082 29-46 28 71 28-24 27-91 27-67 27 49 27 35 27-23 27-05 26 87 26 69 26-60 26 50 26-41 26 32 26-22 26-13
4 21 20 1800 16 69 15-98 15-52 15-21 14-98 14 80 14 66 14-55 14-37 14-20 14 02 13 93 19 84 13-75 13 00 1Э 60 13 40
5 1626 1327 12 Об 11 39 1007 1067 10 46 10 29 10-16 10 05 9 89 9-72 9 55 9-47 9 38 9 29 9 20 9-11 9-02
6 13 75 10-92 9 78 9-15 8-75 8 47 8-26 8 10 7-98 7-87 7-72 7-56 7*40 7 31 7-23 714 706 6-97 6-88
7 12 25 9-55 8-45 7 85 7-46 719 6-99 684 6-72 662 647 631 6-16 607 5-99 5 91 5-82 5-74 5-65
8 11 26 865 7-59 7 01 6 63 637 6 18 6 03 5-91 5-81 5 67 5-52 536 5-28 5-20 512 503 4-95 4-86
9 1056 802 699 642 606 5-80 561 547 5-35 5 26 511 4 96 4 81 4 73 4 65 4-57 4-48 4-40 4 31
10 1004 7-56 6 55 599 564 5-39 5-20 5 06 4-94 4-85 4-71 4 56 4-41 4 33 4 25 4-17 4 08 4 00 3-91
11 9 65 7*21 6 22 5 67 532 5 07 4 89 4 74 4 03 494 4-40 4*25 4-10 402 3-04 386 3 78 3 69 3-60
12 9*33 6*93 5-95 541 508 4-82 4-64 4-50 4-39 4-30 4 16 4-01 3-86 3-78 3-70 3-62 3-54 3-45 3-36
13 907 6-70 5-74 5 21 4 86 4 62 4-44 4 30 4 19 4-10 3 96 3 82 3-66 3 59 3-51 3 43 3 34 .3-25 3-17
14 8 86 6-51 5-56 5 04 4 69 4 46 4-28 4 14 403 Î-94 3-80 3-66 3*51 343 3 35 3-27 318 3 09 3-00
15 8-68 6 36 5 42 4 89 4-56 4 32 414 400 3-89 3-80 367 352 3-37 3 29 3-21 3 13 305 2 96 2-87
16 8-53 623 5-29 4-77 4-44 4-20 4-03 3 89 3-78 3 69 3-55 3 41 3 26 3-18 3-10 3-02 2-93 2-84 2-75
17 8 40 6-11 518 4-67 4-34 4-10 3 93 3-79 3 68 3-30 9 40 3 31 3 10 3 08 3 00 2-92 2*83 275 2-65
18 8 20 0 01 OQ9 4 08 4*25 401 3-84 371 360 3-51 3 37 3 23 3-08 300 2-92 2-84 2-75 2-66 2-57
19 8 18 593 501 4 50 4-17 3-94 3-77 363 3-52 3-43 3 30 3 15 3 00 2-92 2-84 2-76 2-67 2-58 2-49
20 8 10 585 4 94 4-43 410 3-87 3-70 3-56 3-46 3 37 3 23 3 09 2 94 2 86 2-78 2-69 2-61 2 52 2-42
21 8 02 5-78 4-87 4 37 4-04 3-81 3 64 3 51 3 40 331 3 17 303 2-88 2-80 2-72 2 64 2-55 2 46 2-36
22 7 95 5-72 4 82 4 31 3-99 3-76 3 59 3-45 3 35 3 26 3-12 2 98 2 83 2-75 2 67 2-58 2-50 2 40 2-31
23 7-88 5 66 4 76 4 26 3 94 3-71 3-54 341 3 30 3 21 3-07 2 93 2-78 2 70 2 62 2 54 2-45 2 35 2-26
24 7-82 561 4-72 4-22 3 90 3-67 3 50 3-36 3-26 3-17 3 03 2 -8» 2 74 2 00 2 08 2-49 2-40 2*31 2*21
25 7-77 5 57 4 68 4 18 3 85 3 63 3 46 3 32 3-22 3 13 2 99 2-85 2-70 2 62 2-54 2-45 2-36 2 27 2-17
26 7-72 5 53 4 64 4 14 3 82 3-59 3 42 3 29 3 18 3 09 2 96 2 81 2-66 2-58 2 50 2-42 2-33 2-23 213
27 7-68 549 4 60 4 11 3 78 3-56 339 3 26 315 3 06 293 2-78 2 63 2-55 2 47 2-38 2-29 2 20 2-10
28 7-64 545 4 57 4 07 3-75 3-53 3 36 3 23 3 12 3 03 2 90 2-75 2-60 2-52 2-44 2 35 2-26 2 17 2 06
29 7-60 5-42 4 54 4 04 373 3-50 3 33 3-20 3 09 3 00 2 87 2 73 2-57 2 49 2 41 2-33 2-23 2-14 2-03
5 39 4 51 4 02 3 70 3 47 3 30 3 17 307 2 98 2-84 2-70 255 2 47 2 39 2-30 2 21 2 11 2-01
30 7-56 1-92 1-80
40 7-31 518 4 31 3 83 3 51 3-29 3 12 2 99 ‘ 2-89 2 80 2 66 2-52 2-37 2-29 2-20 2-11 2 02
60 708 4-98 4 13 3 65 3 34 3 12 2-95 2 82 2-72 2 63 2 50 2 35 2 20 2 12 2 03 1-94 1-84 1-73 1-60
120 6 85 4 79 3 95 3 48 3 17 2 96 2 79 2 66 2 56 2 47 2 34 2 19 2-03 1-95 1-86 1-76 1 66 1-53 1-38
со 663 4 61 3 78 332 302 • 280 264 2-51 2 41 2 32 2 18 2 04 1-88 1-79 1-70 1-59 1 47 1 32 1-00
П родолж ен ие т абл. 6
99.5-я проценгпиль
V ' 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 оо
• к
1 16211 20000 21615 22500 23056 23437 23715 23925 24091 24224 24426 24630 24836 24940 25044 25148 25253 25359 25465
2 198 3 199 0 199 2 199-2 199 3 199 3 199 4 199 4 199 4 199 4 199 4 199 4 199 4 199 5 199 5 199 5 199 5 199-5 199 5
1 3 55*55 4980 47 47 •4619 45 39 44 84 44 43 44 13 43 88 43 69 43 39 43 08 42-78 42 62 42 47 42 31 42-15 41 99 41 83
4 31 33 26 28 24 26 23 15 22 46 21-97 2162 21 35 21 14 20 97 20 70 2044 20*17 2003 19 88 1975 1961 1947 19 32
5 22-78 18 31 16 53 15 56 14 94 14 51 14 20 13 96 13 77 13 62 13 38 3-15 12-90 12 78 12 66 12 53 12 40 12 27 12 14
6 1863 14 54 12-92 12 03 11 46 11-07 1079 1057 1039 10 25 1003 9 81 9 59 9 47 9 36 9 24 9 12 9 00 8 88
7 16 24 12 40 10 88 10 05 9 52 9 16 8 89 8 68 8 51 8 38 8 18 7-97 7-75 7-65 7-53 7-42 7-31 7 19 708
8 14 69 11 04 9 60 8 81 8-30 7-95 7 69 7-50 7-34 7-21 7 01 681 6 61 в 50 6 40 6 29 6 18 6 06 5 95
9 13 61 10 11 8-72 7-96 7-47 7-13 688 6 69 6 54 6 42 623 603 5 83 5 73 5 62 5 52 541 5 30 5 19
10 1283 943 808 734 в 87 6-54 630 6 12 5 97 5 85 5 66 б 47 б 27 б 17 5 07 4 97 48в 4 76 4 04
И 12 23 8 91 7 60 688 в-42 6 10 5-86 5 68 554 542 524 505 4-86 . 4 76 465 4 55 444 4 34 4 23
12 11 75 8 51 7-23 6-52 6-07 5-76 5 52 5 35 5 20 509 4 91 4-72 4 53 4 43 4 33 4 23 4 12 401 390
13 11-37 8 19 6 93 6 23 5-79 5 48 5 25 5 08 4 94 4 82 4 64 4-46 4-27 4-17 4 07 3 97 3 87 3 76 3 65
14 11 06 7-92 668 600 5 56 5 26 5 03 4 86 4 72 4 60 4 43 4 25 4 06 3 96 3 86 3 76 3 66 3 55 3 44
15 1080 7-70 6-48 5-80 5 37 5-07 4 85 4 67 4-54 442 4 25 407 3-88 3-79 3 69 3 58 3 48 3-37 3-26
16 10 58 7 51 630 5 64 5-21 4 91 4 69 4 52 4-38 4-27 4-10 3-92 3 73 3 64 3 54 3 44 3 33 3 22 3 11
17 10 38 7 36 6 16 5-50 5-07 4-78 4 56 4 39 4 25 4 14 3 97 3-79 3 61 3 51 3-41 3 31 3 21 3 10 2-98
18 10 22 7-21 603 5-37 4 96 4 66 4 44 4 28 4 14 4-03 3 86 368 3 50 3 40 3 30 3 20 3-10 2-99 2-87
1» 1007 709 5 92 5-27 4-85 4 56 4 34 4 18 4 04 3 93 3 76 3-59 3 40 3 31 3 21 3 11 3 00 2 89 2-78
20 9 94 6 99 5-82 5-17 4-76 4-47 4-26 4-09 3-96 3 85 3-68 3 50 3 32 3 22 3 12 302 2-92 2-81 2-69
21 9-83 6 89 5-73 5 09 4-68 4 39 4 18 4-01 3 88 3 77 3-60 343 3 24 3 15 3 05 2 95 2-84 2-73 2-61
2:\ 9-73 681 5 65 5 02 4 61 4 32 4 11 3 94 3 81 3 70 3-54 3 36 3 18 3 08 2-98 2 88 2-77 2 66 2 55
23 9 63 6 73 5 58 4 95 4 54 4 26 4 05 3-88 3 75 3 64 3 47 3 30 312 302 2 92 2 82 2-71 2 60 2 48
24 955 6 66 5-52 4 89 4-49 4 20 3-99 3 83 3 69 3-59 3-42 3 25 3 06 2 97 2-87 2-77 2-66 2 55 2 43
25 9-48 6 60 546 4 84 4 43 4 15 3 94 3-78 3 64 3 54 3-37 3-20 3 01 2-92 2-82 2 72 261 2 50 2 38
26 9 41 6 54 541 4-79 4 38 4-10 3 89 3 73 3 60 3 49 3 33 3 16 2 97 2 87 2 77 2 67 2-56 2 45 2 33
27 9 34 6 49 5-36 4-74 4 34 4 06 3 85 3 69 3-56 3 45 3 28 3 11 2 93 2 83 2 73 2 63 2-52 2 41 2 29
24 928 6 44 5 32 4 70 4 30 4 02 3 81 3 65 3-52 3 41 3 25 3 07 2-89 2-79 2 69 2-59 2-48 2 37 2 25
29 9 23 6 40 5 28 4 66 4-26 3 98 3-77 3 61 3-48 3 38 3 21 3 04 2 86 2-76 2 66 2 56 2-45 2 33 2-21
99.9-я процентиль
1 2 3 4 5 6 7 8 12
X 15 20 24 30 40 60 120 00
1 4053* 5000* 5404* 5625* 57G4* 5859* 5929* 6981* 6023* 6056* 6107* 6158* 6209* 6235* 6261* 6287* 6313* 6340* 6366*
2 998-5 999-0 999-2 999-2 999-3 999 3 999 4 999 4 999 4 999 4 999 4 999 4 999 4 999-5 999 5 999 5 999 5 999-5
3 167-0 148 5 1411 137 1 134-6 132-8 131 6 999 5
130 6 129-9 129 2 128 3 127 4 126-4 125-9 125 4 125 0 124 5 124-0 123 5
4 7414 6126 56 18 53 44 51*71 50 53 49-66 49 00 48-47 48 05 47-41 46-76 46 10 45-77 45 43 45 09 44 75 44 40 44 05
5 47 18 37 12 33 20 31 09 29 75 28 84 28 16 27 64 27 24 26 92 26 42 25 91 25 39 25 14 24 87
6 35-51 27-00 23 70 21 92 20 81 20 03 24 60 24 33 24 06 23 79
7 29-25 18-77
19 46 19 03 18 69 18-41 17 99 17 56 17 12 16-89 16 67 16 44 16-21 15 99 15 75
21-69 17-19 16 21 15 52 15 02 14 63 14 33 14 08 13 71 13 32 12 93 12 73 12 53 12 33 12 12 11 91 11-70
8 25 42 18-49 15-83 14 39 13 49 12 86 12 40 12 04 И 77 11 54 11 19 10 84 10 48 10 30
9 22-86 16-39 13-90 1171 10-11 9 92 9-73 9-53 9-33
12-56 1113 10 70 10 37 10 11 9 89 9 57 9 24 8 90 8 72 8 55 8 37 8-19 8-00 7-81
10 21-04 14 91 12 55 11-28 10 48 9 92 9 52 9 20 8 96 8-75 8 45 8 13 7-80 7 64 7 47 7 30 7-12
11 19 69 13 81 11-56 6 94 6 76
10 35 9 58 9 05 8 66 8 35 8 12 7 92 7 63 7 32 701 6'85 6 6Я 6-52 6 3." 6 17 в оо
12 1»64 12 07 10«О У03 » »У Ö39 Ö00 7 71 7-4» 7-2У 700 6 71 640 625 609 593 5 76 5 59 5 42
13 17 81 12 31 1021 9 07 8 35 7-86 7-49 7 21 6 98 6 80 6 52 6 23 5 93 5-78
14 5 63 5 47 5 30 5 14 4-97
17 14 11-78 9 73 8 62 7 92 7 43 7 08 6 80 6 58 640 6 13 5 85 5 56 5 41 5 25 5 10 4 94 4-77 4 60
15 16-59 11 34 9-34 8-25 7-57 7 09 6 74 6 47 6 26 6 08 5 81 5 54 5 25 5 10
16 16 12 10 97 9-00 7-94 4-95 4 80 4 64 4-47 4 31
7-27 6 81 6 46 6 19 5 98 5 81 5 55 5 27 4 99 4 85 4 70 4 54 4-39 4 23 4 06
17 15-72 10 66 8-73 7-68 7-02 6 56 6 22 5 96 5-75 5 58 5 32 5 05 4-7« 4 63 4-4Й 4 33 4 18 4 02 3 85
18 15-38 10 ЗУ 6-19 7 40 ÖÖ1 6 35 602 5 70 5 56 5 39 5 13
19 4 87 4-59 4 45 4 30 4 15 4 00 3 84 3 67
15-08 10 16 8-28 7-26 6-62 6 18 5 85 5 59 5 39 5 22 4 97 4 70 4 43 4 29 4 14 3 99 3 84 3 68 3-51
20 14-82 9-95 8 10 7 10 6 46 602 5-69 5 44 524 5 08 4 82 4-56 4-29 4-16 4 00 3 86
21 14-59 9-77 7-94 6 95 6-32 5 88 5 56 5 31 5 11 4 95 4 70 4 44 •417 4 03 3-88 3 74
3-70 3 54 3 38
22 14 38 9 61 7-80 6 81 6*19 5 76 5 44 5 10 4 99 4 83 4-58 4 33 4 06 3 92 3 78 3 63
3 58
3 48
3-42
3 32
3 26
3 15
23 14-19 9-47 7 67 6 69 6-08 5-65 5 33 5 09 4 89 4 73 4-48 4 23 3-96 3 82
24 1403 9 34 7-55 в 59 5-98 3 68 3 53 3 38 3 22 3 05
5 55 5 23 4 99 4 80 4 64 4 39 4 14 3-87 3 74 3 59 3 45 3 29 3 14 2 97
25 13 88 0 22 7 40 0 49 о-в» 0 40 5 15 4 91 4 71 4 56 4 31 4 06
26 3-79 366 3 52 3 37 3 22 3 06 2 89
13 74 912 7-36 6 41 5-80 5 38 5-07 4 83 4 64 4 48 4 24 3 99 3 72 3 59 3 44 3 30 3 15
27 13 61 9 02 7-27 6 33 5 73 5 31 5 00 4 76 4 57 2 99 2 82
4 41 4'17 3 92 3-66 3 52 3 38 3 23 3 08 2 92 2-75
28 13 50 8 93 719 6 25 5-66 5 24 4 93 4 69 4 50 4 35 4-11 3-86 3-60 3 46 3 32 3 18 3 02
29 13 39 8 85 7-12 6 19 5 59 5 18 4 87 4 64 2 86 2 69
4 45 4 29 4-05 3-80 3 54 3 41 3 27 3 12 2 97 2 81 2 64
30 13-29 8-77 705 6 12 5 53 5 12 4 82 4 58 4 39 4 24 4 00 3-75 3-49 3 36 3 22 3-07
40 12-61 8-25 6-60 5-70 5 13 4-73 4 44 4 21 2 92 2 76 2 59
4 02 3 87 3 64 3 40 3 15 3 01 2 87 2 73 2 57 2 41 2 23
60 .1-97 7-76 6 17 5-31 4 76 4-3"’ 4-09 3 87 3 69 3 54 3 31 3 08 2 83 2 69 2 55 2 41 2 25 2 08 1 89
120 11-38 7-32 5-79 4 95 4 42 4 04 3 77 3 55 3-38 3 24 302 2 78 2 53 2-40 2 26
со 10-83 6 91 5-42 4 62 4 10 3 74 3 47 3 27 3 10
2 11 1 95 1-76 1 54
2 96 2-74 2 51 2 27 2 13 1 99 1 84 1 66 1 45 1 00
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
X
1 8-93 13-44 16-36 1849 20-15 2151 22-64 23 62 24 48 25 24 25-92 26-54 2710 27-62 28-10 28 54 2896 29 35 29-71
2 413 5 73 6-77 7*64 8*14 863 905 0-41 9-12 10-01 10-26 1049 10-70 108У 11 07 1124 11-39 11 54 11 68
3 3 33 4-47 6-20 5-74 61в 6 51 6-81 7-06 7-29 7-49 7-67 7-83 7-98 8-12 8-25 837 8-48 858 8-68
4 301 3-98 4-59 503 5-39 5-68 5 93 614 6 33 6 49 6-65 6-78 6 91 7-02 7-13 7 23 7 33 7-41 7-50
5 Ч-85 3 72 4-26 4-66 4-98 5-24 546 5 65 5-82 6-97 6-10 6-22 634 6-44 6-54 6 63 6-71 6-79 6-86
6 •76 3 56 4-07 4 44 4-73 497 5 17 5-34 5-50 5-64 5-76 5-87 5-98 6-07 6-16 6-25 6-32 6-40 6-47
7 •08 3 45 393 4-28 4 55 4-78 4-97 514 6 28 6 41 6 53 6 64 6-74 5-83 5-91 5-99 6 06 6 13 6 19
8 2 63 3 37 3 83 4 17 4 43 4-65 4-83 4 09 5 13 б25 6-36 5-46 6-56 5-64 5-72 5-80 5-87 5-93 600
9 2-59 3 32 3-76 408 4-34 4-54 4-72 4-87 501 513 5 23 5 33 5 42 5-51 5-58 5 66 5-72 5 79 5-85
10 2-56 3-27 3-70 4 02 4-28 4 47 4-64 4-78 4 91 603 513 523 5 32 5*40 5-47 5-54 561 5-67 5-75
п 2-54 3-23 3-66 3-96 4-20 4-40 4-57 4-71 4-84 4-95 6-05 615 6-23 5 31 5-38 5 45 5-51 6-57 5-63
12 2-62 3-20 3-62 3-92 416 4-35 4-51 4-65 4-78 4 89 4-99 5-08 5-16 5 24 5 31 5-37 5-44 5-49 5-5Л
13 2-60 318 3-59 3-88 4 12 4 30 4-46 4-60 4-72 4-83 4-93 5-02 5-10 518 5-25 5-31 5 37 5 43 5 48
14 2-49 316 3-56 3-85 4-08 4-27 4 42 4-56 4-68 4 79 4-88 4-97 5-05 512 519 5 26 5-32 5 37 5-43
15 2-48 314 354 3-83 4 05 4-23 4-39 4-52 4-64 4-75 4-84 4 93 5-01 5-08 515 5-21 5-27 6-32 5-38
16 2-47 312 3-52 3-80 4-03 4-21 4-36 4-49 4 61 4-71 4-81 4-89 4-97 5-04 6! 1 617 5-23 5-28 5-33
17 2 40 311 3-50 3-78 4-00 4 18 4 33 4 46 4-58 4-68 4-77 4-86 4 93 5-01 6-07 513 5-19 5-24 5-30
18 2-45 310 3-49 3-77 3-98 4-16 4 31 4 44 4 55 4 65 4-75 4-83 490 4-98 5-04 5-10 5-16 5-21 5 26
!9 2-45 3-09 347 3-75 3-97 414 4-29 4-42 463 4-63 4-72 4-80 4-88 4-95 5-01 5-07 5-13 5-18 6 23
20 2-44 308 3-46 3-74 3-95 412 4-27 4-40 4 61 461 4-70 4-78 4-85 4-92 4-99 5-05 5-10 516 5 20
24 2-42 306 3-42 3-69 3-90 4-07 421 4-34 4 44 4-64 4-63 4-71 4-78 4-85 4-91 4-97 5-02 507 512
30 2-40 3-02 3-39 3-65 3-85 4-02 4-16 4-28 4-38 4-47 4-56 4-64 4-71 4-77 4-83 4-89 4-94 4 99 5-03
40 2-38 2-99 3-35 3-60 3-80 3-96 4 10 4-21 432 4 41 4-49 4-56 4-63 4-69 4-75 4 81 4-86. 4 90 4-95
ЬО 2-36 2-96 3 31 3-56 3-75 3-91 4-04 4 16 425 4 34 4 42 4-49 4 56 4 62 4-67 4-73 4-78 4-82 4-86
120 2-34 2-93 3 28 3-52 3-71 3-86 3-У9 410 4-19 4-28 4-35 4-42 4-48 4-64 4-60 4-65 4-69 4-74 4-78
оо ( 2-33 2-90 3-24 3-48 3-66 3-81 3-93 4-04 > 4-13 421 4-28 4-35 4-41 4-47 4-52 4-67 4-61 4-65 4-69
П родолж ение т абл. 7
95-я процентиль
X 1
2
2
17-97
608
3
26-98
8-33
4
32-82
9-80
5
37-08
10-88
6
40-41
11-74
7
43 12
1244
8
45-40
13-03
9
47-36
13-54
10
49-07
13-99
11
50-59
14-39
12 13
51-96 53-20
14-75 15-08
14
54 33
15-38
15
55-36
15-65
16
56-32
15-91
17
57-22
16-14
18
58-04
16-37
19
58-83
16-57
20
59 56
16-77
3 4-50 5-01 6-82 7-50 8-04 8-48 8-85 9-18 9-46 9-72 9-95 10-15 10-35 10-52 10-69 10-84 10-98 Ul i 11-24
4 3-93 504 5-76 6-29 в-71 7-05 7-35 7-вО 7-аз в-оэ 0-21 Ö-37 8*02 8-66 8-79 891 9-03 013 9-23
5 3*64 4-60 5-22 5-в7 воз в33 в-58 6-80 6-99 7-17 7-32 7-47 7-60 7-72 7-83 7-93 8-03 8-12 8-21
6 3-46 4-34 4-90 530 5-63 5-90 6-12 в32 6-49 0-65 6-79 в92 7-03 7-14 7-24 7-34 7-43 7-51 7-59
7 3-34 416 4-68 5-06 5-36 5-61 5-82 6-00 616 6-30 6-43 6-55 6-66 6-76 6-85 6-94 7-02 7-10 7-17
8 3-26 4-04 4-53 4-89 5-17 5-40 5-60 5-77 5-92 6-05 6-18 6-29 6-39 6-48 6-57 6-65 6-73 6-80 6-87
9 3-20 3-95 4-41 4-76 5-02 6-24 5-43 5-59 5-74 5-87 5-98 6-09 6-19 6-28 в-зв в-44 в-51 в-58 в-64
10 315 3-88 4-33 4-65 4-9! 5-12 5-30 б-4в 5-00 5 72 0 09 Ö-83 оиз 6-11 6*19 6-27 в-34 6-40 6-47
И 311 3-82 4-26 4-57 4-82 5-03 5-20 5-35 5-49 561 5-71 5-81 5-90 5-98 6-06 6-13 6-20 6-27 в33
12 308 3-77 4-20 4-51 4-75 4 95 5 12 5-27 5-39 551 5-61 5-71 5-80 588 6-95 6-02 6-09 615 6-21
13 306 3-73 4 15 4-45 4-69 4 S8 5-05 519 5-32 5 43 5-53 563 6-71 5-79 5-86 5-93 5-99 6-05 6-11
14 303 3-70 4 11 441 4-64 4 КЗ 4-99 5-13 5-25 5 36 5-46 5-55 5-64 5-71 5-79 5-85 5-91 5-97 6-03
15 301 3-67 4-08 4-37 4-59 4-78 4-94 5-08 5-20 5 31 5-40 5-49 5-57 5-65 5-72 5-78 5-85 5-90 5-96
16 300 3-65 405 4 33 4-56 4-74 4-90 5-03 515 5 26 5-35 5-44 5-52 5-59 5-66 5-73 5-79 5-84 5-90
17 2-98 3-63 402 4 30 4-52 4-70 4-86 4-99 5-11 5 21 5-31 5 39 5-47 5-54 5-61 5в7 5-73 5-79 5-84
18 207 3-61 4 00 4-28 4-40 4 67 4-82 4-90 Ö07 017 ÖZ7 3*35 6-43 5-50 5-57 563 5-69 5-74 5-79
i 20
IV 2*96 3-59 3-98 4-25 4-47 4-65 4-79 4-92 5-04 5-14 5-23 5-31 5-39 546 5-53 5-59 5-65 5-70 5-75
2-95 3-58 396 4-23 4-45 4(2 4-77 4-90 5-01 5 11 5-20 5-28 б-Зв 5-43 5-49 5-55 5 61 5-66 5-71
24 2-92 3-53 390 4-17* 4-37 4-54 4-ев 4-81 4-92 501 5-10 5-18 6-25 5-32 5-38 5-44 5-49 5-55 5-69
30 2-89 3-49 3 85 4-10 4-30 4 46 4-60 4-72 4-82 4-92 500 5-08 5-15 5-21 5-27 5-33 5-38 5-43 5-47
40 2-86 3-44 3-79 4-04 4-23 4-39 4-52 4-63 4-73 4-82 4-90 4-98 504 5-11 5-16 5-22 5-27 5-31 5-36
60 2-83 3-40 3-74 3-98 4-16 4-31 4 44 4-55 4-05 4-73 4-81 \ 4-88 4-94 5-00 5-06 5-11 5-15 5-20 5-24
120 2-80 з-зв 368 3-92 4-10 4-24 4-36 4-47 4-56 4-64 4-71 4-78 4-84 -Î-90 4-96 500 5-04 5-09 5-13
00 , 2-77 3-31 3 63 3-86 4-03 4-17 4-29 4-39 4-47 4-55 4-62 4-68 4-74 4-80 4 86 4-69 4-93 V07 5*01
П родолж ен ие т абл. 7
99-я процентиль
X 1
2
2
90 03
1404
3
1350
1902
4
164-3
22-29
5
185 6 202-2
24-72 26-63
6 7
215-8
28-20
8
227-2 237 0
29-53 30-68
9 10
245-6 253-2
31-69 32 59
11 12
260-0
33-40
13
266-2
34-13
14
271-8
34-81
277-0
35-43
16
281*8
36-00
17
286-3
36-53
.8
290*4
37-03
19
294 3
37 50
20
298-0
37 95
3 8-26 1062 1217 13-33 14-24 15-00 15-64 16-20 16-69 17-13 17-53 17-89 18-22 18-52 18-81 19-07 19*32 19-55 19-77
4 6 51 812 917 9-96 10-58 1110 11-55 11-93 12-27 1257 12-84 13-09 13-32 13-53 13-73 13-91 14-08 14 1!4 14-40
5 5-70 6-98 7-80 8-42 8-91 9-32 9-67 9-97 10-24 10-48 10-70 10-89 11-08 И 24 11-40 11 55 11-68 И 81 11-93
6 5-24 6-33 7-03 7 56 7-97 8-32 8-61 8-87 9-10 9 30 9-48 9-65 9-81 9 95 10-08 10-21 10-32 10-43 10-54
7 4-95 5-92 6-54 701. 7-37 7-68 7-94 817 8-37 8-55 8 71 8-86 9 00 9-12 9-24 9-35 9-46 9-55 9-05
4-75 564 6 20 6-62 6-96 7 24 7-47 7-68 7-86 8-03 818 8-31 8 44 8-55 8-66 8 76 8 85 8-94 9-03
9 4 60 5-43 5-96 6 35 6-66 6-91 7-13 7-33 7-49 7-65 7-78 7-91 8-03 8-13 8-23 8 33 8-41 8-49 8-57
10 4-48 5-27 5-77 6-14 6-43 6-67 6-87 7-05 7-21 7 36 7 49 7-60 7-71 7-81 7-9» 7-99 8-08 8-15 8-23
11 4-39 515 562 5-97 6-25 6 48 6-67’ 6-84 6-99 7-13 7-25 7-36 7 46 7-56 7-65 7-73 7-81 7-88 7-95
12 4 32 505 5-50 5-84 6 10 6-32 6-51 6-67 6 81 6-94 7-06 7-17 7-26 7-36 7-44 7 52 7-59 7-66 7-73
13 4-26 4-96 5-40 5-73 5-98 6-19 6-37 6 53 6 67 6 79 6-90 7-01 7 10 7 19 7 27 7 35 7 42 7-48 7-55
14 4 21 4-89 5-32 5-63 5-88 6-08 6-26 6-41 6-54 6 66 6-77 6-87 6 96 7-05 7-13 7 20 7-27 7-33 7-39
15 417 4-84 5-25 5-56 5-80 5-99 6 16 6 31 644 6-55 6 66 6 76 6-84 6 93 700 7-07 7 14 7-20 7-26
16 413 4 79 5-19 5-49 5-72 5-92 6-08 6-22 6-35 6-46 6-56 6-66 6-74 6-82 6-90 6-97 7-03 7-09 7-15
410 4-74 514 543 5-66 5-85 6-01 615 6-27 6 38 6-48 6-57 6-66 6-73 6-81 6-87 6-94 700 705
18 407 4-70 5 09 5-38 5-60 5-79 5 94 6-08 6 20 6-31 6 41 6-50 6 58 6 65 6-73 6-79 6-85 6 91 6-97
19 4 05 4-67 505 5-33 5-55 5-73 5-89 6-02 6-14 6-25 6-34 6 43 6-51 6-58 6-65 6-72 6*78 6-84 6-89
20 402 4-64 502 5-29 5-51 5-69 5-84 5-97 609 6-19 6-28 6 37 6-45 6-52 6-59 6-65 6*71 6-77 6-82
24 3-96 4 55 4-91 517 5-37 5-54 5-69 5-81 5-92 6-02 611 6 19 6-26 6-33 6-39 6-45 6-51 6-56 6-61
30 3-89 4-45 4-80 5-05 5-24 5-40 5-54 5-65 5-76 5-85 5-93 6-01 6-08 6-14 6-20 6-26 6-31 6 36 6-41
40 3-82 437 4-70 4-93 511 5-26 5-39 5 50 5-60 5-69 5-76 5-83 5-90 5-96 6-02 6-07 6-12 6-16 6-21
60 3-76 4-28 4-59 4 82 4-99 5-13 5-25 5 36 5-45 5-53 5-60 5-67 5-73 5-78 5-84 5-89 5-93 5-97 601
120 3-70 4-20 ' 4-50 4-71 4-87 5-01 5-12 5-21 5-30 5-37 5-44 5-50 5-56 5-61 5-66 5-71 5-75 5-79 5 83
00 3-64 4-40 4 60 4-76 4 88 4-99 508 516 5-23 5-29 5-35 5-40 5-45 5-49 5-54 5-57 5-61 5-65
О
г .00 .09 '
оо
.0 1 .0 2 .0 3 .0 4 .0 5 .0 6 .0 7
.0 .0 0 0 0 0 .0 1 0 0 0 .0 2 0 0 0 .0 3 0 0 1 .0 4 0 0 2 .0 5 0 0 4 .0 6 0 0 7 .0 7 0 1 2 .08017 .09024
.1 .1 0 0 3 4 . 11045 .1 2 0 5 8 .1 3 0 7 4 .1 4 0 9 3 .1 5 1 1 4 .1 6 1 3 9 .1 7 1 6 7 .1 8 1 9 8 .19234
.2 .2 0 2 7 3 .2 1 3 1 7 .2 2 3 6 6 .2 3 4 1 9 .2 4 4 7 7 .2 5 5 4 1 .2 6 6 1 1 .2 7 6 8 6 .2 8 7 6 8 .2 9 8 5 7
.3 .3 0 9 5 2 . 32055 .3 3 1 6 5 .3 4 2 8 3 .3 5 4 0 ? .3 6 5 4 4 .3 7 6 8 9 .3 8 8 4 2 .4 0 0 0 6 .41180
.4 .4 2 3 6 5 .4 3 5 6 1 .4 4 7 6 9 .4 5 9 9 0 .4 7 2 2 3 .4 8 4 7 0 .4 9 7 3 1 .5 1 0 0 7 .5 2 2 9 8 .5 3 6 0 6
.5 .5 4 9 3 1 .5 6 2 7 3 .5 7 6 3 4 .5 9 0 1 4 .6 0 4 1 5 .6 1 8 3 8 .6 3 2 8 3 .6 4 7 5 2 .6 6 2 4 6 .6 7 7 6 7
.6 .6 9 3 1 5 .7 0 8 9 2 .7 2 5 0 0 '. 7 4 1 4 2 .7 5 8 1 7 .7 7 5 3 0 .7 9 2 8 1 .8 1 0 7 4 .8 2 9 1 1 .8 4 7 9 5
.7 :8 6 7 3 0 .8 8 7 1 8 .9 0 7 6 4 .9 2 8 7 3 .9 5 0 4 8 .9 7 2 9 5 .9 9 6 2 1 1 .0 2 0 3 3 1 .0 4 5 3 7 1 .0 7 1 4 3
.8 1 .0 9 8 6 1 1. I 2703 1 .1 5 6 8 2 1 .1 8 8 1 3 1 .2 2 1 1 7 1 .2 5 6 1 5 1 .2 9 3 3 4 1 .3 3 3 0 8 1 .3 7 5 7 7 1 .4 2 1 9 2
.9 1 1 .4 7 2 2 2 1.5 2 7 5 2 1 .5 8 9 0 2 1 .6 5 8 3 9 1 .7 3 8 0 5 1 .8 3 1 7 8 1 .9 4 5 9 1 2 .0 9 2 2 9 2 .2 9 7 5 6 2 .6 4 6 6 5
Д о в е р и т е л ь н ы й у р о в е н ь 0 .9 9
g Abr a hamsk, A. F., and K isch, A. I. (1975). Health Status Age: An Age Predictive Health Status
Index, Rand Corp. Report, R-162&-OEO, Rand Corp., Santa Monica, California.
p A f if i, A. A., and E lashoff, R. M. (1966). Missing Observations in Multivariate Statistics I.
Review of the Literature, Journal ofthe American Statistical Association 61, 595-604.
p A fif i, A, A., and E lash o ff, R. M. (1969) Multivariate Two Sample Tests with Dichotomous and
C ontinuous Variables I: The Location Model, Annals ofMathematical Statistics 40,290-298.
p A f if i, A. A., and E lash o ff, R. M. (1969a). Missing Observations in Multivariate Statistics III.
L a rg e Sample Analysis of Simple Linear Regression, Journal of the American Statistical
Association 64, 337-358.
p A fifi, A. A., and E la sh o ff. R. M. (1969b). Missing Observations in Multivariate Statistics IV.
A N ote on Simple Linear Regression, Journal of the American Statistical Association 64.
35 9-365.
P A fifi, A. A., R a n d . W VI, P a lle y , N. \.. Shubin, H., and W eil, M. H. (1971a). A Method for
E valuating Changes in Sets of Computer Monitored Physiological Variables, Computers and
Biomedical Research 4, 329-339.
p A fifi, A. A., Sacks, S. T., Liu, V Y„ W eil, M. H. and Shubin, H. (1971b). Accumulative
P rognostic Index for Patients with Barbiturate, Gluetethemide and Meprobamate Intoxica-.
tio n . New England Journal of Medicine 285. 1497-1502.
x* A n o e rs o n , T. W. (1958). "An Introduction to Multivariate Statistical Analysis,” Wiley, New
Y o rk
jc A n d r e w s , D. F., Bickel, P. J., H ampel, F. R„ H uber, P. J., Rogers, W. H., and T ukey, J. W.
, (1972). “ Robust Estimates of L ocation: Survey and Advances,” Princeton Univ. Press, Prin-
1 c e to n . New Jersey.
f A nscom be, F J. (1961) Examination of Residuals, Proceedings of the Fourth Berkeley Sympo
sium on Mathematical Statistics and Probability, pp. 1-36. Univ. of California Press, Berkeley.
p A nscombe , F. J., and Tukey, J . W. (1963) The E xam ination and Analysis of Residuals, Tech
nometrics 5, 141 160.
p A tk in so n , A C., and P earce. M C. (1976) T he Computer Generation of Beta, Gamma and
Norm al Random Variables. Journal of Royal Statistical Society, Series A 139, 431-451.
P A z e n , S. P (1969). Classification of Tim e-Dependent Observations, Rand Corp. Report,
R-471-PR, Rand Corp.. S a n ta M onica, California.
p A z e n , S. P. and A fifi, A A. (1972a) Two M odels for Assessing Prognosis on the Basis of
Successive Observations, Mathematical Biosciences 14, 169176.
p A z e n , S. P., and A fifi , A A. (1972b). Asym ptotic and Small-Sample Behavior of Estimated
Bayes Rules for Classifying Time-Dependent Observations, Biometrics 28, 989 998.
P A ze n , S. P., and D err . J. I ( 1968) On the D istribution of the Most Significant Hexadecimal
Digit, Rand Corp. Report, RM-5496-PR. R and Corp., Santa Monica, California.
p A z e n , S. P., and R eed , A H (1973). Maximum Likelihood Estimation of Correlation between
Variates Having Equal Coefficients of V ariation, Technometrics 15, 457 462.
p A z e n , S. P., G arcia - P ena , J a n d A fifi, A. A. (1972). Estimation of Missing Values for Com
puter Prognosis, Computers and Biomedical Research 5, 613-20.
p Az e n , S. P., G arcia - P ena . J . . and A fifi, A. A ( 1975) Classification of Time-Dependent Obser
vations: The Exponential Model and the R obustness of the Linear Model, Biometrische
Zeitschrift 17, 203-212. w
p Az e n , S. P., L in n , W., J ones, M. P., H ackney, J., and Sc h o f n t g e n . S. (1977a). A Comparison
of Eight Lung Function In d ice s in Sm oking and Nonsmoking Officeworkers, Lung 154,
213-221.
p Az e n , S. P., M a rgolick . J. B , and S herwiini, R P (1977b). An Experimental Model and
Automated Methodology fo r the Analysis o f the Effects of Ambient Levels of Air Pollutants
on the Lung, Applied Mathematics and Computation 3, 95-102.
p Az e n , S P., Lin n , W S., H ackney , J. D., and J ones , M. P (1978). A Factor Analytic
Approach to an Effective L ung Function Screening Protocol, American Journal of Public
Health. 6 8 . 49-53.
p A z e n , S P , K ammerman .L . , and T eberg , A. (1979). A Bayesian Approach to the Prediction of
Development Outcome i n the Infant of L ow Birthweight, To be published,
p B artlett , M. S. (1937). A nalysis of C ovariance to Missing Values, Journal ofthe Royal Statisti
cal Society, Suppi 4, 151.
g B artlett, M. S. (1947). M u ltivariate Analysis. Journal of the Royal Statistical Society, Suppl.
9B, 176 197.
g B ayley. N. (1969). “ Bayley Scales of Infant dev elo p m en t,” Psychological Services, New York,
p B endel , R. B. and A fifi, A A (1976). A C riterion for Stepwise Regression, American Statisti
cian 30. 85 87.
p B endel , R. B„ and A fifi, A . A. (1977). C om parison of Stopping Rules in Forward Stepwise
Regression. Journal of th e American Statistical Association 72, 46-53.
g B ennett , C. A., and F r a n k l in . N. L. (1954). "Statistical Analysis in Chemistry and the
Chemistry Industry," W iley, New York.
p B ergm \ n , R. N., and A ze im , S. P. (1974). M easurem ent Error Interest in the Determination of
Hepatic Glucose Balancc, Journal Applied Physiology 36, 269-273.
g B eyer . W. H. (Ed.) (1968). "H andbook of Tables for Probability and Statistics" (2nd ed.),
Chemical Rubber Co , C lev elan d , Ohio.
p B ir n b h ’m, Z. W. (1952). N u m e ric al T abulation of the Distribution of Kolmogorov’s Statistic
for Finite Sample Size, Journal of the American Statistical Association 47, 425 441.
g B liss, C. W. (1967). "S ta tistic s in Biology,” Vol. 1, McGraw-Hill, New York.
p Boone , D. C., A z e n , S. P . , L in , C., S p e n c e , C , B aron , C , and L ee, L. (1978). Reliability in
Goriometric M easurem ents, Physical Therapy 58, 1093 1099.
p Box, G. E. P.. and Ml e l l e r . M. E. (1958). A Note on the Generation of Random Normal
Deviates, Annals of Mathematical Statistics 29, 610 611.
470 Литература
А н д е р с о н Т . В в е д е н и е в м н о го м ер н ы й стати сти ч е ск и й а н а л и з . П е р . с а н гл . —
М .: Ф и зм атги з, 1963.
Б р а у н л и К . А . С т а ти ст и ч е с к а я теор и я и м етодологи я в н а у к е и тех н и к е. П ер .
с а н г л . — М .: Н а у к а , 1 9 7 7 .
Д р е й п е р Н . , С м и т Г . П р и к л а д н о й р е г р е с с и о н н ы й а н а л и з . П е р . с а н г л . — М .:
С та ти ст и к а , 1973.
Кендал М. Д. Ранговые корреляции. Пер. с англ. — М.: Статистика, 1975.
Л итература 475
Б о л ы ц е в Л . Н . , С м и р н о в Н . В . Т а б л и ц ы м а т е м а т и ч е с к о й с т а т и с т и к и . — М .:
Н а у к а , 1965.
В е н т ц е л ь Е . С . Т е о р и я в е р о я т н о с т е й . — М .: Н а у к а , 1 9 7 1 .
Г н е д е н к о Б . В . К у р с т е о р и и в е р о я т н о с т е й . — М .: Н а у к а , 196 9 .
Д ж о н с о н Н ., Л и о н Ф . С тати сти к а и п л ан и рован и е эксп ер и м ен та в тех н и к е и
н а у к е . М е т о д ы о б р а б о т к и д а н н ы х . П е р е в . с а н г л . — М .: М и р , 198 0 .
П у г а ч е в В . С . Т е о р и я в е р о я т н о с т е й и м а т е м а т и ч е ск а я с т а т и с т и к а . — - М .: Н а у к а ,
1979 .
Р у м ш н с к и й Л . 3 . Э л е м е н т ы т е о р и и в е р о я т н о с т е й . — М .: Н а у к а , 1 9 7 6 .
С м и р н о в Н . В . , Д у н и н -Б а р к о в с к и й И . В . К у р с теории в ер о я тн о стей и м ате
м а т и ч е с к о й с т а т и с т и к и .— М .: Н а у к а , 1955.
Тернер Д . В е р о я т н о с т ь , ст а т и сти к а , и ссл ед о ван и е оп ерац и й . П ер . с ан гл . —
М .: С т а т и с т и к а , 1 9 7 6 .
Т ь ю к и Д ж . О б р а б о т к а р е з у л ь т а т о в н а б л ю д е н и й . П е р . с а н гл . — М .:,М и р , 19 8 1.
Х альд А . М а т е м а т и ч е с к а я ст а т и сти к а с техн и чески м и п р и л ож ен и ям и . П ер .
с а н г л . — М .: И Л , 19 5 6 .
В. С татистический анализ
А й в а з я н С . А . , Б е ж а е в а 3 . И ., С т а р о в е р о в О . В . К л а сс и ф и к а ц и я м н о го м ер н ы х
н а б л ю д е н и й . — М . : С т а т и ст и к а , 1974.
Б рандт 3. С т а т и с т и ч е с к и е м етоды ан ал и за набл ю ден и й . П е р . с а н г л . — М .:
М ир, 1975.
Гаек Я - , Ш идак 3 . Т еори я р ан говы х критериев. П ерев. с а н г л . — М .: Н аука,
1971.
Д ем иденко Е . 3 . Л иней ная и нелиней ная р е г р е с с и я .— М .: Ф ин ансы и стати
с т и к а , 198 1.
Д у б р о в А . М . О б р а б о т к а ст а т и сти ч еск и х д ан н ы х м етодом гл а в н ы х ком п он ен т. —
М .: С т а т и с т и к а , 19 7 8 .
Д ю ран Б . , О д е л л П . К л а с т е р н ы й а н а л и з . П е р е в . с а н г л . — М .: С т а т и с т и к а ,
1971.
Е л и с е е в а И . И ., Р у к а в и ш н и к о в В . О . Г р уп п и р о в к а , к о р р ел яц и я , распозн аван и е
о б р а з о в . — М .: С т а т и с т и к а , 19 7 Т.
З а г о р у й к о Н . Г . М е т о д ы р а с п о з н а в а н и я и и х п р и л о ж е н и я . — М .: .С о в е т с к о е
р а д и о , 1972.
Л ы с е н к о в А . Н . М а т е м а т и ч е с к и е м етоды п л а н и р о в а н и я м н о го ф ак тор н ы х^ м ед и к о -
б и о л о т и ч е с к и х э к с п е р и м е н т о в . — М .: М е д и ц и н а , 1 9 7 9 . ,А
С е б е р Д ж . Л и н е й н ы й р е г р е с с и о н н ы й а н а л и з . П е р е в ._ ,с а н г л . — М . : М и р , 198 0 .
Г. Имитационное Моделирование
Б у с л е н к о Н . П . и д р . М е т о д с т а т и с т и ч е с к и х и с п ы т а н и й (м ето д М о н т е -К а р л о ). —
М .: Ф и з м а т г и з , 1 9 6 2 .
К л я й н е н Д ж . С т а т и с т и ч е с к и е м е т о д ы в и м и т а д и о н н о м м о д е л и р о в а н и и .В ы п . 1 , 2.
П ер. с а н г л . — Д .: С тати сти к а, 1978.
Соболь И. Н. М етод М о н т е - К а р л о . — М .: Ф и зм атги з, 1968.
Список используемых латинских аббревиатур
Ф а к т о р , в т о р и ч н а я с т р у к т у р а ( r e fe r e n c e Э ф ф е к ти в н о ст ь (e ffic ie n c y ) 4 29
s tru c tu r e ) 374 — а с и м п т о т и ч е с к а я ( a s y m p to tic ) 208,
— н агр узк а на ( ф а к т о р н а я н агр узк а 429
( lo a d in g ) 36 1 D -с т а т и с т и к а С о м е р а 129
— о б щ и й ( п е р в и ч н ы й ) ( c o m m o n ) 361 F -р а сп р е д е л е н и е 4 2 3
— с л у ч а й н ы й (ra n d o m ) 2 37 — ген ер ац и я 32
— с п е ц и ф и ч е с к и й ( х а р а к т е р н ы й ) (s p e ^ -к р и тер и й в ди сп ер си он н ом ан ализе
c ific ) 361 268+
— ф и к с и р о в а н н ы й ( f ix e d ) 2 3 7 ---------м н о ж е с т в е н н о й л и н е й н о й р е г р е с
Ф актор (к р и т е р и й ) ( fa c t o r ) 60 си и 1 6 9 +
Ф акторн ы й ан ализ (fa c to r a n a ly s is ) -------- - о б щ е й л и н е й н о й м о д е л и 2 3 1
360+ -------- п р о с т о й л и н е й н о й р е г р е с с и и 15 0
---------и т е р а ц и и ( i t e r a t i o n ) 3 6 5 — д л я век то р о в ср едни х 3 1 8 +
---------м е т о д г л а в н ы х ф а к т о р о в ( p r in ---------в ы б р о с о в 3 1 5
c ip a l fa c to r ) 3 6 3 + -------- м н о ж е с т в е н н о г о коэф ф и ц и ен та
---------н о р м а л и з а ц и я К а й з е р а ( K a iz e r к о р р е л я ц и и 18 2
n o r m a l i z a t io n ) 365 -------- р а в е н с т в а двух ди сп ер си й 92
---------ц е л е в а я ф у н к ц и я ( o b j e c t i v e f u n c ------------- k > 2 с р е д н и х 100
tio n ) 3 7 2 -------- р а с с т о я н и я М а х а л а н о б и с а 329,
Ф о р м а т (fo rm a t) 3 9 + 347
Ф ортран ( F O R T R A N ) 21 — .Р - в к л ю ч е н и я 1 9 7 , 3 4 4
Ф у н к ц и я р а сп р е д е л е н и я см . К у м у л я — F -у д а л е н и я 1 9 7 , 34 4
ти вн ая ф у н к ц и я р аспределени я g -в и н зо р и зо в а н н ы е н а б л ю д е н и я 13 3
Я - з н а ч е н и е (Р v a l u e ) 439
Ч а с т о т а ( f r e q u e n c y ) 51 r X c -таб л и ц а (со п р я ж е н н о ст и призна
Ч а с т о т н а я к р и в а я ( к р и в а я ч а с т о т ) 403 ков) 6 0 +
— т а б л и ц а ( т а б л и ц а ч а с т о т ) 50 /-к р и т ер и й С т ь ю д е н т а в м н о ж е с тв е н н о й
— ф ункция (п л о тн о ст ь) 402 л и н ей н о й р е гр е сс и и 150
-------- п р о с т о й л и н е й н о й р е г р е с с и и 150
Ш аговая п р о ц е д у р а (s te p p in g p r o c e — двухвы борочны й для ср ед н и х 92,
d u res) в п о ш а г о в о й р егр есси и 1 9 5 + 94
-------------- п о ш а г о в о м ди скр и м и н ан тн ом — д л я к о э ф ф и ц и е н т а к о р р е л я ц и и 16 1
ан ализе 3 4 4 + ч астн ого коэф ф иц иента корре
--------- м н о ж е с т в е н н о й к о р р е л я ц и и ( m i l- ляции 14 2
tip le c o r r e la tio n ) 199 — парны й (д л я св я з а н н ы х вы борок)
--------------------с з а м е н о й п е р е м е н н ы х (со 8 7 , 93
с в о п и г н о м ) ( w i t h s w a p p in g ) 20 0 — У эл ч а 85, 93
-------- с т а н д а р т н а я (s ta n d a rd ) 195 /-р а с п р е д е л е н и е С т ь ю д е н т а 422
- — с з а м е н о й п ер ем ен н ы х (w ith — ген ер а ц и я 32
s w a p p in g ) 19 6 7’2- к р и т е р и й Х отелли н га двухвы бо
Ш кала изм ерений 15 р оч н ы й 320
---------и н т е р в а л ь н а я ( in te r v a l) 16+ — — одновы борочны й 3 18
---------н о м и н а т и в н а я (н а и м е н о в а н и й ) Х2- к р и т е р и й д л я в е к т о р о в с р е д н и х 3 1 7
( n o m in a l) 15+ в ы б р о со в 314
---------о т н о ш е н и й ( r a t i o ) 1 7 -------- - д о л е й 69
---------п о р я д к о в а я ( o r d in a l ) 1 6 -------- о д н о й п е р е м е н н о й 8 1
-------- т а б л и ц с о п р я ж е н н о с т и 112
Э ксп ери м ен тальн ая еди ница ( e x p e r i — со гл аси я 77
m e n ta l u n i t ) 396 /^ -р а с п р е д е л е н и е 4 2 1
Э к с п е р и м е н т а л ь н ы й пл ан (п л а н э к с п е — ген ерац и я 32
р и м ен та) (e x p e r im e n ta l d e s ig n ) 2 2 2
О главлен и е
От редактора перевода 5
Предисловие ко второму изданию 7
Предисловие к первому изданию 9
2
Элементарные статистические выводы 65
2 .1 . П р о гр ам м ы п о д сч ета ч а с то т. А н а л и з д и с к р е т н ы х п ер ем ен н ы х 65
2 .2 . Д е с к р и п т и в н ы е п р о г р а м м ы . А н а л и з н е п р е р ы в н ы х п е р е м е н н ы х 70
2 .3 . Д е с к р и п т и в н ы е п р о г р а м м ы с р а с с л о е н и е м д а н н ы х . А н а л и з д в у х
н епреры вн ы х сл уч ай н ы х величин 85
2 .4 . Д е с к р и п т и в н ы е п р о г р а м м ы с р а с с л о е н и е м д а н н ы х . А н а л и з р : > 2
непреры вн ы х сл уч ай н ы х величин 95
2 .5 . П р о г р а м м ы п е р е к р е с т н о г о т а б у л и р о в а н и я . А н а л и з т а б л и ц с о п р я
ж ен н ости п ри зн аков 10 8
2 .6 . Д р у г и е к р и т е р и и н е з а в и с и м о с т и для табл и ц со п р я ж ен н о сти при
знаков 114
2 .7 . Р о б а с т н ы е о ц ен к и 132
У праж н ения 137
488 Оглавление
3
Регрессионный и корреляционный анализы 141
3 .1 . П р остая линей ная р егр есси я и п р остой коррел яц и он н ы й анализ 142
3 .2 . М н о ж е ств е н н а я линей ная р егр есси я , м н ож ествен н ая и ч астн ая
корреляции 164
3 .3 . П о ш а г о в а я р е гр е сс и я 19 4
3 .4 . Н е л и н е й н ая р е гр е сси я 208
У праж н ения 2 17
4
Дисперсионный анализ 222
4 .1 . О сн овы теор и и общ ей л и н ей н ой м одели 223
4 .2 . О дн оф акторны й ди сп ер си он н ы й ан ал и з 234
4 .3 . Д в ухф ак то р н ы й ди сп ер си он н ы й ан ал и з 244
4 .4 . О бщ ая п рограм м а ф ак то р н ого п л ан и рован и я 266
4.5. Д и с п е р с и о н н ы й а н а л и з п р и п о м о щ и р е г р е с с и и 284
4 .6 . К о в а р и а ц и о н н ы й а н а л и з 295
У праж н ения 308
5
Методы многомерного статистического анализа 313
5 .1 . А н ал и з вы бросов 314
5 .2 . П р о в е р к а г и п о т е з о в е к т о р а х с р е д н и х 317
5 .3 . К л а сс и ф и к а ц и я индивидуум а в сл уч ае двух популяций 322
5 . 4 . К л а с с и ф и к а ц и я в с л у ч а е /г п о п у л я ц и й 334
5 .5 . П о ш а го вы й д и ск р и м и н а н т н ы й ан а л и з 344
5 .6 . А н а л и з г л а в н ы х к о м п о н е н т 3 354
5 .7 . Ф ак то р н ы й ан ал и з 360
5 .8 . М н о го м ер н ы й д и сп е р си о н н ы й а н ал и з 38 0
У праж н ения 392