Саканян Г.Г.
ОСНОВЫ БИОСТАТИСТИКИ
Ереван - 2010
1
Утверждено решением Цикловой методической комиссии
гигиенических и гуманитарных дисциплин ЕГМУ им. Мх.
Гераци (заседание от 14.10.09, протокол N 17).
2
Учебное руководство предназначено для студентов выс-
ших медицинских заведений.
Основная цель научить будущих врачей грамотно ис-
пользовать необходимые статистические методы, корректно
интерпретировать и представлять результаты статистиче-
ских исследований. В учебном руководстве содержатся ис-
пользуемые в статистике основные определения, краткое
описание этапов проведения статистических исследований
и наиболее широко применяемые в медико-биологических
исследованиях методы статистического анализа. Многие
вопросы, освещенные в руководстве, представляют интерес
для магистров, резидентов и аспирантов, участвующих в
клинических и экспериментальных исследованиях.
3
ОГЛАВЛЕНИЕ
4
ВВЕДЕНИЕ В БИОСТАТИСТИКУ
7
ЭТАПЫ ПРОВЕДЕНИЯ МЕДИЦИНСКИХ ИССЛЕДО-
ВАНИЙ
10
В процессе проведения исследования важным является
получение данных, для чего существуют три основных типа
инструментов:
1. Приборы – измерения производятся с помощью чисто
механических приспособлений (весы, термометр, манометр
и т.д.).
2. Люди – измерения производят люди без аппаратуры
или с минимальным ее использованием (сбор анамнеза, ан-
кетирование, перкуссия, аускультация).
3. Комбинация людей и приборов (расшифровка рент-
генограмм, патоморфологические исследования).
В любом случае, желательно, чтобы средства определе-
ния данных обладали двумя свойствами – надежностью
(reliability) и состоятельностью (валидностью, validity).
Надежность – свойство, присущее любому работающе-
му инструменту. Надежен тот инструмент, который дает
стабильные результаты при повторном исследовании одно-
го и того же объекта в сходных условиях.
Состоятельность – это способность метода или инстру-
мента измерять ту характеристику, для измерения которой
он предназначен. Например, лихорадка не может быть со-
стоятельным (достоверным) показателем малярии в районе
с низким уровнем распространения этого заболевания. Или
же: бездетность не может быть состоятельным признаком
бесплодия.
Двумя важными компонентами состоятельности являют-
ся чувствительность и специфичность. В общем смысле
чувствительность критерия, метода или измерительного ин-
струмента представляет собой отношение изменения на-
блюдаемого показателя к соответствующему изменению
значения измеряемой величины. Чем выше это отношение,
тем чувствительнее метод. Если, например, измеряется кон-
центрация и ее малое изменение приводит к большому из-
менению результатов, то такой тест чувствительный. В этом
смысле чувствительность не относится к минимальному ко-
личеству, которое можно выявить (это порог чувствитель-
11
ности). Специфичность определяется как степень, с которой
критерий, метод или измерительный прибор способны реа-
гировать на наличие данной величины и не реагировать на
наличие всех других переменных.
При проведении исследований “измеряемая” исследова-
телем величина состоит из двух составляющих – величины
самого показателя и ошибки измерения. Ошибка измерения
может быть двух типов: систематической (смещение, bias) и
случайной (random error).
поражает поражает
состоятельность надежность
15
ных границ этой совокупности. К тому же, сплошные ис-
следования во много раз дороже несплошных.
При несплошном исследовании изучается лишь часть со-
вокупности для характеристики целого. Несплошное на-
блюдение бывает нескольких видов:
• монографическое описание;
• метод основного массива;
• выборочное исследование.
Метод монографического описания применяется для
подробного изучения одного объекта (одного человека, од-
ного учреждения, одного населенного пункта, новой техно-
логии), имеющего какие-либо яркие особенности. Выводы,
которые получаются путем таких исследований, относятся
либо только к конкретному объекту исследования, либо мо-
гут быть распространены на весьма ограниченную группу
аналогичных объектов. Указанный метод наблюдения на-
шел довольно широкое применение при изучении опыта
лучших (худших) лечебно-профилактических учреждений.
Метод основного массива - метод статистического ис-
следования, при котором изучению подвергают только те
части совокупности, в которых сосредоточено большинство
единиц наблюдения. Например, при изучении здоровья де-
тей, родители которых работают на предприятиях химиче-
ской промышленности, в целях анализа можно использо-
вать только крупные предприятия, исключив мелкие объек-
ты. Обычно эти методы используются на ранних этапах ис-
следования, когда только генерируются гипотезы и прово-
дится их начальная проверка. В результате исследователь
устанавливает основные закономерности, выявляет воз-
можные механизмы действия и т.д.
Собственно выборочное исследование охватывает выбо-
рочную совокупность, или просто выборку, из генеральной
совокупности. При этом конечной целью изучения выбо-
рочной совокупности всегда является получение информа-
ции о генеральной совокупности. Для этого выборочное ис-
следование должно удовлетворять определенным условиям.
16
Одно из главных условий - представительность, или репре-
зентативность выборки. Выборку называют репрезента-
тивной, если каждое свойство (или комбинация свойств)
наблюдается в выборке с той же частотой, что и в популя-
ции, из которой она извлечена.
Различают качественную и количественную репрезен-
тативность.
Количественная репрезентативность определяется дос-
таточным числом элементов выборочной совокупности, га-
рантирующим получение статистически достоверных дан-
ных и основана на законе больших чисел.
Закон больших чисел в наиболее простой форме гласит,
что количественные закономерности массовых явлений от-
четливо проявляются лишь в достаточно большом их числе.
Теорема Чебышева гласит: “С вероятностью, сколь угодно
близкой к единице, можно утверждать, что при достаточно
большом числе независимых наблюдений, средняя величи-
на изучаемого признака, полученная на основе выборки,
будет сколь угодно мало отличаться от средней величины
изучаемого признака во всей генеральной совокупности”.
T.e. сущность закона больших чисел заключается в том, что
в числах, получающихся в результате массового наблюде-
ния, выступают определенные закономерности, которые
могут быть обнаружены только при достаточном числе на-
блюдений. Достаточное число элементов выборочной сово-
купности рассчитывается по специальным формулам.
Качественная репрезентативность основана на законе
вероятности и определяется структурным соответствием
выборочной и генеральной совокупностей.
Качественная репрезентативность выборки лучше всего
достигается посредством случайного отбора ее единиц из
популяции. Случайная выборка (random sample) извлекает
из популяции как типичные, так и нетипичные случаи. В
совокупности они дают самое правильное представление об
изучаемой генеральной совокупности. Важно также то, что
при случайном отборе людей они отличаются от других в
17
генеральной совокупности по всем, в том числе и неизвест-
ным нам признакам, случайным образом. Процесс случай-
ного отбора осуществляется посредством рандомизации.
Проведение рандомизации не затруднительно, и для это-
го в настоящее время достаточно средств: могут использо-
ваться таблицы случайных чисел, различные компьютерные
программы. К обсуждению средств проведения рандомиза-
ции мы еще вернемся в разделе «Дизайны медицинских ис-
следовний».
При расслоенной, или стратифицированной случайной
выборке (stratified random sample), изучаемая неоднородная
генеральная совокупность сначала делится по какому-либо
существенному признаку на относительно однородные
группы (strata), после чего из каждой группы производится
случайный отбор единиц. Предварительная стратификация
обеспечивает большую репрезентативность выборки. Осо-
бенно рекомендуется проводить стратификацию при не-
большом объеме выборки, т.к. в этом случае шансы полу-
чить репрезентативную группу простой рандомизацией не-
достаточны. Например, вместо отбора выборки в 100 чело-
век из всего населения, состоящего из 5000 белых и 5000
негров, можно отобрать две случайные выборки в 50 чело-
век из каждой этнической группы. Это обеспечит большую
этническую представительность общей выборки в 100 чело-
век.
В некоторых случаях, когда проведение случайного от-
бора или стратифицированного случайного отбора требует
больших затрат денег и времени, проводится кластерный
отбор (cluster sampling). Например, если необходимо про-
вести опрос среди 1000 школьников в городе N, исследова-
тель может сначала посредством случайного отбора ото-
брать 10 школ (кластеров) в городе, а затем опросить в каж-
дой из них по 100 школьников. Этот метод является значи-
тельно более экономичным и практичным, по сравнению со
случайным отбором 1000 школьников из всей совокупности
школьников города N.
18
Эквивалентом случайного отбора без использования ран-
домизации является систематический, или механический
отбор (systematic sampling). Систематическая выборка
формируется с помощью механического подхода к отбору
единиц наблюдения: из всей совокупности для изучения бе-
рется механически отобранная каждая третья, пятая, десятая
единица наблюдения. Например, можно отобрать каждого
пятого пациента, поступающего в больницу, или каждого
третьего ребенка, родившегося в данном районе.
О выборке, которая не является репрезентативной, гово-
рят, что она имеет смещение. Когда заключения относи-
тельно популяции делаются на основе наблюдений в сме-
щенной выборке, возможны отклонения результатов от ис-
тинных значений, называемые систематической ошибкой. О
систематической ошибке мы уже говорили выше. Она мо-
жет привести к недооценке реального эффекта, его пере-
оценке, выявлению несуществующих взаимосвязей, демон-
страции положительных взаимосвязей между факторами
вместо отрицательных и наоборот. Источниками система-
тических ошибок являются несовершенство используемых
методов, несоответствие выбранного типа исследования по-
ставленным задачам, неадекватный отбор пациентов для
участия в исследовании и влияние третьих переменных (не
изучаемых непосредственно).
Классическим примером нерепрезентативной выборки
служит опрос общественного мнения, проведенный до пре-
зидентских выборов в США в 1936 году журналом “Litera-
ture Digest”. По результатам опроса выборки из более чем
10 млн. человек, была предсказана полная победа Альфреда
Лендона над Франклином Рузвельтом, однако результаты
состоявшихся выборов были совершенно противополож-
ными. Проблема состояла в том, что выборка была сформи-
рована из числа подписчиков, фамилии которых были
включены в телефонные справочники. Между тем, владель-
цы телефонов в период Великой депрессии в США пред-
ставляли лишь небольшую часть всего электората.
19
Первый этап статистического исследования предусмат-
ривает определение методов сбора статистичекой информа-
ции, а также разработку и тиражирование статистического
инструментария (карт, анкет, компьютерных программ
формирования и обработки информационных баз данных и
др.), куда в период сбора данных будет заноситься вся ин-
формация.
Наконец, программа исследования включает программу
анализа, которая предусматривает перечень статистических
методик, необходимых для выявления закономерностей
изучаемого явления.
Разработка рабочего плана исследования - следующий
важнейший этап подготовки исследования. План исследо-
вания предусматривает решение таких организационных
вопросов, как подбор, обучение и организация работы непо-
средственных исполнителей, определение необходимого
объема и и видов ресурсов, необходимых для проведения
исследования (кадры, финансы, материально-технические,
информационные ресурсы и др.), определение места и сро-
ков проведения исследования, ответственных за отдельные
этапы исследования.
23
ботки данных, так и о соответствующих программных сред-
ствах.
Имеющиеся в настоящее время многочисленные пакеты
компьютерных программ содержат не только практически
все необходимые методы статистической обработки, но
также и методы статистического анализа данных. Компью-
терная обработка данных не только ускоряет, но и много-
кратно повышает качество статистического анализа.
Методы статистического описания полученных ре-
зультатов будут подробно освещены в разделе «Описатель-
ная статистика».
24
выборочных совокупностей, от типа переменных, изучае-
мых в данном исследовании.
При анализе прежде всего проводятся различного харак-
тера сопоставления. Сравнивается эффективность различ-
ных медицинских препаратов, диагностических тестов; по-
лученные в результате исследования данные сопоставляют-
ся с данными предыдущих лет, с данными других авторов,
других регионов, с имеющимися нормативами.
Обширная группа методов статистического анализа
предназначена для исследования парных и множественных
связей между переменными (корреляционный анализ, рег-
рессионный анализ и др.)
Как уже было сказано, в настоящее время для проведения
статистического анализа используются различные компью-
терные статистические пакеты. Некоторые из наиболее ши-
роко используемых методов статистического анализа будут
освещены в соответствующих разделах данного учебного
пособия.
I. Обсервационные исследования:
A. Описание случая.
Б. Описание серии случаев.
В. Исследования по типу случай-контроль.
Г. Поперечные исследования.
Д. Когортные исследования.
II. Экспериментальные исследования:
А. Экспериментальные исследования с наличием контроль-
ных групп-
1. Параллельные клинические испытания
(с одновременным наблюдением экспериментальной и кон-
трольной групп)
а. Рандомизированные исследования.
26
б. Нерандомизированные исследования.
2. Исследования с последующим наблюдением контрольной
группы-
а. Исследования по типу до-после.
б. Перекрестные исследования.
3. Исследования с использованием внешних контрольных
групп (с историческим контролем)
Б. Экспериментальные исследования без наличия кон-
трольных групп.
ОБСЕРВАЦИОННЫЕ ИССЛЕДОВАНИЯ
29
Дизайн исследования “случай-контроль”
Исследование “случай—контроль” (case control study) —
ретроспективное исследование, в котором, по архивным
данным, воспоминаниям или суждениям пациентов, произ-
водится сравнение двух групп, в одну из которых отобраны
пациенты с определенной патологией («случай»), а в дру-
гую — лица без нее («контроль»). Причем обе группы бы-
вают отобраны из одной и той же популяции.
Цель исследования “случай-контроль”- выявление связи
между исходом (развитием заболевания) и воздействием
определенных риск-факторов, т.е. изучение этиологии забо-
левания.
Дизайн исследования показан на рисунке 1.
Отбор групп
Группа Контроль-
случаев ная группа
Определение Были подвержены воз-
подвержен- действию фактора a b
ности воздей- Не были подвержены
ствию изу- воздействию фактора
чаемого фак- c d
тора
Всего a+c b+d
Доля лиц, подвержен-
ных воздействию фак- a/ a+c b/ b+d
тора
32
Таблица 3. Гипотетический пример исследования “слу-
чай-контроль” по изучению связи между курением и
развитием коронарной болезни.
Поперечные исследования
(исследовани распространенности)
36
Для каждого из обследованных в выборочной совокупно-
сти численностью в n человек определяется наличие воз-
действия фактора и наличие заболевания. Как видно из ри-
сунков 3 и 4, у a человек было выявлено и наличие воздей-
ствия фактора, и наличие заболевания; у b человек - выяв-
лено наличие воздействия фактора, но отсутствие заболева-
ния; у с человек - было выявлено отсутствие воздействия
фактора, но наличие заболевания; у d человек - выявлено и
отсутствие воздействия фактора, и отсутствие заболевания.
Для определения наличия связи между воздействием изу-
чаемого фактора и развитием данного заболевания имеются
две возможности: можно определить распространенность
заболевания у лиц с воздействием фактора риска (a/ a+b) и
сравнить ее с уровнем распространенности заболевания
среди лиц, не подверженных воздействию фактора риска
(c/c+d); можно также сравнить распространенность воздей-
ствия фактора риска среди лиц с данным заболеванием (a/
a+c) и лиц без заболевания (b/ b+d).
37
Рисунок 4. Дизайн поперечного исследования (III)
Наличие Отсутствие
заболевания заболевания
Наличие фактора риска a b
Отсутствие фактора риска c d
Частота встречаемости фактора
риска у лиц, имеющих и не имею- a/(a+c) b/(b+d)
щих данное заболевание
38
сульт способствует депрессии, либо что больные инсультом
без депрессии выздоравливают быстрее.
2. При поперечном исследовании в поле зрения исследова-
телей попадают лишь больные, выявленные в момент об-
следования, не учитываются лица, умершие от изучаемого
заболевания, выздоровевшие и больные, выбывшие по дру-
гим причинам. Это ведет к недооценке частоты случаев за-
болевания. Таким образом, показатель распространенности
не отражает в полной мере реальной частоты развития бо-
лезни.
3. Одномоментные исследования обычно охватывают
большой контингент населения, и чем меньше распростра-
ненность заболевания, тем этот контингент должен быть
больше, чтобы выявить достаточное число случаев заболе-
вания.
4. В поперечном исследовании нельзя проверить прогно-
стическую значимость диагностического метода, исполь-
зуемого в популяционном исследовании.
5. При сопоставлении характеристик больных и здоровых
лиц в ходе поперечного исследования встречаются опреде-
ленные трудности. Некоторые характеристики, выявляемые
при поперечном исследовании у лиц с заболеванием, могут
не совпадать с характеристиками, которые имелись в на-
чальной стадии развития заболевания. Например, изучение
особенностей питания у лиц среднего возраста, страдающих
ИБС, имеет ограниченное значение, так как атеросклероз
начинает развиваться уже в юношеском возрасте, кроме то-
го, заболевший человек мог изменить характер питания в
результате заболевания.
Все перечисленные выше недостатки ограничивают
применение поперечных исследований в популяции.
Когортные исследования
Когортное исследование (cohort study) — обсервацион-
ное исследование, в котором выделенную по определенным
признакам группу людей (когорту) наблюдают в течение
39
некоторого периода времени и сравнивают исходы у тех,
кто подвергался и не подвергался воздействию изучаемого
фактора (или нескольких факторов), либо подвергался в
разной степени (рисунок 5).
Когортные исследования называют также продольными,
или лонгитудинальными (longitudinal study), подчеркивая
тем самым, что пациенты прослеживаются во времени; про-
спективными (prospective study), имея в виду, что группа
сформирована в настоящее время и прослежена в будущем;
или исследованиями заболеваемости (incidence study), об-
ращая внимание на то, что основным способом оценки яв-
ляется регистрация новых случаев заболевания в течение
определенного срока .
Время наблюдения при когортном исследовании может
быть от нескольких дней (при острых заболеваниях) до не-
скольких десятков лет (при изучении болезней с длитель-
ным латентным периодом).
Чаще всего целью когортных исследований является до-
казательство этиологических гипотез, т.е. поиск причин и
факторов риска развития заболеваний.
В случае наличия связи между воздействием изучаемого
фактора и развитием заболевания мы должны были бы ожи-
дать больший удельный вес лиц с развитием данного забо-
левания (частота новых случаев среди подверженных воз-
действию фактора) среди тех, которые были подвержены
воздействию изучаемого фактора риска, по сравнению с
удельным весом заболевших среди лиц, не подверженных
воздействию фактора риска (частота новых случаев среди
не подверженных воздействию фактора).
Как видно из таблицы 4, начинается исследование с от-
бора лиц, подверженных и не подверженных воздействию
изучаемого фактора (факторов). Из a + b подверженных
воздействию фактора лиц заболевание развилось у а лиц.
Таким образом, частота новых случаев среди подверженных
воздействию фактора, будет равна: a/ a + b. Подобным же
образом, из c + d не подверженных воздействию фактора
40
лиц, заболевание развилось у c лиц, значит, частота новых
случаев среди не подверженных воздействию фактора будет
равна: c/ c+d.
Рисунок 5. Дизайн когортного исследования
Наблюдение за развитием
Частота
изучаемого заболевания
Всего новых
Заболевание Заболевание
случаев
развилось не развилось
Группа лиц,
подверженных
Выделение групп лиц
воздействию a b a+b a/ a + b
изучаемого
фактора
Группа лиц, не
подверженных
воздействию c d c+d c/ c+d
изучаемого
фактора
41
Если относительный риск равен единице, это указывает
на отсутствие различий между сравниваемыми группами.
Если он выше единицы, это означает, что риск развития за-
болевания в группе экспонированных выше, по сравнению с
группой неэкспонированных.
Все указанные расчеты приводятся в гипотетическом
примере когортного исследования по изучению связи меж-
ду курением и развитием коронарной болезни (Таблица 5).
42
Следует обратить внимание на то, что, так как мы выяв-
ляем новые случаи заболевания по мере их возникновения,
это позволяет нам установить наличие временной взаимо-
связи между воздействием изучаемого фактора и развитием
данного заболевания, т.е. установить предшествовало ли
воздействие фактора развитию заболевания. Разумеется, та-
кая временная связь может быть установлена, если мы рас-
сматриваем изучаемый фактор в качестве возможной при-
чины данного заболевания.
1995 Население
Отсутствие рандомизации
Подверженность
воздействию фактора Отсутствие фактора
2005
44
Рисунок 7. Гипотетическое ретроспективное когортное
исследование, начатое в 1995 году
1975 Население
Отсутствие рандомизации
Подверженность
1985 воздействию фактора Отсутствие фактора
ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ
48
1) клиническое исследование в параллельных группах (pa-
rallel, оr concurrent, group design);
2) клиническое исследование в «перекрестной модели»
(crossover group design).
Клиническое исследование в параллельных группах – это
способ клинического исследования, при котором контроль-
ная группа набирается одновременно по тем же правилам,
что и экспериментальная группа. В этом случае каждый па-
циент попадает под одну из схем лечения, проходящих ис-
пытания. Каждой схеме лечения соответствует своя тера-
певтическая группа, и все пациенты, отнесенные к той или
иной терапевтической группе, получают одинаковое лече-
ние. Несмотря на то, что клинические исследования в ди-
зайне параллельных групп дорогостоящие, продолжитель-
ные и требуют большого количества испытуемых, они при-
меняются широко, поскольку являются наиболее объектив-
ными в определении эффективности лечения и точными в
формулировании выводов, а также позволяют избежать не-
которых видов систематических ошибок, которые неизбеж-
ны при исследованиях с историческим контролем.
49
Рисунок 8. Схема клинического исследования с парал-
лельным контролем
Определение вы-
борочной сово-
купности
Рандомизация
Вмешательство Контроль
Оценка результатов
Рандомизация
54
Рисунок 10. Сравнение рандомизированного и нерандо-
мизированного исследований
I . Нерандомизированное исследoвание
n = 2000
1000 1000
55
II. Рандомизированное исследование
n = 2000
1000 1000
56
четное число как предписание к включению пациента в
группу А, и каждое четное число- к включению пациента в
группу Б. Для пользования таблицей сначала необходимо
выбрать стартовую точку. Выбор случайной стартовой точ-
ки необходим для исключения предсказуемости выборки.
Стартовая точка – это цифра в таблице, которая выбирается,
не глядя на таблицу, наугад. Заранее решается также вопрос
о направлении движения по таблице (горизонтально, слева
направо; горизонтально справа налево; вверх или вниз).
Предположим, мы опустили палец на цифру 5 на пересече-
нии столбца 7 и строки 7 и решили двигаться горизонтально
в направлении слева направо. Первая цифра 5 – нечетное
число, следовательно, первый пациент должен быть вклю-
чен в группу А. Следующая цифра также нечетная, значит,
второй пациент также должен быть включен в группу А.
Третья цифра 8 – четное число, третий пациент должен
быть включен в группу Б и т.д. Таким образом, исследова-
тель не располагает заранее информацией о том, в какую из
сравниваемых групп будет включен следующий пациент.
60
ОПИСАТЕЛЬНАЯ СТАТИСТИКА
61
деления частот встречаемости не отдельных величин, а их
групповых интервалов.
В таблице 7 приведен пример такого сгруппированного
распределения частот. Весь диапазон величин уровня холе-
стерина, определенных у 1054 мужчин обследованной
группы, разбили на 7 групп. Каждая из выделенных групп
имеет одинаковый интервал, в данном случае равный 40.
Как видно из таблицы 7, сгруппированное распределение
частот может быть преобразовано в распределение относи-
тельных частот встречаемости интервалов. Относительная
частота встречаемости интервала показывает удельный вес
величин, находящихся в пределах каждого группового ин-
тервала и рассчитывается путем деления частоты его встре-
чаемости на общее число обследованных.
Так, например, удельный вес лиц с уровнем холестерина
в пределах интервала от 120- до 159 мг/дл составит
150/1054 х 100% = 14,2%.
В таблице 7 приведены также значения кумулятивных
частот. Кумулятивная частота показывает частоту встре-
чаемости величин в пределах данного и всех предшествую-
щих интервалов.
Согласно данным таблицы 7, 14,2% обследованных в
возрасте 25-34 года имели уровень холестерина в крови от
120- до 159 мг/дл, 41,9%- от 160 – до 199, следовательно, у
56,1% (14,2 + 41,9%) обследованных уровень холестерина
составлял 120- 199 мг/дл. Это означает, что приблизительно
56% обследованных имели значения уровня холестерина в
крови 199 мг/дл и меньше, и остальные 44% (100-56%) –
больше 199 мг/дл. Кумулятивная частота группы, которая
включает наиболее высокие уровни холестерина, в данном
случае это интервал 360- 399 мг/дл, равный 100%. Это озна-
чает, что 100% всех обследованных имеют уровень холе-
стерина до 399 мг/дл включительно.
62
Таблица 6. Плотность распределения уровня холестери-
на у 1054 мужчин в возрастной группе от 25 до 34 лет
V P V P V P V P V P V P V P V P
120 1 155 8 190 17 225 4 260 3 295 3 330 1 365 0
121 2 156 7 191 17 226 5 261 0 296 1 331 1 366 0
122 2 157 6 192 17 227 5 262 1 297 0 332 0 367 0
123 3 158 5 193 15 228 7 263 0 298 1 333 0 368 0
124 2 159 6 194 10 229 5 264 1 299 0 334 0 369 0
125 0 160 5 195 16 230 7 265 3 300 0 335 0 370 0
126 0 161 4 196 17 231 7 266 3 301 0 336 0 371 0
127 0 162 4 197 18 232 8 267 1 302 0 337 1 372 0
128 5 163 4 198 18 233 9 268 1 303 1 338 1 373 0
129 4 164 5 199 20 234 8 269 2 304 0 339 0 374 0
130 0 165 6 200 18 235 1 270 3 305 0 340 0 375 0
131 2 166 7 201 17 236 0 271 2 306 0 341 1 376 0
132 0 167 6 202 15 237 7 272 2 307 0 342 0 377 0
133 1 168 5 203 8 238 8 273 1 308 1 343 0 378 0
134 0 169 4 204 8 239 6 274 0 309 0 344 0 379 1
135 0 170 3 205 10 240 8 275 1 310 0 345 0 380 0
136 1 171 7 206 8 241 7 276 2 311 0 346 0 381 0
137 3 172 5 207 11 242 6 277 0 312 0 347 0 382 0
138 6 173 8 208 10 243 6 278 1 313 0 348 0 383 0
139 4 174 9 209 9 244 6 279 1 314 0 349 0 384 0
140 2 175 6 210 11 245 5 280 0 315 1 350 0 385 0
141 6 176 7 211 9 246 6 281 5 316 0 351 0 386 0
142 6 177 5 212 9 247 5 282 2 317 0 352 0 387 0
143 8 178 9 213 9 248 6 283 3 318 0 353 0 388 0
144 0 179 6 214 9 249 4 284 0 319 0 354 0 389 0
145 5 180 10 215 7 250 5 285 2 320 1 355 0 390 0
146 6 181 17 216 5 251 3 286 4 321 0 356 0 391 0
147 3 182 18 217 8 252 4 287 0 322 0 357 0 392 0
148 5 183 13 218 4 253 0 288 3 323 1 358 0 393 1
149 9 184 14 219 4 254 1 289 2 324 1 359 0 394 0
150 8 185 15 220 8 255 3 290 0 325 0 360 0 395 0
151 8 186 20 221 5 256 4 291 4 326 1 361 0 396 0
152 8 187 17 222 0 257 4 292 1 327 0 362 0 397 1
153 5 188 18 223 5 258 0 293 0 328 0 363 1 398 0
154 3 189 20 224 5 259 4 294 0 329 0 364 0 399 1
63
Таблица 7. Сгруппированное, относительное и кумуля-
тивное распределение частот встречаемости уровня хо-
лестерина у 1054 мужчин в возрастной группе от 25 до 34
лет
ГРАФИЧЕСКОЕ ИЗОБРАЖЕНИЕ
РАСПРЕДЕЛЕНИЯ ЧАСТОТ
65
Рисунок 12. Столбиковая диаграмма среднего
уровня холестерина в крови у 100 обследованных муж-
чин и женщин (мг/дл)
250
200
Ñðåäíèé óðîâåíü õîëåñòåðèíà, ìã/äë
150
100
50
0
ìóæ÷èíû æåíùèíû
500
400
Частота
300
200
100
0
140 180 220 260 300 340 380
Уровень холестерина, мг/дл
67
Кумулятивная кривая и распределение кумулятивных
частот встречаемости величин признака иллюстрируют
концепцию перцентилей. Перцентили являются разновид-
ностью квантилей, которые делят распределение на опре-
денное число равных частей. Перцентили делят распределе-
ние на 100 равных частей. К квантилям относятся также
квартили, делящие распределение на 4 равные части, квин-
тили – делящие распределение на 5 равных частей и деци-
ли- делящие распределение на 10 равных частей. Однако, на
практике из квантилей чаще всего используются перценти-
ли и квартили.
Перцентиль – это такое значение заданного распределе-
ния, которое больше «р» процентов всех значений распре-
деления. Иначе говоря, перцентиль показывает процент тех
значений признака, которые располагаются ниже или равны
данной величине признака.
В случае сгруппированного распределения частот, на-
пример, данных, приведенных в таблице 7, перцентили по-
казывают процент наблюдений, который находится в пре-
делах или ниже любого группового интервала. Так, 100%-
перцентиль значения холестерина – это значение холесте-
рина, при котором 100% значений находятся ниже этой точ-
ки. Это максимальное значение, в нашем случае равное ин-
тервалу 360-399 мг/дл. Аналогично, нулевой перцентиль –
это минимальное значение, в данном случае равное интер-
валу 120-159 мг/дл. Из таблицы также видно, что около 56%
всех обследованных имеют значения холестерина в крови
ниже величины 199 мг/дл, которая является 56-ым перцен-
тилем. Мужчина с уровнем холестерина 199 мг/дл входит в
пределы 56-ой перцентили; 44% всех обследованных имеют
значения холестерина выше указанного уровня.
Перцентили часто используются при сравнении индиви-
дуальных данных с нормой. Они находят широкое приме-
нение в разработке и использовании шкал для оценки уров-
ня физического развития, уровня интеллекта. Они опреде-
ляют также пределы нормы для лабораторных показателей.
68
На рисунке 15 изображена центильная шкала для оценки
физического развития девочек в возрастной группе от 0 до
36 месяцев. Для девочек в возрасте 21 месяца, например, 95-
ый перцентиль веса равен 12 кг (показано стрелкой). Это
означает, что 95% девочек в возрасте 21 месяца весят 12 кг
или меньше, и только у 5% девочек этой возрастной группы
значения веса тела больше 12 кг.
Рисунок 15.
Центильная шкала для оценки физического развития
девочек в возрастной группе от 0- до 36 месяцев
69
Как уже было сказано, квартили- это квантили, делящие
распределение на 4 равные части. Первый квартиль - это 25-
ый перцентиль, второй квартиль - 50-ый перцентиль, и тре-
тий квартиль - это 75-ый перцентиль. Половина всех на-
блюдений распределения находится между 25-ым и 75-ым
перцентилями. Разница между третьим и первым квартиля-
ми, или разница между 75% и 25% перцентилями, называет-
ся межквартильным разбросом. Межквартильный разброс
включает срединные 50% всех наблюдений. Например,
межквартильный разброс веса 9-месячных девочек включа-
ет значения веса между 7,5 (75-ый перцентиль) и 6,5 (25-ый
перцентиль) кг. Это означает, что 50% девочек указанной
возрастной группы имеют значения веса между 6,5 и 7,5 кг.
μ=Me=Mo
Частота
Значения
Одно большое преимущество перцентилей и квартилей
заключается в том, что они являются хорошим описанием
данных вне зависимости от формы распределения. Они не
предполагают наличия так называемого, нормального рас-
пределения. Что же подразумевается под нормальным рас-
пределением?
Полигоны распределения частот могут быть различной
формы, но многие нативные явления имеют симметричное,
колокообразное распределение. Это распределение чаще
всего называют нормальным или именем автора, открывше-
70
го данную закономерность, Гауссовским распределением
(рис. 16).
На рисунке 17 показаны некоторые другие виды частот-
ных распределений. Ассиметричные частотные распределе-
ния называются скошенными (skewed distributions). Асси-
метричное распределение может быть скошенным вправо
(положительная ассиметрия) (рис. 17 А) или влево (отрица-
тельная ассиметрия) (рис. 17 B). Направление скошенности
определяют по месту нахождения хвоста. Распределение с
положительной ассиметрией характеризуется наличием от-
носительно большого числа малых значений и небольшого
числа больших значений изучаемого признака. Соответст-
венно, при распределении с отрицательной ассиметрией
превалируют крупные значения при относительно неболь-
шом количестве малых значений изучаемого признака.
На рисунке 17 C и D показаны также J-образное и бимо-
дальное распределения. Бимодальное распределение часто
представляет собой комбинацию двух нормальных распре-
делений. Например, распределение величин роста большой
группы мужчин и женщин, при котором величины каждого
пола имеют нормальное распределение относительно двух
различных средних величин.
71
Рисунок 17. Виды ненормальных частотных распреде-
лений
А. Положительная B. Отрицательная
ассиметрия ассиметрия
C. J –образное D. Бимодальное
распределение распределение
∑X i
X = 1
,
n
где X – средняя (икс с верхним подчеркиванием). Сим-
вол Σ – математический знак суммирования измеренных
величин X i . Выражения над и под знаком суммирования
означают, что суммируется ряд величин X , обозначенных
73
индексом i, от 1 до n; n - число измеренных значений пере-
менной х, или число наблюдений. Процедура вычисления
средней арифметической реализована не только в специали-
зированных пакетах программ для статистического анализа
(например, SPSS, SAS и др.), но и в пакетах программ ши-
рокого назначения, например, в электронных таблицах (MS
Excel и др.).
Покажем расчет величины средней арифметической на
следующем примере. Во время вспышки гепатита А в учеб-
ном заведении заболело 6 человек. Инкубационный период
заболевших составлял соответственно: 29, 31, 24, 29, 30 и 25
дней.
Величина среднего инкубационного периода составит:
n
∑X i
29 + 31 + 24 + 29 + 30 + 25
X = 1
= = 28дней
n 6
74
Минус значение средней
Значение Разность
арифметической
24 -28 -4
25 -28 -3
29 -28 +1
29 -28 +1
30 -28 +2
31 -28 +3
168-168=0 -7+7=0
Mo
Mo
Me
Me
μ
77
разбросаны в большей степени по сравнению со значения-
ми, формирующими распределение В.
Отсюда можно сделать вывод, что недостаточно описы-
вать нормальное распределение только посредством показа-
телей центральной тенденции. Необходимо также указывать
степень варьирования, или изменчивости величин признака
в изучаемом ряду данных.
X = Me =
M
78
Существует несколько показателей варьирования, или
разброса: амплитуда, дисперсия, стандартное отклонение,
коэффициент вариации, квартили и межквартильный раз-
мах.
Амплитуда, или размах – самая простая из величин
варьирования. Амплитудой ряда данных называется разни-
ца между наибольшим (максимальным) и наименьшим (ми-
нимальным) значениями ряда. Следовательно, размах учи-
тывает значения только этих двух величин ряда. Например,
в приведенных ниже рядах данных:
24, 25, 29, 29, 30, 31
24, 25, 29, 29, 0, 31, 331
амплитуда равна, соответственно: 31- 24 = 7 и 331-24 =
307.
При использовании в качестве величины центральной
тенденции средней арифметической для описания вариа-
бельности признака используется дисперсия и стандартное
отклонение. Если же в качестве меры центральной тенден-
ции используется медиана, то вместе с ней, как правило, ис-
пользуются такие меры вариабельности признака, как квар-
тили и межквартильный размах, рассмотренные выше.
Стандартное отклонение (СО) является наиболее часто
используемой величиной варьирования и очень важной ста-
тистической величиной, важным элементом многих стати-
стических тестов. Оно показывает разброс величин призна-
ка вокруг средней, вычисленной для данного ряда наблюде-
ний. Обычно, стандартное отклонение, вычисленное из вы-
борки, обозначается аббревиатурой СО, популяционное
стандартное отклонение, показывающее степень варьиро-
вания величины переменной во всей популяции, обозна-
чают греческой буквой σ.
Какова же формула для вычисления СО? Если нам нужно
определить насколько величины признака в ряду данных
раэбросаны по отношению к вычисленной средней, можно
вычислить величину среднего отклонения, для чего из каж-
79
дой величины признака в представленном ряду данных ( X )
необходимо вычесть величину средней ( X ) , суммировать
все отклонения и разделить сумму на число наблюдений,
т.е.
∑(X − X ) .
n
Однако проблема заключается в том, что при четном
числе наблюдений сумма отклонений величин признака от
средней всегда равна 0. Эта проблема решается возведением
каждого отклонения в квадрат перед их суммированием.
Деление суммы квадратов отклонений на n-1, где n –
число наблюдений, позволит нам вычислить величину
варьирования, которая называется дисперсией и обознача-
ется символом s2:
s =
2 ∑ ( X − X )2
n −1
Объяснение причины, по которой сумма квадратов от-
клонений делится на n-1, а не на n, достаточно сложно и не
входит в программу данного курса. Отметим только, что
использование в знаменателе формулы величины n-1, назы-
ваемой степенью свободы, вместо n дает возможность более
точной оценки истинной величины варьирования величины
признака в популяции.
Однако дисперсия имеет величину размерности признака
в квадрате. Для того, чтобы вернуться к нормальной раз-
мерности, из дисперсии извлекается квадратный корень.
Квадратный корень из дисперсии называется стандарным
отклонением (СО):
CO = s =2 ∑(X − X ) 2
n −1
Рассмотрим все указанные вычисления на следующем
примере. В таблице 8 приведены данные изменения частоты
сердечных сокращений у 18 обследованных больных и все
этапы вычисления стандартного отклонения.
80
Таблица 8. Расчет стандартного отклонения изменений
частоты сердечных сокращений в обследованной вы-
борке из 18 больных
82
В пределах трех стандартных отклонений от средней
умещается почти вся популяция — 99,73%.
Z-значения
84
Из таблицы № 9 видно, например, что 0,309 (или прибли-
зительно 31%) величин распределения лежат выше значе-
ния z, равного +0,5. Так как нормальное распределение
симметрично, это также означает, что приблизительно 31%
величин распределения лежит ниже значения z, равного –
0,5. Значит, 31% указанной популяции имеет значение сис-
толического давления, равное 115 мм рт.ст.
Z-значения стандартизированы, поэтому они позволяют
сравнивать значения различных нормальных распределе-
ний. Например, с помощью соответствующих z- значений
можно сравнивать рост человека с его весом (при условии,
что оба эти признака являются элементами нормального
распределения).
Вместо использования z-значения для нахождения
удельного веса распределения, соответствующего опреде-
ленным величинам, мы может сделать обратное: использо-
вать z-значения для нахождения значения, которое делит
распределение на определенные проценты. Например, ис-
пользуя таблицу z-значений, мы можем определить значе-
ние z, которое отделяет 5% лиц в популяции с наибольшими
значениями систолического давления от остальных 95%
(т.е. группу, соответствующую 95-ому перцентилю или вы-
ше него). Величина 5%, или 0.05, в таблице № 9 соответст-
вует значению z, равному 1,645. Это означает, что соответ-
ствующая величина систолического давления лежит на
1,645 стандартных отклонений выше величины средней, т.е.
она равна μ + 1,645 σ = 120 + (1,645 х 10) = 136.45, или при-
близительно 136 мм рт.ст. Мы можем заключить, таким об-
разом, что в популяции 5% лиц с наибольшими значениями
систолического давления имеют значения указанного при-
знака выше 136 мм рт.ст. Значение z, которое отделяет
верхние 5% популяции от остальных 95%, не равно 2. Хотя
95% величин распределения и лежат в пределах 2 стандарт-
ных отклонений от средней, эти 95% приходятся на середи-
ну площади под кривой нормального распределения. На ос-
тавшиеся два хвоста по обе стороны от площади в 95% при-
85
ходится 5% всего распределения. Но так как кривая нор-
мального распределения симметрична, 2.5% распределения
лежат на 2 стандартных отклонения выше средней и 2.5%
распределения - ниже средней.
Площадь ме-
Площадь в Площадь в
жду значе-
z двух хвостах одном хвосте
ниями
(< -z и > +z) (< -z или > +z)
– z and +z
0.00 0.000 1.000 0.500
0.05 0.040 0.960 0.480
0.10 0.080 0.920 0.460
0.15 0.119 0.881 0.440
0.20 0.159 0.841 0.421
0.25 0.197 0.803 0.401
0.30 0.236 0.764 0.382
0.35 0.274 0.726 0.363
0.40 0.311 0.689 0.345
0.45 0.347 0.653 0.326
0.50 0.383 0.617 0.309
0.55 0.418 0.582 0.291
0.60 0.451 0.549 0.274
0.65 0.484 0.516 0.258
0.70 0.516 0.0484 0.242
0.75 0.547 0.453 0.227
0.80 0.576 0.424 0.212
0.85 0.605 0.395 0.198
0.90 0.632 0.368 0.184
0.95 0.658 0.342 0.171
1.00 0.683 0.317 0.159
1.05 0.706 0.294 0.147
1.10 0.729 0.271 0.136
1.15 0.750 0.250 0.125
1.20 0.770 0.230 0.115
1.25 0.789 0.211 0.106
86
1.28 0.800 0.200 0.100
1.30 0.806 0.194 0.097
1.35 0.823 0.177 0.089
1.40 0.838 0.162 0.081
1.45 0.853 0.147 0.074
1.50 0.866 0.134 0.067
1.55 0.879 0.121 0.061
1.60 0.890 0.110 0.055
1.645 0.900 0.100 0.050
1.65 0.901 0.099 0.049
1.70 0.911 0.089 0.045
1.75 0.920 0.080 0.040
1.80 0.928 0.072 0.036
1.85 0.936 0.064 0.032
1.90 0.943 0.057 0.029
1.95 0.949 0.051 0.026
1.96 0.950 0.050 0.025
2.00 0.954 0.046 0.023
87
Таким образом, вероятность того, что случайно выбран-
ный из данной популяции человек будет иметь значение
систолического давления меньше 100 мм рт.ст., составит
2.5%.
89
Интенсивный показатель - показатель частоты встре-
чаемости, или уровня распространенности процессов, явле-
ний, совершающихся в определенной среде. Он показывает,
как часто встречается изучаемое явление в среде, которая
его продуцирует.
Примерами интенсивных показателей являются показа-
тели заболеваемости, смертности, рождаемости и т.д. Для
расчета интенсивного показателя необходимо иметь данные
об абсолютном размере явления и среды, его продуцирую-
щей. Абсолютное число, характеризующее размер явления,
делится на абсолютное число, показывающее размер среды,
внутри которой произошло данное явление, и умножается
на 100, 1000 и т.д:
250
Частота встречае-
200
150
мости
100
50
0
70
80
88
92
00
02
05
07
19
19
19
19
20
20
20
20
Заболеваемость Распространенность
92
Показатель соотношения характеризует соотношение
между двумя не связанными между собой совокупностями,
одна из которых характеризуется наличием определенного
признака (а), а другая - его отсутствием (b). Формула для
вычисления показателя соотношения следующая:
Показатель соотношения = а / b.
Таким образом, отличительной особенностью показателя
соотношения является то, что в нем числитель никогда не
является частью знаменателя.
Показатель соотношения также иногда умножается на
множитель, равный 100, 1000, 10 000 и т.д.
Примерами показателей соотношения служат, например,
показатель обеспеченности населения больничными койка-
ми, врачами, средним медперсоналом, медицинской техни-
кой. Первый из указанных показателей вычисляется, на-
пример, следующим образом:
Показатель
Число больничных коек х 10 000
обеспеченности населения =
Численность населения
больничными койками
93
СТАТИСТИЧЕСКИЕ ВЫВОДЫ
96
чем значения уровня холестерина в крови у двух людей,
случайно отобранных из популяции.
Причина меньшей вариабельности выборочных средних,
по сравнению с индивидуальными значениями, очевидна.
Средняя арифметическая усредняет значения нескольких
индивидуальных значений. Даже при наличиии в выборке
нескольких крайних (выскакивающих) значений их влияние
будет в значительной степени сглажено воздействием нор-
мальных значений данной переменной, составляющих
большинство. Это позволяет делать о выборке достаточно
обоснованные заключения.
Рассмотрим следующий пример. Предположим нам не-
обходимо сравнить средний рост студентов и студенток-
медиков. Если мы просто отберем 1 студента и 1 студентку
и сравним их значения роста, то скорее всего рост мальчика
будет выше роста девочки. Однако, может статься так, что
выбранная студентка будет выше мальчика. Рост как сту-
дентов, так и студенток подвержен значительной вариации,
и кривые распределения их значений роста в значительной
степени наслаиваются друг на друга, если даже средний
рост мальчиков на 15 см выше роста девочек.
Любая попытка сделать заключение на основе выборок,
включающих одно единственное наблюдение, разумеется,
бесмысленна вследствие присущей переменным вариабель-
ности и, как следствие этого, ненадежности. Однако, было
бы очень удивительно, если бы мы, отобрав по 16 мальчи-
ков и девочек, вдруг выявили, что средний рост девочек
значительно выше среднего роста мальчиков. Даже при на-
личии среди отобранных студентов небольшого числа не-
обычно высоких девочек и мальчиков с необычно низким
ростом, их воздействие на значение выборочной средней
будет очень незначительным.
При повторном отборе нескольких выборок студентов и
студенток и вычислении выборочных средних мы заметим,
что их значения от выборки к выборке несколько варьиру-
ют. Однако благодаря эффекту сглаживания, воздействию
97
обсужденного явления усреднения эта вариация выбороч-
ных средних значительно сократится, и кривые распределе-
ния выборочных средних роста мальчиков и девочек почти
не будут наслаиваться друг на друга. Иными словами, в
сущности, любая отобранная выборка мальчиков и девочек
будет указывать на то, что, на самом деле, мальчики выше
девочек.
Таким образом, средние величины являются менее ва-
риабельными, по сравнению с индивидуальными величина-
ми переменных. Мы уже обсудили, что это уменьшение ва-
риабельности является прямым следствием усреднения ин-
дивидуальных значений в выборке. Однако возникает во-
прос, насколько эта вариабельность меньше и отчего зави-
сит ее величина.
Совершенно очевидно, что вариабельность выборочных
средних будет зависеть от вариабельности индивидуальных
значений переменной, на основе которых они были вычис-
лены. Чем больше вариабельность индивидуальных значе-
ний, тем более вариабельными будут значения средних
арифметических. Кажется одинаково обоснованным также
предположение о том, что вариабельность выборочной
средней должна зависеть от размера выборки, для которой
она была рассчитана. Выборка, включающая всего 2 наблю-
дения, лишь отчасти усредняет вариабельность индивиду-
альных значений и в значительно меньшей степени умень-
шает воздействие необычайно высоких или низких значе-
ний переменной. С другой стороны, выборка, включающая
100 наблюдений, обеспечивает значительно более надеж-
ную защиту средней от воздействия необычных значений, и
средняя, полученная из такой выборки, будет внушать го-
раздо больше доверия, чем средняя выборки, включающей
всего 2 наблюдения.
Таким образом, вариабельность выборочных средних,
или стандартная ошибка, зависит от двух величин - стан-
дартного отклонения и размера выборки. Отношение между
ними показано в нижеприведенной формуле:
98
σ
m= .
n
Как видно из формулы, стандартная ошибка равна стан-
дартному отклонению популяции, деленному на корень
квадратный из размера выборки. Чем больше значение
стандартного отклонения, т.е. чем больше наблюдения от-
личаются от средней, тем меньше уверенности в величине
средней и тем больше стандартная ошибка. Чем больше
объем выборки, тем больше уверенности в том, что полу-
ченная выборочная средняя будет близка к значению ис-
тинной популяционной средней и тем меньше, соответст-
венно, стандартная ощибка.
Так как кривая распределения средних случайных выбо-
рок, по определению, является нормальной, все известные
факты о нормальном распределении и z-значениях могут
быть использованы для определения вероятности того, что
выборка будет иметь значение средней выше или ниже оп-
ределенной величины, при условии, что выборка является
случайной.
Кроме того, так как независимо от формы распределения
величин переменной в популяции, из которой были произ-
ведены выборки, кривая распределения выборочных сред-
них всегда будет оставаться нормальной, то z-значения мо-
гут быть использованы вне зависимости от формы распре-
деления в популяции, при условии, опять-таки, что выборка
является случайной.
Методика определения выборочной средней очень схожа
с методикой определения отдельного элемента- она вклю-
чает нахождение z-значений, соответствующих интересую-
щей нас величине. Однако, вместо вычисления z-значения,
показывающего на сколько стандартных отклонений от-
дельный элемент лежит выше или ниже популяционной
средней, в данном случае z-значение будет показывать на
сколько стандартных ошибок данная выборочная средняя
лежит выше или ниже популяционной средней. Таким обра-
99
зом, формула для вычисления z-значения будет выглядеть
следующим образом:
X −µ
z=
m
Например, в популяции со средним значением систоли-
ческого давления 120 мм рт.ст и стандартным отклонением,
равным 10, вероятность того, что случайная выборка в 25
человек будет иметь значение среднего систолического дав-
ления выше 125 мм рт.ст., будет рассчитана следующим об-
разом:
X −µ
z= , где
m
σ 10
m= = =2
n 25
Отсюда:
X − µ 125 − 120
z= = = 2.5
m 2
Из таблицы 9 видно, что величине z, равной 2.5, соответ-
ствует вероятность 0.006.
Таким образом, вероятность того, что случайная выборка
численностью в 25 человек, выбранная из данной популя-
ции, будет иметь среднее значение систолического давле-
ния выше 125 мм рт.ст. составит 0.6%.
Возможно также определение того, какая из выборочных
средних имеет настолько большое значение, что встречает-
ся только в 5% или меньше выборок. Из таблицы 9 видно,
что значение z, которое отделяет нижние 95% распределе-
ния от верхних 5%, равно 1.645. Соответствующая величина
систолического давления будет равна: µ + 1.645 ⋅ m (т.е.
популяционная средняя + 1.645 стандарных ошибок). Так
как популяционная средняя равна 120, a стандартная ошиб-
ка равна 2, то значение систолического давления составит:
120+(1.645х2), или 123.29 мм рт.ст.
100
Возможно также определение интервалов, в пределах ко-
торых будут лежать 95% всех выборочных средних. Как и в
случае любого нормального распределения, 95% распреде-
ления выборочных средних будет лежать в пределах ± 2
СОС, т.е. в пределах z= ± 2.
Таким образом, 95% всех выборочных средних должны
лежать в пределах ± 2 СОС от популяционной средней. Как
видно из таблицы 8, точное z-значение, которое соответст-
вует средним 95% нормального распределения, равно ±
1.96, а не ±2. Таким образом, точные границы составят 120±
(1.96х 2) = 116.08 и 123.92 мм рт.ст.
ДОВЕРИТЕЛЬНЫЕ ГРАНИЦЫ
ДГ = X ± z ⋅ m
A B C D
104
На рисунке 24 C дротики не только разбросаны, но и
имеется систематическая ошибка в одном направлении. Та-
кое метание является неточным и несостоятельным.
На рисунке 24 D показан идеальный вариант метания
дротиков, когда все дротики попадают в центр мишени. Та-
кое метание характеризуется высокой точностью и состоя-
тельностью.
105
зультат, который можно получить в случае, если выборки
являются случайными, но маленькими.
Рапределение B характеризуется узостью, которая обес-
печивает точную оценку истинной популяционной средней.
Вследствие небольшого значения стандартной ошибки ши-
рина доверительного интервала будет узкой. Однако, сред-
няя этого распределения лежит на значительном расстоянии
от истинной популяционной средней и, следовательно, бу-
дет обеспечивать «пристрастную» оценку истинной попу-
ляционной средней. Такой результат может быть получен
при большой, но не случайной выборке.
Распределение С является очень разбросанным (с боль-
шой величиной стандартной ошибки) и, следовательно, бу-
дет обеспечивать неточную оценку истинной популяцион-
ной средней. Его средняя лежит на значительном расстоя-
нии от истинной популяционной средней, и, значит, ее
оценка является также «пристрастной». Такой результат
может быть в случае, если отобранные выборки будут ма-
ленькими и не случайными.
Распределение D является узким и, следовательно, точ-
ным. Его средняя лежит в той же точке, что и истинная по-
пуляционная средняя и, следовательно, оно является и со-
стоятельным. Это распределение является идеальным и мо-
жет быть получено из случайных достаточно больших вы-
борок.
Таким образом, для достижения максимальной точности
и состоятельности результатов в статистических выводах
выборки должны быть большими и, действительно, случай-
ными.
t-значения
106
ределения стандартной ошибки необходимо знать величину
популяционного стандартного отклонения (σ):
σ
m= .
n
На практике же, как правило, значение популяционного
стандартного отклонения исследователям неизвестно, един-
ственное что им бывает известно, это статистические дан-
ные, полученные из выборки: выборочная средняя и выбо-
рочное стандартное отклонение, которое используется для
вычисления так называемой, оценочной стандартной ошиб-
ки (чаще она называется просто стандартной ошибкой).
Формула для расчета оценочной стандартной ошибки
следующая:
CO
m=
n
где СО – стандартное отклонение, полученное из выбор-
ки, n – размер выборки.
107
одинаковы. С уменьшением объема выборки их значения
становятся все более отличными друг от друга.
В таблице t-значений (таблица 10) показаны значения t,
соответствующие различным площадям под кривой нор-
мального распределения для различных объемов выборок. В
крайнем левом столбце таблицы указаны объемы выборок, а
точнее, значения степеней свободы, которые при опреде-
лении доверительных границ определяются как n- 1. На-
пример, в случае если выборка включает 26 человек, значе-
ние t, соответствующее средним 95% распределения, будет
равно 2.060.
Таблица 10. Площадь под кривой нормального распре-
деления ( t-значения)
Площадь в обоих 0.1 0.05 0.01
хвостах
Площадь в одном 0.05 0.025 0.005
хвосте
Степень свободы
1 6.314 12.706 63.657
2 2.920 4.303 9.925
3 2.353 3.182 5.841
4 2.132 2.776 4.604
5 2.015 2.571 4.032
6 1.943 2.447 3.707
7 1.895 2.365 3.499
8 1.860 2.306 3.355
9 1.833 2.262 3.250
10 1.812 2.228 3.169
11 1.796 2.201 3.106
12 1.782 2.179 3.055
13 1.771 2.160 3.012
14 1.761 2.145 2.977
15 1.753 2.131 2.947
25 1.708 2.060 2.787
50 1.676 2.009 2.678
100 1.660 1.984 2.626
∞ 1.645 1.960 2.576
108
В качестве примера демонстрации использования t-
значений рассмотрим ранее рассмотренную задачу оценки
истинного популяционного систолического давления (с
достоверностью 95%) на основе выборочной средней. На
этот раз мы не будем делать нереальных предположений о
наличии информации о популяционной стандарной ошибке.
Предположим, что была отобрана выборка численностью
в 26 человек. Выборочное среднее значение систолического
давления в группе составило 90 мм рт.ст., а стандартное от-
клонение СО = 3 мм.рт.ст. Значит, оценочная стандартная
ошибка составит:
3
m= = 0.6
26 − 1
Для выборки численностью в 26 человек значение степе-
ни свободы будет равно 25. Это означает, что величину t,
соответствующую срединным 95% распределения, следует
искать на строке со степенью свободы, равной 25. Это вели-
чина 2.060, которая не очень отличается от величины z = 2,
соответствующей 95% распределения. Подставив все най-
денные значения в форму для определения доверительного
интервала, получим:
95% ДИ = 90± 2.060x0.6
95% ДИ (88.8; 91.2).
ПРОВЕРКА ГИПОТЕЗ
110
данном случае альтернативная гипотеза будет утверждать,
что HА: μ ≠ 211 мг/дл.
Альтернативной гипотезе всегда противоречит, так назы-
ваемая нулевая гипотеза, которая обозначается Hо. Назы-
вается она нулевой, потому что в большинстве исследова-
ний указывает на отсутствие различий между сравниваемы-
ми популяциями. В нашем примере нулевая гипотеза будет
утверждать, что средняя холестерина у части населения,
страдающего гипертензией,равна популяционной средней,
или: Hо: μ = μо = 211 мг/дл.
Одним из способов проверки гипотез может служить оп-
ределение уровня холестерина у каждого человека, стра-
дающего гипертензией и вычисление субпопуляционной
средней, что требует значительных затрат времени и денег.
Однако, будет более практичным, если мы отберем из рас-
сматриваемой субпопуляции выборку, вычислим выбороч-
ную среднюю и затем на основании данных выборочного
исследования сделаем статистический вывод о всей субпо-
пуляции.
Предположим, мы отобрали из всей субпопуляции боль-
ных, страдающих гипертензией, выборку в 12 человек и вы-
числили выборочную среднюю. Далее мы должны сравнить
полученную выборочную среднюю с популяционной сред-
ней μ о. Если даже окажется, что нулевая гипотеза непра-
вильна и правдива альтернативная, т.е.μ ≠ 211 мг/дл, мы
зададимся вопросом, является ли эта разница между выбо-
рочной и популяционной средними закономерной или слу-
чайной? Мы уже обсуждали, что вследствие ошибки выбо-
рочного исследования величина выборочной средней всегда
будет иметь отклонение от величины популяционной сред-
ней (в данном случае субпопуляционной). Например, если
выборочная средняя уровня холестерина не равна 211 мг/дл,
то мы не можем сразу заключить, что нулевая гипотеза не-
правильна, так как величина ошибки выборочного исследо-
вания предусматривает возможность отбора из субпопуля-
ции выборки со значением средней, равной 211 мг/дл. Для
111
того, чтобы сделать вывод о правдивости или неправдиво-
сти нулевой гипотезы, мы должны решить. при каком зна-
чении разница между выборочной средней и величиной,
равной 211, является не случайной, а закономерной.
Это значение должно быть определено до отбора выбор-
ки и сбора данных. Вместо определения этой величины в
виде уровня холестерина, она определяется в виде вероят-
ности. Уровень вероятности, при котором нулевая гипотеза
считается неправильной, называется критерием, или уров-
нем значимости, и обозначается символом α.
Как показывает распределение выборочных средних, вы-
борочная средняя не может очень сильно отличаться от ве-
личины популяционной средней (в нашем случае субпопу-
ляционной средней). Если же она очень сильно отличается и
лежит ближе к одному из хвостов кривой, то это вызывает
подозрение, что выборка была отобрана не из популяции,
указанной в нулевой гипотезе, а из другой популяции.
Если вероятность получения выборочной средней, кото-
рая отличалась бы намного от вычисленной величины,
очень мала, нулевая гипотеза отвергается. Но что мы пони-
маем под очень маленькой вероятностью? По договоренно-
сти, вероятность эта должна составлять меньше 5%, или
0.05. Таким образом, нулевая гипотеза должна быть отверг-
нута в случае, когда вероятность того, что выборка могла
быть из популяции с величиной средней, равной μо, меньше
5%. Это подразумевает, что в 5% случаях, отвергая нулевую
гипотезу, мы можем совершать ошибку. Т.е, повторяя мно-
гократно тест на достоверность, в 5 случаях из 100 мы мо-
жем совершить ошибку. Иногда, для большей достоверно-
сти сделанных выводов, вероятность берется равной 0.01. В
этом случае вероятность допущения ошибки составляет 1 из
100 случаев.
Проверка статистической гипотезы может быть сравнена
с уголовным судопроизводством. Человек, признанный су-
дом виновным, в действительности может быть или на са-
мом деле виновным, или невиновным. После представления
112
фактов, имеющих отношение к данному случаю, суд при-
знает подсудимого виновным или невиновным. Если подсу-
димый невиновен, и суд выносит решение о его невиновно-
сти, выносится правильный вердикт. Вердикт считается
также правильным, если подсудимый виновен и осуждается
за совершение преступления.
Аналогично этому, истинная популяционная средняя
равна или не равна μ о. Мы предполагаем, что нулевая гипо-
теза (Hо: μ = μо) правдива и рассматриваем свидетельства,
представленные в виде выборки, размером n. На основе на-
ших результатов нулевая гипотеза отвергается или не от-
вергается.
В этом случае мы также имеем две ситуации, при кото-
рых сделанный вывод является правильным: 1) когда попу-
ляционная средняя равна μ о, и нулевая гипотеза не отверга-
ется; 2) когда популяционная средняя не равна μ о, и нулевая
гипотеза опровергается. Аналогично судебной системе,
процесс проверки гипотезы тоже не является совершенным.
В этом случае также могут быть совершены ошибки двух
видов. Мы можем или опровергнуть нулевую гипотезу, в то
время как на самом деле μ = μо, или принять нулевую гипо-
тезу, в то время как μ ≠ μ о. Более подробно об этих ошибках
мы поговорим позже.
Вероятность получения средней, которая намного бы от-
личалась от той, которая была получена при условии, что
нулевая гипотеза правильна, называется p-величиной теста.
Для решения вопроса о том, должна ли быть нулевая гипо-
теза отвергнута, вычисленная величина p сравнивается с за-
ранее определенной величиной α. Если величина p оказыва-
ется меньше величины α, нулевая гипотеза отвергается, ес-
ли больше величиныα – нулевая гипотеза принимается. В
дополнение к результатам исследования в литературе обыч-
но приводится также и полученная величина p.
Достижение статистически значимой величины p≤0.05
свидетельствует лишь о том, что полученный результат это
не простая случайность, а статистическая закономерность.
113
Вероятность того, что полученный результат – случайность,
составляет 5% или меньше. Необязательно, чтобы это зна-
чило, что результат достоверен в обычном понимании, т.е.
заслуживает внимания или имеет смысл. Это также не озна-
чает, что он обязательно клинически значим. Статистически
значимо то, что, действительно, существует с высокой ве-
роятностью. Клинически значимо то, что своими размерами
(например, величиной снижения летальности) убеждает
врача в необходимости изменить свою практику в пользу
нового образа действий.
Расчет значения t
114
ляционного стандартного отклонения, мы используем не z-
тест, а t-тест:
X − µ 37.20 − 4.13
t= = = 14.67
m 7.13 / 10
Таким образом, выборочная средняя (37.20) на 14.7 стан-
дартных ошибок лежит выше гипотетической популяцион-
ной средней (4.13).
Область
Рисунок 26. Распределение выборочных средних гипоте-
принятия
тической популяции со значением средней, равной 4.13.
(95%)
μo= 4.13
Область Область
непринятия непринятия
(2.5%) (2.5%)
tвыч. = + 14.67
Действительная ситуация
Ho правильна Ho неправильна
Результат
(β ошибка)
Отклонение Ho Ошибка I типа Нет ошибки
(α ошибка)
Статистическая чувствительность
120
Рисунок 27. Области принятия и непринятия для одно-
стороннего t-теста
μo= 4.13
Область
непринятия
Область (5%)
принятия
(95%) tвыч. = + 14.67
tкрит = + 1.833
ДИСПЕРСИОННЫЙ АНАЛИЗ
126
Теоретически эта гипотеза может быть проверена с ис-
пользованием множественного t-теста. Однако, этот метод
имеет ряд недостатков. Во-первых, он требует больших за-
трат времени, так как включает проведение 15 отдельных t-
тестов. Кроме того, статистическая чувствительность каж-
дого теста будет сравнительно низкой, а вероятность воз-
никновения ошибки I типа будет высокой.
К счастью, имеется статистический метод, который пре-
одолевает все эти проблемы. Это - дисперсионный анализ
(ANOVA, аббревиатура от Anlysis of Variance), который в
настоящее время используется достаточно часто. В сущно-
сти, рассмотренный нами t-тест является частным случаем
дисперсионного анализа, позволяющим выявить различия
только между двумя группами. Дисперсионный анализ – это
более общий случай исследования различий, когда возмож-
но, сравнение более чем двух групп. В случае простого
сравнения двух групп результат применения дисперсионно-
го анализа совпадает с результатом сравнения по t-
критерию.
Вычисления, лежащие в основе дисперсионного анализа
достаточно длинны и не входят в данный курс. Однако,
вкратце суть дисперсии можно свести к следующему. Дис-
персия характеризует разброс, или вариабельность, значе-
ний переменной. В любой совокупности результатов иссле-
дования, например, в результатах, полученных от использо-
вания трех различных схем лечения у молодых и пожилых
пациентов, обсужденных ранее, будет иметь место вариа-
бельность изучаемой переменной. Это общая вариабель-
ность переменной обусловлена двумя компонентами. Во-
первых, она обусловлена вариабельностью, возникающей
вследствие известной разницы между группами (межгруп-
повая вариабельность), в нашем примере, разницей между
различными схемами лечения, а также разницей между воз-
растными группами. Вторым компонентом, обусловливаю-
щим общую вариабельность переменной в результатах ис-
следования, является обычная вариабельность изучаемой
127
переменной в пределах каждой группы (внутригрупповая
вариабельность), возникающая вследствие индивидуального
различия между пациентами, ошибки выборочного иссле-
дования и т.д.
Дисперсионный анализ дает возможность определить,
является ли выявленная в результатах исследования общая
вариабельность в значительной степени обусловленной
изучаемым различием между группами. Иными словами,
дисперсионный анализ позволяет ответить на вопрос, при-
надлежат ли сравниваемые группы к одной и той же попу-
ляции или они отобраны из различных популяций. Если все
выборки принадлежат одной и той же популяции, то меж-
групповая вариабельность должна быть не больше, чем ва-
риабельность переменной внутри самих выборок. Если же
сравниваемые группы принадлежат разным популяциям и,
следовательно, между ними существует значительное раз-
личие, то дисперсия между различными группами должна
быть значительно больше, по сравнению с колебанием ве-
личины переменной в пределах отдельных групп.
Если исследование было проведено правильно, это раз-
личие между изучаемыми группами должно быть вследст-
вие использования различных схем лечения или различия в
возрасте пациентов.
Таким образом, дисперсионный анализ позволяет опре-
делить является ли дисперсия выборочных средних относи-
тельно общей средней для всей совокупности данных дос-
товерно большей, по сравнению с дисперсией переменной
относительно средней в пределах каждой выборки. Делает-
ся это посредством вычисления простого соотношения, на-
зываемого F-соотношением (F-ratio):
межгрупповая дисперсия
F=
внутригрупповая дисперсия
СРАВНЕНИЕ ПОКАЗАТЕЛЕЙ
131
Задачей исследования может быть также сравнение двух
популяционных показателей. Как и в случае сравнения по-
пуляционных средних, в данном случае также используется
проверка гипотезы со всеми уже известными этапами:
1. Определение альтернативной и нулевой гипотез (HА и
HO).
2. Определение уровня значимости, α.
3. Вычисление значения z, которое соответствует выбо-
рочному показателю (pвыч.).
4. Определение критических значений.
5. Сравнение вычисленного и критического значений z и
принятие или отклонение нулевой гипотезы.
Нулевая и альтернативная гипотезы в этом случае запи-
сываются следующим образом: Ho: π1 = π2, HA: π1 ≠ π2, где –
π1 и π2 - это сравниваемые популяционные показатели.
Вместо t-теста в данном случае выполняется z-тест, т.е.
вычисляется критерий z по формуле:
p1 − p2
z= .
p1 ⋅ (1 − p1 ) p2 (1 − p2 )
+
n1 n2
Затем, как обычно, при проверке гипотезы определяются
критические значения для z. Полученная величина zвыч.
сравнивается с критическим значением zкрит., найденным в
таблице z-значений. Если вычисленное значение превышает
табличное значение, соответствующее определенной вели-
чине α, то нулевая гипотеза отклоняется и принимается аль-
тернативная.
НЕПАРАМЕТРИЧЕСКИЕ ТЕСТЫ
134
Таблица 11. Тромбозы шунта при приеме плацебо и ас-
пирина
Общее число Тромбоз есть Тромбоза нет
больных
Плацебо 25 18 7
Аспирин 19 6 13
Всего 44 24 20
100% 54.5% 45.5%
Как видно из таблицы 11, из 44 изученных больных
включенных в исследование, 25 - получали плацебо, ос-
тальные 19 – аспирин. Из 25 больных, получивших плацебо,
тромбоз был обнаружен у 18, тогда как из 19 больных, по-
лучавших аспирин- только у 6.
Начинаем проверку по критерию хи-квадрат с определе-
ния нулевой и альтернативных гипотез. Нулевая гипотеза в
данном случае будет утверждать, что никакой связи между
применением аспирина и частотой возникновения тромбоза
нет, альтернативная гипотеза будет утверждать обратное:
связь между изучаемыми переменными имеется.
Для вычисления ожидаемых данных мы предполагаем,
что нулевая гипотеза правдива. Если это так, то это означа-
ет, что распределение больных по частоте возникновения
тромбозов в обеих группах, у тех, кто получал плацебо, и у
тех, кто получал аспирин, должно быть одинаковым и та-
ким, как в обеих группах вместе взятых.
Если общее число больных в обеих группах (44) принять
равным 100%, то согласно нулевой гипотезе, у 54.5% (24)
больных тромбоз должен был развиться, у 45.5% (20) –нет.
Таблица 12. Тромбозы шунта при приеме плацебо и ас-
пирина: ожидаемые числа
Общее число Тромбоз есть Тромбоза нет
больных
Плацебо 25 13.6 11.4
Аспирин 19 10.4 8.6
Всего 44 24 20
135
Рассчитав, сколько составляет 54.5% от 25 и 19, получим
соответственно 13.6 и 10.4 (табл. 12). Это и есть ожидаемые
числа больных с тромбозом в группах плацебо и аспирина.
Таким же образом можно получить ожидаемые числа боль-
ных без тромбоза: в группе, принимающей плацебо – 45.5%
от 25, т.е. 11.4, в группе, принимающей аспирин – 45.5% от
19, т.е. 8.6.
Теперь можно приступить к расчету критерия соответст-
вия. Формула для его вычисления следующая:
(O − E ) 2
χ2 = ∑
E
Где О- фактическое число в клетке таблицы сопряженно-
сти, Е – ожидаемое число в той же клетке. Суммирование
производится по всем клеткам таблицы. В результате полу-
чим: (18 − 13.6) 2 (7 − 11.4) 2 (6 − 10.4) 2 (13 − 8.6) 2
χ2 = + + +
13.6 11.4 10.4 8.6
χ = 1.42 + 1.70 + 1.86 + 2.25 = 7.23.
2
Уровень значимости
df 0.100 0.050 0.025 0.010 0.001
1 2.71 3.84 5.02 6.63 10.83
2 4.61 5.99 7.38 9.21 13.82
3 6.25 7.81 9.35 11.34 16.27
4 7.78 9.49 11.14 13.28 18.47
5 9.24 11.07 12.83 15.09 20.52
6 10.64 12.59 14.45 16.81 22.46
7 12.02 14.07 16.01 18.48 24.32
8 13.36 15.51 17.53 20.09 26.12
9 14.68 16.92 19.02 21.67 27.88
10 15.99 18.31 20.48 23.21 29.59
11 17.28 19.68 21.92 24.72 31.26
12 18.55 21.03 23.94 26.22 32.91
13 19.81 22.36 24.74 27.69 34.53
14 21.06 23.68 26.12 29.14 36.12
15 22.31 25.00 27.49 30.58 37.70
16 23.54 26.30 28.85 32.00 39.25
17 24.77 27.59 30.19 33.41 40.79
18 25.99 28.87 31.53 34.81 42.31
19 27.20 30.14 32.85 36.19 43.82
20 28.41 31.41 34.17 37.57 45.31
21 29.62 32.67 35.48 38.93 46.80
22 30.81 33.92 36.78 40.29 48.27
23 32.01 35.17 38.08 41.64 49.73
24 33.20 36.42 39.36 42.98 51.18
25 34.38 37.65 40.65 44.31 52.62
137
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
139
Рисунок 28. Диаграммы рассеяния
А r = +1 B r=-1
C r = -0.7 D r=0
r=
∑ (x − x )( y − y )
∑ (x − x ) ∑ ( y − y )
2 2
Уровень
Уровень триг-
холесте-
лицеридов
рина
(ммоль/л)
(ммоль/л)
x y (x- x) (y- y) (x- x)2 (y- y)2 (x- x)(y- y)
5.12 2.30 -1.61 -3.61 2.5921 13.0321 5.8121
6.18 2.54 -0.55 -3.37 0.3025 11.3569 1.8535
6.77 2.95 0.04 -2.96 0.0016 8.7616 0.1184
6.65 3.77 -0.08 -2.14 0.0064 4.5796 0.1712
6.36 4.18 -0.37 -1.73 0.1369 2.9929 0.6401
5.90 5.31 -0.83 -0.6 0.6889 0.36 0.4980
5.48 5.53 -1.25 -0.38 1.5625 0.1444 0.4750
6.02 8.83 -0.71 2.92 0.5041 8.5264 2.0732
10.34 9.48 3.61 3.57 13.0321 12.7449 12.8877
8.51 14.20 1.78 8.29 3.1684 68.7241 14.7562
∑= ∑= ∑=
Xx = 6.73 Xy = 5.91 21.9955 131.2229 39.2854
r=
∑ (x − x )( y − y ) =
39.2854
=
39.2854
= +0.73
∑ (x − x ) ∑ ( y − y ) 21.9955 ⋅ 131.2229 53.7244
2 2
141
Коэффициент корреляции равен + 0,73. Следовательно,
существует прямая сильная связь между уровнем холесте-
рина и уровнем триглицеридов в крови.
Для того, чтобы убедиться в том, что коэффициент кор-
реляции, вычисленный по данным выборочного исследова-
ния, будет соответствовать размеру связи в генеральной со-
вокупности, необходимо определить среднюю ошибку ко-
эффициента корреляции и критерий t:
1− r 2 r
mr = , t= .
n−2 mr
В нашем примере:
1 − 0.73 2 0.4671
m= = = 0.24
10 − 2 8
0.73
t= = 3.0
0.24
В соответствии с данными табл. 10, коэффициент корре-
ляции, равный + 0.73, достоверен с вероятностью безоши-
бочного прогноза > 95%, т.к. при n =10 полученный крите-
рий t будет больше tтабл. = 2.228 (α = 0.05).
Таким образом, материалы выборочного исследования
позволяют утверждать, что в генеральной совокупности
существует сильная прямая связь между уровнем холесте-
рина и уровнем триглицеридов в крови.
Коэффициент корреляции по методу Спирмена, или ме-
тоду ранговой корреляции, вычисляется по формуле:
6⋅∑d 2
r = 1−
n(n 2 − 1)
где r – коэффициент корреляции, d – разность между ран-
говыми номерами сопоставляемых рядов, n – число обсле-
дованных.
142
Пример вычисления коэффициента корреляции по мето-
ду Спирмена приведен в таблице 15.
Оценка по Оценка по
Ранговые Квадрат
шкале де- шкале де- Разность
номера в разности
прессии прессии рангов
рядах рангов
Бека Гамильтона (d)
(d2)
x y x y
20 22 5 7.5 -2.5 6.25
11 14 1 3 -2 4
13 10 2 1 1 1
22 17 7 5 2 4
37 31 9.5 10 -0.5 0.25
27 22 8 7.5 0.5 0.25
14 12 3 2 1 1
20 19 5 6 -1 1
37 29 9.5 9 0.5 0.25
20 15 5 4 1 1
∑ = 19
6⋅∑d 2 6 ⋅ 19 114
r = 1− = 1− = 1− = 1 − 0.12 = +0.9.
n(n − 1)
2
10 ⋅ 99 990
Корреляционный анализ имеет ряд ограничений.
Во-первых, методы корреляционного анализа позволяют
выявить наличие между переменными линейной связи: они
определяют силу прямолинейной зависимости между двумя
переменными. Если между двумя переменными существует
сильная нелинейная зависимость, то метод корреляционно-
го анализа может недооценить истинную силу связи между
143
ними. Лекарственный препарат имеет очень сильное воз-
действие в зависимости от его дозы, но он дает очень сла-
бый эффект при очень высокой или очень низкой дозе. Та-
ким образом, так как связь между дозой препарата и эффек-
том является нелинейной, значение коэффициента корреля-
ции, вычисленного по методу Пирсона, будет очень низким,
если даже между эти переменными существует сильная за-
висимость.
Во-вторых, корреляционная зависимость между двумя
переменными, даже если она очень сильная, не свидетель-
ствует о наличии между ними причинной зависимости.
Корреляция является лишь мерой статистической зависимо-
сти между переменными. Заключение о наличии причинной
связи между переменными на основе результатов корреля-
ционного анализа является очень грубой ошибкой.
Коэффицент корреляции, рассчитанный по данным вы-
борочного исследования, очень чувствителен к воздействию
крайних (выскакивающих) вариантов и при их наличии мо-
жет приводить к неправильным результатам.
Наличие корреляционной зависимости между двумя пе-
ременными в выборке еще не означает, что она существует
в популяции. Для того, чтобы распространить результаты
корреляционного анализа, проведенного для данных выбор-
ки на всю популяцию, необходимо провести проверку гипо-
тезы, которая включает проведение специального t-теста.
РЕГРЕССИОННЫЙ АНАЛИЗ
144
или девочек), если рост их увеличится на 1 см. В этих целях
применяется метод регрессионного анализа.
Различают простой и множественный регрессионный
анализ.
Метод простого линейного регрессионного анализа по-
зволяет посредством простой линейной математической
функции (уравнения регрессии), определяющей прямоли-
нейную зависимость между двумя переменными, опреде-
лить величину одной переменной (Y) по величине другой
(X). Прямая линия, или линия регрессии, в сущности, явля-
ется той же наиболее подходящей линией диаграммы рас-
сеяния, которая используется при вычислении коэффициен-
та корреляции. Уравнение простой линейной регрессии та-
кое же, что и уравнение любой прямой линии.
Ожидаемая величина Y = α+ βX,
где α- константа, известная под названием пересечения,
так как это точка, в которой ось Y пересекается линией рег-
рессии; β – это наклон линии регрессии, который известен
под названием коэффициента регресии; X – величина неза-
висимой переменной X. Пересечение линии регрессии пока-
зывает, чему будет равно среднее значение ожидаемой ве-
личины, при значении величины переменной X, равной 0.
Наклон линии регрессии показывает изменение ожидаемой
величины Y, соответствующее изменению величины неза-
висимой переменной X на единицу.
Допустим, обнаруженная нами линейная зависимость
между ростом и весом школьников 1-го класса описывается
следующим уравнением регрессии:
Y = -6 + 0.3 X.
В данном уравнении величина α = - 6, β = 0.3. Согласно
данному уравнению, при увеличении роста на 1 см средний
вес увеличивается на 0.3 кг.
Используя данное уравнение регрессии можно вычис-
лить ожидаемое значение Y для любой величины X. Напри-
мер, при росте школьников, равном 116 см, их средняя мас-
са тела будет составлять 26,8 кг.
145
В уравнении множественной регрессии для определения
ожидаемой величины Y используется более одной перемен-
ной. Например, группой исследователей было установлено,
что масса тела новорожденного (Y, г) может быть частично
прогнозирована по числу сигарет, выкуриваемых в день как
матерью ребенка (X1), так и отцом (X2), по уравнению мно-
жественной регрессии Y = 3385 - 9 X1 – 6 X2.
Для определения нелинейной зависимости между множе-
ственными переменными используется другой статистиче-
ский метод. Как и в случае корреляционной зависимости,
регрессионная зависимость не указывает на наличие при-
чинной зависимости.
ВЫБОР АДЕКВАТНОГО
СТАТИСТИЧЕСКОГО ТЕСТА
ДИНАМИЧЕСКИЕ РЯДЫ
148
Преобразование ряда применяется для большей нагляд-
ности изменений изучаемых явлений. Одно из чисел ряда,
обычно первое, принимается за 100% и по отношению к
данному числу ряда, рассчитываются остальные.
Выравнивание ряда применяется при скачкообразных из-
менениях уровней ряда. Цель выравнивания - устранить
влияние случайных факторов и выявить тенденцию измене-
ний значений явления, а в дальнейшем установить законо-
мерности этих изменений.
Существует несколько способов выравнивания динами-
ческого ряда: укрупнение интервала, расчет групповой и
скользящей средней и др.
Укрупнение интервала применяется, когда явление в
интервальном ряду выражено в абсолютных величинах.
Производят укрупнение интервалов путем суммирования
данных за ряд смежных периодов (табл.16). Применение
этого способа выравнивания ряда возможно при кратном
числе периодов.
Как видно из табл.16, погодовые числа детей с ослож-
ненными формами пневмоний то увеличиваются, то умень-
шаются. После укрупнения интервалов по два года можно
увидеть определенную закономерность, наибольшее число
осложненных форм пневмоний приходится на последний
двухлетний отрезок изучаемого периода.
Вычисление групповой средней применяется, когда
уровни интервального ряда выражены в абсолютных, сред-
них или относительных величинах, которые суммируются, а
затем делятся на число слагаемых (см. табл. 16). Способ
применяется при кратном числе периодов.
Расчет скользящей средней применяется, когда уровни
ряда выражены в абсолютных, средних или относительных
величинах. Каждый уровень ряда заменяется на среднюю
величину из данного уровня и двух соседних с ним
(табл.16). Например, скользящая средняя для 1998 года бу-
дет равна: 15 + 9 + 26 = 16,7. Данный метод применяется,
когда не требуется особой точности, когда имеется доста-
149
точно длинный ряд и можно пренебречь потерей двух зна-
чений ряда.
Годы 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
Число детей с
осложненным
течением
50 9 15 26 31 25 18 16 39 26
пневмонии
Укрупнение
59 41 56 34 65
интервала
Вычисление
групповой 29.5 20.5 28 17 32.5
средней
Вычисление
скользящей 24.7 16.7 24 27.3 24.7 19.7 24.3 27
средней
150
Темп прироста – процентное отношение абсолютного
прироста к предыдущему уровню. Например, для 2001 г.: -
3.0 х 100 / 26.0 = -11.5%.
Темп роста – процентное отношение последующего
уровня к предыдущему. Например, для 2001 г.: 23.0 х 100/
26.0 = 88,5%.
Значение 1% прироста используется при сравнении ди-
намических рядов с разными исходными уровнями. 1%
прироста рассчитывается как отношение абсолютного при-
роста к темпу прироста за каждый период (табл. 17, 18).
151
Анализ показателей таблицы 18 позволяет сделать вывод,
что хотя в районе Б темп роста заболеваемости превышает
темп роста заболеваемости в районе А, тем не менее, забо-
леваемость в районе А увеличилась в большей степени, чем
в районе Б.
СТАНДАРТИЗАЦИЯ ПОКАЗАТЕЛЕЙ
Летальность Ожидаемое
выбыло больных
выбыло больных
в обеих больни-
(число больных
из них умерло
из них умерло
бывших умерших в
Стандарт
больных стандарте
цах)
б-ца б-ца б-ца б-ца
А Б А Б
154
Находят сумму ожидаемых чисел умерших в больницах
А (40 + 16 + 80 = 136) и Б (60 + 20 + 96 = 176).
IV этап. Определяют общие стандартизованные показа-
тели летальности в больницах А и Б:
Больница А: 136 х 100/ 4000 = 3.4 на 100 выбывших
больных,
Больница Б: 176 х 100/ 4000 = 4.4 на 100 выбывших
больных.
V этап. Сопоставление соотношения общих интенсивных
и стандартных показателей летальности в больницах А и Б
и формулировка вывода.
155
Литература
156