Вы находитесь на странице: 1из 156

Ереванский государственный медицинский

университет им. М. Гераци

кафедра общественного здоровья

Саканян Г.Г.

ОСНОВЫ БИОСТАТИСТИКИ

Учебное руководство для студентов медицинского уни-


верситета

Под редакцией проф. Айрапетян А.К.

Ереван - 2010

1
Утверждено решением Цикловой методической комиссии
гигиенических и гуманитарных дисциплин ЕГМУ им. Мх.
Гераци (заседание от 14.10.09, протокол N 17).

Рецензенты: к.ф-м.н., доц. кафедры стати-


стики ЕГУ Гаспарян К.

к.м.н., проф. Арутюнян А.М.

Редактор русского текста: к.п.н., доц. Налбандян С.Р.

ОСНОВЫ БИОСТАТИСТИКИ. Учебное руково-


дство для студентов медицинского университета/
Под ред. д.м.н, проф. Айрапетян А.К. – Ер. Изда-
тельство Ереванского государственного медицинско-
го университета им. М. Гераци, 2010, --- стр. 156.

2
Учебное руководство предназначено для студентов выс-
ших медицинских заведений.
Основная цель научить будущих врачей грамотно ис-
пользовать необходимые статистические методы, корректно
интерпретировать и представлять результаты статистиче-
ских исследований. В учебном руководстве содержатся ис-
пользуемые в статистике основные определения, краткое
описание этапов проведения статистических исследований
и наиболее широко применяемые в медико-биологических
исследованиях методы статистического анализа. Многие
вопросы, освещенные в руководстве, представляют интерес
для магистров, резидентов и аспирантов, участвующих в
клинических и экспериментальных исследованиях.

3
ОГЛАВЛЕНИЕ

Введение в биостатистику .................................................5


Этапы проведения медицинских исследований ...........8
Первый этап исследования .....................................8
Второй этап исследования .....................................20
Третий этап исследования .....................................23
Четвертый этап исследования .................................24
Дизайн медицинских исследований ...............................25
Обсервационные исследования ............................... 27
Экспериментальные исследования .........................47
Описательная статистика .................................................61
Таблицы распределения частот ..............................61
Графическое изображение
распределения частот ............................................64
Показатели центральной тенденции .....................72
Показатели варьирования, или разброса ...............77
Относительные величины, их
графическое представление ...................................88
Статистические выводы ...................................................94
Доверительные границы...........................................101
Проверка гипотез ......................................................110
Сравнение двух средних .........................................122
Дисперсионный анализ ............................................126
Сравнение показателей ..........................................130
Непараметрические тесты ...............................................132
Проверка по критерию хи-квадрат .........................133
Корреляционный анализ .................................................138
Регрессионный анализ ......................................................144
Динамические ряды ..........................................................147
Стандартизация показателей ..........................................152
Выбор адекватного статистического теста....................?

4
ВВЕДЕНИЕ В БИОСТАТИСТИКУ

Слово «статистика» часто ассоциируется со словом


«математика», и это пугает студентов, связывающих это по-
нятие со сложными формулами, требующими высокого
уровня абстрагирования. Однако, статистика — это, прежде
всего, способ мышления, и для ее применения нужно лишь
иметь немного здравого смысла и знать основы математики.
В нашей повседневной жизни мы, сами о том не догады-
ваясь, постоянно занимаемся статистикой. Хотим ли мы,
например, оценить усилия, которые потребуются для усвое-
ния какого-то курса, с учетом полученных до сих пор отме-
ток, спланировать бюджет, рассчитать потребление бензина
автомашиной или вообще оценить, как повлияет то или
иное событие на наше личное или совместное будущее, —
нам постоянно приходится отбирать, классифицировать и
упорядочивать информацию, связывать ее с другими дан-
ными так, чтобы можно было сделать выводы, позволяю-
щие принять верное решение.
Все эти виды деятельности мало отличаются от тех опе-
раций, которые лежат в основе научного исследования и
состоят в синтезе данных, полученных на различных груп-
пах объектов в том или ином эксперименте, в их сравнении
с целью выяснения черт различия между ними, в их сопос-
тавлении с целью выявления показателей, изменяющихся в
одном направлении, и, наконец, в предсказании определен-
ных фактов на основании тех выводов, к которым приводят
полученные результаты. Именно в этом заключается цель
статистики в науках.
Таким образом, статистика – это наука, изучающая мето-
ды сбора, обработки, анализа и интерпретации количест-
венных данных, характеризующих массовые явления и про-
цессы.
Особенностью статистики является то, что, изучая мас-
совые явления, выявляются общие закономерности, делают-
ся выводы и заключения, которые, будучи в целом верными
5
и объективными, тем не менее не применимы для определе-
ния единичного явления. Так, например, характеризуя ме-
тод лечения как успешный в 90% случаев, невозможно точ-
но предсказать исход для конкретного больного.
Статистика широко используется в различных областях:
в бизнесе, маркетинге, экономике, сельском хозяйстве, пси-
хологии, социологии, антропологии, биологии и медицине.
Статистика, изучающая вопросы проведения исследова-
ний в области медицины, экологии, биологии, обществен-
ного здоровья и здравоохранения, называется биостати-
стикой.
Врачам в их повседневной работе знание статистики не-
обходимо для принятия правильных решений в отношении
диагностики, лечения и прогноза заболевания. Любой, кто
работает с больными, знает, как часто перед принятием
клинического решения приходится искать новую информа-
цию. Источниками новой медицинской информации в на-
стоящее время являются в основном медицинские журналы.
При этом во время чтения статьи, указывающей на преиму-
щества нового лекарственного препарата, новой схемы ле-
чения, диагностического теста и т.д., к сожалению, мало кто
из врачей задается вопросом, насколько доказательными
являются приведенные сведения. Знание биостатистики по-
могает врачам до внедрения предлагаемых результатов ис-
следований в клиническую практику критически оценить их
на предмет достоверности. Именно такой научный подход к
оценке медицинских научных публикаций предлагает дока-
зательная медицина (Evidence-Based Medicine).
Доказательная медицина требует от любого врача, кто
серьезно относится к своему делу, не просто чтения статей,
а чтения нужных статей и осмысленного использования ре-
зультатов наиболее доказательных из существующих кли-
нических исследований для выбора методов лечения кон-
кретного больного.
Для того, чтобы уметь отличать нужные статьи от не-
нужных, врачу нужно иметь представление об основных
6
этапах проведения медицинских исследований, об их видах,
возможностях и недостатках каждого из них.
Для врачей крайне важно понимание общей логики ста-
тистического исследования, сути процесса анализа, предела
его возможностей, а также вероятности возникновения
ошибок. Современные пакеты программ статистической об-
работки свели технику проведения анализов к нажатию кла-
виш и создали у исследователя иллюзию легкости и доступ-
ности статистического анализа. Однако, значительно увели-
чилось число неправомерного использования методов, не-
адекватной интерпретации результатов. Необходимо пом-
нить, что нет “статистического” метода, а есть научный ме-
тод. Сам по себе он не может быть плохим или хорошим; он
просто может быть применен неверно или не к месту. Ста-
тистика является лишь инструментом в руках исследовате-
ля, но инструментом очень мощным и требующим грамот-
ного и аккуратного обращения с ним. Существо приложе-
ния статистических методов заключается в использовании
здравого смысла при анализе тех или иных данных. Всегда
надо помнить, что статистическая связь не является еще
причинно-следственной связью. Для доказательства при-
чинно-следственной связи необходим логический анализ с
использованием подходов, известных как причинные кри-
терии Бредфорд-Хилла (Bradford-Hill Causal Criteria) к ко-
торым относятся: сила связи, постоянство, временная по-
следовательность, биологический градиент, правдоподобие,
экспериментальные свидетельства, аналогии.

7
ЭТАПЫ ПРОВЕДЕНИЯ МЕДИЦИНСКИХ ИССЛЕДО-
ВАНИЙ

В организации и проведении биомедицинских исследо-


ваний выделяют четыре этапа:
Первый этап - разработка программы и плана исследо-
вания.
Второй этап - сбор необходимых данных, предусмот-
ренных программой исследования и фор-
мирование баз данных.
Третий этап - обработка собранного материала и стати-
стическое описание полученных резуль-
татов.
Четвертый статистические выводы и предложения на
этап - основе анализа полученных результатов
исследования.

ПЕРВЫЙ ЭТАП ИССЛЕДОВАНИЯ

Еще до начала исследования исследователь должен четко


представлять, что и как он будет делать на каждом этапе.
На первом этапе тщательно разрабатываются программа
и рабочий план исследования. Программа исследования
включает в себя четкое определение изучаемой проблемы,
цели и задач исследования, формулировку гипотез, опреде-
ление дизайна (структуры) исследования, объекта и едини-
цы наблюдения, методов формирования выборочной сово-
купности, разработку статистического инструментария, ме-
тодов сбора, обработки и анализа данных.
Цель исследования определяется конечным результатом,
на достижение которого направлено данное исследование.
Задачи исследования – это ряд конкретных промежуточ-
ных шагов (целей), последовательное решение которых по-
зволяет достичь поставленной цели. Например, целью ис-
следования может являться разработка мероприятий по ук-
8
реплению и сохранению здоровья студентов медицинского
университета. Задачами исследования в этом случае могут
служить:
1. Изучение распространенности курения среди сту-
дентов в начале и в конце обучения в медицинском
университете.
2. Выявление факторов, влияющих на распространен-
ность курения.
3. Предложение мероприятий по профилактике и борь-
бе с курением среди студентов медицинского уни-
верситета.
Четкая формулировка цели и задач исследования облег-
чает задачу разработки статистических гипотез и выбора
дизайна исследования. Разработанные гипотезы определяют
направление исследования. Исследование движется от ги-
потезы к проведению исследования для ее проверки и к по-
лучению выводов. В указанном исследовании гипотезой
может служить, например, предположение об ухудшении
показателей здоровья студентов-медиков к концу обучения
под влиянием курения.
Подробная информация о разновидностях дизайнов ис-
следования, о преимуществах и недостатках каждого из них
будет представлена в следующем разделе.
На этапе разработки программы исследования определя-
ются, как уже было сказано, также единица и объект на-
блюдения.
Единица наблюдения - это каждый первичный элемент
статистической совокупности. Объект наблюдения - это со-
вокупность единиц наблюдения, избранная для статистиче-
ского наблюдения. Эту совокупность в статистике принято
называть статистической совокупностью. Это может быть
население в целом, отдельные группы населения и т.п.
В нашем исследовании единицей наблюдения является
студент, обучающийся в данном медицинском вузе на про-
тяжении всех лет обучения, а объектом наблюдения - сту-
денты медицинского вуза.
9
Единица наблюдения наделена признаками сходства и
различия, которые подлежат учету и дальнейшему наблю-
дению, поэтому эти признаки называются учетными. Типом
признака, или переменной (variable), и дизайном исследова-
ния определяется, какие манипуляции можно с этими при-
знаками проводить и какие статистические инструменты
использовать.
По виду учетные признаки, или переменные, могут быть
качественными или количественными.
Количественные признаки – признаки, или переменные,
значения которых имеют числовое выражение. Они могут
быть дискретными – принимающими в заданном интервале
ограниченное, определеннное число значений и обычно вы-
ражающимися целыми числами (например, число детей, бе-
ременностей, приступов и т.д.); или непрерывными (conti-
nuous) - принимающими в заданном интервале неограни-
ченное число значений (масса, длина тела и т.д.).
Качественные, или описательные признаки, характери-
зуют качество отдельных единиц совокупности; для них ко-
личественных значений нет, либо они скрыты. Описатель-
ный признак – это некоторая категория (значение) характе-
ристики, к которой индивид принадлежит или не принадле-
жит, или свойство, которым индивид обладает или не обла-
дает. Некоторые характеристики можно выразить только
одним способом, другие допускают применение обоих спо-
собов представления. Например, масса может быть выраже-
на в численном значении (в кг) или качественном (наличие
избыточной массы тела или ее отсутствие).
При выборе формы представления важно учитывать осо-
бенности проводимого исследования, требования надежно-
сти и состоятельности, а также свойства различных измери-
тельных шкал. Однако, в общем подход таков – количест-
венные признаки предпочтительнее представлять именно в
таком виде, а не преобразовывать в качественные.

10
В процессе проведения исследования важным является
получение данных, для чего существуют три основных типа
инструментов:
1. Приборы – измерения производятся с помощью чисто
механических приспособлений (весы, термометр, манометр
и т.д.).
2. Люди – измерения производят люди без аппаратуры
или с минимальным ее использованием (сбор анамнеза, ан-
кетирование, перкуссия, аускультация).
3. Комбинация людей и приборов (расшифровка рент-
генограмм, патоморфологические исследования).
В любом случае, желательно, чтобы средства определе-
ния данных обладали двумя свойствами – надежностью
(reliability) и состоятельностью (валидностью, validity).
Надежность – свойство, присущее любому работающе-
му инструменту. Надежен тот инструмент, который дает
стабильные результаты при повторном исследовании одно-
го и того же объекта в сходных условиях.
Состоятельность – это способность метода или инстру-
мента измерять ту характеристику, для измерения которой
он предназначен. Например, лихорадка не может быть со-
стоятельным (достоверным) показателем малярии в районе
с низким уровнем распространения этого заболевания. Или
же: бездетность не может быть состоятельным признаком
бесплодия.
Двумя важными компонентами состоятельности являют-
ся чувствительность и специфичность. В общем смысле
чувствительность критерия, метода или измерительного ин-
струмента представляет собой отношение изменения на-
блюдаемого показателя к соответствующему изменению
значения измеряемой величины. Чем выше это отношение,
тем чувствительнее метод. Если, например, измеряется кон-
центрация и ее малое изменение приводит к большому из-
менению результатов, то такой тест чувствительный. В этом
смысле чувствительность не относится к минимальному ко-
личеству, которое можно выявить (это порог чувствитель-
11
ности). Специфичность определяется как степень, с которой
критерий, метод или измерительный прибор способны реа-
гировать на наличие данной величины и не реагировать на
наличие всех других переменных.
При проведении исследований “измеряемая” исследова-
телем величина состоит из двух составляющих – величины
самого показателя и ошибки измерения. Ошибка измерения
может быть двух типов: систематической (смещение, bias) и
случайной (random error).

измеряемая величина = истинная величина + ошибка измерения

систематическая ошибка + случайная ошибка

поражает поражает
состоятельность надежность

Случайных ошибок избежать невозможно, но, к счастью,


они не фатальны, их можно учесть и “ввести поправки” во
избежание ошибочных заключений. Систематические
ошибки предупреждаемы, их совершать нельзя, т.к. они
приводят к ошибочным выводам и заключениям. К этой те-
ме мы еще не раз вернемся.
Для измерения данных используют четыре шкалы –
шкалу номиналов, шкалу рангов, шкалу интервалов и шкалу
отношений.
Шкала номиналов, или категорий (номинальная), харак-
теризуется тем, что переменные в ней имеют только назва-
ния, метки, ярлыки. Измерение в такой шкале не содержит
никаких указаний на величину индивидуального показате-
ля. Переменные номинальных шкал могут быть дихотоми-
ческими, или бинарными, и полихотомическими.
Дихотомические переменные могут принимать только
два возможных значения – наличие или отсутствие изучае-
12
мых признаков или состояний, например, принадлежность к
мужскому или женскому полу, наличие или отсутствие бо-
лезни и т.д.
Полихотомические переменные имеют более двух воз-
можных вариантов, например, диагноз, место жительства,
группа крови и т.д. Возможности обработки переменных,
относящихся к номинальной шкале очень ограничены.
Можно провести только частотный анализ таких перемен-
ных. К примеру, расчет среднего значения для переменных
“пол” или “семейное положение”, совершенно бессмысле-
нен.
Шкала рангов (порядковая) имеет все свойства номи-
нальной шкалы и, кроме того, позволяет ранжировать пере-
менные, т.е. располагать их в естественном порядке увели-
чения величины переменной. Примерами переменных, от-
носящихся к порядковой шкале, относятся, например, ста-
дии болезни, тяжесть состояния по условной шкале, шкала
Апгар и т.д. К примерам переменных, измеряемых в поряд-
ковой шкале, относятся также переменные, полученные в
результате объединения величин в классы, например, в ре-
зультате объединения в классы величин массы тела ново-
рожденных, величин месячного дохода и т.д. Характерной
особенностью шкалы является то, что несмотря на явную
разницу в классах, тем не менее их нельзя измерить и гра-
ницы между ними являются неопределенными и неравны-
ми.
Кроме частотного анализа, переменные с порядковой
шкалой допускают также вычисление такой статистической
характеристики, как медиана.
Количественные признаки измеряются в интервальных
шкалах и шкалах отношений. Интервальная шкала схожа с
порядковой в том, что варианты интервальной шкалы также
могут быть ранжированы, расположены в порядке возраста-
ния величины переменной. Особенностью интервальной
шкалы является то, что она не только допускает возмож-
ность ранжирования отдельных вариантов, но и характери-
13
зуется равными интервалами между отдельными ступень-
ками шкалы. Интервалами могут иметь числовые выраже-
ния с определенной единицей измерения.
В отличие от шкалы отношений в интервальной шкале
как единица измерения, так и нулевая точка (начало коор-
динат или точки отсчета), произвольны и устанавливаются
только по соглашению (являются условными). По этой
шкале перемножение и сложение дают разные результаты.
Например, по шкале Цельсия температура в 30ºС не в 2 раза
выше температуры в 15ºС, а на 15ºС . Или же: суммарные
знания трех двоечников не больше знаний одного отлични-
ка. Приведем другой пример. Если, например, у Саши ко-
эффициент интеллекта (IQ) равен 80, у Димы - 120 и у Бо-
риса - 160, то можно сказать, что Дима в сравнении с Са-
шей, настолько же интеллектуальнее, насколько Борис в
сравнении с Димой (а именно: на 40 единиц IQ). Однако,
основываясь только на том, что значение IQ у Саши в два
раза меньше, чем у Бориса, исходя из определения IQ, нель-
зя сделать вывод, что Борис вдвое умнее Саши.
Арифметические операции, допустимые в данной шкале,
включают все операции, допустимые и в ранговой шкале;
кроме того, результаты измерений можно складывать, вы-
читать, делить и умножать на любую константу, получая
интерпретируемые результаты. Сравнение интервалов для
этой шкалы имеет определенный смысл и не зависит от
масштаба или системы обозначения оценок. Полноценным
статистическим показателем для характеристики таких пе-
ременных является среднее значение.
Шкала, которая имеет абсолютную нулевую точку, назы-
вается шкалой отношений. В ней измеряется большинство
интервальных переменных, например, температура по шка-
ле Кельвина, масса тела, возраст и т.д. Например, взрослый
человек, имеющий массу тела, равную 60 кг, в 2 раза тяже-
лее ребенка с массой тела, равной 30 кг. Здесь допустимы
все арифметические операции, отношение любых двух из-
мерений имеет смысл и не зависит от масштаба.
14
Нужно отметить, что на практике различие между пере-
менными, относящимися к интервальной шкале и шкале от-
ношений, обычно несущественно.
По роли в статистической совокупности учетные при-
знаки можно подразделить на факторные, или независимые
(independent) и результативные, или зависимые (dependent).
Результативный признак - зависимый, изменяющий свое
значение под влиянием связанных с ним и действующих на
него факторных признаков.
Факторные признаки, соответственно, - это признаки,
влияющие на изучаемое явление. Например, наличие вред-
ных привычек и стаж курения - факторные признаки, а со-
стояние здоровья, наличие заболевания - результативные
признаки. Подобное разделение на факторные и результа-
тивные признаки зависит от цели исследования и постанов-
ки задач, а не является атрибутом признака. Например, в
исследовании, направленном на изучение эффективности
различных методов пропаганды здорового образа жизни на
распространенность вредных привычек, последние станут
зависимыми признаками.
На первом этапе исследования определяется также объем
статистической совокупности, метод отбора единиц наблю-
дения и вид наблюдения.
В зависимости от степени охвата статистической сово-
купности принято различать сплошные и несплошные ста-
тистические исследования. Эта методическая особенность
сбора данных определяет весь дальнейший ход и методику
статистического анализа.
Сплошным называется такое медико-социальное иссле-
дование, при котором изучаются все единицы наблюдения,
составляющие генеральную совокупность. На практике
сплошное исследование проводится крайне редко, посколь-
ку осуществить такое наблюдение организационно очень
трудно или физически невозможно из-за больших размеров
генеральной совокупности или из-за отсутствия определен-

15
ных границ этой совокупности. К тому же, сплошные ис-
следования во много раз дороже несплошных.
При несплошном исследовании изучается лишь часть со-
вокупности для характеристики целого. Несплошное на-
блюдение бывает нескольких видов:
• монографическое описание;
• метод основного массива;
• выборочное исследование.
Метод монографического описания применяется для
подробного изучения одного объекта (одного человека, од-
ного учреждения, одного населенного пункта, новой техно-
логии), имеющего какие-либо яркие особенности. Выводы,
которые получаются путем таких исследований, относятся
либо только к конкретному объекту исследования, либо мо-
гут быть распространены на весьма ограниченную группу
аналогичных объектов. Указанный метод наблюдения на-
шел довольно широкое применение при изучении опыта
лучших (худших) лечебно-профилактических учреждений.
Метод основного массива - метод статистического ис-
следования, при котором изучению подвергают только те
части совокупности, в которых сосредоточено большинство
единиц наблюдения. Например, при изучении здоровья де-
тей, родители которых работают на предприятиях химиче-
ской промышленности, в целях анализа можно использо-
вать только крупные предприятия, исключив мелкие объек-
ты. Обычно эти методы используются на ранних этапах ис-
следования, когда только генерируются гипотезы и прово-
дится их начальная проверка. В результате исследователь
устанавливает основные закономерности, выявляет воз-
можные механизмы действия и т.д.
Собственно выборочное исследование охватывает выбо-
рочную совокупность, или просто выборку, из генеральной
совокупности. При этом конечной целью изучения выбо-
рочной совокупности всегда является получение информа-
ции о генеральной совокупности. Для этого выборочное ис-
следование должно удовлетворять определенным условиям.
16
Одно из главных условий - представительность, или репре-
зентативность выборки. Выборку называют репрезента-
тивной, если каждое свойство (или комбинация свойств)
наблюдается в выборке с той же частотой, что и в популя-
ции, из которой она извлечена.
Различают качественную и количественную репрезен-
тативность.
Количественная репрезентативность определяется дос-
таточным числом элементов выборочной совокупности, га-
рантирующим получение статистически достоверных дан-
ных и основана на законе больших чисел.
Закон больших чисел в наиболее простой форме гласит,
что количественные закономерности массовых явлений от-
четливо проявляются лишь в достаточно большом их числе.
Теорема Чебышева гласит: “С вероятностью, сколь угодно
близкой к единице, можно утверждать, что при достаточно
большом числе независимых наблюдений, средняя величи-
на изучаемого признака, полученная на основе выборки,
будет сколь угодно мало отличаться от средней величины
изучаемого признака во всей генеральной совокупности”.
T.e. сущность закона больших чисел заключается в том, что
в числах, получающихся в результате массового наблюде-
ния, выступают определенные закономерности, которые
могут быть обнаружены только при достаточном числе на-
блюдений. Достаточное число элементов выборочной сово-
купности рассчитывается по специальным формулам.
Качественная репрезентативность основана на законе
вероятности и определяется структурным соответствием
выборочной и генеральной совокупностей.
Качественная репрезентативность выборки лучше всего
достигается посредством случайного отбора ее единиц из
популяции. Случайная выборка (random sample) извлекает
из популяции как типичные, так и нетипичные случаи. В
совокупности они дают самое правильное представление об
изучаемой генеральной совокупности. Важно также то, что
при случайном отборе людей они отличаются от других в
17
генеральной совокупности по всем, в том числе и неизвест-
ным нам признакам, случайным образом. Процесс случай-
ного отбора осуществляется посредством рандомизации.
Проведение рандомизации не затруднительно, и для это-
го в настоящее время достаточно средств: могут использо-
ваться таблицы случайных чисел, различные компьютерные
программы. К обсуждению средств проведения рандомиза-
ции мы еще вернемся в разделе «Дизайны медицинских ис-
следовний».
При расслоенной, или стратифицированной случайной
выборке (stratified random sample), изучаемая неоднородная
генеральная совокупность сначала делится по какому-либо
существенному признаку на относительно однородные
группы (strata), после чего из каждой группы производится
случайный отбор единиц. Предварительная стратификация
обеспечивает большую репрезентативность выборки. Осо-
бенно рекомендуется проводить стратификацию при не-
большом объеме выборки, т.к. в этом случае шансы полу-
чить репрезентативную группу простой рандомизацией не-
достаточны. Например, вместо отбора выборки в 100 чело-
век из всего населения, состоящего из 5000 белых и 5000
негров, можно отобрать две случайные выборки в 50 чело-
век из каждой этнической группы. Это обеспечит большую
этническую представительность общей выборки в 100 чело-
век.
В некоторых случаях, когда проведение случайного от-
бора или стратифицированного случайного отбора требует
больших затрат денег и времени, проводится кластерный
отбор (cluster sampling). Например, если необходимо про-
вести опрос среди 1000 школьников в городе N, исследова-
тель может сначала посредством случайного отбора ото-
брать 10 школ (кластеров) в городе, а затем опросить в каж-
дой из них по 100 школьников. Этот метод является значи-
тельно более экономичным и практичным, по сравнению со
случайным отбором 1000 школьников из всей совокупности
школьников города N.
18
Эквивалентом случайного отбора без использования ран-
домизации является систематический, или механический
отбор (systematic sampling). Систематическая выборка
формируется с помощью механического подхода к отбору
единиц наблюдения: из всей совокупности для изучения бе-
рется механически отобранная каждая третья, пятая, десятая
единица наблюдения. Например, можно отобрать каждого
пятого пациента, поступающего в больницу, или каждого
третьего ребенка, родившегося в данном районе.
О выборке, которая не является репрезентативной, гово-
рят, что она имеет смещение. Когда заключения относи-
тельно популяции делаются на основе наблюдений в сме-
щенной выборке, возможны отклонения результатов от ис-
тинных значений, называемые систематической ошибкой. О
систематической ошибке мы уже говорили выше. Она мо-
жет привести к недооценке реального эффекта, его пере-
оценке, выявлению несуществующих взаимосвязей, демон-
страции положительных взаимосвязей между факторами
вместо отрицательных и наоборот. Источниками система-
тических ошибок являются несовершенство используемых
методов, несоответствие выбранного типа исследования по-
ставленным задачам, неадекватный отбор пациентов для
участия в исследовании и влияние третьих переменных (не
изучаемых непосредственно).
Классическим примером нерепрезентативной выборки
служит опрос общественного мнения, проведенный до пре-
зидентских выборов в США в 1936 году журналом “Litera-
ture Digest”. По результатам опроса выборки из более чем
10 млн. человек, была предсказана полная победа Альфреда
Лендона над Франклином Рузвельтом, однако результаты
состоявшихся выборов были совершенно противополож-
ными. Проблема состояла в том, что выборка была сформи-
рована из числа подписчиков, фамилии которых были
включены в телефонные справочники. Между тем, владель-
цы телефонов в период Великой депрессии в США пред-
ставляли лишь небольшую часть всего электората.
19
Первый этап статистического исследования предусмат-
ривает определение методов сбора статистичекой информа-
ции, а также разработку и тиражирование статистического
инструментария (карт, анкет, компьютерных программ
формирования и обработки информационных баз данных и
др.), куда в период сбора данных будет заноситься вся ин-
формация.
Наконец, программа исследования включает программу
анализа, которая предусматривает перечень статистических
методик, необходимых для выявления закономерностей
изучаемого явления.
Разработка рабочего плана исследования - следующий
важнейший этап подготовки исследования. План исследо-
вания предусматривает решение таких организационных
вопросов, как подбор, обучение и организация работы непо-
средственных исполнителей, определение необходимого
объема и и видов ресурсов, необходимых для проведения
исследования (кадры, финансы, материально-технические,
информационные ресурсы и др.), определение места и сро-
ков проведения исследования, ответственных за отдельные
этапы исследования.

ВТОРОЙ ЭТАП ИССЛЕДОВАНИЯ

Второй этап статистического исследования - это этап


сбора необходимых данных, предусмотренных программой
исследования, и формирование баз данных. Определение
методов сбора необходимых данных, как уже было сказано,
определяется на первом этапе исследования.
Различают два вида данных – первичные и вторичные.
Первичные данные – это данные, полученные непосредст-
венно исследователем, вторичные – получены кем-то дру-
гим, но используемые данным исследователем. Хотя это
разделение несколько условно – первичные данные одного
исследователя становятся вторичными для другого, качест-
венная разница весьма существенна.
20
При проведении медико-социальных исследований ста-
тистический инструментарий, как правило, включает два
раздела:
1. Характеристику состояния здоровья изучаемой груп-
пы.
2. Характеристику условий и образа жизни изучаемой
группы.
Основными источниками информации о состоянии здо-
ровья изучаемой группы являются:
• статистическая отчетность (на бумажных и электрон-
ных носителях организаций и органов управления здраво-
охранением), полученная как на основе официально ут-
вержденных, так и временных учетных форм;
• первичная медицинская документация;
• медицинские (скрининговые) осмотры населения;
• электронные персонифицированные базы данных.
Для получения информации об условиях и образе жизни
применяются социологические методики. Основные сведе-
ния об условиях и образе жизни могут быть получены по-
средством анкетирования (заочный опрос), интервьюирова-
ния (очный опрос), комбинации этих методов (анкета-
интервью), прямого наблюдения, экспедиционно-моногра-
фического метода (с параллельным изучением местных
особенностей типичного объекта).
Наиболее часто в медико-социальных исследованиях ис-
пользуются методы анкетирования, интервью и их комби-
нация.
Анкеты и вопросники составляются еще на первом этапе
исследования. Их разработка является весьма ответствен-
ным делом. Анкета должна быть достаточно полной, но не
перегруженной. Оптимально, если она содержит 40-50 во-
просов. Слишком длинная анкета часто вызывает негатив-
ную реакцию респондентов, отказ от участия в анкетирова-
нии, или, что еще хуже, поспешное, неаккуратное заполне-
ние анкеты. Если тема исследования не позволяет ограни-
читься таким объемом, то анкета должна быть разбита на
21
логически связанные подразделы. Вопросы должны быть
ясно и четко оформлены, быть простыми и понятными, не-
двусмысленными, но в то же время не должны подсказы-
вать респонденту желаемый или ожидаемый ответ. Пред-
почтительны вопросы на которые отвечают «Да / Нет».
По своей структуре вопросы бывают закрытыми, откры-
тыми и полуоткрытыми. Закрытые вопросы предполагают
ограниченный выбор ответов из предлагаемого набора, по-
луоткрытые - дают возможность добавить собственный ва-
риант ответа, а открытые дают полную свободу ответа. Ан-
кета, содержащая преимущественно закрытые вопросы, на-
зывается структурированной (structured); если она содер-
жит значительное количество открытых или полуоткрытых
вопросов, то называется полуструктурированной (semi
structured). Открытые вопросы дают большую свободу рес-
понденту, однако большое разнообразие ответов затрудняет
их дальнейшую группировку и обработку. Закрытые вопро-
сы ставят респондента зачастую в затруднительное положе-
ние, он не может найти среди предложенных ответов под-
ходящий. С другой стороны, наличие закрытых вопросов
значительно упрощает их формализацию и дальнейшую об-
работку. Во всех случаях респонденту надо оставлять сво-
боду выбора и уклонения от ответа, предоставляя возмож-
ность ответить “не знаю”, “затрудняюсь ответить”.
Крайне желательна предварительная проверка работо-
способности анкеты в небольшом пилотном исследовании.
Такая “обкатка” позволяет выявить лишние или пропущен-
ные вопросы, неудачные, не воспринимаемые респондента-
ми вопросы и т.д. Если, например, на какой-либо вопрос
более 30% респондентов дают ответ “затрудняюсь отве-
тить”, то он неудачно сформулирован или не воспринимает-
ся аудиторией и должен быть заменен или исключен. В лю-
бом случае ответы на такие вопросы считаются недостовер-
ными и не подлежат дальнейшей обработке.
Анкета обязательно должна содержать вводную часть, в
которой объясняется важность исследования, ценность от-
22
ветов, заверяется конфиденциальность сообщаемой инфор-
мации, отсутствие последствий для респондента и выража-
ется благодарность за сотрудничество.
Собранные данные в дальнейшем группируются, струк-
турируются и переносятся на электронные носители. Такой
массив данных, хранимый на электронных носителях, назы-
вается базой данных. В настоящее время ввод данных в базу
данных осуществляется не только с бумажных носителей
(анкет, карт и т.д.), возможен и непосредственный ввод
данных через так называемые электронные карты.

ТРЕТИЙ ЭТАП ИССЛЕДОВАНИЯ

Третий этап - этап обработки собранного материала и


статистическое описание (descriptive statistics) полученных
результатов. Обработка данных - процесс получения досто-
верной информации из баз данных и использование ее для
дальнейшего анализа. Статистическое описание включает в
себя группировку, резюмирование данных выборочной со-
вокупности с получением ее обобщенных характеристик, и
их представление в виде таблиц или графиков.
Примерами статистического описания могут служить,
например, определение среднего артериального давления у
группы пациентов, страдающих артериальной гипертензи-
ей; вычисление показателя послеоперационных осложнений
у группы пациентов, оперированных по поводу данного за-
болевания и т.д.
В настоящее время в исследованиях, связанных с изуче-
нием здоровья населения, широко используются различные
математико-статистические методы обработки данных с
применением компьютеров.
Компьютерная обработка данных предполагает некото-
рое математическое преобразование данных с помощью оп-
ределенных программных средств. Для этого необходимо
иметь представление как о математических методах обра-

23
ботки данных, так и о соответствующих программных сред-
ствах.
Имеющиеся в настоящее время многочисленные пакеты
компьютерных программ содержат не только практически
все необходимые методы статистической обработки, но
также и методы статистического анализа данных. Компью-
терная обработка данных не только ускоряет, но и много-
кратно повышает качество статистического анализа.
Методы статистического описания полученных ре-
зультатов будут подробно освещены в разделе «Описатель-
ная статистика».

ЧЕТВЕРТЫЙ ЭТАП ИССЛЕДОВАНИЯ

Четвертый этап - этап статистических выводов (statistical


inference) и предложений на основе анализа полученных ре-
зультатов исследования.
Необходимость проведения статистического анализа
обусловлена тем, что, как уже было сказано, на практике
чаще всего проводятся не сплошные, а выборочные иссле-
дования. При этом, конечной целью изучения выборочной
совокупности всегда является получение информации и вы-
явление закономерностей, которые были бы справедливы
для всей популяции в целом. Результаты статистического
анализа позволяют на основе результатов, полученных из
выборочного исследования, сделать с определенной вероят-
ностью выводы обо всей популяции в целом.
Статистические характеристики, полученные в результа-
те выборочного исследования, называются статистиче-
скими данными, на их основе делаются выводы о статисти-
ческих характеристиках всей популяции, которые называ-
ются параметрами.
Существуют различные статистические методы анализа.
Выбор метода анализа в каждом конкретном исследовании
зависит от цели и задач исследования, от числа изучаемых

24
выборочных совокупностей, от типа переменных, изучае-
мых в данном исследовании.
При анализе прежде всего проводятся различного харак-
тера сопоставления. Сравнивается эффективность различ-
ных медицинских препаратов, диагностических тестов; по-
лученные в результате исследования данные сопоставляют-
ся с данными предыдущих лет, с данными других авторов,
других регионов, с имеющимися нормативами.
Обширная группа методов статистического анализа
предназначена для исследования парных и множественных
связей между переменными (корреляционный анализ, рег-
рессионный анализ и др.)
Как уже было сказано, в настоящее время для проведения
статистического анализа используются различные компью-
терные статистические пакеты. Некоторые из наиболее ши-
роко используемых методов статистического анализа будут
освещены в соответствующих разделах данного учебного
пособия.

ДИЗАЙН МЕДИЦИНСКИХ ИССЛЕДОВАНИЙ

Дизайн исследования - это общая схема проведения ис-


следования. Выбор вида дизайна зависит от задач конкрет-
ного исследования. С каждым типом исследования связаны
определенные проблемы, которые могут исказить результа-
ты и привести к ложным выводам. Поэтому правильный
выбор дизайна определяет успех всего исследования.
Основные вопросы, определяющие вид дизайна исследо-
вания:
1. С какой целью проводится исследование?
2. Имеет ли проблема научное или клиническое значе-
ние?
3. Каков наиболее подходящий план исследования для
достижения поставленной цели?
Существует несколько классификаций дизайна исследо-
ваний. В данном пособии приводится одна из них, согласно
25
которой исследования подразделяются на обсервационные
(observational) и экспериментальные (experimental). Основ-
ная разница между ними заключается в том, что в противо-
положность обсервационным, экспериментальные исследо-
вания всегда включают какое-либо преднамеренное вмеша-
тельство со стороны исследователя, например, использова-
ние нового лекарственного препарата, новой схемы лече-
ния, нового диагностического метода и т.д. Чаще всего ос-
новной целью экспериментальных исследований является
доказательство большей эффективности новых препаратов,
новых схем лечения или большей информативности новых
диагностических методов. В отличие от экспериментальных
исследований, в обсервационных исследованиях исследова-
тели лишь наблюдают и учитывают для последущего анали-
за воздействие на объект исследования различных факторов
риска, которые действуют независимо от воли исследовате-
лей. Главное преимущество обсервационного исследования
– относительная простота проведения. Объектами исследо-
вания в экспериментальных и обсервационных исследова-
ниях могут служить животные или люди.

Таблица 1. Классификация дизайна исследований

I. Обсервационные исследования:
A. Описание случая.
Б. Описание серии случаев.
В. Исследования по типу случай-контроль.
Г. Поперечные исследования.
Д. Когортные исследования.
II. Экспериментальные исследования:
А. Экспериментальные исследования с наличием контроль-
ных групп-
1. Параллельные клинические испытания
(с одновременным наблюдением экспериментальной и кон-
трольной групп)
а. Рандомизированные исследования.
26
б. Нерандомизированные исследования.
2. Исследования с последующим наблюдением контрольной
группы-
а. Исследования по типу до-после.
б. Перекрестные исследования.
3. Исследования с использованием внешних контрольных
групп (с историческим контролем)
Б. Экспериментальные исследования без наличия кон-
трольных групп.

ОБСЕРВАЦИОННЫЕ ИССЛЕДОВАНИЯ

Как уже было сказано, обсервационное исследование


(observational study) в противоположность эксперименталь-
ному исследованию — это исследование без преднамерен-
ного вмешательства. Различают пять типов обсервационных
исследований: описание случая, описание серии случаев,
качественные исследования, поперечные исследования, ис-
следования по типу случай-контроль и когортные исследо-
вания. Из них описание случаев и серий случаев являются
описательными, а остальные три – аналитическими.
Описание случая (case report, case study) – наиболее ста-
рый способ медицинского исследования, представляет со-
бой подробное изложение данных, полученных путем на-
блюдения одного больного. Такие исследования обеспечи-
вают описание необычных проявлений болезни, помогают
изучать патогенез и выдвигать гипотезы об этиологии и
способах лечения.
Описание серии случаев (case series) — обсервационное
исследование, представляющее собой количественный ана-
лиз группы больных численностью 10 человек и более, т.е.
результатом исследований серии случаев является описание
определенной характеристики группы пациентов (или слу-
чаев) в опубликованном труде. Обычно данные исследова-
ния включают пациентов, наблюдаемых в течение сравни-
тельно короткого промежутка времени.
27
Серия случаев – самый распространенный способ описа-
ния клинической картины заболевания. Такие исследования
могут давать важные результаты, но это только предвари-
тельные, а не окончательные наблюдения. Основным недос-
татком этих исследований является отсутствие групп срав-
нения, а также то, что случаи изучаются в разные моменты
времени и на разных стадиях течения заболевания.
Некоторые исследователи не включают описание случая
и описание серии случаев в классификацию дизайнов ис-
следований, так как они, как было уже сказано, имеют лишь
описательный характер, не являются запланированными и
проводятся без предварительного построения научной ги-
потезы. Построение научных гипотез часто является резуль-
татом этих исследований и поэтому они часто предшеству-
ют другим исследованиям (когортным, поперечным, иссле-
дованиям случай-контроль), в которых построенные гипоте-
зы и проверяются.
Качественные исследования позволяют скорее понять
или объяснить процесс заболевания, чем оценить его коли-
чественно. Они очень полезны, когда интересующие пере-
менные непонятны или трудноизмеримы. Основными мето-
дами сбора информации при этих исследованиях могут
служить - прямое наблюдение, интервью, анализ текста или
документа.
Исследования по типу случай-контроль. Представьте
себе, что, работая клиницистом, вы наблюдали группу
больных с определенным видом злокачественной опухоли,
причем почти все больные указывали на подверженность
воздействию определенного химического вещества. Вы
предположили, что развитие указанного вида опухоли свя-
зано с воздействием данного химического вещества. Как вы
можете доказать или опровергнуть выдвинутое предполо-
жение?
Рассмотрим реальный пример.
В 40-х годах XX века австралийский офтальмолог
Норман Грег наблюдал группу младенцев и детей младшего
28
возраста с необычной формой катаракты. Грег выяснил, что
в период эпидемии краснухи в Германии эти дети находи-
лись в утробе матери. Он предположил наличие связи меж-
ду подверженностью плода воздействию инфекции в прена-
тальный период и развитием необычной формы катаракты.
В те времена ничего не было известно о тератогенном воз-
действии вируса краснухи. Следовательно, он предложил
свою гипотезу только на основе данных собственных на-
блюдений.
Предположим, что Грег установил, что 90% наблюдае-
мых им новорожденных в период эпидемии краснухи нахо-
дились в утробе матери. Могло ли это послужить веским
доказательством того, что развитие катаракты связано с
краснухой? Разумеется, ответ должен быть отрицательным,
так как хотя подобное наблюдение и могло представлять
определенный интерес, однако, его было бы очень трудно
правильно интерпретировать без данных контрольной груп-
пы детей без указанного заболевания. Возможно, например,
что 90% всех матерей новорожденных без катаракты также
были беременны в период эпидемии краснухи. В таком слу-
чае история подверженности воздействию изучаемого фак-
тора не отличалась бы у матерей здоровых новорожденных
и новорожденных с катарактой. Таким образом, вопрос был
в том, чтобы определить была ли распространенность воз-
действия вируса краснухи больше среди новорожденных с
катарактой по сравнению с группой детей без катаракты.
Для определения значимости такого наблюдения в груп-
пе случаев необходимо было сравнение ее с контрольной
группой. Без подобного сравнения наблюдения Грега могли
быть интригующими, но не научно обоснованными. Срав-
нение является существенным компонентом эпидемиологи-
ческих исследований и хорошо иллюстрируется на примере
исследования “случай-контроль”.

29
Дизайн исследования “случай-контроль”
Исследование “случай—контроль” (case control study) —
ретроспективное исследование, в котором, по архивным
данным, воспоминаниям или суждениям пациентов, произ-
водится сравнение двух групп, в одну из которых отобраны
пациенты с определенной патологией («случай»), а в дру-
гую — лица без нее («контроль»). Причем обе группы бы-
вают отобраны из одной и той же популяции.
Цель исследования “случай-контроль”- выявление связи
между исходом (развитием заболевания) и воздействием
определенных риск-факторов, т.е. изучение этиологии забо-
левания.
Дизайн исследования показан на рисунке 1.

Рисунок 1. Дизайн исследования по типу “случай-


контроль”

Лица, подвергав- Лица, не подвер- Лица, подвергав- Лица, не подвер-


шиеся воздейст- гавшиеся воздей- шиеся воздейст- гавшиеся воздей-
вию данного ствию данного вию данного фак- ствию данного
фактора актора фактора тора фактора

Лица, страдающие данным Лица, не страдающие данным


заболеванием заболеванием

Группа случаев Контрольная группа

В таблице №2 представлена гипотетическая схема прове-


дения исследования “случай – контроль”. Начинают с отбо-
ра группы пациентов с данным заболеванием и без заболе-
вания. Затем посредством интервьюирования и изучения
историй заболевания или результатов биологических анали-
зов крови, мочи или ткани определяется подверженность
изучаемых лиц воздействию данного фактора. Если воздей-
30
ствие изучаемого фактора- признак бинарный, т.е. воздей-
ствие фактора имело или не имело место, то возможна раз-
бивка на четыре группы: пациенты из группы случаев под-
разделяются на: a- подверженных и c- не подверженных
воздействию фактора риска. Подобным же образом лица из
контрольной группы также подразделяются на: b- подвер-
женных и c – не подверженных воздействию фактора. Та-
ким образом, общее число случаев составит a+c, а общее
число лиц в контрольной группе – b+d. Если имеется связь
между воздействием изучаемого фактора и развитием дан-
ного заболевания, то следует ожидать большую долю лиц,
подверженных воздействию фактора в группе случаев
(a/a+c), по сравнению с их долей в контрольной группе (b/
b+d).

Таблица 2. Дизайн исследования “случай- контроль”

Отбор групп
Группа Контроль-
случаев ная группа
Определение Были подвержены воз-
подвержен- действию фактора a b
ности воздей- Не были подвержены
ствию изу- воздействию фактора
чаемого фак- c d
тора
Всего a+c b+d
Доля лиц, подвержен-
ных воздействию фак- a/ a+c b/ b+d
тора

Данные, полученные в результате исследования по типу


“случай-контроль”, позволяют рассчитать отношение шан-
сов (odds ratio) наступления события в группе случаев к
шансам наступления события в контрольной группе. Шанс
– это отношение числа людей в группе, у которых данное
событие наступило, к числу людей, у которых данное собы-
31
тие не наступило. Так, если в группе из 100 человек частота
события (event rate) равна 0,20, это значит, что у 20 человек
событие наступило, а у 80 не наступило, и шанс будет со-
ставлять 20/80 или 0,25. Отношение шансов, равное едини-
це, указывает на отсутствие различий между сравниваемы-
ми группами. Если отношение шансов выше единицы, это
означает, что риск развития заболевания в группе экспони-
рованных выше по сравнению с группой некспонирован-
ных.
Гипотетический пример проведения исследования “слу-
чай-контроль” приведен и в таблице №3. Было проведено
исследование по выявлению связи между курением и разви-
тием коронарной болезни. Исследователи начали исследо-
вание со сравнения 200 пациентов с коронарной болезнью
(группа случаев) с 400 лицами без данной патологии (кон-
трольная группа). В случае наличия связи между курением
и развитием коронарной болезни, мы должны были бы
предвидеть большую долю курящих среди лиц с коронар-
ной болезнью по сравнению с их долей в контрольной
группе. В ходе исследования было установлено, что из 200
пациентов с коронарной болезнью 112 - курили, и 88 - не
курили. Из 400 лиц в контрольной группе 176 - курили, и
224 - не курили. Таким образом, доля курящих в группе
случаев и в контрольной группе составляла соответственно
56% и 44%. Отношение шансов в этом случае составит:

Это означает, что у курящих риск разви-


112 / 176
тия коронарной болезни, по сравнению с = 1.6
88 / 224
некурящими, выше в 1.6 раза.

32
Таблица 3. Гипотетический пример исследования “слу-
чай-контроль” по изучению связи между курением и
развитием коронарной болезни.

Больные с Лица без ко-


коронарной ронарной бо-
болезнью лезни
Число курящих 112 176
Число не курящих 88 224
Всего 200 400
% курящих 56,0 44,0

Следует отметить, что используя данные исследования


“случай-контроль” мы не можем оценить истинную распро-
страненность изучаемого заболевания среди населения, из
которого были отобраны две сравниваемые группы. В рас-
смотренном выше примере в исследование были включены
200 больных с коронарной болезнью и 400 человек без ука-
занной патологии, но это не означает, что распространен-
ность коронарной болезни составляет 33%, или 200/
200+400. Решение включить в исследование то или иное
число лиц в контрольную группу и группу случаев прини-
мается исследователем и является произвольным решением.
В рассмотренном примере, например, исследователь мог
включить в исследование 200 больных и 200 здоровых или
200 больных и 800 здоровых.
В заключение следует отметить, что отличительной чер-
той исследования “случай-контроль” является то, что дан-
ное исследование начинается с формирования группы лиц с
определенным заболеванием (группа случаев) и без него
(контрольная группа) и дальнейшего их сравнения. В про-
тивоположность исследованию случай-контроль, когортное
исследование, например, начинается с формирования и
сравнения групп людей подверженных и не подверженных
воздействию изучаемого фактора. В некоторых случаях
приходится сталкиваться с ошибочным представлением о
33
том, что основное различие между когортным исследовани-
ем и исследованием случай-контроль заключается в том,
что когортное исследование является проспективным, а ис-
следование “случай-контроль”- ретроспективным. Как из-
вестно, в ретроспективном когортном исследовании иссле-
дователями также используются данные, зарегистрирован-
ные в прошлом. Таким образом, календарное время не явля-
ется характеристикой, отличающей когортное исследование
и исследование “случай-контроль”. Единственное, что, в
действительности, отличает эти два дизайна, это их методо-
логия, а именно - начато ли было исследование с формиро-
вания групп больных и здоровых (исследование случай-
контроль) или подверженных и не подверженных воздейст-
вию изучаемого фактора (когортное исследование).
К основным преимуществам исследований “случай-
контроль” относятся следующие: 1.Исследования по типу
случай-контроль могут быть использованы для изучения
этиологии и клинического течения заболеваний. 2.Такие ис-
следования позволяют выявлять случаи и делать сравнения
независимо от распространенности заболевания, и, следова-
тельно, они позволяют изучать редкие заболевания, заболе-
вания с длительным латентным периодом между экспози-
цией и манифестацией. 3. Это недорогие исследования по
сравнению с когортными исследованиями. 4. Они могут
быть начаты и проведены за сравнительно короткий отрезок
времени, так как группу случаев можно набирать в специа-
лизированных клиниках или из регистров заболеваний, а не
искать или ожидать появления случаев в определенной по-
пуляции риска.
И наконец, следует отметить, что 5. исследования «слу-
чай-контроль» позволяют изучить множественные потенци-
альные причинные агенты заболеваний (экспозиции).
К числу недостатков исследований «случай-контроль»
относят подверженность систематическим ошибкам, так как
информация об экспозиции и анамнезе бывает основана
прежде всего на данных опроса и может быть подвержена
34
предвзятости отбора. Подтверждение информации относи-
тельно экспозиции очень часто затруднительно, неполно
или даже невозможно. В исследованиях “случай-контроль”
важной проблемой является проблема репрезентативности
выборки случаев, так как выборка обычно формируется
только из числа больных, находящихся на стационарном
лечении. Кроме того, этот дизайн исследования не подходит
для изучения редко встречающихся экспозиций.

Поперечные исследования
(исследовани распространенности)

Поперечные исследования (cross—sectional study, preva-


lence study, survey), в противоположность продольным, или
лонгитудинальным исследованиям, — это обсервационные
исследования, которые рассматривают связь между заболе-
ваниями (или иными характеристиками состояния здоровья)
и другими изучаемыми переменными в определенной попу-
ляции в данное конкретное время (и болезнь, и факторы, ее
вызывающие, оцениваются одновременно). Т.е. в попереч-
ных исследованиях обследование каждого пациента выпол-
няется однократно. В результате можно описать картину
болезни у одного пациента или у группы, уточнить симпто-
матику, связать отдельные симптомы с основным диагнозом
и тяжестью болезни, т.е. решить множество важных вопро-
сов. Эти исследования применяются очень широко. Чаще
всего целью одномоментного исследования является изуче-
ние ситуации относительно какого-либо заболевания среди
населения на определенный момент. Это исследование по-
зволяет определить распространенность заболевания и фак-
торов, способствующих и препятствующих его возникнове-
нию, поэтому поперечные исследования называют иногда
исследованиями распространенности. Под распространен-
ностью (prevalence) понимается отношение числа лиц с
признаками заболевания (согласно выработанным критери-
ям) к числу обследованных лиц.
35
Источником информации в исследованиях данного типа
являются как опросы, так и медицинские обследования на-
селения.
Очень часто данные по распространенности заболеваний
используются для этиологических выводов, поэтому пони-
мание ограничений поперечного исследования является
чрезвычайно важным.

Дизайн поперечного исследования

Дизайн исследования представлен на рисунке 2. Сначала


определяется популяция или выборочная совокупность, ко-
торая должна быть обследована. Затем посредством сбора
данных определяется наличие воздействия изучаемого фак-
тора и наличие данного заболевания у каждого из участни-
ков исследования. Таким образом, каждый из них может
быть отнесен в одну из четырех возможных групп.

Рисунок 2. Дизайн поперечного исследования (I)


Определение популяции или
выборочной совокупности

Сбор сведений о наличии воздействия изучаемого


фактора и наличии заболевания

Наличие воздей- Наличие воздейст- Отсутствие воз- Отсутствие воз-


ствия фактора, вия фактора, от- действия факто- действия факто-
наличие заболе- сутст-вие заболе- ра, наличие забо- ра, отсутст-вие
вания вания левания заболевания

Полученные данные могут быть представлены и в виде


рисунков 3 и 4, которые также показывают два подхода к
интерпретации результатов поперечного исследования.

36
Для каждого из обследованных в выборочной совокупно-
сти численностью в n человек определяется наличие воз-
действия фактора и наличие заболевания. Как видно из ри-
сунков 3 и 4, у a человек было выявлено и наличие воздей-
ствия фактора, и наличие заболевания; у b человек - выяв-
лено наличие воздействия фактора, но отсутствие заболева-
ния; у с человек - было выявлено отсутствие воздействия
фактора, но наличие заболевания; у d человек - выявлено и
отсутствие воздействия фактора, и отсутствие заболевания.
Для определения наличия связи между воздействием изу-
чаемого фактора и развитием данного заболевания имеются
две возможности: можно определить распространенность
заболевания у лиц с воздействием фактора риска (a/ a+b) и
сравнить ее с уровнем распространенности заболевания
среди лиц, не подверженных воздействию фактора риска
(c/c+d); можно также сравнить распространенность воздей-
ствия фактора риска среди лиц с данным заболеванием (a/
a+c) и лиц без заболевания (b/ b+d).

Рисунок 3. Дизайн поперечного исследования (II)

Наличие Отсутствие Распространенность за-


заболе- заболе- болевания среди лиц
вания вания экспозиционной и неэкс-
позиционной групп
Наличие
фактора a b a/(a+b)
риска
Отсутствие
фактора c d c/(c+d)
риска

37
Рисунок 4. Дизайн поперечного исследования (III)

Наличие Отсутствие
заболевания заболевания
Наличие фактора риска a b
Отсутствие фактора риска c d
Частота встречаемости фактора
риска у лиц, имеющих и не имею- a/(a+c) b/(b+d)
щих данное заболевание

Распространенность заболевания среди лиц, подвержен-


ных и не подверженных воздействию фактора риска соста-
вит соответственно: a/ a+b против c/c+d. Распространен-
ность воздействия фактора риска среди больных данным
заболеванием и здоровых: a/ a+c против b/ b+d.
Как уже было сказано, поперечные исследования прово-
дятся довольно-таки часто в связи с наличием у них ряда
преимуществ. Эти исследования, по сравнению с другими
аналитическими обсервационными исследованиями, просты
и недороги, так как требуют относительно мало времени
для проведения. Они позволяют определить уровень рас-
пространенности заболеваний или изучаемых факторов
риска среди населения. Кроме того, эти исследования часто
являются первым шагом в направлении поиска факторов
риска и формулировки гипотез.
В то же время поперечные исследования имеют и ряд
существенных недостатков:
1. Поперечное исследование не всегда позволяет обнару-
жить связь между причиной и следствием во времени, по-
этому эти исследования не дают правильного представления
о причинах заболеваний. Например, если в поперечном ис-
следовании у 30% больных инсультом выявлена депрессия,
это еще не значит, что у 30% больных инсультом без де-
прессии она наступит в будущем. Это может означать, что
депрессия предрасполагает к развитию инсульта или же ин-

38
сульт способствует депрессии, либо что больные инсультом
без депрессии выздоравливают быстрее.
2. При поперечном исследовании в поле зрения исследова-
телей попадают лишь больные, выявленные в момент об-
следования, не учитываются лица, умершие от изучаемого
заболевания, выздоровевшие и больные, выбывшие по дру-
гим причинам. Это ведет к недооценке частоты случаев за-
болевания. Таким образом, показатель распространенности
не отражает в полной мере реальной частоты развития бо-
лезни.
3. Одномоментные исследования обычно охватывают
большой контингент населения, и чем меньше распростра-
ненность заболевания, тем этот контингент должен быть
больше, чтобы выявить достаточное число случаев заболе-
вания.
4. В поперечном исследовании нельзя проверить прогно-
стическую значимость диагностического метода, исполь-
зуемого в популяционном исследовании.
5. При сопоставлении характеристик больных и здоровых
лиц в ходе поперечного исследования встречаются опреде-
ленные трудности. Некоторые характеристики, выявляемые
при поперечном исследовании у лиц с заболеванием, могут
не совпадать с характеристиками, которые имелись в на-
чальной стадии развития заболевания. Например, изучение
особенностей питания у лиц среднего возраста, страдающих
ИБС, имеет ограниченное значение, так как атеросклероз
начинает развиваться уже в юношеском возрасте, кроме то-
го, заболевший человек мог изменить характер питания в
результате заболевания.
Все перечисленные выше недостатки ограничивают
применение поперечных исследований в популяции.
Когортные исследования
Когортное исследование (cohort study) — обсервацион-
ное исследование, в котором выделенную по определенным
признакам группу людей (когорту) наблюдают в течение
39
некоторого периода времени и сравнивают исходы у тех,
кто подвергался и не подвергался воздействию изучаемого
фактора (или нескольких факторов), либо подвергался в
разной степени (рисунок 5).
Когортные исследования называют также продольными,
или лонгитудинальными (longitudinal study), подчеркивая
тем самым, что пациенты прослеживаются во времени; про-
спективными (prospective study), имея в виду, что группа
сформирована в настоящее время и прослежена в будущем;
или исследованиями заболеваемости (incidence study), об-
ращая внимание на то, что основным способом оценки яв-
ляется регистрация новых случаев заболевания в течение
определенного срока .
Время наблюдения при когортном исследовании может
быть от нескольких дней (при острых заболеваниях) до не-
скольких десятков лет (при изучении болезней с длитель-
ным латентным периодом).
Чаще всего целью когортных исследований является до-
казательство этиологических гипотез, т.е. поиск причин и
факторов риска развития заболеваний.
В случае наличия связи между воздействием изучаемого
фактора и развитием заболевания мы должны были бы ожи-
дать больший удельный вес лиц с развитием данного забо-
левания (частота новых случаев среди подверженных воз-
действию фактора) среди тех, которые были подвержены
воздействию изучаемого фактора риска, по сравнению с
удельным весом заболевших среди лиц, не подверженных
воздействию фактора риска (частота новых случаев среди
не подверженных воздействию фактора).
Как видно из таблицы 4, начинается исследование с от-
бора лиц, подверженных и не подверженных воздействию
изучаемого фактора (факторов). Из a + b подверженных
воздействию фактора лиц заболевание развилось у а лиц.
Таким образом, частота новых случаев среди подверженных
воздействию фактора, будет равна: a/ a + b. Подобным же
образом, из c + d не подверженных воздействию фактора
40
лиц, заболевание развилось у c лиц, значит, частота новых
случаев среди не подверженных воздействию фактора будет
равна: c/ c+d.
Рисунок 5. Дизайн когортного исследования

Лица с наличием Лица без наличия


воздействия фактора воздействия фактора

Развитие Отсутствие Развитие Отсутствие


заболевания заболевания заболевания заболевания

Таблица 4. Дизайн когортного исследования

Наблюдение за развитием
Частота
изучаемого заболевания
Всего новых
Заболевание Заболевание
случаев
развилось не развилось
Группа лиц,
подверженных
Выделение групп лиц

воздействию a b a+b a/ a + b
изучаемого
фактора
Группа лиц, не
подверженных
воздействию c d c+d c/ c+d
изучаемого
фактора

Полученные данные позволяют рассчитать относитель-


ный риск развития заболевания (Relative Risk - RR) – отно-
шение риска в группе экспонированных к риску в группе
неэкспонированных. Риск (доля, вероятность или процент)
– это отношение числа людей, у которых состоялось данное
событие, к общей численности группы.

41
Если относительный риск равен единице, это указывает
на отсутствие различий между сравниваемыми группами.
Если он выше единицы, это означает, что риск развития за-
болевания в группе экспонированных выше, по сравнению с
группой неэкспонированных.
Все указанные расчеты приводятся в гипотетическом
примере когортного исследования по изучению связи меж-
ду курением и развитием коронарной болезни (Таблица 5).

Таблица 5. Результаты гипотетического когортного ис-


следования взаимосвязи между курением и развитием
коронарной болезни

Затем следят за развитием


Частота
изучаемого заболевания:
новых
Развитие Отсутствие Всего
случаев
коронарной коронарной
на 1000
болезни болезни
Сначала Курящих 84 2916 3000 28.0
выделяются
Не
группы 87 4913 5000 17.4
курящих
лиц:

Как видно из приведенной таблицы, в данном исследова-


нии была выделена когорта, состоящая из 3000 курящих и
5000 не курящих. Все наблюдаемые лица в начале исследо-
вания не имели коронарной болезни. Обе группы наблюда-
лись в течение длительного периода времени с целью выяв-
ления развившейся коронарной болезни. Далее были срав-
нены частоты новых случаев коронарной болезни у обеих
сравниваемых групп. Коронарная болезнь развилась у 84
курящих и 87 не курящих. В итоге, показатель новых случа-
ев заболевания среди курящих составил 28.0 на 1000, а сре-
ди не курящих- 17.4 на 1000. Относительный риск будет ра-
вен: 28.0/17.4 = 1.6. Это означает, что риск курения увели-
чивает риск развития коронарной болезни на 60%.

42
Следует обратить внимание на то, что, так как мы выяв-
ляем новые случаи заболевания по мере их возникновения,
это позволяет нам установить наличие временной взаимо-
связи между воздействием изучаемого фактора и развитием
данного заболевания, т.е. установить предшествовало ли
воздействие фактора развитию заболевания. Разумеется, та-
кая временная связь может быть установлена, если мы рас-
сматриваем изучаемый фактор в качестве возможной при-
чины данного заболевания.

Виды когортных исследований

Основная проблема, связанная с проведением когортных


исследований заключается в том, что для выявления случа-
ев развития изучаемого заболевания исследуемая популяция
должна наблюдаться в течение длительного периода време-
ни. Рассмотрим в качестве примера гипотетическое иссле-
дование изучения взаимосвязи между курением и развитием
рака легких. Предположим, исследователями была выделе-
на и в течение 10 лет прослежена определенная группа
школьников. По прошествии 10 лет, все наблюдаемые были
разделены на две группы: группу курящих и не курящих.
Наблюдение за обеими группами было продолжено с целью
выявления у них случаев развития рака легких. Предполо-
жим, исследование было начато в 1995 году (рисунок 6) и
латентный период с момента начала курения до развития
рака легких составляет 10 лет. Так как промежуток времени
с момента выделения обследуемой группы школьников до
определения их отношения к курению в подростковом пе-
риоде будет длиться примерно 10 лет, понятно, что их от-
ношение к курению не будет определено ранее 2005 года, а
факт развития рака легкого не может быть установлен ранее
2015 года.
Описанный вид дизайна называется параллельным, или
проспективным когортным исследованием (concurrent, pros-
pective cohort study). Он называется параллельным, по-
43
скольку исследователь определяет исходную совокупность
в самом начале исследования и в сущности сопровождает
участников исследования в течение календарного времени
до развития изучаемого заболевания.

Рисунок 6. Гипотетическое параллельное когортное ис-


следование, начатое в 1995 году

1995 Население

Отсутствие рандомизации

Подверженность
воздействию фактора Отсутствие фактора
2005

Наличие Отсутствие Наличие за- Отсутствие


2015 заболевания заболевания болевания заболевания

Проблема заключается в том, что предпринятое исследо-


вание должно продолжаться до завершения, по меньшей
мере, 20 лет. И в связи с этим возникает ряд проблем.
Во первых, такое длительное исследование требует очень
больших затрат и времени, и финансов. Кроме того, в связи
с длительностью исследования есть риск того, что многие
из участников исследования выйдут из-под наблюдения,
исследователи могут не дожить до завершения исследова-
ния. В связи с указанными проблемами исследователи
обычно находят проспективные когортные исследования не
привлекательными.

44
Рисунок 7. Гипотетическое ретроспективное когортное
исследование, начатое в 1995 году

1975 Население

Отсутствие рандомизации

Подверженность
1985 воздействию фактора Отсутствие фактора

Наличие Отсутствие Наличие за- Отсутствие


1995 заболевания заболевания болевания заболевания

Означают ли указанные проблемы, что когортные иссле-


дования не практичны? Давайте рассмотрим другой подход
к проведению когортного исследования (рисунок 7). Пред-
положим, что мы начали свое исследование опять-таки в
1995 году, но на этот раз в нашем распоряжении оказался
список школьников 1975 года, и в 1985 году было проведе-
но исследование по выяснению отношения членов этой
группы школьников к курению. Используя данные 1995 го-
да, мы можем определить, у кого из указанной группы лиц
развился рак легких, у кого он отсутствовал. Этот дизайн
называется ретроспективным, или историческим когорт-
ным исследованием (historical, retrospective cohort study).
Нужно отметить, однако, что дизайн ретроспективного
когортного исследования не отличается от дизайна про-
спективного исследования: в обоих случаях мы сравниваем
экспонированные (подверженные воздействию фактора) и
неэкспонированные (не подверженные воздействию факто-
ра) группы. Что отличает ретроспективное исследование от
45
проспективного? В ретроспективном - используются архив-
ные данные и, следовательно, вся интересующая исследова-
теля информация может быть получена гораздо быстрее.
Это не параллельное исследование, так как для сокращения
времени проведения исследования мы начинаем его с уже
имеющейся популяцией. Таким образом, главное различие
между этими видами исследования заключается в различ-
ном календарном времени. В проспективном исследовании
группы экспонированных и неэкспонированных выделяют-
ся по мере их появления в ходе исследования, после чего
указанные группы наблюдаются в течение нескольких лет и
вычисляется частота возникновеноя новых случаев заболе-
вания. В ретроспективном исследовании наличие воздейст-
вия фактора устанавливается из архивных документов, а ис-
ход (развитие заболевания или его отсутствие) - в то время,
когда было начато исследование.
Основными преимуществами когортных исследований
являются следующие:
Во–первых, в отличие от исследований “случай-
контроль” и поперечных исследований, в когортных иссле-
дованиях экспозиция предшествует заболеванию, это отве-
чает критерию временной последовательности при установ-
лении причинных связей.
Во-вторых, эти исследования могут быть использованы
для изучения относительно редких экспозиций при тща-
тельном отборе групп по характеру экспозиции.
В-третьих, когортные исследования позволяют изучить
широкий спектр патологий, связанных с воздействием изу-
чаемой экспозиции.
В-четвертых, они позволяют изучить широкий спектр
факторов риска, связанных с развитием изучаемого заболе-
вания. Кроме того, когортные исследования могут дать под-
робную информацию о мешающих факторах, что позволяет
их контролировать на стадии планирования или при анализе
данных. Когортные исследования предоставляют подроб-
ные данные об экспозиции.
46
Но когортные исследования имеют также и ряд недос-
татков. Они очень объемны, значительно превышают объем
исследований “случай-контроль”. В связи с большим объе-
мом и длительностью наблюдения когортные исследования
требуют значительных затрат времени и денег. Эти иссле-
дования не подходят для исследования редких заболеваний:
число лиц, которых необходимо включить в исследование,
настолько велико, что делает проведение когортного иссле-
дования практически нецелесообразным. Кроме того, суще-
ственным недостатком когортного исследования является
то, что в течение длительного периода наблюдения за ко-
гортой многие из ее членов могут выйти из-под наблюде-
ния, что приведет к возникновению ошибок.

ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ

Экспериментальные исследования в медицинской лите-


ратуре встречаются гораздо чаще обсервационных.
Экспериментальное исследование (Experimental study)
– это исследование, условия проведения которого находятся
под прямым контролем исследователя.
Экспериментальные исследования с участием людей на-
зываются клиническими испытаниями (Clinical trials). Их
целью является исследование эффективности и безопасно-
сти медицинского вмешательства (применения новых ле-
карств, медицинской техники, методов лечения или профи-
лактики).
Клинические испытания делятся на две группы: с кон-
трольной группой и без нее. Испытания с контрольной
группой, или контролируемые клинические испытания (con-
trolled clinical trials) – это исследования, в которых проводят
сравнение одной и более групп вмешательства (экспери-
ментальной группы) с одной и более группами сравнения
(контрольной группой). Иными словами, испытуемый ле-
карственный препарат или, допустим, диагнoстическая про-
цедура сравнивается с другим ранее использующимся пре-
47
паратом или процедурой (параллельный контроль различ-
ных препаратов), с отсутствием вмешательства (контроль с
отсутствием лечения) или с плацебо (плацебо-контроль).
Таким образом, экспериментальные группы подвергаются
определенным вмешательствам или разным режимам одно-
го вмешательства. Контрольные группы находятся точно в
таких же условиях, как и первые, за исключением того, что
составляющие их пациенты не подвергаются изучаемому
вмешательству. Во всех группах наблюдают клиническое
течение заболевания, и любые отличия в исходах приписы-
вают изучаемому вмешательству.
В клинических испытаниях без контрольной группы, или
неконтролируемых клинических испытаниях (uncontrolled
clinical trials), исследователь лишь описывает результаты
применения экспериментального вмешательства без срав-
нения с контрольной группой.
Так как целью клинических испытаний является опреде-
ление большей эффективности испытуемого средства, по
сравнению с другими средствами, клинические испытания с
контрольными группами, по сравнению с испытаниями без
контрольных групп, позволяют с большей точностью опре-
делить, является ли большая эффективность результатом
применения экспериментального средства или результатом
воздействия другого фактора. Именно поэтому клинические
испытания с применением контрольных групп считаются в
медицине имеющими большую валидность, по сравнению с
испытаниями без контрольных групп.
При планировании клинических испытаний в зависимо-
сти от конкретных условий и целей может быть выбран раз-
личный порядок их проведения. Для каждого дизайна ис-
следования сегодня сформировались определенные требо-
вания к его подготовке, специфические стандарты качества
проведения, обработки и представления данных. Чаще всего
из контролируемых испытаний применяют два варианта ди-
зайна:

48
1) клиническое исследование в параллельных группах (pa-
rallel, оr concurrent, group design);
2) клиническое исследование в «перекрестной модели»
(crossover group design).
Клиническое исследование в параллельных группах – это
способ клинического исследования, при котором контроль-
ная группа набирается одновременно по тем же правилам,
что и экспериментальная группа. В этом случае каждый па-
циент попадает под одну из схем лечения, проходящих ис-
пытания. Каждой схеме лечения соответствует своя тера-
певтическая группа, и все пациенты, отнесенные к той или
иной терапевтической группе, получают одинаковое лече-
ние. Несмотря на то, что клинические исследования в ди-
зайне параллельных групп дорогостоящие, продолжитель-
ные и требуют большого количества испытуемых, они при-
меняются широко, поскольку являются наиболее объектив-
ными в определении эффективности лечения и точными в
формулировании выводов, а также позволяют избежать не-
которых видов систематических ошибок, которые неизбеж-
ны при исследованиях с историческим контролем.

49
Рисунок 8. Схема клинического исследования с парал-
лельным контролем

Определение вы-
борочной сово-
купности

Рандомизация

Вмешательство Контроль

Оценка результатов

Перекрестное клиническое исследование (Cross-over


group design) – исследование, при котором между экспери-
ментальной и контрольной группами почти нет различий:
обе группы получают по очереди оба сравниваемых препа-
рата. С этой целью пациентов рандомизируют в группы, в
которых они проходят одинаковое курсовое лечение, но с
различной последовательностью. Например, в первом пе-
риоде одной группе пациентов дают контрольное лечение, а
второй - изучаемое новое. Во втором периоде лечение в
двух группах меняется. Сопоставляется эффект от лечения в
каждой группе, в каждом периоде. Таким образом, в пере-
крестной модели клинического испытания каждый пациент
является и опытным, и контрольным. Следовательно, кли-
ническое исследование в «перекрестной модели» позволяет
оценить на одних и тех же испытуемых эффекты как изу-
чаемых лекарственных препаратов, так и сравнительных
курсов лечения. Такой подход обеспечивает более надежное
тестирование терапевтического эффекта при меньшем числе
пациентов, чем схема параллельного группового анализа.
50
Эта схема применяется у пациентов со стабильным течени-
ем заболевания, обычно хронического характера. Перекре-
стные варианты дизайна часто находят свое место при про-
ведении клинико-фармакологических испытаний.

Рисунок 9. Схема двухпериодного перекрестного иссле-


дования лекарственного средства А в сравнении с пла-
цебо Б
Определение выборочной со-
вокупности

Рандомизация

Вмешательство А Период 1 Вмешательство Б

Вмешательство Б Период 2 Вмешательство А

Кроме того, к экспериментальным исследованиям с на-


личием контрольных групп относятся также исследования
“до-после” и исследования с историческим контролем.
Исследование “до–после” (before–after study)– клиниче-
ское исследование, описывающее течение заболевания в
одной группе пациентов, подвергающейся изучаемому
вмешательству. В данном случае одна и та же группа паци-
ентов рассматривается и как контрольная, и как экспери-
ментальная группа. Данный подход основан на предполо-
жении, что любое улучшение, наблюдаемое после лечения,
обусловлено именно лечением. Это предположение может
оказаться ложным, что делает указанный метод весьма уяз-
вимым.
51
Исследования с историческим, или непараллельным кон-
тролем (historical or nonconcurrent control) — способ клини-
ческого исследования, при котором результаты современно-
го лечения сравниваются с данными наблюдения аналогич-
ных пациентов в прошлом. Таким образом, это исследова-
ние противоположно параллельному контролю (concurrent
control), при котором контрольная группа набирается одно-
временно по тем же правилам, что и экспериментальная
группа. В исследованиях с использованием исторического
контроля высок риск систематической ошибки, связанной с
систематическими различиями между сравниваемыми
группами из-за изменения со временем риска, прогноза, ме-
дицинской помощи и т.п.
Сопоставляемые группы больных в клинических иссле-
дованиях должны быть однородны по всем признакам, ко-
торые могут оказать влияние на исход заболевания. Это ус-
ловие выполнимо, если каждый из участников испытания
имеет равный шанс попасть как в экспериментальную, так и
в контрольную группу. Процедура, обеспечивающая слу-
чайное распределение людей в экспериментальную и кон-
трольную группу, называется рандомизацией. Случайным
распределением достигается отсутствие различий между
двумя группами и, таким образом, снижается вероятность
систематической ошибки в клинических исследованиях
вследствие различий групп по каким-либо признакам.
На рисунке 8 приведен гипотетический пример воздейст-
вия недостаточной сопоставимости сравниваемых групп на
результаты сравнения уровня летальности в них. Предпо-
ложим, было проведено исследование по изучению эффек-
тивности профилактических мероприятий по снижению
уровня летальности больных, страдающих инфарктом мио-
карда. В исследование было вовлечено всего 2000 больных
с указанной патологией, из коих у 700 наблюдалась арит-
мия, у остальных 1300 - она отсутствовала. Уровень леталь-
ности среди больных с аритмией составлял 50%, среди
больных без аритмии - 10%.
52
В обе группы: в группу, где проводились профилактиче-
ские мероприятия (1-ая группа), и группу, где они не прово-
дились (2-ая группа), было включено по 1000 больных, пе-
ренесших инфаркт миокарда.
Если группы по частоте встречаемости аритмии были не
сопоставимы, например, в первой группе из 1000 больных
только 200 имели аритмию (с уровнем летальности 50%), а
во второй группе из 1000 больных аритмией страдали 500,
то показатель летальности в первой группе составит 18%, а
во второй группе - 30%. В результате мы можем заключить,
что проведенные профилактические мероприятия имели
высокую эффективность.
Предположим теперь, что группы были сопоставимы по
частоте встречаемости аритмии: в каждой из двух сравни-
ваемых групп было по 350 больных, страдающих аритмией.
В этом случае уровень летальности в обеих группах соста-
вит 24%. Таким образом, разница между двумя сравнивае-
мыми группами (с проведением профилактических меро-
приятий и без их проведения) в том случае, когда группы
были не сопоставимы по частоте встречаемости аритмии,
была обусловлена лишь несопоставимостью сравниваемых
групп, а не воздействием профилактических мероприятий.
Может возникнуть вопрос, зачем нам беспокоиться по
поводу сопоставимости групп, если можно использовать
метод стандартизации показателей. Дело в том, что стан-
дартизация показателей позволит нам устранить влияние
только тех факторов о существовании которых мы знаем.
Но существует множество других факторов, которые также
могут влиять на результаты исследования, о некоторых из
них мы можем даже не знать. Рандомизация увеличивает
вероятность того, что группы будут сопоставимы не только
в отношении факторов, о существоствовании которых мы
знаем, но также в отношении тех факторов, о возможности
воздействия которых мы не подозреваем.
Tаким образом, задача рандомизации состоит в том, что-
бы обеспечить такой подбор больных, при котором кон-
53
трольная группа отличалась бы от экспериментальной толь-
ко методом лечения. Рандомизация является обязательным
условием хорошо спланированного экспериментального ис-
следования. Тем не менее, по некоторым данным, на сего-
дняшний день всего лишь 20% статей, публикуемых в ве-
дущих международных медицинских журналах, содержат
результаты рандомизированных исследований.
Результаты нескольких рандомизированных исследова-
ний, посвященных изучению какой-то определенной про-
блемы, могут объединяться. Количественный анализ объе-
диненных результатов нескольких клинических испытаний
одного и того же вмешательства называют мета-анализом.
За счет увеличения размера выборки при мета-анализе
обеспечивается большая статистическая мощность, чем в
каждом отдельном испытании.
Для осуществления рандомизации могут использоваться
таблицы случайных чисел, метод конвертов или метод по-
следовательности случайных чисел, генерируемой различ-
ными компьютерными программами.

54
Рисунок 10. Сравнение рандомизированного и нерандо-
мизированного исследований

I . Нерандомизированное исследoвание

n = 2000

1000 1000

Проведение профилак- Отсутствие профилак-


тических мероприятий тических мероприятий

800 │ 200 500 │ 500

Случаи 80 100 50 250


смертей:

Общее 180 300


число
смертей:

Летальность: 180/1000 = 18% 300/1000 =30%

55
II. Рандомизированное исследование

n = 2000
1000 1000

Проведение профилакт- Отсутствие профилак-


ических мероприятий тических мероприятий

650 350 650 350

Случаи 65 175 65 175


смертей:

Общее 240 240


число
смертей:

Летальность: 240/1000 = 24% 240/1000 =24%

Ниже приведен фрагмент из таблицы случайных чисел .


Таблица состоит из групп, составленных из пяти строк и
пяти столбцов. Это деление предусмотрено для облегчения
восприятия таблицы. Столбцы пронумерованы сверху вниз:
00, 01, 02 и т.д. Подобным же образом, слева направо про-
нумерованы строки: 00, 01, 02 и т.д. Как использовать таб-
лицу случайных чисел? Предположим, запланировано про-
ведение исследования, в котором должны сравниваться две
группы больных: получающих лечение А (группа А) и ле-
чение Б (группа Б). Допустим, до распределения больных по
группам было принято решение рассматривать каждое не-

56
четное число как предписание к включению пациента в
группу А, и каждое четное число- к включению пациента в
группу Б. Для пользования таблицей сначала необходимо
выбрать стартовую точку. Выбор случайной стартовой точ-
ки необходим для исключения предсказуемости выборки.
Стартовая точка – это цифра в таблице, которая выбирается,
не глядя на таблицу, наугад. Заранее решается также вопрос
о направлении движения по таблице (горизонтально, слева
направо; горизонтально справа налево; вверх или вниз).
Предположим, мы опустили палец на цифру 5 на пересече-
нии столбца 7 и строки 7 и решили двигаться горизонтально
в направлении слева направо. Первая цифра 5 – нечетное
число, следовательно, первый пациент должен быть вклю-
чен в группу А. Следующая цифра также нечетная, значит,
второй пациент также должен быть включен в группу А.
Третья цифра 8 – четное число, третий пациент должен
быть включен в группу Б и т.д. Таким образом, исследова-
тель не располагает заранее информацией о том, в какую из
сравниваемых групп будет включен следующий пациент.

Таблица случайных чисел

00-04 05-09 10-14 15-19


00 56348 01458 36236 07253
01 09372 27651 30103 37004
02 44782 54023 61355 71692
03 04383 90952 57204 57810
04 98190 89997 98839 76129

05 16263 35632 88105 59090


06 62032 90741 13468 02647
07 48457 78538 22759 12188
08 36782 06157 73084 48094
09 63302 55103 19703 74741
Имеются и другие способы использования таблицы слу-
чайных чисел. Например, мы можем решить, что цифры от
57
0 до 4 будут предписанием к включению пациентов в груп-
пу А, а цифры от 5 до 9 – предписанием для включения их в
группу Б. Каждый из указанных методов имеет одинаковую
валидность, но всегда заранее, до проведения рандомизации
необходимо в письменной форме указывать, какой из под-
ходов будет использован.
Одним из способов использования таблицы случайных
чисел является приготовление непрозрачных конвертов, по-
следовательно пронумерованных с внешней стороны: 1, 2, 3
и т.д. Внутрь каждого конверта кладется карта с указанием
вида лечения: карта с указанием лечения А будет положена
в первый конверт, карта с указанием лечения Б – во второй
конверт и так далее в соответствии со случайными числами.
Конверты запечатываются. Первый включенный в исследо-
вание пациент вскрывает конверт, и определяется группа, в
которую он должен быть включен. Вся эта процедура по-
вторяется затем для каждого из последующих участников
исследования.
Рандомизированные исследования могут быть откры-
тыми и “слепыми” (маскированными). Открытым рандоми-
зированное испытание считается в том случае, если и паци-
ент, и врач сразу после проведения рандомизации узнают о
том, какой вид лечения будет применен у данного больного.
Уровень «маскирования», или «ослепления» исследования,
может быть различным, и от этого зависит достоверность
анализа и интерпретация конечных результатов. При про-
стом слепом методе (Blind study) только пациент не знает,
какое именно лечение ему выбрано; при двойном слепом
методе (Double-blind study) этого не знают ни пациент, ни
исследователь; при тройном слепом методе (Triple-blind
study) – не знают пациент, исследователь и даже статистик,
проводящий статистическую обработку данных. «Маскиро-
вание», или «ослепление» исследования, позволяет исклю-
чить влияние субъективных факторов на результаты лече-
ния и таким образом, устранить систематические ошибки в
клинических исследованиях.
58
Нерандомизированное клиническое испытание

Нерандомизированное клиническое испытание - клини-


ческое испытание в параллельных группах, в котором не
проводилось рандомизированного распределения участни-
ков по сравниваемым группам. По своей валидности эти ис-
следования в значительной степени уступают рандомизиро-
ванным, так как в них ничего не предпринимается для пре-
дотвращения возникновения систематической ошибки, свя-
занной с распределением участников исследования по срав-
ниваемым группам.
Имеется несколько различных подходов для распределе-
ния участников нерандомизированного исследования по
сравниваемым группам. В одном из них, например, предла-
гается распределять больных по группам в зависимости от
даты их поступления в стационар. Предположим, если
больной поступил в больницу в четный день месяца, он
включается в группу А, если в нечетный день - в группу Б.
Проблема в данном случае заключается в том, что в отличие
от рандомизированного исследования, в нерандомизиро-
ванном исследовании исследователю заранее известно, в
которую группу будет включен следующий пациент, что
вызывает возможность возникновения систематической
ошибки, связанной с отбором.
Таким образом, основным преимуществом рандомизиро-
ванных клинических испытаний является прежде всего то,
что они являются “золотым стандартом” для изучения эф-
фективности терапевтических, профилактических и других
мероприятий как в медицине, так и в области общественно-
го здоровья. Они позволяют с наибольшей уверенностью
утверждать, что результат является следствием вмешатель-
ства, а не какой-либо другой причины, так как посредством
сравнения групп, полностью сопоставимых во всех отноше-
ниях, за исключением исследуемого вмешательства, кон-
тролируется воздействие как известных, так и неизвестных
искажающих факторов. Эти исследования дают возмож-
59
ность оценки результатов воздействия одновременно не-
скольких вмешательств и их сочетаний.
Основными недостатками клинических испытаний явля-
ются их дороговизна, сложность методики выполнения, а
также этические проблемы, всегда возникающие при их
проведении.
В рандомизированном исследовании с целью сравнения
двух хирургических методов лечения рака молочной желе-
зы: простой и радикальной мастэктомии, один из участ-
вующих хирургов был убежден, что радикальная мастэкто-
мия является операцией выбора и не мог уговорить себя ис-
пользовать простую мастэктомию ни у одного из своих па-
циентов, включенных в исследование. Во время проведения
рандомизации среди его пациентов он откладывал в сторону
те конверты, которые содержали предписания для проведе-
ния больным простой мастэктомии до тех пор, пока попа-
дался конверт с предписанием к проведению радикальной
мастэктомии.
Этот пример наглядно демонстрирует конфликт, испы-
тываемый многими клиницистами при включении их паци-
ентов в рандомизированные клинические испытания. С од-
ной стороны, врач имеет обязательство сделать все возмож-
ное для пациена, с другой стороны, когда он участвует в
клиническом испытании, он обязуется следовать инструк-
циям по правильному проведению исследования.
Таким образом, при проведении рандомизированных
клинических испытаний часто возникает конфликт между
ролью клинициста и ролью врача, участвующего в клиниче-
ском испытании, приводящий к возникновению системати-
ческой ошибки.

60
ОПИСАТЕЛЬНАЯ СТАТИСТИКА

В результате сбора статистического материала на прак-


тике обычно набирается большая совокупность наблюдений
(десятки, сотни, а иногда и тысячи результатов измерений
индивидуальных характеристик), поэтому возникает задача
компактного описания имеющихся данных. Для этого ис-
пользуют методы описательной статистики, которая, как
уже было сказано, позволяет обобщать первичные результа-
ты, полученные при наблюдении или в эксперименте. Про-
цедуры здесь сводятся к группировке данных по их значе-
ниям, построению распределения их частот, выявлению
центральных тенденций распределения (например, средней
арифметической) и, наконец, к оценке разброса данных по
отношению к найденной центральной тенденции.

ТАБЛИЦЫ РАСПРЕДЕЛЕНИЯ ЧАСТОТ

Совокупность неорганизованных данных сложна для


восприятия и понимания. Рассмотрим пример изучения
уровня холестерина в крови у группы, состоящей из 1054
мужчин.
Наиболее простым способом организации полученных
данных является их последовательное расположение в по-
рядке возрастания или убывания с указанием частоты
встречаемости (P) каждой величины (V). В результате полу-
чится таблица распределения частот встречаемости имею-
щихся величин (таблица 6). В указанной таблице данные об
уровне холестерина обследованных 1054 мужчин приведе-
ны в порядке возрастания, минимальный зарегистрирован-
ный уровень холестерина равен 120 мг/дл, максимальный
уровень – 399 мг/дл.
При таком расположении данных в таблице, таблица по-
лучается очень громоздкой, она будет более привлекатель-
ной и понятной, если ее данные представить в виде распре-

61
деления частот встречаемости не отдельных величин, а их
групповых интервалов.
В таблице 7 приведен пример такого сгруппированного
распределения частот. Весь диапазон величин уровня холе-
стерина, определенных у 1054 мужчин обследованной
группы, разбили на 7 групп. Каждая из выделенных групп
имеет одинаковый интервал, в данном случае равный 40.
Как видно из таблицы 7, сгруппированное распределение
частот может быть преобразовано в распределение относи-
тельных частот встречаемости интервалов. Относительная
частота встречаемости интервала показывает удельный вес
величин, находящихся в пределах каждого группового ин-
тервала и рассчитывается путем деления частоты его встре-
чаемости на общее число обследованных.
Так, например, удельный вес лиц с уровнем холестерина
в пределах интервала от 120- до 159 мг/дл составит
150/1054 х 100% = 14,2%.
В таблице 7 приведены также значения кумулятивных
частот. Кумулятивная частота показывает частоту встре-
чаемости величин в пределах данного и всех предшествую-
щих интервалов.
Согласно данным таблицы 7, 14,2% обследованных в
возрасте 25-34 года имели уровень холестерина в крови от
120- до 159 мг/дл, 41,9%- от 160 – до 199, следовательно, у
56,1% (14,2 + 41,9%) обследованных уровень холестерина
составлял 120- 199 мг/дл. Это означает, что приблизительно
56% обследованных имели значения уровня холестерина в
крови 199 мг/дл и меньше, и остальные 44% (100-56%) –
больше 199 мг/дл. Кумулятивная частота группы, которая
включает наиболее высокие уровни холестерина, в данном
случае это интервал 360- 399 мг/дл, равный 100%. Это озна-
чает, что 100% всех обследованных имеют уровень холе-
стерина до 399 мг/дл включительно.

62
Таблица 6. Плотность распределения уровня холестери-
на у 1054 мужчин в возрастной группе от 25 до 34 лет

V P V P V P V P V P V P V P V P
120 1 155 8 190 17 225 4 260 3 295 3 330 1 365 0
121 2 156 7 191 17 226 5 261 0 296 1 331 1 366 0
122 2 157 6 192 17 227 5 262 1 297 0 332 0 367 0
123 3 158 5 193 15 228 7 263 0 298 1 333 0 368 0
124 2 159 6 194 10 229 5 264 1 299 0 334 0 369 0
125 0 160 5 195 16 230 7 265 3 300 0 335 0 370 0
126 0 161 4 196 17 231 7 266 3 301 0 336 0 371 0
127 0 162 4 197 18 232 8 267 1 302 0 337 1 372 0
128 5 163 4 198 18 233 9 268 1 303 1 338 1 373 0
129 4 164 5 199 20 234 8 269 2 304 0 339 0 374 0
130 0 165 6 200 18 235 1 270 3 305 0 340 0 375 0
131 2 166 7 201 17 236 0 271 2 306 0 341 1 376 0
132 0 167 6 202 15 237 7 272 2 307 0 342 0 377 0
133 1 168 5 203 8 238 8 273 1 308 1 343 0 378 0
134 0 169 4 204 8 239 6 274 0 309 0 344 0 379 1
135 0 170 3 205 10 240 8 275 1 310 0 345 0 380 0
136 1 171 7 206 8 241 7 276 2 311 0 346 0 381 0
137 3 172 5 207 11 242 6 277 0 312 0 347 0 382 0
138 6 173 8 208 10 243 6 278 1 313 0 348 0 383 0
139 4 174 9 209 9 244 6 279 1 314 0 349 0 384 0
140 2 175 6 210 11 245 5 280 0 315 1 350 0 385 0
141 6 176 7 211 9 246 6 281 5 316 0 351 0 386 0
142 6 177 5 212 9 247 5 282 2 317 0 352 0 387 0
143 8 178 9 213 9 248 6 283 3 318 0 353 0 388 0
144 0 179 6 214 9 249 4 284 0 319 0 354 0 389 0
145 5 180 10 215 7 250 5 285 2 320 1 355 0 390 0
146 6 181 17 216 5 251 3 286 4 321 0 356 0 391 0
147 3 182 18 217 8 252 4 287 0 322 0 357 0 392 0
148 5 183 13 218 4 253 0 288 3 323 1 358 0 393 1
149 9 184 14 219 4 254 1 289 2 324 1 359 0 394 0
150 8 185 15 220 8 255 3 290 0 325 0 360 0 395 0
151 8 186 20 221 5 256 4 291 4 326 1 361 0 396 0
152 8 187 17 222 0 257 4 292 1 327 0 362 0 397 1
153 5 188 18 223 5 258 0 293 0 328 0 363 1 398 0
154 3 189 20 224 5 259 4 294 0 329 0 364 0 399 1

63
Таблица 7. Сгруппированное, относительное и кумуля-
тивное распределение частот встречаемости уровня хо-
лестерина у 1054 мужчин в возрастной группе от 25 до 34
лет

Интервал Частота Относительная Кумулятивная


частота частота
120-159 150 14,2 14,2
160-199 442 41,9 56,1
200-239 299 28,4 84,5
240-279 115 10,9 95,4
280-319 34 3,2 98,6
320-359 9 0,9 99,5
360-399 5 0,5 100,0
Всего 1054 100,0

ГРАФИЧЕСКОЕ ИЗОБРАЖЕНИЕ
РАСПРЕДЕЛЕНИЯ ЧАСТОТ

Обычно табличное распределение частот дополняют его


графическим представлением.
Графически распределение частот встречаемости вели-
чин признаков, относящихся к интервальной шкале, или
шкале соотношений, представляется в виде гистограммы.
Гистограмма представляет собой разновидность графика,
построенного на оси координат, на котором по оси «Х» от-
кладываются интервалы значений определенного признака,
а на оси «Y» - соответствующие частоты или относитель-
ные частоты их встречаемости, в результате чего график
становится “ступенчатым”. На рисунке 11 представлена
гистограмма распределения частот встречаемости величин,
представленных в таблице 7. На оси абсцисс указаны ин-
тервалы уровня холестерина, на оси ординат- частоты
встречаемости величин в пределах соответствующих интер-
валов.
64
Рисунок 11. Гистограмма сгруппированного распреде-
ления частот встречаемости уровня холестерина у 1054
мужчин в возрастной группе 25-34 года

Для графического представления сведений о значении


количественного признака в сравниваемых группах, выде-
ленных по номинальному признаку, обычно используется
столбиковая диаграмма. Например, если группа мужчин
численностью в 100 человек имела средний уровень холе-
стерина в крови 218 мг/дл, а у группы обследованных жен-
щин численностью также в 100 человек уровень холестери-
на составлял 190 мг/дл, средние указанных двух групп
можно представить в виде нижеприведенной столбиковой
диаграммы (рисунок 12).

65
Рисунок 12. Столбиковая диаграмма среднего
уровня холестерина в крови у 100 обследованных муж-
чин и женщин (мг/дл)
250

200
Ñðåäíèé óðîâåíü õîëåñòåðèíà, ìã/äë

150

100

50

0
ìóæ÷èíû æåíùèíû

Столбиковые диаграммы очень схожи с гистограммами.


Различие между ними заключается в том, что на гистограм-
ме прямоугольники не отделяются друг от друга, демонст-
рируя непрерывность групповых интервалов, тогда как на
столбиковой диаграмме каждый прямоугольник четко от-
деляется от другого, что свидетельствует о принадлежности
соответствующих данных разным категориям.
Для еще более наглядного представления общей конфи-
гурации распределения частот встречаемости величин при-
знаков, относящихся к интервальной шкале или шкале со-
отношений, строятся полигоны распределения частот. Для
этого отрезками прямых соединяют центры верхних сторон
всех прямоугольников гистограммы, а затем с обеих сторон
«замыкают» площадь под кривой, доводя концы полигонов
до горизонтальной оси (частота = 0) в точках, соответст-
вующих самым крайним значениям распределения (рисунок
13).
66
Рисунок 13. Полигон распределения частот встречаемо-
сти уровня холестерина у 1054 мужчин в возрастной
группе от 25 до 34 лет
Частота

140 180 220 260 300 340 380

Уровень холестерина, мг/дл


Распределение кумулятивных частот встречаемости ве-
личин признаков, относящихся к интервальной шкале, или
шкале соотношений, может быть представлено в виде куму-
лятивной кривой (рисунок 14).
Рисунок 14. Кривая распределения кумулятивных час-
тот встречаемости уровня холестерина у 1054 мужчин в
возрастной группе от 25 до 34 лет

500

400
Частота

300

200

100

0
140 180 220 260 300 340 380
Уровень холестерина, мг/дл

67
Кумулятивная кривая и распределение кумулятивных
частот встречаемости величин признака иллюстрируют
концепцию перцентилей. Перцентили являются разновид-
ностью квантилей, которые делят распределение на опре-
денное число равных частей. Перцентили делят распределе-
ние на 100 равных частей. К квантилям относятся также
квартили, делящие распределение на 4 равные части, квин-
тили – делящие распределение на 5 равных частей и деци-
ли- делящие распределение на 10 равных частей. Однако, на
практике из квантилей чаще всего используются перценти-
ли и квартили.
Перцентиль – это такое значение заданного распределе-
ния, которое больше «р» процентов всех значений распре-
деления. Иначе говоря, перцентиль показывает процент тех
значений признака, которые располагаются ниже или равны
данной величине признака.
В случае сгруппированного распределения частот, на-
пример, данных, приведенных в таблице 7, перцентили по-
казывают процент наблюдений, который находится в пре-
делах или ниже любого группового интервала. Так, 100%-
перцентиль значения холестерина – это значение холесте-
рина, при котором 100% значений находятся ниже этой точ-
ки. Это максимальное значение, в нашем случае равное ин-
тервалу 360-399 мг/дл. Аналогично, нулевой перцентиль –
это минимальное значение, в данном случае равное интер-
валу 120-159 мг/дл. Из таблицы также видно, что около 56%
всех обследованных имеют значения холестерина в крови
ниже величины 199 мг/дл, которая является 56-ым перцен-
тилем. Мужчина с уровнем холестерина 199 мг/дл входит в
пределы 56-ой перцентили; 44% всех обследованных имеют
значения холестерина выше указанного уровня.
Перцентили часто используются при сравнении индиви-
дуальных данных с нормой. Они находят широкое приме-
нение в разработке и использовании шкал для оценки уров-
ня физического развития, уровня интеллекта. Они опреде-
ляют также пределы нормы для лабораторных показателей.
68
На рисунке 15 изображена центильная шкала для оценки
физического развития девочек в возрастной группе от 0 до
36 месяцев. Для девочек в возрасте 21 месяца, например, 95-
ый перцентиль веса равен 12 кг (показано стрелкой). Это
означает, что 95% девочек в возрасте 21 месяца весят 12 кг
или меньше, и только у 5% девочек этой возрастной группы
значения веса тела больше 12 кг.

Рисунок 15.
Центильная шкала для оценки физического развития
девочек в возрастной группе от 0- до 36 месяцев

69
Как уже было сказано, квартили- это квантили, делящие
распределение на 4 равные части. Первый квартиль - это 25-
ый перцентиль, второй квартиль - 50-ый перцентиль, и тре-
тий квартиль - это 75-ый перцентиль. Половина всех на-
блюдений распределения находится между 25-ым и 75-ым
перцентилями. Разница между третьим и первым квартиля-
ми, или разница между 75% и 25% перцентилями, называет-
ся межквартильным разбросом. Межквартильный разброс
включает срединные 50% всех наблюдений. Например,
межквартильный разброс веса 9-месячных девочек включа-
ет значения веса между 7,5 (75-ый перцентиль) и 6,5 (25-ый
перцентиль) кг. Это означает, что 50% девочек указанной
возрастной группы имеют значения веса между 6,5 и 7,5 кг.

Рисунок 16. Кривая нормального распределения

μ=Me=Mo
Частота

Значения
Одно большое преимущество перцентилей и квартилей
заключается в том, что они являются хорошим описанием
данных вне зависимости от формы распределения. Они не
предполагают наличия так называемого, нормального рас-
пределения. Что же подразумевается под нормальным рас-
пределением?
Полигоны распределения частот могут быть различной
формы, но многие нативные явления имеют симметричное,
колокообразное распределение. Это распределение чаще
всего называют нормальным или именем автора, открывше-
70
го данную закономерность, Гауссовским распределением
(рис. 16).
На рисунке 17 показаны некоторые другие виды частот-
ных распределений. Ассиметричные частотные распределе-
ния называются скошенными (skewed distributions). Асси-
метричное распределение может быть скошенным вправо
(положительная ассиметрия) (рис. 17 А) или влево (отрица-
тельная ассиметрия) (рис. 17 B). Направление скошенности
определяют по месту нахождения хвоста. Распределение с
положительной ассиметрией характеризуется наличием от-
носительно большого числа малых значений и небольшого
числа больших значений изучаемого признака. Соответст-
венно, при распределении с отрицательной ассиметрией
превалируют крупные значения при относительно неболь-
шом количестве малых значений изучаемого признака.
На рисунке 17 C и D показаны также J-образное и бимо-
дальное распределения. Бимодальное распределение часто
представляет собой комбинацию двух нормальных распре-
делений. Например, распределение величин роста большой
группы мужчин и женщин, при котором величины каждого
пола имеют нормальное распределение относительно двух
различных средних величин.

71
Рисунок 17. Виды ненормальных частотных распреде-
лений

А. Положительная B. Отрицательная
ассиметрия ассиметрия

C. J –образное D. Бимодальное
распределение распределение

ПОКАЗАТЕЛИ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ

Все распределение величин может быть представлено


одной наиболее типичной величиной, характеризующей
всю изучаемую совокупность. Эта наиболее типичая вели-
чина называется величиной центральной тенденции. К ве-
личинам центральной тенденции относятся средняя, медиа-
на и мода. Все три величины центральной тенденции ис-
пользуются для характеристики данных, представленных
72
количественными признаками; медиана и мода могут ис-
пользоваться также для порядковых признаков.
Мода (Мо) — это самый простой и наименее редко ис-
пользуемый из всех показателей центральной тенденции.
Обозначается мода символом Mo. Это значение признака,
наиболее часто встречающееся в ряду всех полученных зна-
чений. Моду можно с легкостью найти при простом обозре-
нии распределения частот. Например, мода следующего на-
бора данных, показывающих число родов у группы опро-
шенных женщин, равна 1:
0, 0, 1, 1, 1, 1, 2, 2, 2, 3, 4, 6.

На полигоне распределения частот мода соответствует


самой высокой точке кривой. Если оказывается, что каждое
значение встречается один раз (или одинаковое количество
раз), то у такого распределения не будет моды. Если с наи-
большей частотой встречается не одна, а сразу две величи-
ны, то у распределения будут сразу две моды, а само рас-
пределение является бимодальным, если с наибольшей час-
тотой встречается несколько величин - распределение будет
многомодальным.
Средняя арифметическая ( X ) — это наиболее часто
используемый показатель центральной тенденции. Она так
часто используется для описания центральной тенденции,
что в обыденном языке стала синонимом типичного значе-
ния. Она часто называется просто "средней". Формула для
расчета средней арифметической ряда данных приведена
ниже:
n

∑X i
X = 1
,
n
где X – средняя (икс с верхним подчеркиванием). Сим-
вол Σ – математический знак суммирования измеренных
величин X i . Выражения над и под знаком суммирования
означают, что суммируется ряд величин X , обозначенных
73
индексом i, от 1 до n; n - число измеренных значений пере-
менной х, или число наблюдений. Процедура вычисления
средней арифметической реализована не только в специали-
зированных пакетах программ для статистического анализа
(например, SPSS, SAS и др.), но и в пакетах программ ши-
рокого назначения, например, в электронных таблицах (MS
Excel и др.).
Покажем расчет величины средней арифметической на
следующем примере. Во время вспышки гепатита А в учеб-
ном заведении заболело 6 человек. Инкубационный период
заболевших составлял соответственно: 29, 31, 24, 29, 30 и 25
дней.
Величина среднего инкубационного периода составит:
n

∑X i
29 + 31 + 24 + 29 + 30 + 25
X = 1
= = 28дней
n 6

Таким образом, средний инкубационный период для


больных, заболевших во время данной вспышки, был равен
28 дням.
Средняя арифметическая используется чаще других по-
казателей центральной тенденции, т. к. она обладает удоб-
ными статистическими свойствами. Например, сумма от-
клонений отдельных значений от средней арифметической
равна нулю. Поясним это на примере вспышки гепатита А.
В нижеприведенной таблице показаны данные, полученные
вычитанием среднего инкубационного периода из отдель-
ных инкубационных периодов. Приведена также и их сум-
ма. Заметим, что она равна нулю. Это означает, что средняя
арифметическая является арифметическим центром распре-
деления.

74
Минус значение средней
Значение Разность
арифметической
24 -28 -4
25 -28 -3
29 -28 +1
29 -28 +1
30 -28 +2
31 -28 +3
168-168=0 -7+7=0

Средняя арифметическая является наилучшим показате-


лем центральной тенденции, наиболее устойчивым к воз-
действию варьирования различных выборок. Например, при
повторном изучении образцов крови одного и того же паци-
ента среднее число лейкоцитов в различных образцах крови
будет варьировать в значительно меньшей степени, чем
значения двух других показателей центральной тенденции.
Хотя средняя арифметическая представляет собой хоро-
шую обобщающую характеристику ряда данных, данные
должны быть нормально, или симметрично, распределены,
так как средняя арифметическая крайне "чувствительна" к
влиянию крайних значений распределения. Например, если
бы наибольшее из перечисленных выше значений инкуба-
ционного периода у группы студентов, заболевших гепати-
том А, было бы 131, а не 31, средняя арифметическая стала
бы равной 44,7, а не 28,0:
(24+25+29+29+30+131)/6 = 44,7
Полученная величина средней арифметической (44,7) на-
ходится в "центре тяжести" этих данных, но, в действитель-
ности, плохо их отражает. Под воздействием одного очень
большого («выскакивающего») значения средняя арифме-
тическая становится больше, чем остальные значения рас-
пределения, за исключением «выскакивающего». Таким об-
разом, средняя правильно отражает центральную тенден-
цию только в случае симметричного распределения. В слу-
75
чае несимметричного распределения данных вычислять
среднюю не следует.
Медиана (Me) является еще одним из часто применяе-
мых видов величин центральной тенденции. Она особенно
подходит для описания асимметрично распределенных дан-
ных. Mедиана - это значение, делящее ряд последовательно
расположенных данных на две равные половины, одна из
которых состоит из наблюдений больше значения медианы,
а другая - из значений меньших медианы. Предположим,
например, что имеется следующий набор значений систо-
лического давления крови (в мм Hg): 110,120,122,130,180.
В этом примере два значения больше 122, а два других -
меньше; таким образом, медиана равна 122 мм Hg, значе-
нию третьего наблюдения. Рассчитанная для данного ряда
величина средней арифметической (132 мм Hg) больше 4 из
5 значений и не может считаться типичной для указанных
данных.
В отличие от средней арифметической, медиана не так
сильно подвержена воздействию крайних значений распре-
деления. Например, приведенные ниже ряды данных разли-
чаются только последним наблюдением:
24, 25, 29, 29, 30, 31 средняя = 28,0, медиана = 29
24,25,29,29,30, 131 средняя = 44,7, медиана = 29
Различие в одном наблюдении значительно изменяет ве-
личину средней арифметической, но совершенно не меняет
значения медианы. Таким образом, использование медианы
предпочтительнее, если ряд наблюдений смещен в одну или
в другую сторону или если набор данных имеет несколько
очень больших или очень маленьких значений.
В случае, когда распределение включает нечетное число
наблюдений, медиана равна значению признака, находяще-
гося в середине ряда. При четном числе наблюдений, ме-
диана равна средней арифметической двух срединных зна-
чений признака.
Отношение между тремя указанными показателями цен-
тральной тенденции зависит от формы распределения. При
76
симметричном, нормальном распределении все три величи-
ны совпадают (рис. 16), при ассиметричном распределении-
не совпадают.
Как при положительных, так и при отрицательных асси-
метричных распределениях мода занимает самую высокую
точку на кривой распределения, средняя смещается книзу
или кверху под воздействием сравнительно малых или
больших значений; медиана располагается между средней и
модой, разбивая распределение на два равных поля под
кривой (рисунок 18).

Рисунок. 18. Показатели центральной тенденции при


положительной (А) и отрицательной ассиметрии (B)

Mo
Mo

Me

Me
μ

ПОКАЗАТЕЛИ ВАРЬИРОВАНИЯ, ИЛИ РАЗБРОСА

На рисунке 19 показаны два распределения А и В. Их


средние, медианы и моды совпадают и, подобно всем кри-
вым нормального распределения, они являются симметрич-
ными и одновершинными. Однако, несмотря на все указан-
ные сходства, эти два распределения различны и отличают-
ся друг от друга по степени вариабельности, т.е. по степени,
в которой их значения близки или далеки друг от друга.
Понятно, что значения, формирующие распределение А,

77
разбросаны в большей степени по сравнению со значения-
ми, формирующими распределение В.
Отсюда можно сделать вывод, что недостаточно описы-
вать нормальное распределение только посредством показа-
телей центральной тенденции. Необходимо также указывать
степень варьирования, или изменчивости величин признака
в изучаемом ряду данных.

Рисунок 19. Кривые нормального распределения с оди-


наковыми показателями центрального распределения,
но с разными показателями варьирования.

X = Me =
M

Величина вариабельности имеет очень большое значе-


ние. Подобно тому, как средние величины использовались
для описания местоположения пика распределения, показа-
тели варьирования указывают, насколько велик разброс
(варьирование) данных вокруг центрального значения. Так,
например, если указанные на рисунке 19 распределения
представляют уровни глюкозы натощак у больных сахар-
ным диабетом, принимающих два различных препарата,
предназначенных для гликемического контроля, то, понят-
но, что препарат В имеет преимущества по сравнению с
препаратом А, так как в распределении В меньше пациентов
с очень высокими или очень низкими значениями уровня
глюкозы, хотя и средний эффект препарата В такой же, что
и препарата А.

78
Существует несколько показателей варьирования, или
разброса: амплитуда, дисперсия, стандартное отклонение,
коэффициент вариации, квартили и межквартильный раз-
мах.
Амплитуда, или размах – самая простая из величин
варьирования. Амплитудой ряда данных называется разни-
ца между наибольшим (максимальным) и наименьшим (ми-
нимальным) значениями ряда. Следовательно, размах учи-
тывает значения только этих двух величин ряда. Например,
в приведенных ниже рядах данных:
24, 25, 29, 29, 30, 31
24, 25, 29, 29, 0, 31, 331
амплитуда равна, соответственно: 31- 24 = 7 и 331-24 =
307.
При использовании в качестве величины центральной
тенденции средней арифметической для описания вариа-
бельности признака используется дисперсия и стандартное
отклонение. Если же в качестве меры центральной тенден-
ции используется медиана, то вместе с ней, как правило, ис-
пользуются такие меры вариабельности признака, как квар-
тили и межквартильный размах, рассмотренные выше.
Стандартное отклонение (СО) является наиболее часто
используемой величиной варьирования и очень важной ста-
тистической величиной, важным элементом многих стати-
стических тестов. Оно показывает разброс величин призна-
ка вокруг средней, вычисленной для данного ряда наблюде-
ний. Обычно, стандартное отклонение, вычисленное из вы-
борки, обозначается аббревиатурой СО, популяционное
стандартное отклонение, показывающее степень варьиро-
вания величины переменной во всей популяции, обозна-
чают греческой буквой σ.
Какова же формула для вычисления СО? Если нам нужно
определить насколько величины признака в ряду данных
раэбросаны по отношению к вычисленной средней, можно
вычислить величину среднего отклонения, для чего из каж-

79
дой величины признака в представленном ряду данных ( X )
необходимо вычесть величину средней ( X ) , суммировать
все отклонения и разделить сумму на число наблюдений,
т.е.
∑(X − X ) .
n
Однако проблема заключается в том, что при четном
числе наблюдений сумма отклонений величин признака от
средней всегда равна 0. Эта проблема решается возведением
каждого отклонения в квадрат перед их суммированием.
Деление суммы квадратов отклонений на n-1, где n –
число наблюдений, позволит нам вычислить величину
варьирования, которая называется дисперсией и обознача-
ется символом s2:
s =
2 ∑ ( X − X )2
n −1
Объяснение причины, по которой сумма квадратов от-
клонений делится на n-1, а не на n, достаточно сложно и не
входит в программу данного курса. Отметим только, что
использование в знаменателе формулы величины n-1, назы-
ваемой степенью свободы, вместо n дает возможность более
точной оценки истинной величины варьирования величины
признака в популяции.
Однако дисперсия имеет величину размерности признака
в квадрате. Для того, чтобы вернуться к нормальной раз-
мерности, из дисперсии извлекается квадратный корень.
Квадратный корень из дисперсии называется стандарным
отклонением (СО):

CO = s =2 ∑(X − X ) 2

n −1
Рассмотрим все указанные вычисления на следующем
примере. В таблице 8 приведены данные изменения частоты
сердечных сокращений у 18 обследованных больных и все
этапы вычисления стандартного отклонения.

80
Таблица 8. Расчет стандартного отклонения изменений
частоты сердечных сокращений в обследованной вы-
борке из 18 больных

Пациент Х Х- Х (Х- Х)2


1 19.20 -29.57 874.19
2 51.90 3.13 9.82
3 33.10 -15.67 245.44
4 86.70 37.93 1438.94
5 29.10 -19.67 386.78
6 45.30 -3.47 12.02
7 14.40 -34.37 1181.07
8 67.10 18.33 336.11
9 64.80 16.03 257.07
10 15.90 -32.87 1080.22
11 75.80 27.03 730.80
12 42.60 -6.17 38.03
13 74.20 25.43 646.85
14 41.40 -7.37 54.27
15 85.70 36.93 1364.07
16 22.10 -26.67 711.11
17 64.90 16.13 260.28
18 43.60 -5.17 26.69
Сумма 877.80 9653.76
Средняя ариф- 48.77
метическая

Как видно из таблицы № 8, средняя величина изменения


частоты сердечных сокращений у группы обследованных
пациентов ( X ) составила 48.77. После чего из каждой ве-
личины X вычитается величина средней арифметической
( X − X ) . Каждое из полученных отклонений возводится в
квадрат ( X − X ) 2 . При суммировании всех квадратов от-
∑(X − X )
2
клонений получается величина , равная 9653.76.
81
Посредством деления указанной величины на степень сво-
боды, получим величину дисперсии, равную 567.87. Корень
квадратный из данной величины равен 23.83 и является
стандартным отклонением.
Таким образом, среднее отклонение изменения частоты
сердечных сокращений у группы обследованных составило
23.83. Полученная величина позволяет сказать, что большая
часть результатов располагается в пределах 23.83 от сред-
ней, т.е. между 24.94 (48.77-23.83) и 72.60 (48.77+ 23.83).
Что же понимается под «большей частью» результатов?
Вся площадь под кривой нормального распределения равна
100%. Статистики показали, что при нормальном распреде-
лении «большая часть» результатов, располагающаяся в
пределах одного стандартного отклонения по обе стороны
от средней, в процентном отношении всегда одна и та же и
не зависит от величины стандартного отклонения: она соот-
ветствует приблизительно 68% популяции (т.е. 34% ее эле-
ментов располагается слева и 34% — справа от средней):

Точно так же рассчитали, что 94.45% или приблизитель-


но 95% элементов популяции при нормальном распределе-
нии не выходит за пределы двух стандартных отклонений
от средней:

82
В пределах трех стандартных отклонений от средней
умещается почти вся популяция — 99,73%.

Коэффициент вариации (СV) – это процентное отноше-


ние стандартного отклонения к среднеарифметической ве-
личине: CO
CV = ⋅100%
X
Таким образом, в отличие от стандартного отклонения,
коэффициент вариации – это относительная мера варьиро-
вания признака. Используется коэффициент вариации для
сравнительной оценки степени вариабельности признаков,
имеющих различные единицы измерения, например, может
использоваться для оценки степени вариабельности концен-
траций лейкоцитов и натрия в крови. При величине коэф-
фициента вариации до 10% вариабельность признака счита-
ется слабой, при 10-20% - средней и при величине выше
83
20% - сильной. Сильное разнообразие признака свидетель-
ствует о малой представительности, соответствующей сред-
ней арифметической, и, следовательно, о нецелесообразно-
сти ее использования в практических целях.

Z-значения

При нормальном распределении отдаленность его любо-


го элемента от средней арифметической может быть выра-
жена в стандартных отклонениях, т.е. можно определить -
на расстоянии скольких стандартных отклонений от сред-
ней (выше или ниже) лежит та или иная величина. Это рас-
стояние, выраженное в стандартных отклонениях, известно
под названием z-значения элемента. Если данный элемент
лежит выше средней величины, он будет иметь положи-
тельное z-значение, если ниже средней величины - отрица-
тельное z-значение.
Формула для вычисления z-значения следующая:
Xi − µ
z=
σ
Например, если в популяции здоровых людей значения
систолического давления имеют нормальное распределение
с величиной средней арифметической, μ, равной 120 мм
рт.ст и стандартным отклонением, σ, равным 10 мм рт. ст.,
величина кровяного давления, равная 135 мм рт.ст., будет
лежать на 1.5 стандартных отклонений выше средней, сле-
довательно, ее z-значение будет равно +1.5 (135-120/10).
Величина кровяного давления, равная 115, лежит примерно
на 0.5 стандартных отклонений ниже средней арифметиче-
ской, значит ее z-значение равно – 0.5 (115-120/10).
С помощью таблицы z-значений (таблица 9) можно оп-
ределить удельный вес различных величин распределения,
лежащих ниже или выше любого данного z-значения, а не
только значений z, равных ±1, 2 и 3.

84
Из таблицы № 9 видно, например, что 0,309 (или прибли-
зительно 31%) величин распределения лежат выше значе-
ния z, равного +0,5. Так как нормальное распределение
симметрично, это также означает, что приблизительно 31%
величин распределения лежит ниже значения z, равного –
0,5. Значит, 31% указанной популяции имеет значение сис-
толического давления, равное 115 мм рт.ст.
Z-значения стандартизированы, поэтому они позволяют
сравнивать значения различных нормальных распределе-
ний. Например, с помощью соответствующих z- значений
можно сравнивать рост человека с его весом (при условии,
что оба эти признака являются элементами нормального
распределения).
Вместо использования z-значения для нахождения
удельного веса распределения, соответствующего опреде-
ленным величинам, мы может сделать обратное: использо-
вать z-значения для нахождения значения, которое делит
распределение на определенные проценты. Например, ис-
пользуя таблицу z-значений, мы можем определить значе-
ние z, которое отделяет 5% лиц в популяции с наибольшими
значениями систолического давления от остальных 95%
(т.е. группу, соответствующую 95-ому перцентилю или вы-
ше него). Величина 5%, или 0.05, в таблице № 9 соответст-
вует значению z, равному 1,645. Это означает, что соответ-
ствующая величина систолического давления лежит на
1,645 стандартных отклонений выше величины средней, т.е.
она равна μ + 1,645 σ = 120 + (1,645 х 10) = 136.45, или при-
близительно 136 мм рт.ст. Мы можем заключить, таким об-
разом, что в популяции 5% лиц с наибольшими значениями
систолического давления имеют значения указанного при-
знака выше 136 мм рт.ст. Значение z, которое отделяет
верхние 5% популяции от остальных 95%, не равно 2. Хотя
95% величин распределения и лежат в пределах 2 стандарт-
ных отклонений от средней, эти 95% приходятся на середи-
ну площади под кривой нормального распределения. На ос-
тавшиеся два хвоста по обе стороны от площади в 95% при-
85
ходится 5% всего распределения. Но так как кривая нор-
мального распределения симметрична, 2.5% распределения
лежат на 2 стандартных отклонения выше средней и 2.5%
распределения - ниже средней.

Таблица 9. Площадь под кривой нормального распреде-


ления

Площадь ме-
Площадь в Площадь в
жду значе-
z двух хвостах одном хвосте
ниями
(< -z и > +z) (< -z или > +z)
– z and +z
0.00 0.000 1.000 0.500
0.05 0.040 0.960 0.480
0.10 0.080 0.920 0.460
0.15 0.119 0.881 0.440
0.20 0.159 0.841 0.421
0.25 0.197 0.803 0.401
0.30 0.236 0.764 0.382
0.35 0.274 0.726 0.363
0.40 0.311 0.689 0.345
0.45 0.347 0.653 0.326
0.50 0.383 0.617 0.309
0.55 0.418 0.582 0.291
0.60 0.451 0.549 0.274
0.65 0.484 0.516 0.258
0.70 0.516 0.0484 0.242
0.75 0.547 0.453 0.227
0.80 0.576 0.424 0.212
0.85 0.605 0.395 0.198
0.90 0.632 0.368 0.184
0.95 0.658 0.342 0.171
1.00 0.683 0.317 0.159
1.05 0.706 0.294 0.147
1.10 0.729 0.271 0.136
1.15 0.750 0.250 0.125
1.20 0.770 0.230 0.115
1.25 0.789 0.211 0.106
86
1.28 0.800 0.200 0.100
1.30 0.806 0.194 0.097
1.35 0.823 0.177 0.089
1.40 0.838 0.162 0.081
1.45 0.853 0.147 0.074
1.50 0.866 0.134 0.067
1.55 0.879 0.121 0.061
1.60 0.890 0.110 0.055
1.645 0.900 0.100 0.050
1.65 0.901 0.099 0.049
1.70 0.911 0.089 0.045
1.75 0.920 0.080 0.040
1.80 0.928 0.072 0.036
1.85 0.936 0.064 0.032
1.90 0.943 0.057 0.029
1.95 0.949 0.051 0.026
1.96 0.950 0.050 0.025
2.00 0.954 0.046 0.023

Z–значения позволяют также определить вероятность то-


го, что случайно отобранный элемент будет иметь величину
признака выше или ниже указанного значения. Например,
если мы знаем, что 5% популяции имеют значения систоли-
ческого давления выше 136 мм рт.ст, тогда вероятность то-
го, что человек, случайно выбранный из данной популяции,
будет иметь величину систолического давления 136 мм
рт.ст., будет равна 5%. Подобным же образом мы можем
определить вероятность того, что человек, случайно вы-
бранный из популяции, будет иметь значение систолическо-
го давления меньше 100 мм рт.ст. Так как 100 лежит на 2
стандартных отклонения ниже средней величины (100-
120/10), т. е. соответствует значению z, равному -2, и мы
знаем, что примерно 95% распределения лежит в пределах
интервала ±2, следовательно 5% распределения лежат за
пределами этого интервала: 2.5% ниже величины z= -2,
2.5%- выше величины z=+2.

87
Таким образом, вероятность того, что случайно выбран-
ный из данной популяции человек будет иметь значение
систолического давления меньше 100 мм рт.ст., составит
2.5%.

ОТНОСИТЕЛЬНЫЕ ВЕЛИЧИНЫ, ИХ ГРАФИЧЕСКОЕ


ПРЕДСТАВЛЕНИЕ

Как уже было сказано, показатели центральной тенден-


ции почти всегда (в особенности средняя арифметическая)
используются для характеристики данных, представленных
количественными признаками. Медиана и мода могут ис-
пользоваться также для порядковых признаков.
Для характеристики данных, представленных качествен-
ными признаками, чаще всего используются относительные
величины, к числу которых относятся экстенсивные пока-
затели, интенсивные показатели и показатели соотноше-
ния.
Экстенсивный показатель - это показатель удельного ве-
са, доли части в целой совокупности, показатель распреде-
ления совокупности на составляющие ее части, т.е. показа-
тель структуры. Для его расчета необходимо иметь данные
о численности всей совокупности и составляющих ее частях
(или отдельной части этой совокупности). Рассчитывается
экстенсивный показатель обычно в процентах, при этом со-
вокупность в целом принимается за 100%, а отдельные час-
ти- за x. Формула для расчета экстенсивного показателя
следующая:
Экстенсивный показатель = Часть совокупности х 100%
Вся совокупность
Рассмотрим следующий пример вычисления экстенсив-
ного показателя.
В районе N в текущем году было зарегистрировано 500
случаев инфекционных заболеваний, из них: эпидемическо-
го гепатита - 60 случаев, кори - 100 случаев, прочих инфек-
88
ционных заболеваний - 340 случаев. В структуре инфекци-
онных заболеваний доля эпидемического гепатита составит
12% (60х100%/ 500), кори - 20% (100х 100%/500), прочих
инфекционных заболеваний - 68% (340х 100%/ 500).
Экстенсивные показатели могут быть использованы
лишь для анализа конкретной совокупности в конкретный
момент времени. Они не могут быть использованы для
сравнения различных совокупностей - это приведет к не-
правильным, ошибочным выводам.
Поскольку экстенсивный показатель – показатель стати-
ки, то графически он изображается только секторной или
внутристолбиковой диаграммами (рисунок 20), которые яв-
ляются разновидностями плоскостных диаграмм.
На секторной диаграмме окружность представляет всю
совокупность и берется равной 100%. Каждый сектор диа-
граммы представляет составную часть изучаемой совокуп-
ности. На внутристолбиковой диаграмме вся совокупность
представлена прямоугольником, высота которого принима-
ется за 100%. Удельный вес отдельных частей показывают
внутри прямоугольника, расположив части снизу вверх в
порядке убывания процентов, при этом группу «прочие за-
болевания» указывают последней.
Рисунок 20. Распределение инфекционных заболеваний
в районе N по нозологическим формам (в % к итогу). А –
секторная; B – внутристолбиковая.

89
Интенсивный показатель - показатель частоты встре-
чаемости, или уровня распространенности процессов, явле-
ний, совершающихся в определенной среде. Он показывает,
как часто встречается изучаемое явление в среде, которая
его продуцирует.
Примерами интенсивных показателей являются показа-
тели заболеваемости, смертности, рождаемости и т.д. Для
расчета интенсивного показателя необходимо иметь данные
об абсолютном размере явления и среды, его продуцирую-
щей. Абсолютное число, характеризующее размер явления,
делится на абсолютное число, показывающее размер среды,
внутри которой произошло данное явление, и умножается
на 100, 1000 и т.д:

Интенсивный показатель = Явление х 100 (1000 и т.д.)


Среда
Множитель зависит от распространенности явления в
среде: чем реже оно встречается, тем больше множитель, и
наоборот. На практике для вычисления некоторых интен-
сивных показателей множители являются общепринятыми
(так, например, большинство демографических показателей
и многие показатели заболеваемости вычисляются в расчете
на 1000 человек населения).
Определим на следующем примере показатель рождае-
мости. В городе А проживает 120 000 человек (среда). В
предыдущем году родилось 108 детей (явление). Показатель
рождаемости равен 9‰ (108х 1000/ 120 000).
Интенсивные показатели используются как для сравне-
ния, сопоставления распространенности изучаемого явле-
ния во времени, так и для сравнения, сопоставления часто-
ты встречаемости того же явления в один и тот же проме-
жуток времени, но на различных территориях, в различных
учреждениях и т.д.
Графически интенсивные показатели могут быть пред-
ставлены в виде линейной, радиальной и столбиковой диа-
грамм.
90
Линейная диаграмма обычно используется для представ-
ления динамики явления во времени. При этом время тра-
диционно откладывается по абсциссе, величина изучаемого
явления - по ординате (рисунок 21).
Рисунок 21. Заболеваемость и распространенность ту-
беркулеза в Армении (на 100 000 населения)

250
Частота встречае-

200
150
мости

100
50
0
70

80

88

92

00

02

05

07
19

19

19

19

20

20

20

20
Заболеваемость Распространенность

Радиальная диаграмма является разновидностью линей-


ной диаграммы, применяется для изображения динамики
явления за замкнутый цикл времени: сутки, неделя, месяц,
год. Радиальная диаграмма может использоваться, напри-
мер, для изображения сезонных колебаний инфекционной
заболеваемости, суточных колебаний числа вызовов скорой
помощи и т.д. Циклические процессы на этой диаграмме
представлены в виде круга, замыкающего цикл. Радиус кру-
га равен среднецикловому (например, среднемесячному)
уровню изучаемого явления (рисунок 22). Весь круг радиу-
сами делится на число секторов, соответствующее интерва-
лам времени изучаемого явления, и на каждом радиусе, со-
ответственно каждому интервалу времени откладывается
величина изучаемого явления. В результате получается
многоугольник неправильной формы, изображающий коле-
бания уровня изучаемого явления за данный период време-
ни.
91
Рисунок 22. Сезонные изменения числа случаев заболе-
ваний дизентерией за изучаемый год в городе N

Столбиковая диаграмма, как уже было сказано, может


использоваться для графического представления сведений о
значении количественного признака в сравниваемых груп-
пах, выделенных по номинальному признаку. Кроме того,
она может также использоваться для изображения интен-
сивных показателей, например, для представления частоты
встречаемости данного признака в сравниваемых группах в
данный период времени и для изображения частоты встре-
чаемости данного признака в одной группе в разные перио-
ды времени (рисунок 23). В последнем случае на оси абс-
цисс, как и в случае линейной диаграммы, откладываются
промежутки времени, а на оси ординат- величина изучаемо-
го явления в принятом масштабе.
Рисунок 23. Заболеваемость населения страны N скар-
латиной и коклюшем за предыдущий и изучаемый годы
(на 100 000 населения)

92
Показатель соотношения характеризует соотношение
между двумя не связанными между собой совокупностями,
одна из которых характеризуется наличием определенного
признака (а), а другая - его отсутствием (b). Формула для
вычисления показателя соотношения следующая:
Показатель соотношения = а / b.
Таким образом, отличительной особенностью показателя
соотношения является то, что в нем числитель никогда не
является частью знаменателя.
Показатель соотношения также иногда умножается на
множитель, равный 100, 1000, 10 000 и т.д.
Примерами показателей соотношения служат, например,
показатель обеспеченности населения больничными койка-
ми, врачами, средним медперсоналом, медицинской техни-
кой. Первый из указанных показателей вычисляется, на-
пример, следующим образом:
Показатель
Число больничных коек х 10 000
обеспеченности населения =
Численность населения
больничными койками

Рассмотрим следующий пример. Численность населения


в городе А составляла 120 000 человек, общее число тера-
певтических коек в городе- 300. Обеспеченность населения
терапевтическими койками составит 25 на 10 000 населения
(300 х 10 000 / 120 000).
Примером показателя соотношения служит также пока-
затель соотношения числа людей в группе, у которых дан-
ное событие имело место, к числу людей, у которых оно не
имело места, например соотношение числа больных и здо-
ровых в изучаемой группе. Указанный показатель использу-
ется для вычисления отношения шансов, показывающего
отношение шансов наступления события в группе случаев к
шансам наступления события в контрольной группе, рас-
смотренного в разделе дизайнов исследований.

93
СТАТИСТИЧЕСКИЕ ВЫВОДЫ

Мы уже рассматривали возможность использования z-


значений для определения вероятности того, что случайно
отобранный элемент будет иметь величину признака выше
или ниже указанного значения. Этот метод может быть ис-
пользован в случае нормального распределения, при нали-
чии информации о характеристиках всей генеральной сово-
купности (популяции), т.е. о популяционной средней ариф-
метической и стандартном отклонении.
Однако, на практике чаще всего исследователи не имеют
сведений о средней арифметической и стандартном откло-
нении, характеризующих всю популяцию, так как в реаль-
ной жизни их вычисление чаще всего бывает непрактич-
ным. Популяция может включать десятки тысяч и даже
миллионы людей, и их изучение связано со значительными
затратами. Поэтому обычно исследователи ограничиваются
изучением характеристик интересующего их явления в
сравнительно небольшой выборке, отобранной из интере-
сующей их популяции. Таким образом, все, что им бывает
известно - это данные о средней арифметической и стан-
дартном отклонении, полученные из выборочного исследо-
вания. Поэтому задачей исследователей чаще всего является
экстраполяция выводов, сделанных на основании изучения
выборки, на всю популяцию, из которой эта выборка была
взята.
Например, на основе испытания, проведенного с не-
большой группой больных, исследователи стремятся дока-
зать эффективность какого-либо нового лекарственного
препарата для всех пациентов, страдающих соответствую-
щей патологией. Такую экстраполяцию выводов называют
статистическими выводами (Inferential statistics). Известно
большое число статистических методов, позволяющих сде-
лать эти выводы.
Характеристики популяции (μ и σ), о которых делаются
выводы, принято называть параметрами, а характеристики,
94
полученные из выборочного исследования ( X и СО) - ста-
тистическими данными.
Выборка не может полностью соответствовать популя-
ции, из которой она была отобрана, и, следовательно, стати-
стические данные (например, выборочная средняя) не будут
в точности равными параметрам (популяционной средней).
Предположим, для изучения уровня холестерина в крови
у определенной популяции из нее была отобрана выборка
численностью в 1000 человек. Значение уровня холестерина
в крови в выборке составило 180 мг/100мл. Это, отнюдь, не
означает, что уровень холестерина в крови у людей во всей
изучаемой популяции обязательно совпадет с величиной,
полученной из выборочного исследования. При проведении
выборочных исследований обязательно бывает, так назы-
ваемая ошибка выборочного исследования, которая возни-
кает вследствие естественного варьирования величины при-
знака. Это варьирование и является причиной разницы ме-
жду значениями статистических данных, полученных из
выборочного исследования и параметрами, характеризую-
щими популяцию.
Представим себе, что из рассмотренной выше популяции
методом случайного отбора была произведена выборка в
1000 человек, у которой был вычислен средний уровень хо-
лестерина в крови. Обозначим среднюю арифметическую,
вычисленную для первой выборки ( X 1 ) . Предположим
также, что из той же популяции была произведена вторая
выборка в 1000 человек с последующим вычислением ее
средней арифметической ( X 2 ) . Будут ли вычисленные
средние арифметические совпадать? Разумеется, нет.
Вследствие ошибки выборочного исследования они будут в
определенной степени варьировать. Если изобразить все
выборочные средние в виде кривой распределения частот,
то окажется, что полученное распределение очень похоже
на нормальное. Это распределение получило название рас-
пределения средних случайных выборок. Если процесс
95
отбора выборок и размещение полученных средних на кри-
вой распределения будут продолжены до бесконечности,
обнаружится, что распределение, действительно, становится
нормальным. Кривая распределения выборочных средних
будет нормальной даже в том случае, если изучаемая попу-
ляция не имеет нормального распределения.
Этот принцип известен под названием центральной
предельной теоремы, которая гласит, что независимо от
формы распределения величин признака в популяции, из ко-
торой были отобраны выборки, кривая распределения вы-
борочных средних всегда будет оставаться нормальной.
Согласно центральной предельной теореме, с увеличением
размера выборок, кривая распределения выборочных сред-
них все более приближается к нормальной. Кроме того,
центральная предельная теорема гласит, что средняя всех
выборочных средних ( µ x ) равна истинной средней всей по-
пуляции (μ).
Подобно всем распределениям, распределение выбороч-
ных средних характеризуется не только средней, но и стан-
дартным отклонением. Здесь, как и везде, стандартное от-
клонение является мерой вариабельности, показывающей
разброс элементов распределения. Это особое стандартное
отклонение выборочных средних от истинной популяцион-
ной средней, показывающее их меру вариабельности, назы-
вается стандартной ошибкой средней и обозначается сим-
волом СОС или буквой m. Чем меньше величина стандарт-
ной ошибки, тем ближе средняя любой конкретной выборки
к популяционной средней.
Однако, выборочные средние характеризуются гораздо
меньшей вариабельностью, по сравнению с индивидуаль-
ными результатами, на основе которых они были получены.
Например, вычисленные средние уровня холестерина в кро-
ви в двух различных выборках, отобранных из одной и той
же популяции, будут иметь очень близкие значения. Во вся-
ком случае их значения будут намного ближе друг к другу,

96
чем значения уровня холестерина в крови у двух людей,
случайно отобранных из популяции.
Причина меньшей вариабельности выборочных средних,
по сравнению с индивидуальными значениями, очевидна.
Средняя арифметическая усредняет значения нескольких
индивидуальных значений. Даже при наличиии в выборке
нескольких крайних (выскакивающих) значений их влияние
будет в значительной степени сглажено воздействием нор-
мальных значений данной переменной, составляющих
большинство. Это позволяет делать о выборке достаточно
обоснованные заключения.
Рассмотрим следующий пример. Предположим нам не-
обходимо сравнить средний рост студентов и студенток-
медиков. Если мы просто отберем 1 студента и 1 студентку
и сравним их значения роста, то скорее всего рост мальчика
будет выше роста девочки. Однако, может статься так, что
выбранная студентка будет выше мальчика. Рост как сту-
дентов, так и студенток подвержен значительной вариации,
и кривые распределения их значений роста в значительной
степени наслаиваются друг на друга, если даже средний
рост мальчиков на 15 см выше роста девочек.
Любая попытка сделать заключение на основе выборок,
включающих одно единственное наблюдение, разумеется,
бесмысленна вследствие присущей переменным вариабель-
ности и, как следствие этого, ненадежности. Однако, было
бы очень удивительно, если бы мы, отобрав по 16 мальчи-
ков и девочек, вдруг выявили, что средний рост девочек
значительно выше среднего роста мальчиков. Даже при на-
личии среди отобранных студентов небольшого числа не-
обычно высоких девочек и мальчиков с необычно низким
ростом, их воздействие на значение выборочной средней
будет очень незначительным.
При повторном отборе нескольких выборок студентов и
студенток и вычислении выборочных средних мы заметим,
что их значения от выборки к выборке несколько варьиру-
ют. Однако благодаря эффекту сглаживания, воздействию
97
обсужденного явления усреднения эта вариация выбороч-
ных средних значительно сократится, и кривые распределе-
ния выборочных средних роста мальчиков и девочек почти
не будут наслаиваться друг на друга. Иными словами, в
сущности, любая отобранная выборка мальчиков и девочек
будет указывать на то, что, на самом деле, мальчики выше
девочек.
Таким образом, средние величины являются менее ва-
риабельными, по сравнению с индивидуальными величина-
ми переменных. Мы уже обсудили, что это уменьшение ва-
риабельности является прямым следствием усреднения ин-
дивидуальных значений в выборке. Однако возникает во-
прос, насколько эта вариабельность меньше и отчего зави-
сит ее величина.
Совершенно очевидно, что вариабельность выборочных
средних будет зависеть от вариабельности индивидуальных
значений переменной, на основе которых они были вычис-
лены. Чем больше вариабельность индивидуальных значе-
ний, тем более вариабельными будут значения средних
арифметических. Кажется одинаково обоснованным также
предположение о том, что вариабельность выборочной
средней должна зависеть от размера выборки, для которой
она была рассчитана. Выборка, включающая всего 2 наблю-
дения, лишь отчасти усредняет вариабельность индивиду-
альных значений и в значительно меньшей степени умень-
шает воздействие необычайно высоких или низких значе-
ний переменной. С другой стороны, выборка, включающая
100 наблюдений, обеспечивает значительно более надеж-
ную защиту средней от воздействия необычных значений, и
средняя, полученная из такой выборки, будет внушать го-
раздо больше доверия, чем средняя выборки, включающей
всего 2 наблюдения.
Таким образом, вариабельность выборочных средних,
или стандартная ошибка, зависит от двух величин - стан-
дартного отклонения и размера выборки. Отношение между
ними показано в нижеприведенной формуле:
98
σ
m= .
n
Как видно из формулы, стандартная ошибка равна стан-
дартному отклонению популяции, деленному на корень
квадратный из размера выборки. Чем больше значение
стандартного отклонения, т.е. чем больше наблюдения от-
личаются от средней, тем меньше уверенности в величине
средней и тем больше стандартная ошибка. Чем больше
объем выборки, тем больше уверенности в том, что полу-
ченная выборочная средняя будет близка к значению ис-
тинной популяционной средней и тем меньше, соответст-
венно, стандартная ощибка.
Так как кривая распределения средних случайных выбо-
рок, по определению, является нормальной, все известные
факты о нормальном распределении и z-значениях могут
быть использованы для определения вероятности того, что
выборка будет иметь значение средней выше или ниже оп-
ределенной величины, при условии, что выборка является
случайной.
Кроме того, так как независимо от формы распределения
величин переменной в популяции, из которой были произ-
ведены выборки, кривая распределения выборочных сред-
них всегда будет оставаться нормальной, то z-значения мо-
гут быть использованы вне зависимости от формы распре-
деления в популяции, при условии, опять-таки, что выборка
является случайной.
Методика определения выборочной средней очень схожа
с методикой определения отдельного элемента- она вклю-
чает нахождение z-значений, соответствующих интересую-
щей нас величине. Однако, вместо вычисления z-значения,
показывающего на сколько стандартных отклонений от-
дельный элемент лежит выше или ниже популяционной
средней, в данном случае z-значение будет показывать на
сколько стандартных ошибок данная выборочная средняя
лежит выше или ниже популяционной средней. Таким обра-
99
зом, формула для вычисления z-значения будет выглядеть
следующим образом:
X −µ
z=
m
Например, в популяции со средним значением систоли-
ческого давления 120 мм рт.ст и стандартным отклонением,
равным 10, вероятность того, что случайная выборка в 25
человек будет иметь значение среднего систолического дав-
ления выше 125 мм рт.ст., будет рассчитана следующим об-
разом:
X −µ
z= , где
m
σ 10
m= = =2
n 25
Отсюда:
X − µ 125 − 120
z= = = 2.5
m 2
Из таблицы 9 видно, что величине z, равной 2.5, соответ-
ствует вероятность 0.006.
Таким образом, вероятность того, что случайная выборка
численностью в 25 человек, выбранная из данной популя-
ции, будет иметь среднее значение систолического давле-
ния выше 125 мм рт.ст. составит 0.6%.
Возможно также определение того, какая из выборочных
средних имеет настолько большое значение, что встречает-
ся только в 5% или меньше выборок. Из таблицы 9 видно,
что значение z, которое отделяет нижние 95% распределе-
ния от верхних 5%, равно 1.645. Соответствующая величина
систолического давления будет равна: µ + 1.645 ⋅ m (т.е.
популяционная средняя + 1.645 стандарных ошибок). Так
как популяционная средняя равна 120, a стандартная ошиб-
ка равна 2, то значение систолического давления составит:
120+(1.645х2), или 123.29 мм рт.ст.
100
Возможно также определение интервалов, в пределах ко-
торых будут лежать 95% всех выборочных средних. Как и в
случае любого нормального распределения, 95% распреде-
ления выборочных средних будет лежать в пределах ± 2
СОС, т.е. в пределах z= ± 2.
Таким образом, 95% всех выборочных средних должны
лежать в пределах ± 2 СОС от популяционной средней. Как
видно из таблицы 8, точное z-значение, которое соответст-
вует средним 95% нормального распределения, равно ±
1.96, а не ±2. Таким образом, точные границы составят 120±
(1.96х 2) = 116.08 и 123.92 мм рт.ст.

ДОВЕРИТЕЛЬНЫЕ ГРАНИЦЫ

Мы уже говорили о том, что кривая распределения сред-


них случайных выборок является нормальной и, следова-
тельно, к ней применимы все известные факты о нормаль-
ном распределении и z-значениях. Это означает, что подоб-
но тому, как в случае нормального распределения величин
популяции 68% всех членов популяции будут иметь значе-
ния в пределах ± 1σ от средней, 95% - в пределах прибли-
зительно ± 2 σ (или точнее ±1.96), а 99,7% - в пределах ± 3
σ, так и на кривой распределения выборочных средних 68%
всех выборочных средних будут лежать в пределах ± 1
стандартной ошибки от популяционной средней, 95% - в
пределах приблизительно ± 2 стандартных ошибок и, нако-
нец, 99,7% - в пределах ± 3 стандартных ошибок.
Если 95% выборочных средних ( X ) лежат в пределах
приблизительно ± 2 стандартных ошибок от популяционной
средней (μ), то это значит, что и неизвестная популяционная
средняя, которая нас интересует, также будет лежать в этих
пределах. В то же время, если мы знаем, что 95% всех вы-
борочных средних будут иметь значения в пределах указан-
ного интервала, то мы также может утверждать, что на 95%
уверены в том, что истинная популяционная средняя лежит
101
в этом пределе. Разумеется, мы не можем делать такого ут-
верждения со 100% уверенностью, так как возможно, что
мы могли бы отобрать выборку с очень необычными и не-
типичными для данной популяции значениями. Но мы мо-
жем достигнуть большей степени уверенности посредством
вычисления предела, в котором могут располагаться 99.7%
всех выборочных средних (±3 стандартных ошибки). В этом
случае мы сможем сказать, что на 99.7% уверены в том, что
популяционная средняя лежит в этом пределе. Однако не-
достатком в этом случае является то, что границы средних
становятся более широкими и, следовательно, неопределен-
ными.
Этот интервал в пределах ± приблизительно 2 или 3
стандартных ошибок известен под названием доверитель-
ных границ. В медицинских исследованиях желательно
быть более уверенными в достоверности полученных выво-
дов, поэтому, как правило, доверительные границы берутся,
равными 95% или 99.7%.
Определение доверительных границ является методом
статистического вывода, так как для оценки величины по-
пуляционной средней (μ) используется выборочная сре дняя
( X ).
Например, если исследователь хочет определить истин-
ную величину систолического давления у большой популя-
ции, будет непрактичным измерение систолического давле-
ния у каждого отдельного члена популяции. Вместо этого
он отберет из популяции выборку и измерит величину сис-
толического давления только у членов выборки. Так как
выборка является действительно случайной, он может быть
на 95% уверен, что истинная средняя лежит в пределах ±
1.96 стандартных ошибок от выборочной средней. Напри-
мер, если выборочная средняя равна 90 мм рт.ст., а m = 3,
исследователь может быть на 95% быть уверенным, что ис-
тинная популяционная средняя лежит в пределах ± 1.96
стандартных ошибок от 90, т.е. 90 ± (1.96 х 3), или в интер-
вале от 84.12 до 95.88 мм рт.ст..
102
Таким образом доверительные границы (ДГ) равны вы-
борочной средней ± z-значение, найденное в таблице, ум-
ноженное на величину стандартной ошибки:

ДГ = X ± z ⋅ m

Разница между верхней и нижней доверительной грани-


цами называется доверительным интервалом (ДИ).
Понятно, что исследователи стремятся получить по воз-
можности более узкий доверительный интервал. Как видно
из формулы для вычисления ДИ, для того, чтобы ДИ был
уже (для данного доверительного уровня, например 95%),
стандартная ошибка должна быть поменьше. Как известно,
стандартная ошибка вычисляется по формуле:
σ
m= .
n
Так как σ – это популяционный параметр, величина ко-
торого исследователем не может быть изменена, единствен-
ным способом уменьшения стандартной ошибки является
увеличение размера выборки (n). Таким образом, еще раз
можно получить математическое обоснование того, почему
исследованиям, проводимым на больших выборках, можно
доверять больше, чем исследованиям с использованием ма-
лых выборок. В соответствии с формулой для вычисления
стандартной ошибки, ее величина обратно пропорциональ-
на корню квадратному из размера выборки. Таким образом,
ширина доверительного интервала уменьшится пропорцио-
нально корню квадратному из размера выборки.
Уже говорилось о том, что чем шире ДИ, тем менее точ-
ной является оценка популяционной средней. По определе-
нию, точность – это степень, в которой величина (например,
оценка популяционной средней) защищена от случайной
вариации.
Так как ширина ДИ уменьшается пропорционально кор-
ню квадратному из объема выборки, точность пропорцио-
нальна корню квадратному из объема выборки. Так, для то-
103
го, чтобы увеличить точность оценки вдвое, объем выборки
должен быть увеличен в 4 раза. Таким образом, увеличение
точности исследования требует несоразмерного увеличения
объема выборки, и, следовательно, исследование с высокой
точностью требует больших затрат денег и времени.
Точность следует отличать от состоятельности, которая
показывает степень, в которой оценка защищена от систе-
матической ошибки.
Хорошим способом демонстрации разницы между точ-
ностью и состоятельностью является пример метания дро-
тиков в центр мишени (рис. 24). На рисунке 24 A не наблю-
дается какой-либо тенденции к промахам дротиков в одном
направлении, а значит нет систематической ошибки. Одна-
ко, имеется значительная случайная вариация, так как дро-
тики не собраны в кучу. Следовательно, метание дротиков в
данном случае является неточным, но состоятельным.

Рисунок 24. Четыре варианта метания дротиков в ми-


шень

A B C D

На рисунке 24 B дротики также не попали в центр мише-


ни, но все они собраны в одну кучу, в левой верхней части
мишени. В этом случае метание дротиков является «при-
страстным» (имеется тенденция к попаданию в левую часть
мишени), однако нет значительной вариации, так как все
дротики попали в одну кучу, и, следовательно, метание от-
личается точностью.

104
На рисунке 24 C дротики не только разбросаны, но и
имеется систематическая ошибка в одном направлении. Та-
кое метание является неточным и несостоятельным.
На рисунке 24 D показан идеальный вариант метания
дротиков, когда все дротики попадают в центр мишени. Та-
кое метание характеризуется высокой точностью и состоя-
тельностью.

Рисунок 25. Четыре гипотетических распределения вы-


борочных средних

Рисунок 25 показывает тот же принцип на примере четы-


рех гипотетических распределений выборочных средних. О
точности полученных результатов можно судить по степени
узости каждой кривой, а о состоятельности - по расстоянию
между средней случайного выборочного распределения
средних и истинной популяционной средней (μ).
Распределение А на рисунке 25 показывает очень расши-
ренное распределение выборочных средних и, таким обра-
зом, обеспечивает неточную оценку истинной популяцион-
ной средней. В то же время его средняя совпадает с истин-
ной популяционной средней и, следовательно, обеспечивает
состоятельную оценку истинной популяционной средней.
Иными словами, оценка является беспристрастной, но она
подвержена значительной случайной вариации. Это тот ре-

105
зультат, который можно получить в случае, если выборки
являются случайными, но маленькими.
Рапределение B характеризуется узостью, которая обес-
печивает точную оценку истинной популяционной средней.
Вследствие небольшого значения стандартной ошибки ши-
рина доверительного интервала будет узкой. Однако, сред-
няя этого распределения лежит на значительном расстоянии
от истинной популяционной средней и, следовательно, бу-
дет обеспечивать «пристрастную» оценку истинной попу-
ляционной средней. Такой результат может быть получен
при большой, но не случайной выборке.
Распределение С является очень разбросанным (с боль-
шой величиной стандартной ошибки) и, следовательно, бу-
дет обеспечивать неточную оценку истинной популяцион-
ной средней. Его средняя лежит на значительном расстоя-
нии от истинной популяционной средней, и, значит, ее
оценка является также «пристрастной». Такой результат
может быть в случае, если отобранные выборки будут ма-
ленькими и не случайными.
Распределение D является узким и, следовательно, точ-
ным. Его средняя лежит в той же точке, что и истинная по-
пуляционная средняя и, следовательно, оно является и со-
стоятельным. Это распределение является идеальным и мо-
жет быть получено из случайных достаточно больших вы-
борок.
Таким образом, для достижения максимальной точности
и состоятельности результатов в статистических выводах
выборки должны быть большими и, действительно, случай-
ными.
t-значения

В рассмотренном выше примере для определения дове-


рительных границ использовались z-значения, которые по-
казывают на сколько стандартных ошибок отдалена выбо-
рочная средняя от популяционной средней. Однако, для оп-

106
ределения стандартной ошибки необходимо знать величину
популяционного стандартного отклонения (σ):
σ
m= .
n
На практике же, как правило, значение популяционного
стандартного отклонения исследователям неизвестно, един-
ственное что им бывает известно, это статистические дан-
ные, полученные из выборки: выборочная средняя и выбо-
рочное стандартное отклонение, которое используется для
вычисления так называемой, оценочной стандартной ошиб-
ки (чаще она называется просто стандартной ошибкой).
Формула для расчета оценочной стандартной ошибки
следующая:
CO
m=
n
где СО – стандартное отклонение, полученное из выбор-
ки, n – размер выборки.

При малых выборках (при числе наблюдений меньше 30)


в знаменателе вышеуказанной формулы будет n – 1.
В случаях, когда популяционное стандартное отклонение
неизвестно (а это бывает в большинстве случаев), для выво-
дов о средних, для определения доверительных границ
средних вместо z-значения используется значение t, иногда
называемое также t Стьюдента.
Подобно таблице z-значений, позволяющей определить
проценты нормального распределения, которые лежат выше
или ниже определенной величины z, существуют таблица t-
значений, которая обеспечивает такой же информацией для
любого значения t. Однако между таблицами существует
разница. В то время как значение z для любой доли распре-
деления остается постоянным (например, z-значение, рав-
ное ±1.96 всегда соответствует средним 95% распределе-
ния), значение t варьирует в зависимости от величины вы-
борки. В случае больших выборок (n> 100) значения z и t

107
одинаковы. С уменьшением объема выборки их значения
становятся все более отличными друг от друга.
В таблице t-значений (таблица 10) показаны значения t,
соответствующие различным площадям под кривой нор-
мального распределения для различных объемов выборок. В
крайнем левом столбце таблицы указаны объемы выборок, а
точнее, значения степеней свободы, которые при опреде-
лении доверительных границ определяются как n- 1. На-
пример, в случае если выборка включает 26 человек, значе-
ние t, соответствующее средним 95% распределения, будет
равно 2.060.
Таблица 10. Площадь под кривой нормального распре-
деления ( t-значения)
Площадь в обоих 0.1 0.05 0.01
хвостах
Площадь в одном 0.05 0.025 0.005
хвосте
Степень свободы
1 6.314 12.706 63.657
2 2.920 4.303 9.925
3 2.353 3.182 5.841
4 2.132 2.776 4.604
5 2.015 2.571 4.032
6 1.943 2.447 3.707
7 1.895 2.365 3.499
8 1.860 2.306 3.355
9 1.833 2.262 3.250
10 1.812 2.228 3.169
11 1.796 2.201 3.106
12 1.782 2.179 3.055
13 1.771 2.160 3.012
14 1.761 2.145 2.977
15 1.753 2.131 2.947
25 1.708 2.060 2.787
50 1.676 2.009 2.678
100 1.660 1.984 2.626
∞ 1.645 1.960 2.576
108
В качестве примера демонстрации использования t-
значений рассмотрим ранее рассмотренную задачу оценки
истинного популяционного систолического давления (с
достоверностью 95%) на основе выборочной средней. На
этот раз мы не будем делать нереальных предположений о
наличии информации о популяционной стандарной ошибке.
Предположим, что была отобрана выборка численностью
в 26 человек. Выборочное среднее значение систолического
давления в группе составило 90 мм рт.ст., а стандартное от-
клонение СО = 3 мм.рт.ст. Значит, оценочная стандартная
ошибка составит:
3
m= = 0.6
26 − 1
Для выборки численностью в 26 человек значение степе-
ни свободы будет равно 25. Это означает, что величину t,
соответствующую срединным 95% распределения, следует
искать на строке со степенью свободы, равной 25. Это вели-
чина 2.060, которая не очень отличается от величины z = 2,
соответствующей 95% распределения. Подставив все най-
денные значения в форму для определения доверительного
интервала, получим:
95% ДИ = 90± 2.060x0.6
95% ДИ (88.8; 91.2).

Таким образом, на основе полученных результатов с ве-


роятностью безошибочного прогноза 95%, можно заклю-
чить, что истинная средняя будет лежать в интервале от
88.8 до 91.2 мм рт.ст.
Средняя арифметическая не является единственным ста-
тистическим показателем, для которого можно подсчитать
доверительный интервал. Доверительные интервалы часто
вычисляются для интенсивных и экстенсивных показателей,
для показателя отношения шансов и других показателей в
тех случаях, когда нужно сделать выводы обо всей популя-
ции, исходя из характеристик выборки. Интерпретация до-
верительного интервала остается той же: чем уже интервал,
109
тем точнее наша оценка величины данной характеристики в
популяции и тем больше уверенность в том, что полученное
в исследовании значение характеристики будет близко к
значению популяционной характеристики.
Метод построения доверительного интервала для попу-
ляционного показателя будет обсужден позже.

ПРОВЕРКА ГИПОТЕЗ

Определение доверительных границ, при котором стати-


стические данные (например, выборочная средняя) с опре-
деленной степенью достоверности используются для оцен-
ки параметра (популяционной средней), являются одним из
важных методов статистических выводов. Однако более
важным и распространенным методом статистического ана-
лиза является проверка гипотезы.
Основными этапами проверки гипотезы о средней явля-
ются следующие:
1. Определение альтернативной и нулевой гипотез (HА и
HO).
2. Определение уровня значимости, α.
3. Вычисление значения t, которое соответствует выбо-
рочной средней (tвыч.).
4. Определение критических значений.
5. Сравнение вычисленного и критического значений t и
принятие или отклонение нулевой гипотезы.
Рассмотрим следующий пример. Допустим, что средний
уровень холестерина в крови у мужского населения Арме-
нии в возрастной группе от 20 до 74 лет составляет 211
мг/дл. Мы можем утверждать, что у части населения стра-
ны, страдающей гипертензией (субпопуляции), средний
уровень холестерина не может быть также равным 211
мг/дл. Это утверждение является гипотезой, которую нужно
проверить и называется она альтернативной. Обозначается
альтернативная гипотеза обычно как HА. Таким образом, в

110
данном случае альтернативная гипотеза будет утверждать,
что HА: μ ≠ 211 мг/дл.
Альтернативной гипотезе всегда противоречит, так назы-
ваемая нулевая гипотеза, которая обозначается Hо. Назы-
вается она нулевой, потому что в большинстве исследова-
ний указывает на отсутствие различий между сравниваемы-
ми популяциями. В нашем примере нулевая гипотеза будет
утверждать, что средняя холестерина у части населения,
страдающего гипертензией,равна популяционной средней,
или: Hо: μ = μо = 211 мг/дл.
Одним из способов проверки гипотез может служить оп-
ределение уровня холестерина у каждого человека, стра-
дающего гипертензией и вычисление субпопуляционной
средней, что требует значительных затрат времени и денег.
Однако, будет более практичным, если мы отберем из рас-
сматриваемой субпопуляции выборку, вычислим выбороч-
ную среднюю и затем на основании данных выборочного
исследования сделаем статистический вывод о всей субпо-
пуляции.
Предположим, мы отобрали из всей субпопуляции боль-
ных, страдающих гипертензией, выборку в 12 человек и вы-
числили выборочную среднюю. Далее мы должны сравнить
полученную выборочную среднюю с популяционной сред-
ней μ о. Если даже окажется, что нулевая гипотеза непра-
вильна и правдива альтернативная, т.е.μ ≠ 211 мг/дл, мы
зададимся вопросом, является ли эта разница между выбо-
рочной и популяционной средними закономерной или слу-
чайной? Мы уже обсуждали, что вследствие ошибки выбо-
рочного исследования величина выборочной средней всегда
будет иметь отклонение от величины популяционной сред-
ней (в данном случае субпопуляционной). Например, если
выборочная средняя уровня холестерина не равна 211 мг/дл,
то мы не можем сразу заключить, что нулевая гипотеза не-
правильна, так как величина ошибки выборочного исследо-
вания предусматривает возможность отбора из субпопуля-
ции выборки со значением средней, равной 211 мг/дл. Для
111
того, чтобы сделать вывод о правдивости или неправдиво-
сти нулевой гипотезы, мы должны решить. при каком зна-
чении разница между выборочной средней и величиной,
равной 211, является не случайной, а закономерной.
Это значение должно быть определено до отбора выбор-
ки и сбора данных. Вместо определения этой величины в
виде уровня холестерина, она определяется в виде вероят-
ности. Уровень вероятности, при котором нулевая гипотеза
считается неправильной, называется критерием, или уров-
нем значимости, и обозначается символом α.
Как показывает распределение выборочных средних, вы-
борочная средняя не может очень сильно отличаться от ве-
личины популяционной средней (в нашем случае субпопу-
ляционной средней). Если же она очень сильно отличается и
лежит ближе к одному из хвостов кривой, то это вызывает
подозрение, что выборка была отобрана не из популяции,
указанной в нулевой гипотезе, а из другой популяции.
Если вероятность получения выборочной средней, кото-
рая отличалась бы намного от вычисленной величины,
очень мала, нулевая гипотеза отвергается. Но что мы пони-
маем под очень маленькой вероятностью? По договоренно-
сти, вероятность эта должна составлять меньше 5%, или
0.05. Таким образом, нулевая гипотеза должна быть отверг-
нута в случае, когда вероятность того, что выборка могла
быть из популяции с величиной средней, равной μо, меньше
5%. Это подразумевает, что в 5% случаях, отвергая нулевую
гипотезу, мы можем совершать ошибку. Т.е, повторяя мно-
гократно тест на достоверность, в 5 случаях из 100 мы мо-
жем совершить ошибку. Иногда, для большей достоверно-
сти сделанных выводов, вероятность берется равной 0.01. В
этом случае вероятность допущения ошибки составляет 1 из
100 случаев.
Проверка статистической гипотезы может быть сравнена
с уголовным судопроизводством. Человек, признанный су-
дом виновным, в действительности может быть или на са-
мом деле виновным, или невиновным. После представления
112
фактов, имеющих отношение к данному случаю, суд при-
знает подсудимого виновным или невиновным. Если подсу-
димый невиновен, и суд выносит решение о его невиновно-
сти, выносится правильный вердикт. Вердикт считается
также правильным, если подсудимый виновен и осуждается
за совершение преступления.
Аналогично этому, истинная популяционная средняя
равна или не равна μ о. Мы предполагаем, что нулевая гипо-
теза (Hо: μ = μо) правдива и рассматриваем свидетельства,
представленные в виде выборки, размером n. На основе на-
ших результатов нулевая гипотеза отвергается или не от-
вергается.
В этом случае мы также имеем две ситуации, при кото-
рых сделанный вывод является правильным: 1) когда попу-
ляционная средняя равна μ о, и нулевая гипотеза не отверга-
ется; 2) когда популяционная средняя не равна μ о, и нулевая
гипотеза опровергается. Аналогично судебной системе,
процесс проверки гипотезы тоже не является совершенным.
В этом случае также могут быть совершены ошибки двух
видов. Мы можем или опровергнуть нулевую гипотезу, в то
время как на самом деле μ = μо, или принять нулевую гипо-
тезу, в то время как μ ≠ μ о. Более подробно об этих ошибках
мы поговорим позже.
Вероятность получения средней, которая намного бы от-
личалась от той, которая была получена при условии, что
нулевая гипотеза правильна, называется p-величиной теста.
Для решения вопроса о том, должна ли быть нулевая гипо-
теза отвергнута, вычисленная величина p сравнивается с за-
ранее определенной величиной α. Если величина p оказыва-
ется меньше величины α, нулевая гипотеза отвергается, ес-
ли больше величиныα – нулевая гипотеза принимается. В
дополнение к результатам исследования в литературе обыч-
но приводится также и полученная величина p.
Достижение статистически значимой величины p≤0.05
свидетельствует лишь о том, что полученный результат это
не простая случайность, а статистическая закономерность.
113
Вероятность того, что полученный результат – случайность,
составляет 5% или меньше. Необязательно, чтобы это зна-
чило, что результат достоверен в обычном понимании, т.е.
заслуживает внимания или имеет смысл. Это также не озна-
чает, что он обязательно клинически значим. Статистически
значимо то, что, действительно, существует с высокой ве-
роятностью. Клинически значимо то, что своими размерами
(например, величиной снижения летальности) убеждает
врача в необходимости изменить свою практику в пользу
нового образа действий.

Расчет значения t

Значение t, соответствующее выборочной средней (tвыч.),


показывает на сколько стандартных ошибок вычисленная
выборочная средняя лежит выше или ниже гипотетической
популяционной средней, и вычисляется по формуле:
X −µ
t=
m
Рассмотрим следующий пример. Предположим, из попу-
ляции младенцев была произведена выборка в 10 детей, ко-
торые получали антациды, содержащие алюминий. Популя-
ционная средняя и стандартное отклонение для уровня
алюминия в плазме крови детей неизвестны. Однако, мы
знаем, что выборочная средняя уровня алюминия в плазме
крови составила 37.20μг/л, а стандартное отклонение –
7.13μг/л. Средний уровень алюминия в плазме крови у по-
пуляции детей, не получавших антациды, составляет 4.13
μг/л. Могли ли данные нашей выборки быть полученными
из популяции со значением средней, равной 4.13μг/л?
Для ответа на этот вопрос мы проводим тест на проверку
гипотезы. Нулевая гипотеза в данном случае будет утвер-
ждать, что Hо: μ = 4.13г/л,μ а альтернативная: HА: μ≠
4.13μг/л. В качестве уровня значимости нами будет опреде-
лена величина α = 0.05. Так как мы не знаем значения поп у-

114
ляционного стандартного отклонения, мы используем не z-
тест, а t-тест:
X − µ 37.20 − 4.13
t= = = 14.67
m 7.13 / 10
Таким образом, выборочная средняя (37.20) на 14.7 стан-
дартных ошибок лежит выше гипотетической популяцион-
ной средней (4.13).

Определение критических значений

Следующим этапом проверки гипотезы является опреде-


ление критических значений. Мы уже обсуждали, что при
очень большом числе случайных выборок, отобранных из
определенной популяции, их средние формируют нормаль-
ное распределение- распределение случайных выборочных
средних, которое имеет среднее, равное величине популя-
ционной средней. Говоря о проверке нулевой гипотезы, мы
также сказали о том, что, по договоренности, нулевая гипо-
теза отвергается в том случае, когда, вероятность получения
выборочной средней, значительно отличающейся от вычис-
ленной величины, составляет меньше 5%, или 0.05.
Это означает, что если выборочная средняя оказывается в
области, в пределах которой будут находиться 95% всех
средних случайных выборок, нулевая гипотеза принимает-
ся. Эта область называется областью принятия. Если выбо-
рочная средняя лежит за пределами указанной области, в
области непринятия, то нулевая гипотеза отвергается и при-
нимается альтернативная гипотеза.
Пределы этой области называются критическими значе-
ниями и определяются с помощью таблицы t значений.
В рассматриваемом нами примере численность выборки
равна 10, следовательно, степень свободы будет равна 9 (n-
1). Как видно из таблицы t –значений, при значении степени
свободы, равной 9, значение t, которое отделяет 95% об-
115
ласть принятия от двух 2.5% областей непринятия, равно ±
2.262. Это критические значения и обычно обозначаются
символом tкрит. = ± 2.262.
Рисунок 26 показывает распределение средних случай-
ных выборок для нашей гипотетической популяции со
средней (μ), равной 4.13. На рисунке показана также о б-
ласть непринятия и принятия, отмеченная критическими
значениями t, которые были определены. Средняя гипоте-
тической популяции часто обозначается в виде μгипот.

Область
Рисунок 26. Распределение выборочных средних гипоте-
принятия
тической популяции со значением средней, равной 4.13.
(95%)
μo= 4.13

Область Область
непринятия непринятия
(2.5%) (2.5%)

tвыч. = + 14.67

tкрит = - 2.262 tкрит = + 2.262

Сравнение вычисленного значения t с его критически-


ми значениями и принятие или отвержение нулевой ги-
потезы
Если вычисленное значение t лежит за пределами крити-
ческих значений, то это означает, что оно лежит в одной из
двух областей непринятия.
Рисунок 26 показывает, что в этом примере значение t
лежит в пределах верхней области непринятия. Таким обра-
зом, нулевая гипотеза будет отвергнута и принята альтерна-
тивная гипотеза.
116
Объяснение этому заключается в следующем. Выбороч-
ная средняя настолько отличается от гипотетической попу-
ляционной средней, что вероятность того, что она будет по-
лучена, если нулевая гипотеза правильна, равна 0.05 (или
меньше 0.05). Можно сказать, что разница между выбороч-
ной средней и гипотетической популяционной средней яв-
ляется статистически значимой, и нулевая гипотеза отверг-
нута на уровне 0.05. Обычно об этом говорится в следую-
щей форме: “Гипотеза о том, что средний уровень алюми-
ния в плазме крови младенцев, получавших антациды, со-
держащие алюминий, составляет 14.3μг/л., отвергается, t =
14.67, df = 9, p≤ 0.05”.
Если бы вычисленное значение t лежало между двумя
критическими значениями в области принятия, то нулевая
гипотеза была бы принята. В таком случае можно было бы
заключить, что разница между выборочной и гипотетиче-
ской популяционной средней статистически не значима
(p>0.05).

Два типа ошибок

Никакой статистический критерий не дает абсолютной,


100% уверенности в том, что выводы не содержат ошибок.
Напротив, все статистические критерии позволяют утвер-
ждать что-либо лишь с некоторой вероятностью ошибки
вывода.
Во время проверки гипотез может возникнуть два типа
ошибок.
Достижение статистически значимой величины p≤0.05
означает, что исследователь может быть уверенным на 95%,
что результат получен не случайно. Хотя нулевая гипотеза
отвергается, имеется 5% шансов, что она правильна.
Отклонение нулевой гипотезы в случае, если она правильна,
называется ошибкой первого типа (Type I error). Вероят-
ность допущения ошибки первого типа, фактически, явля-
ется величиной p. Так как эта величина относится к крите-
117
рию α, она известна также под названием альфа ошибки (α
error). По договоренности, вероятность альфа ошибки
должна составлять меньше 5%, или 0.05.
Противоположной ошибке первого типа является ошиб-
ка второго типа (Type II error), которая заключается в при-
нятии нулевой гипотезы, тогда как, на самом деле, она не-
правильна. Эта величина также называется бетта ошибкой
(β error). Обычно приемлемой считается вероятность ошиб-
ки второго типа не выше 0.2.
В нижеприведенной таблице показаны четыре возмож-
ных варианта решений, которые могут быть сделаны на ос-
нове статистических тестов.

Действительная ситуация
Ho правильна Ho неправильна
Результат

Принятие Ho Нет ошибки Ошибка II типа


теста

(β ошибка)
Отклонение Ho Ошибка I типа Нет ошибки
(α ошибка)

Выбор подходящего уровня для критерия α зависит от


соответствующих последствий ошибок I или II рода. Если
исследователь желает с большей уверенностью утверждать,
что полученные результаты статистически значимы, то он
волен устанавливать очень высокий порог статистической
значимости, например, α = 0.01 или даже α = 0.001. Но в т а-
ком случае увеличивается вероятность ошибки второго ти-
па.

Статистическая чувствительность

Итак, для уменьшения возможности ошибки I типа мож-


но установить более высокий порог статистической значи-
мости, α. Как же уменьшить возможность возновения
ошибки II типа? Оказывается, сделать это не так просто. По
определению, ошибка II типа включает принятие непра-
118
вильной нулевой гипотезы, поэтому способность статисти-
ческого теста избежать возникновения ошибки II типа зави-
сит от его способности определять неправильность нулевой
гипотезы.
Это способность известна под названием статистиче-
ской чувствительности теста и равна 1- β. Таким образом,
статистическая чувствительность (power) – это вероятность
отклонения нулевой гипотезы, когда она, действительно,
ложна. По договоренности, статистическая чувствитель-
ность теста в исследовании должна быть равна 0.8 (т.е. β =
0.2). Иными словами, исследование, в котором вероятность
определения ложной нулевой гипотезы меньше 80%, счита-
ется неприемлемым.
Наиболее практичным и важным способом увеличения
статистической чувствительности теста является увеличе-
ние объема выборки. Это приведет к уменьшению величи-
ны стандартной ошибки и, следовательно, к увеличению
вычисленного значения t. Таким образом, при выборках
больших размеров вероятность отвержения нулевой гипоте-
зы больше, чем при небольших объемах выборки.
К увеличению статистической чувствительности теста
ведет также увеличение значенияα. Это ведет к уменьш е-
нию критических значений t и, таким образом, к увеличе-
нию площади непринятия, и к увеличению вероятности от-
клонения нулевой гипотезы.
Кроме того, статистическая чувствительность теста зави-
сит от величины разницы между выборочной средней и ги-
потетической средней, а также величины вариабельности
переменной в выборке.
Понятно, что чем больше разница между величинами
выборочной и популяционной средней, тем больше величи-
на критерия t, а, значит, и больше будет статистическая чув-
ствительность теста.
Чем меньше величина вариабельности переменной, т. е.
чем меньше величина стандартного отклонения, тем мень-
ше величина стандартной ошибки выборки. При уменьше-
119
нии величины стандартной ошибки увеличивается значение
критерия t и статистическая чувствительность.

Односторонние статистические критерии

Всегда до проверки гипотезы, еще до отбора случайной


выборки, бывает необходимо определить, должны ли мы
использовать двусторонние или односторонние статистиче-
ские критерии.
В рассмотренном нами примере проверки гипотезы о
возможности одинаковых средних уровней алюминия в
плазме крови младенцев, получавших алюминийсодержа-
щие антациды и младенцев, не получавших антациды, нами
был использован двусторонний статистический критерий
или, так называемый двусторонний тест (two-tailed, two-
sided test). В данном примере альтернативная гипотеза была
ненаправленной, она просто утверждала, что популяцион-
ная средняя уровня алюминия в плазме крови младенцев,
получавших алюминийсодержащие антациды не равна по-
пуляционной средней той же переменной у младенцев, не
получавших антациды (4.13μг/л), не уточняя является ли
популяционная средняя выше или ниже этой величины. Та-
ким образом, как показано на рисунке 26, имелись две об-
ласти непринятия, одна выше гипотетической популяцион-
ной средней, другая ниже.
Однако, вместо такого предположения мы могли сделать
более правдоподобное. Мы могли предположить, что попу-
ляционная средняя уровня алюминия в плазме крови мла-
денцев, получавших алюминий содержащие антациды
должна быть как минимум 4.13 μг/л. Нулевая гипотеза в
этом случае будет утверждать, чтоμ ≤ 4.13, а альтернати в-
ная гипотеза - что μ > 4.13. Альтернативная гипотеза в этом
случае является направленной, так как она уточняет, что
популяционная средняя лежит в определенном направлении
по отношению к нулевой гипотезе.

120
Рисунок 27. Области принятия и непринятия для одно-
стороннего t-теста
μo= 4.13

Область
непринятия
Область (5%)
принятия
(95%) tвыч. = + 14.67

tкрит = + 1.833

В подобных ситуациях на кривой распределения выбо-


рочных средних уже не будет двух областей непринятия.
Как показывает рисунок 27, в этом случае имеется только
одна область непринятия. Если величина α остается равной
0.05, область принятия (область, в которой лежат 95% всех
возможных выборочных средних, отобранных из гипотети-
ческой популяции) расширяется кверху с самого нижнего
конца распределения, оставляя только одну область непри-
нятия – верхние 5% кривой. Таким образом, область непри-
нятия в этом случае лежит только в одном хвосте распреде-
ления, а не в обоих хвостах.
Шаги по проверке гипотезы по критерию t при направ-
ленной проверке те же, за исключением того, что критиче-
ское значение t в этом случае другое. Критическое значение
в этом случае отделяет верхние 5% распределения от ниж-
них 95%, вместо деления средних 95% от двух хвостов, ка-
ждый из которых составляет 2.5%. Соответствующий стол-
бик в таблице 10 показывает, что критическое значение t в
этом случае (для той же степени свободы = 9) равно + 1.833,
а не ± 2.262.
121
Как видно на рисунке 27, это новое критическое значение
связано только с одним хвостом распределения. Использо-
вание этой величины включает, таким образом, выполнение
одностороннего статистического теста (one-tailed, one-
sided test) вследствие того, что альтернативная гипотеза яв-
ляется направленной.
В нашем примере вычисленная величина t, как и в случае
выполнения двустороннего теста, лежит в области неприня-
тия. Однако, нередко при выполнении для одних и тех же
данных двустороннего теста вычисленный критерий попа-
дает в область принятия, тогда как при выполнении одно-
стороннего теста он оказывается в области непринятия.
Иными словами, нередко статистически незначимые ре-
зультаты в двустороннем тесте становятся статистически
значимыми при выполнении одностороннего теста. Поэто-
му односторонние тесты должны использоваться как редкое
исключение в продемонстрированных случаях. Даже если
исследователь убежден, что разница может наблюдаться
только в одном направлении, в некоторых случаях это не
дает ему права использовать односторонний статистический
критерий. Например, при испытании нового лекарственного
препарата, даже если исследователь убежден, что препарат
окажет благоприятное воздействие на состояние здоровья
больного, это не позволяет ему использовать односторон-
ний тест. Его использование означало бы, что исследова-
тель игнорирует способность препарата ухудшать состоя-
ние больных, что не допускается в медицинских исследова-
ниях.

СРАВНЕНИЕ ДВУХ СРЕДНИХ

В предыдущем разделе мы рассмотрели возможность


сравнения средней одной популяции с какой-то известной
величиной μо. Однако, гораздо чаще задачей биомедицин-
ских исследований является сравнение двух разных популя-
ционных средних, которые не известны. При этом исследо-
122
вателя интересует вопрос, является ли различие между дву-
мя популяциями случайным или достоверным.
Для ответа на этот вопрос также используется проверка
гипотезы, которая во многих отношениях очень схожа с
проверкой гипотезы об одной популяционной средней.
Основными этапами проверки гипотезы и в этом случае
являются: формулировка нулевой и альтернативной гипо-
тез, вычисление статистического критерия t (z), определе-
ние критических значений, сравнение вычисленного и кри-
тического значений t (z) и принятие или отклонение нуле-
вой гипотезы.
Нулевая гипотеза в этом случае будет утверждать, что
обе группы были отобраны из популяции с одной и той же
средней, иными словами, обе выборки, в сущности, взяты из
одной и той же популяции и, следовательно, между ними
нет никакой разницы. Альтернативная гипотеза будет ут-
верждать, что две популяционные средние различны:
Ho: μ1 = μ2
Ho: μ1 ≠ μ.
Очень широко проверка гипотезы о двух средних ис-
пользуется при проведении клинических испытаний, на-
пример, при сравнении средних экспериментальной и кон-
трольной групп при сравнении эффективности двух различ-
ных лекарственных препаратов, двух схем лечения и т.д.
Обсуждая дизайны исследований с использованием кон-
трольной группы, мы упомянули, что она может быть раз-
ной. Если включение пациента в нее не обусловлено вклю-
чением другого пациента в опытную группу, то это случай
независимых выборок (independent samples). Если в экспе-
риментальной и контрольной группах используются одни и
те же люди, но в разное время (например, до получения
курса лечения и после), то это связанные выборки (paired
samples). Если паценту экспериментальной группы подби-
рается пара равного возраста и пола в контрольной группе,
то это тоже вариант связанных выборок. (matched pairs).
Важно, что статистические критерии, предназначенные для
123
связанных выборок, не должны использоваться для незави-
симых выборок и наоборот. В данном пособии приведен
только метод проверки гипотезы двух средних в случае не-
связанных выборок.

Сравнение двух средних в случае несвязанных выборок

Рассмотрим следующий пример. 50 больных с гипертен-


зией были поровну разбиты на две группы: эксперимен-
тальную и контрольную. В экспериментальной группе
больные получали диуретик в комбинации с другими анти-
гипертензивными препаратами, в то время как в контроль-
ной группе они получали только диуретик. После одного
месяца лечения в экспериментальной и контрольной груп-
пах были вычислены значения среднего систолического
давления и стандартные отклонения, которые составили:
X экс = 93 ммрт.ст., СОэкс. = 20.2
X контр. = 117 ммрт.ст., СО = 21.6
Начинаем проверку гипотезы с формулирования нуле-
вой и альтернативных гипотез. Нулевая гипотеза будет ут-
верждать, что никакой связи между схемой лечения и уров-
нем артериального давления нет и, следовательно, в обеих
группах средний уровень давления больных после получен-
ного лечения должен быть одинаков. Альтернативная гипо-
теза будет утверждать обратное: между указанными пере-
менными существует связь, и, следовательно, средние зна-
чения артериального давления у больных двух сравнивае-
мых групп будут различны.
Следующим этапом является вычисление соответствую-
щего статистического критерия.
При сравнении двух средних чаще всего вычисляется t-
критерий (t-тест), так как обычно популяционные диспер-
сии бывают не известны. В очень редких случаях, при нали-
чии сведений о величинах дисперсии переменной в двух
сравниваемых популяциях, может использоваться z-тест.
124
Формула для вычисления t-критерия в случае несвязан-
ных выборок следующая:
( X1 − X 2 ) ( X1 − X 2 )
t= = ,
m1 + m2
2 2 2 2
s1 s2
+
n1 n2
где X 1 и X 2 - средние величины артериального давления
у больных экспериментальной и контрольной групп после
лечения, s12 и s22 – соответственно, их дисперсии, n1 и n2 -
численность больных в группах.
Подставив все данные в формулу, мы получим:
117 − 93
t= = 4.05.
470 409

25 25
Указанная формула для вычисления t-критерия исполь-
зуется во всех тех случаях, когда при сравнении двух сред-
них делается предположение о неравенстве двух популяци-
онных дисперсий. В случае, когда допускается предположе-
ние об их равенстве, формула для вычисления t-критерия
включает величину суммарной дисперсии (pooled variance)
переменной в обеих сравниваемых популяциях.
На следующем этапе определяются критические значе-
ния t. Для пользования таблицей t-значений нам и в этом
случае необходимо вычислить значение степени свободы.
Формула для ее вычисления в этом случае равна df= n1 + n2
– 2, т.е. 25+25 - 2 = 48.
В таблице t–значений мы не находим степени свободы,
равной 48, но есть близкое значение df = 50. Как видно из
таблицы t–значений, при выполнении двустороннего теста
значению степени свободы, равному 50 соответствует кри-
тическое значение t, равное ± 2.009. Вычисленная нами ве-
личина t(4.05) больше критической, и, значит, лежит в пре-
делах области непринятия.
Таким образом, нулевая гипотеза о том, что средние
уровни артериального давления у больных в двух сравни-
125
ваемых группах одинаковы, должна быть отвергнута и при-
нята альтернативная гипотеза.
Для проверки нулевой гипотезы могут использоваться
три метода. Один из них – это уже обсужденный метод про-
верки гипотезы по определению критических значений и
сравнению вычисленной величины tвыч. с табличной tкрит.
Кроме того, проверка нулевой гипотезы может прово-
диться посредством вычисления величины p, соответст-
вующей величине tвыч.. Например, в рассмотренном нами
примере величина tвыч. оказалась равной 4.05. При степени
свободы, равной приблизительно 50, и выполнении двусто-
роннего теста, вычисленной величине соответствует значе-
ние p < 0.01, что меньше допустимого p≤ 0.05. Таким обра-
зом, полученный результат совпадает с результатом сравне-
ния по критическим значениям.
Третьим методом проверки гипотезы является построе-
ние доверительных границ для разности между популяци-
онными средними. На основе этого метода нулевая гипотеза
должна быть отклонена в случае, если рассчитанный дове-
рительный интервал различия между мопуляционными
средними не включает 0.

ДИСПЕРСИОННЫЙ АНАЛИЗ

Нередко задачей биомедицинских исследований является


сравнение более чем двух групп, например, сравнение ре-
зультатов лечения трех групп пациентов, получавших лече-
ние по различным схемам. Если каждая из сравниваемых
групп включает пациентов молодого и пожилого возраста,
исследователь может также провести сравнение между воз-
растными группами, и в итоге получит 6 сравниваемых
групп, три группы с различными схемами лечения с двумя
возрастными группами в каждой из них. Нулевая гипотеза в
этом случае будет утверждать, что:
Ho: μ1= μ2=μ3=μ4=μ5=μ6.

126
Теоретически эта гипотеза может быть проверена с ис-
пользованием множественного t-теста. Однако, этот метод
имеет ряд недостатков. Во-первых, он требует больших за-
трат времени, так как включает проведение 15 отдельных t-
тестов. Кроме того, статистическая чувствительность каж-
дого теста будет сравнительно низкой, а вероятность воз-
никновения ошибки I типа будет высокой.
К счастью, имеется статистический метод, который пре-
одолевает все эти проблемы. Это - дисперсионный анализ
(ANOVA, аббревиатура от Anlysis of Variance), который в
настоящее время используется достаточно часто. В сущно-
сти, рассмотренный нами t-тест является частным случаем
дисперсионного анализа, позволяющим выявить различия
только между двумя группами. Дисперсионный анализ – это
более общий случай исследования различий, когда возмож-
но, сравнение более чем двух групп. В случае простого
сравнения двух групп результат применения дисперсионно-
го анализа совпадает с результатом сравнения по t-
критерию.
Вычисления, лежащие в основе дисперсионного анализа
достаточно длинны и не входят в данный курс. Однако,
вкратце суть дисперсии можно свести к следующему. Дис-
персия характеризует разброс, или вариабельность, значе-
ний переменной. В любой совокупности результатов иссле-
дования, например, в результатах, полученных от использо-
вания трех различных схем лечения у молодых и пожилых
пациентов, обсужденных ранее, будет иметь место вариа-
бельность изучаемой переменной. Это общая вариабель-
ность переменной обусловлена двумя компонентами. Во-
первых, она обусловлена вариабельностью, возникающей
вследствие известной разницы между группами (межгруп-
повая вариабельность), в нашем примере, разницей между
различными схемами лечения, а также разницей между воз-
растными группами. Вторым компонентом, обусловливаю-
щим общую вариабельность переменной в результатах ис-
следования, является обычная вариабельность изучаемой
127
переменной в пределах каждой группы (внутригрупповая
вариабельность), возникающая вследствие индивидуального
различия между пациентами, ошибки выборочного иссле-
дования и т.д.
Дисперсионный анализ дает возможность определить,
является ли выявленная в результатах исследования общая
вариабельность в значительной степени обусловленной
изучаемым различием между группами. Иными словами,
дисперсионный анализ позволяет ответить на вопрос, при-
надлежат ли сравниваемые группы к одной и той же попу-
ляции или они отобраны из различных популяций. Если все
выборки принадлежат одной и той же популяции, то меж-
групповая вариабельность должна быть не больше, чем ва-
риабельность переменной внутри самих выборок. Если же
сравниваемые группы принадлежат разным популяциям и,
следовательно, между ними существует значительное раз-
личие, то дисперсия между различными группами должна
быть значительно больше, по сравнению с колебанием ве-
личины переменной в пределах отдельных групп.
Если исследование было проведено правильно, это раз-
личие между изучаемыми группами должно быть вследст-
вие использования различных схем лечения или различия в
возрасте пациентов.
Таким образом, дисперсионный анализ позволяет опре-
делить является ли дисперсия выборочных средних относи-
тельно общей средней для всей совокупности данных дос-
товерно большей, по сравнению с дисперсией переменной
относительно средней в пределах каждой выборки. Делает-
ся это посредством вычисления простого соотношения, на-
зываемого F-соотношением (F-ratio):

межгрупповая дисперсия
F=
внутригрупповая дисперсия

Однако, начинается статистический анализ, как всегда, с


формулирования нулевой и альтернативной гипотез. Нуле-
128
вая гипотеза будет утверждать, что между изучаемыми пе-
ременными, в нашем примере - между результатом лечения
и использованной схемой лечения, а также между результа-
том и возрастом пациентов, связи нет. Альтернативная ги-
потеза будет утверждать обратное.
На втором этапе вычисляется F-соотношение, показы-
вающее отношение межгрупповой дисперсии к внутригруп-
повой.
Затем, как обычно, при проверке гипотезы определяются
критические значения для F. Полученная величина Fвыч.
сравнивается с критическим значением Fкрит., найденным в
таблице F-значений. Как и в случае t-теста, если вычислен-
ное значение превышает табличное значение, соответст-
вующее определенной величине α, то нулевая гипотеза
должна быть отвергнута.
Таким образом, F-тест – это тест соотношения диспер-
сий, и он используется в дисперсионном анализе для выяс-
нения, существует ли статистически значимое различие ме-
жду изучаемыми группами. Иными словами, существуют
ли, кроме обычной внутригрупповой дисперсии перемен-
ной, значительные источники ее дисперсии в совокупности
данных.
F-тесты иногда используются отдельно от метода дис-
персионного анализа для проверки гипотез о различии меж-
ду дисперсиями переменной в различных группах. Напри-
мер, может возникнуть необходимость сравнения диспер-
сии уровня гемоглобина в крови больных, получавших раз-
ные препараты против анемии.
Если многочисленные сравниваемые группы отличаются
друг от друга только по одной переменной, например, по
виду использованной схемы лечения, то используется од-
номерный дисперсионный анализ (One-way ANOVA).
Если же сравниваемые группы отличаются одновременно
по двум переменным, используется двухмерный дисперси-
онный анализ (Two-way ANOVA). Например, этот стати-
стический метод анализа понадобится, если группы пациен-
129
тов отличаются не только по виду использованной схемы
лечения, но и по возрасту. В этом случае ANOVA покажет
не только то, имеется ли важный источник вариабельности
в результатах, но и то обусловлено ли это воздействием од-
ной переменной, другой переменной или обеих переменных
вместе взятых. В случае установления факта воздействия
только одной из изучаемых переменных, говорят об основ-
ном эффекте. Eсли значительным является эффект от ком-
бинированного воздействия двух переменных, то это эф-
фект взаимодействия. Эффект взаимодействия возникает в
случаях, когда эффект обеих переменных, вместе взятых,
отличается от суммы их индивидуального воздействия.
При необходимости изучения различий между группами,
отличающимися по нескольким переменным, может быть
использован многофакторный дисперсионный анализ (Mul-
tifactor ANOVA).

СРАВНЕНИЕ ПОКАЗАТЕЛЕЙ

В предыдущих разделах мы обсуждали использование


методов статистических выводов для количественных пе-
ременных. Однако задачей биомедицинских исследований
может быть не только оценка достоверности полученных
выборочных средних или сравнение средних величин.
Очень часто в биомедицинских исследованиях приходится
иметь дело с качественными переменными и, соответствен-
но, с необходимостью оценки характеризующих их выбо-
рочных показателей.
Например, мы можем быть заинтересованы в оценке
удельного веса пациентов, выживших в течение 5 лет с мо-
мента выявления у них рака легкого. В данном случае мы
имеем дело не с количественным, а с качественным призна-
ком, измеряемым в шкале номиналов (выживание в течение
5-летнего периода).
Удельный вес выживших пациентов определяется как
обычный интенсивный показатель:
130
P = Явление х 100 (1000 и т.д.) ,
Среда
где явление - это число пациентов, выживших в течение
5-летнего периода, среда- это общее число изученных паци-
ентов, у которых был диагностирован рак легких.
Разумеется, и в этом случае мы не станем изучать выжи-
ваемость всех больных, у которых был диагностирован рак
легких, а, как обычно, проведем выборочное исследование.
Следовательно, полученный показатель будет показывать
частоту встречаемости изучаемого явления в изученной вы-
борке, а не во всей популяции интересующих нас больных.
Как обычно, при проведении выборочных исследований,
у нас возникнет ошибка выборочного исследования. Как и в
случае с выборочными средними, вследствие ошибки выбо-
рочного исследования выборочные показатели будут в оп-
ределенной степени варьировать вокруг истинного популя-
ционного показателя. Мера вариабельности выборочных
показателей называется стандартной ошибкой показателя и
обозначается символом СОП или буквой mp. Вычисляется
она по формуле:
p ⋅ (1 − p )
mp = ,
n
где p- показатель, полученный из выборочного исследо-
вания, показывающий удельный вес выживших пациентов,
(1-p) – это удельный вес пациентов, скончавшихся в течение
наблюдаемого периода времени, n – объем выборки.
Формула для построения доверительных границ для по-
пуляционного показателя очнь схожа с формулой, исполь-
зованной нами для построения ДГ для популяционной
средней:
95% ДИ = p ± z ⋅ m

Интерпретация полученных результатов в этом случае


будет такой же, что и при построении доверительных гра-
ниц для популяционной средней.

131
Задачей исследования может быть также сравнение двух
популяционных показателей. Как и в случае сравнения по-
пуляционных средних, в данном случае также используется
проверка гипотезы со всеми уже известными этапами:
1. Определение альтернативной и нулевой гипотез (HА и
HO).
2. Определение уровня значимости, α.
3. Вычисление значения z, которое соответствует выбо-
рочному показателю (pвыч.).
4. Определение критических значений.
5. Сравнение вычисленного и критического значений z и
принятие или отклонение нулевой гипотезы.
Нулевая и альтернативная гипотезы в этом случае запи-
сываются следующим образом: Ho: π1 = π2, HA: π1 ≠ π2, где –
π1 и π2 - это сравниваемые популяционные показатели.
Вместо t-теста в данном случае выполняется z-тест, т.е.
вычисляется критерий z по формуле:
p1 − p2
z= .
p1 ⋅ (1 − p1 ) p2 (1 − p2 )
+
n1 n2
Затем, как обычно, при проверке гипотезы определяются
критические значения для z. Полученная величина zвыч.
сравнивается с критическим значением zкрит., найденным в
таблице z-значений. Если вычисленное значение превышает
табличное значение, соответствующее определенной вели-
чине α, то нулевая гипотеза отклоняется и принимается аль-
тернативная.

НЕПАРАМЕТРИЧЕСКИЕ ТЕСТЫ

Обсужденные в предыдущих главах t-, z- и F тесты, объ-


единяют под названием параметрических тестов, так как
они используются для проверки гипотез, относящихся к по-
пуляционным параметрам (к популяционной средней или
популяционной дисперсии). Кроме того, их гипотезы каса-
132
ются переменных, которые измеряются в интервальных
шкалах и шкалах соотношения. Все эти тесты требуют
предположения о нормальном распределении популяцион-
ных данных.
В противоположность им непараметрические тесты не
имеют всех вышеуказанных особенностей. Они не требуют
предположения о популяционных характеристиках и о нор-
мальности распределения популяционных данных. Поэтому
их также называют тестами, свободными от параметров или
свободными от распределения. Используются непараметри-
ческие тесты для тестирования переменных, измеряемых в
номинальной или порядковой шкалах. Их также используют
в случаях, когда объемы данных недостаточны для приме-
нения параметрических тестов.
Основным недостатком непараметрических тестов явля-
ется то, что по своей мощности они уступают параметриче-
ским, поэтому в случаях когда можно использовать пара-
метрический тест, использовать непараметрический тест не
следует.

ПРОВЕРКА ПО КРИТЕРИЮ ХИ-КВАДРАТ

Наиболее часто используемым из непараметрических


тестов является вычисление критерия соответствия, или
проверка по критерию хи-квадрат (Chi-square test). Исполь-
зуется проверка по критерию хи-квадрат для тестирования
гипотез о наличии связи между переменными, измеряемыми
в номинальной шкале. Одним из преимуществ этого стати-
стического метода анализа является то, что он позволяет
проводить сравнения между двумя и более несвязанными
между собой совокупностями.
Так же, как и другие тесты по проверке гипотез, этот ста-
тистический метод анализа включает следующие основные
шаги: определение нулевой и альтернативной гипотез, вы-
числение по стандартной формуле статистической величи-
ны (χ2) и сравнение ее с критическим значением (соответст-
133
вующим выбранному значению α), приведенным в табл ице
критериев соответствия, вывод.
Альтернативная гипотеза в данном случае говорит о на-
личии связи между изучаемыми переменными, нулевая ги-
потеза – об отсутствии указанной связи. Особенностью это-
го метода анализа является вычисление так называемых
ожидаемых величин на основе предположения о том, что
нулевая гипотеза правдива. Вычисляемая статистическая
величина (χ 2), которая называется критерием соответствия,
показывает различие между фактическими данными, полу-
ченными в результате исследования и ожидаемыми данны-
ми, полученными на основе предположения о правдивости
нулевой гипотезы.
Для представления данных при этом методе анализа ис-
пользуются так называемые таблицы сопряженности. Таб-
лица выражает идею о том, что одна переменная (например,
излечение и отсутствие излечения) может быть сопряжена с
другой переменной (например, вид антибиотика, использо-
ванного пациентом).
Проверка по критерию хи-квадрат является довольно
мощным статистическим тестом, однако и у него есть свои
ограничения. Для использования данного метода статисти-
ческого анализа данные исследования должны быть пред-
ставлены в виде абсолютных величин, а не показателей.
Данный метод анализа не может быть использован, если ве-
личина ожидаемых данных в какой-либо одной из катего-
рий меньше 5. Для решения этой проблемы было предложе-
но несколько методов, из которых наиболее часто использу-
ется поправка Йетса на непрерывность и точный критерий
Фишера.
Рассмотрим следующий пример. В приведенной ниже
таблице представлены результаты выборочного исследова-
ния по изучению взаимосвязи между тромбозом шунта и
применением аспирина.

134
Таблица 11. Тромбозы шунта при приеме плацебо и ас-
пирина
Общее число Тромбоз есть Тромбоза нет
больных
Плацебо 25 18 7
Аспирин 19 6 13
Всего 44 24 20
100% 54.5% 45.5%
Как видно из таблицы 11, из 44 изученных больных
включенных в исследование, 25 - получали плацебо, ос-
тальные 19 – аспирин. Из 25 больных, получивших плацебо,
тромбоз был обнаружен у 18, тогда как из 19 больных, по-
лучавших аспирин- только у 6.
Начинаем проверку по критерию хи-квадрат с определе-
ния нулевой и альтернативных гипотез. Нулевая гипотеза в
данном случае будет утверждать, что никакой связи между
применением аспирина и частотой возникновения тромбоза
нет, альтернативная гипотеза будет утверждать обратное:
связь между изучаемыми переменными имеется.
Для вычисления ожидаемых данных мы предполагаем,
что нулевая гипотеза правдива. Если это так, то это означа-
ет, что распределение больных по частоте возникновения
тромбозов в обеих группах, у тех, кто получал плацебо, и у
тех, кто получал аспирин, должно быть одинаковым и та-
ким, как в обеих группах вместе взятых.
Если общее число больных в обеих группах (44) принять
равным 100%, то согласно нулевой гипотезе, у 54.5% (24)
больных тромбоз должен был развиться, у 45.5% (20) –нет.
Таблица 12. Тромбозы шунта при приеме плацебо и ас-
пирина: ожидаемые числа
Общее число Тромбоз есть Тромбоза нет
больных
Плацебо 25 13.6 11.4
Аспирин 19 10.4 8.6
Всего 44 24 20
135
Рассчитав, сколько составляет 54.5% от 25 и 19, получим
соответственно 13.6 и 10.4 (табл. 12). Это и есть ожидаемые
числа больных с тромбозом в группах плацебо и аспирина.
Таким же образом можно получить ожидаемые числа боль-
ных без тромбоза: в группе, принимающей плацебо – 45.5%
от 25, т.е. 11.4, в группе, принимающей аспирин – 45.5% от
19, т.е. 8.6.
Теперь можно приступить к расчету критерия соответст-
вия. Формула для его вычисления следующая:
(O − E ) 2
χ2 = ∑
E
Где О- фактическое число в клетке таблицы сопряженно-
сти, Е – ожидаемое число в той же клетке. Суммирование
производится по всем клеткам таблицы. В результате полу-
чим: (18 − 13.6) 2 (7 − 11.4) 2 (6 − 10.4) 2 (13 − 8.6) 2
χ2 = + + +
13.6 11.4 10.4 8.6
χ = 1.42 + 1.70 + 1.86 + 2.25 = 7.23.
2

Полученное значение критерия соответствия сравнивает-


ся с табличным значением (таблица 13). Для пользования
таблицей критических значений, кроме статистистической
величины χ2, нужно также определить заранее величину
степени свободы (degree of freedom, df). Формула для вы-
числения df следующая:
df = (C-1)x (R-1),
где C- это число столбцов, а R- число строк в таблице со-
пряженности без столбца и строки «Всего».
В нашем примере df = (2-1)x (2-1) = 1. Это означает, что
критическое значение χ 2 мы должны искать на первой стро-
ке таблицы. На первой строке критическое значениеχ 2 , со-
ответствующее уровню значимости 0.050, равно 3.84. Вы-
численная нами величина - 7,3, значительно выше критиче-
ского значения. Поэтому нулевая гипотеза об отсутствии
взаимосвязи между применением аспирина и частотой воз-
никновения тромбоза нами отвергается и принимается аль-
тернативная гипотеза.
136
Таблица 13. Критические значения χ2

Уровень значимости
df 0.100 0.050 0.025 0.010 0.001
1 2.71 3.84 5.02 6.63 10.83
2 4.61 5.99 7.38 9.21 13.82
3 6.25 7.81 9.35 11.34 16.27
4 7.78 9.49 11.14 13.28 18.47
5 9.24 11.07 12.83 15.09 20.52
6 10.64 12.59 14.45 16.81 22.46
7 12.02 14.07 16.01 18.48 24.32
8 13.36 15.51 17.53 20.09 26.12
9 14.68 16.92 19.02 21.67 27.88
10 15.99 18.31 20.48 23.21 29.59
11 17.28 19.68 21.92 24.72 31.26
12 18.55 21.03 23.94 26.22 32.91
13 19.81 22.36 24.74 27.69 34.53
14 21.06 23.68 26.12 29.14 36.12
15 22.31 25.00 27.49 30.58 37.70
16 23.54 26.30 28.85 32.00 39.25
17 24.77 27.59 30.19 33.41 40.79
18 25.99 28.87 31.53 34.81 42.31
19 27.20 30.14 32.85 36.19 43.82
20 28.41 31.41 34.17 37.57 45.31
21 29.62 32.67 35.48 38.93 46.80
22 30.81 33.92 36.78 40.29 48.27
23 32.01 35.17 38.08 41.64 49.73
24 33.20 36.42 39.36 42.98 51.18
25 34.38 37.65 40.65 44.31 52.62

137
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

Часто в биомедицинских исследованиях бывает необхо-


димо определить наличие связи между двумя переменными,
например, связи между количеством потребляемой соли и
уровнем кровяного давления или между температурой ок-
ружающей среды и числом простудных заболеваний.
Различают две формы проявления количественных свя-
зей между явлениями или процессами: функциональную и
корреляционную.
Под функциональной понимают такую связь, при кото-
рой каждому значению одного из двух признаков соответ-
ствует строго определенное значение другого (например,
радиусу круга соответствует определенная площадь круга и
т.д.) Функциональная связь характерна для физико-
математических процессов.
При корреляционной связи каждому значению одного
признака соответствуют несколько значений другого взаи-
мосвязанного с ним признака (связь между ростом и массой
тела, между температурой тела и частотой пульса и др.).
Корреляционная связь характерна для медико-
биологических процессов.
Статистический метод, используемый для изучения ха-
рактера корреляционной связи между двумя переменными,
называется корреляционным анализом.
Корреляционный анализ посредством вычисления коэф-
фициента корреляции (r) позволяет изучить силу и направ-
ление связи между двумя переменными. Коэффициент кор-
реляции может принимать значения от -1 до +1. Знак коэф-
фициента корреляции показывает направление связи, а аб-
солютная величина- ее силу.
Знак + указывает на наличие между двумя переменными
положительной корреляционной связи, при которой увели-
чение величины одной переменной приводит к увеличению
значения другой переменной, находящейся с первой в кор-
реляционной зависимости. Например, с увеличением систо-
138
лического давления повышается диастолическое или с уве-
личением роста повышается масса тела. Знак минус указы-
вает на наличие отрицательной корреляционной связи: уве-
личение величины одной переменной приводит к уменьше-
нию значения второй, находящейся с первой в корреляци-
онной зависимости. Например, чем больше охват населения
вакцинацией, тем ниже уровень заболеваемости населения
заболеванием, против которого была проведена вакцинация
и т.д.
Чем сильнее корреляционная связь, тем больше абсолют-
ная величина коэффициента корреляции. При отсутствии
корреляционной связи коэффициент корреляции равен 0.
Значения коэффициента корреляции от 0 до 0.3 указывают
на наличие слабой связи, от 0.31 до 0.7- средней связи и от
0.71 до 1 – на наличие сильной корреляционной связи меж-
ду изучаемыми переменными.
Связь между двумя коррелирующими переменными об-
разует двухмерное распределениe, которое обычно графи-
чески представляется в виде диаграммы рассеяния (scatter-
gram). Значения первой переменной (систолическое давле-
ние, длина тела) обычно откладываются на горизонтальной
оси (X), значения второй переменной – на вертикальной оси
(Y). Каждая отложенная точка представляет наблюдение
пары значений, например, массу тела и длину тела каждого
обследованного. Таким образом, число отложенных точек
соответствует числу парных наблюдений. На рисунке 28
приведены 4 различные диаграммы рассеяния.

139
Рисунок 28. Диаграммы рассеяния
А r = +1 B r=-1

C r = -0.7 D r=0

По виду диаграммы рассеяния можно предварительно


судить как о направлении корреляционной связи между пе-
ременными, так и о ее связи. О наличии и силе корреляци-
онной связи можно судить по тому, насколько точно через
отложенные точки можно провести прямую линию. Напри-
мер, на рисунках A и B через отложенные точки можно
провести только по одной прямой линии, это означает, что
коэффициент корреляции равен 1. Рисунок С показывает
наличие между переменными сильной отрицательной связи
со значением коэффициента корреляции, приблизительно
равным - 0.7. На рисунке D проведение прямой линии через
отложенные точки пересечения невозможно, значит коэф-
фициент корреляции приблизительно равен 0.
Двумя наиболее часто используемыми методами вычис-
ления коэффициента корреляции являются метод Пирсона и
метод Спирмена. Метод Пирсона может быть использован
лишь для описания линейной связи между двумя перемен-
ными, измеряемыми в интервальной шкале или шкале соот-
140
ношений. Он требует нормальности распределения. Метод
ранговой корреляции Спирмена – это непараметрический
метод, он не требует какого-либо определенного типа рас-
пределения и, в основном, используется для выявления свя-
зи между переменными, измеряемыми в порядковой шкале.
Коэффициент корреляции по методу Пирсона, или мето-
ду квадратов, вычисляется по формуле:

r=
∑ (x − x )( y − y )
∑ (x − x ) ∑ ( y − y )
2 2

где r – коэффициент корреляции, ( x − x ) и ( y − y ) - от-


клонения каждой варианты от их средней в рядах x и y.
Пример вычисления коэффициента корреляции по мето-
ду Пирсона приведен в таблице 14.

Таблица 14. Данные уровня холестерина и триглицери-


дов у 10 больных с гипертриглицеридемией

Уровень
Уровень триг-
холесте-
лицеридов
рина
(ммоль/л)
(ммоль/л)
x y (x- x) (y- y) (x- x)2 (y- y)2 (x- x)(y- y)
5.12 2.30 -1.61 -3.61 2.5921 13.0321 5.8121
6.18 2.54 -0.55 -3.37 0.3025 11.3569 1.8535
6.77 2.95 0.04 -2.96 0.0016 8.7616 0.1184
6.65 3.77 -0.08 -2.14 0.0064 4.5796 0.1712
6.36 4.18 -0.37 -1.73 0.1369 2.9929 0.6401
5.90 5.31 -0.83 -0.6 0.6889 0.36 0.4980
5.48 5.53 -1.25 -0.38 1.5625 0.1444 0.4750
6.02 8.83 -0.71 2.92 0.5041 8.5264 2.0732
10.34 9.48 3.61 3.57 13.0321 12.7449 12.8877
8.51 14.20 1.78 8.29 3.1684 68.7241 14.7562
∑= ∑= ∑=
Xx = 6.73 Xy = 5.91 21.9955 131.2229 39.2854

r=
∑ (x − x )( y − y ) =
39.2854
=
39.2854
= +0.73
∑ (x − x ) ∑ ( y − y ) 21.9955 ⋅ 131.2229 53.7244
2 2

141
Коэффициент корреляции равен + 0,73. Следовательно,
существует прямая сильная связь между уровнем холесте-
рина и уровнем триглицеридов в крови.
Для того, чтобы убедиться в том, что коэффициент кор-
реляции, вычисленный по данным выборочного исследова-
ния, будет соответствовать размеру связи в генеральной со-
вокупности, необходимо определить среднюю ошибку ко-
эффициента корреляции и критерий t:

1− r 2 r
mr = , t= .
n−2 mr
В нашем примере:
1 − 0.73 2 0.4671
m= = = 0.24
10 − 2 8

0.73
t= = 3.0
0.24
В соответствии с данными табл. 10, коэффициент корре-
ляции, равный + 0.73, достоверен с вероятностью безоши-
бочного прогноза > 95%, т.к. при n =10 полученный крите-
рий t будет больше tтабл. = 2.228 (α = 0.05).
Таким образом, материалы выборочного исследования
позволяют утверждать, что в генеральной совокупности
существует сильная прямая связь между уровнем холесте-
рина и уровнем триглицеридов в крови.
Коэффициент корреляции по методу Спирмена, или ме-
тоду ранговой корреляции, вычисляется по формуле:
6⋅∑d 2
r = 1−
n(n 2 − 1)
где r – коэффициент корреляции, d – разность между ран-
говыми номерами сопоставляемых рядов, n – число обсле-
дованных.
142
Пример вычисления коэффициента корреляции по мето-
ду Спирмена приведен в таблице 15.

Таблица 15. Результаты оценки тяжести депрессии по


шкале депрессии Бека и шкале депрессии Гамильтона у
10 обследованных больных

Оценка по Оценка по
Ранговые Квадрат
шкале де- шкале де- Разность
номера в разности
прессии прессии рангов
рядах рангов
Бека Гамильтона (d)
(d2)
x y x y
20 22 5 7.5 -2.5 6.25
11 14 1 3 -2 4
13 10 2 1 1 1
22 17 7 5 2 4
37 31 9.5 10 -0.5 0.25
27 22 8 7.5 0.5 0.25
14 12 3 2 1 1
20 19 5 6 -1 1
37 29 9.5 9 0.5 0.25
20 15 5 4 1 1
∑ = 19

6⋅∑d 2 6 ⋅ 19 114
r = 1− = 1− = 1− = 1 − 0.12 = +0.9.
n(n − 1)
2
10 ⋅ 99 990
Корреляционный анализ имеет ряд ограничений.
Во-первых, методы корреляционного анализа позволяют
выявить наличие между переменными линейной связи: они
определяют силу прямолинейной зависимости между двумя
переменными. Если между двумя переменными существует
сильная нелинейная зависимость, то метод корреляционно-
го анализа может недооценить истинную силу связи между

143
ними. Лекарственный препарат имеет очень сильное воз-
действие в зависимости от его дозы, но он дает очень сла-
бый эффект при очень высокой или очень низкой дозе. Та-
ким образом, так как связь между дозой препарата и эффек-
том является нелинейной, значение коэффициента корреля-
ции, вычисленного по методу Пирсона, будет очень низким,
если даже между эти переменными существует сильная за-
висимость.
Во-вторых, корреляционная зависимость между двумя
переменными, даже если она очень сильная, не свидетель-
ствует о наличии между ними причинной зависимости.
Корреляция является лишь мерой статистической зависимо-
сти между переменными. Заключение о наличии причинной
связи между переменными на основе результатов корреля-
ционного анализа является очень грубой ошибкой.
Коэффицент корреляции, рассчитанный по данным вы-
борочного исследования, очень чувствителен к воздействию
крайних (выскакивающих) вариантов и при их наличии мо-
жет приводить к неправильным результатам.
Наличие корреляционной зависимости между двумя пе-
ременными в выборке еще не означает, что она существует
в популяции. Для того, чтобы распространить результаты
корреляционного анализа, проведенного для данных выбор-
ки на всю популяцию, необходимо провести проверку гипо-
тезы, которая включает проведение специального t-теста.

РЕГРЕССИОННЫЙ АНАЛИЗ

При наличии между двумя переменными корреляцион-


ной связи, врачам нередко приходится устанавливать на ка-
кую величину может измениться значение одной перемен-
ной (зависимой переменной) при изменении другой (неза-
висимой переменной) на общепринятую или установленную
самим исследователем единицу измерения. Например, как
изменится масса тела школьников 1-го класса (мальчиков

144
или девочек), если рост их увеличится на 1 см. В этих целях
применяется метод регрессионного анализа.
Различают простой и множественный регрессионный
анализ.
Метод простого линейного регрессионного анализа по-
зволяет посредством простой линейной математической
функции (уравнения регрессии), определяющей прямоли-
нейную зависимость между двумя переменными, опреде-
лить величину одной переменной (Y) по величине другой
(X). Прямая линия, или линия регрессии, в сущности, явля-
ется той же наиболее подходящей линией диаграммы рас-
сеяния, которая используется при вычислении коэффициен-
та корреляции. Уравнение простой линейной регрессии та-
кое же, что и уравнение любой прямой линии.
Ожидаемая величина Y = α+ βX,
где α- константа, известная под названием пересечения,
так как это точка, в которой ось Y пересекается линией рег-
рессии; β – это наклон линии регрессии, который известен
под названием коэффициента регресии; X – величина неза-
висимой переменной X. Пересечение линии регрессии пока-
зывает, чему будет равно среднее значение ожидаемой ве-
личины, при значении величины переменной X, равной 0.
Наклон линии регрессии показывает изменение ожидаемой
величины Y, соответствующее изменению величины неза-
висимой переменной X на единицу.
Допустим, обнаруженная нами линейная зависимость
между ростом и весом школьников 1-го класса описывается
следующим уравнением регрессии:
Y = -6 + 0.3 X.
В данном уравнении величина α = - 6, β = 0.3. Согласно
данному уравнению, при увеличении роста на 1 см средний
вес увеличивается на 0.3 кг.
Используя данное уравнение регрессии можно вычис-
лить ожидаемое значение Y для любой величины X. Напри-
мер, при росте школьников, равном 116 см, их средняя мас-
са тела будет составлять 26,8 кг.
145
В уравнении множественной регрессии для определения
ожидаемой величины Y используется более одной перемен-
ной. Например, группой исследователей было установлено,
что масса тела новорожденного (Y, г) может быть частично
прогнозирована по числу сигарет, выкуриваемых в день как
матерью ребенка (X1), так и отцом (X2), по уравнению мно-
жественной регрессии Y = 3385 - 9 X1 – 6 X2.
Для определения нелинейной зависимости между множе-
ственными переменными используется другой статистиче-
ский метод. Как и в случае корреляционной зависимости,
регрессионная зависимость не указывает на наличие при-
чинной зависимости.

ВЫБОР АДЕКВАТНОГО
СТАТИСТИЧЕСКОГО ТЕСТА

Выбор адекватного статистического метода для опреде-


ленной исследовательской проблемы определяется двумя
факторами: типом собранных данных, а именно шкалой из-
мерения изучаемых переменных, и задачей исследования.
При изучении переменных, измеряемых в номинальной
шкале, задачей исследования может быть, например, срав-
нение двух и более несвязанных между собой совокупно-
стей. Подходящим статистическим методом анализа в этом
случае может служить проверка по критерию хи-квадрат.
При изучении переменных, измеряемых в порядковой
шкале, задачей исследования может быть описание направ-
ления и силы связи между изучаемыми переменными. В
данном случае подходящим статистическим методом может
служить корреляционный анализ по методу Спирмена.
Для переменных, измеряемых в шкале соотношения, мо-
гут ставиться следующие задачи: 1) определение истинной
популяционной средней; 2) оценка достоверности различий
между двумя или несколькими выборочными средними; 3)
оценка достоверности различий между дисперсиями в двух
выборках; 4) описание силы и направления связи между
146
двумя переменными. В каждом конкретном случае может
быть использован либо t-, либо z- тест или ANOVA.
Для решения задач, касающихся оценки популяционной
средней, проверки гипотезы о популяционной средней или
для сравнения двух выборочных средних, обычно использу-
ется t-тест. В случае, если размер выборки n > 100 или если
популяционное стандартное отклонение известно, может
быть использован z-тест.
Когда задачей исследования является сравнение более
двух средних подходящим статистическим методом являет-
ся дисперсионный анализ (ANOVA) c F-тестом. F–тест яв-
ляется единственным методом сравнения дисперсий в вы-
борках.
Для оценки силы и направления связи между двумя пе-
ременными, измеряемыми в интервальной шкале или шкале
соотношений, используется корреляционный анализ по ме-
тоду Пирсона, вместе с определенным видом t-теста для
проверки нулевой гипотезы об отсутствии связи между пе-
ременными в популяции. Для определения величины одной
переменной при наличии значения другой используется
регрессионный анализ.

ДИНАМИЧЕСКИЕ РЯДЫ

В научно-практической деятельности врачу нередко при-


ходится анализировать происходящие во времени измене-
ния в состоянии здоровья отдельных групп населения, в
деятельности медицинских учреждений, в эксперименталь-
ных исследованиях. Выявление основной тенденции изу-
чаемого явления вне влияния «случайных» факторов позво-
ляет определять закономерности изменения явлений и на
этой основе осуществлять прогнозирование.
Для изучения динамики изучаемого явления во времени
используются так называемые, динамические ряды. Дина-
мический ряд - это ряд однородных величин, характери-
зующих изменения какого-либо явления в течение опреде-
147
ленного промежутка времени. Величины, составляющие
динамический ряд, принято называть уровнями. Уровни ря-
да могут быть представлены абсолютными, относительны-
ми или средними величинами.
В зависимости от характера уровней динамические ряды
могут быть простыми (уровни представлены абсолютными
величинами) или сложными (уровни представлены относи-
тельными или средними величинами).
Динамические ряды, состоящие из величин, показываю-
щих величину изучаемого явления на определенные момен-
ты времени, называются моментными. Уровни моментного
ряда не подлежат дроблению.
Динамические ряды, состоящие из величин, характери-
зующих величину изучаемого явления за определенный пе-
риод времени (сутки, неделя, месяц, год и т.д.), называются
интервальными. Интервальный ряд в отличие от моментно-
го можно разделить на более дробные периоды, а также
можно укрупнить интервалы. Выбор величины периода для
интервального ряда в известной мере определяется степе-
нью изменчивости явления. Чем медленнее изменяется яв-
ление во времени, тем крупнее могут быть периоды наблю-
дения.

Приемы для установления тенденций или закономерно-


стей изучаемого явления

Динамический ряд не всегда состоит из уровней, после-


довательно изменяющихся в сторону снижения или увели-
чения. Нередко некоторые уровни в динамическом ряду
представляют значительные колебания, что затрудняет воз-
можность проследить основную закономерность, свойст-
венную явлению в наблюдаемый период.
В этих случаях для выявления тенденции изучаемого яв-
ления рекомендуется произвести преобразование или вы-
равнивание динамического ряда.

148
Преобразование ряда применяется для большей нагляд-
ности изменений изучаемых явлений. Одно из чисел ряда,
обычно первое, принимается за 100% и по отношению к
данному числу ряда, рассчитываются остальные.
Выравнивание ряда применяется при скачкообразных из-
менениях уровней ряда. Цель выравнивания - устранить
влияние случайных факторов и выявить тенденцию измене-
ний значений явления, а в дальнейшем установить законо-
мерности этих изменений.
Существует несколько способов выравнивания динами-
ческого ряда: укрупнение интервала, расчет групповой и
скользящей средней и др.
Укрупнение интервала применяется, когда явление в
интервальном ряду выражено в абсолютных величинах.
Производят укрупнение интервалов путем суммирования
данных за ряд смежных периодов (табл.16). Применение
этого способа выравнивания ряда возможно при кратном
числе периодов.
Как видно из табл.16, погодовые числа детей с ослож-
ненными формами пневмоний то увеличиваются, то умень-
шаются. После укрупнения интервалов по два года можно
увидеть определенную закономерность, наибольшее число
осложненных форм пневмоний приходится на последний
двухлетний отрезок изучаемого периода.
Вычисление групповой средней применяется, когда
уровни интервального ряда выражены в абсолютных, сред-
них или относительных величинах, которые суммируются, а
затем делятся на число слагаемых (см. табл. 16). Способ
применяется при кратном числе периодов.
Расчет скользящей средней применяется, когда уровни
ряда выражены в абсолютных, средних или относительных
величинах. Каждый уровень ряда заменяется на среднюю
величину из данного уровня и двух соседних с ним
(табл.16). Например, скользящая средняя для 1998 года бу-
дет равна: 15 + 9 + 26 = 16,7. Данный метод применяется,
когда не требуется особой точности, когда имеется доста-
149
точно длинный ряд и можно пренебречь потерей двух зна-
чений ряда.

Таблица 16. Динамика количества детей с осложненны-


ми формами пневмонии (ателектазы, деструкция), ле-
чившихся в пульмонологическом отделении

Годы 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
Число детей с
осложненным
течением
50 9 15 26 31 25 18 16 39 26
пневмонии

Укрупнение
59 41 56 34 65
интервала

Вычисление
групповой 29.5 20.5 28 17 32.5
средней

Вычисление
скользящей 24.7 16.7 24 27.3 24.7 19.7 24.3 27
средней

Анализ динамического ряда

Для углубленного изучения процессов во времени рас-


считывают показатели динамического ряда. К их числу от-
носятся показатели абсолютного прироста, темпа прироста,
темпа роста, а также значение 1% прироста.
Абсолютный прирост и темп прироста применяются для
характеристики скорости изменения явления во времени.
Абсолютный прирост (убыль) - характеризует абсолют-
ную величину прироста в единицу времени. Рассчитывается
абсолютный прирост как разность между данным и преды-
дущим уровнями динамического ряда (табл. 17). Например,
для 2001 г.: 23.0 – 26.0 = - 3.0.

150
Темп прироста – процентное отношение абсолютного
прироста к предыдущему уровню. Например, для 2001 г.: -
3.0 х 100 / 26.0 = -11.5%.
Темп роста – процентное отношение последующего
уровня к предыдущему. Например, для 2001 г.: 23.0 х 100/
26.0 = 88,5%.
Значение 1% прироста используется при сравнении ди-
намических рядов с разными исходными уровнями. 1%
прироста рассчитывается как отношение абсолютного при-
роста к темпу прироста за каждый период (табл. 17, 18).

Таблица 17. Динамика средней длительности пребыва-


ния на койке больных язвенной болезнью
Средняя Абсолютный Темп Темп
Значение
Год длительность прирост роста прироста
1%
(в днях) (+,-) (%)
2000 26.0 - - - -
2001 23.0 -3,0 88.5 -11.5 0.26
2002 20.0 -3,0 87.0 -13.0 0.23
2003 21.0 +1,0 105.0 +5.0 0.20
2004 20.0 -1 95.2 -4.8 0.25

Таблица 18. Динамика заболеваемости ветряной оспой


населения районов А и Б за 1997-2006 гг.

Абсолютный Темп 1% при-


Районы 1997 2006
прирост прироста роста
А 3.5 7.3 +3.8 +108.6
Б 1.5 4.3 +2.8 +186.7

В районе А 1% прироста составил: +3.8/108.6 = 0.035


В районе Б % прироста равен: + 2.8/186.7 = 0.015

151
Анализ показателей таблицы 18 позволяет сделать вывод,
что хотя в районе Б темп роста заболеваемости превышает
темп роста заболеваемости в районе А, тем не менее, забо-
леваемость в районе А увеличилась в большей степени, чем
в районе Б.

СТАНДАРТИЗАЦИЯ ПОКАЗАТЕЛЕЙ

Сравнивая общие показатели, вычисленные для разных


совокупностей, следует иметь в виду возможность влияния
на их уровни неоднородности составов сравниваемых сово-
купностей по ряду признаков. Так, например, при сравне-
нии общих уровней летальности, вычисленных для двух
больниц, прежде чем сделать вывод о причинах различий в
сравниваемых показателях, необходимо проанализировать -
однороден ли по нозологическим формам состав больных,
лечившихся в этих больницах. Понятно, что общий показа-
тель летальности будет выше в той из больниц, где в соста-
ве больных было больше лиц с тяжелыми хроническими за-
болеваниями. Неоднородность состава больных в сравни-
ваемых больницах не позволяет делать выводы о причинах
различий в уровнях показателей летальности.
При сравнении общих показателей, вычисленных из не-
однородных по своей структуре совокупностей, применяет-
ся метод стандартизации.
Метод стандартизации показателей позволяет устранить
возможное влияние различий в составе совокупностей по
какому-либо признаку на величины сравниваемых общих
показателей. С этой целью составы совокупностей по дан-
ному признаку уравниваются, что в дальнейшем позволяет
рассчитать стандартизованные показатели.
Стандартизованные показатели – это условные, гипоте-
тические величины, не отражающие истинных размеров яв-
лений. Они свидетельствуют о том, какими были бы значе-
ния сравниваемых показателей, если бы были исключены
различия в составах совокупностей.
152
Существуют два основных метода стандартизации пока-
зателей: прямой и непрямой. Наиболее распространенным
является прямой метод стандартизации показателей.
Прямой метод стандартизации показателей
Этапы расчета стандартизованных показателей:
1. Расчет общих и специальных интенсивных показате-
лей для двух сравниваемых совокупностей.
2. Выбор и расчет стандарта. Стандарт – это состав сово-
купности, который принимается общим для сравни-
ваемых групп.
В качестве стандарта в каждом конкретном случае бе-
рется состав одной из сравниваемых совокупностей,
их суммарный состав, или состав какой-то третьей со-
вокупности.
3. Вычисление ожидаемых абсолютных величин в груп-
пах сравнения на основе групповых интенсивных по-
казателей, рассчитанных на I этапе.
4. Вычисление стандартизованных показателей для
сравниваемых совокупностей.
5. Сопоставление стандартизованных и общих интенсив-
ных показателей, формулировка вывода.
Пример: Уровень летальности больных в больницах А и
Б составил соответственно 4 и 3.8 случаев на 100 вы-
бывших больных. При углубленном исследовании вы-
яснилось, что возрастной состав больных в двух срав-
ниваемых больницах различен. Было произведено вы-
числение стандартизованных показателей летальности
(табл. 19).
I этап. Сначала определяют общие показатели леталь-
ности в больницах А и Б:
Больница А: 80 х 100/ 2000 = 4 на 100 выбывших
больных.
Больница Б: 76х 100/ 2000 = 3.8 на 100 выбывших
больных.
Затем находят показатели летальности в отдельных воз-
растных группах. Например, в больнице А у больных в воз-
153
растной группе до 40 лет летальность составляет: 12 х
100/600 = 2%, а в больнице Б, соответственно, 42 х 100/1400
= 3%. Аналогично проводят расчеты и в других возрастных
группах (табл.19).

Таблица 19. Летальность больных в больницах А и Б

Больница Больница I этап II этап III этап


А Б
Возраст больных

Летальность Ожидаемое
выбыло больных

выбыло больных

на 100 вы- число

в обеих больни-
(число больных
из них умерло

из них умерло
бывших умерших в

Стандарт
больных стандарте

цах)
б-ца б-ца б-ца б-ца
А Б А Б

До 40 600 12 1400 42 2 3 2000 40 60


лет
От 40- 200 8 200 10 4 5 400 16 20
до 59
60 и 1200 60 400 24 5 6 1600 80 96
старше
Всего 2000 80 2000 76 4.5 3.8 4000 136 176
IV этап
Определение стандарти- 100 3.4 4.4
зованных показателей

II этап. За стандарт принимают сумму выбывших боль-


ных по каждой возрастной группе в обеих больницах.
III этап. С учетом соответствующих показателей леталь-
ности определяют ожидаемое число умерших в больницах
А и Б по каждой возрастной группе. Например, в в больни-
це А у больных в возрастной группе до 40 лет ожидаемое
число умерших составляет: 2 х 2000/ 100 = 40, а в больнице
Б, соответственно, 3 х 2000/ 100 = 60. Аналогично проводят
расчеты и в других возрастных группах.

154
Находят сумму ожидаемых чисел умерших в больницах
А (40 + 16 + 80 = 136) и Б (60 + 20 + 96 = 176).
IV этап. Определяют общие стандартизованные показа-
тели летальности в больницах А и Б:
Больница А: 136 х 100/ 4000 = 3.4 на 100 выбывших
больных,
Больница Б: 176 х 100/ 4000 = 4.4 на 100 выбывших
больных.
V этап. Сопоставление соотношения общих интенсивных
и стандартных показателей летальности в больницах А и Б
и формулировка вывода.

Больница Больница Соотношение


Показатели
А Б АиБ
Интенсивные 4.0 3.8 А>Б
Стандартизованные 3.4 4.4 А<Б

Если бы возрастной состав выбывших больных в боль-


ницах А и Б был одинаков, то летальность была бы выше в
больнице Б. На различия в уровнях летальности (в частно-
сти, на «завышение» ее в больнице А и «занижение» в
больнице Б) оказала влияние неоднородность возрастного
состава больных, а именно, преобладание в больнице А по-
жилых пациентов с относительно высоким показателем ле-
тальности, и наоборот, в больнице Б – больных в возрасте
до 40 лет, имеющих низкие показатели летальности.

155
Литература

1. Стентон Гланц. Медико-биологическая статистика.


Москва, 1999.
2. Beth Dawson, Robert G. Trapp. Basic and Clinical Biosta-
tistics. Lange Medical Books/McGraw-Hill, 2001.
3. Leon Gordis. Epidemiology. W.B.Saunders Company,
1996. p. 400.
4. Marcello Pagano, Kimberlee Gauvreau. Principles of Bi-
ostatistics. Belmont, Duxbury Press, 1993. p. 112.

156

Вам также может понравиться