Вы находитесь на странице: 1из 6

1

Сравнение двух групп. Параметрические тесты.


Тест Стьюдента. t-распределение. Тест Стьюдента для парных измерений. Использование доверитель-
ных интервалов для проверки гипотезы о равенстве двух средних. Введение поправки Бонферрони для t-
критерия при проведении множественных сравнений средних. Непараметрические аналоги критерия
Стьюдента: U-тест Манна-Уитни, тест Уилкоксона, тест Уэлча.
z-критерий для сравнения двух выборочных долей и условие его применимости.

Объектами биологических экспериментов являются живые организмы, и в биоло-


гии очень часто возникает необходимость сравнивать те или иные генеральные пара-
метры изучаемых совокупностей, которые, как правило, остаются неизвестными. Не-
возможно сравнивать неизвестные показатели, но можно рассчитать и сравнить вы-
борочные характеристики, которые являются оценками генеральных параметров. По раз-
ности между выборочными показателями сравниваемых выборок, учитывая статистиче-
ские ошибки, можно судить о разнице между генеральными параметрами. Для того
чтобы выяснить, являются ли различия случайными или систематическими, используют
статистические методы с применением статистических критериев, которые позволяют
на основании сравнения выборочных характеристик принять обоснованное решение о
совпадениях или различиях в изучаемых группах и сделать вывод о параметрах генераль-
ных совокупностей.
Общий алгоритм использования статистических критериев
1. Определить, какая шкала измерений используется – отношений, интервальная,
порядковая, номинальная.
2. Выбрать статистический критерий.
Для метрических шкал при любом распределении можно использовать критерий
Крамера-Уэлча. Если данные распределяются по нормальному закону, используют тест
Стьюдента.
Для порядковой (ранговой) шкалы используют тест Манна-Уитни, возможно
также использование критерия 2.
Для номинальной шкалы следует использовать критерий 2. Для дихотомической
(альтернативной) шкалы используют критерий 2 и критерий Фишера.
В случае связаных выборок применяют тест Вилкоксона для любого распределе-
ния или парный тест Стьюдента для данных, распределенных по нормальному закону.
3. Сформулировать нулевую и альтернативную гипотезы.
Чаще всего при сравнении двух выборок по какому-то признаку нулевая гипотеза
(Н0) носит общепринятый характер. Сущность ее сводится к предположению, что раз-
2
ность между генеральными параметрами сравниваемых групп равна нулю, а разли-
чия, наблюдаемые между выборочными характеристиками, носят не систематиче-
ский, а исключительно случайный характер.
Противоположная нулевой – альтернативная гипотеза (НА или Н1) – исходит
из предположения, что разность между генеральными параметрами сравниваемых групп
не равна нулю, а различия, наблюдаемые между выборочными характеристиками, носят
не случайный, а систематический характер.
В разных статистических тестах для признаков, измеренных в разных шкалах,
проверяется различие между разными параметрами с помощью разных статистических
критериев.
4. Вычислить эмпирическое (фактическое) значение выбранного статистического
критерия для выбранного уровня значимости  и степеней свободы k.
5. Сравнить полученное значение критерия с известным (статистическим, таблич-
ным) числом – критическим значением этого критерия.
6. Если эмпирическое значение критерия оказывается меньше (или для некоторых
тестов – меньше или равно критическому) критического, то можно утверждать, что «ис-
следуемые характеристики (параметры) сравниваемых групп совпадают на вы-
бранном уровне значимости (например, 0,05) по статистическому критерию … (далее
следует название использованного критерия: Стьюдента, Крамера-Уэлча, Вилкоксона,
Манна-Уитни, хи-квадрат, Фишера)».
В противном случае, если эмпирическое значение критерия оказывается больше
(или для некоторых тестов – больше или равно критическому) критического, можно
утверждать, что «достоверность различий характеристик сравниваемых групп по
статистическому критерию … равна … (например, при =0,05 - 95%)».
7. Рассчитать достигаемый уровень значимости проведенного теста (p-level).
разность между изучаемыми выборочными характеристиками
Фактическое значение критерия = ошибка разности выборочных характеристик

Тест Стьюдента с предполагаемым равенством дисперсий (для нормально распре-


деленных совокупностей) (метрическая шкала).
Если одна изучаемая выборка извлечена из нормально распределяющейся сово-
купности с параметрами х и х2 а другая – из совокупности с параметрами у и у2 (дис-
персии х2 и у2 предполагаются равными), можно предположить, что разность гене-
ральных средних равна 1 – 2 = D. Значения этих генеральных параметров неизвестны,
3

однако можно рассчитать величины выборочных средних и разность между ними ( x 1 –


x 2) = d. t-критерий, с помощью которого можно определить достоверность различий
между выборочными средними, выражается в виде отношения разности выборочных
средних к ошибке разности средних (Sd):

d x1  x2
tфакт   , где для равновеликих выборок (n1 = n2) S d  S x  S x ,
2 2

Sd Sd 1 2

Гипотезы:
Н0: разность между генеральными средними значениями двух сравниваемых
групп с одинаковыми дисперсиями равна нулю, а различия, наблюдаемые между выбо-
рочными средними значениями, носят не систематический, а случайный характер.
НА (или Н1): разность между генеральными средними значениями двух срав-
ниваемых групп с одинаковыми дисперсиями не равна нулю, а различия, наблюдаемые
между выборочными средними значениями, носят не случайный, а систематический
характер.
Вывод, если фактически установленная величина t-критерия (tф.) больше крити-
ческого (статистического) значения tst этой величины для принятого уровня значимости
 и числа степеней свободы k = n1 + n2 — 2, т. е при условии tф > tst, Н0 - гипотезу отвер-
гают, а принимают альтернативную. В противном случае, если фактическое значение tф
меньше табличного, принимают Н0 – гипотезу.

Тест Крамера-Уэлча (независимо от вида распределения) (метрическая шкала).


Эмпирическое (фактическое) значение данного критерия рассчитывается:
𝑛1 ∙𝑛2 ∙|𝑥1 −𝑥2 |
Тфакт = √ ,
√(𝑛1 𝑆𝑥2 +𝑛2 𝑆𝑦2 )

где x 1 и x 2 – выборочные средние, Sx2 и S y 2 – выборочные дисперсии сравнивае-


мых выборок, n1 и n2 – их объемы.

Гипотезы:
Н0: разность между генеральными средними значениями двух сравниваемых
групп равна нулю, а различия, наблюдаемые между выборочными средними значени-
ями, носят не систематический, а случайный характер.
4
НА (или Н1): разность между генеральными средними значениями двух срав-
ниваемых групп не равна нулю, а различия, наблюдаемые между выборочными сред-
ними значениями, носят не случайный, а систематический характер.

Вывод: если рассчитанное значение Т-критерия больше 1,96, нулевая гипотеза


отвергается на выбранном уровне значимости (=0,05), принимается альтернативная ги-
потеза. В противном случае, нулевую гипотезу отбросить нельзя.

Использование доверительных интервалов для проверки гипотезы о равенстве


двух средних (для нормального распределения; метрическая шкала).
Для разности генеральных средних величин тоже можно построить доверитель-
ный интервал с помощью коэффициента Стьюдента.

𝑑 − 𝑆𝑑 𝑡 ≤ 𝐷 ≤ 𝑑 + 𝑆𝑑 𝑡

Благодаря доверительному интервалу для разности средних можно не только кон-


статировать статистическую значимость различий между средними значениями двух
групп, но и указать величину выявленных различий.
Разность генеральных средних может находиться в любой точке построенного до-
верительного интервала. Если построенный доверительный интервал содержит нулевое
значение, то истинная разность средних также может быть равна нулю. Следовательно,
нет оснований отвергнуть нулевую гипотезу. Но, если доверительный интервал не со-
держит нуля, мы можем с заданной уверенностью (уровнем значимости) отказаться от
нулевой гипотезы и считать различия статистически значимыми.

Гипотезы:
Н0: разность между генеральными средними значениями двух сравниваемых
групп равна нулю, а различия, наблюдаемые между выборочными средними значени-
ями, носят не систематический, а случайный характер.
НА (или Н1): разность между генеральными средними значениями двух срав-
ниваемых групп не равна нулю, а различия, наблюдаемые между выборочными сред-
ними значениями, носят не случайный, а систематический характер.

Вывод: если построенный доверительный интервал для разности генеральных


средних для принятого уровня значимости  и числа степеней свободы k содержит ну-
левое значение, принимается Н0, иначе принимается Н1.
5
Тест Стьюдента для парных измерений (связанных выборок)
Две выборки считаются связанными (зависимыми друг от друга или попарно со-
пряженными), если каждому значению одной выборки можно однозначно поставить в
соответствие ровно одно значение другой выборки. Или зависимые выборки – это одна
и та же выборка, но до и после воздействия некоторого фактора.
Парный двухвыборочный t-тест Стьюдента используется для проверки гипотезы
о различии средних для двух выборок данных. В нем не предполагается равенство дис-
персий генеральных совокупностей, из которых выбраны данные.
Пусть X и Y – это исследуемый признак первой и второй совокупностей, связан-
ных между собой. Вычисление значения tфакт осуществляется по формуле:

∑𝑛 𝑑𝑖
| 𝑖=1
𝑛 |
𝑡факт =
𝑆𝑑

где di = xi – yi − разности между соответствующими значениями переменной X и


переменной Y

𝑛
(∑𝑖=1(𝑥𝑖 −𝑦𝑖 )) 2
∑𝑛 ∑𝑛 2
𝑖=1(𝑥𝑖 −𝑦𝑖 ) −
𝑑= 𝑖=1(𝑥𝑖 −𝑦𝑖 )
𝑆𝑑 = √ 𝑛
𝑛 𝑛(𝑛−1)

Число степеней свободы k определяется по формуле k = n − 1.

Гипотезы:
Н0: разность между генеральными средними значениями двух сравниваемых
связанных групп равна нулю, а различия, наблюдаемые между выборочными сред-
ними значениями, носят не систематический, а случайный характер.
НА (или Н1): разность между генеральными средними значениями двух срав-
ниваемых связанных групп не равна нулю, а различия, наблюдаемые между выбороч-
ными средними значениями, носят не случайный, а систематический характер.

Вывод: если фактически установленная величина t-критерия больше критиче-


ского значения tst этой величины для принятого уровня значимости  и числа степеней
свободы k, Н0 − гипотезу отвергают, принимают Н1.

Методы множественного сравнения. Введение поправки Бонферрони для t-


критерия при проведении множественных сравнений средних.
6
Критерий Стьюдента может быть использован для проверки гипотезы о различии
средних только для двух групп. При необходимости исследовать большее число групп,
используют дисперсионный анализ. Если дисперсионный анализ подтвердит значимые
различия между средними значениями выборок, для дальнейшего анализа используют
методы множественного сравнения.
Критерий Стьюдента для множественного сравнений основан на использовании
неравенства Бонферрони, из которого следует, что при исследовании (сравнении) не-
скольких групп для каждого из сравнений необходимо принять уровень значимости /k
(поправка Бонферрони), где k - число сравнений.
Например, сравниваются между собой 4 выборки, значит, число сравнений будет
равно 6. Принимаемый уровень значимости в этом случае будет не 0,05, как было бы в
случае сравнения между собой 2-выборок, а /k = 0,05/6 = 0,008.