Вы находитесь на странице: 1из 6

1

Сравнение двух групп.

Непараметрические аналоги критерия Стьюдента: U-тест Манна-


Уитни, тест Уилкоксона (Вилкоксона).
Непараметрические аналоги критерия Стьюдента: U-тест Манна-Уитни, тест Уилкоксона, тест
Уэлча.
z-критерий для сравнения двух выборочных долей и условие его применимости.

U-критерий Манна-Уитни (независимо от вида распределения, ранговая шкала).

Гипотезы:
Н0: разность между генеральными значениями медиан двух сравниваемых
групп равна нулю, а различия, наблюдаемые между выборочными медианами, носят
не систематический, а случайный характер.
НА (или Н1): разность между генеральными значениями медиан двух сравнива-
емых групп не равна нулю, а различия, наблюдаемые между выборочными медианами,
носят не случайный, а систематический характер.
Алгоритм проведения теста Манна-Уитни:
1. обе выборки объединяют и ранжируют по возрастанию в один общий ряд;
2. каждой варианте присваивается ранг (R) - порядковый номер того места, которое оно
занимает в этом ряду. Одинаковым по величине вариантам присваивается один и тот же
средний ранг, который находится как среднее арифметическое между такими вариан-
тами. Например, после 10 ранга идут 2 одинаковые варианты, им обеим присваивается
ранг 11,5 (11+12 = 23:2 = 11,5). Следующей варианте присваивается ранг 13;
3. для каждой выборки находят суммы рангов ∑R1, ∑R2 и определяют величины U1 и U2.

n1 n1  (n1  1) n2 n2  (n2  1)
U1   R1i  U 2   R2i 
i 1 2 i 1 2
4. из двух рассчитанных значений U выбирают меньшее;
5. определяют значение z-критерия:
𝒏𝟏 ∙ 𝒏𝟐
|𝑼 −
𝒛= 𝟐 |
√𝒏𝟏 ∙ 𝒏𝟐 ∙ (𝒏𝟏 + 𝒏𝟐 + 𝟏)
𝟏𝟐
2
Вывод: если рассчитанное значение z-критерия больше 1,96, нулевая гипотеза
отвергается на выбранном уровне значимости (=0,05), принимается альтернативная ги-
потеза. В противном случае, нулевую гипотезу отбросить нельзя.

Тест Уилкоксона (W-критерий Вилкоксона) (независимо от вида распределения,


ранговая шкала) для парных измерений (связанных выборок).

Гипотезы:
Н0: разность между генеральными значениями медиан двух сравниваемых свя-
занных групп равна нулю, а различия, наблюдаемые между выборочными медианами,
носят не систематический, а случайный характер.
НА (или Н1): разность между генеральными значениями медиан двух сравнива-
емых связанных групп не равна нулю, а различия, наблюдаемые между выборочными
медианами, носят не случайный, а систематический характер.
Алгоритм проведения теста Вилкоксона.
1. находят разности между парными вариантами сравниваемых выборок, обязательно с
учетом знака;
2. разности равные нулю удаляются (не учитываются), число парных наблюдений n
сразу соответственно уменьшается!
3. разности, взятые по модулю, ранжируют по возрастанию. То есть, наименьшая по мо-
дулю разность, получает первый ранг независимо от знака. Одинаковым величинам при-
сваивают один и тот же средний ранг.
4. находят суммы рангов плюсовых и минусовых разностей;
5. меньшая сумма рангов составляет фактическую величину W-критерия
6. находят по таблицам критическое значение Wst-критерия для принимаемого уровня
значимости  и числа парных наблюдений n (без нулевых разностей).

Вывод: если фактически установленная величина W-критерия превзойдет или


окажется равной критическому значению W-критерия (для принятого уровня значимо-
сти  и числа парных наблюдений n), то есть Wф ≥ Wst, принимают (!!!) Н0 - гипотезу.
Если Wф < Wst, принимают альтернативную.
3
z-критерий для сравнения двух выборочных долей.

Гипотезы:
Н0: разность между генеральными долями двух сравниваемых групп равна
нулю, а различия, наблюдаемые между выборочными долями, носят не систематиче-
ский, а случайный характер.
НА (или Н1): разность между генеральными долями двух сравниваемых групп
не равна нулю, а различия, наблюдаемые между выборочными долями, носят не слу-
чайный, а систематический характер.
Рассчитывают значение z-критерия, где wd1 – выборочная доля первой группы,
wd2 – второй. n1 и n2 – объемы сравниваемых выборок.

|𝑤𝑑1 − 𝑤𝑑2 |
𝑧=
𝑤𝑑1 ∙ (1 − 𝑤𝑑1 ) 𝑤𝑑2 ∙ (1 − 𝑤𝑑2 )
√ +
𝑛1 𝑛2

И с поправкой Йетса на непрерывность:

1 1 1
|𝑤𝑑1 − 𝑤𝑑2 | − ∙ ( + )
2 𝑛1 𝑛2
𝑧=
𝑤 ∙ (1 − 𝑤𝑑1 ) 𝑤𝑑2 ∙ (1 − 𝑤𝑑2 )
√ 𝑑1 +
𝑛1 𝑛2

Вывод: если рассчитанное значение z-критерия больше 1,96, нулевая гипотеза


отвергается на выбранном уровне значимости (=0,05), принимается альтернативная ги-
потеза. В противном случае, нулевую гипотезу отбросить нельзя.

Первичная статистическая обработка экспериментальных данных.


1. Определить среднюю арифметическую ( x ). При необходимости рассчитать другие
средние (среднюю гармоническую, геометрическую и.т.д.).
2. Рассчитать среднее квадратическое отклонение (стандартное отклонение) (Sx)
3. Определить любым способом, представляет ли изучаемая выборка совокупность с
нормальным распределением. Наиболее просто можно найти отношение размаха R к
СКО (R/Sx). Полученное значение сравнить со значением из таблицы 1 для уровня зна-
чимости 10 % (для Р= 0,10) и фактического значения объема выборки (n). В случае нор-
мального распределения значения вычисленного отношения должны находиться в пре-
делах указанных границ. Если выборка распределяется по нормальному закону, перехо-
дим к п.4, если нет – к п. 6.
4
4. Рассчитать ошибку средней арифметической (стандартную ошибку) ( S ).
x

5. По таблице определить значение критерия Стьюдента (t) при известном числе степе-
ней свободы k и заданном уровне значимости  ( = 0,05).
Для нормального распределения построить доверительный интервал для генеральной
средней (). Для выборки, не распределяющейся по нормальному закону, рассчитать зна-
чение медианы, 1 и 3 квартилей, 5 и 95 процентилей и интерквартильный размах.
В случае сравнения двух выборок оценить значимость различия между их генеральными
параметрами с помощью правильно выбранного критерия.

Пример. Для изучения влияния кобальта на рост кроликов проводился опыт на


опытной и контрольной группах. Обе группы животных содержались на одном и том же
кормовом рационе. Но опытные кролики ежедневно получали добавку хлористого ко-
бальта в виде водного раствора по 0,06 г на 1 кг веса. За время опыта животные дали
прибавки в массе (г). Достоверны ли различия в прибавке массы в опытной и контроль-
ной группах?
выборки выборки Манна-Уитни Ранж. выб Ранги
1 2 1 2Me 820 640 1 x1 820 12,5 sumR1 100
8 720 Среднее 837,5 696,3q1 807,5 650 2 810 11 sumR2 36
28 640 Ст.откл 51,5 39,6q3 855 680 3 820 12,5
810 700 Размах 150 110 690 4 780 9 n1(n1+1)/2 36
720 740 Ст.ош 18,2 14,0P5 787 700 5 800 10 n2(n2+1)/2 36
80 650 S/R 2,91 2,78P95 919,5 720 6 900 15
09 750 tabl 2,59 –3,3 740 7 930 16 U1 64
09 690 tst 2,37 IQR1 47,5 750 8 840 14 U2 0
308 680 tst*Sx1 43,1 Me 695 780 9 x2 720 6
140 794, tst*Sx2 33,1 q1 672,5 800 10 640 1 Z(znam) √90,7
1_0 4 2_n_i
880, 663,2 q3 725 810 11 700 5 =9,5
_nк.Стьюд. 6 2_v_i 729,4 820 12 740 7 Z(chisl) -32
v_i
t 6,15 d=x1-x2 141,3 p-levelP5 643,5 820 12 650 2 Zfakt 3,36
_i
ф
k 14 Sd 22,9 2,5*10P95
-5 746,5 840 14 750 8 Zst 1,96
ф
tst 2,15 Sd*t 49,2 IQR2 52,5 900 15 690 4
ф Крамера-Уэлча 930 16 680 3 p-level 0,005
ф 141,3-49,2 <D<141,3-49,2 Дис1 2650 T 6,15
ф
Метод интервалов 92 <D< 190,5 Дис2 1569,6 p-level 2,5*10-5 6,15>1,96
ф
ф
ф Вывод (по тесту Стьюдента): так как фактически рассчитанная величина коэффи-
ф
циента
ф Стьюдента (6,15) больше статистического значения (2,15), принимается альтер-
ф
нативная
ф гипотеза: разность между средними значениями привесов кроликов опытной
ф
ифконтрольной групп не равна нулю (p-level = 2,5∙10-5).
ф
ф Вывод (по тесту Крамера-Уэлча): так как фактически рассчитанная величина ко-
ф
эффициента
ф Стьюдента (6,15) больше статистического значения (1,96), принимается аль-
ф
тернативная
ф гипотеза: разность между средними значениями привесов кроликов опыт-
ф
ной ф и контрольной групп не равна нулю (p-level = 2,5∙10 ).
-5
ф
ф
ф
ф
ф
ф
5
Вывод (построение доверительного интервала): так как построенный доверитель-
ный интервал для разности генеральных средних привесов кроликов опытной и кон-
трольной групп не содержит нулевое значение, принимается альтернативная гипотеза:
разность между средними значениями привесов кроликов опытной и контрольной групп
не равна нулю (достоверна).
Вывод (по тесту Манна-Уитни): так как фактически рассчитанная величина Z-
критерия (3,36) больше статистического значения (1,96), принимается альтернативная
гипотеза: разность между значениями медиан привесов кроликов опытной и контроль-
ной групп не равна нулю (p-level = 0,005).
Пример. Приведены данные о годовых удоях (кг) 13 коров и их дочерей. Отлича-
ются ли удои этих двух групп?
Годовой удой разница квадрат ранги
матерей дочерей в знаках фактическая
3770 2991 -779 779 606841 8
3817 4593 776 776 602176 7
2450 3529 1079 1076 1157776 10
3463 4274 811 811 657721 9
3500 3103 -397 397 157609 4
5544 3949 -1595 1597 2550409 12
3112 3491 379 379 143641 3
3150 3559 409 409 167281 5
3118 2916 -202 202 40804 1
3018 4580 1562 1562 2439844 11
4291 4510 219 219 47961 2
3463 4144 681 681 463761 6
3000 3000 0 0 0 -
n=13 sum 2943 sum 9035824 sumR(-)
d 245,25 n(n-1) 132 25
d2 60147,6 Sd 260,7634 sumR(+)
Стьюдент t 0,94 Wф =25 Wst = 15 53
Вывод (по тесту Стьюдента для связанных выборок): так как фактически рассчи-
танная величина коэффициента Стьюдента (0,94) меньше статистического значения
(2,15), принимается нулевая гипотеза: разность между средними значениями привесов
кроликов опытной и контрольной групп не равна нулю (p-level = 0,37).
Вывод (по тесту Вилкоксона): так как фактически установленная величина W-
критерия (25) больше критического значения W-критерия (15), принимается нулевая ги-
потеза: разность между значениями медиан привесов кроликов опытной и контрольной
групп равна нулю.

Пример. Получены следующие результаты сдачи зачета по биометрии студен-


тами дневного и заочного отделений. Признак X – успешная сдача студентом зачета
по биометрии. Действительно ли доля студентов, успешно сдающих биометрию, выше
у студентов дневного отделения по сравнению со студентами заочного?
6
Сдано Не сдано Всего доля
дневное 49 25 74 0,66
заочное 24 23 47 0,51
Всего 73 48 121
z 1,47 p-level 0,17
wd1 – (49/74=0,66) выборочная доля студентов дневного отделения, wd2 –
(24/47=0,51) выборочная доля студентов заочного отделения. n1 и n2 – объемы выборок,
n1 = 74; и n2 =47.
Вывод: так как рассчитанное значение z-критерия (1,47) меньше 1,96 принима-
ется нулевая гипотеза: разность между долей студентов успешно сдающих зачет по био-
метрии очного и заочного отделений равна нулю (p-level = 0,17).

 Рекомендуемая литература по теме:

1. Лакин Г.Ф. Биометрия. М., Высшая школа, 1990. с. 113 – 134.


2. Рокицкий П.Ф. Биологическая статистика., Минск, «Вышэйш.школа», 1973. с.
92-98.
3. А.И. Орлов. Математика случая. Вероятность и статистика – основные факты.
Учебное пособие. М.: МЗ-Пресс, 2004. http://www.aup.ru/books/m155/
Главы:
Основные понятия, используемые при проверке гипотез;
Параметрические и непараметрические гипотезы;
Статистические критерии.

Вопросы для самопроверки


1. Какие статистические тесты используются для выяснения, являются ли различия гене-
ральных параметров некоторого признака, измеренного в метрической шкале, случай-
ными или систематическими?
2. Какие статистические тесты используют для того, чтобы выяснить, являются ли раз-
личия генеральных параметров некоторого признака, измеренного в ранговой шкале,
случайными или систематическими?
3. Какие тесты используют при сравнении двух зависимых выборок по определенным
параметрам некоторого признака?
4. Что такое зависимые выборки?
5. Чем тест Стьюдента отличается от теста Манна-Уитни?
6. Чем вывод из теста Вилкоксона отличается от вывода из теста Манна-Уитни?
7. Что такое поправка Йетса на непрерывность?
8.Чем принятый уровень значимости отличается от достигаемого уровня значимости?