Вы находитесь на странице: 1из 9

Статистическая гипотеза

Понятие о статистической гипотезе. Нулевая и альтернативная гипотезы. Статистические критерии


(тесты). Вероятность справедливости нулевой гипотезы (уровень значимости).
Статистические ошибки I и II типа. Мощность критерия (теста). Понятие о параметрических и непа-
раметрических критериях (тестах).
Коэффициенты асимметрии и эксцесса.
Способы трансформации данных для приведения их к нормальному распределению: логарифмирование,
извлечение квадратного корня, преобразование Бокса-Кокса, угловое преобразование.

Довольно часто требуется на основе тех или иных данных сделать вывод, спра-
ведливо ли то или иное суждение. Например, верно ли, что в этом году зима теплее, чем
в прошлом? Правда, что студенты дневного отделения успешнее сдают зачет по биомет-
рии, чем студенты заочного? Так как исходные данные, необходимые для таких выводов
носят случайный характер, то и ответы на такие вопросы тоже можно дать лишь с опре-
деленной степенью уверенности (вероятности) и, соответственно, остается некоторая ве-
роятность ошибки. Поэтому при решении задач нужно уметь принимать обоснованные
выводы и оценивать вероятность ошибочности принятого решения.
Решение подобных вопросов осуществляется с помощью статистической гипо-
тезы относительно некоторых параметров сравниваемых групп. Статистическая ги-
потеза (statistical hypothesys) – это определённое предположение о распределении веро-
ятностей, лежащем в основе наблюдаемой выборки данных.
В области биометрии широко используется так называемая нулевая гипотеза
(Н0), которая чаще всего носит общепринятый характер. Например: средняя температура
воздуха зимы этого года не отличается от прошлогодней. Студенты дневного отделения
сдают зачет по биометрии так же, как студенты заочного.
Противоположная нулевой – альтернативная гипотеза (НА или Н1) – исходит
из обратного предположения, например, средняя температура воздуха зимы этого года
отличается от прошлогодней. Студенты дневного отделения успешнее сдают зачет по
биометрии, чем студенты заочного.
Гипотеза выражается в терминах вероятности и может быть проверена по выбо-
рочным характеристикам. Проверка статистической гипотезы или статистический
тест (testing statistical hypotheses) – это процесс принятия решения о том, противоречит
ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных или нет.
Однозначно определенный способ проверки статистических гипотез называ-
ется статистическим критерием. Статистический критерий строится с помощью ста-
2
тистики U(x1, x2, …, xn) – функции от результатов наблюдений x1, x2, …, xn. В простран-
стве значений статистики U выделяют некую критическую область, т.е. область со сле-
дующим свойством: если значения применяемой статистики принадлежат данной обла-
сти, то отклоняют (иногда говорят – отвергают) нулевую гипотезу, в противном случае
– не отвергают (т.е. принимают).
Статистику U, используемую при построении определенного статистического
критерия, называют статистикой этого критерия.
На практике, как правило, используются статистики с унимодальной (имеющей
форму пика) плотностью распределения. Критические области (наименее вероятные зна-
чения статистики) соответствуют «хвостам» этого распределения. Поэтому чаще всего
возникают критические области одного из трёх типов (рис. 8):

Рис. 8. Критические области распределений: а) левосторонняя; б) двусторонняя; в) правосто-


ронняя

Левосторонняя критическая область определяется интервалом (рис. 8, а):


[─ ∞, tα]
Двусторонняя критическая область определяется двумя интервалами (рис. 8, б):
[─ ∞, tα/2]U[t(1-α)/2,+ ∞,]
Правосторонняя критическая область определяется интервалом (рис. 8, в):
[t1-α,+ ∞].
В биометрии применяют два вида статистических критериев: параметрические и
непараметрические. Параметрические строятся на основании параметров данной со-
вокупности (например, x , Sx2) и представляют функции этих параметров. Непарамет-
рические представляют собой функции, зависящие непосредственно от вариант совокуп-
ности с их частотами. Параметрические служат для проверки гипотез о параметрах со-
вокупностей, распределяемых по нормальному закону, непараметрические – для про-
верки рабочих гипотез независимо от формы распределения совокупностей.
При нормальном распределении признака параметрические критерии обладают
большей безошибочностью и мощностью, чем непараметрические критерии. В случае
3
очень больших отличий в распределении признака от нормального вида применяют не-
параметрические критерии. При изучении качественных признаков применяют только
непараметрические критерии.
Статистический тест включает 4 основных элемента:
1. Формулировку нулевой гипотезы (Н0);
2. Формулировку альтернативной гипотезы (НА или Н1);
3. Вычисление статистики теста. Вопрос о том, какую статистику надо взять для
проверки той или иной гипотезы, решается отдельно в каждом отдельном случае.
4. Определение фиксированного уровня значимости (не более 0,05). Определение
достигаемого уровня значимости. Достигаемый уровень значимости (p-value) – это
наименьшая величина уровня значимости, при которой нулевая гипотеза отвергается для
данного значения вычисляемой статистики критерия (p < 0,05). Нулевую гипотезу не
отвергают, если в результате исследования окажется, что p-value превышает 5%, т. е.
p > 0,05.
При проверке статистических гипотез возможны ошибки первого и второго рода.
Ошибка первого рода или «ложная тревога» (англ. type I error, false positive) –
когда нулевая гипотеза отвергается, хотя на самом деле она верна. Максимальная до-
пустимая вероятность ошибки первого рода α (вероятность справедливости нулевой ги-
потезы) – это уровень значимости выбранного критерия.
Ошибка второго рода или «пропуск цели» (англ. type II error, false negative) –
когда нулевая гипотеза принимается, хотя на самом деле она не верна. Минимальная
допустимая вероятность ошибки второго рода β (вероятность справедливости альтерна-
тивной гипотезы) – мощность выбранного критерия. Чем ближе мощность критерия к
1, тем более эффективен критерий. Мощность критерия – это вероятность того, что ну-
левая гипотеза будет отвергнута, когда альтернативная гипотеза верна (табл. 5).

Таблица 5 – ошибки первого и второго рода

Верная гипотеза
H0 HA
Результат HH0 H0 верно принята H0 неверно принята
применения (ошибка второго рода)
критерия HHA H0 неверно отвергнута H0 верно отвергнута
(ошибка первого рода)

Максимальная допустимая вероятность ошибки первого рода α и минимальная


допустимая вероятность ошибки второго рода β связаны между собой выражением:

α=1–β
4
Функции распределения статистических критериев сведены в специальные таб-
лицы, где содержатся значения функции для разных чисел степеней свободы k или объ-
ема выборки n и уровней значимости .
Параметрические критерии предполагают, что выборка порождена распределе-
нием из заданного параметрического семейства. Прежде чем применять такие критерии,
необходимо убедиться, что выборка распределяется нормально. Гипотезы о виде рас-
пределения проверяются с помощью критериев согласия.
Непараметрические критерии не опираются на дополнительные предположения о
распределении, для их применения не надо проверять вид распределения исходных дан-
ных. В частности, к этому типу критериев относится большинство ранговых критериев.
В зависимости от проверяемой нулевой гипотезы статистические критерии де-
лятся на группы:
Критерии согласия проверяют, согласуется ли заданная выборка с заданным фик-
сированным распределением, с заданным параметрическим семейством распределений,
или с другой выборкой.
Критерий Колмогорова-Смирнова
Критерий хи-квадрат (Пирсона)
Критерии нормальности (выделенный частный случай критериев согласия).
Проверка на нормальность выполняется на первом шаге анализа выборки, чтобы решить,
использовать далее параметрические методы или непараметрические.
Критерий Шапиро-Уилка
Критерий асимметрии и эксцесса
Критерии сдвига (специальный случай двухвыборочных критериев согласия).
Проверяется гипотеза сдвига, согласно которой распределения двух выборок имеют оди-
наковую форму и отличаются только сдвигом на константу.
Критерий Стьюдента
Критерий Вилкоксона, Манна-Уитни
Критерии однородности предназначены для проверки нулевой гипотезы о том,
что две выборки (или несколько) взяты из одного распределения, либо их распределения
имеют одинаковые значения средней величины, дисперсии, или других параметров.
Критерии симметричности позволяют проверить симметричность распределе-
ния.
Одновыборочный критерий Вилкоксона
Критерий знаков
Коэффициент асимметрии
5
Критерии тренда и случайности предназначены для проверки нулевой гипо-
тезы об отсутствии зависимости между выборочными данными и номером наблюдения
в выборке. Они часто применяются в анализе временных рядов, в частности, при анализе
регрессионных остатков.
Критерии выбросов
Критерии дисперсионного анализа
Критерии корреляционного анализа
Критерии регрессионного анализа

Асимметрия и эксцесс
Среди эмпирических распределений довольно часто встречаются асимметрия и
эксцесс. Графически асимметрия выражается в виде скошенности вариационной кривой
левее или правее центра распределения (рис. 9. а). В первом случае асимметрия называ-
ется правосторонней или положительной (A > 0), а во втором — левосторонней или
отрицательной (A < 0).
Также встречаются островершинные и плосковершинные распределения. Ост-
ровершинность кривой распределения вызывается чрезмерным накапливанием в вариа-
ционном ряду частот с вариантами, близкими к среднему значению, вследствие чего вер-
шина вариационной кривой оказывается сильно поднятой вверх (рис. 9. б). В таких слу-
чаях говорят о положительном эксцессе распределения (E > 0). Плосковершинные (с
двумя и более вершинами) кривые свидетельствуют о наличии у такого распределения
отрицательного эксцесса (E < 0).

Рис. 9. Эмпирические распределения: а) с асимметрией; б) с эксцессом

Асимметрия и эксцесс эмпирических распределений могут возникнуть вследствие


действия на признак как систематических, так и случайных факторов. Поэтому для опре-
деления причин отклонения эмпирических распределений от нормальной кривой рассчи-
тывают показатели асимметрии As и эксцесса Ex (невзвешенные и взвешенные):
6

 ( xi  x)  f i  ( xi  x)
n k
3 3
n n
As   i 1
As   i 1

(n 1)  (n  2) S x3 (n 1)  (n  2) S x3
n  (n  1)   ( xi  x) 4  3  (n 1)   ( xi  x) 2   ( xi  x) 2
n n n

Ex  i 1 i 1 i 1

(n 1)  (n  2)  (n  3)  S 4
x

n  (n  1)   f i  ( xi  x) 4  3  (n 1)   f i  ( xi  x) 2   f i  ( xi  x) 2
k k k

Ex  i 1 i 1 i 1

(n 1)  (n  2)  (n  3)  S 4
x

где Sx3, Sx4 – СКО. Предельная величина отрицательного эксцесса = –2. При отсутствии
эксцесса Ex = 0, при отсутствии асимметрии As = 0 (рис. 9. а и б).
Как и другие оценки генеральных параметров, показатели эксцесса и асимметрии
являются величинами случайными и сопровождаются ошибками репрезентативности:

6 6
S As  S Ex  2 
n3 n3
Сформулируем статистические гипотезы:
Для коэффициента асимметрии
Н0: в генеральной совокупности показатель асимметрии As равен нулю, данные
распределяются по нормальному закону.
НА (или Н1): в генеральной совокупности показатель асимметрии As не равен
нулю, данные не распределяются по нормальному закону.
Вывод: если величина tAs (отношение коэффициента асимметрии к своей
ошибке) больше 3
As
t As  3
S As
нулевая гипотеза отвергается, принимается альтернативная; значит, исходные данные
не распределяются по нормальному закону.
Для коэффициента эксцесса
Н0: в генеральной совокупности показатель эксцесса Ex равен нулю, данные рас-
пределяются по нормальному закону.
НА (или Н1): в генеральной совокупности показатель эксцесса Ex не равен нулю,
данные не распределяются по нормальному закону.
Вывод: если величина tEx (отношение коэффициента эксцесса к своей ошибке)
больше 3
Ex
t Ex  3
S Ex
7
нулевая гипотеза отвергается, принимается альтернативная; значит, исходные данные
не распределяются по нормальному закону.
Пример. Проверить гипотезу о нормальности распределения кальция в сыворотке

крови павианов гамадрилов (табл. 2). ( x = 11,92; sx = 1,2).

∑ (xi - x )3 = 10,06 ; Sx3 = 1,76; As = 0,06; ∑ (xi - x )4 = 594,7; Sx4 = 2,12; Ex = -0,19;
Ошибки: SAs = 0,24; SEx = 0,48. tAs = < 3; tEx = < 3. Н0 - гипотезу отбросить нельзя.

Способы трансформации данных для приведения их к нормальному распределению


Если показано, что гипотеза нормальности распределения не может быть принята,
используют преобразование исходных данных для приведения их к нормальному виду.
После получения окончательного результата необходимо выполнить обратное преобра-
зование. Преобразование исходных значений x в y происходит по правилу y = f(x), где f
– это некоторая определенная монотонная функция, тогда от значений y можно одно-
значно вернуться к значениям x.
Очень часто для приведения распределения к нормальному виду используется ло-
гарифмическое преобразование значений исходных наблюдений.
y = logx
Подобная трансформация уменьшает неоднородность дисперсий на отдельных от-
резках вариационного ряда, снижает асимметрию распределения.
Логарифмическое преобразование является частным случаем преобразования
Бокса-Кокса, где y = f(x,α), α ≥ 0, значение α исследователь выбирает самостоятельно.
𝒙𝜶 − 𝟏
𝒇(𝒙, 𝜶) =
𝜶
Преобразование Бокса-Кокса при α < 1 растягивает расстояния между малыми
значениями и сжимает его между большими по величине значениями данных, при α > 1
наблюдается обратная картина, а при α = 0 это преобразование действует как логариф-
мическое.
Если данные представляют собой распределение площадей, из вариант ряда из-
влекают квадратный корень:
𝑦 = 𝑓(𝑥) = √𝑥
Угловое преобразование Фишера чаще всего применяют к данным, представлен-
ным процентами, которые априори не могут быть нормально распределены.
𝑦 = 𝜑(𝑥) = 2𝑥 arcsin( √𝑤𝑑 ),
где wd - доля события, выраженная в долях единицы, а арксинус считается в радианах
(например, для p=0,02 𝜑(𝑥)=0,283786...).
8

 Рекомендуемая литература по теме:

1. Лакин Г.Ф. Биометрия. М., Высшая школа, 1990. с. 89 – 92, с. 111-113.


2. Рокицкий П.Ф. Биологическая статистика., Минск, «Вышэйш.школа», 1973. с. 53 – 76,
с. 91-92.
3. Орлов А.И. Математика случая. Вероятность и статистика – основные факты. Учебное
пособие. М.: МЗ-Пресс, 2004. c
Главы:
 Основные понятия, используемые при проверке гипотез;
 Параметрические и непараметрические гипотезы;
 Статистические критерии.

Вопросы для самопроверки

1. Что такое статистическая гипотеза?


2. Чем нулевая гипотеза отличается от альтернативной?
3. Что такое статистическая ошибка I типа? II типа.
4. Что такое мощность критерия?
5. В каких случаях используют параметрические критерии, а в каких - непараметриче-
ские?
6. Что такое асимметрия?
7. Что такое эксцесс?
8. Какие вы знаете способы трансформации данных для приведения их к нормальному
распределению?
9

Учебное издание
Чайковская Наталья Антоновна

БИОМЕТРИЯ. КУРС ЛЕКЦИЙ. ЧАСТЬ 1-ая.

Учебное пособие

Редактор Е.А. Смирнова


Компьютерная верстка П.И. Крышаловича

Сдано в набор 25.12.2011. Подписано в печать 05.01.2012.


Формат 6084/16. Бумага офсетная №1.
Печать офсетная. Гарнитура Times.
Усл. печ. л.9,28. Уч.-изд.л. 10,1.
Тираж 150 экз. Заказ 103.

Учреждение образования «Гродненский государственный университет имени


Янки Купалы».
ЛВ № 96 от 02.12.97. Ул. ? Гродно