Академический Документы
Профессиональный Документы
Культура Документы
Довольно часто требуется на основе тех или иных данных сделать вывод, спра-
ведливо ли то или иное суждение. Например, верно ли, что в этом году зима теплее, чем
в прошлом? Правда, что студенты дневного отделения успешнее сдают зачет по биомет-
рии, чем студенты заочного? Так как исходные данные, необходимые для таких выводов
носят случайный характер, то и ответы на такие вопросы тоже можно дать лишь с опре-
деленной степенью уверенности (вероятности) и, соответственно, остается некоторая ве-
роятность ошибки. Поэтому при решении задач нужно уметь принимать обоснованные
выводы и оценивать вероятность ошибочности принятого решения.
Решение подобных вопросов осуществляется с помощью статистической гипо-
тезы относительно некоторых параметров сравниваемых групп. Статистическая ги-
потеза (statistical hypothesys) – это определённое предположение о распределении веро-
ятностей, лежащем в основе наблюдаемой выборки данных.
В области биометрии широко используется так называемая нулевая гипотеза
(Н0), которая чаще всего носит общепринятый характер. Например: средняя температура
воздуха зимы этого года не отличается от прошлогодней. Студенты дневного отделения
сдают зачет по биометрии так же, как студенты заочного.
Противоположная нулевой – альтернативная гипотеза (НА или Н1) – исходит
из обратного предположения, например, средняя температура воздуха зимы этого года
отличается от прошлогодней. Студенты дневного отделения успешнее сдают зачет по
биометрии, чем студенты заочного.
Гипотеза выражается в терминах вероятности и может быть проверена по выбо-
рочным характеристикам. Проверка статистической гипотезы или статистический
тест (testing statistical hypotheses) – это процесс принятия решения о том, противоречит
ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных или нет.
Однозначно определенный способ проверки статистических гипотез называ-
ется статистическим критерием. Статистический критерий строится с помощью ста-
2
тистики U(x1, x2, …, xn) – функции от результатов наблюдений x1, x2, …, xn. В простран-
стве значений статистики U выделяют некую критическую область, т.е. область со сле-
дующим свойством: если значения применяемой статистики принадлежат данной обла-
сти, то отклоняют (иногда говорят – отвергают) нулевую гипотезу, в противном случае
– не отвергают (т.е. принимают).
Статистику U, используемую при построении определенного статистического
критерия, называют статистикой этого критерия.
На практике, как правило, используются статистики с унимодальной (имеющей
форму пика) плотностью распределения. Критические области (наименее вероятные зна-
чения статистики) соответствуют «хвостам» этого распределения. Поэтому чаще всего
возникают критические области одного из трёх типов (рис. 8):
Верная гипотеза
H0 HA
Результат HH0 H0 верно принята H0 неверно принята
применения (ошибка второго рода)
критерия HHA H0 неверно отвергнута H0 верно отвергнута
(ошибка первого рода)
α=1–β
4
Функции распределения статистических критериев сведены в специальные таб-
лицы, где содержатся значения функции для разных чисел степеней свободы k или объ-
ема выборки n и уровней значимости .
Параметрические критерии предполагают, что выборка порождена распределе-
нием из заданного параметрического семейства. Прежде чем применять такие критерии,
необходимо убедиться, что выборка распределяется нормально. Гипотезы о виде рас-
пределения проверяются с помощью критериев согласия.
Непараметрические критерии не опираются на дополнительные предположения о
распределении, для их применения не надо проверять вид распределения исходных дан-
ных. В частности, к этому типу критериев относится большинство ранговых критериев.
В зависимости от проверяемой нулевой гипотезы статистические критерии де-
лятся на группы:
Критерии согласия проверяют, согласуется ли заданная выборка с заданным фик-
сированным распределением, с заданным параметрическим семейством распределений,
или с другой выборкой.
Критерий Колмогорова-Смирнова
Критерий хи-квадрат (Пирсона)
Критерии нормальности (выделенный частный случай критериев согласия).
Проверка на нормальность выполняется на первом шаге анализа выборки, чтобы решить,
использовать далее параметрические методы или непараметрические.
Критерий Шапиро-Уилка
Критерий асимметрии и эксцесса
Критерии сдвига (специальный случай двухвыборочных критериев согласия).
Проверяется гипотеза сдвига, согласно которой распределения двух выборок имеют оди-
наковую форму и отличаются только сдвигом на константу.
Критерий Стьюдента
Критерий Вилкоксона, Манна-Уитни
Критерии однородности предназначены для проверки нулевой гипотезы о том,
что две выборки (или несколько) взяты из одного распределения, либо их распределения
имеют одинаковые значения средней величины, дисперсии, или других параметров.
Критерии симметричности позволяют проверить симметричность распределе-
ния.
Одновыборочный критерий Вилкоксона
Критерий знаков
Коэффициент асимметрии
5
Критерии тренда и случайности предназначены для проверки нулевой гипо-
тезы об отсутствии зависимости между выборочными данными и номером наблюдения
в выборке. Они часто применяются в анализе временных рядов, в частности, при анализе
регрессионных остатков.
Критерии выбросов
Критерии дисперсионного анализа
Критерии корреляционного анализа
Критерии регрессионного анализа
Асимметрия и эксцесс
Среди эмпирических распределений довольно часто встречаются асимметрия и
эксцесс. Графически асимметрия выражается в виде скошенности вариационной кривой
левее или правее центра распределения (рис. 9. а). В первом случае асимметрия называ-
ется правосторонней или положительной (A > 0), а во втором — левосторонней или
отрицательной (A < 0).
Также встречаются островершинные и плосковершинные распределения. Ост-
ровершинность кривой распределения вызывается чрезмерным накапливанием в вариа-
ционном ряду частот с вариантами, близкими к среднему значению, вследствие чего вер-
шина вариационной кривой оказывается сильно поднятой вверх (рис. 9. б). В таких слу-
чаях говорят о положительном эксцессе распределения (E > 0). Плосковершинные (с
двумя и более вершинами) кривые свидетельствуют о наличии у такого распределения
отрицательного эксцесса (E < 0).
( xi x) f i ( xi x)
n k
3 3
n n
As i 1
As i 1
(n 1) (n 2) S x3 (n 1) (n 2) S x3
n (n 1) ( xi x) 4 3 (n 1) ( xi x) 2 ( xi x) 2
n n n
Ex i 1 i 1 i 1
(n 1) (n 2) (n 3) S 4
x
n (n 1) f i ( xi x) 4 3 (n 1) f i ( xi x) 2 f i ( xi x) 2
k k k
Ex i 1 i 1 i 1
(n 1) (n 2) (n 3) S 4
x
где Sx3, Sx4 – СКО. Предельная величина отрицательного эксцесса = –2. При отсутствии
эксцесса Ex = 0, при отсутствии асимметрии As = 0 (рис. 9. а и б).
Как и другие оценки генеральных параметров, показатели эксцесса и асимметрии
являются величинами случайными и сопровождаются ошибками репрезентативности:
6 6
S As S Ex 2
n3 n3
Сформулируем статистические гипотезы:
Для коэффициента асимметрии
Н0: в генеральной совокупности показатель асимметрии As равен нулю, данные
распределяются по нормальному закону.
НА (или Н1): в генеральной совокупности показатель асимметрии As не равен
нулю, данные не распределяются по нормальному закону.
Вывод: если величина tAs (отношение коэффициента асимметрии к своей
ошибке) больше 3
As
t As 3
S As
нулевая гипотеза отвергается, принимается альтернативная; значит, исходные данные
не распределяются по нормальному закону.
Для коэффициента эксцесса
Н0: в генеральной совокупности показатель эксцесса Ex равен нулю, данные рас-
пределяются по нормальному закону.
НА (или Н1): в генеральной совокупности показатель эксцесса Ex не равен нулю,
данные не распределяются по нормальному закону.
Вывод: если величина tEx (отношение коэффициента эксцесса к своей ошибке)
больше 3
Ex
t Ex 3
S Ex
7
нулевая гипотеза отвергается, принимается альтернативная; значит, исходные данные
не распределяются по нормальному закону.
Пример. Проверить гипотезу о нормальности распределения кальция в сыворотке
∑ (xi - x )3 = 10,06 ; Sx3 = 1,76; As = 0,06; ∑ (xi - x )4 = 594,7; Sx4 = 2,12; Ex = -0,19;
Ошибки: SAs = 0,24; SEx = 0,48. tAs = < 3; tEx = < 3. Н0 - гипотезу отбросить нельзя.
Учебное издание
Чайковская Наталья Антоновна
Учебное пособие