Вы находитесь на странице: 1из 17

Занятие № 3

ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ


Цель работы: изучить приёмы работы с инструментами
Пакета анализа и встроенными функциями MS Excel для
проверки статистических гипотез.
Под статистической гипотезой понимают всякое
высказывание о генеральной совокупности, проверяемое по
выборке.
Выдвинутая гипотеза называется нулевой (или основной) и
обозначается H0. Гипотеза, которая противоречит нулевой,
называется конкурирующей (или альтернативной) и
обозначается H1. Для проверки нулевой гипотезы используют
критерий ‒ специально подобранную случайную величину,
распределение которой известно. Значение критерия,
вычисленное по выборкам, называется наблюдаемым (или
экспериментальным) значением и обозначается Zнабл.
Множество возможных значений критерия разбивается на два
непересекающихся подмножества: одно из них содержит
значения, при которых нулевая гипотеза отвергается
(критическая область), а другое – при которых она
принимается (область допустимых значений или область
принятия гипотезы).
Различают одностороннюю (правостороннюю или
левостороннюю) и двустороннюю критические области. Если
наблюдаемое значение критерия принадлежит критической
области, то основная гипотеза H0 отклоняется и принимается
альтернативная гипотеза H1, если же Zнабл. принадлежит
области допустимых значений, то принимается H0, отвергается
H1.
Схема проверки гипотезы:
1. Формирование нулевой гипотезы H0 и конкурирующей
гипотезы H1.
2. Выбор вероятности  − уровня значимости нулевой гипотезы
H0.
3. Вычисление соответствующего уровню значимости
критического значения статистики (статистического
критерия) Zкр.

1
4. Вычисление по выборкам наблюдаемого значения критерия
Zнабл..
5. Сравнение наблюдаемого значения критерия с критическим
(проверка попадания критерия в критическую область). Если
Zнабл. попадает в критическую область, то нулевая гипотеза H0
отвергается и принимается конкурирующая гипотеза H1. Если
же нет, то нет оснований отвергать нулевую гипотезу.
В статистических пакетах обычно не используется значения
задаваемого уровня значимости . В выходных данных
содержатся выборочные значения Zнабл. статистики критерия Z и
вероятность того, что случайная величина Z (при условии, что
верна гипотеза H0) превышает выборочное значение Zнабл., т. е.
значение
p=P Z>|Z набл .||H
[ ]
0
Эта вероятность называется p-значением (p-level).
При двусторонней проверке p-значение равно
p=2 P Z >|Z набл .||H
[ ]
. 0

Таким образом, p – минимальный уровень значимости, при


котором гипотеза может быть отвергнута.
Если p > , где  − заданный уровень значимости, гипотеза
H0 принимается на уровне значимости p. Если p <  − гипотеза
H0 отклоняется, так как Zнабл. попадает в критическую
область, причём вероятность ошибки первого рода равна p.
В MS Excel проверить некоторые гипотезы можно
несколькими способами: с использованием встроенных функций
и с помощью инструментов Пакета анализа.

1. Проверка гипотезы о равенстве дисперсий


На практике необходимость сравнения дисперсий возникает
при сравнении точности приборов, инструментов, методов
измерений.
1.1. Сравнение двух дисперсий нормальных генеральных
совокупностей
Пусть генеральные совокупности X и Y распределены
нормально. Требуется по двум независимым выборкам (x1, x2, …,

2
xn) объёма n и (y1, y2, …, ym) объёма m, извлечённым из этих
совокупностей, проверить гипотезу H0: D(X) = D(Y).
В качестве статистического критерия рассматривается
2
S
отношение большей исправленной дисперсии б . к меньшей
2
S м. :
2
Sб .
F= 2
Sм. .
Если нулевая гипотеза H0: D(X) = D(Y) верна, то статистика F
имеет распределение Фишера-Снедекора со степенями свободы
k1 = n1 - 1, k2= n2 -1, где n1 ‒ объём выборки, которая
соответствует большей дисперсии, n2 ‒ объём выборки, которая
соответствует меньшей дисперсии. Значение, вычисленное по
формуле, обозначим Fнабл.. Если Fнабл < Fкр.(, k1, k2 ), то нет
оснований отвергать нулевую гипотезу.
Рассмотрим проверку гипотезы непосредственным расчётом
по формулам с использованием встроенных функций.
Пример 1. Пробу глины проанализировали в двух
лабораториях и получили следующие значения содержания SiO2,
%:
лаборатория № 1 (n = 5): 41,6; 41,9; 41,4; 41,3; 41,7;
лаборатория № 2: (m = 8): 41,1; 40,9; 41,3; 41,4; 42,1; 41,5;
41,4; 40,7.
Полагая, что содержание SiO2 подчиняются нормальному
закону распределения, выяснить, можно ли считать равными
оценки случайных погрешностей результатов анализа.
Решение
Введём выборочные данные в диапазоны А2:А6 и B2:B9, а
тексты-метки в ячейки А1, B1, C2, C3, C4, C5, C6.
В ячейку D2 ввести формулу:=ДИСП.В(A2:A6). Получим
значение исправленной выборочной дисперсии для лаборатории
1: 0,057.
В ячейку D3 ввести формулу: =ДИСП.В(B2:B9). Получим
значение исправленной выборочной дисперсии для лаборатории
2 : 0,018.
Так как D3 > D2, в ячейку D4 введём формулу = D3/ D2.
Получим наблюдаемое значение критерия: 3,16.

3
Вычислим критические значения критерия. Функция
F.ОБР.ПХ(вероятность;степени_свободы1;
степени_свободы2) возвращает обратное значение для F-
распределения вероятностей.
Зададим уровень значимости α = 0,05. В ячейки D5 и D6
введём соответственно формулы: = F.ОБР.ПХ (0,05; 7; 4) и =
F.ОБР.ПХ (0,025; 7; 4). Получим в ячейках D5 и D6
критические значения Fкр.: 6,09 и 9,07.

Если в качестве альтернативной гипотезы рассматривается


гипотеза H1: D(Y) > D(X), то уровню значимости α = 0,05 и
степеням свободы k1 = 7 и k2= 4 соответствует Fкр.= 6,09. Так как
Fнабл. < . Fкр., то гипотеза H0: D(X) = D(Y) принимается.
При альтернативной гипотезе H1: D(Y) ≠ D(X) в качестве
критического значения принимается Fкр.= 9,07, также нет
оснований отвергать нулевую гипотезу (3,16 < 9,07).
Вывод: результаты можно считать равноточными.

Для проверки гипотезы о равенстве дисперсий можно


использовать функцию F.ТЕСТ(Массив 1, Массив 2), которая
определяет расчётное значение уровня значимости p в случае
двусторонней критической области.
Введём в свободную ячейку, например в D7, формулу:
=F.ТЕСТ(A2:A6; B2:B9). Получим результат: 0,28. (Уровень
значимости для двусторонней критической области, а для

4
односторонней  0,14). Так как p > 0,05, то гипотеза H0
принимается на уровне значимости p.

Проверим нулевую гипотезу с помощью инструмента Пакета


анализа «Двухвыборочный F-тест для дисперсии». Перейдём
на вкладку Данные и в группе Анализ нажмём кнопку Анализ
данных. В диалоговом окне Анализ данных выберем инструмент
«Двухвыборочный F-тест для дисперсии» и в окне диалога
введём следующие значения:

Нажмём кнопку ОК и получим следующий результат:

5
В таблице результатов: df ‒ число степеней свободы;
2 2
F=S 1 / S2 =0 , 32 . Так как
S 21 < S 22
, то альтернативная
гипотеза формулируется как H1: D(X) < D(Y) и строится
левосторонняя критическая область в интервале (0; 0,16). Так
как Fкр.= 0,32. Fнабл > Fкр., следовательно наблюдаемое значение
критерия не попадает в критическую область, и нулевую
гипотезу следует принять. Значение левосторонней критической
точки (показатель F критическое одностороннее)
рассчитывается по формуле: =F.ОБР (0,05;4; 7).

2. Проверка гипотезы о равенстве средних


Пусть в результате наблюдений получены независимые
выборки из нормально распределённых генеральных
совокупностей X и Y: (x1, x2, …, xn) объёма n и (y1, y2, …, ym)
объёма m. Требуется проверить гипотезу о том, что
математические ожидания случайных величин X и Y равны, то
есть нулевая гипотеза H0: M(X) = M(Y).
2.1. Проверка гипотезы о равенстве средних при
известных дисперсиях
Пусть дисперсии случайных величин D(X) и D(Y) известны.
В качестве критерия используется статистика
x−y
N=
D( X ) D(Y )
√ n
+
m
Величина N является стандартной нормальной случайной
величиной с нулевым математическим ожиданием и единичной
дисперсией. Величину N, вычисленную по выборкам, обозначим
Nнабл..
Для вычисления критического значения Nкр.. можно
воспользоваться функцией НОРМСТОБР(вероятность),
которая возвращает обратное значение стандартного
нормального распределения.
Для проверки гипотезы при известных дисперсиях можно
использовать инструмент Пакета анализа «Двухвыборочный z-
тест для средних».

6
2.2. Проверка гипотезы о равенстве средних при
неизвестных дисперсиях
Если дисперсии неизвестны, но известно, что они равны (то
есть гипотеза о равенстве дисперсий подтверждается), то
наблюдаемое значение критерия рассчитывается по формуле:
x−y nm ( n+ m−2 )
T набл.= 2 √
2
√ ( n−1 ) S x +( m−1 ) S y

n+m
.
Критическое значение критерия Т кр. находится по
распределению Стъюдента по заданному α и числу степеней
свободы
k = n + m - 2. Если Tнабл.> Tкр., то нулевую гипотезу следует
отвергнуть и принять альтернативную гипотезу. Если Tнабл.<
Tкр., то нулевую гипотезу следует принять.

Пример 2. Проверить гипотезу о равенстве средних для


данных примера 1.
В предположении, что дисперсии генеральных совокупностей
одинаковы, требуется проверить гипотезу H0: M(X) = M(Y), то
есть необходимо установить, значимо или незначимо
различаются статистические оценки x и y , вычисленные
по независимым выборкам.
Решение
Расчет Tнабл. По формуле из п.п. 2.2.
Tкр (α; k = n + m – 2) = СТЬЮДРАСПОБР(α; k) =
= СТЬЮДРАСПОБР(0,05; 5+8-2) = 2,2
Вывод: Так как
|T
набл. |<T
кр. , то нет оснований отвергать
нулевую гипотезу. Уровень значимости также больше 0,05.
Для проверки гипотезы воспользуемся стандартной функцией
MS Excel ТТЕСТ, которая определяет вероятность P,
соответствующую найденному значению критерия. Аргументы
функции: Массив1 – первый набор данных; Массив2 – второй
набор данных; Хвосты – число хвостов распределения (1 или 2).
Если Хвосты равно 1, то функция определяет уровень
значимости для односторонней доверительной вероятности.
Если Хвосты равно 2, то функция определяет уровень

7
значимости для двусторонней доверительной вероятности. Тип
– вид исполняемого теста: 1 – парный; 2- двухвыборочный с
равными дисперсиями (гомоскедатический); 3 –
двухвыборочный с неравными дисперсиями
(гетероскедастический).
В ячейку В30 введём формулу:
=TТЕСТ(A2:A6;B2:B9;2;2). Получим результат: .

Проверим гипотезу с использованием инструмента Пакета


анализа Двухвыборочный t-тест с одинаковыми
дисперсиями.
В таблице объединённая дисперсия рссчитывается по
формуле:

S 2

 n  1 S12   m  1 S 22
nm2

Замечание. В случае, если гипотеза о равенстве дисперсий не


подтверждается, то для проверки гипотезу о равенстве средних

8
следует использовать инструмент Двухвыборочный t-тест с
разными дисперсиями.
3. Применение непараметрических критериев для проверки
гипотез
Непараметрическими называются критерии, не включающие
в формулу расчета параметры распределения, и не
предполагающие знания функции распределения. Эти критерии
оперируют частотами или рангами.
3.1 Проверка гипотезы о законе распределения
Одной из задач математической статистики является
нахождение закона распределения случайной величины по
выборочным данным. Критерий проверки гипотезы о
предполагаемом законе распределения называют критерием
согласия.
Критерий согласия хи-квадрат К.Пирсона для проверки
гипотезы о виде закона распределения
Критерий хи-квадрат основан на сравнении наблюдаемых и
теоретических (вычисленных в предположении известного
закона распределения) частот. Критерий предполагает, что
результаты наблюдений сгруппированы в статистический ряд
(дискретный или интервальный, содержащий k разрядов).
Схема проверки гипотезы
1. Выдвигается гипотеза H0 о законе распределения случайной
величины Х с функцией распределения F(x)  модель закона
распределения.
2. По результатам наблюдений находят оценки неизвестных
параметров этой модели. Определяются наблюдаемые частоты
mi (i=1,…,k) попадания элементов выборки в полученные
интервалы.
теор.
3. Определяются теоретические (ожидаемые) частоты mi
попадания выборочных значений в промежутки, для чего:
 используя теоретическую функцию распределения F(x),
определяют вероятности
pi того, что случайная величина Х
примет значения xi;

9
 находят значения теоретических частот mтеор.
i путём
умножения полученных вероятностей
pi на объём выборки n:
mтеор.
i =np i .
4. Находится выборочное значение критерия согласия
К.Пирсона по формуле:
2
2
k
(mi −miтеор ) k m2i
χ набл .=∑ =∑ теор −n
i=1 m теор
i i=1 mi
,
теор.
где:
m
i (i=1,…,k)  наблюдаемые частоты; m i 
теоретические частоты (найдены по модели); n  объём выборки.
Для выбранного уровня значимости  при числе степеней
свободы df =k−r−1 , где r – число параметров
теоретического распределения вероятностей, оцениваемых по
2
данным выборки, находят критическое значение χ кр . Если
экспериментальное значение χ 2набл . больше критического, т.е.
2
χ набл > χ 2кр . , то гипотеза H0 отвергается; если
2
χ набл . <
2
χ кр .
, гипотеза H0 не противоречит экспериментальным
данным.
Ограничения критерия хи-квадрат К.Пирсона
1) Объём выборки должен быть достаточно большим: n  30.
2) Теоретическая частота для каждой ячейки не должна быть
меньше 5.

Пример 3. Был измерен вес (в кг) у 55 обезьян-павианов. По


выборке был построен интервальный статистический ряд.
Проверить гипотезу о нормальном распределении генеральной
совокупности, приняв уровень значимости α = 0,1.

Номер Границы интервала Наблюдаемая


интервала,
[a i ; ai+1 ) частота, mi
k
1 10  12 2

10
2 12  14 4
3 14  16 8
4 16  18 12
5 18  20 16
6 20  22 10
7 22  24 3

Решение
Ввести исходные данные в диапазон A2:C8. В диапазоне
D2:D8 рассчитать середины интервалов по формуле =(B2+C2)/2,
которую затем протянуть до D8.
В ячейки E2:E8 ввести наблюдаемые частоты.
В ячейку E9 ввести объём выборки n = 55.
В ячейке В10 рассчитать среднее выборки по формуле
k
1
x= ∑ x i m i
n i=1 = СУММПРОИЗВ(D2:D8;E2:E8)/$E$9.
В ячейке В11 рассчитать выборочную дисперсию по
формуле:
k
1
Dв= ∑ xi2 mi −x 2
n i=1
= СУММПРОИЗВ(D2:D8;D2:D8;E2:E8)/$E$9-B10^2.
В ячейке В12 рассчитать выборочное стандартное
отклонение:
σ =√ D
в в = КОРЕНЬ(В11).
Для расчёта теоретических частот в ячейку F2 формулу:
=(НОРМРАСП(C2;$B$10;$B$12;ИСТИНА) –
НОРМРАСП(B2;$B$10;$B$12;ИСТИНА))*$E$9,
которую затем протянем до ячейки F8.
Так как для первого интервала левая граница принимается
равной – ∞, то исправим формулу в ячейке F2:
=(НОРМРАСП(C2;$B$10;$B$12;ИСТИНА)-0)*$E$9.
Так как для последнего интервала правая граница
принимается равной + ∞, то исправим формулу в ячейке F8:
=(1-НОРМРАСП(B8;$B$10;$B$12;ИСТИНА))*$E$9.

11
Объединим частоты для первого и второго интервалов, а
также для шестого и седьмого интервалов.
k 2
2 mi
χ набл .=∑ теор −n
i=1 m i
Рассчитываем
В ячейке I11рассчитаем значение критерия хи-квадрат: 1,11.
Найдём критическое значение критерия для α = 0,1 и числа
степеней свободы df = k – r – 1 = 5 – 2 – 1 = 2 (r = 2 для
нормального распределения) с использованием функции:
= ХИ2ОБР(0,1;2). Получим результат: 4,61.
2 2
Так как χ набл . < χ кр . (1,11<4,61), то гипотезу о том, что
вес обезьян подчиняется нормальному закону, следует принять.
3.2. Ранговые критерии

Рангом наблюдения называют номер, который получит это


наблюдение в упорядоченной совокупности всех данных после
упорядочения их согласно определённому правилу (например,
от меньшего значения к большему).
Ранжирование  процесс присвоения элементам выборки

3.2.1.Сравнение двух независимых выборок. U - критерий


Манна-Уитни
Критерий предназначен для проверки гипотезы о
статистической однородности двух независимых выборок, т.е.
для оценки различий между двумя выборками по уровню
какого-либо признака, количественно измеренного. Он

12
позволяет выявлять различия между малыми выборками, когда
n1, n2 3 или n1 = 2, n2  5 (n1 и n2 – объёмы выборок). В каждой
выборке должно быть не более 60 наблюдений: n1, n2  60.
Критерий Манна-Уитни основан на попарном сравнении
результатов из первой и второй выборок.
Проверяются следующие гипотезы:
H0: уровень признака в группе 2 не ниже уровня признака
в группе 1.
H1: уровень признака в группе 2 ниже уровня признака в
группе 1.
Схема применения критерия Манна-Уитни
1. Объединить вместе значения для обеих групп по степени
нарастания признака.
2. Проранжировать значения, приписывая меньшему значению
меньший ранг. Всего рангов (n1 + n2).
3. Подсчитать сумму рангов значений первой выборки и сумму
рангов значений второй выборки. Определить большую из
двух ранговых сумм.
4. Определить значение Uнабл. по формуле:
nx ( n x +1 )
U набл .=n1 n 2 + −T x
2
где: n1, n2  объёмы выборок 1 и 2; T x  большая из двух
ранговых сумм; nx  объём выборки с большей суммой
рангов.
5. Определить критические значения Uкр. для заданных n1, n2 и
уровня значимости  по таблице. Если Uнабл.> Uкр., то H0
принимается. Если Uнабл. Uкр., то H0 отвергается. Чем меньше
значения U, тем достоверность различий выше.
Пример 4. Две группы выпускников двух высших учебных
заведений (1 и 2) (в первой группе 9 человек, во второй -10),
получили оценки своих административных способностей в
баллах.
1 вуз: 26; 23; 19; 21; 14; 18; 29; 17; 12.
2 вуз: 16; 10; 8; 13; 24; 20; 7; 15; 9; 22.
С помощью критерия Манна-Уитни при уровне значимости 
 0,05 проверить нулевую гипотезу о том, группа выпускников

13
первого вуза не превосходит группу выпускников второго вуза
по уровню административных способностей.
Решение
Сформулируем гипотезы:
H0: Группа выпускников первого вуза не превосходит группу
выпускников второго вуза по уровню административных
способностей (т.е. различия незначимы).
H1: группа выпускников первого вуза превосходит группу
выпускников второго вуза по уровню административных
способностей. (В данном случае H1 является направленной).
Введём исходные данные в ячейки A2:A10 (показатели
выпускников 1 вуза) и в ячейки B2:B11 (показатели
выпускников 2 вуза).
В ячейках C2:C20 составим объединенную выборку и
выпоним ранжирование. Для этого в ячейку D2 введём формулу
=РАНГ(C2;$C$2:$C$20;1) и протянем её до ячейки D20.
Замечание. В случае, если в выборках имеются совпадающие
значения, то вместо функции РАНГ следует использовать
функцию РАНГ.СР для вычисления средних рангов.
В ячейки F7 и F8 введём объемы выборок, а в ячейку F9 
объём объединённой выборки.
В ячейках F10 и F11 рассчитаем суммы рангов элементов
каждой из выборок по формулам:
=СУММ(D2:D10) и =СУММ(D11:D20).
Получим результаты: 112 и 78.
Выполним проверку правильности ранжирования, вычислив
общую сумму рангов, и сравним её с суммой рангов, найденной
N ( N +1 )
∑ ( R i )= 2
по формуле: .
В ячейку F13 введём формулу = F10+F11. Получим
результат: 190. В ячейку F14 введём формулу =F9*(F9+1)/2.
Получим результат: 190. Следовательно, ранги приписаны
правильно.
Находим большую из двух ранговых сумм T x = 112
(соответствует первой выборке n1 = 9), т. е. nx = 9. Запишем эти
значения в ячейки F15 и F16.

14
Находим наблюдаемое значение критерия. В ячейку F17
введём формулу =F7*F8+F15*(F15+1)/2-F16. Получим
результат: 23.
Находим критическое значение критерия. По таблице
определяем критическое значение в случае направленной
альтернативы, причем меньшее n принимаем за n1 (n1 =9), а
большее за n2 (n2 =10).
U кр. = 20 для   0,05.
Вывод: так как U набл. ≥
U кр. , то H (различия незначимы)
0
принимается и отвергается гипотеза H1 (различия значимы).
3.2.2 Сравнение двух зависимых выборок. Т-критерий
Вилкоксона
Критерий применяется для сопоставления показателей,
измеренных в двух разных условиях на одной и той же выборке.
Он позволяет установить не только направленность изменений,
но и их выраженность. Критерий применим в тех случаях, когда
признаки измерены, по крайней мере, в порядковой шкале, и
сдвиги между вторым и первым замерами тоже могут быть
упорядочены. Минимальный объем выборки равен 5.
Схема применения Т-критерия Вилкоксона
1. Составить список пар в любом порядке.

15
2. Вычислить разность между индивидуальными значениями во
втором и первом замерах (после и до). Определить, что будет
считаться «типичным» сдвигом и сформулировать
соответствующие гипотезы.
3. Перевести разности в абсолютные величины.
4. Проранжировать абсолютные величины разностей, начисляя
меньшему значению меньший ранг.
5. Отметить ранги, соответствующие сдвигам в «нетипичном»
направлении.
6. Подсчитать сумму этих рангов по формуле:
Т = ∑ Rr ,

где
R r - ранговые значения сдвигов с более редким
знаком. Это будет наблюдаемым значением критерия Tнабл..
7. Определить по таблице критические значения Tкр. для данного
объём выборки n и уровня значимости . Если Tнабл.  Tкр.,
нулевая гипотеза отвергается, сдвиг в «типичную» сторону по
интенсивности достоверно преобладает.
Пример 5. В группе студентов был проведен тренинг по
развитию творческого мышления. Перед тренингом и после него
были проведены тесты (стимулирующее воздействие должно
повышать творческий потенциал, т.е. увеличивать количество
баллов). Получены следующие результаты в баллах:
До тренинга: 19; 20; 18; 15; 29; 21; 21; 18; 21; 23; 14;
После тренинга: 17; 26; 20; 18; 30; 25; 28; 19; 20; 27; 19;
Требуется проверить гипотезу о том, что тренинг способствует
развитию творческого мышления при уровне значимости  
0,05?
Последовательность выполнения
Введём исходные данные в ячейки A2:A13 (показатели до
тренинга) и в ячейки B2:B13 (показатели после тренинга), как в
предыдущем примере.

16
В диапазоне С2:С13 получим разность показателей до-после.
Для этого в ячейку С2 введём формулу: =B2-A2 и размножим
её до ячейки С13. Две из полученных разностей отрицательные,
и 10 – положительные. Типичное направление – положительное.
Сформулируем гипотезы:
H0: интенсивность сдвигов в типичном направлении не
превосходит интенсивности сдвигов в нетипичном направлении.
H1: интенсивность сдвигов в типичном направлении
превышает интенсивность сдвигов в нетипичном направлении.
В диапазоне D2:D12 вычислим абсолютные значения
полученных разностей и проранжируем их, используя функцию
РАНГ.СР. Результаты запишем в диапазон E2:Е12.
Отметим те сдвиги, которые являются нетипичными, в
данном случае – отрицательными. Сумма рангов этих редких
сдвигов и составляет наблюдаемое значение Т-критерия:
Tнабл. = 2 + 4,5 = 6,5.
По таблице для n = 12 и   0,05 в случае односторонней
альтернативы находим Tкр. = 17.
Вывод: так как Tкр. Tнабл., то нулевая гипотеза отвергается.

17