Академический Документы
Профессиональный Документы
Культура Документы
Ломоносова
Кафедра “Математических методов прогнозирования”
Преподаватель:
Воронцов Константин Вячеславович
Москва
2009
– 2 –
Содержание
1 Задание 2
3 Результаты моделирования 4
3.1 Зависимость достигаемого уровня значимости от значений параметров
при однократном проведении эксперимента . . . . . . . . . . . . . . . . 5
3.2 Зависимость достигаемого уровня значимости от значений параметров,
усреднённого по 100 экспериментам . . . . . . . . . . . . . . . . . . . . . 6
3.3 Эмпирические оценки мощности критерия для разных значений пара-
метров . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.4 Использование критерия для проверки гипотезы о мультипликативном
сдвиге распределения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
4 Выводы 11
1 Задание
Исследовать поведение критерия Уилконсона для связных выборок для провер-
ки гипотезы сдвига. Параметры модели:
2 Условные обозначения 𝑀 2𝑉 𝑁 𝑛ℒ
– 3 –
𝑧𝑖 = 𝑦𝑖 − 𝑥𝑖 , 1 6 . . . 6 𝑛
2. 𝑒𝑖 взаимно независимы;
𝐻0 : 𝜃 = 0
𝑛(𝑛 + 1) (︁ 𝛼 )︁ (︁ 𝛼 )︁
−𝑡 ,𝑛 < 𝒯 + < 𝑡 1 − ,𝑛 ,
2 2 2
где 𝛼 - уровень значимости, а 𝑡(𝛼, 𝑛) — 𝛼-квантиль распределения, вычисление кото-
рого является комбинаторной задачей [2]. Но, для относительно небольших объемов
выборки (≈ больше 15), существует хорошее приближение данного распределения
нормальным [1]:
𝑛(𝑛+1)
* 𝒯+− 4
𝒯 = [︁ (︁ )︁]︁ 12
1 1
∑︀𝑔
24
𝑛(𝑛 + 1)(2𝑛 + 1) − 2 𝑗=1 𝑡𝑗 (𝑡𝑗 − 1)(𝑡𝑗 + 1)
𝒯 * ∼ 𝒩 (0, 1) ,
(︃ √︂ )︃
** 𝒯* 𝑛−1
𝒯 = 1+
2 𝑛 − 𝒯 *2
𝑡𝑛−1,𝛼 + 𝑧𝛼
𝑡** (𝛼, 𝑛) = ,
2
где 𝑡𝑛−1,𝛼 и 𝑧𝛼 — 𝛼-квантили распределения Стьюдента с 𝑛−1 степенью свободы и
стандартного нормального распределения соответственно.
3 Результаты моделирования
Возможность применения двухвыборочного критерия Уилконсона для связных
выборок в данной задаче обусловлена тем, что медиана (сдвиг которой позволяет
обнаружить критерий) равномерного распределения 𝒰[0, 𝜇 + 1] зависит от параметра
𝜇 и равна 𝜇+1
2
.
Не трудно проверить, что выполнены все три предположения двухвыборочного
критерия Уилконсона. Разность случайных величин 𝜉1 ∼ 𝒰[0, 𝜇1 +1], 𝜉2 ∼ 𝒰[0, 𝜇2 +1],
имеющих равномерные распределения с заданными параметрами имеет трапециевид-
ную плотность:
⎧
⎪
⎪ 0 , при 𝑡 6 −(𝜇1 + 1)
(𝜇1 +1+𝑡)2
⎪
, при −(𝜇1 + 1) < 𝑡 6 0
⎪
⎪
2
⎪
⎨ 2
𝑝𝜉2 −𝜉1 (𝑡) = (𝜇1 + 1)𝑡 + (𝜇1 +1)
2
, при 0 < 𝑡 6 𝜇2 − 𝜇1
(𝜇2 +1−𝑡)2
⎪
(𝜇1 + 1)(𝜇2 + 1) − , при 𝜇2 − 𝜇1 < 𝑡 6 𝜇2 + 1
⎪
⎪
⎪
⎪
⎪ 2
1 , при 𝑡 > 𝜇2 + 1 .
⎩
Также стоит отметить, что при разумных уровнях значимости, критерий прак-
тически не допускает ошибок первого рода. При заданных распределениях данных
можно утверждать, что критерий “ведет себя хорошо”, когда длина интервалов, но-
сителей равномерного распределения, отличается больше, чем в 1.5 раза, а длина
выборки больше 10.
– 7 –
Рис. 3: Эмпирические оценки мощности критерия для разных значений параметров. Аддитивный
сдвиг
Из рисунка видно, что при длине выборки 5 и при заданном уровне значимости
альтернативная гипотеза вообще не принималась. Это можно отнести к недостаткам
критерия, но с другой стороны при такой длине выборки сложно ожидать каких-то
обоснованных выводов. Кроме того, любое “нарушение” знака статистики критерия
уже выводит нас из критической области. А приняв во внимание рисунок (2), можно
предположить, что очень большие отклонения параметра 𝜇2 критерий все же начнет
выявлять.
При 𝜇2 = 0, т. е. там, где верна гипотеза 𝐻0 , альтернативная гипотеза принима-
ется крайне редко, что вполне допустимо при заданном уровне значимости 𝛼.
В остальных случаях — с ростом объема выборки и с увеличением относительной
разности между параметрами модельных распределений — эмпирическая мощность
критерия равномерно возрастает. Причем, в области 𝜇2 > 1.5, 𝑛 > 20 эмпирическая
– 8 –
оценка мощности уже достигает 1, что свидетельствует о том, что критерий Уилкон-
сона для связных выборок является состоятельным. Если исключить из рассмотре-
ния крайние случаи, то можно предполагать, что критерий является несмещенным.
В отличие от предыдущих графиков, на этом наблюдается следующая законо-
мерность. При фиксированном объеме выборки мощность с ростом 𝜇2 возрастает
быстрее, чем при фиксированном 𝜇2 с ростом длины выборки.
Для обнаружения сдвига в используемых модельных данных критерий можно с
уверенность применять при длине выборки больше 25 и величине сдвига 0.5 (𝜇2 = 1).
𝑦𝑖 + 𝜀
𝑧𝑖 = − 1, 1 6 . . . 6 𝑛,
𝑥𝑖 + 𝜀
где 𝜀 — сколь угодно малая положительная константа. Она введена для того, чтобы
исключить проблемы, связанные с делением на ноль и “улучшить” характеристики
(а именно — симметрию) распределения статистики:
⎧
⎪
⎪ 0 , при 𝑡 6 − 𝜇1𝜇+1+𝜀
1 +1
⎨ (𝜇1 +1+𝜀)2 − 𝜀2
⎪
𝜇2 −𝜇1
, при − 𝜇1𝜇+1+𝜀
1 +1
⎪
2 2(𝑡+1)2
<𝑡6 𝜇1 +1+𝜀
𝑝 𝜉2 +𝜀 −1 (𝑡) = (𝜇2 +1+𝜀) 2
𝜇2 −𝜇1 𝜇2 +1
𝜉1 +𝜀 ⎪
⎪
⎪ 2(𝑡+1)2
− 𝜀2 , при 𝜇1 +1+𝜀
<𝑡 6 𝜀
𝜇2 +1
⎪
⎩1 , при 𝑡 > 𝜀 .
𝜇2 +1+𝜀
Это распределение не является симметричным, но его медиана равна
𝜇1 +1+𝜀
− 1,
т. е. равна нулю при равенстве 𝜇1 и 𝜇2 .
Графики на рисунках (4), (5), (6) позволяют сделать вывод о том, что использо-
вание критерия Уилконсона для связных выборок с предложенной статистикой при
заданных параметрах модели, позволяет получить лучшие результаты.
При меньших отклонениях параметров и при меньших объемах выборки крите-
рий становится мощнее. Достигаемый уровень значимости быстрее убывает с ростом
длины выборки и увеличения параметра 𝜇2 .
Стоит также отметить (хотя это и не отражено на графиках), что при выборе
слишком малого 𝜀 результаты не сильно улучшаются. При проведении экспериментов
𝜀 полагалось равным 1.
– 9 –
Рис. 6: Эмпирические оценки мощности критерия для разных значений параметров. Мультиплика-
тивный сдвиг
– 11 –
4 Выводы
Критерий Уилконсона для связных выборок показал достаточно хорошие ре-
зультаты при применении на модельных данных. При использовании критерия для
обнаружения сдвига распределения стоит учитывать соотношение длины выборки и
ожидаемой величины сдвига.
Не смотря на то, что модельные данные были независимы и сдвиг происходил
только “частично”, эксперименты показали, что при длине выборки больше 25 и от-
носительной величине ожидаемого сдвига не меньше 0.5 критерий работает точно (в
рамках определения статистического критерия).
Можно ожидать, что на реальных данных, где между выборками существует
непосредственная взаимосвязь результаты окажутся даже лучше.
Кроме указанных преимуществ наиболее существенным является то, что данный
критерий непараметрический. Это позволяет применять его, не делая практически
никаких предположений о характере распределений реальных данных.
Список литературы
[1] Холлендер М., Вульф Д. Непараметрические методы статистики. — Финансы и
статистика, 1983. — Pp. 46–58.
Рис. 9: Эмпирические оценки мощности критерия для разных значений параметров. Аддитивный
сдвиг. Приближенная оценка
– 14 –
% number of experiments
Number_of_Exprs = 10;
% a method to calculate distribution of criteria statistic
% ’exact’ - for exact
% [] - for exact if n < 15 and approximate otherwise
method = [];
% significance level
alpha = 0.05;
% shift statics definition
% ’additive’ or ’multiplicative’
% the last one is an heuristics
shiftmode = ’additive’;
% a constant, used whis multiplicative shift
% to avoid devision by zero and to enhance distribution characteristics
epsilon = realmin;
break;
end
end
xlabel(’\mu_2’)
ylabel(’Sample size’)