ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
им.М.В.ЛОМОНОСОВА
ФАКУЛЬТЕТ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И
КИБЕРНЕТИКИ
На правах рукописи
УДК. 519.2
У Да
01.01.05—теория вероятностей и
математическая статистика
АВТОРЕФЕРАТ
диссертации на соискание ученой степени
кандидата физико-математических наук
Москва
2004
Работа выполнена на кафедре математической статистики факультета вычислительной
математики и кибернетики Московского государственного университета им. М. В.
Ломоносова
НАУЧНЫЙ РУКОВОДИТЕЛЬ:
Доктор физико-математических наук, профессор В. Е. Бенинг
ОФИЦИАЛЬНЫЕ ОППОНЕНТЫ:
Доктор физико-математических наук, профессор С. Я. Шоргин;
кандидат физико-математических наук, с.н.с. А. В. Колчин
ВЕДУЩАЯ ОРГАНИЗАЦИЯ:
Тверской государственный университет
С диссертацией можно ознакомиться в библиотеке факультета вычислительной
математики и кибернетики МГУ
Ученый секретарь
Диссертационного Совета,
Профессор Н. П. ТРИФОНОВ
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы.
Как хорошо известно, распределение Стьюдента, возникающее в задачах проверки
гипотез о среднем значении нормального рапределения в случае неизвестной дисперсии,
зависит от целочисленного параметра у, называемого числом степеней свободы, и имеет
плотность
2. Найдены оценки скорости сходимости распределения асимптотически нормальных
статистик к распределению Стьюдента в случае выборок случайного объёма.
3. Построена асимптотическая аппроксимация для асимптотической эффективности
широкого класса эквивариантных оценок, применяемых для оценки центра рас-
пределения Стьюдента.
4. В качестве примера из теории риска рассмотрена простейшая модель страхова-
ния, в которой также естественно возникает распределение Стьюдента. Получена
асимптотическая аппроксимация для необходимого резервного капитала страхо-
вой компании.
6
Здесь - параметры, и при к = 1 первый множитель в правой части
формулы (0.3) полагается равным единице. В частности, при т = 1 соотношение (0.3)
задает геометрическое распределение. Известно, что
так что
Отрицательное биномиальное распределение с натуральным г допускает наглядную
интерпретацию в терминах испытаний Бернулли. А именно, случайная величина с рас-
пределением (0.3) - это число испытаний Бернулли, проведенных до осуществления г-й
по счету неудачи, если вероятность успеха в одном испытании равна 1 — р.
ЛЕММА 0.2.(Бенинг, Королёв 2004) Для любого фиксированного г > 0
Такое распределение впервые описано как предельное для выборочной медианы, по-
строенной по выборке случайного объёма, имеющего геометрическое распределение, по-
видимому, в работе (Гнеденко 1989) (следует отметить, что в этой работе не указано,
что функция распределения, стоящая в правой части (0.4), соответствует распределе-
нию Стьюдента).
Таким образом, основной вывод из приведенных выше результатов можно сформули-
ровать следующим образом. Если число случайных факторов, определяющих наблюда-
емое значение случайной величины, само является случайноц величиной, распределение
которой может быть приближено гамма-распределением с одинаковыми параметрами
(например, является отрицательным биномиальным с вероятностью успеха, близкой к
единице, см. лемму 0.2), то те функции от значений случайных факторов, которые в
классической ситуации считаются асимптотически нормальными, в действительности
являются асимптотически стьюдентовскими. Следовательно, в силу довольно широкой
применимости гамма-моделей с одинаковыми параметрами и отрицательных биноми-
альных моделей распределение Стьюдента может рассматриваться в задачах приклад-
ной (описательной) статистики как вполне разумная модель.
Выше мы уже упоминали, что отрицательное биномиальное распределение (как мы
убедились, тесно связанное с распределением Стьюдента следствием 0.1), при натураль-
ном г может быть интерпретировано в терминах испытаний Бернулли, проведенных до
r-й неудачи. В то же время, особенно в задачах, связанных с анализом больших рисков,
большой интерес представляет изучение распределения Стьюдента с малым парамет-
ром формы, то есть с очень "тяжелыми хвостами". Более того, можно показать, что при
максимум плотности р 7 (х) распределения Стьюдента (см. (0.1)) стремится
к нулю как . Одновременно "хвосты" распределения Стьюдента становятся все
более и более "тяжелыми". Поэтому распределение Стьюдента с малым параметром
может рассматриваться как некий аналог равномерного распределения на бесконечном
интервале.
Чтобы следствие 0.1 можно было использовать и в такой ситуации, следует раз-
обраться, что из себя представляет отрицательное биномиальное распределение, то есть
как оно может быть проинтерпретировано при В главе 1 приводятся также
два примера, иллюстрирующие возможность такой интерпретации.
В главе 2 доказана общая теорема, позволяющая автоматически получать оценки
скорости сходимости к распределению Стьюдента распределений статистик, построен-
ных по выборкам случайного объёма, из оценок скорости сходимости к нормальному
закону аналогичных статистик, использующих большой, но не случайный объём выбо-
рок. При этом предполагается, что объём выборок имеет отрицательное биномиальное
распределение с малыми параметрами. Затем эта теорема применяется к линейным
комбинациям порядковых статистик и U - статистикам, широко применяемым в тео-
рии риска и математической статистике.
Пусть - случайная величина, имеющая отрицательное биномиальное распреде-
ление с параметрами определённое формулой (0.3).
Нас будет интересовать предельное поведение распределения нормированной случайной
величины
9
тогда распределение статистики где случайная величина
имеет отрицательное биномиальное распределение вида (0.8) и удовле-
творяет равенству
Далее приведены два примера использования теоремы 0.3. Первый пример касает-
ся U - статистик, а второй - линейных комбинаций порядковых статистик, широко
применяемых в статистике (см., например, (Королюк, Боровских 1989), (Serfling 1980),
(Helmers 1984), (Bening 2000)). Совершенно аналогично, с учётом, например, резуль-
татов работы (Does 1982), могут быть рассмотрены ранговые статистики, или ста-
тистика Стьюдента (см. (Bentkus, Gotze 1996)) и вообще достаточно широкий класс
симметричных статистик (см. работы (Van Zwet 1984) и (Alberink 2000), теорема 3.1).
Эти результаты могут быть также использованы для уточнения теорем, касающихся
оценок опасности отказа из работы (Wu Da 2003).
Пусть - повторная выборка независимых одинаково распределённых
случайных величин, имеющих общую функцию распределения F(x). Определим U -
статистику по формуле
10
где величины определены в этих работах, а
функция распределения Стьюдента с параметром формы
В главе 3 рассматривается задача статистического оценивания центра распределе-
ния Стьюдента в предположении, что параметр формы этого распределения является
известным и малым. Изучается асимптотика по этому параметру асимптотической от-
носительной эффективности наиболее распространённых оценок центра этого распре-
деления.
В качестве иллюстрации тех возможных преимуществ, которые предоставляет се-
мейство распределений Стьюдента, если его использовать в качестве модели распреде-
ления с "тяжёлыми хвостами", мы вычислим некоторые асимптотические характерис-
тики статистических процедур оценивания параметров распределения Стьюдента.
Наиболее очевидной и естественной задачей статистического оценивания, связанной
с распределением Стьюдента, является задача оценивания параметра формы - числа
степеней свободы. Для ее решения могут быть использованы различные процедуры, на-
пример, метод максимального правдоподобия, метод логарифмических моментов. Особо
следует отметить, что так как распределение Стьюдента принадлежит к классу зако-
нов с " тяжёлыми хвостами", а параметр является показателем " тяжести хвостов", то
для оценивания этого параметра могут также применяться известные процедуры оце-
нивания степени "тяжести хвостов", например, оценки Хилла (Hill 1975), Де Хаана (см,
например, (Resnick 1995)) и другие (см., например, (Embrechts et al. 1997)). Оценки вто-
рой группы, как правило, вычисляются намного проще, нежели оценки максимального
правдоподобия или оценки метода логарифмических моментов. Подробное сравнитель-
ное исследование упомянутых процедур не является целью данной диссертации.
Вместо этого, в соответствии с общей направленностью диссертации, ниже мы рас-
смотрим другую естественную задачу статистического оценивания, связанную с рас-
пределением Стьюдента, - задачу оценивания центра этого распределения, уделяя осо-
бое внимание асимптотическим свойствам соответствующих процедур при что
важно при использовании распределения Стьюдента для описания больших рисков.
Пусть (Х\, •••, Хп) - независимые одинаково распределённые наблюдения, имеющие
функцию распределения причём функция распределения F(x) известна,
симметрична и обладает положительной плотностью
11
Питмэна (см. (Леман 1991), теорема 3.1.5; (Ибрагимов, Хасьминский 1979), стр. 33)
Однако эти оценки, являющиеся эталоном при сравнении оценок, как правило, являются
трудновычислимыми и представляют в основном теоретический интерес.
Мы будем рассматривать асимптотический подход (при и асимптотически
нормальные последовательности эквивариантных оценок
то . .
Таким образом, чтобы получить предельное распределение, совпадающее с предельным
оценки асимптотически эквивалентны.
Рассмотрим теперь абсолютную АОЭ (ААОЭ), то есть асимптотическую эффектив-
ность относительно наилучшей оценки Питмэна , В работах (Stone 1974)
и (Port, Stone 1974) показано, что при весьма общих условиях регулярности эти оценки
асимптотически нормальны
12
Заметим, что асимптотическая дисперсия 1~1 оценки Питмэна совпадает с нижней
границей дисперсий из неравенства Крамера - Рао. Обозначим ААОЭ последователь-
ности эквивариантных асимптотически нормальных оценок
относительно оценки Питмэна через
где - вариационный ряд, построенный по исходным независимым наблю-
дениям
(Xi,---,Xn).
Однако такое радикальное отбрасывание крайних членов выборки не всегда приво-
дит к разумным результатам. Естественным компромиссом между средним и медианой
является отбрасывание, например, наименьших и наибольших наблюдений,
где то есть рассмотрение усечённых средних
или усечённых линейных комбинаций порядковых статистик
где
13
или - уинзоризованных средних (см. (Bickel 1965))
Рассмотрим также оценку Ходжеса - Лемана (см. (Hodges, Lehmann 1963) и (Леман
1991), стр. 339 - 341)
то есть это медиана
Всюду далее будет рассматриваться семейство рапределений Стьюдента с пара-
метром функциями распределения и плотностями
определяемыми соотношением (0.1). Параметр формы (число степеней свободы)
предполагается известным. При у этого распределения существует абсо-
лютный момент порядка При у этого распределения существует дисперсия,
которая в таком случае равна . При дисперсии не существует. В главе 3
доказана следующая
ЛЕММА 0.3
14
Заметим также, что из теоремы 0.5 следует, что выборочная медиана асимпто-
тически "лучше" чем оценки
Как уже отмечалось, усечённое среднее , (см. (0.16)) является естественным ком-
промиссом между средним (см. (0.14)) и медианой Мп (см. (0.15)). Другой ком-
промисс, предложенный Хьюбером (Huber 1964), подсказан тем фактом, что среднее и
медиана являются величинами, минимизирующими по соответственно функции
15
Хьюбер предложил минимизировать более общее выражение вида
с некоторой разумно выбранной функцией р(х) (например, выпуклой и чётной). Оценки,
минимизирующие выражение (0.19), будем называть М-оценками. Если функция
дифференцируема, то при соответствующих условиях регулярности (см. (Huber 1964)),
М-оценка является решением уравнения
Эта функция пропорциональна а вне этого отрезка заменяет ветви пара-
болы на прямые линии. Эти куски согласованы так, что функция и её производная
непрерывны. Оценки, минимизирующие выражение (0.19) с этой функцией, будем обо-
значать При растущем k функция будет совпадать с , на всё большей части
области её определения, так что оценка "~ будет сближаться с . При уменьшении
оценка будет сближаться с медианой
Обозначим оценку максимального правдоподобия через Справедлив следующий
результат.
ТЕОРЕМА 0.6 Пусть случайные величины независимы, имеют одина-
ковую функцию распределения и плотность Тогда:
16
Заметим, что из теоремы 0.6 следует, что выборочная медиана асимптотически
"лучше" чем М-оценка но М-опенка "лучше" чем оценки
В главе 4 рассматривается задача аппроксимации необходимого резервного капитала
страховой компании в случае большого числа различных клиентов.
Рассмотрим простейшую модель страхования, в которой имеется большое число
страховых контрактов (клиентов), и одна страховая компания, их обслужи-
вающая. Страхование рассматривается с точки зрения страховой компании. Каждый
контракт характеризуется величиной денежного "ущерба" (формаль-
но здесь не предполагается неотрицательность и вероятностью
1,...,п, с которой этот ущерб может возникнуть. Тогда общий суммарный убыток
страховой компании является случайной величиной вида
17
Мы рассмотрим здесь также случай неоднородных контрактов, то есть случай, когда
нарушаются условия (0.21). Для данного малого (0,1) нас будет интересовать
астимптотическое поведение резервного капитала страховой компании который
определяется из условия малости вероятности того, что у страховой компании не хватит
средств для покрытия общих суммарных убытков, то есть из условия
Здесь возможна так же следующая интерпретация. Пусть, например, на единичном
отрезке "времени" [0,1] задана достаточно гладкая функция которая описывает
"скрытый ущерб" в момент времени t Предположим, что "ущерб" может проявиться
только, например, в моменты времени вида
и величина ущерба
18
Поэтому в этом случае, при выполнении условия (0.23), справедливо следующее пре-
дельное соотношение для резервного капитала
где
Рассмотрим вопрос об уточнении остаточного члена в формулах подобного типа, ко-
торые получаются с использованием предельных теорем. Для получения асимптоти-
ческого разложения резервного капитала страховой компании используем условия
регулярности на константы j = 1,..., п и Pjn, j = 1,..., п из работы ((Albers et
al. 1976), формулы (4.2.14) - (4.2.16)).
Обозначим математическое ожидание, дисперсию, третий и четвертый семиинвари-
анты случайной величины (см.(0.20)) соответсвенно через
19
Аналогичным образом, с учётом теорем 0.3 и 0.8, может быть рассмотрен общий не-
симметричный случай и случай, когда случайная величина Nn имеет отрицательное
биномиальное распределение (0.8).
Публикации
Основные результаты диссертации опубликованы в следующих работах
1. У Да, Бенинг В.Е., Об оценивании центра распределения Стьюдента с малым
числом степеней свободы. - Вестник Московского Университета, серия 15, Вы-
числительная Математика и Кибернетика, 2003, н. 3, с. 30 - 37.
2. Wu Da, Bening V.E., Small degree of freedom for the Student distribution family (in
Chinese). - Mathematica Applicata, 2003, v. 16, p. 133 - 136.
3. У Да, Бенинг В.Е., Об аппроксимации необходимого резервного капитала стра-
ховой компании в случае большого числа неоднородных контрактов. - Вестник
Московского Университета, серия 15, Вычислительная Математика и Киберне-
тика, 2002, н. 3, с. 49 - 54.
4. Wu Da, Two theorems for estimating risk refusal function. - J. Appl. Math., 2003, v.
18, ser. A, p. 311 - 317.
21
Издательство ООО "МАКС Пресс".
Лицензия ИД № 00510 от 01.12.99 г.
Подписано к печати 11.11.2004 г.
Формат 60x90 1/16. Усл.печл. 1,25. Тираж 100 экз. Заказ 1119.
Тел. 939-3890,939-3891,928-1042. Тел./факс 939-3891.
119992, ГСП-2, Москва, Ленинские горы, МГУ им. М.В Ломоносова.
2-й учебный корпус, 627 к.