Вы находитесь на странице: 1из 24

МОСКОВСКИЙ 

ГОСУДАРСТВЕННЫЙ  УНИВЕРСИТЕТ
им.М.В.ЛОМОНОСОВА
ФАКУЛЬТЕТ  ВЫЧИСЛИТЕЛЬНОЙ  МАТЕМАТИКИ  И
КИБЕРНЕТИКИ

На правах рукописи

УДК. 519.2

У  Да

НЕКОТОРЫЕ  ЗАДАЧИ  ТЕОРИИ  ВЕРОЯТНОСТЕЙ


И  МАТЕМАТИЧЕСКОЙ  СТАТИСТИКИ,  СВЯЗАННЫЕ  С
РАСПРЕДЕЛЕНИЕМ  СТЬЮДЕНТА

01.01.05—теория вероятностей и
математическая  статистика

АВТОРЕФЕРАТ
диссертации на соискание ученой степени
кандидата  физико-математических  наук

Москва
2004
Работа выполнена на кафедре  математической  статистики  факультета вычислительной
математики и кибернетики Московского государственного университета им. М. В.
Ломоносова

НАУЧНЫЙ РУКОВОДИТЕЛЬ:
Доктор физико-математических наук, профессор В. Е. Бенинг

ОФИЦИАЛЬНЫЕ ОППОНЕНТЫ:
Доктор физико-математических наук, профессор С. Я. Шоргин;
кандидат физико-математических наук, с.н.с. А. В. Колчин

ВЕДУЩАЯ  ОРГАНИЗАЦИЯ:
Тверской  государственный  университет

Защита состоится«  «  200  года

В  «  « часов на заседании Диссертационного Совета Д 501.001.44 при  МГУ им.  М. В.


Ломоносова (119899, ГСП-3, Москва В-234, Воробьевы горы, МГУ,  факультет ВмиК, ауд.
685).

С диссертацией можно ознакомиться в библиотеке факультета вычислительной
математики и кибернетики МГУ

Автореферат разослан«  «  200  года

Ученый  секретарь
Диссертационного  Совета,
Профессор  Н. П. ТРИФОНОВ
ОБЩАЯ  ХАРАКТЕРИСТИКА  РАБОТЫ
Актуальность  темы.
Как  хорошо  известно,  распределение  Стьюдента,  возникающее  в  задачах  проверки
гипотез о среднем значении нормального рапределения в случае неизвестной дисперсии,
зависит от целочисленного параметра у, называемого числом степеней свободы, и имеет
плотность

где  -  эйлерова  гамма-функция.  Здесь  параметр  тесно  связан  с  объемом  выбор-


ки  и  принимает  натуральные  значения.  Однако  можно  сказать,  что  в  таких  задачах
роль  распределения  Стьюдента  в  значительной  мере  вспомогательна,  оно  является  в
определенном  смысле  абстрактной идеальной теоретической  моделью.  (Отметим  также
здесь,  что формально  распределение Стьюдента определено при любом положительном
значении  параметра формы  =  1  мы имеем  "тяжёлохвостное"  распределение
Коши.)
Вместе  с  тем,  в  описательной  статистике  распределение  Стьюдента  практически
не  используется  в  качестве  аналитической  модели,  "подгоняемой"  к  эксперименталь-
ным данным.  Лишь относительно недавно появились работы, в которых распределение
Стьюдента  применяется  (впрочем,  без  надлежащего  теоретического  обоснования)  для
описания  динамики  некоторых  финансовых  индексов,  в  частности  приращений  лога-
рифмов  биржевых  цен.  В  первую  очередь  здесь  следует  упомянуть  работы  П.  Прэтца
(Praetz  1972)  и  Р.  Блаттберга,  Н.  Гоундса  (Blattberg,  Gonedes  1974).
По-видимому,  недостаточное  доверие  прикладных  статистиков  к  распределению
Стьюдента  как  к  модели,  описывающей  статистическое  поведение  реальных  данных,
связано с тем,  что, в отличие от, скажем,  нормального или пуассоновского распределе-
ний,  фигурирующих  в  качестве  предельных  соответственно  в  центральной  предельной
теореме и теореме Пуассона о редких событиях,  распределение  Стьюдента не считается
асимптотической аппроксимацией.
В прикладной математике вообще и в статистике в частности, принято считать, что
адекватной  может быть  лишь  та аналитическая  модель,  в  основе которой  лежит  какая-
либо  предельная  теорема  с  довольно  простыми  и  общими  условиями,  в  то  время  как
та асимптотическая  схема,  которая используется для  обоснования возможности приме-
нения  распределения  Стьюдента  в  качестве  предельной  аппроксимации  (в  тех  редких
случаях,  когда  распределение  Стьюдента  используется  в  таком  качестве)  и  связана  с
его  безграничной  делимостью  (кстати,  установленной  сравнительно  недавно),  доволь-
но  сложна.  А  именно,  известно,  что  любое  безгранично  делимое  распределение  может
быть слабым пределом для распределений  сумм независимых равномерно предельно ма-
лых случайных величин.  Поэтому в принципе,  если при статистическом анализе реаль-
ных  данных  можно  предположить,  что  каждое  наблюдение  является  результатом  сум-
марного  воздействия  большого  числа  случайных  факторов,  которые  вносят  примерно
одинаковый  (в  определенном  смысле)  вклад  в  наблюдаемое  значение,  то  при  выполне-
нии  условий,  гарантирующих  сходимость  распределений  сумм  независимых  равномер-
но предельно малых случайных величин к распределению  Стьюдента,  последнее вполне
может  быть  использовано  в  качестве  модели,  описывающей  статистическое  поведение
экспериментальных  данных.  Однако  упомянутые  условия  формулируются  в  терминах
элементов так называемого канонического представления безгранично делимой характе-
ристической функции и имеют сложный вид, что серьезно затрудняет их практическую
проверку.  В  результате  в  рамках  такого  подхода  до  сих  пор  не  удалось  найти  доста-
точного обоснования возможности более или менее широкого применения распределения
Стьюдента  в  задачах  описательной  статистики.
Отметим  ещё  раз,  что  аналитическая  форма  плотности  распределения  Стьюдента
(0.1)  формально  определена  для  любых  положительных  значений  параметра  Здесь
следует отметить  недавние результаты Бенинга и Королёва.  Работа  (Бенинг,  Королёв
2004)  посвящена математическому  обоснованию  возможности  использования  распреде-
ления  Стьюдента,  зависящего  от  параметра  формы  (число  степеней  свободы)
в  качестве  статистической  модели,  описывающей  распределение  наблюдаемых  случай-
ных  величин.
Для обоснования такой возможности показано, что распределение Стьюдента с про-
извольным  может  быть  получено  в  качестве  предельного  в  случае  выборки  слу-
чайного объёма. При этом особо выделен случай,  когда параметр формы распределения
Стьюдента  мал.  Этот  случай  представляет  интерес  как  модель  распределения  с
"тяжёлыми  хвостами".  В  этом  случае  подчеркивается  возможность  использования  се-
мейства  распределений  Стьюдента  в  качестве  удобной  модели  распределений  с  "тяже-
лыми хвостами", так как для него  (в отличие от устойчивых законов)  многие формулы,
в частности функция правдоподобия,  приобретают  явный  вид.
Диссертация  посвящена  дальнейшему  развитию  идей  работы  (Бенинг,  Королёв
2004).
Доказана  общая  теорема,  позволяющая  автоматически  получать  оценки  скорости
сходимости  распределений  статистик,  построенных  по  выборкам  случайного  объёма,  к
распределению  Стьюдента  из  оценок  скорости  сходимости  к  нормальному  закону  этих
же статистик,  но уже  построенным  по обычным не случайным  выборкам.
В  качестве  иллюстрации  возможностей  статистического  анализа,  основанного  на
стьюдентовом  семействе,  рассматривается  задача  статистического  оценивания  центра
распределения  Стьюдента в предположении,  что параметр формы  (число степеней  сво-
боды)  известен. В диссертации рассматриваются эквивариантные оценки центра
распределения  Стьюдента,  основанные  на  порядковых  статистиках,  оценки  Ходжеса  -
Лемана,  М-оценки  и  оценки  максимального  правдоподобия.  Находится  их  асимптоти-
ческая  относительная  эффективность  и  изучается  её  поведение  при  стремлении  числа
степеней  свободы  к  нулю.
Рассматривается  также задача из теории риска,  а именно,  задача оценивания необ-
ходимого  резервного  капитала  страховой  компании  в  случае  большого  числа  неодина-
ковых  клиентов.  Для  этой  оценки  также  используется  распределение  Стьюдента.
Цель  работы.  Она состояла в том,  чтобы обосновать возможность систематичес-
кого  использования  распределения  Стьюдента  в  задачах  теории  вероятностей  и  мате-
матической  статистики,  как  распределения  с  "тяжёлыми  хвостами",  возникающего  в
качестве  предельного  в  случае  выборок  случайного  объёма.
Методы  исследования.  Основные  результаты  диссертации  получены  с  помощью
методики, сочетающей элементы метода характеристических функций, теории предель-
ных  теорем  и  прямых  методов  анализа.
Основные  результаты.

1.  Получены  оценки  скорости  сходимости  отрицательного  биномиального  закона  к


гамма -  распределению.

2.  Найдены оценки скорости сходимости распределения асимптотически нормальных
статистик  к  распределению  Стьюдента  в  случае  выборок  случайного  объёма.

3.  Построена асимптотическая аппроксимация для асимптотической эффективности
широкого  класса  эквивариантных  оценок,  применяемых  для  оценки  центра  рас-
пределения  Стьюдента.

4.  В  качестве  примера  из  теории  риска  рассмотрена  простейшая  модель  страхова-
ния,  в которой также  естественно возникает распределение Стьюдента.  Получена
асимптотическая  аппроксимация  для  необходимого  резервного  капитала  страхо-
вой компании.

Научная  новизна работы.  Все  основные  результаты  диссертации  являются  но-


выми.
Теоретическое  и  прикладное  значение.  Работа имеет теоретический характер.
Показано,  что  в случае  выборок  случайного  объёма естественным  образом  вместо при-
вычного  нормального  закона возникает распределение  Стьюдента,  которое  приводит  к
утяжелению  "хвостов"  предельного  закона,  которое  необходимо  учитывать  в  практи-
ческих  расчётах.
Результаты  могут  найти  применение  в  прикладных  исследованиях,  связанных,  на-
пример,  с  теорией  риска,  поскольку  их  использование  приводит  к  сокращению  вычис-
лений и повышению точности.
Апробация  работы.  Результаты диссертации докладывались на Международной
Конференции  посвященной  100  -  летию  со  дня  рождения  академика  А.Н.Колмогорова
(Москва,  2003), на 24  Международной  Конференции по Проблемам Устойчивости  Сто-
хастических Моделей  (Юрмала, 2004), на научно - исследовательском семинаре Универ-
ситета г. Нинбо (Китай, сентябрь 2004), на семинаре по теории вероятностей и матема-
тической  статистике  факультета  ВМиК  Московского  Государственного  Университета
под  руководством  академика  Ю.В.Прохорова  (октябрь  2004).
Публикации.  Всего  по  теме  диссертации  опубликовано  4  работы  (см.  [1]  -  [4]),
которые  цитируются  в диссертации.
Структура  и  объём  работы.  Диссертация  состоит  из  введения,  четырёх  глав  и
списка литераруры,  состоящего  из  57 названий.  Объем  работы —  107 страниц.
СОДЕРЖАНИЕ РАБОТЫ
В  работе приняты  следующие обозначения:
- действительная прямая, символ  будет  обозначать  слабую  сходимость,  и
- функция  распределения  и плотность стандартного  нормального закона,
-  нормальное  распределение  в  с указанными параметрами,  -  соответ-
ственно  плотность  и  функция  распределения  распределения  Стьюдента  с  параметром
-  эйлерова гамма-функция,  -  отрицательно  бино-
миальная  случайная  величина  с  параметрами  -  функция  распределения
гамма распределения  с  параметром формы  параметром  масштаба.
В  первой  главе  приведены  и  прокомментированы  следующие  основные  результаты
из работы  (Бенинг,  Королёв  2004).
Рассмотрим  случайные  величины  N\,N2,...,Xi,X2,---,  определенные  на  одном  и
том  же  измеримом  пространстве  Пусть  на  Л  задано  семейство  вероятностных
мер  Предположим,  что  при  каждом  случайные  величины  при-
нимают  только  натуральные  значения  и  независят  от  последовательности  Х\,Х2,...
относительно  каждой  из  семейства мер  . Пусть  - неко-
торая  статистика,  то  есть  измеримая  функция  от  случайных  величин  Xi,...,Хп-  Для
каждого  определим  случайную  величину  положив

для  каждого  элементарного  исхода  Будем  говорить,  что  статистика  асимп-


тотически  нормальна,  если  существуют функции  такие, что при
каждом

Примеры асимптотически  нормальных статистик хорошо известны.  Свойством  асимп-


тотической  нормальности  обладают,  например,  выборочное  среднее  (при  условии  су-
ществования дисперсий),  центральные порядковые статистики, оценки максимального
правдоподобия  (при  достаточно  общих  условиях  регулярности)  и  многие  другие  ста-
тистики.
ЛЕММА  0.1.  (Бенинг,  Королёв  2004)  Пусть  -  некоторая  неограниченно
возрастающая последовательность  положительных чисел.  Предположим,  что
по  вероятности  при  относительно  каждой  вероятности  из  семейства
Пусть  статистика  асимптотически  нормальна  в  смысле  (0.2).  Для
того  чтобы  при каждом  существовала такая функция  распределения
что

необходимо  и  достаточно,  чтобы  существовало  семейство  функций  распредления


удовлетворяющее  условиям

При  этом,  если  функция распределения  случайной  величины  не  зависят  от  то


не  зависят от  и функция распределения  то  есть  семейство  состоит из
единственного  элемента.
Пусть  -  случайная  величина,  имеющая  отрицательное биномиальное  распреде-
ление вида

6
Здесь  - параметры,  и при  к  =  1  первый  множитель  в  правой части
формулы  (0.3)  полагается равным единице.  В частности,  при т  =  1  соотношение  (0.3)
задает  геометрическое  распределение.  Известно,  что

так  что
Отрицательное биномиальное распределение  с  натуральным  г  допускает  наглядную
интерпретацию в терминах испытаний Бернулли. А именно, случайная величина с рас-
пределением  (0.3) - это число испытаний  Бернулли,  проведенных до осуществления  г-й
по  счету  неудачи,  если  вероятность успеха в  одном  испытании равна  1  —  р.
ЛЕММА  0.2.(Бенинг,  Королёв  2004)  Для любого  фиксированного  г  >  0

где  -  функция распределения гамма-распределения  с  параметром  формы,  сов-


падающим с параметром масштаба и равным г.
В  подавляющем  большинстве  ситуаций,  связанных  с  анализом  экспериментальных
данных,  можно  признать,  что  число  случайных  факторов,  влияющих  на наблюдаемые
величины,  само  является  случайным  и  изменяется  от  наблюдения  к  наблюдению.  По-
этому  вместо  различных  версий  центральной  предельной  теоремы,  обосновывающих
нормальность  распределения  наблюдаемых  случайных  величин  в  классической  статис-
тике,  в  таких  ситуациях  следует  опираться  на  их  аналоги  для  выборок  случайного
объема  (см.  лемму  0.1).
ТЕОРЕМА  0.1.(Бенинг,  Королёв  2004)  Пусть  произвольно  и  -  не-
которая  неограниченно  возрастающая  последовательность  положительных  чисел.
Предположим, что  по  вероятности  при  относительно  каждой
вероятности  из  семейства  Пусть  статистика  асимптотически
нормальна  в  смысле  (0.2).  Для того  чтобы  при каждом

где  -  функция распределения  Стьюдента  с  параметром  необходимо и доста-


точно,  чтобы

СЛЕДСТВИЕ  0.1.  Пусть  т  >  0  произвольно.  Предположим,  что  при каждом


случайная величина  имеет отрицательное биномиальное распределение с парамет-
рами  и  г.  Пусть  статистика  асимптотически  нормальна  в  смысле  (0.2).
Тогда при каждом

равномерно  по  -  функция распределения  Стьюдента  с  параметром


Для  иллюстрации  возможности  возникновения  предельных  законов  с  "тяжёлыми
хвостами"  сделаем  два  замечания.
ЗАМЕЧАНИЕ 0.1. Распределение Коши  возникает  в  ситуации,  описанной  в
следствии  0.1,  когда  объем  выборки .  имеет  отрицательное  биномиальное  распреде-
ление с параметрами  и п велико.
ЗАМЕЧАНИЕ 0.2. В ситуации, когда объем выборки  имеет  отрицательное  би-
номиальное  распределение  с  параметрами  (то  есть  геометрическое
распределение с параметром  в пределе при  мы  получаем  распределение
Стьюдента  с  параметром  которому  соответствует  функция  распределения

Такое  распределение  впервые  описано  как  предельное  для  выборочной  медианы,  по-
строенной по выборке случайного объёма, имеющего геометрическое распределение, по-
видимому,  в  работе  (Гнеденко  1989)  (следует  отметить,  что  в  этой  работе  не  указано,
что  функция  распределения,  стоящая  в  правой  части  (0.4),  соответствует  распределе-
нию  Стьюдента).
Таким образом, основной вывод из приведенных выше результатов можно сформули-
ровать  следующим  образом.  Если  число  случайных  факторов,  определяющих  наблюда-
емое значение случайной величины, само является случайноц величиной, распределение
которой  может  быть  приближено  гамма-распределением  с  одинаковыми  параметрами
(например,  является  отрицательным биномиальным с  вероятностью  успеха,  близкой  к
единице,  см.  лемму  0.2),  то  те  функции  от  значений  случайных  факторов,  которые  в
классической  ситуации  считаются  асимптотически  нормальными,  в действительности
являются асимптотически  стьюдентовскими.  Следовательно,  в силу довольно  широкой
применимости  гамма-моделей  с  одинаковыми  параметрами  и  отрицательных  биноми-
альных  моделей  распределение  Стьюдента  может  рассматриваться  в  задачах  приклад-
ной  (описательной)  статистики как вполне разумная модель.
Выше  мы уже  упоминали,  что отрицательное  биномиальное  распределение  (как  мы
убедились, тесно связанное с распределением Стьюдента следствием 0.1), при натураль-
ном г может быть интерпретировано в терминах испытаний Бернулли, проведенных до
r-й неудачи.  В  то же время,  особенно в задачах, связанных с анализом больших рисков,
большой  интерес  представляет  изучение  распределения  Стьюдента  с  малым  парамет-
ром формы, то есть с очень "тяжелыми хвостами". Более того, можно показать, что при
максимум  плотности р 7 (х)  распределения  Стьюдента  (см.  (0.1))  стремится
к  нулю  как  .  Одновременно  "хвосты"  распределения  Стьюдента  становятся  все
более  и  более  "тяжелыми".  Поэтому  распределение  Стьюдента  с  малым  параметром
может  рассматриваться  как  некий  аналог  равномерного  распределения  на бесконечном
интервале.
Чтобы  следствие  0.1  можно  было  использовать  и  в  такой  ситуации,  следует  раз-
обраться, что из себя представляет отрицательное биномиальное распределение, то есть
как оно может быть проинтерпретировано при  В главе  1  приводятся также
два примера,  иллюстрирующие  возможность такой  интерпретации.
В  главе  2  доказана  общая  теорема,  позволяющая  автоматически  получать  оценки
скорости  сходимости  к  распределению  Стьюдента распределений  статистик,  построен-
ных  по  выборкам  случайного  объёма,  из  оценок  скорости  сходимости  к  нормальному
закону  аналогичных статистик,  использующих большой,  но  не случайный  объём  выбо-
рок.  При этом  предполагается,  что  объём выборок  имеет  отрицательное  биномиальное
распределение  с  малыми  параметрами.  Затем  эта  теорема  применяется  к  линейным
комбинациям  порядковых  статистик  и  U  -  статистикам,  широко  применяемым  в  тео-
рии  риска и математической  статистике.
Пусть  - случайная  величина,  имеющая  отрицательное  биномиальное  распреде-
ление  с  параметрами  определённое  формулой  (0.3).
Нас будет интересовать предельное поведение распределения нормированной случайной
величины

при р  0.  В  главе  2  доказана  следующая


ТЕОРЕМА  0.2
Пусть  тогда  существует  постоянная  такая,  что

При г  —  1  правую часть  неравенства (0.6) можно заменить на


Затем  эта  теорема применяется  следующим  образом.
Пусть  статистика

построена по повторной выборке  независимых  одинаково  распределённых


случайных величин, является асимптотически нормально распределённой и для её рас-
пределения справедлива оценка скорости сходимости вида: существуют числа <  и
такие,  что

Пусть  - случайная  величина,  имеющая отрицательное биноми-


альное распределение  (см.  (0.3))  вида

которая  не  зависит  от  исходных  случайных величин


-  функция  распределения  распределения  Стьюдента  с  параметром  формы
Рассмотрим теперь  статистику  построенную по выборке случайного объёма
то  есть

Доказана  следующая  теорема.


ТЕОРЕМА  0.3
Пусть распределение статистики  удовлетворяет  соотноше-
нию

9
тогда  распределение  статистики  где  случайная  величина
имеет  отрицательное  биномиальное распределение  вида  (0.8)  и  удовле-
творяет  равенству

Далее  приведены  два  примера  использования  теоремы  0.3.  Первый  пример  касает-
ся  U  -  статистик,  а  второй  -  линейных  комбинаций  порядковых  статистик,  широко
применяемых в  статистике  (см.,  например,  (Королюк,  Боровских  1989),  (Serfling  1980),
(Helmers  1984),  (Bening  2000)).  Совершенно  аналогично,  с  учётом,  например,  резуль-
татов  работы  (Does  1982),  могут  быть  рассмотрены  ранговые  статистики,  или  ста-
тистика  Стьюдента  (см.  (Bentkus,  Gotze  1996))  и  вообще  достаточно  широкий  класс
симметричных  статистик  (см.  работы  (Van  Zwet  1984)  и  (Alberink  2000),  теорема  3.1).
Эти  результаты  могут  быть  также  использованы  для  уточнения  теорем,  касающихся
оценок  опасности  отказа  из  работы  (Wu  Da  2003).
Пусть  -  повторная  выборка  независимых  одинаково  распределённых
случайных  величин,  имеющих  общую  функцию  распределения  F(x).  Определим  U  -
статистику  по формуле

где  -  симметричная  измеримая  функция  двух  переменных.


Определим теперь линейные комбинации порядковых статистик. Пусть
-  вариационный  ряд,  построенный  по  исходной  выборке  Тогда  ли-
нейная  комбинация порядковых статистик  определяется  по формуле

гле  -  некоторые  числа.


Пусть теперь  - случайная величина, имеющая отрицательное
биномиальное  распределение  вида  (0.8),  которая  не  зависит  от  исходных  случайных
величин  Рассмотрим теперь статистики  (см.  определения  (0.10)  и
(0.11))  построенные по выборке  случайного  объёма  то  есть  пусть

Следующая  теорема  является  непосредственным  следствием  теоремы  0.3.


ТЕОРЕМА  0.4
Пусть  для  статистик  выполнены  условия регулярности,  сформули-
рованные в работах (Helmers,  Van Zwet 1982) и (Helmers 1981,  1984).  Тогда распреде-
ления  статистик  где  случайная  величина.  имеет
отрицательное  биномиальное  распределение  вида  (0.8)  и  удовлетворяет
равенству

10
где  величины  определены  в  этих  работах,  а
функция распределения Стьюдента с параметром формы
В  главе  3  рассматривается  задача  статистического  оценивания  центра  распределе-
ния  Стьюдента  в  предположении,  что  параметр  формы  этого  распределения  является
известным и малым.  Изучается  асимптотика по этому параметру асимптотической  от-
носительной  эффективности  наиболее  распространённых  оценок  центра  этого  распре-
деления.
В  качестве  иллюстрации  тех  возможных  преимуществ,  которые  предоставляет  се-
мейство  распределений  Стьюдента,  если  его  использовать в  качестве  модели  распреде-
ления с "тяжёлыми хвостами",  мы вычислим некоторые  асимптотические характерис-
тики  статистических  процедур  оценивания  параметров  распределения  Стьюдента.
Наиболее очевидной и естественной задачей статистического оценивания, связанной
с  распределением  Стьюдента,  является  задача оценивания  параметра формы  -  числа
степеней свободы. Для ее решения могут быть использованы различные процедуры,  на-
пример, метод максимального правдоподобия, метод логарифмических моментов. Особо
следует  отметить,  что  так  как  распределение  Стьюдента  принадлежит  к  классу  зако-
нов с " тяжёлыми хвостами",  а параметр  является показателем " тяжести хвостов",  то
для  оценивания  этого  параметра  могут  также  применяться  известные  процедуры  оце-
нивания степени "тяжести хвостов", например, оценки Хилла (Hill 1975), Де Хаана (см,
например,  (Resnick 1995)) и другие  (см., например,  (Embrechts et al.  1997)). Оценки вто-
рой группы,  как правило,  вычисляются намного проще,  нежели оценки максимального
правдоподобия или  оценки  метода логарифмических моментов.  Подробное сравнитель-
ное исследование  упомянутых процедур  не  является  целью  данной диссертации.
Вместо этого,  в соответствии с общей направленностью диссертации,  ниже мы рас-
смотрим  другую  естественную  задачу  статистического  оценивания,  связанную  с  рас-
пределением  Стьюдента,  - задачу  оценивания  центра  этого  распределения,  уделяя  осо-
бое внимание  асимптотическим  свойствам соответствующих  процедур при  что
важно при  использовании распределения  Стьюдента для  описания  больших рисков.
Пусть  (Х\, •••, Хп) - независимые одинаково распределённые наблюдения, имеющие
функцию распределения  причём  функция распределения  F(x)  известна,
симметрична и  обладает  положительной  плотностью

Рассмотрим задачу оценивания параметра  сдвига  С этой целью будем рассматривать


эквивариантные оценки  то есть  такие,  что  при  всех

Все  традиционно  используемые  оценки  параметра  сдвига  являются  эквивариантными


относительно  сдвига,  например,  среднее,  выборочная  медиана  или  любое  взвешенное
среднее  порядковых  статистик  с  суммой  весов,  равной  единице.  Заметим,  что  оценка
максимального  правдоподобия  также  эквивариантна.  Известно,  что  при  квадратичной
функции  потерь  при  каждом  п  наилучшей  эквивариантной  оценкой  является  оценка

11
Питмэна  (см.  (Леман  1991),  теорема 3.1.5;  (Ибрагимов, Хасьминский  1979), стр.  33)

Однако эти оценки, являющиеся эталоном при сравнении оценок, как правило, являются
трудновычислимыми  и  представляют  в  основном  теоретический  интерес.
Мы  будем  рассматривать  асимптотический подход (при  и асимптотически
нормальные  последовательности  эквивариантных оценок

Для  сравнения  предельного  качества  таких  оценок  используем  понятие  асимпто-


тической  относительной  эффективности  (АОЭ)  (см.  (Леман  1991),  стр.  305  -  307).
Для  двух  последовательностей  асимптотически  нормальных  эквивариантных  оценок

определим  АОЭ оценки  относительно оценки  как

Отметим,  что  если  определить  число наблюдений  т  =  тп(п)  так,  чтобы

то  .  .

Таким образом, чтобы получить предельное распределение, совпадающее с предельным

оценки асимптотически эквивалентны.
Рассмотрим теперь  абсолютную АОЭ  (ААОЭ),  то есть  асимптотическую эффектив-
ность относительно наилучшей оценки Питмэна  ,  В  работах  (Stone  1974)
и  (Port, Stone 1974)  показано, что при весьма общих условиях регулярности эти оценки
асимптотически нормальны

где  / - фишеровская  информация

12
Заметим,  что  асимптотическая дисперсия  1~1  оценки Питмэна  совпадает  с  нижней
границей  дисперсий  из  неравенства  Крамера  -  Рао.  Обозначим  ААОЭ  последователь-
ности  эквивариантных  асимптотически  нормальных оценок
относительно оценки Питмэна  через

Рассмотрим  теперь  задачу  оценивания  параметра  по выборке независимых одинако-


во распределённых случайных величин (Xi, • • •, Хп), имеющих функцию распределения
Если функция  распределения F(x)  нормальна,  то  выборочное среднее

является  несмещённой  оценкой  параметра в  с  минимальной  дисперсией.  Эта оценка об-


ладает тем  же  свойством для  всех  распределений,  имеющих  плотность  и нулевое  мате-
матическое ожидание  (см.  (Леман 1991), стр.  99).
Свойства оценки  (0.14)  существенно  зависят  от поведения  "хвостов"  распределения
наблюдений.  Например, для распределения Коши  (имеющего столь "тяжелые хвосты",
что не существует математическое ожидание),  как известно, при  каждом  оценка
(0.14)  имеет  такое же  распределение,  как  и отдельное наблюдение.  Естественный  путь
получения более устойчивых оценок состоит в отбрасывании крайних наблюдений. Осо-
бенно  нечувствительной  к  поведению  "хвостов"  функции  распределения  F(x)  является
выборочная медиана

где  - вариационный ряд, построенный по исходным независимым наблю-
дениям
(Xi,---,Xn).
Однако такое радикальное  отбрасывание крайних членов выборки не всегда приво-
дит к разумным  результатам.  Естественным компромиссом между средним и медианой
является  отбрасывание, например,  наименьших  и  наибольших  наблюдений,
где  то  есть  рассмотрение  усечённых  средних

или усечённых линейных комбинаций  порядковых статистик

где

13
или  - уинзоризованных  средних  (см.  (Bickel  1965))

Рассмотрим  также  оценку  Ходжеса  -  Лемана  (см.  (Hodges,  Lehmann  1963)  и  (Леман
1991),  стр.  339  - 341)

то есть  это медиана
Всюду  далее  будет  рассматриваться  семейство  рапределений  Стьюдента  с  пара-
метром  функциями распределения  и  плотностями
определяемыми соотношением  (0.1). Параметр формы  (число степеней  свободы)
предполагается  известным. При  у  этого  распределения  существует  абсо-
лютный  момент порядка  При  у  этого  распределения  существует  дисперсия,
которая в  таком случае  равна  . При  дисперсии  не  существует.  В  главе  3
доказана  следующая
ЛЕММА  0.3

1.  Для любого  существует фишеровская информация


. 2

Далее  с помощью  этой  леммы  находится  АОЭ  указанных  выше  опенок.


ТЕОРЕМА  0.5  Для  о ц е н о к с п р а -
ведливы соотношения

14
Заметим  также,  что  из  теоремы  0.5  следует,  что  выборочная  медиана  асимпто-
тически  "лучше"  чем оценки
Как  уже  отмечалось,  усечённое  среднее ,  (см.  (0.16))  является естественным ком-
промиссом  между  средним  (см.  (0.14))  и  медианой  Мп  (см.  (0.15)).  Другой  ком-
промисс,  предложенный  Хьюбером  (Huber  1964),  подсказан  тем  фактом,  что среднее и
медиана являются величинами, минимизирующими по  соответственно функции

15
Хьюбер предложил  минимизировать более  общее  выражение  вида

с некоторой разумно выбранной функцией р(х) (например, выпуклой и чётной). Оценки,
минимизирующие  выражение  (0.19),  будем  называть  М-оценками.  Если функция
дифференцируема,  то при соответствующих условиях регулярности  (см.  (Huber  1964)),
М-оценка является решением уравнения

Заметим  также,  что  М-оценки  являются  эквивариантными,  и  оценки  максимального


правдоподобия  (в случае параметра сдвига)  являются  М-оценками  с  функцией

Рассмотрим конкретную функцию  предложенную  в  работе  (Huber  1964):

Эта функция пропорциональна  а вне этого отрезка заменяет ветви пара-
болы на прямые линии. Эти куски согласованы так, что функция  и её производная
непрерывны.  Оценки, минимизирующие выражение  (0.19)  с этой функцией, будем обо-
значать  При растущем k функция  будет  совпадать  с  ,  на всё большей части
области её определения,  так что оценка  "~  будет  сближаться с  . При уменьшении
оценка  будет  сближаться  с  медианой
Обозначим  оценку  максимального правдоподобия  через  Справедлив  следующий
результат.
ТЕОРЕМА  0.6  Пусть  случайные величины  независимы,  имеют одина-
ковую функцию распределения  и  плотность  Тогда:

1.  Оценка максимального правдоподобия  удовлетворяет  уравнению

16
Заметим,  что  из  теоремы  0.6  следует,  что  выборочная  медиана  асимптотически
"лучше"  чем  М-оценка  но М-опенка  "лучше"  чем оценки
В главе 4 рассматривается задача аппроксимации необходимого резервного капитала
страховой  компании  в  случае  большого  числа  различных  клиентов.
Рассмотрим  простейшую  модель  страхования,  в  которой  имеется  большое  число
страховых  контрактов  (клиентов),  и  одна  страховая  компания,  их  обслужи-
вающая.  Страхование  рассматривается  с  точки  зрения  страховой  компании.  Каждый
контракт  характеризуется  величиной денежного  "ущерба"  (формаль-
но  здесь  не  предполагается  неотрицательность  и  вероятностью
1,...,п,  с  которой  этот  ущерб  может  возникнуть.  Тогда  общий  суммарный  убыток
страховой компании  является случайной величиной  вида

где  мы  предполагаем,  что  случайные  величины  независимы и принимают


только два значения  1  и 0 соответственно с вероятностями  то  есть
с математической точки зрения имеем так называемую схему серий.  Заметим, что если
контракты  однородны,  то есть

то  случайная  величина  имеет  вид

где  -  биномиальная  случайная  величина  с  параметрами  (п,р),  и  моделирование


поведения  случайной  величины  при  больших  п  сводится  к  имитационному  моде-
лированию биномиальной случайной  величины  или к использованию  асимптотических
свойств биномиального распределения  (см.  теорему 0.9 ниже).

17
Мы рассмотрим здесь также случай  неоднородных контрактов,  то есть случай,  когда
нарушаются  условия  (0.21).  Для  данного  малого  (0,1)  нас  будет  интересовать
астимптотическое  поведение  резервного  капитала  страховой  компании  который
определяется из условия малости вероятности того, что у страховой компании не хватит
средств  для  покрытия  общих  суммарных  убытков,  то  есть  из  условия

Здесь  возможна  так  же  следующая  интерпретация.  Пусть,  например,  на  единичном
отрезке  "времени"  [0,1]  задана  достаточно  гладкая  функция  которая  описывает
"скрытый  ущерб"  в  момент  времени  t  Предположим,  что  "ущерб"  может  проявиться
только, например, в моменты времени вида

и  величина ущерба

проявляется с вероятностью  в момент времени  - величина  суммарного


проявившегося ущерба и,  - неслучайный  порог,  за который  величина Dn  не выходит
с большой  вероятностью
Используя результаты работ  (Albers et al.  1976),  (Бенинг, Королёв  1998) и  (Molenaar
1970), в главе получено  асимптотическое разложения по п для необходимого резервного
капитала  (см.  (0.22))  (см.  теоремы  0.8  и  0.9  ниже).  Рассмотрен  так  же  случай
случайного  числа  контрактов
Предельное  поведение  резервного  капитала  страховой  компании  (см.  (0.22))  в
случае,  если  случайные величины  одинаково распределены
1,..., п),  может  быть  описано  с  использованием следующей  предельной  теоремы.
ТЕОРЕМА  0.7  (см.,  например,  (Гаек,  Шидак  1971),  стр  198)  Пусть  Xi,X2,...,Хп  -
независимые одинаково распределенные случайные величины с конечными математи-
ческими ожиданиями и дисперсиями

18
Поэтому  в  этом  случае,  при  выполнении  условия  (0.23),  справедливо  следующее  пре-
дельное соотношение для  резервного капитала

где

Заметим,  что  условие  регулярности  (0.23)  на константы  означает,  что  асимпто-


тически (при  они  себя ведут примерно  одинаково.
Для  случая  однородных  контрактов

формула  (0.24)  приобретает  следующий  простой  вид

Рассмотрим  вопрос  об  уточнении  остаточного  члена  в  формулах  подобного  типа,  ко-
торые  получаются  с  использованием  предельных  теорем.  Для  получения  асимптоти-
ческого  разложения  резервного  капитала  страховой компании  используем  условия
регулярности  на константы  j  =  1,..., п  и Pjn,  j  =  1,..., п  из  работы  ((Albers  et
al.  1976),  формулы  (4.2.14)  -  (4.2.16)).
Обозначим математическое ожидание, дисперсию, третий и четвертый семиинвари-
анты  случайной величины  (см.(0.20))  соответсвенно  через

19
Аналогичным  образом,  с  учётом  теорем  0.3  и  0.8,  может  быть  рассмотрен  общий  не-
симметричный  случай  и  случай,  когда  случайная  величина  Nn  имеет  отрицательное
биномиальное  распределение  (0.8).
Публикации
Основные  результаты  диссертации  опубликованы  в  следующих  работах

1.  У  Да,  Бенинг  В.Е.,  Об  оценивании  центра  распределения  Стьюдента  с  малым
числом  степеней  свободы.  -  Вестник  Московского  Университета,  серия  15,  Вы-
числительная  Математика и Кибернетика,  2003,  н.  3,  с.  30 - 37.

2.  Wu  Da,  Bening  V.E.,  Small  degree  of  freedom  for  the  Student  distribution  family  (in
Chinese).  -  Mathematica  Applicata,  2003,  v.  16,  p.  133  -  136.

3.  У  Да,  Бенинг  В.Е.,  Об  аппроксимации  необходимого  резервного  капитала  стра-
ховой  компании  в  случае  большого  числа  неоднородных  контрактов.  -  Вестник
Московского  Университета,  серия  15,  Вычислительная  Математика  и  Киберне-
тика,  2002, н.  3,  с.  49 - 54.

4.  Wu  Da,  Two  theorems  for  estimating  risk  refusal  function.  -  J.  Appl.  Math.,  2003,  v.
18,  ser.  A,  p.  311  - 317.

21
Издательство ООО "МАКС Пресс".
Лицензия ИД № 00510 от 01.12.99 г.
Подписано к печати  11.11.2004 г.
Формат 60x90  1/16. Усл.печл.  1,25. Тираж  100 экз. Заказ  1119.
Тел.  939-3890,939-3891,928-1042.  Тел./факс  939-3891.
119992, ГСП-2, Москва, Ленинские горы, МГУ им. М.В Ломоносова.
2-й учебный корпус, 627 к.

Вам также может понравиться