Вы находитесь на странице: 1из 15

Модель двумерного гамма распределения с приложением

в фармакологии

Морозов Никита Денисович, 22.М03-мм

Санкт-Петербургский государственный университет


Математико-механический факультет
Кафедра статистического моделирования

Научный руководитель: к. ф.-м. н., доцент Н. П. Алексеева


Рецензент: Скурат Евгения Петровна

Санкт-Петербург
2024г.

1/15 Морозов Никита Денисович, 22.М03-мм Модель двумерного гамма распределения


Постановка задачи

Цель работы состоит в исследовании возможности применения гамма


распределения для анализа медицинских данных, включая выделение
подходящих признаков и сравнение оценок параметров для различных
групп данных, а также рассмотрению методов проверки согласия
данных с гамма распределением.

Получение оценок параметров и построение доверительных


интервалов для параметров одномерного и двумерного гамма
распределения
Выделение различных подгрупп в данных и получение их оценок
параметров.
Рассмотрение методов для проверки согласия теоретического
распределения с эмпирическим

2/15 Морозов Никита Денисович, 22.М03-мм Модель двумерного гамма распределения


Структура данных

Данные представляют собой большую кардиологическую базу из 224


признаков и 169 индивидов. Из всех данных были отобраны признаки
имеющие лучшее согласие с гамма распределением. 4 категориальных
признака были выделены для подгрупп и создания симптомов.
LA, LVd, LVs–размеры предсердий и желудочков перед операцией.
Эти же признаки рассматривались в 2 точках измерений.
RA,RV – правое предсердие и желудочек.
EF, EF po–Фракция изгнания левого желудочка перед, и после
операции
EKK, ISh- время перфузии и ишемии
KDO, KSO - Конечный диастолический и систолический объем
ЛЖ, представленный в 2 временных точках.
рАPmах, РМКмах-Градиент давления на МК, АК(аортальный и
митральный клапаны) или протезе.
Категориальные признаки: Пол, ИМТ, возраст, курение.

3/15 Морозов Никита Денисович, 22.М03-мм Модель двумерного гамма распределения


Модель одномерного гамма распределение

Функция и плотность гамма распределения


Функция гамма распределения :
∫∞
Γ(𝛼) = x 𝛼− 1 e − x dx, 𝛼 > 0.
0
Плотность:
 −x
 x 𝛼− 1 e 𝛽
𝛽 𝛼 Γ( 𝛼) , x ≥ 0,


𝛾(x, a, 𝛽) =
 0, x < 0,


Где 𝛽 – масштаб, 𝛼 – форма.

4/15 Морозов Никита Денисович, 22.М03-мм Модель двумерного гамма распределения


Модель двумерного гамма распределения

Есть три независимо распределенный гамма величины 𝜉1 , 𝜉2 , 𝜉3 с


параметром масштаба равным 1, и параметрами
формы(экстенсивности), равными 𝜆1 , 𝜆2 , 𝜆3 . Из них мы можем
построить случайные величины

𝜂1 = 𝜉1 + 𝜉2 , 𝜂2 = 𝜉1 + 𝜉3 .

Пусть имеются две гамма-распределенные случайные величины Y1 , Y2


с параметрами формы, равными Λ1 , Λ2 соответственно, единичными
параметрами масштаба и с коэффициентом корреляции, равным 𝜌.
Примем за Λi = 𝜆0 + 𝜆i , где i = 1, 2.
Параметры двумерного гамма-распределения могут быть получены
следующим образом:
√︁ √︁ √︁
𝜆0 = 𝜌 Λ1 Λ2 , 𝜆 1 = Λ1 − 𝜌 Λ1 Λ2 , 𝜆 2 = Λ2 − 𝜌 Λ1 Λ2 .

[Н.Алексеева]

5/15 Морозов Никита Денисович, 22.М03-мм Модель двумерного гамма распределения


Проверка согласия эмпирического распределения с теоретическим
Для проверки гипотезы о согласии данных с гамма распределением
использовался 𝜒2 . Статистика критерия:
r ( v − np0 ) 2 d
𝜒2 = i
−−−−−→ 𝜒2 (r − 1). Использовался метод Bootstrap на 1000
Í i
np0 n→∞
i=1 i
выборок с уровнем значимости 𝛼 = 0.05. В тексте научной работы
написаны разделы о математической проблеме проверки гипотез
однородности по параметрам.

Рис.: Гистограмма признаков Ish и D ro.


6/15 Морозов Никита Денисович, 22.М03-мм Модель двумерного гамма распределения
ММП для одномерного гамма распределения

Функция правдоподобия для выборки из гамма распределения:


n
n
Ö −1 Í
xi
𝛼− 1
𝛽 − n 𝛼 Γ − n (𝛼).
𝛽
L(x1 , . . . , xn |𝛽, 𝛼) = ( xi ) e i= 1

i= 1

Логарифм функции правдоподобия:


n n
∑︁ 1 ∑︁
lnL(x1 , . . . , xn |𝛽, 𝛼) = (a − 1) lnxi − xi − n𝛼ln𝛽 − nlnΓ(𝛼),
𝛽
i=1 i= 1

Оценки:
𝛼ˆ
𝛽ˆ = .

n
1 ∑︁ Γ′ ( 𝛼)
ˆ
ln(xi ) + ln( 𝛼)
ˆ − ln( x̄) − =0
n Γ( 𝛼)
ˆ
i= 1

7/15 Морозов Никита Денисович, 22.М03-мм Модель двумерного гамма распределения


Разбиение на подгруппы

Во время разбиения данных на подгруппы были рассмотрены


признаки, которые по нашим категориальным признакам разбивали
выборку на 2 группы с значением TRUE и FALSE. После этого
разбиения у полученных подгрупп были получены оценки параметров и
значение p-value для согласия с гамма распределения. Таким образом,
мы например выделили признак RA и показатель пола пациента,
которые оба оставляли хорошее согласие с гамма распределение, и
имели большую разницу в полученных оценках

Таблица: Пример Оценки сгруппированных параметров RA и p.value

Группа Форма Масштаб P.Value


Изначальное значение 27 1.7 0.95
Женщина 19.18 2.4 0.9
Мужчина 32.2 1.4 0.7
Лишний вес 61 0.8 0.2
Нормальный вес 24 1.8 0.45

8/15 Морозов Никита Денисович, 22.М03-мм Модель двумерного гамма распределения


Оценки параметров у данных в 2 точках

У нас есть данные, которые представляю две временные точки, с ними


были проведены операции оценки параметров и разбиения на группы с
последующим получением оценок

Таблица: Пример оценок параметров двумерного гамма распределения в 2


точках

Признак Λ1 Λ2 𝜌 𝜆0 𝜆1 𝜆2
LA,LAd po 25 40.5 0.66 21.3 3.7 19.2
LVd,LVd po 37.8 49.6 0.65 28.5 9.2 21
LVs,LVs po 21.01 22.1 0.7 15.2 5.7 6.8
EF,EF po 30.3 23.2 0.4 10.8 19.5 12.4

9/15 Морозов Никита Денисович, 22.М03-мм Модель двумерного гамма распределения


Создание симптомов

С помощью наших категориальных переменных мы создавали


симптомы, которые представляют собой всевозможные комбинации
этих признаков. Для каждого признака были рассмотрены часть этих
всевозможных комбинаций(около 1000) которые я создавал из базовых
симптомов. Обозначим Возраст переменной a, Пол b, Вес c, Курение d.
Базовые симптомы имеют вид: a, b, a · b, c, a·c, b·c, a·b·c, d, a·b·c·d, a · d.

Таблица: Пример получения оценок параметров у симптомов признака LA.

Симптом и значение 𝛼 𝛽 p-value популяция


c+a·c+a·b·c·d+a·d=TRUE 18.7 2.4 0.78 75
a+b+c+a·c+a·b·c·d+a·d=FALSE - - - 2
a+c+a·c+a·b·c+a·b·c·d+a·d=TRUE 18 2.5 0.52 88
a+c+a·c+a·b·c+a·b·c·d+a·d=FALSE 42.1 1.13 0.7 44
a·b+b·c+a·d=TRUE 19.9 2.3 0.45 62
a·b+b·c+a·d=FALSE 26.5 1.7 0.69 72

10/15 Морозов Никита Денисович, 22.М03-мм Модель двумерного гамма распределения


Симптомы в двух точках

Таблица: Оценка параметров одномерного распределения признаков LVd и


LVd po.

Симптом и значение pvalue1 pvalue2 N1 N2


a+a·b+a·c+a·b·c+a·d=TRUE 0.5 0.3 45 51
a+c+a·b·c+a·d=TRUE 0.48 0.29 89 78
a·b+a·c+b·c+a·b·c=TRUE 0.63 0.42 73 64
c+b·c+a·b·c=TRUE 0.56 0.36 67 59

Таблица: Оценка параметров у двумерного распределения признака LVd и


LVd po.

Симптом и значение Λ1 Λ2 𝜌 𝜆0 𝜆1 𝜆2 N
a+a·b+a·c+a·b·c+a·d=TRUE 25.9 49.5 0.6 22.1 3.7 27.4 43
a+c+a·b·c+a·d=TRUE 30.8 50.6 0.6 25.6 5.2 25 76
a·b+a·c+b·c+a·b·c=TRUE 28.4 47.6 0.66 24.3 4 23.2 63
c+b·c+a·b·c=TRUE 33 45.8 0.6 24.1 9.7 21.7 58

11/15 Морозов Никита Денисович, 22.М03-мм Модель двумерного гамма распределения


Доверительные интервалы методом моментов и максимального
правдоподобия

Были построены 95 процентные доверительные интервалы для


параметров полученных методом моментов и методам максимального
правдоподобия. Так же были рассмотрены данные с симптомами.

Таблица: Пример доверительные интервалы на признаке LA и LAd po

Параметр ММ оценка ММ интервал ММП оценка ММП интервал


𝜆0 20.5 ( 15.1; 25.97) 21.3 (15.7;26.9)
𝜆1 3.59 ( -1.8; 9) 3.7 (-1.9;9.3)
𝜆2 18. (13; 23.8) 19.2 (13.5; 24.8)

12/15 Морозов Никита Денисович, 22.М03-мм Модель двумерного гамма распределения


Симптом

Рассмотрим подробнее симптом c+b·c+a·b·c.


В подгруппу TRUE у нас попадают люди мужского пола, старше 35
лет, имеющих лишний вес и, возможно, курящих.
Изначальные параметры:

Таблица: Изначальные оценки LVd и LVd po

Параметр LVd 𝛼 LVd po 𝛼 LVd 𝛽 LVd po 𝛽


TRUE 34.14 46.48 1.84 1.14
FALSE 56.74 57.39 3.7 1

Таблица: Двумерный случай.

Значение симптома Λ1 Λ2 𝜌 𝜆0 𝜆1 𝜆2 N
TRUE 33 45.8 0.6 24.1 9.7 21.7 58
FALSE 51.74 57.39 0.63 34.33 17.41 23.06 54
Значение симптома p-value значимости
TRUE 2.399e-07
FALSE 1.786e-08

13/15 Морозов Никита Денисович, 22.М03-мм Модель двумерного гамма распределения


Доверительные интервалы

Рис.: Доверительные интервалы LA и LAd po

14/15 Морозов Никита Денисович, 22.М03-мм Модель двумерного гамма распределения


Полученные результаты

Рассмотрены модели и возможности получения оценок параметров


у одномерного и двумерного гамма распределения.
Проведена проверка согласия группированных признаков с гамма
распределением с использованием метода Bootstrap.
Модель и методы оценки параметров применены к реальным
данным кардиологических наблюдений.
Рассмотрены данные разбитые на различные группы,
проанализированы их оценки параметров
Выделены различные симптомы в различных подгруппах.
Рассмотрены симптомы состоящие из 4 признаков. Построены
доверительные интервалы

15/15 Морозов Никита Денисович, 22.М03-мм Модель двумерного гамма распределения

Вам также может понравиться