Академический Документы
Профессиональный Документы
Культура Документы
Г.А. Зверкина∗
19 ноября 2021 г.
Аннотация
Цель этой статьи – показать, как метод склеивания может приме-
няться для получения строгих оценок сверху для скорости сходимости
распределения регенерирующих марковских процессов к стационарно-
му распределению в случаях, когда рассматриваемый регенерирующий
марковский процесс эргодичен. Этот метод может применяться к СМО,
СеМО и системам надёжности. Статья представляет собой изложение
пленарного доклада авторов на VIII Международной молодежной на-
учной конференции «Математическое и программное обеспечение ин-
формационных, технических и экономических систем» (г. Томск, 26-30
мая 2021 года).
Введение
В теории массового обслуживания (ТМО) и в смежных задачах очень важно
знать числовые характеристики рассматриваемой системы – как в стационар-
ном, так и в достационарном режиме. В ряде случаев такие характеристики
могут быть вычислены, но это возможно для ограниченного количества ре-
альных моделей. Однако в большинстве случаев возможно вычисление или
∗
Работа автора поддержана грантом РФФИ № 20-01-00575А
1
оценка стационарных значений характеристик исследуемых моделей. Пове-
дение подавляющего количества систем массового обслуживания (СМО), си-
стем надёжности и сетей массового обслуживания (СеМО) может быть описа-
но с помощью линейчатых марковских процессов, которые во многих случаях
являются регенерирующими. В том случае, когда период регенерации мар-
ковского процесса имеет конечное среднее значение, этот процесс эргодичен.
Метод склеивания может применяться для получения строгих оценок сверху
для скорости сходимости распределения регенерирующих марковских про-
цессов (РМП) к стационарному распределению (естественно, в тех случаях,
когда рассматриваемый РМП эргодичен). Этот метод может применяться к
анализу систем массового обслуживания, сетей массового обслуживания и
систем надёжности.
К сожалению, в отечественной литературе практически нет информации
о методе склеивания (см., например, [1], [5]), хотя отечественные учёные ис-
пользовали этот метод ([6] и др.).
2
ляется измеримой по ~y функцией распределения (ф.р.)
(0)
Bij (~x|~y ) = P{~υ (t + dt) < ~x|~υ (t) = ~y , ν(t) = i, ν(t + dt) = j}
2 Регенерирующие процессы
Поведение большинства изучаемых СМО, СеМО и систем надёжности опи-
сывается регенерирующими процессами.
3
Определение (Регенерирующего процесса). Процесс (Xt , t > 0), заданный
на вероятностном пространстве (Ω, F , P), с измеримым пространством
состояний (X , B(X )) называется регенерирующим, если существует воз-
растающая последовательность {θn } (n ∈ Z+ ) Марковских моментов по
отношению к фильтрации Ft60 таких, что последовательность
{Θn } = Bt+θn−1 − Bθn−1 , θn − θn−1 , t ∈ [θn−1 , θn ) , n ∈ N
4
Например, в состояние регенерирующего процесса Xt , t ∈ [θn−1 , θn ) мож-
но включить полную историю этого процесса на интервале [θn−1 , t]: процесс
def
X t == {Xs , s ∈ [θn−1 , t]|t < θn } – марковский и регенерирующий на расширен-
ном пространстве состояний X .
5
2.4 Процесс восстановления и неравенство Лордена
∞
( i )
def
X X
Рассмотрим процесс восстановления Nt == 1 ξk 6 t , где {ξ1 , ξ2 , ...}
i=1 s=1
– н.о.р. положительные случайные величины (сл.в.) с ф.р. F (s). Nt – это
считающий процесс, который меняет своё значение в моменты времени tk =
s
def
X
Sk == ξj . Эти моменты tk называются моментами восстановления.
j=1
D D D
ξ1 ξ2 = ξ1 ξ3 = ξ1 ξ4 = ξ1
.........
-
t0 = 0 t1 t2 t t3
@
t4
Bt Wt
— см. [8].
Теорема (Г.Лордена, см. [11]). Неравенство Лордена даёт оценку сверху ма-
тематического ожидания (м.о.) перескока:
E ξ 2 def
E Bt 6 == Ξ = функционал от F (s) .
Eξ
Это неравенство будет использовано для получения оценки сверху для
скорости сходимости распределения перескока к стационарному распределе-
нию в метрике полной вариации.
Напомним, что
P{имеется хотя бы одно восстановление на интервале [t, t+∆]|Bt = y} =
y+∆
F (y + ∆) − F (y)
Z
= = λ(s) ds = λ(y)∆ + o(∆),
1 − F (y)
y
6
где
F 0 (t) d
λ(t) = = − ln(1 − F (t) , (1)
1 − F (t) dt
и λ(t) называется интенсивностью процесса восстановления.
При этом
s s
Z Z
F (s) = 1 − exp (−λ(u)) du, F 0 (s) = λ(s) exp (−λ(u)) du . (2)
0 0
7
т.е. поведение процесса после момента tn зависит только от его состояния в
момент tn и не зависит от того, что было раньше.
Пусть теперь два независимых Марковских процесса Xt и Xt0 имеют одина-
0
ковые переходные вероятности: P{Xt+θ ∈ A|Xt ∈ B} ≡ P{Xs+θ ∈ A|Xs0 ∈ B}
для всех θ > 0 и t > 0, s > 0, при этом X0 6= X00 . И пусть известно, что в
некоторый момент времени τ эти процессы совпали: Xτ = Xτ0 = X. Тогда,
в соответствии с переходной функцией и Марковским свойством, для всех
t = τ + s > τ и A ∈ σ(X ) выполняется: P{Xt ∈ A} = P{Xt ∈ A|Xτ = X} =
P{Xt0 ∈ A|Xτ0 = X} = P{Xt0 ∈ A}.
Если известно распределение (или оценка распределения) момента скле-
ивания τ (эта величина, вообще говоря, зависит от начальных условий про-
цессов Xt и Xt0 ), то выписывается основное неравенство склеивания:
= |P{Xt ∈ S} − P{Xt0 ∈ S}| × (1(τ > t) + 1(τ 6 t)) 6 P{τ > t} (3)
(здесь 1(·) обозначает индикатор события).
Процессы (Xt , t > 0) и (Xt0 , t > 0) имеют распределения
def def
Pt (A) == P {Xt ∈ A}, и Pt (A) == P {Xt ∈ A} соответственно.
0 0
def
τ (X0 , X00 ) === inf {t > 0 : Xt = Xt0 } . Предположим, что для некоторой по-
ложительной возрастающей функции ϕ(t) вычислена или оценена сверху ве-
личина E ϕ (τ (X0 , X00 )) = C (X0 , X00 ) < ∞ . Подставим эту функцию в послед-
нее выражение (3) и применим неравенство Маркова:
|Pt (A) − Pt0 (A)| 6 P {τ (X0 , X00 ) > t} = P {ϕ (τ (X0 , X00 )) > ϕ(t)} 6
E ϕ (τ (X0 , X00 ))
6 |Pt (A) − Pt0 (A)| 6 .
ϕ(t)
Если известна оценка стационарного распределения P процесса Xt (и Xt0
– это одно и то же), то последнее неравенство можно проинтегрировать по
стационарной мере P, и тогда получаем
Z
C
b (X0 )
|Pt (A) − P(A)| 6 (ϕ(t))−1
ϕ (τ (X0 , X00 )) d P (X00 ) = ,
ϕ(t)
X
| {z }
C(X
b 0)
т.е.
Pt 0 − P
X
C
b (X0 )
ПВ 6 .
ϕ(t)
8
Напомним
Определение. Расстояние в метрике полной вариации между двумя веро-
ятностными мерами P1 и P2 на σ-алгебре F подмножеств вероятност-
ного пространства Ω определяется как
9
(i)
Повторимся, что конечномерные распределения процессов t>0 Zt ,
(i)
могут отличаться от конечномерных распределений процессов Xt , t > 0 ;
более того, при конструировании параллельного склеивания процессы Zt и
Zt0 , как правило, зависимы.
Для всех A ∈ B(X ) основное неравенство склеивания (3) переписывается
так:
X00
Pt (A) − Pt (A) = |P {Xt ∈ A} − P {Xt0 ∈ A}| =
X0
10
Т.е. соответствующие процессы восстановления начинаются до момента
t = 0, и в момент t = 0 значения перескоков вложенных процессов восста-
новления различны: B0 = b, B00 = b0 ; что можно обозначить как Bt = Btb ,
0
Bt0 = Btb .
Распределения этих процессов в момент t обозначим соответственно Ptb и
b0
Pt .
def
Если мы оценим сл.в. τ (b, b0 ) = τ (b, b0 ) == inf {t > 0 : Zt = Zt0 }, то можно
получить оценку
0
E ϕ(τ (b, b0 ))
Pt (A) − P b (A)
6 P {τ (b, b0 ) > t} 6
b
.
ПВ ϕ(t)
F (s + b) − F (b) def
= == Fb (s). (5)
1 − F (b)
Также напомним, что
Z∞
def
lim P {Bt > s} = µ−1 (1 − F (u)) d u == 1 − Fe(s), (6)
t→∞
s
11
def
где µ == E ξ1 (см. [8]).
ξ0 ∼ Fb ξ1 ∼ F ξ2 ∼ F ξ3 ∼ F ξ4 ∼ F
-
0 t0 t1 t2 t3 t4 t5
12
Z∞
Величина min(f1 (s), f2 (s)) ds = κ называется общей частью распреде-
−∞
лений θi .
Доказательство. Пусть
Z∞
def def
ϕ(s) == min (f1 (s), f2 (s)) ; ϕ(s) d s == κ = Φ(+∞) > 0,
0
Zs
def
где Φ(s) == ϕ(u) d u.
0
Обозначим
def def
Ψ(s) == F1 (s) − Φ(s), Ψc (s) == F2 (s) − Φ(s); Ψ1 (+∞) = Ψ2 (+∞) = 1 − κ,
def
ξ1 (U , U 0 , U 00 ) == 1(U < κ)Φ−1 (κU 0 ) + 1(U > κ)Ψ−1 ((1 − κ)U 00 );
def
ξ2 (U , U 0 , U 00 ) == 1(U < κ)Φ−1 (κU 0 ) + 1(U > κ)Ψ−1 00
c ((1 − κ)U ).
и P {ξ1 (U , U 0 , U 00 ) = ξ2 (U , U 0 , U 00 )} = κ.
Замечание. Фактически
ξ с вероятностью κ;
e
ξi =
ξi с вероятностью 1 − κ,
b
Φ(s) Ψ(s)
где независимые сл.в. ξe и ξbi имеют ф.р. и . .
κ 1−κ
13
4.3 Второй шаг: модификация конструирования пары (Bt , Bt0 )
в параллельное склеивание
Вернёмся к нашим независимым процессам Bt и Bt0 . У нас B0 = b, B00 = b0 ,
это – перескоки процессов восстановления.
Т.е. времена t1 и t01 – остаточные времена периодов регенерации с ф.р.
Fb (s) и Fb0 (s) соответственно (см. (5)). Первый этап конструирования – это
построение независимых сл.в. t1 и t01 .
def
После момента T1 == max {t1 , t01 } оба процесса начинают удовлетворять
def
условиям Теоремы Лордена (очевидно, T1 6 t1 + t01 == θ0 ).
На рисунке 5 T1 = t01 . После момента T1 к процессу Bt0 можно применять
неравенство Лордена, т.е. E Bt01 6 Ξ.
По неравенству Маркова, для любого Θ > Ξ > E Bt00 верно неравенство
1
n
0
o Ξ
P Bt01 < Θ > 1 − = p0 и в случае, если произойдёт событие Bt01 < Θ,
Θ
можно оценить величину
Z∞ Z∞
sup min(λ(s + u), λ(s)) ds > sup min(ϕ(s + u), ϕ(s)) ds = κ > 0,
u∈(0,Θ) u∈(0,Θ)
0 0
т.к. почти всюду ϕ(s) > 0 (поскольку предполагается, что плотность распре-
деления сл.в. ξi п.в. положительна).
Теперь, используя Основную Лемму Склеивания, можно продолжить оста-
точное время периода восстановления процесса Bt и следующий период вос-
def
становления Bt0 таким образом, что с вероятностью κ == p0 κ, процессы Bt и
def
Bt0 совпадут в момент t02 == θ1 .
(Заметим, что здесь использовалась некоторая величина Θ > Ξ; выбор
этой величины влияет на значение κ – так что можно искать значение Θ,
при котором значение κ максимально.)
14
Если в момент t02 = θ1 не произошло совпадения процессов (с вероятно-
стью 6 (1 − κ)), то в следующий момент восстановления Bt0 мы повторяем
описанную выше конструкцию с перескоком Bt процесса восстановления в
момент t02 = θ2 таким образом, что процессы Bt и Bt0 совпадут с вероятно-
стью p0 κ в момент t03 = θ3 , и т.д.. Таким образом, при условии, что в момент
t0n = θn−1 произойдёт совпадение процессов Bt и Bt0 ,
n
X
(t)
τ B0 , B0 6 T1 + ξi0
i=2
∞ i−1
!
X X
= E(ν + 1)`−1 × E T1` + (i + 1) × E (ξj` |Ei )P(Ei ) + E (ξi` |Ei )P(Ei ) ,
i=1 j=1
15
i−1
где Ei = S j ∪ Si , а Si – событие {момент θi – это момент склеивания τ }.
S
j=1
Заметим, что P(Si ) = (1 − κ)i−1 (1 − κ) 6 (1 − κ)i−1 , а также используем
очевидное неравенство
E (ξ|A)P(A) 6 E (ξ). (7)
i−1
Поэтому E (ξj` |Ei )P(Ei ) 6 E (ξj` |Ei ) (1−P(Sj )) 6 E ξj` (1−κ)i−2 ; E (ξi` |Ei )P(Ei ) ≤
Q
j=1
E ξi` (1 − κ)i−1 ≤ (1 − κ)i−2 .
Таким образом,
ν
!` ∞
X X
E T1 + ξi ≤ E(ν+1)`−1
×E T1` +E ξi` (i+1)2 (1−κ)i−1 = Υ(b, b0 , Θ, F (·)),
i=1 i=1
Υ(`,
e b, Θ, F (·))
P P
b
− 6 . .
f
t
ПВ t`
16
Теорема 2. Если E exp(αΞ) < ∞, то для некоторого β ∈ (0, α) можно
вычислить постоянную Kβ (b, b0 ) такую, что E exp(βτ (b, b0 )) 6 Kβ (b, b0 ), и
Pt − P
b
6K
e β (b) exp(−βt),
f
ПВ
Z∞
где Kβ (b) = exp(Kβ (b, b0 )) dFe(b0 ).
e .
0
5 Заключение
Использование предложенных способов вычисления строгих оценок сверху
для регенерирующих процессов может быть использован при анализе пове-
дения различных сложных СМО, СеМО и систем надёжности. Оценив вре-
мя T достижения приемлемого уровня близости распределения исследуемой
модели, исследователь может с помощью имитационного моделирования про-
анализировать поведение системы до достижения времени T и использовать
эти данные при прогнозировании поведения аналогичных систем.
Для случая, когда исследуемая модель включает несколько параллель-
ных технологических процессов, может применяться естественное обобщение
Основной Леммы Склеивания:
Лемма (Обобщение Основной Леммы Склеивания). Пусть fi (s) – плотно-
сти распределения сл.в. θi (i = 1, . . . , n). и пусть
Z∞
min (fi (s)) ds = κ > 0.
i=1,...,n
−∞
P{ϑ1 = ϑ2 = . . . = ϑn } > κ. .
17
Умение оценивать сверху, а не только указывать тип скорости сходимо-
сти (степенной, экспоненциальный) важно для практического использования
различных стохастических моделей. Использование таких оценок позволяет
узнать, когда распределение используемой системы станет достаточно близ-
ко к предельному (стационарному) распределению. До этого момента можно
оценивать поведение используемой системы с помощью имитационного моде-
лирования, что не всегда бывает экономически оправдано.
Поэтому так важно уметь оценивать гарантированное время до прибли-
жения распределения используемой системы к стационарному режиму.
Благодарности
Авторы благодарят анонимного рецензента за ценные замечания, способство-
вавшие улучшению текста. Работа частично поддержана РФФИ (проекто №
20-01-00575А)
Список литературы
[1] Аничкин С.А., Склеивание процессов восстановления и его применение
// Проблемы устойчивости стохастических моделей. Труды семинара. –
М., ВНИИСИ, 1984. C.4–24.
[7] Кемени Дж. Дж., Снелл Дж. Л., Конечные цепи Маркова. М.: Наука.
1970.
18
[8] Кокс Д., Смит В., Теория восстановления. М., 1967.
[9] Torgny Lindvall, Lectures on the Coupling Method. Wiley, New York, 1992.
[11] Gary Lorden. On Excess Over the Boundary // Ann. Math. Statist. 41 (2)
520 – 527, April, 1970. https://doi.org/10.1214/aoms/1177697092
[12] Kato, K. Coupling Lemma and Its Application to The Security Analysis of
Quantum Key Distribution // Tamagawa University Quantum ICT Research
Institute Bulletin Vol.4 No.1: 23-30 (2014) P.23–30.
19