Писарук
Введение в теорию игр
Минск
2015
Писарук, Н. Н.
Введение в теорию игр / Н. Н. Писарук. — Минск : БГУ, 2015. —
256 c.
c Писарук Н. Н., 2015
Введение
Теория игр как научная дисциплина изучает отношения между людь-
ми, которые руководствуются несовпадающими (а иногда и противопо-
ложными) мотивами. Наряду с традиционными играми, такими как по-
кер, шахматы, футбол и многие другие, теория игр изучает и такие
серьезные отношения как рыночная конкуренция, гонка вооружений,
загрязнение окружающей среды. В теории игр все эти серьезные от-
ношения называют играми, поскольку в них, как и в играх, результат
зависит от решений (стратегий) всех участников.
С одной стороны теория игр — это математическая дисциплина, ко-
торая применяется во многих областях человеческой деятельности (эко-
номика, военное дело, биология и др.). С другой стороны теория игр
— это раздел современной экономической теории, что подтверждается
большим количеством Нобелевских премий в области экономики, при-
сужденных самым выдающимся представителям данной науки. И имен-
но как строго математизированный раздел микроэкономики и рассмат-
ривается теория игр в данном вводном курсе.
Ключевое понятие, которое связывает неоклассическую экономиче-
скую теорию и теорию игр — это рациональность: каждый субъект
стремится максимизировать свою объективную или субъективную вы-
году. Несмотря на критику в его адрес, этот постулат играет важную
двойную роль в обеих теориях. Во первых, он существенно ограничивает
возможные варианты принятия решений, поскольку абсолютно рацио-
нальное поведение более предсказуемо, чем иррациональное поведение.
Во вторых, он дает четкий критерий оценки эффективности принятых
решений: то решение более эффективо, которое приносит большую вы-
году лицу, принимающему решение.
Неоклассическая экономическая теория обычно предполагает суще-
ствование и функционирование «совершенного рынка». Каждый субъ-
ект принимает решения, основываясь на индикаторах состояния этого
рынка. Данный подход логичен при исследовании экономических систем
с огромным числом участников, когда отдельному субъекту невозможно
4 Введение
(1928) 295–320.
Введение 5
Пример 1.2 (азартная игра Нэша). Два игрока делят сумму де-
нег d. Игрок 1 хочет получить долю x (0 ≤ x ≤ d), а игрок 2 — долю
y (0 ≤ y ≤ d). Если x + y ≤ d, то игрок 1 получит x, а игрок 2 — y. В
противном случае, когда x + y > d, оба игрока ничего не получат.
Нужно записать стратегическую форму для данной бескоалицион-
ной игры и найти все ситуации равновесия.
Решение. У нас здесь два игрока N = {1, 2}. Оба игрока имеют одно
и то же множество стратегий S1 = S2 = [0, d]. В ситуации (x, y) ∈ [0, d]2
выигрыши игроков определяются по формулам:
( (
x, если x + y ≤ d, y, если x + y ≤ d,
φ1 (x, y) = φ2 (x, y) =
0, если x + y > d, 0, если x + y > d.
В данной игре γ = ({1, 2}, {[0, d], [0, d]}, {φ1 , φ2 }) имеется много ситу-
аций равновесия.
1. Все ситуации (x, y), такие, что x + y = d. Если любой из игроков
увеличит свою долю, то оба игрока ничего не получат. Если кто-то из
игроков уменьшит свою долю, то его выигрыш уменьшится.
2. Ситуация (d, d), когда каждый из игроков хочет получить всю сум-
му денег. В этой ситуации выигрыши игроков равны нулю. Но это тоже
ситуация равновесия, поскольку, если один из игроков требует всю сум-
му денег, то его оппонент ничего не получит.
3. В качестве упражнения докажите, что в данной игре нет других
ситуаций равновесия. 2
1.1.1. Доминирование
Говорят, что стратегия s̄i ∈ Si доминирует стратегию ŝi ∈ Si игро-
ка i, если
φi (s̄i , s−i ) ≥ φi (ŝi , s−i ) для всех s−i ∈ S−i , (1.3)
Стратегия ŝi ∈ Si называется доминируемой, если существует другая
стратегия s̄i ∈ Si , которая доминирует ŝi .
Стратегия s̄i ∈ Si является доминирующей стратегией игрока i, ес-
ли она доминирует все его стратегии:
φi (s̄i , s−i ) ≥ φi (ŝi , s−i ) для всех ŝi ∈ Si , s−i ∈ S−i . (1.4)
Игрок 3:
1 2
Игрок 2: 1 (5, 5) (1, 0)
2 (0, 1) (1, 1)
5
Теорема 1.1 (Деброу,Гликсберг,Фан). Любая выпуклая игра име-
ет хотя бы одну ситуацию равновесия.
Доказательство. Пусть γ = (N, {Si }i∈N , {φi }i∈N ) есть выпуклая иг-
ра. Определим многозначное отображение Z : S → S как декартово
произведение
Z(s) = Z1 (s) × Z2 (s) × · · · × Zn (s)
отображений Zi : S → Si , которые определяются по правилу
Заметим, что любая стратегия s̄i ∈ Zi (s) игрока i является его оптималь-
ным ответом в том случае, если бы он заранее предвидел, что остальные
игроки применят свои стратегии s1 , . . . , si−1 , si+1 , . . . , sn . Теперь условие
равновесия (1.1) можно записать в виде s∗ ∈ Z(s∗ ), т. е. ситуации рав-
новесия в игре γ являются неподвижными точками отображения Z. В
силу следствия A.1 отображение Z является K-отображением и, следо-
вательно, по теореме Какутани A.8 оно имеет неподвижную точку. 2
x1 = (1/2n, . . . , 1/2n)
Игра из примера 1.4 принадлежит к классу игр (не все из них вы-
пуклые) под названием «проклятие общего». В этих играх доказывается,
что бесплатные общие ресурсы всегда используются неэффективно. Еще
один пример игры из этого класса представлен в упр. 1.8.
s̄k−1
i ∈ arg max φi (si , sk−1
−i ), i = 1, . . . , n. (1.7)
si ∈Si
стратегии, вычисляя свои новые стратегии ski для применения в k-й пар-
тии:
ski = (1 − λk )sk−1
i + λk s̄k−1
i , i = 1, . . . , n.
Параметр λk , который входит в эту формулу, можно интерпретировать
как меру осторожности игроков, или их степень доверия новой инфор-
мации после опыта, накопленного в ранее сыгранных партиях.
Нас интересует вопрос: сходится ли последовательность
s0 , s1 , . . . , sk , . . .
и, если сходится, то является ли ее предел s∗ = limk→∞ sk ситуацией
равновесия?
Если придерживаться слишком консервативной политики, когда
∞
X
λk < ∞,
k=0
1.3. Олигополии
Одним из основных достижений теории бескоалиционных игр в эко-
номике является формулировка и анализ моделей олигополий. В этих
моделях ограниченное число фирм соперничают на некотором рынке.
Поскольку на рынке фирм немного, то они могут сами влиять на цены,
что невозможно на рынках с совершенной конкуренцией. Теория игр до-
казывает, что и в этом случае на рынке возможно устойчивое равновесие,
если фирмы-олигополисты будут принимать свои решения, просчитывая
возможные ответы конкурентов. В данном разделе мы рассмотрим две
самые известные модели олигополий.
1.3. Олигополии 17
По теореме Куна — Таккера A.6 в точке ŷi оптимума задачи (1.10) вы-
полняются условия:
∂φi ∂φi
(ŷi , ŷ−i ) ≤ 0 и ŷi (ŷi , ŷ−i ) = 0, i = 1, . . . , n. (1.11)
∂yi ∂yi
Подставляя в (1.11) Pвыражения (1.9) при y = ŷ и определяя равно-
n
весную цену p̂ = f −1 ( i=1 ŷi ), получим систему
ŷi
p̂ + 0
− gi0 (ŷi ) ≤ 0, i = 1, . . . , n, (1.12)
f (p̂)
ŷi
ŷi p̂ + 0
− gi0 (ŷi ) = 0, i = 1, . . . , n. (1.13)
f (p̂)
Если фирма i остается на рынке, т. е. ее выпуск ŷi положителен, то из
(1.12) и (1.13) следует, что
ŷi = f 0 (p̂) (gi0 (ŷi ) − p̂) > 0.
А поскольку f строго убывающая функция, то f 0 (p̂) < 0 и gi0 (ŷi ) < p̂.
Эти неравенства означают, что
на рынке остаются только те фирмы, чьи предельные издерж-
ки не превосходят равновесной цены продукта.
Pn
которое означает, что средние издержки n1 i=1 ci не могут превосходить
максимальную цену a/b (при p = a/b выпуск q = 0); в противном случае
олигополия из n фирм не может существовать и на рынке останется
меньше фирм, а менее эффективные фирмы (те, у которой стоимость
производства единицы продукта большая) уйдут с рынка. Кроме того, в
любом случае чистый доход более эффективной фирмы всегда больше,
чем чистый доход менее эффективного конкурента.
Существует такая цена p∗i , что fi (p) = 0 для всех таких p, что pi >
p∗i .
По теореме Куна — Таккера A.6 в точке оптимума p̂i задачи (1.18) вы-
полняются условия:
∂φi ∂φi
(p̂i , p̂−i ) ≤ 0 и p̂i (p̂i , p̂−i ) = 0, i = 1, . . . , n. (1.19)
∂pi ∂pi
Подставляя в (1.19) выражения (1.17) при p = p̂ и учитывая, что
ŷi = fi (p̂), получим систему
∂fi
ŷi + (p̂i − gi0 (ŷi )) (p̂) ≤ 0, i = 1, . . . , n, (1.20)
∂pi
0 ∂fi
p̂i ŷi + (p̂i − gi (ŷi )) (p̂) = 0, i = 1, . . . , n. (1.21)
∂pi
1.3. Олигополии 23
ŷi
p̂i = gi0 (ŷi ) − ∂fi
,
∂pi (p̂)
Олигополия Бертрана
при линейных функциях спроса и затрат
ni
X
pi = (pi1 , pi2 , . . . , pi,ni ), pij = 1, pij ≥ 0, j = 1, . . . , ni . (1.23)
j=1
ние игрок 2:
def
α(A) = max min aij .
1≤i≤n 1≤j≤n
Понятно, что в ситуации (p, q) средний выигрыш игрока 2 равен −EA (p, q).
Решением матричной игры в смешанных стратегиях называют па-
ру смешанных стратегий (p0 , q 0 ), которая образует седловую точку функ-
ции EA (p, q), т. е.
Для любых
и
p0 ∈ arg max min EA (p, q), q 0 ∈ arg min max EA (p, q).
p∈Σm q∈Σn q∈Σn p∈Σm
min{g(q) : q ∈ Σn }. (1.35)
y
6 6
6
5
Z
4 XZ
X 4
v(A)
X
Z
Z
XXXX
X
Z XXXX
2 Z X2
Z
Z
0 -
Z x
0
Z
x Z
−1
−2
находится) с вероятностью
uj (r) = 1 − (1 − ωj )r .
Каким образом нужно распределить вертолеты по лесным массивам,
чтобы вероятность обнарудения человека была максимальной.
Решить пример при следующих значениях параметров n = k = 2,
ω1 = 0.6, ω2 = 0.4.
Решение. Здесь у нас нет конфликтной ситуации. Но мы можем пла-
нировать поисковую операцию, расчитывая на худшее, когда «злой рок»
направил потерявшегося человека в то место, где обнаружить его труд-
нее всего. В таком случае мы можем рассматривать задачу планирова-
ния поисковых усилий как матричную игру, в которой игрок 1 — это
лицо (или группа лиц), планирующее операцию, а игрок 2 — это «злой
рок». Игрок 2 имеет n стратегий, где стратегия j = 1, . . . , n означает,
что человек потерялся в районе j. Стратегии
Pn игрока 1 представим как
разбиения (s1 , . . . , sn ) числа k, где s
j=1 j = k и sj есть количество
вертолетов, посланных в район j.
Для заданных параметров n = k = 2 у игрока 1 три стратегии:
(2,0) — направить оба вертолета в район 1;
(1,1) — направить один вертолет в район 1, а другой — в район 2;
(0,2) — направить оба вертолета в район 2.
У игрока 2 две стратегии: 1) направить человека в район 1, 2) направить
человека в район 2.
Теперь составим матрицу игры для параметров ω1 = 0.6, ω2 = 0.4:
Район 1 Район 2
(2,0) 0.84 0 0
A= (1,1) 0.6 0.4 0.4
(0,2) 0 0.64 0
0.84 0.64
Так как α(A) = 0.4 < 0.64 = β(A), то данная игра не имеет решения
в чистых стратегиях. Решение в смешанных стратегиях будем искать
графическим методом (см. рис. 1.2).
Поскольку в данной игре нас интересует только стратегия игрока 1,
то мы не будем тратить время на поиск стратегии игрока 2. Так как ак-
тивными у игрока 1 являются стратегии (1, 1) и (0, 2), то его оптималь-
ная стратегия имеет вид p0 = (0, y 0 , 1 − y 0 ). Найдем y 0 из уравнения
0.6y + 0(1 − y) = 0.4y + 0.64(1 − y).
1.5. Матричныя игры 35
y
6 6
0.8
0.7
0.6 Z
Z 0.6
Z
Z
v(A) Z
Z
0.4 Z
Z
Z
Z
Z
Z-
x0 x
qj ≥ 0, j = 1, . . . , n.
Следующая тривиальная лемма позволит нам несколько упростить
задачи (1.36) и (1.37).
1.5. Матричныя игры 37
xj ≥ 0, j = 1, . . . , n.
Заметим, что задачи (1.40) и (1.41) двойственны друг другу. Итак мы
доказали следующую теорему.
Теорема 1.7. Решение матричной игры эквивалентно решению па-
ры двойственных задач ЛП.
38 Глава 1. Бескоалиционные игры
прохладное жаркое
и дождливое нормальное и сухое
Культура 1 0 2 5 0
Культура 2 2 3 1 1
Культура 3 4 3 −1 −1
4 3 5
Решение. Здесь у фермера нет реального противника. Но, если фер-
мер планирует свою деятельность в расчете на наихудшие погодные
условия, то можно считать Природу активным субъектом, который пы-
тается создать наихудшую (с точки зрения фермера) погоду. В таком
случае, мы можем смоделировать задачу фермера как матричную игру,
в которой фермер является игроком 1, а Природа — игроком 2. Матрица
A выигрышей в данной игре — это таблица доходов фермера.
Поскольку нижняя чистая цена данной игры α(A) = 1 меньше верх-
ней чистой цены β(A) = 3, то игра не имеет решения в чистых страте-
гиях. Решим игру в смешанных стратегиях. Поскольку α(A) = 1 > 0, то
1.5. Матричныя игры 39
x1 + x2 + x3 → max
2x2 + 5x3 ≤ 1,
2x1 + 3x2 + 1x3 ≤ 1,
4x1 + 3x2 − 1x3 ≤ 1,
x1 , x2 , x3 ≥ 0.
b x1 x2 x3 x4 x5 x6 Отн.
z 0 1 1 1 0 0 0
x4 1 0 2 5 1 0 0 ∞
1
x5 1 2 3 1 0 1 0 2
1
x6 1 4 3 −1 0 0 1 4
b x1 x2 x3 x4 x5 x6 Отн.
z − 14 0 1
4
5
4 0 0 − 14
1
x4 1 0 2 5 1 0 0 5
1 3 3
x5 2 0 2 2 0 1 − 12 1
3
1 3
x1 4 1 4 − 14 0 0 1
4 ∞
b x1 x2 x3 x4 x5 x6 Отн.
z − 12 0 − 14 0 − 14 0 − 14
1 2 1
x3 5 0 5 1 5 0 0
1 9 3
x5 5 0 10 0 − 10 1 − 12
3 17 1 1
x1 10 1 20 0 20 0 4
Этот пример нам интересен тем, что здесь смешанная стратегия до-
пускает иную, более естественную, интерпретацию. Она рекомендует
фермеру засеять половину своего поля культурой 1, а другую половину
— культурой 3. При этом, при любой погоде доход фермера не будет
меньшим цены v(A) = 2 данной игры. 2
Ястреб Голубь
Ястреб 0, 0 3∗ , 1∗ .
Голубь 1∗ , 3∗ 2, 2
Футбол Балет
Футбол 2∗ , 1∗ 0, 0 .
∗ ∗
Балет 0, 0 1 ,2
A B
A 2∗ , 2∗ 0, 0 .
B 0, 0 1∗ , 1∗
План 1 План 2
План 1 1∗ , 1∗ 0, 0 .
∗ ∗
План 2 0, 0 1 ,1
9 В экономике оптимальным по Парето называется такое распределение доходов
Алгоритм Лемке
ляется следующая книга: R.G. Murty, Feng-Tien Yu. Linear complementarity, linear
and nonlinear programming (Internet Edition) (1997) http://ioe.engin.umich.edu/peop-
le/fac/books/murty/linear_complementarity_webbook
48 Глава 1. Бескоалиционные игры
Ба- q u v x y Отно-
зис шения
.
u −1m In 0 0 A
v −1n 0 Im BT 0
Продемонстрируем работу алгоритма Лемке на численном примере.
Ба- Отно-
зис q u1 u2 v1 v2 v3 x1 x2 y1 y2 y3 шения
u1 -1 1 0 0 0 0 0 0 -2 -1 -1
u2 -1 0 1 0 0 0 0 0 -1 -2 -2
v1 -1 0 0 1 0 0 -1 -2 0 0 0 1 max
1
v2 -1 0 0 0 1 0 -3 -1 0 0 0 3
1
v3 -1 0 0 0 0 1 -2 -3 0 0 0 2
50 Глава 1. Бескоалиционные игры
Ба- Отно-
зис q u1 u2 v1 v2 v3 x1 x2 y1 y2 y3 шения
1
u1 -1 1 0 0 0 0 0 0 -2 -1 -1 2
u2 -1 0 1 0 0 0 0 0 -1 -2 -2 1 max
x1 1 0 0 -1 0 0 1 2 0 0 0
v2 2 0 0 -3 1 0 0 5 0 0 0
v3 1 0 0 -2 0 1 0 1 0 0 0
Ба- Отно-
зис q u1 u2 v1 v2 v3 x1 x2 y1 y2 y3 шения
u1 1 1 -2 0 0 0 0 0 0 3 3
y1 1 0 -1 0 0 0 0 0 1 2 2
1
x1 1 0 0 -1 0 0 1 2 0 0 0 2
2
v2 2 0 0 -3 1 0 0 5 0 0 0 5 min
1
v3 1 0 0 -2 0 1 0 1 0 0 0 1
Ба- Отно-
зис q u1 u2 v1 v2 v3 x1 x2 y1 y2 y3 шения
1
u1 1 1 -2 0 0 0 0 0 0 3 3 3 min
1
y1 1 0 -1 0 0 0 0 0 1 2 2 2
1 1
x1 5 0 0 5 − 52 0 1 0 0 0 0
2
x2 5 0 0 − 35 5
1
0 0 1 0 0 0
3
v3 5 0 0 − 75 − 51 1 0 0 0 0 0
Поскольку переменная v2 покинула базис, то ее дополнение y2 теперь
нужно вводить в базис, а из базиса выводить u1 .
Ба- Отно-
зис q u1 u2 v1 v2 v3 x1 x2 y1 y2 y3 шения
1 1
y2 3 3 − 23 0 0 0 0 0 0 1 1
1
y1 3 − 23 1
3 0 0 0 0 0 1 0 0
1 1
x1 5 0 0 5 − 25 0 1 0 0 0 0
2
x2 5 0 0 − 35 1
5 0 0 1 0 0 0
3
v3 5 0 0 − 75 − 15 1 0 0 0 0 0
По правилу о дополнительности в базис нужно вводить переменную
x1 (дополнение u1 ), но x1 уже находится в базисе. Это означает, что
текущий базис является дополняюще-допустимым. Поэтому вектор
(u1 , u2 ; v1 , v2 , v3 ; x1 , x2 ; y1 , y2 , y3 )T = (0, 0; 0, 0, 3/5; 1/5, 2/5; 1/3, 1/3, 0)T
есть решение ЛЗД (??). Поскольку x1 + x2 = 3/5 и y1 + y2 + y3 = 2/3, то
1 5
p0 = Pm x= · (1/5, 2/5)T = (1/3, 2/3)T
i=1 xi 3
и
1
3
q 0 = Pm · (1/3, 1/3, 0)T = (1/2, 1/2, 0)T
y=
i=1 yi 2
образуют пару равновесных стратегий для рассматриваемой игры.
qj ≤ yj , j = 1, . . . , n, (1.52c)
m
X
0 ≤ v2 − aij pi ≤ U2 (1 − yj ) , j = 1, . . . , n, (1.52d)
i=1
m
X n
X
pi = 1, qj = 1, (1.52e)
i=1 j=1
v → max,
v1 ≥ v, v2 ≥ v.
1.7. Упражнения
1.1. Найдите все ситуации равновесия в бескоалиционной игре трех
лиц, если каждый из игроков имеет две стратегии, а платежи определя-
ются по правилу:
Qxk
φk (x1 , x2 ) = pk − xk .
x1 + x2
.................................................................................................
.......................... ..................
.......................... u u ............
........... s 2 ut1
.......
...
..... Сеть 2 @ ..
.......
............. ........ ....
................. @ ........
. .....
........
.......... ...........................................................................@ ....................
G......1..................................u
...........u
..@
......
.........................
...................................................................................G
.........2........
.
.................. B ............
......
. ..
..... Сеть 1 B
But2 ..
......
............ u u ..
. . ....
................. s1 ............. ....
......................... ..........
.......................................................................................................
the Theory of Games, eds. Harold W. Kuhn and A. Tucker, Vol. 2, Princeton University
Press, 1953, pp. 193–216.
13 Непонятные термины и обозначения, касающиеся графов, ищите в приложе-
нии C.
2.1. Дерево игры 61
r r r r r r r r
COC COC CO COC
Л П Л П ЛC П Л П
C C C C
........ .C...................
....C... ....
.... h
Ch
F 1h G.......1h
C ...
... 1 D
..... . 1E ...
.
............. ...........
]
JJ COC
ЛJ П ЛC
П
J C
J...............h
.......
h
.......C..........
...
...
B ........2............ 2 C
....... ......
.....
]
JJ
ЛJ
П
J
A 1h
J
ЛJ П Л B
П
(0,r0) J.............h .......
.... D E .... 2 ....
.
.
B h
...... .
...... ....
..
. (2,r0)
... 1 ... . .
. .
]
J }
Z >
J Z
ЛJ Z
П
J П ZZЛ
B ..........1....h
J.... .. ... Z...... h .
...
.
.. ... 2 .... C
....... ..............
]
JJ
1J
1
2 2
J
A 0h
J
И П
СС (2ρ − 1)(1 + a) 1
СП (2 + a)ρ − 1 2ρ − 1
ПС a(ρ − 1) + 2ρ − 1 1
ПП 2ρ − 1 2ρ − 1
Рассмотрим случай, когда a = 1, m = n и тогда ρ = 1/2. Тогда
матрица выигрышей игрока 1 следующая:
И П
СС 0 1 0
1
СП 2 0 0
A=
ПС − 21 1 − 12
ПП 0 0 0
1
2 1
(1, 6)
(2, 4)
(4, 1)
(0, 2)
(2, 0)
(3, 2)
(2, 3)
(0, 3)
t1
r t r t r t r rt rt r r
2 3 4 5 6 t t
CO OC CO CO 7 8
ЛC 1 0 П Л C 1 0 П Л C 0 1 П Л C 0 1 П
C C C C
D ...........1....h h.. F ...........1....h h..
.............
...C .. ..C................. .............
...C .. ..C.................
....... .......1........E ....... .......1........ G
..... .....
]
JJ COC
2 1 2 1
Л J 3 3 П Л C 3 3
П
J C
J..............h
....... h
.......C..........
...
..
B ........2........... .......2........ C
.....
]
JJ
1 5
Л 6 J 6 П
Jh
A 1
(2)
I1 = {B, C}, игрок 2 также выберет свой ход случайным образом: ход
Л — с вероятностью 2/3, а ход П — с вероятностью 1/3. Если игра до-
(1)
стигнет позиции информационного множества I2 = {D, E}, игрок 1
выберет ход Л, а если игра достигнет позиции информационного мно-
(1)
жества I3 = {F, G}, игрок 1 выберет ход П. В рассматриваемой игре у
игрока 1 имеется восемь стратегий:
ЛЛЛ, ЛЛП, ЛПЛ, ЛПП, ПЛЛ, ПЛП, ППЛ, ППП,
где первая из трех букв указывет ход в позициях информационного мно-
(1) (1)
жества I1 , вторая — в позициях множества I2 , а третья — в позициях
(1)
множества I3 . У игрока 2 — всего две стратегии: Л и П.
Любая поведенческая стратегия — это всего лишь более удобное
представление некоторой смешанной стратегии игрока. Так какую же
смешанную стратегию игрока 1 определяет его поведенческая страте-
гия в игре на рис. 2.4? Чтобы задать эту смешанную стратегию, нужно
указать вероятности применения игроком его восьми чистых стратегий.
Эти вероятности вычисляются очень просто. Для примера, вероятность
применения игроком чистой стратегии ЛЛЛ равна произведению трех
вероятностей:
(1)
1) вероятности того, что в позициях информационного множества I1
игрок 1 сделает ход Л, эта вероятность равна 1/6;
2.4. Поведенческие стратегии 69
(1)
2) вероятности того, что в позициях информационного множества I2
игрок 1 сделает ход Л, эта вероятность равна 1;
(1)
3) вероятности того, что в позициях информационного множества I3
игрок 1 сделает ход Л, эта вероятность равна 0.
Следовательно, p0ЛЛЛ = 0. Аналогично вычисляются и все остальные
вероятности, среди которых ненувые только две:
Л П
ЛЛЛ 1, 6∗ ∗
4 ,1
ЛЛП 1, 6∗ 4∗ , 1
ЛПЛ 2, 4∗ 0, 2
ЛПП 2, 4∗ 0, 2 .
ПЛЛ 2, 0 2, 3∗
ПЛП 3∗ , 2 0, 3∗
ППЛ 2, 0 2, 3∗
ППП 3∗ , 2 0, 3∗
цию v, из которой все дуги ведут в позиции, для которых веса уже
определены.
a) Если v есть позиция игрока i, то вычиляем w(v) как сумму
весов тех позиций, в которые входят дуги из вершины v. Всем
дугам (v, x) приписываем вероятности p̄i (v, x) = w(x)/w(v).
б) Если v не есть позиция игрока i, то веса всех позиций, в кото-
рые входят дуги из вершины v, должны быть одинаковыми,
скажем, равными a. Полагаем w(v) = a.
w(B) 1 w(C) 5
p̄1 (A, B) = = , p̄1 (A, C) = = ,
w(A) 6 w(A) 6
w(t1 ) w(t2 )
p̄1 (D, t1 ) = = 1, p̄1 (D, t2 ) = = 0,
w(D) w(D)
w(t3 ) w(t4 )
p̄1 (E, t3 ) = = 1, p̄1 (E, t4 ) = = 0,
w(E) w(E)
w(t5 ) w(t6 )
p̄1 (F, t5 ) = = 0, p̄1 (F, t6 ) = = 1,
w(F ) w(F )
w(t7 ) w(t8 )
p̄1 (G, t7 ) = = 0, p̄1 (G, t8 ) = = 1.
w(G) w(G)
72 Глава 2. Позиционные игры
E. Zermelo. Über eine Anwendung der Mengenlehre auf die Theorie des Schachspiels.
Proceedings of the Fifth International Congress on Mathematics, Cambridge Vol. 2: 501,
1912.
2.5. Игры с совершенной информацией: обратная индукция 73
t (7, 1,
r t3) (3, 4,
r 4) t8 r(5, 5, 7) (7, 1,
r 3) (3, 4,r 4) t8 r(5, 5, 7)
(4, 5, 2) r 5 6 t7 (4, 5, 2) r
@
I 6 6 I
@ 6 6
@ (7, @ )
(3, 4, 5) r 3
t @h 1 @ 5, 7r(6, 3, 5)
G 1h
t4 r
1F (6, 3, 5) (3, 4, 5) r , 3) 1hF G 1h(5,
I
@ 6 t3@
I 6
@ 6 (3, @ 6 )
(1, 0, 3) r
@h 4 @ 5, 7
E 3h
t2 r
(1, 0, 3) r , 5) 3hD E 3h(5, r(2, 2, 1)
t 1
3D (2, 2, 1)
I
@ @
I 6
@ 6 6 @ 6
@h
C 2h (3, 4, 5) 2hB C 2h(5, 5, 7)
@
2B
2]
J
1
2]
J
1
3 J
A 0 h
3 3 J
h
3
A 0 1 (11, 13, 17)
3
а б
(3, 4, 5). В позициях B и C игрок 2 делает ходы (B, D) и (C, E), а по-
зиции B и C получают метки (3, 4, 5) и (5.5.7). И наконец, мы можем
вычислить вектор выигрышей 32 (3, 4, 5) + 31 (5, 5, 7) = 13 (11, 13, 17) в на-
чальной позиции A. 2
(3,r1) (0,r0)
I
@
Л@ П Л П
2m
@
(2,r2) Л 2, 2∗ 2∗ , 2∗
I
@ П 3∗ , 1∗ 0, 0
Л@ П
1m
@
2.7. Источники
несовершенной информации
В примере 2.1 причиной несовершенной информированности игро-
ка 2 (или того, что у него появилось информационное множество раз-
мера 2) было наличие в игре случайного хода. Но случайные ходы —
не единственный источник несовершенной информации. Другой причи-
ной несовершенной информированности игрока является его неполная
информированность о стратегиях и функциях выигрышей других игро-
ков. Таким играм с неполной информацией посвящена отдельная гла-
ва 3. Еще одной причиной несовершенной информированности игрока
является невозможность наблюдать действия других игроков. В част-
ности, это проиcходит тогда, когда игроки должны принимать реше-
ния одновременно. При моделировании такой ситуации, мы произвольно
устанавливаем порядок принятия решений игроками, а затем уменьша-
ем степень информированности тех игроков, которые при установлен-
2.7. Источники несовершенной информации 77
H :r(100, 100)
В
...........................
t1
....
2m
...
....
..
.
...
...
В*
....
. X t ......
z2r(40, 70)
XX
XX
Н X
D m
1
:r(70, 40)
HH
В
Р
HH ...... .... t3
... 2m
Н H
....
j ...
...
... .....
...... ......
..............
.
X XXX t4
........................ I Н Xzr(40, 40)
X
.....
2m
.. ...
.... ...
B ...
.... ....
.
:r(160, 55)
. .....
@ J В
........................
..... t5
m
...
@ .... ..
*........ 2 ..X
. ..
...
М@ В ... X
XX t6
zr(100, 55)
@
R m
Н XX
Р @
1
E HH :r(90, 15)
В
HH ..... ....
Н .... 2m
j
H ... ...
..
t7
... ..
..... ...
....................... XX
X t
K z8r(70, 25)
XX
Н X
A 1m
A L В :r(55, 160)
.......................
..... t9
m
... ...
A ...
...
A Н Xzr(15, 90)
XX
F m
A 1
:r(55, 100)
МA H
HH В
A
Р ..... ....
t11
Н H m
H .. ..
...
.....
j
... 2 X ...
A
..... ... X
.....................
..
XX t12
zr(25, 70)
A
..
.U .... M Н XX
C ........... 2m
..A ...
.. ..
...
..
:r(115, 115)
.........................
@ N В
.........................
....
t13
2m
..
...
...
.....
@
..
... ..
М @ В*
...
X XXX t14 .....
.
@ Н Xzr(55, 85)
X
R m
@
1
G HH :r(85, 55)
В
H ...... .... t15
... 2m
НH....
j
H ...
..
... .....
...... ......
..............
.
X XXX t16
O Н Xzr(55, 55)
X
(300 − 100) · 600 000 − 20 000 000 = 100 000 000 = 100 млн. долларов
В Н В Н
D: В 100 , 100∗
∗ ∗
40 , 70 , E: В 160 , 55∗
∗
100 , 55∗ ,
∗
В Н В Н
F: В 55∗ , 160∗ 15, 90 , G: В 115∗ , 115∗ 55∗ , 85 .
Н 55∗ , 100∗ 25∗ , 70 Н 85, 55∗ 55∗ , 55∗
(115, 115)
(160, 55)
(55, 160)
r r r r Р М
]
J
РJ М
BM
РB
М Р 100∗ , 100∗ 160∗ , 55
J...............j
........
.. ............ ..
.....B ...
РJ
М
J j
Рис. 2.8. Первая усеченная игра для игры «PlayBox против X-Station»
2.8. Совершенное байесовское равновесие 81
(115, 115)
(100, 55)
(55, 100)
r r r r Р М
]
J
РJ М
BM
РB
М Р 100∗ , 100∗ 100, 55
J...............j
........
.. ............ ..
.....B ...
РJ
М
J j
Рис. 2.9. Вторая усеченная игра для игры «PlayBox против X-Station»
82 Глава 2. Позиционные игры
(1, 1)
r (−2, −1)
r (2,r 1) (−1,r −1)
]
J BM
J B
ЛJ П Л B
П
............... B...........h
.......
(0, 3)r DJ........ 2h
.. ...
.....2...... E
.
.
. (0,
r 3)
................ .......
]
J 6 6
ЛJ П П
Л
B 1h 1hC
J
]
JJ
1/3 J
2/3
A 0h
J
P(v)
µ(v) = P , (2.1)
w∈I(v) P(w)
(−2, +2)
(+1, −1)
s s s s
Объ ру
я
BMB
иг
]
JJ
Объ
с
яв.
с
Па
Па
J .... B
m 2m
...
J ... ...
...
... 2 ..
..... ..... ...
......................... .........................
]
JJ
3 1
4 J
4
J m
2.9. Упражнения
2.1. Рассмотрим следующую антагонистическую игру. Колода из трех
карт (король, дама и валет) тасуется и затем по одной карте сдается
2.9. Упражнения 85
Contributions to the Theory of Games, v. 1, pp. 97-103, Princeton University Press, 1950.
86 Глава 2. Позиционные игры
1j - 2j - 1j - 2j- r r r - 1j - 2j - 1j - 2j - r
(100, 100)
r
? r
? r
? r
? r
? r
? r
? r
?
(1, 0)
(0, 3)
(2, 2)
(1, 4)
(98, 98)
(97, 100)
(99, 99)
(98, 101)
Рис. 2.12. Дерево игры «сороконожка»
(1, −1)
(−1, 1)
(−1, 1)
(1, −1)
(1, −1)
(0, 0)
(0, 0)
(0, 0)
r r r r r r r r
(a, a + 1)
(3, a − 1)
CO
CO CO CO
(3, a)
(1, 2)
Л C П Л C П Л C П Л C П
................. ..........
...C.. ........ ................. ..........
...C.. ........
r r r r .... j
...C ..
.... 1 .. . 1 j ..
..
.... j
... C ..
.... 1 .. . 1j ..
..
................. .
. .
.................
. ................. .
....................
CO BM
C B H] JJ I @ J I
@
K
ЛC П ЛB П ЛJ
П
П @Л
................ ..................... ..................
@.............j ........
D............2j j .... j
....C .. ..B .. J ....
....
. . 2
....... ....... ..
.
.E F .. 2
........ ....... . . 2
....... .......... G
.
.............. ...... ..... ......
]
J J
]
J J
ЛJ
П βJ
1−β
B 1j
J
Jj
i
PPP α 1 − α 10 C
PP
A 0j
P
(−3, 3, −1)
(−a, 4, 1)
(1, −1, 1)
(−2, 2, 2)
(−1, 1, 2)
(1, −1, 1)
(2, a, 2)
(1, 3, 1)
(2, 2, 2)
r r r r r r r r r r r r
COC BMB CO CO CO CO
ЛC П Л B П Л C П Л C П Л C П Л C П
.C............... .................... ............... ..........
....C.. ........ ............... ..........
....C.. ........
..... j j.. ..... j j..
.... ....C ... ....C ...
H ...........2j j
.. ..B ...
..
. ..... 2 ....... I
. .... 1 .. ..... 1 ....... .... 1 .. ..... 1 .......
.............. ............ ................. ............ ................. ............
]
J J
J ] JJ KI @ L
@
M
ЛJ
П ЛJ П @Л
П
(2, 1, 1)
r DJ 1j
....
........ ......... @............j ........
E ............2j
J ...
....
..... 2 ...... F
..
..
.... .
......... ...........
]
J 6 ]
J
J J
αJ 1−α βJ
1−β
Jj Jj
B 0P
iPP Л П 10 C
PP
Pj
3 A
(90, 200)
r (150, 150)
r (150,
r 60) (170, r−50)
]
J BM
Бо
Бо J
ро Ко КоB
ро
тьJ оп. оп.B
ть
ся J B
ся
Jh
E 1h
(500,
r 0)
B
(400, 0)
r
1 D
Не
]
J 6 6
Не
разр.J Pазр. Pазр.
разр.
свойJ свой свой
свой
прод. J прод. прод.
прод.
J...................
h
..... .
....... .....
h.....
B ...........2
............
2 C
..... .......
........
]
J
Не заключатьJ
Заключить
контракты J
контракты
A 1h
J
y1∗ (соотв., p∗1 ) фирмы 1. Вычисляя y2∗ = y2 (y1∗ ) (соотв., p∗2 = p2 (p∗1 )), вы
найдете ситуацию равновесия (y1∗ , y2∗ ) (соотв., (p∗1 , p∗2 )).
Глава 3
Байесовские игры
До сих пор мы изучали игры с полной информацией, когда перед
началом игры каждый из игроков знал стратегии и функции выигры-
шей всех других игроков. Когда в начале игры некоторые игроки име-
ют ограниченную информацию о стратегиях и функциях выигрышей
других игроков, то им нужно принимать решения, базируясь только на
доступной информации. Такие игры называются играми с неполной ин-
формацией или Байесовскими играми. Эти игры не следует путать с
играми с несовершенной информацией, в которых неполная информи-
рованность игроков появляется в процессе игры из-за невозможности
наблюдать действия других игроков или результаты случайных ходов.
фирмы 2.
Аналогично, если g2 (y2 ) = cL y2 , фирма 2 решает задачу:
a − y1 − y2
φ2 (y1 , y2 ; L) = y2 − cL y2 → max .
b y2 ≥0
a − y1 − cL b
y2 (L) = . (3.2)
2
Эти же вычисления может произвести и фирма 1, чтобы определить
свою среднюю чистую прибыль
gi (yi ; H) = cH yi ,
a − y1 − y2
φi (y1 , y2 ; H) = yi − cH yi ;
b
• издержки низкие
gi (yi ; L) = cL yi ,
a − y1 − y2
φi (y1 , y2 ; L) = yi − cL yi .
b
Например,
µ1 (c2 = cH |c1 = cH ) = µ1 (c2 = cH |c1 = cL ) = θ,
µ1 (c2 = cL |c2 = cH ) = µ1 (c2 = cL |c1 = cL ) = 1 − θ.
Выпуск (стратегия) yi фирмы i есть функция от уровня ее издержек,
т. е. yi = yi (H) или yi = yi (L).
Если c1 = cH , фирма 1 определяет свою среднюю чистую прибыль
y1 (H) (выигрыш), как оптимальное решение следующей задачи
φ1 (y1 , µ1 (H|H)y2 (H) + µ1 (L|H)y2 (L); H) =
a − y1 − µ1 (H|H)y2 (H) − µ1 (L|H)y2 (L) (3.4)
= y1 − cH y1 → max .
b y1 ≥0
где
• N = {1, . . . , n} — множество игроков;
• Si — множество стратегий игрока i, i = 1, . . . , n;
• Ti — множество типов игрока i, i = 1, . . . , n;
Qn
• φi : j=1 Sj × Ti → R — функция выигрышей игрока i, i = 1, . . . , n;
• µi : Ti → ∆(T−i )17 — представление игрока i (о типах других иг-
роков), i = 1, . . . , n.
Тип игрока представляет информацию, известную самому игроку, но
неизвестную другим игрокам. Теперь выбор стратегии игрока зависит от
его типа, т. е. игрок i типа ti ∈ Ti выбирает стратегию si (ti ). Например,
в рассмотренной нами модели дуополии Курно мы можем определить
типы и стратегии игроков так:
T1 = {H, L}, T2 = {H, L}, (y1 (H), y1 (L)), (y2 (H), y2 (L)).
стве Ω.
3.2. Байесовские игры в стратегической форме 99
p(t)
µi (t−i |ti ) = X , t ∈ T, i = 1, . . . , n. (3.9)
p(τ )
τ ∈T :τi =ti
роков
4 3 8 9
µ1 (L|L) = , µ1 (H|L) = , µ1 (L|H) = , µ1 (H|H) = ,
7 7 17 17
1 2 1 3
µ2 (L|L) = , µ2 (H|L) = , µ2 (L|H) = , µ2 (H|H) =
3 3 4 4
являются согласующимися, поскольку они определяется по правилу Бай-
еса для распределения вероятностей
1 1 1 3
p(L, L) = , p(L, H) = , p(H, L) = , p(H, H) = .
6 8 3 8
Для примера,
1
p(H, L) 3 8
µ1 (L|H) = = 1 3 = ,
p(H, L) + p(H, H) 3 + 8
17
1
p(L, H) 8 1
µ2 (L|H) = = 1 3 = .
p(L, H) + p(H, H) 8 + 8
4
G = ({1, . . . , n}, {Si }ni=1 , {Ti }ni=1 , {φi }ni=1 , {µi }ni=1 ) .
Eti (φi (s̃i (ti ), s̃−i (t−i ); ti )) ≥ Eti (φi (si , s̃−i (t−i ); ti )), si ∈ Si ,
18 Здесь и далее для удобства байесовские стратегии помечаются знаком «∼».
3.3. Байесовское равновесие 101
X X
p̃i (ti ) ∈ arg max φi (s; ti ) · µi (t−i |ti )×
pi ∈Σki
t−i ∈T−i s∈ n
Q
j=1 Sj
3.4. Аукционы
Первую формализацию аукционов предложил В. Викрей20 , которо-
му за это в 1996 г. была присуждена Нобелевская премия в области
экономики. В этом разделе мы рассмотрим два типа аукционов для де-
монстрации концепции байесовского равновесия.
На аукционе продается один объект, на который претендуют n поку-
пателей (игроков). Покупатель i имеет свою оценку vi стоимости про-
даваемого объекта, i = 1, . . . , n. Будем предполагать, что другие по-
купатели знают лишь то, что vi принадлежит некоторому множеству
Vi . Покупатели одновременно объявляют суммы b1 , b2 , . . . , bn , которые
они согласны заплатить за данный объект. Заметим, что покупатели не
обязаны раскрывать свою оценку стоимости объекта, т. е. объявленная
сумма bi может быть не равна оценке vi .
(1968) 8–37.
104 Глава 3. Байесовские игры
def
где X(b) = arg max{bj : 1 ≤ j ≤ n} есть множество игроков, объявивших
def
наибольшую цену, а b̄i = max{bj : 1 ≤ j ≤ n, j 6= i} есть наибольшая
цена, объявленная конкурентами игрока i.
Отметим, важную особенность данного аукциона: объявленная поку-
пателем цена не влияет на величину его выигрыша, она лишь влияет на
то, будет ли он победителем или нет.
Здесь мы имеем байесовскую игру n лиц, в которой Si = Ti = Vi =
[0, ∞) для всех i = 1, . . . , n. В данной игре мы не указываем представ-
лений игроков, поскольку, как мы увидим позже, в этой игре у каждого
106 Глава 3. Байесовские игры
def
где v̄i = max{vj : 1 ≤ j ≤ n, j 6= i} есть наибольшая оценка среди
оценок конкурентов игрока i. Если игрок i назначит цену bi > v̄i , то он
все равно выиграет, но его выигрыш не изменится. Если же он назначит
цену bi = v̄i , то, если он выиграет при подбрасывании монеты, его выиг-
рыш не изменится, а если он проиграет, его выигрыш будет равен нулю.
И наконец, если bi < v̄i , игрок i проиграет и вместо vi − v̄i получит 0.
Если игрок i оказался среди проигравших, то его выигрыш равен 0.
Пусть победителем оказался игрок j. Тогда vi ≤ vj . Если игрок i объявит
цену bi < vj , то он все равно проиграет. А если игрок i объявит цену
bi > vj , то он выиграет, но его выигрыш будет vi − vj ≤ 0. 2
Здесь мы имеем байесовскую игру двух лиц, в которой N = {s, b}, где
продавец — это игрок s, а покупатель — игрок b. Множества стратегий
и типов игроков совпадают: Ss = Ts = Sb = Tb = [0, 1]. Представления
игроков симметричны и задаются следующим образом:
В том, что пара (s̃x (vs ), b̃x (vb )) является байесовским равновесием, мож-
но убедиться формально проверяя справедливость включений (3.14),
(3.15). Но проще прибегнуть к логическим рассуждениям.
Если vs > x, то продавец объявляет цену 1, которую покупатель не
может превзойти. В этом случае любая стратегия покупателя (в том
108 Глава 3. Байесовские игры
то
Z !
def s + b̃(vb )
us (s) = − vs dvb =
{vb ∈[0,1]: b̃(vb )≥s} 2
Z 1
s + ab + cb vb
= − vs dvb =
(s−ab )/cb 2
1
cb vb2
s + ab − 2vs
= vb + =
2 4
(s−ab )/cb
(s − ab )2
s − ab s + ab − 2vs cb
= 1− + 1− =
cb 2 4 c2b
s − ab 3s + ab + cb
= 1− − vs .
cb 4
3.5. Парные торги 109
c(1 − F (x(t))
x0 (t) = ,
vf (x(t))
def
где x(t) = t̃−1 (t). В точке равновесия t = t̃(v) имеем x(t) = v и x0 (t) =
1/t̃0 (v). Поэтому
vf (v)
t̃0 (v) =
c(1 − F (v))
D r (0, 4) H r (3, 1)
3
3
У П
......................
1j - 2j
О
...
... ..
... ..
... .....
3 H В
Г B F HH
1 j r (5, −1)
HH
2 I
A 0j
Jr
Q 1
* (−1, 5)
Q
2
Q
НQ Q C G... В
О ..
s j
Q -........ 2j ...
.
1 ..... ......
..
.............
Q Q
Q Q
У Q П Q
s r (0, 4)
QQ s r (3, 1)
QQ
E K
M A M A def
где ΣP и Σ есть симплексы соответственно в R+ и R+ , a Mp̃ = {m ∈
∗
Отправитель t1 Отправитель t2
a1 a2 a1 a2
m1 4, 0 1, 3 m1 0, 1 2, 4
m2 0, 0 2, 1 m2 1, 2 1, 0
Существуют ли в данной игре пулово и отделяющее равновесия?
(1, 3)
(0, 0)
(2, 1)
(1, 2)
(1, 0)
(0, 1)
(2, 4)
r r r r r r r r
CO CO CO CO
a2
C C a2 C a2 C a2
a1C a1C a1C a1C
C C C C
............... ........
..C.... ........
D Rm
Ci
.... i
....C ..
i.... F Cim
...............
................
E .... R ..
............... ... R
.................. .
.. R G
...............
.
................... ...
..
..
..
..
..
.....
]
JJ ....................................................................................CO....................................
..........................
J C
m1 J m2 m2 C
m1
J C
J i Ci
B S S C
I
@ @ t1
2
t2 1
3@ 3
@i
A 0
2
3.9. Рынок лимонов 121
(1500, −1250)
(1000, −750)
(−250, 500)
(450, 50)
(250, 0)
(500, 0)
(0, 0)
(0, 0)
t1 r t2 r t3 r t4 r t5 r t6 r t7 r t8 r
OC CO CO CO
1250 C 1250 C 1250 C 1250 C
C C C C
2500C C 2500 C 2500 C 2500
.................. .........
..C... ........
D Rm
Ci ...C i i.. Ci
Rm
............... E ...........R ... .....R....... F ...........
G
................
...................
.
........... ...........
..
..
..
..
..
..
..
..
...............
]
J
J ....................................................................................CO................................
..........................
J C
ГJ Б БC
Г
J C
Ji
SiC
C
B S
I
@ @ П
1 Х 1
2 @ 2
A 0i
@
φS (t4 ) 2500 − 1000 1500
= = ,
φR (t4 ) 1250 − 2500 −1250
φS (t5 ) 0
= , (cделка не состоялась)
φR (t5 ) 0
φS (t6 ) 2500 − 2000 500
= = ,
φR (t6 ) 2500 − 2500 0
φS (t7 ) 0
= , (cделка не состоялась)
φR (t7 ) 0
φS (t8 ) 2500 − 2000 − 50 450
= = .
φR (t8 ) 2500 + 50 − 2500 50
В игре на рис. 3.3 нет подигр, отличных от всей игры. Поэтому стро-
им стратегическую форму для всей игры. Это есть следующая бимат-
ричная игра:
(1500, −1250)
(1000, −750)
(−250, 500)
(450, 50)
(250, 0)
(500, 0)
(0, 0)
(0, 0)
t1 r t2 r t3 r t4 r t5 r t6 r t7 r t8 r
OC CO CO CO
1250 C 3 1250 C 1 1250 C 1 1250 C 3
C 5 25 C 0 C 0 C 5 25
C 2500 C 2500 C 2500 C 2500
Cm ..
..
..
..
..
.. .
..
..
..
..
..
..
i ... i i.. Cim
.
.
..C .. .. .
.
.C ......
D R ............... E ..........R .
..............
R F
..... .......
...........
.
.
...........
R G
......... ......... ...................
1
26 J .......................................................1.............................................................0...............CO............................................
]
J
25
26
J 1 24 C0
Г J 25 25 Б БC 1
Г
J C
B Si SiC
J C
I
@ @ П
1 Х 1
2 @ 2
A 0i
@
где ct (m) = m/t есть стоимость обучения для людей группы t. Функция
ã∗ (m), выражающая зависимость зарплаты человека от количества лет
обучения m, изображена жирной линией на рис. 3.5. Там же представ-
лены и функции затрат на обучение c1 (m) и c2 (m).
Максимизируя u1 (m), группа 1 определяет свою оптимальную стра-
тегию m1 = 0, при которой ее выигрыш равен u1 (m1 ) = 1 − m1 = 1.
Оптимальной стратегией группы 2 яляется m2 = m∗ , при которой ее
выигрыш равен u2 (m2 ) = 2 − m∗ /2 > 1.
3.11. Предел байесовского равновесия 129
c2 (m) = m/2
1
-
1 m∗ 2 m
Футбол Балет
Футбол 2∗ , 1∗ 0, 0 .
Балет 0, 0 1∗ , 2∗
Вспомним, что в этой игре имеется два равновесия (1, 1) и (2, 2) в чистых
стратегиях и одно равновесие в смешанных стратегиях p∗ = (2/3, 1/3) и
q ∗ = (1/3, 2/3).
Теперь предположим, что супруги не вполне уверены в предпочте-
ниях своих избранников. Более точно, предположим, что выигрыши су-
пругов следующие:
Футбол Балет
Футбол 2 + th , 1 0, 0 .
Балет 0, 0 1, 2 + tw
Здесь th и tw равномерно распределенные на отрезке [0, x] независимые
случайные величины. Предполагается, что муж знает величину th , а
жена — tw .
Здесь мы имеем байесовскую игру двух лиц со следующими пара-
метрами:
T1 = T2 = [0, x],
S1 = {1, 2}, S2 = {1, 2},
µ1 (tw ∈ [w, x]|th ) = (x − w)/x,
µ2 (th ∈ [h, x]|tw ) = (x − h)/x.
Мы будем искать байесовское равновесие в классе пороговых страте-
гий:
( (
1, если th ≥ h, 1, если tw < w,
s̃1 (th ) = s̃2 (tw ) =
2, если th < h, 2, если tw ≥ w.
3.12. Упражнения
3.1. Два игрока не консультируясь друг с другом решают финансиро-
вать или не финансировать полезный для обоих проект. Каждый игрок
оценивает свою пользу от реализации проекта равной 1. Проект будет
реализован, если хотя бы один из игроков внесет свой взнос (недоста-
ющие средства будут выделены из местного бюджета). Взнос игрока i
равен ci (i = 1, 2). Каждый игрок знает свой взнос, но не знает взноса
другого игрока, и полагает, что взнос оппонента есть случайная величи-
на, равномерно распределенная на отрезке [0, 2].
Найдите байесовское равновесие.
3.2. Рассмотрим аукцион первой цены, описанный в разделе 3.4.1.
Но теперь предположим, что обе оценки v1 и v2 являются случайными
величинами с одинаковой плотностью
(
4x3 , x ∈ [0, 1],
f (x) =
0, x 6∈ [0, 1].
Найдите симметричное байесовское равновесие в линейных страте-
гиях, когда b̃∗i (vi ) = a + cvi с c > 0.
3.3. На аукционе продается один предмет, купить который хотят два
покупателя. Продавец и другой покупатель не знают оценки vi стоимо-
сти предмета покупателем i и полагают, что vi есть случайная величина,
равномерно распределенная на отрезке [0, 1], i = 1, 2. Предполагается,
что оба покупателя рациональны и, в зависимости от правил проведения
аукциона, используют оптимальные стратегии. Какой из двух аукцио-
нов, аукцион первой цены (см. раздел 3.4.1) или аукцион второй цены
(см. раздел 3.4.2), следует организовать продавцу, чтобы максимизиро-
вать свою ожидаемую прибыль (матожидание суммы, полученной за
предмет).
3.12. Упражнения 133
роков:
x, 1 1, 0
,
1, 0 0, 1
где x ∈ {0, 2}. Игрок 1 знает значение x, а игрок 2 полагает, что x = 0 с
вероятностью 2/3, или x = 2 с вероятностью 1/3. Найдите байесовское
равновесие.
3.7. Рассмотрим биматричную игру со следующими выигрышами иг-
роков:
1, 2 x, 0
,
x, y −1, y
где x ∈ {0, 2} и y ∈ {1, 3}. Игрок 1 знает точное значение x, а игрок 2 —
значение y. Независимо от значения x игрок 1 полагает, что оба значения
y (1 и 3) равновероятны. Аналогично, независимо от значения y игрок 2
полагает, что оба значения x (0 и 2) равновероятны. Найдите байесовское
равновесие.
3.8. В игре двух лиц игрок 1 имеет полную информацию об игроке 2,
в то время как игрок 2 предполагает, что игрок 1 с равной вероятностью
обладает одной из двух технологий. У каждого из игроков имеется по две
стратегии. В зависимости от технологии игрока 1 матрицы выигрышей
игроков следующие:
1, 1 0, 2 2, 2 0, 1
Технология 1: , Технология 2: .
0, 2 1, 1 3, 4 2, 3
Ф Н
Ф v1 − c/2, v2 − c/2 v1 − c, v2
Н v1 , v2 − 8 0, 0
3.12. Упражнения 135
µ1 (vL |vL ) = µ1 (vH |vH ) = 2/3, µ1 (vH |vL ) = µ1 (vL |vH ) = 1/3,
µ2 (vL |vL ) = µ2 (vH |vH ) = 2/3, µ2 (vH |vL ) = µ2 (vL |vH ) = 1/3.
B C
B 0, 0 7, 2 .
C 2, 7 6, 6
u → max,
(4.3)
X
φi (s)p(s) ≥ u, i = 1, . . . , n.
s∈S
1 1
p(B, B) = 0, p(B, C) = p(C, B) = , p(C, C) = .
4 2
Для данного корреллированного равновесия ожидаемый вы-
игрыш каждого из игроков равен 41 (2 + 7) + 21 6 = 5 14 , что на
1/4 больше их ожидаемых выигрышей для корреллированно-
го равновесия, которое рассматривалось ранее. 2
M C H
M 25,25 50,30 50,20
C 30,50 15,15 30,20
H 20,50 20,30 10,10
M C
M 25, 25 50 , 30∗
∗
u → max,
25p(M, M ) + 50p(M, C) ≥ 30p(M, M ) + 15p(M, C),
30p(C, M ) + 15p(C, C) ≥ 25p(C, M ) + 50p(C, C),
25p(M, M ) + 50p(C, M ) ≥ 30p(M, M ) + 15p(C, M ),
30p(M, C) + 15p(C, C) ≥ 25p(M, C) + 50p(C, C),
p(M, M ) + p(M, C) + p(C, M ) + p(C, C) = 1,
25p(M, M ) + 50p(M, C) + 30p(C, M ) + 15p(C, C) ≥ u, (4.4)
25p(M, M ) + 30p(M, C) + 50p(C, M ) + 15p(C, C) ≥ u, (4.5)
p(M, M ), p(M, C), p(C, M ), p(C, C) ≥ 0,
u → max,
5p(M, M ) − 35p(M, C) ≤ 0,
− 5p(C, M ) + 35p(C, C) ≤ 0,
5p(M, M ) − 35p(C, M ) ≤ 0,
− 5p(M, C) + 35p(C, C) ≤ 0,
p(M, M ) + p(M, C) + p(C, M ) + p(C, C) = 1,
25p(M, M ) + 50p(M, C) + 30p(C, M ) + 15p(C, C) ≥ u,
25p(M, M ) + 30p(M, C) + 50p(C, M ) + 15p(C, C) ≥ u,
p(M, M ), p(M, C), p(C, M ), p(C, C) ≥ 0.
1 2
(1, 1) 3 6
(1, 2) 2 6 .
(2, 1) 6 4
(2, 2) 5 6
1 2
(1, 1) 4 5
(1, 2) 7 4 .
(2, 1) 5 2
(2, 2) 5 5
1 2
(1, 1) 1 3
(1, 2) 5 7 .
(2, 1) 7 3
(2, 2) 4 3
v(∅) = 0,
v(S ∪ T ) ≥ v(S) + v(T ), S, T ⊂ N, S ∩ T = ∅ (супераддитивность).
x1 + x2 + x3 = 2000;
x1 ≥ 0, x2 ≥ 0, x3 ≥ 0.
4.2.1. Ядро
Дележ
P x нестабилен из-за коалиции S ⊂ N , если v(S) >
i∈S x i . В таком случае суммарный выигрыш игроков коа-
лиции S меньше того, что коалиция может получить действуя
самостоятельно. Поэтому игроки коалиции S объединившись,
смогут расстроить соглашение, приведшее к формированию
дележа x.
Мы также говорим, что дележ нестабилен, если он неста-
билен из-за какой-либо коалиции, иначе дележ называется
152 Глава 4. Кооперативные игры
x3
6
2000
@
@ x1 + x3 = 1800
@
@@
@@
@
@@
@
@
@@@
@ @
@@@
@
@
@ @
@ @
@
@@
@
@
@@@
@
@@
@
@
@
@
@
@
@
@
@ @
@
@ @
@ @ 2000
@
- x1
@
@
@
x2 + x3 = 1400
2000
x2
x1 + x2 + x3 = 8, x1 ≥ 1, x2 ≥ 0, x3 ≥ 1.
x1 + x2 + x3 = 8,
x1 ≥ 1, x2 ≥ 0, x3 ≥ 1,
x1 + x2 ≥ 4, x1 + x3 ≥ 3, x2 + x3 ≥ 5.
(7, 0, 1)T
s
J
J
J
Нест. J x1 + x2 = 4
J
из-за J
{2, 3} J
Js
(4, 0, 4)T
J
T
(3, 4, 1) T
(3, 1, 4) s
J T
s
Js(3, 0, 5)
x1 + x3 = 3J
J x1 + x3 = 5
J
Нест. J
(2, 5, 1)T Js
Ядро
из-за J
J
J
Нест.J
{1, 2} J
s
{1, 3} Js s
Js
(1, 6, 1)T (1, 5, 2)T (1, 3, 4)T (1, 0, 7)T
x1 + x2 + x3 = 1,
x1 + x2 ≥ 1, x1 + x3 ≥ 1, x2 + x3 ≥ 0, (4.11)
x1 , x2 , x3 ≥ 0.
4.2. Коалиции и дележи 155
yS ≥ 0, S ⊆ N,
которая является двойственной к задаче (4.14), также рав-
но v(N ). Поскольку любое сбалансированное семейство весов
yPS , S ⊆ N , является допустимым решением задачи (4.15), то
S⊆N v(S) yS ≤ v(N ). 2
x1 + x2 + x3 + x4 + x5 → min,
x1 + x2 + x3 + x4 + x5 ≥ 1,
x2 + x3 + x4 + x5 ≥ 1,
x1 + x2 ≥ 1,
x1 + x3 ≥ 1,
x1 + x4 ≥ 1,
x1 + x5 ≥ 1,
x1 , x2 , x3 , x4 , x5 ≥ 0.
Вклады игроков
Перестановка
1 2 3
(1,2,3) 0 0 2000
(1,3,2) 0 200 1800
(2,1,3) 0 0 2000
(2,3,1) 600 0 1400
(3,1,2) 1800 200 0
(3,2,1) 600 1400 0
Средний вклад 3000/6 1800/6 7200/6
Результат (вектор Шепли) записан в последней строке таб-
лицы:
(3000/6, 1800/6, 7200/6)T = (500, 300, 1200)T .
4.4. Сердцевина
Значение Шепли в общем случае не удовлетворяет условию
индивидуальной рациональности и потому не является даже
дележом. Кроме того, если это возможно, то хотелось бы, что-
бы «справедливый» дележ был стабильным (принадлежал
ядру). Иная интересная концепция для определения «спра-
ведливого» дележа предложена Д. Шмайдлером29 . Основная
идея здесь состоит в том, чтобы получить дележ, который
вызывает наименьшую неудовлетворенность среди всех коа-
лиций. Такой дележ называют сердцевиной (nucleolus).
Рассмотрим кооперативную игру (N, v) и дележ x. Дефицит
коалиции S ⊂ N определяется как разность
def
X
d(x, S) = v(S) − xi
i∈S
17 (1969) 1163–1170.
164 Глава 4. Кооперативные игры
Дележи
S v(S) d(x, S)
(6,12,18) (5,12,19) (5,10.5,20.5)
{1} 0 −x1 -6 -5 -5
{2} 0 −x2 -12 -12 -10.5
{3} 6 6-x3 -12 -13 -14.5
{1,2} 6 6-x1 -x2 -12 -11 -9.5
{1,3} 16 16-x1 -x3 -8 -8 -9.5
{2,3} 26 26-x2 -x3 -4 -5 -5
α → min,
X
xi + α ≥ v(S), S ⊂ N,
i∈S
X
xi = v(N ), xi ≥ v(i), i ∈ N.
i∈N
4.4. Сердцевина 167
F1 = S ⊂ N : d(x1 , S) = α1
α → min,
X
xi = v(S) − α1 , S ∈ F1 ,
i∈S
X
xi + α ≥ v(S) − α1 , S ⊂ 2 N \ F1 ,
i∈S
X
xi = v(N ), xi ≥ v(i), i ∈ N.
i∈N
F2 = S ⊂ 2N \ F1 : d(x2 , S) = α1 + α2 .
α → min,
X s
X
xi = v(S) − αj , S ∈ Fs , s = 1, . . . , k − 1,
i∈S j=1
X k−1
X
xi + α ≥ v(S) − αj , S ⊂ 2N \ ∪k−1
j=1 Fj ,
i∈S j=1
X
xi = v(N ), xi ≥ v(i), i ∈ N.
i∈N
4.5. Кооперация
для минимизации издержек
До сих пор мы рассматривали кооперативные игры, в кото-
рых целью игроков была максимизация выигрыша (прибы-
ли). На практике ничуть не реже встречаются ситуации, ко-
гда игроки образуют коалиции с целью минимизировать свои
издержки. Такая кооперативная игра представляется парой
(N, c), где N есть множество игроков, а характеристическая
функция c : 2N → R удовлетворяет следующим свойствам:
c(∅) = 0,
c(S ∪ T ) ≤ c(S) + c(T ), S, T ⊂ N, S ∩ T = ∅ (субаддитивность).
Вклады игроков
Перестановка
1 2 3
(1,2,3) 3 2 3
(1,3,2) 3 2 3
(2,1,3) 1 4 3
(2,3,1) 3 4 1
(3,1,2) 3 2 3
(3,2,1) 3 2 3
Средний вклад 8/3 8/3 8/3
4.6. Предварительные переговоры 171
3
v(∅) = 0, v(1) = v(A) = 2, v(2) = v(B T ) = , v(1, 2) = 10.
2
v(∅) = 0, v(1) = v(A), v(2) = v(B T ), v(1, 2) = max max (aij +bij ).
1≤i≤m 1≤j≤n
4.6. Предварительные переговоры 173
D1 − D2 = pT (A − B)q,
4.7. Упражнения
4.1. Рассмотрим биматричную игру
3, 2 4, 1 0, 2
2, 1 3, 0 2, 3 .
0, 1 5, 3 1, 1
.........................................
.............. ..........
..........
........ 8 ........
A.m Bm Cm
....... ......
....... ....... ........ .................
....... . .... .......
......... .......
..............
...
... .
.
....
.... 3
... ..
.. ...
... .. ..
... .... ....
.... 2
... 6 7 ....
..
..
....
....
...... .
.. .
.....
.
..
....... ...
... 5 u
..........................
..
u
......... .
....
. ... .....
...................... ............................... ... ... ...
. .... .... .. ...
u 2 ...
. ...... ...
... .................................... ...
.
... . . ....
.... ..
................ ...
...
.. ..
.
..
. .
..
.
.. 6 ...
..
.... ..
.
.
.
...
5 5 ...
.
... ..
..
..
.. ..
... . . ..
..
.. .... ..
..
. .... .
Шоссе
G = ({1, . . . , n}, {Si }ni=1 , {Ti }ni=1 , {φi }ni=1 , {µi }ni=1 ) ,
Ḡ = {1, . . . , n}, {S̄i = Ti }ni=1 , {Ti }ni=1 , {φ̄i }ni=1 , {µi }ni=1 ,
def
φ̄i (τ1 , . . . , τn ; ti ) = φi (s̃1 (τ1 ), . . . , s̃n (τn ); ti ), τ ∈ T, ti ∈ Ti , i = 1, . . . , n.
GM = ({1, . . . , n}, {Si = Vi }ni=1 , {Ti = Vi }ni=1 , {φi }ni=1 , {µi }ni=1 )
vi (f (vi , v−i ))−pi (vi , v−i ) ≥ vi (f (v̄i , v−i ))−pi (v̄i , v−i ), vi , v̄i ∈ Vi .
(5.1)
Поскольку доминирующая байесовская ситуация равновесия
является байесовским равновесием при любых представлени-
ях игроков, то побудительно совместимый механизм является
побудительно совместимым в байесовском смысле при любой
системе представлений {µi }ni=1 . Также понятно, что побуди-
тельно совместимый в байесовском смысле механизм M реа-
лизует функцию социального выбора f .
Для примера, в игре «аукцион первой цены», рассмотренной
в разделе 3.4.1, механизм M1 = (V1 , V2 ; f ; p1 , p2 ) определяется
следующим образом. В данной игре всего два исхода: 1 —
предмет купит игрок 1, 2 — предмет купит игрок 2. Поэтому
33 Понятие побудительно совместимого механизма, которое является центральным
pi (v) ≥ 0, v ∈ V, i = 1, . . . , n,
Теорема 5.1. Пусть ({Vi }ni=1 ; f ; {pi }ni=1 ) и ({Vi }ni=1 ; f ; {p̄i }ni=1 )
есть два побудительно совместимых механизма с одной и
той же функцией социального выбора f : V → A, и пред-
положим, что все области предпочтений Vi ⊆ RA явля-
ются связными множествами. Тогда для всех i = 1, . . . , n
существуют такие функции hQ i : V−i → R, что p̄i (v) =
n
pi (v) + hi (v−i ) для всех v ∈ V = j=1 Vj .
P
Вычитаемое j∈{1,...,n}\{i} vj (f (v)) — это сумма, которую по-
лучает игрок i. Ее величина равна сумме величин предпочте-
ний других игроков, и, если сложить эту величину с вели-
чиной предпочтения самого игрока i, то как раз мы и полу-
чим значение функции социального благополучия. Поэтому
VCG-механизм стимулирует всех игроков максимизировать
функцию социального благополучия.
X Pn
max 0, c − vi (P) , если vi (P) ≥ c,
def i=1
pi (v) =
j∈N \{i}
Pn
0, если vi (P) < c.
i=1
(5.9)
5.5. Реализация общественного проекта 193
Pn
Если i=1 ui > c, то
n
X
qi (u1 , . . . , un ) < c,
i=1
или
hi (v−i ) ≤ vi (f (v)) − pi (v), v ∈ V.
В частности, для v̂i (P) = v̂i (Н ) = 0 имеем
Следовательно,
n
X n
X n
X
p̄i (v1 , . . . , vn ) ≤ pi (v1 , . . . , vn ) = qi (u1 , . . . , un ) < c.
i=1 i=1 i=1
5.6.1. Механизмы
для однопараметрических областей
оценку t ∈ [t0i , t1i ], где ti0 , ti1 ∈ R и ti0 ≤ ti1 . Всем невыигрыш-
ным исходам a ∈ A \ Wi игрок i приписывает оценку 0. Та-
кое предпочтение игрока i описывается пороговой функцией
vit : A → R, где vit (a) = t для всех a ∈ Wi , и vit (a) = 0 для
всех a ∈ A \ Wi . Область Vi предпочтений игрока i состоит из
пороговых функций vit для всех t ∈ [t0i , t1i ]. Поскольку каждая
функция из Vi определяется по значению одного параметра
t, то такую область называют однопараметрической.
Рандомизированный механизм (с однопараметрическими об-
ластями предпочтений) задается тройкой:
wi (ti , t−i )ti − pi (ti , t−i ) ≥ wi (t̄i , t−i )ti − pi (t̄i , t−i ).
∂pi
вен ∂ti (τ, t−i ). Следовательно, мы доказали справедливость
равенства
∂pi ∂wi
(τ, t−i ) = τ (τ, t−i ),
∂ti ∂ti
проинтегрировав которое на отрезке [t0i , ti ]
Z ti Z ti
∂pi ∂wi
(τ, t−i ) dτ = τ (τ, t−i ) dτ,
0
ti ∂ti 0
ti ∂ti
и покупателя
Z b
pb (s, b) = w(s, b)b − w(s, β) dβ =
0
Z b
b − 1 dβ = s, s ≤ b,
s
= Z b
0 −
0 dβ = 0, s > b.
0
5.7. Проектирование
оптимального механизма
До сих пор мы рассматривали задачу проектирования ме-
ханизма, целью которой была реализация некоторой функ-
ции социального выбора посредством механизма из задан-
5.7. Проектирование оптимального механизма 201
def 1 − Fi (ti )
νi (ti ) = ti − .
fi (ti )
Для заданных t ∈ T и w ∈ [0, 1]n виртуальный излишек опре-
деляется по формуле:
n
X
νi (ti )wi − c(w).
i=1
Eti (pi (ti , t−i )) = Eti (νi (ti )wi (ti , t−i )),
щего с плотностями fi .
5.7. Проектирование оптимального механизма 205
вероятность
(
1, aτ ∈ Wi ,
wi (t) =
0, aτ ∈ A \ Wi
победы игрока i.
Прокомментируем действия оптимального механизма Майер-
сона по шагам:
на шаге 1 оценки (стратегии) ti игроков заменяются на вир-
туальные оценки τi = νi (ti );
на шаге 2 применяется V CG-механизм с правилом замеще-
ния Кларка для вычисления виртуальных платежей qi
всех игроков;
на шаге 3 по виртуальным платежам qi вычисляются плате-
жи игроков pi (t) и вероятности их победы wi (t) в ситуа-
ции t.
Определяя вероятности wi (t), мы неявно предполагали, что
на шаге 2 возможные неоднозначности при выборе исхода
aτ разрешались детерминированным образом (например, для
конечных множеств A среди возможных кандидатов всегда
выбирается исход с минимальным номером), то оптимальный
механизм Майерсона будет детерминированным побудитель-
но совместимым механизмом.
def 1 − F (τ )
ν(τ ) = τ − (5.15)
f (τ )
5.8. Упражнения
2m
4 3
Q1
6 Q
1m
s m
Q
2 4
Q 3
1QQs m 3
3
Рис. 5.1.
Приложение A
Элементы
нелинейного анализа
Начиная с 50-х годов 20-го века в экономической теории ме-
тоды «классического» математического анализа, основанные
на дифференциальном исчислении, начали вытесняться бо-
лее общими методами нелинейного негладкого анализа с ши-
роким использованием выпуклых структур. Пожалуй наибо-
лее мощным из этих новых средств является теорема Каку-
тани о неподвижной точке многозначных отображений. С ее
использованием становятся почти тривиальными доказатель-
ства существования равновесий во многих игровых моделях.
В этом приложении представлены, хотя и не в систематиче-
ском виде, те понятия и результаты современного нелинейно-
го анализа, которые используются в данной книге.
def √
Норма(или длина вектора x ∈ Rn — это число kxk = xT x.
Расстояние между векторами x, y ∈ Rn определяется как дли-
на вектора x − y, т. е. это число kx − yk.
Бесконечную последовательность
x1 , x2 , . . . , xk , . . .
векторов из Rn будем абозначать через {xk }∞ k=1 или просто
{xk }. Говорят, что последовательность {xk } сходится к точ-
ке x ∈ Rn (или x есть предел последовательности {xk }, пи-
шут xk → x), если
lim kxk − xk = 0.
k→∞
def
• евклидов шар B(x0 , r), где x0 ∈ Rn , r ∈ R++ = {α ∈ R :
α > 0};
• гиперплоскость
def
H(a, b) = {x ∈ Rn : aT x = b}
и полупространство
def
H ≤ (a, b) = {x ∈ Rn : aT x ≤ b}.
≤ (1 − λ) max xi + λ max yi
1≤i≤n 1≤i≤n
неотрицательно определена35 .
35 Матрица A размера n×n неотрицательно определена тогда и только тогда, когда
Qn 1/n
Чуть труднее доказать, что функция f (x) = ( i=1 xi ) ,
значения которой равны среднему геометрическому ее аргу-
ментов, является вогнутой на R++ . Компоненты ее Гессиана
∇2 f (x) вычисляются по правилу:
Qn 1/n
∂2f ( i=1 xi )
(x) = −(n − 1) , k = 1, . . . , n,
∂ 2 xk n2 x2k
Qn 1/n
∂2f ( i=1 xi )
(x) = , k, l = 1, . . . , n, k 6= l.
∂xk ∂xl n2 xk xl
Поскольку для произвольного вектора y ∈ Rn выполняется
неравенство
!2
Qn 1/n n n
( x i ) X X
y T ∇2 f (x)y = − i=1 2 n (yi /xi )2 − yi /xi ≤ 0,
n i=1 i=1
Комбинируя
Pэти две операции, мы получим, что взвешенная
m
сумма f = i=1 fi выпуклых функций f1 , . . . , fm с неотрица-
тельными весами w1 , . . . , wn также является выпуклой функ-
цией.
Эти свойства распространяются на бесконечные суммы и ин-
тегралы. Например, если f (x, y) — выпуклая функция аргу-
мента x ∈ X для всех y ∈ Y и w(y) ≥ 0 для всех y ∈ Y , то
функция g, определенная по правилу
Z
g(x) = w(y)f (x, y)dy
Y
h((1 − λ)x + λy) = max{f ((1 − λ)x + λy), g((1 − λ)x + λy)}
≤ max{(1 − λ)f (x) + λf (y), (1 − λ)g(x) + λg(y)}
≤ (1 − λ) max{f (x), g(x)} + λ max{f (y), g(y)}
= (1 − λ)h(x) + λh(y),
... ...
... ...
6 6
... ...
α2 .
...
..
f (y) = max{f (x), f (y)} .
...
..
...
... r ...
...
... ...
.............................. ... .............................. ...
....... .. ....... ..
....... ... ....... ...
....... .... ....... ....
α1
.......
.......
.......
.....
.
....
...
.
..
f (x) r
.......
.......
.......
.....
.
....
...
.
..
- -
a x̄ b c x y
а б
является квазивыпуклой.
Верен и более общий результат. Пусть Y — произвольное мно-
жество, X — выпуклое множество из Rn , w(y) ≥ 0 для всех
y ∈ Y , а g(x, y) есть выпуклая на X функция аргумента x
при всех фиксированных значениях y ∈ Y . Тогда функция
является квазивыпуклой.
a) ϕ(0) = x0 ;
b) ϕ(θ) ∈ X для достаточно малого θ > 0.
Допустимым направлением в точке x0 назовем вектор
T
dϕ dϕ1 dϕ2 dϕn
y= (0) = (0), (0), . . . , (0) ,
dθ dθ dθ dθ
касающийся некоторой дуги кривой ϕ(θ), допустимой в x0 .
В дальнейшем будем обозначать через Cad (x0 ) конус, обра-
зованный множеством допустимых направлений в точке x0 .
Отыщем условие, необходимое для того, чтобы вектор y ∈ Rn
принадлежал конусу Cad (x0 ).
Обозначим через I(x0 ) множество индексов насыщенных огра-
ничений в x0 , т. е. ограничений, выполняющихся в x0 в форме
равенства:
I(x0 ) = {i ∈ I : gi (x0 ) = 0}.
Касательный конус в точке x0 определяется следующим об-
разом:
def
T (x0 ) = {y ∈ Rn : ∇giT (x0 )y ≤ 0 ∀ i ∈ I(x0 )}.
∇g1 (x0 ) 0
X.... X
X −∇f (x )
..
..........r - ∇g3 (x0 )
XX >
... ..................X
..
......... ..
........ x .... 0
..
..
.
......... ...
... .
.
.
..... C (x ) ....
... 0
...ad
.... ....
..
....
....
....
..
.......
...
........
g1 (x) = 0 ...
.
...........
.....................
...
..
. .....
.. .
........
g3 (x) = 0
т. е. x ∈ Z(y). 2
Тогда α ≤ β.
36 S. Kakutani. A Generalization of Brouwer’s Fixed Point Theorem. Duke Mathematical
Тогда
max min f (x, y) = min max f (x, y) (A.12)
x∈X y∈Y y∈Y x∈X
Отсюда
Поэтому
max min f (x, y) = min max f (x, y).
x∈X y∈Y y∈Y x∈X
f (x)
r
6
1 ....
....... .......
r....
...
....
..
...
..
.....
.
....
..
..
..
..
..
..
. r
......
....
.
..
..
.
... .... .....
... ......
...
..
-
0 1 x
Рис. A.3.
Приложение B
Элементы
теории вероятностностей
В этом приложении в сжатой форме представлены те поня-
тия теории вероятностей, которые необходимы для понима-
ния материала данной книги. Предполагается, что вы уже
прослушали начальный курс теории вероятностей. Это при-
ложение поможет вам систематизировать свои знания.
(ii) P(Ω) = 1.
Распределение Пуассона
Равномерное распределение
Z b
1 a+b
E(ξ) = xdx =
,
b−a a 2
Z b 2
2 1 b+a (b − a)2
σ (σ) = x− dx = .
b−a a 2 24
B.3. Часто используемые распределения 239
Нормальное распределение
2m 3m 2m
z. m
2m m
............................................. ........................
....................... ...................... .......................
.y
.......................... .. 3 ..........................................................3
....................... .
........................................
.. .
....... ...
....... ...
6 ....... ......
.....
6 ..
... ..
.
... ..
....
... ....
...
....... .......
... ....
... .....
.... ............
... ...
..... .............
.
1m 4m 1m - 4m 1m 4m
. .........
.
vm
4 wm
4 4m 5m 8m 4m 5m 8m
@ A A
vm wm 3m 3m
@ A A
3 3
H @
@ HH
@
vm
@ m
2m 7m 2m 7m
@ H
H
2 w2
HH @
H@
vm
@ m
1m 6m 1m 6m
H
H
1 w1
def
x−i = (x1 , . . . , xi−1 , xi+1 , . . . , xn ) ∈ X−i
def
(y, x−i ) = (x1 , . . . , xi−1 , y, xi+1 , . . . , xn ) ∈ X для y ∈ Xi и
x−i ∈ X−i
def
{ai }ni=1 = {a1 , . . . , an }
def
{ai }i∈N = {ai1 , . . . , ain } для N = {i1 , . . . , in }
convX — выпуклая оболочка множества векторов X ⊆ Rn
I — единичная матрица
AT — транспонированная матрица для матрицы A
0 — нулевой вектор, нулевая матрица
ei — i-й единичный орт (0, . . . , 0, 1, 0, . . . , 1)T с единицей на
i-м месте
e — вектор (1, 1 . . . , 1)T
AJI — подматрица матрицы A, образованная элементами, ко-
Список обозначений 245