А. А. ГОРОДОВ
А. А. КУЗНЕЦОВ
А. М. ПОПОВ
ПРИКЛАДНАЯ
ТЕОРИЯ ИГР
Утверждено редакционно-издательским советом
университета в качестве практикума
для магистрантов направлений подготовки
230200.68 и 230400.68
В 2 частях
Часть 2
Красноярск 2013
УДК 519.8
ББК 22.18
Г70
Рецензенты:
доктор физико-математических наук, профессор А. К. ШЛЕПКИН
(Красноярский государственный аграрный университет);
доктор физико-математических наук, профессор К. В. САФОНОВ
(Сибирский государственный аэрокосмический университет
имени академика М. Ф. Решетнева)
Городов, А. А.
Г70 Прикладная теория игр : практикум : в 2 ч. Ч. 2 / А. А. Го-
родов, А. А. Кузнецов, А. М. Попов / Сиб. гос. аэрокосмич.
ун-т. – Красноярск, 2013. – 76 с.
УДК 519.8
ББК 22.18
2
ОГЛАВЛЕНИЕ
Предисловие .......................................................................................... 4
3
ПРЕДИСЛОВИЕ
4
сутствовать и быть оформленным по образцу (см. приложение к
части 1 практикума).
Расчетное задание должно быть сдано на проверку не позднее,
чем за неделю до зачетной недели. В противном случае за каждый
просроченный день снимается 0,2 балла. В случае невыполнения вы-
шеуказанных требований расчетное задание не принимается.
Данный практикум может быть полезен магистрантам матема-
тического и экономического факультетов университетов, техниче-
ских вузов, а также аспирантам, преподавателям и научным сотруд-
никам.
5
1. БЕСКОАЛИЦИОННЫЕ ИГРЫ
6
Рассмотрим более подробно одну из биматричных игр.
Пример 1. Двое подростков едут навстречу друг другу на авто-
мобилях. Проигравшим считается тот, кто свернет в сторону. Если
один свернул в сторону, а другой нет, то «выигравший» игрок полу-
чает 5, а «проигравший» (свернувший с дороги) получает (–5). Если
сворачивают оба, то состязание оканчивается вничью и выигрыши
равны нулю. Если же никто из них не свернул в сторону, то игра за-
вершается аварией – выигрыш каждого равен (–100). Составить мат-
рицы игры.
Решение. Игра состоит из двух ходов; оба – личные. У игроков
по две стратегии.
Стратегии игрока А:
A1 – свернуть в сторону; A2 – не сворачивать.
Аналогично у игрока В:
B1 – свернуть в сторону; B2 – не сворачивать.
Таблица 1.1
В1 В2
А1 (0; 0) (–5; 5)
А2 (5; –5) (–100; –100)
7
Вопросы и задания для самоконтроля
1. Дайте определение понятия биматричной игры.
2. Приведите примеры биматричных игр, известных вам.
3. Чем отличаются биматричные игры от матричных?
4. Дайте определение понятия смешанной стратегии в бимат-
ричной игре.
8
вкладчик забирает вклад, то банк вынужден прекратить финансирова-
ние проекта. Забравший свои средства вкладчик получает D, другой
вкладчик 2r − D ; игра останавливается. Если оба вкладчика забрали
средства, то каждый получает r, игра заканчивается. Если оба вклад-
чика не забрали свои средства, то каждый получает по R. Представьте
ситуацию в виде биматричной игры.
4. На железнодорожной платформе в электричку заходят двое:
безбилетник и контролер. Если они заходят в один и тот же вагон, то
контролер ловит безбилетника и штрафует его на 100 руб. Если они
садятся в разные вагоны, то безбилетник выходит на следующей
станции, ничего не заплатив. Свое моральное удовлетворение от по-
имки безбилетника контролер оценивает в 50 руб. Предположим для
простоты, что в электричке всего два вагона. Представьте ситуацию в
виде биматричной игры.
5. В Австралии по соседству находятся два фермерских участка.
Каждый фермер может поставить на своем участке пугало для отпу-
гивания ворон и кроликов, грозящих уничтожить его посевы. Уро-
жайность каждого участка зависит от наличия пугала как на этом, так
и на соседнем участке. Пусть а – прибыль каждого фермера, если пу-
гала стоят на обоих участках, b < a – прибыль, если пугало стоит
только на одном участке, 0 – прибыль, если пугал нет. Стоимость ус-
тановки пугала равна 100 ден. ед. Представьте ситуацию в виде би-
матричной игры.
9
соответствующие элементы которой больше соответствующих эле-
ментов другой чистой стратегии, называемой доминируемой (в мат-
рице затрат наоборот).
Рассмотрим игру с матрицами выигрышей игроков А и В.
Применить отношения доминирования возможно, если:
а) сторона А хочет максимизировать свой выигрыш и миними-
зировать выигрыш стороны В;
б) сторона В хочет максимизировать свой выигрыш и миними-
зировать выигрыш стороны А;
в) сторона А хочет минимизировать свой проигрыш и максими-
зировать проигрыш стороны В;
г) сторона В хочет минимизировать свой проигрыш и максими-
зировать проигрыш стороны А.
Рассмотрим алгоритм упрощения некоторых игровых задач
с использованием приведенных критериев.
Пример 2. Требуется редуцировать размерность задачи за счет
исключения заведомо невыгодных стратегий следующих матриц вы-
игрышей биматричной игры:
B1 B2 B3 B1 B2 B3
⎡2 3 6⎤ A1 ⎡3 1 2⎤ A1
A = ⎢7 1 4⎥ A2 , B = ⎢2 5 1⎥ A2 .
⎢ ⎥ ⎢ ⎥
⎢1 5 6⎥ A3 ⎢4 1 3⎥ A3
⎢ ⎥ ⎢ ⎥
⎣8 1 6⎦ A4 ⎣6 2 1⎦ A4
Решение. Рассмотрим первый критерий задачи: сторона А хочет
максимизировать свой выигрыш.
По этому критерию из матрицы А удаляются доминируемые
строки. При сравнении выигрышей в стратегиях A2 и A4 видно, что
все элементы четвертой строки больше соответствующих элементов
второй строки, следовательно, из матрицы А удаляется вторая строка.
Автоматически удаляется вторая строка и из матрицы В.
Таким образом, после отработки первого критерия матрицы вы-
игрышей выглядят следующим образом:
B1 B2 B3 B1 B2 B3
⎡2 3 6⎤ A1 ⎡3 1 2⎤ A1
A= ⎢ , B= .
1 5 6⎥ A3 ⎢4 1 3⎥ A3
⎢ ⎥ ⎢ ⎥
⎢⎣8 1 6 ⎥⎦ A4 ⎢⎣ 6 2 1 ⎥⎦ A4
10
Перейдем к рассмотрению второго критерия – сторона А хочет
минимизировать выигрыш стороны В.
По данному критерию из матрицы удаляются доминирующие
строки. Строка, соответствующая стратегии A3 , является домини-
рующей по отношению к строке, соответствующей стратегии A1 , и
удаляется из матрицы В.
Из матрицы А также удаляется строка, соответствующая страте-
гии A3 .
Таким образом, после применения отношений доминирования
матрицы выигрышей принимают следующий вид:
B1 B2 B3 B1 B2 B3
A = ⎡2 3 6⎤ A1 , B = ⎡3 1 2⎤ A1 .
⎢8 1 6 ⎥ A4 ⎢6 2 1 ⎥ A4
⎣ ⎦ ⎣ ⎦
Сторона В хочет минимизировать выигрыш стороны А. По дан-
ному критерию из матрицы А удаляются доминирующие столбцы.
Столбец B3 является доминирующим по отношению к столбцу B2 и
удаляется из матрицы. Соответственно, из матрицы В также удаляется
третий столбец.
Таким образом, после применения отношений доминирования
матрицы выигрышей принимают следующий вид:
B1 B2 B1 B2
A = ⎡ 2 3⎤ A1 , B = ⎡ 3 1 ⎤ A1 .
⎢ 8 1⎥ A4 ⎢6 2 ⎥ A4
⎣ ⎦ ⎣ ⎦
При выборе других критериев рассуждения проводятся анало-
гичным образом.
11
Задания для самостоятельного решения
12
Произведем следующее преобразование:
⎛a a12 ⎞ ⎛ q1 ⎞
H A ( p , q ) = P ⋅ A ⋅ Q T = ( p1 ; p2 ) ⋅ ⎜ 11 ⎟⋅⎜ q ⎟ =
a
⎝ 21 a 22 ⎠ ⎝ 2 ⎠
⎛a a12 ⎞ ⎛ q1 ⎞
= ( p1 ,1 − p1 ) ⋅ ⎜ 11 ⎟⋅⎜ ⎟=
⎝ a21 a22 ⎠ ⎝ 1 − q1 ⎠
= p ⋅ a11 ⋅ q1 + p1 ⋅ a12 ⋅ (1 − q1 ) + (1 − p1 ) ⋅ a21 ⋅ q1 + (1 − p1 ) ⋅ a22 ⋅ (1 − q1 ) =
= p1 ⋅ a11 ⋅ q1 + p1 ⋅ a12 − p1 ⋅ a12 ⋅ q1 + a21 ⋅ q1 − p11 ⋅ a21 ⋅ q1 +
+ a22 − p11 ⋅ a22 − a22 ⋅ q1 + p11 ⋅ a22 ⋅ q1 =
= ( a11 − a12 − a21 + a22 ) ⋅ p1 ⋅ q1 + ( a12 − a22 ) ⋅ p1 + ( a21 − a22 ) ⋅ q1 + a22 .
После аналогичных преобразований получим выражение для
игрока В:
H B ( p , q ) = P ⋅ A ⋅ QT =
= ( b11 − b12 − b21 + b22 ) ⋅ p1 ⋅ q1 + ( b12 − b22 ) ⋅ p1 + ( b12 − b22 ) ⋅ q1 + b22 .
Так как равновесные ситуации в биматричной игре означают
приемлемость решения для каждого из игроков, то можно его описать
в графической форме. Следующие теоремы определяют наличие рав-
новесия в данной игре.
Теорема 1 (теорема Нэша). Каждая биматричная игра имеет
по крайней мере одну ситуацию равновесия.
Теорема 2. Биматричная игра образует ситуацию равновесия то-
гда и только тогда, когда выполняются неравенства
H A ( p, q ) ≤ H A ( p, q ), H B ( p ,0 ) ≤ H B ( p , q ) ,
H A (1, q ) ≤ H A ( p , q ) , H B ( p ,1) ≤ H B ( p , q ) .
Видно, что эти условия никаким образом не связаны для игро-
ка А с матрицей выигрыша игрока В, и наоборот.
Если рассмотреть соотношение теоремы 1 для игрока А, то мож-
но предположить, что p1 = 1 , а затем p1 = 0 , тогда получим:
H A ( 0, q ) = ( a21 − a22 ) ⋅ q1 + a22 ,
H A (1, q ) = ( a11 − a12 − a21 + a22 ) ⋅ q1 + ( a12 − a22 ) + ( a21 − a22 ) ⋅ q1 + a22 =
= ( a11 − a12 − a21 + a22 ) ⋅ q1 + a12 + ( a21 − a22 ) ⋅ q1 .
Запишем выигрыши игрока на основании соотношений теоре-
мы 2 в следующем виде:
( a21 − a22 ) ⋅ q1 + a22 ≤ ( a11 − a12 − a21 + a22 ) ⋅ p1 ⋅ q1 +
+ ( a12 − a22 ) ⋅ p1 + ( a21 − a22 ) ⋅ q1 + a22 ,
13
( a11 − a12 − a21 + a22 ) ⋅ q1 + a12 + ( a21 − a22 ) ⋅ q1 ≤
≤ ( a11 − a12 − a21 + a22 ) ⋅ p1 ⋅ q1 +
+ ( a12 − a22 ) ⋅ p1 + ( a21 − a22 ) ⋅ q1 + a22 .
После упрощения получим:
( a11 − a12 − a21 + a22 ) ⋅ p1 ⋅ q1 + ( a12 − a22 ) ⋅ p1 ≥ 0 ,
( a11 − a12 − a21 + a22 ) ⋅ (1 − p1 ) ⋅ q1 + ( a12 − a22 ) ⋅ (1 − p1 ) ≤ 0 .
Положим для упрощения записи:
a11 − a12 − a21 + a22 = C ,
a22 − a12 = c1 .
Тогда полученные неравенства можно записать в следующей
форме:
⎧Cp1q1 − c1 p1 ≥ 0,
⎨
⎩C (1 − p1 ) q1 − c1 (1 − p1 ) ≤ 0.
Из данной системы следует, что при C ≠ 0 множество приемле-
мых для игрока А ситуаций можно будет записать в следующем виде:
H A (1; q1 ) , при q1C ≥ c1 = a22 − a12 ,
H A ( 0; q1 ) , при q1C ≤ c1 ,
H A ( p1 ; q1 ) , при q1C = c1 и q1 ∈ [ 0;1] .
14
H B ( p1 ;1) , при p1 D ≥ d1 = b22 − b12 и D ≠ 0 ,
H B ( p1 ; 0 ) , при p1 D ≤ d1 и D ≠ 0 ,
H B ( p1 ; q1 ) , при p1 D = d1 , p1 ∈ [ 0;1] и D ≠ 0 .
При D = 0 и d1 ≠ 0 :
H B ( p1 ;1) , при d1 > 0 ; H B ( p1 ; 0 ) , при d1 < 0 .
При D = 0 и d1 = 0 для игрока В все ситуации приемлемы.
Итоговое решение для игроков можно записать в следующем
виде:
c1 a22 − a12
p1 = = ,
C a11 − a12 − a21 + a22
d1 b22 − b12
q1 = = .
D b11 − b12 − b21 + b22
В отличие от матричной игры, для которой зигзаги оптимальных
ситуаций всегда имеют одинаковую ситуацию, в биматричных играх
они могут иметь различную ориентацию. При этом число равновес-
ных точек будет равно одному в двух ситуациях:
а) равновесная ситуация существует только в чистых стратегиях;
б) равновесная ситуация соответствует смешанной стратегии
хотя бы одного игрока и зигзаги имеют одинаковую ориентацию.
Число равновесных точек будет равно трем, если существует
равновесный исход в смешанных стратегиях.
Возможные решения можно представить графически (рис. 1.1
и 1.2).
y y
x x
Рис. 1.1. Одна точка равновесия Рис. 1.2. Три точки равновесия
в биматричной игре в игре
15
Теперь рассмотрим пример решения биматричной игры размер-
ностью 2 × 2 .
Пример 3. Игра «Студент–профессор».
Студент имеет две стратегии: A1 – хорошо подготовиться, A2 –
плохо подготовиться. Профессор также располагает двумя стратегия-
ми: B1 – поставить зачет и B2 – не поставить зачет. Матрицы игроков
⎛ 2 −1⎞ ⎛ 1 −2 ⎞
имеют следующий вид: A = ⎜ ⎟ , B = ⎜ ⎟ . Найдите равно-
⎝1 0 ⎠ ⎝ −3 −1 ⎠
весие.
Решение. Найдем решение задачи по Нэшу:
−1 − (−3) 2 2 3
p1 = = ⇒ p2 = 1 − = ,
1 − (−2) − (−3) + (−1) 5 5 5
0 +1 1 1 1
q1 = = ⇒ q2 = 1 − = .
2 − (−1) − 1 + 0 2 2 2
Поэтому студент должен выучить 40 % материалов по предмету,
а профессор – в одинаковой степени склонен поставить или не поста-
вить зачет. Графически данное решение можно представить следую-
щим образом (рис. 1.3):
1
2
2 1 x
5
16
На следующем примере рассмотрим отличие равновесия Нэша
и оптимальности по Парето.
Пример 4. Игра «Дилемма заключенного».
Два преступника ожидают суда. Каждому из них предлагают
сознаться и дать показания против сообщника. При этом если один
молчит, а второй сознается, то первого освобождают, а второму дают
12 лет тюрьмы. Если оба молчат, то каждый получит по 2 года. Если
оба сознаются, то получат по 8 лет. Найдите решение биматричной
игры.
Решение. Составим матрицы игры:
⎛ −8 0 ⎞ ⎛ −8 −12 ⎞
A=⎜ ⎟ , B=⎜ ⎟.
⎝ −12 −2 ⎠ ⎝ 0 − 2 ⎠
Найдем решение задачи по Нэшу:
−2 − 0 −2
p1 = = < 0 , так как p1 < 0 , C > 0 ⇒ p1 = 1 .
−8 + 12 − 0 − 2 2
−2 − 0 −2
q1 = = < 0 , так как q1 < 0 , C > 0 ⇒ q1 = 1 .
−8 − 0 + 12 − 2 2
Графическое решение представлено на рис. 1.4.
y
1
–1 1 x
–1
17
Множество всех реализуемых выигрышей в четырех возможных
ситуациях изображено на рис. 1.5.
а
Н1
–12 –8 –2
b
–12 с
Рис. 1.5. Решение игры
«Дилемма заключенного» по Парето
Таблица 1.2
В1 В2
А1 (1000, 100) (0, 0)
А2 (0, 0) (100, 1000)
18
2. Найдите равновесия Нэша в смешанных стратегиях в сле-
дующей игре в нормальной форме (табл. 1.3).
Таблица 1.3
В1 В2
А1 (2, 1) (0, 2)
А2 (1, 2) (3, 0)
⎛ −10 2 ⎞ ⎛ 5 −2 ⎞
A=⎜ ⎟ , B = ⎜ −1 1 ⎟ .
⎝ 1 −1 ⎠ ⎝ ⎠
(Например: если игроки применяют свои первые стратегии, мини-
стерство решает строить объект 1, а городские власти разрешают его
постройку, тогда город получает выигрыш 5 млн руб., а министерство
теряет 10 млн руб. и т. д.) Определите оптимальность по Парето и
равновесие по Нэшу.
4. Игра «Орел-решка». Первый игрок прячет монету орлом или
решкой вверх, а второй пытается угадать, как она спрятана. Если он
не угадывает – он платит первому одну денежную единицу, если уга-
дывает – первый платит ему одну денежную единицу. Определите оп-
тимальность по Парето и равновесие по Нэшу.
5. Пусть две страны, осуществляющие лов рыбы в одних и тех
же водах, согласились на взаимное ограничение добычи с целью со-
хранения рыбных запасов. При этом каждая из сторон не имеет ре-
альных средств, чтобы контролировать соблюдение соглашения дру-
гой стороной. Это обстоятельство исключает возможность примене-
ния санкций за нарушения.
Возможные стратегии сторон состоят в том, чтобы соблюдать
или не соблюдать принятые соглашения. Доходы сторон (в некоторых
условных единицах), соответствующие различным выборам страте-
19
гий, представлены парами целых чисел (разделенных запятыми)
(табл. 1.4). Определите равновесие по Нэшу.
Таблица 1.4
Матрица А и B Соблюдать Не соблюдать
соглашение соглашение
Соблюдать соглашение (10, 10) (5, 11)
Не соблюдать соглашение (11, 5) (6, 6)
( )
но ψ kj раз j = 1, n . Тогда в ( k + 1) -й партии игрок А будет использо-
вать Aik +1 стратегию, а игрок В – свою B jk +1 стратегию, при этом по-
лучим
V = max ∑ aij ψ kj = ∑ aijk +1 ψ kj ,
k
i
j j
k k
где V и V – нижняя и верхняя цены игры соответственно.
Представим нижнюю и верхнюю цены игры в виде соотно-
шений
k
V ⎛ ψ kj ⎞ ⎛ ψ kj ⎞
= max ∑ aij ⎜ ⎟ = ∑ aik +1 j ⎜ ⎟,
k i ⎜ k ⎟ j ⎜ k ⎟
j ⎝ ⎠ ⎝ ⎠
V
k
⎛ ϕik ⎞ ⎛ ϕik ⎞
= min ∑ aij ⎜ ⎟ = ∑ aik +1 j ⎜ ⎟.
k j
i ⎝ k ⎠ j ⎝ k ⎠
Представим векторы смешанных стратегий игроков А и В в сле-
k ⎧ k ϕ1k k ϕm ⎫
k
k ⎧ k ψ1k k ψn ⎫
k
дующем виде: P = ⎨ p1 ; ...; pm ⎬ и Q = ⎨q1 ; ...; qn ⎬.
⎩ k k ⎭ ⎩ k k ⎭
По теореме фон Неймана, цена игры находится в границах V ≤ V ≤ V ,
откуда можно получить следующее соотношение:
21
k k
V V
max ≤ V ≤ min .
k k k k
⎡ V
k
V ⎤
k
V
1
⎛ ϕik ⎞
= min ∑ aij ⎜ ⎟=
1 j
i ⎝ k ⎠
= min {( 2 ⋅1 + 3 ⋅ 0 + 1 ⋅ 0 ) ; (1 ⋅1 + 0 ⋅ 0 + 2 ⋅ 0 ) ; ( 3 ⋅1 + 1 ⋅ 0 + 1 ⋅ 0 )} =
j
= max {2;1; 3} = 1.
i
22
Во второй и третьей партиях игрок А выбирает стратегию A2 ,
а игрок В стратегию B2 , поскольку эти стратегии обеспечивают наи-
лучший результат, т. е.:
2
V ⎛ ψ 2j ⎞
= max ∑ aij ⎜ ⎟=
2 i ⎜ 2 ⎟
j ⎝ ⎠
⎧⎛ 1 1 ⎞ ⎛ 1 1 ⎞ ⎛ 1 1 ⎞⎫
= max ⎨⎜ 2 ⋅ + 1 ⋅ + 3 ⋅ 0 ⎟ ; ⎜ 3 ⋅ + 0 ⋅ + 1 ⋅ 0 ⎟ ; ⎜1 ⋅ + 2 ⋅ + 1 ⋅ 0 ⎟ ⎬ =
i ⎩⎝ 2 2 ⎠ ⎝ 2 2 ⎠ ⎝ 2 2 ⎠⎭
⎧3 3 3⎫ 3
= max ⎨ ; ; ⎬ = ;
i ⎩2 2 2⎭ 2
V
2
⎛ ϕi2 ⎞
= min ∑ aij ⎜ ⎟ =
2 j
i ⎝ 2 ⎠
⎧⎛ 1 1 ⎞ ⎛ 1 1 ⎞ ⎛ 1 1 ⎞⎫
= min ⎨⎜ 2 ⋅ + 3 ⋅ + 1 ⋅ 0 ⎟ ; ⎜1 ⋅ + 0 ⋅ + 2 ⋅ 0 ⎟ ; ⎜ 3 ⋅ + 1 ⋅ + 1 ⋅ 0 ⎟ ⎬
j ⎩⎝ 2 2 ⎠ ⎝ 2 2 ⎠ ⎝ 2 2 ⎠⎭
⎧5 1 4⎫ 1
= max ⎨ ; ; ⎬ = ;
i ⎩2 2 2⎭ 2
3
V ⎛ ψ 3j ⎞
= max ∑ aij ⎜ ⎟=
3 i ⎜ 3 ⎟
j ⎝ ⎠
⎧⎛ 1 1 ⎞ ⎛ 1 2 ⎞ ⎛ 1 2 ⎞⎫
= max ⎨⎜ 2 ⋅ + 1 ⋅ + 3 ⋅ 0 ⎟ ; ⎜ 3 ⋅ + 0 ⋅ + 1 ⋅ 0 ⎟ ; ⎜ 1 ⋅ + 2 ⋅ + 1 ⋅ 0 ⎟ ⎬ =
i ⎩⎝ 3 3 ⎠ ⎝ 3 3 ⎠ ⎝ 3 3 ⎠⎭
⎧4 5⎫ 5
= max ⎨ ;1; ⎬ = ;
i ⎩3 3⎭ 3
V
3
⎛ ϕ3i ⎞
= min ∑ aij ⎜ ⎟ =
3 j
i ⎝ 3 ⎠
⎧⎛ 1 2 ⎞ ⎛ 1 2 ⎞ ⎛ 1 2 ⎞⎫
= min ⎨⎜ 2 ⋅ + 3 ⋅ + 1 ⋅ 0 ⎟ ; ⎜ 1 ⋅ + 0 ⋅ + 2 ⋅ 0 ⎟ ; ⎜ 3 ⋅ + 1 ⋅ + 1 ⋅ 0 ⎟ ⎬
j ⎩⎝ 3 3 ⎠ ⎝ 3 3 ⎠ ⎝ 2 3 ⎠⎭
⎧8 1 5 ⎫ 1
= max ⎨ ; ; ⎬ = .
i ⎩3 3 3⎭ 3
23
Дальнейшие расчеты сведем в таблицу (табл. 1.5), в которой
укажем результаты разыгрывания, а также накопленный и средний
выигрыш.
Таблица 1.5
k Ai B j ϕ1k ϕk2 ϕ3k ψ1k ψ k2 ψ 3k Выигрыш A Проиг- k
V V
k
Ошибка
рыш B
k k k k k k k k
A1 A2 A3 B1 B2 B3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
1 A1 B1 1 0 0 1 0 0 2 3 1 2 1 3 3 1 2
1 1 1 1 3 1
2 A2 B2 0 0 3 3 3 5 1 4 1
2 2 2 2 2 2
1 2 1 2 2 1 4
3 A2 B2 0 0 4 3 5 8 1 5
3 3 3 3 3 3 3
1 2 1 1 3 7 3
4 A3 B2 0 5 3 7 9 3 6 1
4 4 4 4 4 4 4
1 2 2 1 4 9 5 4
5 A3 B2 0 6 3 9 10 5 7
5 5 5 5 5 5 5 5
1 2 3 1 5 11 7 4
6 A3 B2 0 7 3 11 11 7 8
6 6 6 6 6 6 6 6
1 2 4 1 6 13 9 4
7 A3 B2 0 8 3 13 12 9 9
7 7 7 7 7 7 7 7
1 2 5 1 6 1 14 10 4
8 A3 B3 1 4 14 13 11 10
8 8 8 8 8 8 8 8 8
1 2 6 1 6 2 15 11 4
9 A3 B3 14 5 15 14 13 11
9 9 9 9 9 9 9 9 9
1 2 7 1 6 3 17 12 5
10 A3 B3 17 6 16 15 15 12
10 10 10 10 10 10 10 10 10
2 2 7 1 6 4 20 15 5
11 A1 B3 20 7 17 17 16 15
11 11 11 11 11 11 11 11 11
3 2 7 1 6 5 23 17 6
12 A1 B3 23 8 18 19 17 18
12 12 12 12 12 12 12 12 12
24
размерности матрицы. Это является также следствием немонотонно-
k k
V V
сти последовательностей и .
k k
25
2. ПОЗИЦИОННЫЕ ИГРЫ
26
{ }
Определение 7. Ситуация u* = u0* , u1* , ..., un* в чистых стратегиях
называется ситуацией равновесия по Нэшу, если для всех игроков
выполняется условие
( ) ( )
H i u* ≥ H i ui* , ui , ∀ui , i = 1, ..., n .
При этом достаточным условием существенной игровой струк-
туры является наличие в ней полной информации.
Определение 8. Говорят, что G (k , u ) имеет полную информацию,
если каждое информационное множество состоит из одной позиции.
Следует заметить, что любая игра одного лица имеет эффектив-
но полную информацию и существенно определена.
Далее рассмотрим несколько примеров решения позиционных
игр, а затем перейдем к применению позиционных игр при принятии
управленческих решений.
Пример 6. Рассмотрим позиционную структуру с одним игро-
ком (рис. 2.1).
u5
u4
u3
u2
u1
Рис. 2.1. Позиционная структура для примера 6
27
из предыдущего). Поэтому для описания поведения игрока в u1 доста-
точно одного параметра, а для описания его поведения в каждом из
последующих информационных множеств – двух (при выборе в пре-
дыдущем информационном множестве правой или левой альтернати-
вы). Общее число параметров, таким образом, равно 9.
Далее рассмотрим две игры двух лиц А и В с заданными множе-
ствами возможных альтернатив. Позиции изображаются точками,
а ходы указываются соединяющими их отрезками. Ход игрока А изо-
бражается отрезком, идущим вниз налево, ход В – отрезком, идущим
вниз направо.
Пример 7. Пусть G – игра (рис. 2.2), рассмотрим сумму п экзем-
пляров игры G.
x1(2; 3)
x2(0; 2) x3(–1; 1)
7 3 0 –2
28
7 +3+ 0− 2
H1 ( u1 ) = = 2 . Порядок предпочтения позиций x1 , x2 , x3
4
должен быть сравним с числами σ ( x1 ) , σ ( x2 ) , σ ( x3 ) . Как указано на
рис. 2.2, σ ( x1 ) = 3 , σ ( x2 ) = 2 , σ ( x3 ) = 1. Число σ ( xi ) является, по су-
ществу, ценой хода из позиции x .
Пример 8. Пусть дана игра G (рис. 2.3).
x1(3; 4)
x2(8; 5) x3(–1; 1)
13 3 0 –2
29
6. Какую игру назовут позиционной игрой с полной информа-
цией?
7. Дайте определение понятия финальной позиции.
30
Показанное решение может быть представлено в виде направ-
ленного графа (дерева решений) (рис. 2.4).
Вероятность 0,6
Нефти нет; прибыль: –50 000
Вероятность 0,1
Нефть: 50 000 т; прибыль: –20 000
Бурить
Вероятность 0,15
Нефть: 100 000 т; прибыль: 30 000
62 000
Вероятность 0,1
Нефть: 500 000 т; прибыль: 430 000
Вероятность 0,5
Нефть: 1 000 000 т; прибыль: 930 000
Не бурить
31
Построим дерево решений (рис. 2.5).
Заем уплачен
А Вероятность 0,05; доход: 172 500 руб.
6 375 руб.
Вероятность 0,05; доход: –150 000 руб.
Заем не уплачен
1 12 000 руб.
Таблица 2.1
Действие компании Доход в зависимости о конъюнктуры рынка, тыс. руб.
Благоприятная Неблагоприятная
Строительство круп- 200 –180
ного завода ( x1 )
Строительство малого 100 –20
предприятия ( x2 )
Продажа патента ( x3 ) 10 10
32
Вероятность положительного состояния рынка оценивается
в 0,5. Оцените целесообразность вложений.
Решение. На основе приведенной таблицы дохода (убытков) по-
строим дерево решений (рис. 2.6).
Процедура принятия решения состоит в определении для каж-
дой вершины дерева ОДО и определении оптимального решения, че-
рез нахождение максимума ожидаемой денежной оценки.
Определим ожидаемые доходы для каждой из вершины дерева:
ОДО1 = 0,5 ⋅ 200 + 0,5 ⋅ (−180) = 10 тыс. руб.,
ОДО 2 = 0,5 ⋅100 + 0,5 ⋅ (−20) = 40 тыс. руб.,
ОДО3 = 10 тыс. руб.
Проведем итог. Наиболее целесообразно выбрать стратегию x2 ,
т. е. строить малое предприятие, а ветви x1 и x3 можно отбросить.
Тогда ОДО составит 40 тыс. руб. при равновозможном состоянии
рынка.
10 тыс. руб.
Большое предприятие
x1 Благоприятное
Вероятность 0,5; доход: 200 тыс. руб.
Неблагоприятное
Вероятность 0,5; доход: –180 тыс. руб.
40 тыс. руб. 40 тыс. руб.
Малое предприятие
Благоприятное
x2
Вероятность 0,5; доход: 100 тыс. руб.
Неблагоприятное
Вероятность 0,5; доход: – 20 тыс. руб.
10 тыс. руб.
Продать патент
x3
доход 10 тыс. руб.
33
Пример 11. Используем условие примера 10 при введении до-
полнительных условий. Пусть перед принятием решения руководство
компании заказывает дополнительную оценку вероятности состояния
рынка за 10 тыс. руб. При этом фирма, проводящая оценку, может
ошибиться. Так, рынок будет благоприятным с вероятностью 0,78, и
этот прогноз оправдается (с вероятностью 0,22 могут возникнуть про-
блемы). Если фирма дает отрицательный прогноз, то неблагоприят-
ным рынок будет с вероятностью 0,73, и с вероятностью 0,27 этот
прогноз не оправдается.
При этом фирма утверждает, что ситуация будет благоприятной
с вероятностью 0,45, а неблагоприятной – с вероятностью 0,55.
Решение. На основании новых сведений построим новое дерево
решений (рис. 2.7) и произведем соответствующие вычисления.
Из анализа дерева следует:
1) необходимо производить дополнительное исследование рын-
ка, что позволит увеличить ОДО;
2) в случае благоприятного прогноза фирмы-аналитика целесо-
образно строить большое предприятие (ОДО = 116,4 тыс. руб.), если
прогноз будет неблагоприятным, то ОДО составит 12,4 тыс. руб.
Предположим, что консультационная фирма за определенную
плату готова предоставить информацию о фактической ситуации на
рынке в тот момент, когда руководству компании надлежит принять
решение о масштабе производства.
Рассчитаем ожидаемую ценность точной информации для
примера 10, в котором дополнительное обследование конъюнктуры
рынка не проводится. При отсутствии точной информации, как уже
было показано выше, максимальная ожидаемая денежная оценка
равна 40 тыс. руб.
Учитывая, что вероятности благоприятной и неблагоприятной
ситуаций равны 0,5, значение ОДОт.и (ОДО точной информации) оп-
ределяется выражением
ОДОт.и = 0,5 ⋅100 + 0,5 ⋅10 = 105 тыс. руб.
Тогда ожидаемая ценность точной информации составит:
ОЦт.и = ОДОт.и – ОДО = 105 – 40 = 65 тыс. руб.
Значение ОЦт.и показывает, какую максимальную цену должна
быть готова заплатить компания за точную информацию об истин-
ном состоянии рынка в тот момент, когда ей это необходимо.
34
x1 Благоприятное состояние
10 тыс. руб. Вероятность 0,5; доход: 200 тыс. руб.
Не проводить Неблагоприятное состояние
обследование Вероятность 0,5; доход: –180 тыс. руб.
x2 Благоприятное состояние
Вероятность 0,5; доход: 100 тыс. руб.
40 тыс. руб. 40 тыс. руб. Неблагоприятное состояние
Вероятность 0,5; доход: –20 тыс. руб.
Благоприятное состояние
x3
Вероятность 1; доход: 10 тыс. руб.
10 т. руб.
x1 Благоприятное состояние
49,2 тыс. руб. Вероятность 0,78; доход: 200 тыс. руб.
116,4 тыс. руб.
Неблагоприятное состояние
Прогноз благоприятный Вероятность 0,22; доход: –180 тыс. руб.
(вероятность 0,45)
Благоприятное состояние
x'' x2
Вероятность 0,78; доход: 100 тыс. руб.
Благоприятное состояние
x''' x2
Вероятность 0,27; доход: 100 тыс. руб.
Прогноз неблагоприятный Неблагоприятное состояние
(вероятность 0,55) 12,4 тыс. руб.
Вероятность 0,73; доход: –20 тыс. руб.
Благоприятное состояние
x3
Вероятность 1; доход: 10 тыс. руб.
10 тыс. руб.
35
Вопросы и задания для самоконтроля
Таблица 2.2
Вероятность для поставщика
Процент брака
А В
1 0,7 0,4
2 0,1 0,3
3 0,09 0,15
4 0,07 0,1
5 0,04 0,05
37
мере R1 = 280 тыс. долл. в течение следующих пяти лет) с вероятно-
стью p1 = 0,8 и низкий спрос (ежегодные убытки R2 = 80 тыс. долл.)
с вероятностью p2 = 0, 2 ;
2) построить маленький завод стоимостью M 2 = 300 тыс. долл.
При этом варианте возможен большой спрос (годовой доход в разме-
ре T1 = 180 тыс. долл. в течение следующих пяти лет) с вероятностью
p1 = 0,8 и низкий спрос (ежегодные убытки T2 = 55 тыс. долл.) с ве-
роятностью p2 = 0, 2 ;
3) отложить строительство завода на один год для сбора допол-
нительной информации, которая может быть позитивной или нега-
тивной с вероятностью p3 = 0,7 и p4 = 0,3 соответственно. В случае
позитивной информации можно построить заводы по указанным вы-
ше расценкам, а вероятности большого и низкого спроса меняются
на p5 = 0,9 и p6 = 0,1 соответственно. Доходы на последующие четы-
ре года остаются прежними. В случае негативной информации ком-
пания заводы строить не будет.
Все расчеты выражены в текущих ценах и не должны дисконти-
роваться. Попробуйте самостоятельно нарисовать дерево решений и
определить наиболее эффективную последовательность действий, ос-
новываясь на ожидаемых доходах. Какова ожидаемая стоимостная
оценка наилучшего решения?
5. Главному инженеру компании надо решить, монтировать или
нет новую производственную линию, использующую новейшую тех-
нологию. Если новая линия будет работать безотказно, компания
получит прибыль 200 млн руб. Если же она откажет, компания мо-
жет потерять 150 млн руб. По оценкам главного инженера, сущест-
вует 60 % шансов, что новая производственная линия откажет. Мож-
но создать экспериментальную установку, а затем уже решать, мон-
тировать или нет производственную линию. Эксперимент обойдется в
10 млн руб. Главный инженер считает, что существует 50 % шансов,
что экспериментальная установка будет работать. Если эксперимен-
тальная установка будет работать, то 90 % шансов за то, что смонти-
рованная производственная линия также будет работать. Если же экс-
периментальная установка не будет работать, то только 20 % шансов
на то, что производственная линия заработает. Следует ли строить
экспериментальную установку? Следует ли монтировать производст-
венную линию? Какова ожидаемая стоимостная оценка наилучшего
решения?
6. Пусть предлагается лотерея: за 100 руб. (стоимость лотерей-
ного билета) игрок с равной вероятностью p = 0,5 может ничего не
38
выиграть или выиграть 1000 руб. Один индивид пожалеет 100 руб. за
право участия в такой лотерее, т. е. просто не купит лотерейный би-
лет, другой готов заплатить за лотерейный билет 500 руб., а третий
заплатит даже 600 руб. за возможность получить 1000 руб. (например,
когда ситуация складывается так, что только имея 1000 руб., игрок
может достичь своей цели, поэтому возможная потеря последних де-
нежных средств, а у него их ровно 600 руб., не меняет для него ситуа-
ции). Постройте дерево решений, предполагая, что участвует только
один игрок. Оцените наилучшую стратегию.
7. Для финансирования проекта бизнесмену нужно занять сро-
ком на один год 15 000 фунтов стерлингов. Банк может одолжить ему
эти деньги под 15 % годовых или вложить в дело со 100%-м возвра-
том суммы, но под 9 % годовых. Из прошлого опыта банкиру извест-
но, что 4 % таких клиентов ссуду не возвращают. При этом банк ре-
шает вопрос, проверять ли конкурентоспособность клиента перед тем
как выдавать заем. Аудиторская фирма просит с банка 80 фунтов
стерлингов за проверку. В результате этого перед банком встают две
проблемы. Первая: проводить или нет проверку. Вторая: выдавать по-
сле этого заем или нет. НЕТ ВОПРОСА
8. Постройте дерево решений и определите наилучшую страте-
гию компании «Суперлайн», осуществляющей перевозки пассажиров
на микроавтобусах – маршрутных такси. В настоящее время компа-
нии принадлежит 60 автобусов, однако лишь 40 из них являются от-
носительно новыми. Двадцать других автобусов по своему техниче-
скому состоянию еще могут эксплуатироваться в течение года, однако
есть 50%-я вероятность того, что муниципальные власти запретят
эксплуатацию морально устаревших машин по соображениям безо-
пасности. Компания может капитально отремонтировать эти автобусы
с целью повышения их шансов на продление лицензии на перевозку
пассажиров. Наконец, компания рассматривает возможность продать
устаревшие автобусы сегодня и инвестировать средства в более со-
временные и комфортабельные машины, которые должны привлечь
более состоятельных пассажиров. Однако существует 30%-я вероят-
ность того, что муниципальные власти не разрешат повышать стои-
мость проезда, что при двухлетнем расчетном сроке эксплуатации
автобусов сделает проект экономически сомнительным. Таким обра-
зом, у компании существует три возможных инвестиционных альтер-
нативы:
1) не предпринимать ничего. Тогда, если местные органы власти
не примут никаких запретительных мер, 20 машин будут эксплуати-
39
роваться в течение года и принесут по 180 тыс. руб. расчетного чис-
того денежного дохода при нулевой ликвидационной стоимости. Если
же эксплуатация этого типа автобусов будет запрещена, то фирме
придется в середине года срочно продавать оставшиеся автобусы в
среднем по 60 тыс. руб. за штуку (после налогов). Реинвестирования
вырученных средств в этом случае не предусматривается;
2) капитально отремонтировать устаревшие автобусы так, чтобы
они соответствовали современным требованиям безопасности. В этом
случае придется потратить 24 тыс. руб. на ремонт одной машины се-
годня, однако с вероятностью 90 % лицензия на перевозку пассажи-
ров на этих машинах будет продлена до конца года. В противном слу-
чае компании придется продавать автобусы на приведенных выше ус-
ловиях;
3) продать морально устаревшие машины сегодня. В этом слу-
чае при текущих ценах можно выручить по 130 тыс. руб. за машину.
Приобретение 20 новых микроавтобусов обойдется в 380 тыс. руб. за
штуку. Годовой чистый денежный поток от эксплуатации этих машин
оценивается в 320 тыс. руб., однако лишь только в том случае, если
компании удастся обеспечить повышение стоимости проезда в сред-
нем на 30 %. В противном случае годовой чистый денежный поток
составит лишь 240 тыс. руб.
9. Пусть менеджер на предприятии должен решить, вкладывать
ли средства в изделие A или в изделие B. (Он не может сделать и то и
другое из-за финансовых ограничений.) Согласно имеющимся оцен-
кам, научно-исследовательские работы по изделию A требуют инве-
стиций в размере 2 млн долл., но шансы, что исследования будут ус-
пешными и удастся организовать производство изделия, равны всего
50 %. С вероятностью 30 % будет получена прибыль от продаж в раз-
мере 5 млн долл., с вероятностью 40 % – 10 млн долл., а с вероятно-
стью 30 % изделие не удастся продать. Научно-исследовательские ра-
боты по изделию B, с другой стороны, будут стоить также 2 млн долл.,
но вероятность их успеха равна 100 %. С вероятностью 80 % будет
получена прибыль от продаж в размере 5 млн долл., а с вероятностью
20 % изделие не удастся продать. Издержки производства и того и
другого изделия равны 1 млн долл. Если политика компании состоит
в максимизации ожидаемой прибыли (т. е. компания нейтральна к
риску), то какая стратегия будет наилучшей?
40
3. КОАЛИЦИОННЫЕ ИГРЫ
41
Из этой формулы видно, что число всевозможных коалиций
возрастает в зависимости от числа всех игроков в данной игре. Для
исследования этих игр необходимо учитывать все возможные коали-
ции, и поэтому трудности исследований возрастают с ростом N. Обра-
зовав коалицию, игроки действуют как один против остальных, и вы-
игрыш этой коалиции зависит от применяемых стратегий каждым из
игроков.
Определение 12. Функция v, ставящая в соответствие каждой
коалиции наибольший, уверенно получаемый его выигрыш v ( K ) , на-
зывается характеристической функцией игры (где K – подмножество
игроков).
Так, например, для бескоалиционной игры N игроков v ( K ) мо-
жет получиться, когда игроки из множества K оптимально действуют
как один игрок против остальных N \ K игроков, образующих другую
коалицию (второй игрок).
Определение 13. Характеристическая функция v называется про-
стой, если она принимает только два значения: 0 и 1.
Определение 14. Если характеристическая функция v простая,
то коалиции K, для которых v ( K ) = 1 , называются выигрывающими,
а коалиции K, для которых v ( K ) = 0 , – проигрывающими.
Определение 15. Если в простой характеристической функции v
выигрывающими являются те и только те коалиции, которые содер-
жат фиксированную непустую коалицию R, то характеристическая
функция v , обозначаемая в этом случае через vR , называется про-
стейшей.
Содержательно простые характеристические функции возни-
кают, например, в условиях голосования, когда коалиция является
выигрывающей, если она собирает более половины голосов (простое
большинство) или не менее двух третей голосов (квалифицированное
большинство).
Простейшая характеристическая функция появляется, когда в
голосующем коллективе имеется некоторое «ядро», голосующее с со-
блюдением правила вето, а голоса остальных участников оказываются
несущественными.
Обозначим через vG характеристическую функцию бескоалици-
онной игры. Эта функция обладает следующими свойствами:
1) персональностью:
vG ( ∅ ) = 0 ,
т. е. коалиция, не содержащая ни одного игрока, ничего не выигрывает;
42
2) супераддитивностью:
vG ( K ∪ L ) ≥ vG ( K ) + vG ( L ) , если K , L ⊂ N , K ∪ L ≠ ∅ ,
т. е. общий выигрыш коалиции не меньше суммарного выигрыша
всех участников коалиции;
3) дополнительностью:
vG ( K ) + v ( N \ K ) = v ( N ) ,
т. е. для бескоалиционной игры с постоянной суммой сумма выигры-
шей коалиции и остальных игроков должна равняться общей сумме
выигрышей всех игроков.
43
т. е. сумма выигрышей игроков должна соответствовать возможно-
стям (если сумма выигрышей всех игроков меньше, чем v ( N ) , то иг-
рокам незачем вступать в коалицию; если же потребовать, чтобы
сумма выигрышей была больше, чем v ( N ) , то это значит, что игроки
должны делить между собой сумму большую, чем у них есть).
Используя вышесказанное, сформулируем понятие дележа в
коалиционной игре.
Определение 16. Вектор x = ( x1 , ..., xn ) , удовлетворяющий усло-
виям индивидуальной и коллективной рациональности, называется
дележом в условиях характеристической функции v .
Определение 17. Система { N , v} , состоящая из множества игро-
ков, характеристической функции над этим множеством и множест-
вом дележей, удовлетворяющих соотношениям индивидуальной и
коллективной рациональности в условиях характеристической функ-
ции, называется классической коалиционной игрой.
Из этих определений непосредственно вытекает следующее.
Определение 18. Дележом в классической коалиционной игре
{ N , v} , называется вектор x = ( x1 , ..., xn ) , для которого
xi = v ( i ) + αi , ( i ∈ N ) ,
причем
αi ≥ 0 , ( i ∈ N ) ,
а
−1 −1
⎡ ⎤ ⎡ ⎤
αi = ⎢v ( N ) − ∑ v ( i ) ⎥ , ci = −v ( i ) ⎢v ( N ) − ∑ v ( i ) ⎥ .
⎣ i∈N ⎦ ⎣ i∈N ⎦
В бескоалиционных играх исход формируется в результате дей-
ствий тех самых игроков, которые в этой ситуации получают свои
выигрыши. Исходом в коалиционной игре является дележ, возни-
кающий не как следствие действия игроков, а как результат их согла-
шений. Поэтому в коалиционных играх сравниваются не ситуации,
как это имеет место в бескоалиционных играх, а дележи, и сравнение
это носит более сложный характер.
Определение 19. Коалиционные игры считаются существенны-
ми, если для любых коалиций K и L в условии супераддитивности
выполняется строгое неравенство
44
v ( K ) + v ( L) < v ( K ∪ L) .
Если же в условии супераддитивности выполняется равенство
v ( K ) + v ( L) = v ( K ∪ L),
то такие игры называются несущественными.
Справедливы следующие свойства существенности игр:
1) для того чтобы характеристическая функция была аддитивной
(коалиционная игра – несущественной), необходимо и достаточно
выполнение следующего равенства:
∑ v(i) = v( N ) ;
i∈N
45
Справедливы следующие свойства для стратегически эквива-
лентных игр.
1. Рефлексивность, т. е. каждая характеристическая функция эк-
вивалентна себе: v ~ v .
2. Симметрия, т. е. если v ~ v1 , то v1 ~ v .
3. Транзитивность, т. е. если v ~ v1 и v1 ~ v2 , то v ~ v2 .
Из свойств рефлексивности, симметрии и транзитивности выте-
кает, что множество всех характеристических функций единственным
образом распадается на попарно непересекающиеся классы, которые
называются классами стратегической эквивалентности.
Отношение стратегической эквивалентности игр и их характе-
ристических функций переносится на отдельные дележи.
Теорема 4. Пусть v ~ v1 и x = ( x1 , ..., xn ) – дележи в условиях ха-
(
рактеристической функции v ; рассмотрим вектор x1 = x11 , ..., x1n , где )
xi1 = kxi + Ci ; для него выполняется условие индивидуальной рацио-
нальности
xi1 = kxi + Ci ≥ kv ( K ) + Ci = v1 ( i ) ,
и условие коллективной рациональности
∑ xi1 = ∑ ( kxi )
+ Ci = k ∑ xi + ∑ Ci = kv ( K ) + ∑ Ci = v1 ( N ) .
i∈N i∈N i∈N i∈N i∈N
46
Между (0,1)-редуцированной формой и ее коалиционной игрой
существует взаимосвязь.
Теорема 5. Каждая существенная коалиционная игра стратеги-
чески эквивалентна одной и только одной игре в (0,1)-редуцирован-
ной форме.
Сформулированная теорема показывает, что мы можем выбрать
игру в (0,1)-редуцированной форме для представления любого класса
эквивалентности игр. Удобство этого выбора состоит в том, что в та-
кой форме значение v(K ) непосредственно демонстрирует нам силу
коалиции S (т. е. ту дополнительную прибыль, которую получают
члены коалиции, образовав ее), а все дележи являются вероятностны-
ми векторами.
В игре в (0,1)-редуцированной форме дележом является любой
вектор x = ( x1 , ..., xn ) , для которого
xi ≥ 0 , ∀ i ∈ N , причем ∑ xi = 1.
i∈N
47
3.3. ХАРАКТЕРИСТИКИ ФУНКЦИЙ С МАЛЫМ ЧИСЛОМ ИГРОКОВ
48
v (1) = v ( 2 ) = v ( 3) = v ( 4 ) = 0 , v (1, 2, 3, 4 ) = 1.
Исходя из свойства дополнительности, получаем
v (1, 2, 3) = v (1, 2, 3, 4 ) − v ( 4 ) = 1 − 0 = 1 ,
v (1, 2, 4 ) = v (1, 2, 3, 4 ) − v ( 3) = 1 − 0 = 1 ,
v (1, 3, 4 ) = v (1, 2, 3, 4 ) − v ( 2 ) = 1 − 0 = 1 ,
v ( 2, 3, 4 ) = v (1, 2, 3, 4 ) − v (1) = 1 − 0 = 1 .
Теперь необходимо определить значения характеристической
функции на коалициях двух игроков. Всего таких коалиций шесть:
(1, 2), (1, 3), (1, 4), (2, 3), (2, 4), (3, 4).
Характеристическая функция на этих коалициях, согласно свой-
ству дополнительности, удовлетворяет только следующим соотноше-
ниям:
v (1, 4 ) = 1 − v ( 2, 3) ,
v (1, 3) = 1 − v ( 2, 4 ) ,
v (1, 2 ) = 1 − v ( 3, 4 ) .
Так как значений неизвестных шесть, а соотношений только
три, то значения из шести могут быть выбраны произвольно. Обозна-
чим эти произвольные значения через x1 , x2 , x3 , т. е.
v (1, 4 ) = x1 , v ( 2, 4 ) = x2 , v ( 3, 4 ) = x3 .
Тогда
v ( 2, 3) = 1 − x1 , v (1, 3) = 1 − x2 , v (1, 2 ) = 1 − x3 .
Кроме того, должно быть
0 ≤ x1 , x2 , x3 ≤ 1,
так как значение характеристической функции на коалиции из двух
игроков не может быть меньше, чем значение характеристической
функции для одного из этих игроков (равное нулю для одного игро-
ка), и не может быть больше, чем значение характеристической функ-
ции для коалиции из трех игроков (равное единице для трех игроков).
Геометрически ( x1 , x2 , x3 ) можно изобразить как точку единичного
куба, т. е. каждому классу стратегической эквивалентности игр четы-
рех игроков будет соответствовать точка единичного куба.
49
Итак, множество классов стратегической эквивалентности су-
щественных игр четырех игроков бесконечно и зависит от трех про-
извольных параметров.
4. Игры для более чем четырех игроков. Такие игры имеют боль-
шее разнообразие классов стратегической эквивалентности сущест-
венных игр. Так, размерность множества классов игр п игроков равна
2n−1 − n − 1 , т. е. имеется 2n−1 − n − 1 произвольных параметров.
Далее рассмотрим коалиционные игры с ненулевой суммой.
1. Для игр двух игроков множество всех игроков содержит два
элемента, т. е. N = {1, 2} , условия редуцированности дают
v ( ∅ ) = v (1) = v ( 2 ) = v (1, 2 ) = 1 .
Таким образом, существенные коалиционные игры двух игроков
с ненулевой суммой составляют один класс стратегической эквива-
лентности.
2. Для игр трех игроков множество всех игроков содержит три
элемента, т. е. N = {1, 2, 3} , условия редуцированности дают
v ( ∅ ) = v (1) = v ( 2 ) = v ( 3) = 0, v (1, 2, 3) = 1.
Значения характеристической функции на множествах коалиций
двух игроков произвольные (здесь нет условия дополнительности):
v (1, 2 ) = C1 , v (1, 3) = C2 , v ( 2, 3) = C3 ,
но удовлетворяющие условию
0 ≤ C1 , C2 , C3 ≤ 1.
Таким образом, классы стратегической эквивалентности общих
коалиционных игр трех игроков могут быть поставлены в соответст-
вие точкам трехмерного единичного куба, подобно тому как это по-
лучилось для игр четырех игроков с нулевой суммой. Для игр более
трех игроков с ненулевой суммой рассмотрения аналогичны.
50
3. Какие коалиционные игры называются существенными?
4. Какое количество решений возможно в коалиционной игре
трех лиц с ненулевой суммой в (0,1)-редуцированной форме?
51
Справедлива следующая теорема.
Теорема 6. Если v и v1 – две стратегически эквивалентные ха-
рактеристические функции, причем дележам х и у соответствуют
дележи x1 и y1 , то из x > y следует x1 > y1 .
Очевидно, все явления, описываемые в терминах доминирова-
ния дележей, относятся к классам стратегической эквивалентности,
поэтому достаточно изучать эти классы (а не сами игры) для сущест-
венных игр по их (0,1)-редуцированной форме, а для несущественных
игр – по нулевым играм.
В любой несущественной игре имеется только один дележ, по-
этому доминирования в ней нет.
Рассмотрим доминирование дележей в существенной игре на
следующем примере.
Пример 12. Пусть имеется (0,1)-редуцированная форма сущест-
венной игры трех игроков с постоянной суммой (равной 1). Посколь-
ку доминирование невозможно ни по одной из одноэлементных коа-
лиций 1, 2, 3, а также по коалиции, состоящей из всех трех игроков,
то доминирование возможно только по одной из двухэлементных ко-
алиций {1, 2}, {1, 3}, {2, 3}.
Решение. Для наглядности доминирования дележей введем по-
нятие барицентрических координат. Осями координат служат три оси
x1 , x2 , x3 , составляющие между собой одинаковые углы 60о, ось x3 на-
ходится на расстоянии единицы от точки пересечения осей x1 и x2
(рис. 3.1), координаты точки x = ( x1 , … , xn ) – соответственно расстоя-
ния от этой точки до осей x1 , x2 , x3 , взятые с такими знаками, как ука-
зано на рис. 3.1 (например, для точки х на рис. 3.1 x1 < 0,
x2 > 0, x3 > 0 ).
В барицентрической системе координат всегда выполняется ра-
венство
x1 + x2 + x3 = 1,
т. е. в плоскости всегда имеется точка с координатами x1 , x2 , x3 , удо-
влетворяющими равенству. Поэтому барицентрическая система коор-
динат автоматически удовлетворяет одному из условий, определяю-
щих исход игры трех игроков. С другой стороны, поскольку игра
в (0,1)-редуцированной форме, то точка х должна находиться в за-
52
штрихованном треугольнике (рис. 3.2). Дележи x1 , x2 , x3 должны
удовлетворять неравенствам
x1 + x2 ≤ v (1, 2 ) , x1 + x3 ≤ v (1, 3) , x2 + x3 ≤ v ( 2, 3) .
x1 x2
x2
х = ( x1 x2 x3 )
x2 < 0
x1
x2 > 0 x3
x1 < 0
x1 > 0
60° 60° x3 < 0 x3
x3 < 0
Рис. 3.1. Барицентрические координаты для примера 12
x1 = 1 x2 = 1
x3 = 0
53
Дележ x = ( x1 , … , xn ) доминирует над дележом y = ( y1 , … , yn ) :
по коалиции {1, 2}, если x1 > y1 , x2 > y2 ;
по коалиции {1, 3}, если x1 > y1 , x3 > y3 ;
по коалиции {2, 3}, если x2 > y2 , x3 > y3 ,
т. е. если дележ у находится в одном из заштрихованных параллело-
граммов (за исключением трех граничных прямых, проходящих через
точку х) на рис. 3.3, то дележ х доминирует над дележом у, а всякая
точка, находящаяся в незаштрихованных треугольниках, является
предпочтительнее исхода х.
x2 = –1
x3 = –1
x1 = 0
x3 = 1 − C3
x1 = 1 − C1 x2 = 1 − C2
Рис. 3.4. Области доминирования дележей х
над у для примера 13 (вариант 1)
x1 = 1 − C1 x2 = 1 − C2
•x
x3 = 1 − C3
55
x2 = 1 − C2 x1 = 1 − C1
x3 = 1 − C3
•х
3.5. С-ЯДРО
56
v( K ) ≤ ∑ xi .
i∈ K
ξ3 = 1 − C 3
1 2
ξ2 = 1 − C 2 ξ1 = 1 − C 1
57
Из последних неравенств путем суммирования получим:
x1 + x2 + x3 ≤ 3 − ( C1 + C2 + C3 )
или, учитывая, что x1 + x2 + x3 = 1,
C1 + C2 + C3 ≤ 2 .
Данное неравенство является необходимым условием существо-
вания непустого С-ядра. С другой стороны, если оно выполняется, то
можно взять такие неотрицательные ξ1 , ξ2 , ξ3 , чтобы
3
∑ (Ci + εi ) = 2 ,
i =1
и положить
xi = 1 − Ci − ξi , i = 1, 3 ,
т. е. такой дележ x = ( x1 , x2 , x3 ) принадлежит С-ядру.
Геометрически непустое С-ядро является заштрихованным тре-
угольником (см. рис. 3.7) со сторонами, выраженными уравнениями
ξi = 1 − Ci , при условии, что выполняется соотношение
ξ1 + ξ 2 + ξ3 = 1,
и решения любой пары уравнений являются неотрицательными. Так,
например, рассмотрим систему
⎧ ξ1 = 1 − C1 ,
⎨
⎩ ξ 2 = 1 − C2 .
Поскольку 0 ≤ C1 ≤ 1 , 0 ≤ C2 ≤ 1 , то ξ1 , ξ2 ≥ 0 . Отсюда получаем
ξ3 = 1 − ξ1 − ξ2 = 1 − (1 − C1 ) − (1 − C2 ) = C1 + C2 − 1.
Для выполнения условия ξ3 ≥ 0 необходимо, чтобы
C1 + C2 − 1 ≥ 0
или
C1 + C2 ≥ 1 .
В этом случае С-ядро представлено на рис. 3.7 в виде заштри-
хованного треугольника внутри основного треугольника. Аналогич-
но рассматриваются остальные возможные варианты сочетаний
неравенств. Например, если C1 + C2 < 1 , то С-ядро имеет вид за-
58
штрихованного четырехугольника внутри основного треугольника
(рис. 3.8).
ξ2 = 1 − C 2
ξ3 = 1 − C 3
1 2
ξ1 = 1 − C 1
3
ξ1 = 1 − C 1 ξ2 = 1 − C 2
ξ3 = 1 − C 3
1 2
Рис. 3.9. Шестигранник решений
59
т. е. при этих обстоятельствах нет оснований отклоняться от такого
дележа. Однако найти дележ, который не только не доминировался
бы какими-либо другими дележами, но сам доминировал бы над лю-
бым другим дележом, не удается. Поэтому решение отыскивают на
пути расширения класса дележей. И это расширение состоит в том,
что решением игры должен быть не один дележ, а некоторое их мно-
жество.
60
клонение от допустимого поведения, найдется такая коалиция, кото-
рая будет стремиться к восстановлению нормы.
Теорема 8. Если в коалиционной игре существует С-ядро и
Н–М-решение R, то C ⊂ R .
Основное свойство Н–М-решений коалиционной игры заклю-
чается в том, что она не может состоять только из одного дележа, так
как в этом случае характеристическая функция игры несущественная.
Недостатки Н–М-решения состоят в следующем:
1) известны примеры коалиционных игр, которые не имеют
Н–М-решений. Более того, в настоящее время неизвестны какие-либо
критерии, позволяющие судить о наличии у коалиционных игр
Н–М-решений. Тем самым заложенный в Н–М-решении принцип оп-
тимальности не является универсально реализуемым и область его
реализуемости пока остается неопределенной;
2) коалиционные игры, если не имеют Н–М-решения, то, как
правило, более одного. Поэтому принцип оптимальности, приводя-
щий к Н–М-решению, не является полным: он, вообще говоря, не в
состоянии указать игрокам единственной системы норм распределе-
ния выигрыша;
3) решения существенных коалиционных игр состоят более чем
из одного дележа. Таким образом, даже выбор какого-либо конкрет-
ного Н–М-решения еще не определяет выигрыша каждого из игроков;
4) понятие Н–М-решения только в очень малой степени отра-
жает черты справедливости.
Перечисленные недостатки показывают действительное поло-
жение дел: большинство экономических и социальных проблем до-
пускает множественные решения и эти решения не всегда поддаются
непосредственному сравнению по их предпочтительности.
Перечисленные недостатки Н–М-решения коалиционных игр
способствуют поискам новых подходов. Одним из таких подходов яв-
ляется подход Шепли, суть которого в том, что он строится на осно-
вании аксиом, отражающих справедливость дележей.
Определение 26. Носителем игры с характеристической функ-
цией v называется такая коалиция Т, что
v(S ) = v(S ∩T )
для любой коалиции S.
Смысл носителя Т состоит в том, что любой игрок, не принад-
лежащий Т, является нейтральным, он не может ничего внести в коа-
лицию и ему ничего не следует выделять из общих средств.
61
Рассмотрим решение на примере коалиционной игры.
Пример 14. Рассмотрим пример возможных С-ядер для коали-
ционной игры трех лиц с неэффективностью (0; 1)-редуцированной
формой игры.
Решение. Необходимое и достаточное условие абсолютной не-
эффективности для (0; 1)-редуцированной формы игры запишется
следующим образом:
x (1, 2 ) = x1 + x2 ≥ v (1, 2 ) ,
x (1, 3) = x1 + x3 ≥ v (1, 3) ,
x ( 2, 3) = x2 + x3 ≥ v ( 2, 3) .
Здесь не рассматриваются пустая и одноэлементная коалиции и
все множество игроков Т. Множество дележей в (0,1)-игре есть мно-
жество точек фундаментального симплекса x1 + x2 + x3 = 1;
x1 , x2 , x3 > 0 (рис. 3.10).
Линии I, II, III – это линии пересечения плоскости симплекса с
плоскостями xi = v (T \ {i} ) , i = 1, 3 .
X3 I
III
1
x1 + x2 = v(1; 2)
X1
0 1
x1 + x3 = v(1; 3)
II
x3 > 0
x2 + x3 = v(2; 3)
X2
Рис. 3.10. Решение примера 14
62
Пример 15. Характеристическая функция имеет вид:
v (1) = 40, v ( 2 ) = 30, v ( 3) = 0, v (1, 2 ) = 80,
v (1, 3) = 60, v ( 2, 3) = 50, v (1, 2, 3) = 100 .
Найдите C-ядро и покажите многогранник решений.
Решение. Представим вначале данную характеристическую
функцию в (0,1)-редуцированной форме. Используя
−1 −1
⎡ ⎤ ⎡ ⎤
αi = ⎢v ( N ) − ∑ v ( i ) ⎥ , ci = −v ( i ) ⎢ v ( N ) − ∑ v ( i ) ⎥ , получим
⎣ i∈N ⎦ ⎣ i∈N ⎦
1 1 1
αi = = = ,
v (1, 2, 3) − v (1) − v ( 2 ) − v ( 3) 100 − 40 − 30 − 0 30
4
c1 = − , c2 = −1 , c3 = 0 .
3
Тогда новая характеристическая функция примет вид
v′ (1) = 0, v′ ( 2 ) = 0, v′ ( 3) = 0, v (1, 2, 3) = 1,
8 4 1 6 4 2 5 2
v′ (1, 3) = − − 1 = , v′ (1, 3) = − = , v′ ( 2, 3) = − 1 = .
3 3 3 3 3 3 3 3
С-ядро расположено на симплексе x1 + x2 + x3 = 1, x1 , x2 , x3 > 0 , и опре-
деляется следующей системой:
⎧ 1
⎪ x1 + x2 ≥ ,
3
⎪
⎪ 2
⎨ x1 + x3 ≥ ,
⎪ 3
⎪ 2
⎪ x2 + x 3 ≥ .
⎩ 3
Поскольку x1 + x2 + x3 = 1, неравенства можно переписать в виде
2 1 1
x3 ≤ , x2 ≤ , x1 ≤ .
3 3 3
Заштрихованная область (рис. 3.11) представляет собой С-ядро.
Любой элемент С-ядра не доминируется никаким другим дележом.
В качестве возможного решения можно выбрать центр тяжести
⎛ 2 2 5⎞
С-ядра: x = ⎜ ; ; ⎟ .
⎝9 9 9⎠
63
x3
x1
1
1
x2
66
т. е. ради «справедливости» необходимо считать, что при участии иг-
роков в двух играх их выигрыши в отдельных играх должны склады-
ваться.
Определение 27. Вектором цен (вектором Шепли) игры с харак-
теристической функцией v называется п-мерный вектор
ϕ(v) = ( ϕ1 (v), ϕ2 (v), … , ϕn (v) ) ,
удовлетворяющий аксиомам Шепли.
Существование вектора Шепли вытекает из следующей теоремы.
Теорема 9. Существует единственная функция ϕ , определенная
для всех игр и удовлетворяющая аксиомам Шепли.
Определение 28. Характеристическая функция ωS (T ) , опреде-
ленная для любой коалиции S, называется простейшей, если
⎧1, при S ⊂ T ,
ωS (T ) = ⎨
⎩0, при S ⊄ T .
Содержательно простейшая характеристическая функция опи-
сывает такое положение дел, при котором множество игроков S выиг-
рывает единицу тогда и только тогда, когда оно содержит некоторую
основную минимальную выигрывающую коалицию S.
Можно доказать, что компоненты вектора Шепли в явном виде
запишутся следующим образом:
(t − 1)! (n − t )
ϕi (v) = ∑ ϕi (T ) [ v(T ) − v(T \ {i}) ] = ∑ [v(T ) − v(T \ {i})] ,
T⊂ N T⊂ N n !
i∈ T i∈ T
67
Пример 16. Рассматривается корпорация из четырех акционе-
ров, имеющих акции соответственно в следующих размерах:
v (1) = 10, v ( 2 ) = 20, v ( 3) = 30, v ( 4 ) = 40.
Найдите «справедливость» Шепли.
Решение. Любое решение утверждается акционерами, имеющи-
ми в сумме большинство акций. Это решение считается выигрышем,
равным 1. Поэтому данная ситуация может рассматриваться как про-
стая игра четырех игроков, в которой выигрывающими коалициями
являются следующие:
{2, 4}, {3, 4}, {1, 2, 3}, {1, 2, 4}, {2, 3, 4}, {1, 3, 4}, {1, 2, 3, 4}.
Найдем вектор Шепли для этой игры.
При нахождении ϕ1 необходимо учитывать, что имеется только
одна коалиция T = {1; 2; 3} , которая выигрывает, а коалиция
T \ {1} = {2; 3} не выигрывает. В коалиции Т имеется t = 3 игрока, по-
этому
(t − 1)! (n − t )! 2! ⋅ 1! 1
ϕ1 = = = .
n! 4! 12
Далее определяем все выигрывающие коалиции, но не выигры-
вающие без второго игрока: {2, 4}, {1, 2, 3}, {2, 3, 4}. Поэтому
1 1 1 1
ϕ2 = + + = .
12 12 12 4
1 5
Аналогично получаем, что ϕ3 = , ϕ4 = .
4 12
В результате получаем, что вектор Шепли равен
⎛1 1 1 5⎞
ϕ = ⎜ ; ; ; ⎟ . При этом, если считать, что вес голоса акционера
⎝ 12 4 4 12 ⎠
пропорционален количеству имеющихся у него акций, то получим
следующий вектор голосования:
⎛1 2 3 4⎞
⎜ ; ; ; ⎟,
⎝ 10 10 10 10 ⎠
который, очевидно, отличается от вектора Шепли.
Анализ игры показывает, что компоненты второго и третьего
игроков равны, хотя третий игрок имеет больше акций. Это получает-
ся вследствие того, что возможности образования коалиций у второго
и третьего игрока одинаковые. Для первого и четвертого игроков си-
туация естественная, отвечающая силе их капитала.
68
Вопросы и задания для самоконтроля
70
4. РАСЧЕТНОЕ ЗАДАНИЕ
Задание
Задание
1. Формализуйте поставленную задачу, согласно выбранному
вами варианту (табл. 4.1).
2. Постройте дерево решений. Определите, какова ожидаемая
денежная оценка наилучшего решения, какова ожидаемая ценность
дополнительной информации.
3. Выясните, какое решение о проекте выберет руководитель
химической компании.
Таблица 4.1
Номер Параметры задачи
вариан- t C1 C2 C3 C4 C5 C6 C7 p1 p2 q1 q2 N1 N2 N3
та
1 5 11 9 7 12 6 15 10 0,7 0,3 0,5 0,5 26 16 7
2 4 16 9 5 3 7 20 15 0,9 0,1 0,45 0,55 17 6 5
3 7 11 9 6 8 16 21 10 0,55 0,45 0,6 0,4 16 12 6
4 6 20 15 15 9 18 13 24 0,8 0,2 0,55 0,45 18 12 15
5 9 12 10 7 14 9 15 11 0,6 0,4 0,65 0,35 19 18 7
6 10 18 13 18 14 10 25 12 0,8 0,2 0,45 0,55 10 9 18
7 8 11 7 15 10 16 12 9 0,7 0,3 0,5 0,5 26 18 17
8 7 22 20 15 11 17 23 9 0,9 0,1 0,65 0,35 17 13 9
9 10 17 13 12 15 9 21 8 0,6 0,4 0,55 0,45 19 14 18
73
Продолжение таблицы 4.1
74
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
Основной
Дополнительный
7. Волошин, Г. Я. Методы оптимизации в экономике : учеб. по-
собие / Г. Я. Волошин ; Моск. гос. ун-т сервиса. – М. : Дело и сервис,
2004. – 320 с.
8. Гейл, Д. Теория линейных экономических моделей : учеб.
пособие / Д. Гейл ; пер. с англ. под ред. Н. Н. Воробьева. – М. : Изд-во
иностр. лит., 1963. – 418 с.
9. Конюховский, П. В. Математические методы исследования
операций в экономике / П. В. Конюховский. – СПб. : Питер, 2000. –
208 с.
10. Маркин, Ю. П. Математические методы и модели в экономи-
ке : учеб. пособие / Ю. П. Маркин. – М. : Высш. шк., 2007. – 422 с.
11. Мулен, Э. Теория игр с примерами из математической эко-
номики : пер. с франц. / Э. Мулен. – М. : Мир, 1985. – 200 с.
75
Учебно-практическое издание
ПРИКЛАДНАЯ
ТЕОРИЯ ИГР
Практикум
В 2 частях
Часть 2
Редактор Т. Е. Ильющенко
Оригинал-макет и верстка Е. С. Завьяловой
Санитарно-эпидемиологическое заключение
№ 24.49.04.953. П.000032.01.03. от 29.01.2008 г.
76