КРЕМЛЕВ
ОСНОВНЫЕ ПОНЯТИЯ
ТЕОРИИ ИГР
Учебное пособие
Министерство образования и науки Российской Федерации
Уральский федеральный университет
имени первого Президента России Б. Н. Ельцина
А. Г. Кремлев
Основные понятия
теории игр
Рекомендовано
методическим советом УрФУ
в качестве учебного пособия для студентов,
обучающихся по программе бакалавриата
по направлению подготовки 080100 — Экономика
Екатеринбург
Издательство Уральского университета
2016
УДК 519.83(075.8)
ББК 22.18я73
К79
Рецензенты:
А. Н. Красовский, д‑р физ.-мат. наук, проф., завкафедрой «Инфор‑
мационные технологии и математическое моделирование» Ураль‑
ского государственного аграрного университета;
С. С. Титов, д‑р физ.-мат. наук, проф., завкафедрой прикладной
математики и технической графики УралГАХА
Кремлев, А. Г.
К79 Основные понятия теории игр : учебное пособие / А. Г. Крем‑
лев. — Екатеринбург : Изд-во Урал. ун-та, 2016. — 144 с.
ISBN 978-5-7996-1940-4
Предисловие......................................................................5
3. Матричные игры..........................................................47
Определение матричной игры....................................47
Ситуации равновесия в матричной игре....................49
Смешанные стратегии.................................................54
Ситуации равновесия в смешанных стратегиях.........56
Свойства значения игры.............................................60
Контрольные вопросы и задания................................62
3
Оглавление
4
Предисловие
5
Предисловие
6
Предисловие
7
Предисловие
8
Предисловие
9
Предисловие
10
1. Общее представление о теории игр
П
редметом теории игр является математический ана‑
лиз конфликтных ситуаций, формализованное опи‑
сание которых представлено в виде математической
модели, определяющей некоторую игру.
Конфликтная ситуация — это ситуация, в которой сталки‑
ваются интересы двух (и более) противодействующих сторон,
преследующих различные цели (несовпадающие полностью или
частично). Эти конфликтующие стороны стремятся предпри‑
нять такие действия (выбрать такие решения), чтобы достичь
наибольшего для себя в данных условиях успеха. Таким обра‑
зом, если цели сторон противоположны, то максимизация успе‑
ха (выигрыша) одной из сторон будет означать максимизацию
проигрыша другой стороны. А если сторон несколько (более
двух), то это ведет к уменьшению их возможных выигрышей.
Поэтому конфликтующие стороны будут осуществлять поиск
наиболее приемлемых для себя решений (причем эта приемле‑
мость должна быть для каждой из сторон).
Если каждая из сторон (в результате собственной оценки
текущей ситуации) примет какое-то определенное решение,
то последующая реализация принятых решений приведет к кон‑
кретному результату — распределению выигрышей сторон. Ре‑
11
1. Общее представление о теории игр
1
Воробьев Н. Н. Философская энциклопедия. Т. 5. М., 1970. С. 208.
12
Неопределенность в игровых ситуациях
13
1. Общее представление о теории игр
14
Применение теории игр
15
1. Общее представление о теории игр
Классификация игр
16
Примеры классических игр двух лиц
17
1. Общее представление о теории игр
Игрок Б
Стратегии игроков
Хранить молчание Давать показания
Хранить молчание –0,5; –0,5 –10; 0
Игрок А
18
Примеры классических игр двух лиц
19
1. Общее представление о теории игр
Жена
Стратегии игроков
Футбол Театр
Футбол 4; 1 0; 0
Муж
Театр 0; 0 1; 4
20
Примеры классических игр двух лиц
21
1. Общее представление о теории игр
= 5xy - x - y + 1,
M x 2 = x Ч (1 Ч y + 0 Ч (1 - y )) + (1 - x ) ( 0 Ч y + 4 Ч (1 - y )) =
= 5xy - 4 x - 4 y + 4.
Вычислим
M x1 х + у =1
= 5х (1 - х ) ® max .
0 Ј x Ј1
f(x)
f(x) = 5x(1 – x)
5/4
x
0 1/2 1
Рис. 1.1. График функции f (x) = 5x (1 — x)
22
Примеры классических игр двух лиц
Игрок 2
Стратегии игроков
Орел Решка
Орел –1, 1 1, —1
Игрок 1
Решка 1, —1 –1, 1
23
1. Общее представление о теории игр
M x1 = - xy + x (1 - y ) + (1 - x ) y - (1 - x )(1 - y ) =
= -1 + 2( x + y ) - 4 xy = (2 x - 1)(1 - 2 y ),
M x 2 = -M x1.
м2 x - 1 при 0 Ј x < 1 / 2;
п
= н1 - 2 x при 1 / 2 < x Ј 1;
п0, при x = 1 / 2.
о
Вид функции f ( x ) = min M x1 x,y приведен на рис. 1.2.
0 Ј y Ј1
24
Контрольные вопросы и задания
f(x)
1/2 1
x
0
f ( x) = min Mξ1 x, y
0 Ј y Ј1
–1
25
1. Общее представление о теории игр
26
Контрольные вопросы и задания
27
2. Формализация бескоалиционных игр
Р
ассмотрим формализованное представление бескоа‑
лиционной игры (в нормальной форме), в которой це‑
лью каждого игрока является оптимизация индивиду‑
ального выигрыша (причем игроки не могут координировать
совместно свои стратегии).
Определение. Бескоалиционной игрой в нормальной (или
стратегической) форме называется тройка Г = {I, S, H}, где I =
= {1, 2, …, n} — множество всех игроков, которых различаем
по номерам; Si — множество стратегий, доступных игроку i О I ;
отдельную стратегию игрока i обозначим si О Si . Иногда для боль‑
шей определенности будем вводить дополнительные индексы:
29
2. Формализация бескоалиционных игр
30
Доминирование стратегий
Доминирование стратегий
31
2. Формализация бескоалиционных игр
32
Доминирование стратегий
s2(1) s2(3)
ж (4, 3) (6, 2) ц s1(1)
з ч .
H=з ч
з (3, 0) (2, 8) чш s1(3)
и
Шаг 3. Удаляется стратегия s1(3), так как она строго домини‑
руется стратегией s1(1), т. е. получим
s2(1) s2(3)
ж (4, 3) (6, 2) ц s1(1)
з ч .
H =з ч
з ч
и ш
Шаг 4. Удаляется стратегия s2 , так как она строго домини‑
( 3)
34
Оптимальные по Парето ситуации
H i (s ) і H i (s 0 ) для " i О I ,
35
2. Формализация бескоалиционных игр
l Т — транспонированный вектор l.
Данное свойство вполне согласуется с интерпретацией оп‑
тимальности по Парето через область прямого угла.
Однако для разных ситуаций, оптимальных по Парето,
но не сравниваемых по области прямого угла (на рис. 2.1 ситуа‑
ции s ў, s ўўО S p ), используют дополнительные условия эффектив‑
ности стратегий (как решений). Например, условие «взвешенной
эффективности» для оптимальных по Парето ситуаций sО S p:
l T H (s ) ® max
sОS p
p е
max H i ( s ) = е H i ( s 0 ).
sОS
i =1 i =1
36
Оптимальные по Парето ситуации
8
7
0 1 2 3 4 5 6 7 8 9
Рис. 2.2. Графическая иллюстрация оптимальных по Парето ситуаций
37
2. Формализация бескоалиционных игр
38
Стратегическая эквивалентность игр
H iў(s ) = kH iўў(s ) + ci .
Отсюда получим:
H iў(s ) = (1 / k )H i (s ) - (ci / k ) = k ўH i (s ) + ciў,
39
2. Формализация бескоалиционных игр
40
Стратегическая эквивалентность игр
H i (s * s ) = kH iў(s * s ) + ci . (2.6)
i i
41
2. Формализация бескоалиционных игр
Игрок 1 Игрок 2
Наилучшие Максимальный Наилучшие Максимальный
ответы выигрыш ответы выигрыш
u(v1) = u1 = u2 4 v(u1) = v3 7
u(v2) = u1 6 v(u2) = v1 6
u(v3) = u3 7 v(u3) = v2 8
43
2. Формализация бескоалиционных игр
44
Контрольные вопросы и задания
46
3. Матричные игры
О
пределение. Антагонистические игры, в которых каж‑
дый игрок имеет конечное множество стратегий, на‑
зываются матричными играми.
Итак, матричная игра — это конечная игра двух лиц с нуле‑
вой суммой (т. е. сумма выигрышей игроков в каждой ситуа‑
ции равна нулю). Такая игра полностью определяется матрицей
ж h11 h12 h1n ц
з ч
з h21 h22 h2n ч
H =з ,
ч
з ч
зh ч
и m1 hm 2 hmn ш
в которой строки соответствуют чистым стратегиям игрока 1,
столбцы — чистым стратегиям игрока 2, на их пересечении сто‑
ит выигрыш игрока 1 в соответствующей ситуации, т. е. ситуа‑
ции s = (i, j) соответствует выигрыш H 1 (s ) є H (i, j ) = h . Тогда
ij
выигрыш игрока 2 равен H 2 (s ) = -H 1 (s ) для всех s О S .
Здесь игрок 1 имеет m стратегий, игрок 2 имеет n стратегий.
Такая игра называется m×n‑игрой. Матрица H называется ма-
трицей игры или матрицей выигрышей (платежной матрицей).
Цель игрока 1 — максимизировать свой возможный выи‑
грыш, при этом увеличение его выигрыша ведет к уменьшению
47
3. Матричные игры
причем для второго игрока выигрыш равен –h, где h — выи‑
грыш игрока 1.
Таким образом, оптимальная стратегия игрока 2 будет состо‑
ять в выборе стратегии j*, для которой выполняется:
-h i * j * = max(- h i * j ) = max(- max hi j ) = - min max hij ,
j
j j i i
отсюда получим:
hi * j * = min max hij .
j i
48
Ситуации равновесия в матричной игре
49
3. Матричные игры
hij * Ј hi * j * Ј hi * j (3.1)
для любых i = 1, 2, …, m, j = 1, 2, …, n.
Пара (i*, j*), удовлетворяющая неравенству (3.1), называется
седловой точкой матрицы H. В седловой точке элемент матрицы
hi * j * является одновременно минимумом в своей строке и мак‑
симумом в своем столбце. Седловая точка существует не всегда.
Для матричных игр характерны следующие свойства.
1. Функция выигрыша H (i, j ) = hi j принимает одно и то же
значение во всех ситуациях равновесия.
Если ситуация (i *, j *) — ситуация равновесия по Нэшу в ма‑
тричной игре Г, то v = H (i *, j *) называется значением (ценой)
игры Г.
2. max min hi j Ј min max hi j
1Ј i Ј m 1Ј j Ј n 1Ј j Ј n 1Јi Ј m
для любых i = 1, 2, …, m, j = 1, 2, …, n.
50
Ситуации равновесия в матричной игре
D
h0
i j0
і max h
i j0
і min max hij = hi * j * = v * .
j
i i
51
3. Матричные игры
52
Ситуации равновесия в матричной игре
Ї Ї
40 30
Ї
min max hi j = 30
j i
53
3. Матричные игры
Смешанные стратегии
54
Смешанные стратегии
ж x1 ц
з ч
x2
X = з ч = ( x1 , x2 ,, xm )T, (3.5)
з ч
зз чч
и xm ш
где xi — вероятность выбора игроком его i‑й стратегии, xi ≥ 0,
m
i = 1, 2,.., m; е xi = 1; X T — транспонированный вектор X.
i =1
Замечания
1. Задание смешанной стратегии игрока состоит в указании
тех вероятностей, с которыми выбираются его чистые стратегии.
2. Каждая чистая стратегия может рассматриваться как сме‑
шанная стратегия, в которой эта чистая стратегия выбирается
с вероятностью 1, а все остальные — с вероятностью 0. Таким
образом, все чистые стратегии являются ортами ei (векторами
единичной длины) в m‑мерном евклидовом пространстве век‑
торов вида (1), т. е. eiT = (0,, 0,1, 0,, 0).
i
55
3. Матричные игры
m n
M x1 = е е hi j xi y j = X T HY .
i =1 j =1
ж h(1) ц
з ( 2) ч
h ч
Н = зз = (h(1) , h( 2) , , h(n) ),
ч
зз (m ) чч
иh ш
где h(i ) — i‑я строка матрицы Н; h( j ) — j‑й столбец матрицы Н.
Тогда имеем (рассматривая h(i ) как вектор-строку, h( j ) как
вектор-столбец) h(i ) = eiT H , h( j ) = He j .
Таким образом, можно записать
m n
H(X, Y) = X T HY = е е hi j xi y j =
i =1 j =1
m n
= е xi h(i )Y = е X T h( j ) y j . (3.6)
i =1 j =1
56
Ситуации равновесия в смешанных стратегиях
Тогда справедливо
X T HY Ј a для " X О S m. (3.10)
i =1 i =1
57
3. Матричные игры
58
Ситуации равновесия в смешанных стратегиях
59
3. Матричные игры
v
Таким образом, выбор игроком 1 своей оптимальной стра‑
тегии дает ему средний выигрыш не меньший, чем значение
игры v при любой стратегии игрока 2. Выбор игроком 2 его оп‑
тимальной стратегии дает ему средний проигрыш не больший,
чем значение игры v при любой стратегии игрока 1.
60
Свойства значения игры
v (H )
для i = 1, 2, …, m; j = 1, 2, …, n.
" "
Теорема 3.7. Для любой матрицы Н выполняются неравенства
max min hij ≤ v(H) ≤ min max hij . (3.20)
j j
i i
61
3. Матричные игры
m
X 0 h( j* ) = е hij* xi0 = v для j* : y 0j* > 0 . (3.22)
T
i =1
62
Контрольные вопросы и задания
63
4. Решение матричных игр
Р
ешить матричную игру — значит найти оптимальные
стратегии игроков (чистые или смешанные) и значе‑
ние (цену игры), определяющее выигрыши игроков.
Теорема 4.1 (об аффинных преобразованиях). Оптимальные
стратегии игроков в матричной игре с матрицей Н и в матрич‑
ной игре с матрицей H = kH + C совпадают, где число k > 0,
C = (cij ) — матрица размерности m×n, cij = c — const. Значения
игр связаны равенством:
v(H ) = kv(H) + с.
Доказательство. Пусть X 0 ,Y 0 — оптимальные смешанные
стратегии игроков, доставляющие значение игры v (H) (в игре
с матрицей Н). По определению седловой точки (X 0 ,Y 0 ) имеем
T
X T HY 0 Ј 0T
X Ј X HY (4.1)
HY
0 0
v(H )
= X T (kH + C )Y = kX T HY + X TCY =
X T HY
m n m n
= kX T HY + е е ci j xi y j = kX T HY + c е е xi y j =
i =1 j =1 i =1 j =1
m n
= kX T HY + c е x е y = kX
i j
T
HY + c .
i =1 j =1
=1 =1
64
Задачи игроков в матричной игре
v(H )
0 Ј X 0 T HY
T
X HY 0 Ј X 0T HY
.
v ( H )
v(H )
65
4. Решение матричных игр
66
Решение матричной игры 2×2
67
4. Решение матричных игр
v0 = D , (4.13)
h11 + h22 - h12 - h21
ж h -h12 ц
H -1 = 1 з 22 ч,
D и -h21 h11 ш
то получим
68
Графический метод решения матричной игры
Учитывая x1 + x2 = 1, находим
v (h - h + h - h ) = 1 Ю v 0 = D . (4.16)
D 22 21 11 12 h11 + h22 - h12 - h21
Тогда из (4.15) и (4.16) получим (4.14). Значение игры
v (H ) = v 0 .
Теперь рассмотрим задачу для игрока 2. Среди чисел y1, y2,
удовлетворяющих неравенствам
мh11 y1 + h12 y2 Ј v,
н (4.17)
оh21 y1 + h22 y2 Ј v,
y1 і 0, y2 і 0, y1 + y2 = 1, (4.18)
69
4. Решение матричных игр
v2
B2 v2( 2 )
B2 ( y ) B1ў
Q
h22 B2ў
B1 ( y ) h11
B1 v2(1 ) h21
h12
y
0 y y0 1
Рис. 4.1. Графическая иллюстрация решения задачи для игрока 2
в матричной игре 2×2
70
Графический метод решения матричной игры
y = y , y = 1 - y , v(H ) = v2 ( y 0 ) = v 0 .
0
1
0 0
2
0
71
4. Решение матричных игр
v1
A2 v1( 2 )
A2 ( x) A1ў
P
h22 A2ў
A1 ( x) h11
A1 v1(1) h12
h21
x
0 x x0 1
Рис. 4.2. Графическая иллюстрация решения задачи для игрока 1
в матричной игре 2×2
Итак, получим x = x , x = 1 - x 0, v 0 = v1 ( x 0 ).
0
1
0 0
2
72
Графический метод решения матричной игры
h21
40
30 v1( 2 ) h12
P
v0
20
h22
10 v1(1) h11
x
0 0 1
x
Рис. 4.3. Графическое решение задачи для игрока 1
73
4. Решение матричных игр
v2
40 v2( 2 ) h21
h12
30 Q
0
v
20
h22
10 v2(1) h11
y
0 0 1
y
Рис. 4.4. Графическое решение задачи для игрока 2
74
Графический метод решения матричной игры
v1( 2) = 3х + 3 (1 — х) = 3.
75
4. Решение матричных игр
v1
4 v1(1)
A2 P v1( 2)
3
2 A1ў
x
0 x* = 1 / 2 1
Рис. 4.5. Графическое решение задачи для игрока 1
v2( 2) = 4y + 3 (1 — y) = y + 3.
Тогда получим следующие координаты точки Q ( y , v ):
0 0
y 0 = 0 , v 0 = 3,
определяющей 0min
Ј y Ј1
max v2(i ) = v 0 = v2 ( y 0 ).
i
76
Теорема о дополняющей нежесткости (теорема равновесия)
v2
4
Q v2( 2)
3 v2(1)
y
0 1
Рис. 4.6. Графическое решение задачи для игрока 2
77
4. Решение матричных игр
h(i0 )Y 0 < v(H ) и при этом xi0 > 0 . Умножим это неравенство на xi0 ,
0 0
получим
h(i0 )Y 0 xi0 < v(H ) xi0 . (4.21)
0 0
i =1,
i №i0 i №i0
=X 0 T 0
HY = v ( H ) =1
т. е. имеем v(H) < v(H) — противоречие.
Аналогично доказывается вторая часть теоремы.
Замечание. Из определения существенной (активной) стра‑
тегии и доказанной теоремы следует, что для каждой существен‑
ной стратегии i игрока 1 и любой оптимальной стратегии Y 0
игрока 2 в игре с платежной матрицей H выполняется равен‑
ство h(i )Y 0 = v(H ).
Аналогично для каждой активной стратегии j игрока 2 и лю‑
бой оптимальной стратегии Х 0 игрока 1 в игре с платежной ма‑
T
трицей H выполняется равенство X 0 h( j ) = v(H ).
Пример 4.3. Рассмотрим игру с платежной матрицей
ж1 3 4ц
з ч
H = з2 2 1 ч.
з2 1 5 чш
и
78
Теорема о дополняющей нежесткости (теорема равновесия)
1 Ј v(H ) Ј 2.
v(H ) = v = 11 / 12.
80
Решение матричных игр 2×n и m×2
3 Ј v(H ) Ј 9.
При этом отрезок прямой v1(3) расположен строго выше этой ло‑
маной (гарантированного выигрыша игрока 1). Это означает,
что игрок 2 заведомо не будет выбирать свою стратегию 3.
Игрок 1 выбирает х так, чтобы достичь наивысшей точки P
(получить максимум выигрыша, т. е. max min v1( j )). Точка Р —
j 0 Ј х Ј1
81
4. Решение матричных игр
11
10 (3)
9 v1
8
7 v0 P
6 ( 2)
v1
5
4 v1(1)
3 A2ў
2
1 A1
x
0 x0 1
Рис. 4.7. Графическое решение задачи для игрока 1
82
Решение матричных игр 2×n и m×2
11y1 + 3 y2 + 8 y3 Ј v ,
y1 + 10 y2 + 9 y3 Ј v ,
м11y1 + 3 y2 = v,
н
о y1 + 10 y2 = v,
при условии y1 і 0, y2 і 0 , y1 + y2 = 1.
Тогда получим y10 = 7/17, y20 = 10/17, v(H ) = v 0 = 107 / 17.
Итак, имеем оптимальную смешанную стратегию игрока 2:
Y 0 = (7/17, 10/17, 0).
Пример 4.5. Рассмотрим игру с платежной матрицей
ж3 5 8ц
H =з ч.
и8 5 4ш
Решение. 1. Данная игра не имеет ситуации равновесия в чи‑
стых стратегиях, причем
v* = max min hij = 4 № v * = 5 = min max hij ,
j j
i i
4 Ј v(H ) Ј 5.
83
4. Решение матричных игр
v1( 2) = 5х + 5 (1 — х) = 5,
v1(3) = 8х + 4 (1 — х) = 4х + 4.
v1
8 v1(1) v1(3) 8
Р1 Р2 v1( 2)
5 5
4 A3
A1ў 3
x
0 x 1* x *2 1
Рис. 4.8. Графическое решение задачи для игрока 1
84
Решение матричных игр 2×n и m×2
м3 y1 + 5 y2 + 8 y3 Ј v = v 0 = 5,
п
н8 y1 + 5 y2 + 4 y3 Ј v = v 0 = 5,
п
о y1 і 0, y2 і 0, y3 і 0, y1 + y2 + y3 = 1.
Подставим в первые два неравенства y3 = 1 - y1 - y2, получим
(с учетом y3 = 1 - y1 - y2 і 0) систему неравенств
м5 y1 + 3 y2 і 3,
п
п4 y1 + y2 Ј 1,
н
п y1 і 0, y2 і 0,
п1 - y - y і 0.
о 1 2
y2
M
1
y1 + y2 = 1
y1
0 0,25 0,6 1
4 y1 + y2 = 1 5 y1 + 3 y2 = 3
Рис. 4.9. Графическое решение системы неравенств
85
4. Решение матричных игр
86
Теоремы о доминировании строк (столбцов) платежной матрицы
87
4. Решение матричных игр
4 Ј v(H ) Ј 8.
88
Теоремы о доминировании строк (столбцов) платежной матрицы
ж10 4 8 ц
з ч
H ўў = з 2 8 6 ч.
з ч
и ш
2.3. Найти 0 < l < 1, для которого h(3) > lh(1) + (1 - l)h( 2):
м8 > 10l + 4(1 - l), Ю 4 > 6l Ю l < 2 / 3,
н
о6 > 2l + 8(1 - l), Ю -2 > -6l Ю l > 1 / 3,
откуда получим 1/3 < l < 2/3, т. е. h(3) — доминируемый стол‑
бец, его можно вычеркнуть, при этом y30 = 0 . Получим новую
матрицу
ж10 4 ц
з ч
H ўўў = з 2 8 ч.
з ч
и ш
3. Поиск оптимальных смешанных стратегий.
Задача для игрока 1. В соответствии с методом имеем
v1(1)= 10х + 2 (1 — х) = 8х + 2,
89
4. Решение матричных игр
90
Контрольные вопросы и задания
ж 2 3 6 5ц
з ч ж 3 2 -3 -5 ц
в) H = з 1 2 7 3 ч ; г) H = з ч.
з 5 4 3 0ч и -5 - 3 1 2 ш
и ш
9. Имеют ли матрицы А и В седловые точки:
ж 0 a ц ж 2 1ц
A=з ч, B = з ч.
и 1 2ш иb 0ш
При каких значениях a и b в игре с матрицей А + В суще‑
ствует вполне смешанное равновесие?
10. Проверьте, являются ли стратегии X, Y оптимальными
в игре с матрицей H:
ж 1/ 2 ц ж 1/3 ц ж 1 -1 2ц
з ч з ч з ч
а) X = з 0 ч, Y = з 1 / 3 ч, H = з 1 2 - 2 ч;
з 1/ 2 ч з 1/3 ч з 2 1 1 чш
и ш и ш и
ж 0ц ж 1/ 2 ц ж 2 -4 1ц
з ч з ч з ч
б) X = з 1 / 6 ч, Y = з 1 / 2 ч, H = з -2 3 - 1 ч.
з 5/6 ч з 0 чш з 3 чш
и ш и и 1 0
91
5. Сведение матричной игры
к задаче линейного программирования (ЛП)
П
усть рассматривается матричная игра m×n с матри‑
цей H, причем будем считать, что все hij > 0, i = 1, …, m,
j = 1, …, n. Это всегда можно сделать в силу теоремы
об аффинных преобразованиях. Тогда значение игры v(H) > 0.
Рассмотрим задачу для игрока 2. Среди стратегий
Q = (q1 , q2 , , qn ) О S n , удовлетворяющих неравенствам
n
еh q
j =1
ij j Ј v для " i = 1, 2, …, m, (5.1)
n
еq
j =1
j = 1, q j і 0 для " j = 1, 2, …, n, (5.2)
92
Эквивалентные задачи ЛП для игроков
n n n
е q = е vy
j =1
j
j =1
j =1 Ю е yj =1/ v,
j =1
93
5. Сведение матричной игры к задаче линейного программирования (ЛП)
94
Общий вид задачи ЛП
при ограничениях
мa11 y1 + a12 y2 + + a1n yn Ј b1 ,
п
п...
н (5.16)
пam1 y1 + am 2 y2 + + amn yn Ј bm ,
п y j і 0, j = 1, 2,..., n.
о
Данную задачу можно записать в матрично-векторной форме:
f ( y ) = c0 + (c, y ) ® max,
y О S = { y ОR n : Ay Ј b, y і 0},
где обозначены
ж y1 ц ж c1 ц ж a11 a1n ц ж b1 ц
з ч з ч з ч з ч
y = з ч, c = з ч , A = з ч, b = з ч .
зy ч зc ч зa ч зb ч
и nш и nш и m1 amn ш и mш
Неравенство для векторов a ≥ b означает:
a j і b j для " j = 1, 2, …, n.
95
5. Сведение матричной игры к задаче линейного программирования (ЛП)
при ограничениях
мa11 x1 + a21 x2 + + am1 xm і c1 ,
п
п...
н (5.18)
пa1n x1 + a2n x2 + + amn xm і cn ,
п x і 0, i = 1, 2,..., m.
о i
Данную задачу также можно записать в матрично-векторной
форме, где x T = ( x1 , x2 , , xm ):
f * ( x ) = c0 + (b, x ) ® min ,
x ОT = { x ОR m : A T x і c, x і 0},
*
f max = f min . (5.19)
Замечание. Задачи игроков (5.3)–(5.5) и (5.10)–(5.12) обра‑
зуют пару взаимно двойственных задач.
Действительно, задачи (5.15), (5.16) и (5.17), (5.18) перехо‑
дят соответственно в задачи игроков (5.3)–(5.5) и (5.10)–(5.12)
при c0 = 0, c T = (1 1), b T = (1 1), A = H.
Пример 5.1. Найти решение игры с платежной матрицей
ж 6 -2 3 ц
H =з ч.
и -4 5 4ш
Решение. В соответствии с теоремой об аффинных преобра‑
зованиях рассмотрим стратегически эквивалентную игру с ма‑
трицей
96
Общий вид задачи ЛП
ж11 3 8ц
H = з ч,
и 1 10 9 ш
при этом все элементы новой матрицы H положительны. Тог‑
да значения игр связаны равенством: v(H ) = v(H ) + 5.
1. Запишем задачу для игрока 1 в форме задачи ЛП.
Задача для игрока 1. Среди чисел x1 , x2 , удовлетворяющих
неравенствам
м11x1 + x2 і 1,
п
п3x1 + 10 x2 і 1,
н
п8x1 + 9 x2 і 1,
п x і 0, x і 0,
о 1 2
97
5. Сведение матричной игры к задаче линейного программирования (ЛП)
x2
8 x1 + 9 x2 = 1 T
A( x10 , x20 )
x1
0 1
- Сf * = (-1, - 1) 3 x1 + 10 x2 = 1
11x1 + x2 = 1
*
x1 + x2 = f min
98
Общий вид задачи ЛП
м11y1 + 3 y2 + 8 y3 Ј 1,
п
н y1 + 10 y2 + 9 y3 Ј 1, ,
п y і 0, y і 0, y і 0,
о 1 2 3
y1 + y2 + y3 ® max.
y2
- 8 y1 + y2 = -46 /107
3 y1 - 5 y2 = -29 /107
10/107 A
y1
0 7/107
y1 + y2 = 17 /107
Рис. 5.2. Графическое решение системы неравенств
99
5. Сведение матричной игры к задаче линейного программирования (ЛП)
при ограничениях
мa11 х1 + a12 х2 + + a1n хn = b1 ,
п
п...
н (5.20)
пam1 х1 + am 2 х2 + + amn хn = bm ,
п х і 0, i = 1,22,..., n.
о i
100
Правила работы с симплекс-таблицей
… … … … … … …
хk+j βj αj1 … αjs … αjk
… … … … … … …
хn βr αr1 … αrs … αrk
101
5. Сведение матричной игры к задаче линейного программирования (ЛП)
102
Правила работы с симплекс-таблицей
Таблица 2
Заполненная симплекс-таблица. Шаг 1
Свободные переменные
Таблица 1‑го шага
x1 … xs … xk
γ0 γ1 γ γ
— λαj1γs … — λγs …
f s k
— λβjγs — λαjkγs
β1 α11 α α
xk+1 — λβjα1s — λαj1α1s … 1s
— λα1s …
1k
— λαjkα1s
переменные
… … … … … … …
Базисные
βj αj1 … α α
xk+j λ …
js jk
λβj λαj1 λαjk
… … … … … … …
βr αr1 … αrs … αrk
xn — λβjαrs — λαj1αrs — λαrs — λαjkαrs
Таблица 3
Симплекс-таблица. Шаг 2
Свободные переменные
Таблица 2‑го шага
x1 … xk+j … xk
f γ0 — βjγs γ1 — λαj1γs … –λγs … γk — λαjkγs
xk+1 β1 — λβjα1s α11 — λαj1α1s … –λα1s … α1k — λαjkα1s
переменные
Базисные
… … … … … … …
xs λβj λαj1 … λ … λαjk
… … … … … … …
xn βr — λβjαrs αr1 — λαj1αrs … –λαrs … αrk — λαjkαrs
103
5. Сведение матричной игры к задаче линейного программирования (ЛП)
y5 = 1 - ( y1 + 10 y2 + 9 y3 ). (5.24)
104
Правила работы с симплекс-таблицей
105
5. Сведение матричной игры к задаче линейного программирования (ЛП)
Таблица 5
Заполненная симплекс-таблица. Шаг 1
Таблица 1‑го шага y1 y2 y3
0 1 1 1 βi/αis
F —1/11 —1/11 —3/11 —8/11
1 11 3 8
y4 1/11 1/11
1/11 3/11 8/11
1 1 10 9
y5 1
—1/11 —1/11 —3/11 —8/11
Таблица 6
Заполненная симплекс-таблица. Шаг 2
Таблица 2‑го шага y4 y2 y3
–1/11 –1/11 8/11 3/11 βi/αis
F - 80 8 - 8 - 8 Ч 91
11 Ч107 11 Ч107 107 11 Ч107
1/11 1/11 3/11 8/11
y1 - 30 3 - 3 - 3 Ч 91 1/3
11 Ч107 11 Ч107 107 11 Ч107
10/11 –1/11 107/11 91/11
y5 10 - 1 11 91 10/107
107 107 107 107
106
Контрольные вопросы и задания
Таблица 7
Итоговая таблица
Таблица 3‑го шага y4 y5 y3
F –17/107 –9/107 –8/107 –37/107
y1 7/107 10/107 –3/107 53/107
y2 10/107 –1/107 11/107 91/107
107
6. Биматричные игры
Б
ескоалиционная конечная игра двух игроков, т. е. игра
парная, с конечным числом стратегий у каждого игро‑
ка называется биматричной. Формализованное опи‑
сание биматричной игры Г определяется следующим образом:
Г = {I, S, H}, где I = = {1, 2} — множество игроков; S = S1 ґ S 2 —
м н о ж е с т в о с и т у а ц и й , п р и ч е м S1 = { s1(1) , s1( 2) ,, s1(m ) } ,
S 2 = { s2(1) , s2( 2) ,, s2(n ) } – множества стратегий игрока 1 и 2 соот‑
ветственно; функция выигрышей игроков H = (H 1 , H 2 ) : S ® R 2 ,
H 1 (si j ) = ai j , H 2 (si j ) = bi j — функции выигрышей игрока 1 и 2 со‑
ответственно, i = 1, 2, …, m; j = 1, 2, …, n; si j = (s1(i ) , s2( j ) ) — ситу‑
ация, образованная стратегией s1(i ) игрока 1 и стратегией s2( j )
игрока 2.
Выигрыши игроков можно задать матрицей выигрышей (или
платежной матрицей) следующего вида:
s2(1) … s2(n )
s1(1) ж (a11 , b11 ) … (a1n , b1n ) ц
з ч,
з … … … ч
s1(m ) зи (am1 , bm1 ) … (amn , bmn ) чш
здесь против каждой строки (каждого столбца) указана соот‑
ветствующая стратегия игрока 1 (игрока 2).
108
Смешанное расширение биматричных игр
bi * j Ј bi * j * для любых j = 1, 2, …, n.
109
6. Биматричные игры
где обозначены: x = ( x1 , x2 , , xm ), y = ( y1 , y2 , , yn ).
T T
110
Условия равновесия (в смешанных стратегиях) в биматричной игре 2x2
H = (H 1 , H 2 ) : S ® R 2 ,
111
6. Биматричные игры
112
Условия равновесия (в смешанных стратегиях) в биматричной игре 2x2
н 0 T 0
по( x ) By і ( x ) By для " 0 Ј q Ј 1.
0 T
(p 0
)(
- p (a12 - a22 ) + q 0 (a11 - a12 - a21 + a22 ) і 0 )
(q 0
- q ) ((b
21 - b22 ) + p 0 (b11 - b12 - b21 + b22 )) і 0 (6.4)
для " p О [0, 1], qО [0, 1].
Пример 6.1. Найти ситуации равновесия в биматричной игре
2×2 с матрицей выигрышей
s2(1) = +1 s2( 2) = -1
s1(1) = +1 ж (5, 5) (2, 8) ц
з ч.
s1 = -1 и (8, 2) (0, 0) ш
( 2)
113
6. Биматричные игры
ж 5 8 цж q ц
x T By = ( p, 1 - p)з чз ч = 8 p + 2q - 5 pq .
и 2 0 ши1 - q ш
3. Запишем условия равновесия, используя систему (6.4):
мп( p 0 - p)(2 - 5q 0 ) і 0 для " p О[0,1],
н 0
оп(q - q )(2 - 5 p ) і 0 для " q О[0,1].
0
н 0
поq - q Ј 0 для " q О[0,1] Ю q = 0,
0
3.3. н 0 ,
по p - p Ј 0 для " p О[0,1] Ю p = 0
0
114
Поиск ситуаций равновесия в биматричных играх
M x2 p,q = 2 / 5
= 8 p + 2q - 5 pq p,q = 2 / 5
= 6 p + 0, 8,
{
supp(si ) = si(k ) О Si | xk > 0 , }
где xk = P (si(k ) ) — вероятность применения стратегии s1(k ) .
115
6. Биматричные игры
116
Поиск ситуаций равновесия в биматричных играх
причем е pk + pў = 1.
{k : s1( k ) № s1ў }
а из (6.6) имеем
H 1 (s1 , s 2 ) і H 1 (s1ў, s 2 ) для " s1ў О S1.
117
6. Биматричные игры
=1
118
Поиск ситуаций равновесия в биматричных играх
H 1 (s1( 2) , s 2 ) = 2q + 5(1 - q ).
119
6. Биматричные игры
H 1 (s) є М x1 = H 1 (s1(1) , s 2 ) = 29 / 7 ,
j = 1, 3, 4, q2 = 0.
Действительно, игрок 2 никогда не будет применять страте‑
гию s2( 2), так как существует комбинация его чистых стратегий
(т. е. смешанная стратегия), строго доминирующая эту страте‑
гию s2( 2), например, комбинация его стратегий s2(1) и s2(3) (столбец
2 платежной матрицы игрока 2 строго доминируется комбина‑
цией столбцов 1 и 3):
ж 0 2 6 8ц
B =з ч.
и 7 5 4 1ш
Запишем условия для такой комбинации: найти 0 < l < 1 та‑
кое, что
120
Поиск ситуаций равновесия в биматричных играх
1 ж 0 ц + 1 ж 6 ц = ж 3 ц > ж 2 ц.
2 зи 7 чш 2 зи 4 чш зи 5, 5 чш зи 5 чш
Итак, вероятность использования стратегии s2( 2) равна 0, т. е.
q2 = 0 .
Вычислим для игрока 2 ожидаемые выигрыши:
H 2 (s1 , s2(1) ) = 0 Ч p + 7(1 - p) = v2,
121
6. Биматричные игры
122
Поиск ситуаций равновесия в биматричных играх
123
6. Биматричные игры
( j)
H 2 (s1 , s2 )
8
(4)
7 s2
6
(3)
5 s2
4
(2)
s2
1 (1)
s2
р
0 1/3 3/5 1
125
6. Биматричные игры
126
Графический метод решения биматричных игр 2×n и m×2
127
6. Биматричные игры
128
Свойства равновесных стратегий
ж x1 ц ж y1 ц
з ч з ч
s1 = x = з ч , s 2 = y = з ч.
зx ч зy ч
и mш и nш
Тогда функции выигрышей игроков для ситуации s =(s1 , s 2 )
имеют вид
m n
H 1 (s) є М x1 = е е aij xi y j = x T Ay ,
i =1 j =1
m n
H 2 (s) є М x 2 = е е bij xi y j = x T By .
i =1 j =1
примет вид
( x *)T Ay * і s1T Ay * для " s1 О S1,
( x *)T By * і ( x *)T Bs2 для " s2 О S 2 , (6.14)
где sk записаны в форме смешанных стратегий e , т. е. i‑я чи‑ (i )
k
129
6. Биматричные игры
( x *)T B Ј vB w T, (6.16)
где вектор-столбцы u О R m, w О R n , состоящие из одних единиц:
u T = (1, , 1), w T = (1, , 1).
Определение. Стратегия sk игрока k называется вполне сме-
шанной, если ее носитель (или спектр) совпадет с множеством
чистых стратегий S k , т. е. supp(sk ) = S k .
Ситуация s = (s1 , s 2 ), в которой обе стратегии s1 и s 2 вполне
смешанные, называется вполне смешанной.
Для вполне смешанных стратегий s1 = x и s 2 = y игроков име‑
ем xi > 0, i = 1, 2, …, m; y j > 0, j = 1, 2, …, n.
Пусть s = (s1 , s 2 ) — вполне смешанная ситуация равновесия
(по Нэшу). Тогда из условий теоремы 2 следует
H k (sk , s - k ) = H k (s) для " sk О S k , k = 1, 2,
x Т B = vB w T, vB = ( x *)T By *.
x u = 1, y u = 1.
Т Т
130
Свойства равновесных стратегий
м Ay = v A u, м x B = vB u ,
Т T
а) н Т б) н Т
о x u = 1; о y u = 1;
причем x > 0, y > 0 (для вполне смешанной ситуации).
Из (а) получим y = v A A -1u, из (б) следует x Т = vB u T B -1. Тогда
находим
x Тu = vB u T B -1u = 1 Ю vB = (u T B -1u)-1,
u Т y = v A u T A -1u = 1 Ю v A = (u T A -1u)-1.
131
6. Биматричные игры
-1
ж ж1 2 ц ж1 ц ц
vB = (u B u) = з 1 (1 1) з
T -1 -1
чз чч =
и3 и1 5 ш и1 ш ш
-1
ж ж3цц
= 3 з (1 1) з ч ч = 3 = 1 .
и и6шш 9 3
3. Определим равновесные стратегии игроков:
ж1 2 ц 1 1
x Т = vB u T B -1 = 1 (1 1) з ч = (2 7) = (2 / 9 7 / 9),
3 и1 5 ш 3 9
ж1 2 ц ж1 ц 1
y = v A A -1u = - 4 з (- ) = 1 (3 11) = (3 / 14 11 / 14).
7 и1 10 чш зи1 чш 8 14
Итак, имеем вполне смешанную ситуацию равновесия
s = ((2 / 9 7 / 9), (3 / 14 11 / 14)),
= 9 pq - 3 p - 2q + 1.
132
Свойства равновесных стратегий
мqmax = 0, 0 Ј p < 2 / 9;
п
qmax ( p) = н qmax = 1, 2 / 9 < p Ј 1;
п [0, 1], p = 2 / 9.
о
133
6. Биматричные игры
qmax ( p )
R pmax ( q )
3/14
p
0 2/9 1
Рис. 6.2. Геометрические представления наилучших ответов игроков
134
Доминирование смешанных стратегий
а также в форме
H i (siў, s -i ) > H i (si , s -i ) для " s -i О S -i .
H 1 (s) є М x1 s ,s = 1 Ч 2 Ч q + 0 Ч 0 Ч q + 1 Ч (-1) Ч q +
1 2 2 2
1
+ Ч (-1) Ч (1 - q ) + 0 Ч 0 Ч (1 - q ) + Ч 2 Ч (1 - q ) = 1 .
1
2 2 2
135
6. Биматричные игры
Пусть s1 = (1/2, 1/2, 0), при этом чистые стратегии s1(1), s1( 2) О
О supp(si ), но не являются доминируемыми. Однако
H 1 (s1 , s2(1) ) = M x1 =
s1 ,s2(1 )
= 1 Ч 1 Ч1 + (-2) Ч 1 Ч1 = - 1 < H 1 (s1(3) , s2(1) ) = 0,
2 2 2
H 1 (s1 , s2( 2) ) = M x1 ( 2 ) =
s1 ,s2
= (-2) Ч 1 Ч1 + 1 Ч 1 Ч1 = - 1 < H 1 (s1(3) , s2( 2) ) = 0,
2 2 2
т. е. стратегия s1 строго доминируется стратегией s1(3).
137
6. Биматричные игры
ж (7, 3) (0, 5) ц
H =з ч.
и (4, 1) (2, 0) ш
9. Найдите ситуации равновесия по Нэшу в смешанных
стратегиях в биматричной игре с платежной матрицей
Н, используя отображения наилучших ответов игроков,
ж (6, 2) (0, 4) ц
H =з ч.
и (3, 1) (1, 0) ш
10. При каких значениях z стратегия s 2 = (1 / 2, 1 / 2) строго
доминирует стратегию sў2 = (3 / 4, 1 / 4) в биматричной игре
с платежной матрицей
ж (7, z ) (3, 5) ц
H =з ч?
и (2, 4) (5, 2 + z ) ш
11. Н айдите вполне смешанную ситуацию равновесия
по Нэшу в биматричной игре с платежной матрицей
ж (0, 4) (3, 3) ц
H =з ч.
и (5, 3) (2, 5) ш
138
Библиографический список
139
Библиографический список
140
Библиографический список
141
Для заметок
142
Для заметок
143
Учебное издание
Редактор О. В. Климова
Корректор Е. Е. Афанасьева
Компьютерный набор А. Г. Кремлева
Верстка О. П. Игнатьевой