Открыть Электронные книги
Категории
Открыть Аудиокниги
Категории
Открыть Журналы
Категории
Открыть Документы
Категории
Лекция 13
Сигнальные игры
158
Лекция 13. Сигнальные игры
Отправитель узнает свой тип и посылает одно из сообщений:
m1 или m2 . Получив сообщение, но не зная, какой тип реали-
зовался, получатель R выбирает действие a1 или a2 .
a1 a1
m1 t1 m2
S
a2 a2
0
a1 a1
1
S
m1 t2 m2
a2
a2
Здесь вероятности равны p (t1 ) , p (t2 ) 1 . У
каждого игрока есть два информационных множества и
четыре стратегии. У игрока S есть две выявляющие страте-
гии: m(t1 ) m(t2 ) , а также две скрывающие стратегии:
m(t1 ) m(t2 ) . В общем случае бывают, конечно, еще гиб-
ридные стратегии: не взаимнооднозначные m(t ) , но и не
m(t ) const .
У игрока R каждое из двух двухэлементных инфор-
мационных множеств соответствует полученному сообще-
нию. На каждом нужно выбрать одно из двух действий,
поэтому получается 4 стратегии.
Пары выигрышей игроков нужно проставить во все 8
финальных позиций.
Перепишем теперь общее определение СБР для слу-
чая сигнальных игр.
Определение. Совершенное байесовское равновесие
в сигнальных играх есть совокупность стратегии отправи-
159
Лекции по теории игр и экономическому моделированию
теля m(t ) , стратегии получателя a( m) и представлений
получателя (t | m) , которые удовлетворяют следующим
условиям.
Условие 1. Для каждого информационного множест-
ва H (m) , соответствующего сообщению m , задано веро-
ятностное распределение (t | m) на множестве типов T ,
характеризующее представление получателя R о типах.
Условие 2. При заданных представлениях (t | m)
стратегия получателя a( m) максимизирует его ожидаемый
выигрыш (t | m) u R (t , m, a ) для каждого сообщения m.
tT
Условие 3. Для стратегии a( m) , определенной усло-
вием 2, и для каждого t T стратегия отправителя m(t )
максимизирует его выигрыш uS (t , m, a( m)) .
Условие 4. Представления получателя (t | m) долж-
ны быть согласованы со стратегией отправителя m(t ) и
вероятностным распределением p (t ) на T по правилу
Байеса.
Уточним условие 4.
Пусть T ( m) {t T | m(t ) m} . Если T ( m) , то
H (m) лежит вне равновесного пути (и не достижимо не из
какой промежуточной позиции) и (t | m) на нем может
быть определено произвольным образом.
Если T ( m) , то H (m) лежит на равновесном пути
p(t )
и должно быть выполнено: (t | m) .
p (T (m))
Для того чтобы понять, как ищется СБР в сигнальной
игре, остановимся на конкретном числовом примере би-
нарной сигнальной игры, добавив выигрыши в рассмот-
ренный ранее пример.
Пример. Нахождение СБР в бинарной сигнальной
игре.
160
Лекция 13. Сигнальные игры
(1,3)
u u
[q]
[ p] t1
l r (2,1)
(4,0)
S 1
d
d 2 (0,0)
0
(2,4) (1,0)
u
1 u
S
2
(1,2)
(0,1)
[1 p] l t2 r
d [1 q]
d
Здесь
1
T {t1 , t2 }, M {l , r}, A {u, d }, p(t1 ) p(t 2 ) .
2
Алгоритм поиска СБР в бинарной сигнальной игре.
А1. Фиксируем одну из четырех стратегий m(t ) от-
правителя S и будем пытаться достроить ее до СБР.
А2. Находим представления ( p и q ), согласованные
с m(t ) на равновесном пути.
А3. При заданных представлениях на равновесном
пути находим оптимальный ответ получателя R.
А4. Вне равновесного пути подбираем представления
и согласованные с ними действия получателя S так, чтобы
отправителю было невыгодно отклоняться от m(t ) для лю-
бого из своих двух типов.
Сначала будем искать скрывающие равновесия.
Р1. (l , l ) : S посылает сообщение l независимо от ти-
па. С этой стратегией в силу условия 4 согласуются пред-
ставления p 0.5 и любое q . При p 0.5 (как, впрочем, и
161
Лекции по теории игр и экономическому моделированию
при любом другом p для данного примера) ожидаемый
выигрыш от действия u ( 3.5 ) больше, чем ожидаемый вы-
игрыш от d (0.5), поэтому на равновесном пути в левом
информационном множестве игрок R будет выбирать u .
Осталось проверить выгодность отклонения для иг-
рока S. При t1 игрок S будет выбирать l , только если на
правом информационном множестве игрок R будет играть
d . (Сравните выигрыши игрока S). Для того чтобы R иг-
рал справа d , нужно, чтобы d было лучше u справа. От-
сюда получаем условие на q :
2
1 q 0 (1 q ) 0 q 2 (1 q) q .
3
При таких q действие d будет оптимальным справа,
а игрок S не будет иметь мотивации к отклонению от l при
t1 . Последняя проверка: выгодно ли для S отклониться от l
при t2 ? Нет, поскольку при t2 , l и u слева его выигрыш
равен 2, а при отклонении r и ответе d справа его выиг-
рыш равен 1.
Итак, получили скрывающее СБР, которое может
быть кратко записано так:
1 2
l , l , u, d , p , q .
2 3
Р2. (r , r ) : S посылает сообщение r независимо от
типа. Теперь в силу условия 4 получаем q 0.5 . При таком
q оптимальным действием R справа будет d (1 > 0.5).
Слева оптимальным действием является u при любом p .
Но тогда игроку S выгодно отклониться от r и выбрать l
для любого типа.
Значит, (r , r ) не может быть достроено до равновесия.
Перейдем теперь к выявляющим равновесиям.
162
Лекция 13. Сигнальные игры
Р3. (l , r ) : S посылает сообщение l при t1 и r при t2 .
Оба информационных множества лежат на равновесном
пути, поэтому все представления определены однозначно:
p 1 , q 0 . Значит, R слева будет играть u , а справа d .
Но игроку S при t2 выгодно вместо r сыграть l (2 > 1).
Значит, (l , r ) нельзя достроить до СБР.
Р4. (r , l ) : S посылает сообщение l при t2 и r при t1 .
Теперь p 0 , q 1 . Слева R ходит u , справа R ходит тоже
u . Проверка показывает, что игроку S невыгодно откло-
няться ни при каком из своих двух типов.
Итак, получили выявляющее равновесие:
{r , l , u, u , p 0, q 1} .
Всего в этой игре существуют два СБР: одно скры-
вающее и одно выявляющее.
В следующей лекции мы рассмотрим несколько мо-
делей, основанных на сигнальных играх, а сейчас разберем
интересный частный случай сигнальных игр, когда выиг-
рыши не зависят от сообщений.
Бесплатные сигналы (Cheap-Talk Games). До сих
пор сообщения m не были чисто информационным дейст-
вием, поскольку выигрыши игроков от них зависели. Сей-
час мы рассмотрим случай, когда выигрыши зависят толь-
ко от типов и от действий, но не зависят от сообщений:
uS (t , a) и u R (t , a) .
Скрывающее равновесие в такой игре всегда сущест-
вует. Если m(t ) m* , то представления получателя опреде-
ляются как (t | m* ) p (t ) и оптимальным действием бу-
дет выбор a* из условий максимизации ожидаемого выиг-
рыша p (t ) uR (a, t ) . Действия a* игрок R в СБР выбира-
tT
ет в ответ на любое сообщение.
163
Лекции по теории игр и экономическому моделированию
Кажется, что ничего, кроме такого СБР в случае бес-
платных сигналов и быть не может. Но это не совсем так. В
рассмотренных ниже примерах найдены условия на функ-
ции выигрышей, при выполнении которых существуют, по
крайней мере, частично выявляющие равновесия.
Бинарная игра с бесплатными сигналами. Пусть
множества типов T {1,2} и действий A {1,2} состоят из
двух элементов каждое, а множество сообщений M T
совпадает с множеством сигналов. Приведем таблицу вы-
игрышей (это не игра в нормальной форме, а просто табли-
ца значений).
a\t 1 2
1 x,1 y, 0
2 z, 0 w,1
Выигрыши игрока R заданы, причем, если бы он
имел информацию о типе, то выбирал бы a t . Наша зада-
ча найти такие выигрыши x, y , z, w игрока S, при которых
существовало бы выявляющее равновесие.
1. Если x z и y w , то при любом типе игроку S
выгоднее, чтобы R сыграл 1, поэтому S будет пытаться
убедить R, что t 1 , но верить этому R не будет. Анало-
гично разбирается случай x z и y w .
2. Если x z и y w , то S будет пытаться убедить
R, что t 1 , когда t 2 , и наоборот. Поскольку R понима-
ет это, то верить он не будет.
3. Если x z и w y , оба игрока заинтересованы в
выявлении информации и стратегии m(t ) t и a( m) m
образуют выявляющее равновесие СБР.
Итак, в бинарной игре с бесплатными сигналами для
существования выявляющего СБР необходимо, чтобы ин-
тересы игроков качественно совпадали.
Непрерывная игра с бесплатными сигналами.
Множество типов состоит из отрезка T [0,1] с равномер-
ным распределением. Множества сообщений M T и
164
Лекция 13. Сигнальные игры
действий A T совпадают с множеством типов. Получа-
тель R хочет точно угадать тип. Его выигрыш равен
u R (t , a) (a t ) 2 . Отправитель S хочет угадать тип с за-
данным завышением. Выигрыш отправителя S равен
2
uS (t , a) a (t b) , b 0 .
Оказывается, что в этой игре существуют гибридные
кусочно-линейные СБР. Число кусков n зависит от вели-
чины рассогласования b .
Начнем с n 2 . Разобьем отрезок на два диапазона с
помощью x1 .
0 x1 1
0 1
Слева от x1 посылается сообщение 0, а справа – со-
общение 1.
Получатель знает тип с точностью до диапазона, по-
этому его оптимальный ответ – середина соответствующе-
x 1 x1
го диапазона: a(0) 1 , a(1) .
2 2
Отправитель пошлет сообщение 0 или 1, в зависимо-
x 1 x1
сти от того, что ближе к t b : a(0) 1 или a(1) .
2 2
Чтобы оптимальный ответ m(t ) совпадал с m(t ) 0 при
t x1 и m(t ) 1 при t x1 , должно быть выполнено усло-
вие
1 x 1 x2 1
x1 b 1 x1 2b .
2 2 2 2
165
Лекции по теории игр и экономическому моделированию
Для того чтобы это решение имело смысл, должно
1
быть выполнено b . При больших значениях рассогла-
4
сования b существует только скрывающее равновесие.
Заметим, что длины отрезков в СБР отличаются на
4b : (1 x1 ) ( x1 0) 4b .
Нетрудно показать, что это свойство сохраняется при
любом количестве n кусков. Пусть длина самого малень-
кого левого куска равна d . Тогда остальные длины обра-
зуют арифметическую прогрессию
d (d 4b) (d 8b) ( d (n 1) (4b)) 1 .
n(n 1)
Поскольку 1 2 ( n 1) , то уравнение
2
для d примет вид n d n(n 1) 2b 1 .
Если 2bn(n 1) 1 , то положительное решение урав-
нения существует. Обозначим через n* (b) максимальное
n , для которого 2bn(n 1) 1 . Найдем положительный ко-
1
рень квадратного уравнения n2 n 0 , равный
2b
1 1 1
. Целая часть этой величины равна n* (b) . При
2 4 2b
1
b получается n* (b) 1 , что соответствует скрывающе-
4
му равновесию.
Ясно, что при b 0 число кусков n* (b) , т.е.
гибридное равновесие становится все ближе к выявляю-
щему, но совпадет с ним только при полном совпадении
интересов игроков.
166
Лекция 13. Сигнальные игры
Задачи к лекции 13
13.1. Найдите скрывающее совершенное байесовское
равновесие, в котором отправитель любого типа играет r в
следующей сигнальной игре:
t1 0,1
1,2 l r
0.5 3,0
2,0
R 0 R
0,0 0.5 1,0
l r 2,2
t2
3,1
13.2. Рассмотрим сигнальную игру с тремя типами.
t1 0,1
1,1 l r
(1/3) 0,0
1,0
R R
2,1 t2 1,1
l (1/3) r 1,0
0,0
t3 0,0
1,1
l r 2,1
(1/3)
0,0
Найдите все скрывающие совершенные байесовские рав-
новесия, в которых отправитель любого типа играет l.
13.3. Рассмотрим две сигнальные игры.
167
Лекции по теории игр и экономическому моделированию
(1,1) а. (2,2)
u
u
[ p] t1 [q ]
l r
(2,0)
S 1
d
d 2 (0,0)
0
(0,0) (1,0)
u
1 u
S
2
(0,1) (1,1)
[1 p ] l t2 r [1 q]
d d
(3,0) б. (0,0)
u u
[q]
[ p] t1
l r
(1,1)
S 1
d
d 2 (4,1)
0
(3,3) (1,2)
u
1 u
S
2
(0,1) (2,0)
[1 p ] l t2 r [1 q]
d d
168
Лекция 13. Сигнальные игры
13.4. Найдите все совершенные байесовские равнове-
сия для двух игр из задач 13.1 и 13.2.
13.5. Рассмотрим сигнальную игру 2, аналогичную
динамической игре 1 с неполной, но несовершенной ин-
формацией, которую мы определили в лекции 12.
Игра 1:
1 R
L (1,3)
M
2
L R
R L
L t1 R a
(0,0) (1,3)
S 1
d 2
R R
(0,2) 0
u
1
S 2 a
(1,3)
(0,1)
M R
t2
d
Типы t1 и t2 аналогичны ходам L и M в сигнальной
игре. Если S получает сигнал R, то игра фактически закан-
чивается.
Найдите РБН в чистых стратегиях и СБР в данной
сигнальной игре 2. Сравните все РН и все СБР в игре 1.
169
Лекции по теории игр и экономическому моделированию
13.6. Найдите СБР в следующей игре с бесплатными
сигналами.
a\t 1 2 3
1 0,1 0,0 0,0
2 1,0 1,2 1,0
3 0,0 0,0 2,1
Все 3 типа равновероятны. Напомним, что это пла-
тежная матрица выигрышей игроков 1 и 2 в зависимости от
действия и от типа, а не матрица игры в нормальной фор-
ме.
13.7. Рассмотрим непрерывную игру с бесплатными
сигналами, описанную в лекции. Для каких значений b
существует трехступенчатое равновесие? В каком равнове-
сии ожидаемый выигрыш получателя больше: в трех- или в
двухступенчатом равновесии? Какому типу отправителя
лучше в трехступенчатом равновесии по сравнению с
двухступенчатым?
170
Лекция 14. Модели, основанные на сигнальных играх
Лекция 14
Модели, основанные на сигнальных играх
wL
wH
w1
e1 e2 e
Прежде чем переходить к поиску СБР в этой игре,
рассмотрим случай полной информации. Если фирма знает
тип работника, то она назначит ему зарплату w(t ) y (t , e) ,
а работник (в бытность студентом) выберет усилия e* (t ) ,
исходя из максимизации своего выигрыша y (t , e) c(t , e) .
It
y
y (e, t )
w* (t )
e* (t ) e
173
Лекции по теории игр и экономическому моделированию
Обозначим w* (t ) y (t , e* (t )) . Графически в точке
(e* (t ), w* (t )) происходит касание уровня безразличия и ли-
нии (для простоты ее можно изобразить прямой) выпуска
y (e, t ) .
При поиске СБР важным является то, насколько
близки типы работников. Может тип L выдержать уровень
обучения e* ( H ) ради более высокой зарплаты w* ( H ) или
его дополнительные затраты настолько высоки, что даже
более высокая зарплата не компенсирует эти затраты. Если
w* ( L) c( L, e* ( L)) w* ( H ) c ( L, e* ( H )) , то будем гово-
рить, что типы H и L сильно различимы.
y y ( H , e)
y ( L, e )
w* ( H )
w* ( L)
*
e* ( L ) e ( H ) e
Для этого случая легко построить выявляющее СБР.
Стратегия работника в этом СБР: выбирать оптимальный
уровень образования для своего типа e( H ) e* ( H ) и
e( L) e* ( L ) . С учетом этой стратегии работника ожидания
фирмы, которые задаются вероятностью ( H | e) , в этом
выявляющем СБР должны быть определены однозначно
при оптимальных уровнях образования на основании усло-
вия согласования представлений на равновесном пути. До-
определим эти представления вне равновесного пути так,
174
Лекция 14. Модели, основанные на сигнальных играх
чтобы игроку типа L было невыгодно маскироваться под
тип H: ( H | e) 0, e e* ( H ) , ( H | e) 1, e e* ( H ) .
Стратегия фирмы в СБР состоит в том, чтобы назна-
чать адекватную зарплату: w(e) y ( L, e) при e e* ( H ) и
w(e) y ( H , e) при e e* ( H ) .
Выигрыши обоих игроков в этом СБР совпадают со
случаем полной информации.
Более интересен случай, когда типы H и L слабо раз-
личимы, т.е. когда дополнительная зарплата компенсирует
типу L дополнительные затраты на более высокий уровень
обучения: w* ( L) c( L, e* ( L)) w* ( H ) c ( L, e* ( H )) .
w* ( L)
e* ( L) e* ( H ) eS e
176
Лекция 14. Модели, основанные на сигнальных играх
для типа L и ожидаемого выпуска при скрывающем СБР
py ( H , e) (1 p ) y ( L, e) .
IL
y ( H , e)
y IH
py ( H , e)
(1 p ) y ( L, e)
wP
y ( L , e)
w* ( L )
e* ( L ) eP y
где w w(e ) y ( L, e ) .
При этом с точки зрения фирмы должно быть выпол-
нено условие оптимальной зарплаты
p (1 p)
w y ( H , e ) y ( L, e ) .
p (1 p ) p (1 p )
Решение этого уравнения относительно сущест-
вует и единственно при y ( L, e ) w y ( H , e ) . Найдем
сначала вероятность q из условия
w qy ( H , e ) (1 q ) y ( L, e ) ,
p(1 q)
а затем вычислим вероятность .
q(1 p)
Для графического изображения гибридного равнове-
сия и сравнения его с найденными ранее выявляющим и
скрывающим равновесиям нам понадобятся четыре линии
выпуска: y ( H , e) для типа H, y ( L, e) для типа L и ожидае-
мого выпуска py ( H , e) (1 p ) y ( L, e) при скрывающем
СБР и ожидаемого выпуска qy ( H , e) (1 q) y ( L, e) при
гибридном СБР.
Уровень образования e для гибридного равновесия
лежит между оптимальным уровнем e* ( L ) образования
для типа L при выявлении информации и уровнем eS , ко-
торый позволяет различить типы.
178
Лекция 14. Модели, основанные на сигнальных играх
IH
IL y ( H , e)
qy ( H , e)
w
(1 q) y ( L, e)
w py ( H , e)
(1 p) y ( L, e)
y ( L, e )
*
w ( L)
e* ( L ) e eS e
Предприниматель и инвестор
Допустим, что предпринимателю нужно привлечь
внешние инвестиции для выполнения некоторого нового
привлекательного проекта. У предпринимателя есть при-
ватная информация о прибыльности существующей ком-
пании, но доход от нового проекта не может быть выделен
179
Лекции по теории игр и экономическому моделированию
на фоне доходов существующей компании. Все, что можно
наблюдать — это агрегированную прибыль фирмы.
Предположим, что предприниматель предлагает по-
тенциальному инвестору некоторую долю собственности
фирмы в обмен на необходимые для нового проекта инве-
стиции. В каком случае новый проект будет реализован, и
какова будет переданная доля фирмы?
Рассмотрим эту модель в виде сигнальной игры,
предположив, что доходы существующей фирмы могут
быть либо высокими t H , либо низкими t L , где
H L 0 . Пусть для реализации нового проекта необхо-
димы инвестиции I . Привлекательность проекта для инве-
стора характеризуется тем, что этот проект дает большую
доходность, чем альтернативный для инвестора вариант r
(скажем, банковский процент): R I (1 r ) .
Динамический сценарий игры.
1. Природа определяет доход текущий фирмы: t H
с вероятностью p или t L с вероятность 1 p .
2. Предприниматель узнает тип t и делает предложе-
ние потенциальному инвестору в виде доли s собственно-
сти фирмы, где 0 s 1 .
3. Инвестор видит s (но не t ) и принимает решение:
принять предложение или отказаться.
4. Если инвестор отказывается, то его выигрыш равен
I (1 r ) , а выигрыш предпринимателя равен t . Если инве-
стор соглашается, то его выигрыш равен s (t R) , а выиг-
рыш предпринимателя равен (1 s ) (t R) .
В этой сигнальной игре у получателя (инвестора)
всего два действия: согласиться или отказаться. У отправи-
теля (предпринимателя) множество сигналов больше, но,
как оказывается, этого недостаточно для эффективного
взаимодействия участников.
Начнем со скрывающего равновесия, в котором оба
типа посылают сигнал s . Представления инвестора долж-
180
Лекция 14. Модели, основанные на сигнальных играх
ны приписывать вероятность p типу L. В этом случае ус-
ловие согласия инвестора с предложением s имеет вид
s[ pL (1 p) H R] I (1 r ) .
Для предпринимателя его часть дохода после реали-
зации проекта (1 s ) (t R) не должна быть меньше теку-
щих доходов t :
R
(1 s ) (t R) t s .
tR
Отсюда видна верхняя грань для предложения с точки зре-
ния рациональности предпринимателя.
Оба условия на долю s могут быть выполнены, если
I (1 r ) R
.
pL (1 p) H R t R
При малых p это неравенство следует из условия
привлекательности проекта R I (1 r ) . При p , близких к
1, нужно дополнительно потребовать выполнение условия
H
R I (1 r ) I (1 r ) L,
R
т.е. проект должен быть не просто привлекательным, а
иметь определенную степень привлекательности по срав-
нению с альтернативным вариантом.
На содержательном уровне для этого скрывающего
равновесия получается, что тип H субсидирует на финан-
совом рынке тип L, поскольку минимальное предложение
I (1 r )
pL (1 p) H R
для типа H хуже, а для типа L лучше случая с полной ин-
формацией. Конечно, такие косвенные субсидии еще не
означают отказа инвестора от участия в проекте. Если при-
веденные выше условия существования скрывающего СБР
181
Лекции по теории игр и экономическому моделированию
выполнены, то потери от субсидирования перекрываются
доходами от участия в новом проекте.
I (1 r ) R
Если , то скрывающего рав-
pL (1 p) H R t R
новесия не существует, однако выявляющее равновесие в
этой игре существует всегда. В выявляющем равновесии
I (1 r )
предприниматель типа L предлагает долю , на что
LR
инвестор соглашается. Тип H не может сделать для себя
I (1 r ) R
невыгодное предложение s , а при любом
H R HR
I (1 r )
предложении s получит отказ. В итоге в выяв-
H R
ляющем СБР новый проект будет реализовывать на полу-
ченные инвестиции только слабый тип L. В этом неэффек-
тивность механизма переговоров предпринимателя и инве-
стора, обусловленная недостаточным разнообразием мно-
жества сигналов.
Обсудим кратко другой способ привлечения инве-
стиций: долговой контракт вместо передачи портфеля ак-
ций. Предположим, что инвестор соглашается на долговой
контракт в размере D . Если предприниматель не объявит о
своем банкротстве, то инвестор получит выигрыш D , а
выигрыш предпринимателя будет равен t R D . Если
предприниматель объявит о банкротстве, то его выигрыш
будет равен нулю, а выигрыш инвестора будет равен дохо-
ду перешедшей ему в собственность фирмы: t R .
Если L 0 , то скрывающее равновесие существует.
Оба типа просят в долг D I (1 r ) , на что инвестор со-
глашается. Если L 0 , причем R L I (1 r ) , то тип L не
может вернуть долг, даже с учетом доходов от нового про-
екта, поэтому инвестор не может в этом случае согласиться
на долговой контракт. Аналогичная ситуация возникает в
том случае, если H и L представляют ожидаемые (а не
гарантированные) доходы. Допустим, что доходы типа t
182
Лекция 14. Модели, основанные на сигнальных играх
могут быть либо t K , либо t K , причем с одинаковой
1
вероятностью . Если R L K I (1 r ) , то с вероятно-
2
1
стью предприниматель типа L не сможет расплатиться
2
по долговому контракту D I (1 r ) , а поэтому инвестор
не может согласиться на такой контракт.
Денежная политика. Добавим приватную информа-
цию в двухпериодную версию модели денежной политики,
которую мы уже рассматривали. В этой модели, как и в
модели Спенса, есть много скрывающих, выявляющих и
гибридных равновесий. Остановимся на них кратко.
Напомним, что в нашей модели выигрыш финансо-
вых властей считается равным
w( , e ) c 2 (b y* d ( e ) y* ) 2 ,
где — реальная инфляция, e — ожидаемая предприни-
мателями инфляция, y* — эффективный уровень выпуска.
Однопериодный выигрыш предпринимателей равен
( e ) 2 .
В двухпериодной модели выигрыши игроков опреде-
лим просто как сумму однопериодных выигрышей:
w(1 , 1e ) w( 2 , 2e ) и (1 1e )2 ( 2 2 e ) 2 ,
где t — реальный уровень инфляции в периоде t , а te –
ожидаемый предпринимателями уровень инфляции на на-
чало периода t .
Параметр c в определении функции выигрыша
w( , e ) характеризует готовность к компромиссу между
двумя критериями: нулевая инфляция и эффективный вы-
пуск. Раньше мы предполагали, что значение этого пара-
метра общеизвестно. Теперь будем считать, что этот пара-
метр является приватной информацией финансовых вла-
183
Лекции по теории игр и экономическому моделированию
стей: c S — сильная борьба с инфляцией, c W — сла-
бая борьба с инфляцией, где S W 0 .
Динамический сценарий двухпериодной игры.
1. Природа определяет тип денежных властей c . Ве-
роятность c W равна p .
2. Предприниматели формируют ожидания 1e ин-
фляции первого периода, не зная типа властей.
3. Власти узнают 1e и выбирают уровень реальной
инфляции 1 первого периода.
4. Предприниматели узнают 1 (но не c ) и форми-
руют ожидания инфляции 2e второго периода.
5. Власти узнают 2e и выбирают уровень реальной
инфляции 2 второго периода.
Заметим, что в этой динамической игре с неполной
информацией можно выделить встроенную сигнальную
игру. Выбор реальной инфляции первого периода можно
трактовать, как сигнал, который власти отправляют пред-
принимателям. Ожидания предпринимателями уровня ин-
фляции второго периода можно интерпретировать как дей-
ствия получателя в ответ на полученный сигнал. Ожидания
первого периода — это ход до сигнальной игры, а опреде-
ление реального уровня инфляции во втором периоде —
это ход после сигнальной игры.
Напомним, в однопериодной игре (эта игра ранее
рассматривалась как этап повторяющейся игры) оптималь-
ный выбор финансовых властей в ответ на ожидания пред-
принимателей был найден в виде
d
* ( e ) 2
[(1 b) y* d e ] .
cd
184
Лекция 14. Модели, основанные на сигнальных играх
По аналогии можно найти оптимальный ответ вла-
стей на ожидания предпринимателей во втором периоде
d
для типа c : 2* ( 2e , c ) 2
[(1 b) y* d 2e ] .
cd
В скрывающем равновесии оба типа выбирают один
и тот же уровень инфляции * , поэтому в равновесии
ожидания инфляции предпринимателями должны быть та-
кими же: 1e * . Представления предпринимателей на
равновесном пути должны быть таковы, что они ожидают
тип W у властей с вероятностью p . С учетом действий
властей во втором периоде ожидания предпринимателей
2e ( p ) находятся из максимизации
p( 2* ( 2 e ,W ) 2e ) 2 (1 p)( 2* ( 2 e , S ) 2 e ) 2 .
Власти типа c выбирают во втором периоде инфляцию на
уровне 2* ( 2 e ( p), c) , и игра кончается.
Для завершения построения скрывающего СБР нуж-
но еще определить представления и действия вне равно-
весного пути, чтобы ни одному из типов отправителя (вла-
стям) не выгодно было отклониться.
В выявляющем равновесии каждый тип шлет свой
сигнал: W и S (разные уровни реальной инфляции пер-
вого периода в зависимости от типа финансовых властей).
Ожидания предпринимателей инфляции первого периода
теперь равны
1e p W (1 p ) S .
Увидев, что реальная инфляция в первом периоде
оказалась равной W , предприниматели начинают второй
период с уверенностью, что c W , и значит, формируют
ожидания 2e (1) . Аналогично, если инфляция оказалась на
уровне S , то это приводит к ожиданиям 2e (0) . В равно-
185
Лекции по теории игр и экономическому моделированию
весии слабый тип выбирает 2* ( 2 e (1), W ) , а сильный тип
выбирает 2* ( 2 e (0), S ) , после чего игра кончается.
Для завершения конструкции выявляющего равнове-
сия нужно еще построить представления и действия вне
равновесного пути, а также проверить условия невыгодно-
сти отклонения для обоих типов властей. В частности, у
властей типа L не должно быть соблазна в первом периоде
выбрать уровень инфляции S с тем, чтобы на основе (не-
адекватных) ожиданий 2e (0) добиться суммарно больше-
го выигрыша за счет второго периода. Для широкого диа-
пазона параметров здесь возникает эффект, похожий на
модель Спенса. Уровень S в выявляющем СБР приходит-
ся держать ниже уровня инфляции в игре с полной инфор-
мацией с тем, чтобы блокировать возможность слабому
типу выставлять себя за сильного.
Задачи к лекции 14
14.1. Найдите другой вариант представлений и дейст-
вий вне равновесного пути для скрывающего СБР для мо-
дели Спенса.
14.2. Нарисуйте линии безразличия и производствен-
ной функции для сигнальной игры на рынке труда с двумя
типами работника. Найдите гибридное СБР, в котором вы-
сокоэффективный работник использует смешанную стра-
тегию.
14.3. Два партнера делят общую собственность.
Партнер 1 владеет долей s , а партнер 2 владеет долей
1 s . Партнеры соглашаются играть в следующую игру:
партнер 1 называю цену p за всю собственность, а парт-
нер 2 решает: либо купить долю партнера 1, заплатив ему
p s , либо продать ему свою долю, получив p (1 s ) . Бу-
дем считать общеизвестным, что личные оценки стоимости
собственности партнеров независимы и равномерно рас-
пределены на отрезке [0, 1], но своя оценка известна каж-
186
Лекция 14. Модели, основанные на сигнальных играх
дому партнеру и является его приватной информацией.
Найдите СБР.
14.4. Покупатель и продавец имеют оценки стоимо-
сти товара vB и vS . Общеизвестно, что vB vS , т.е. что
сделка между ними потенциально прибыльна. Предполо-
жим, что оценка продавца равномерно распределена на
отрезке [0, 1] и является его приватной информацией. Из-
вестно, что vB k vS , причем коэффициент k 1 общеиз-
вестен. Покупатель знает k , но он не знает vB (и vS ).
Продавец знает vS и k , а потому и vB . Предположим, что
продавец делает сигнальное предложение с ценой p , ко-
торое покупатель принимает или отвергает. Каким будет
СБР при k 2 ? А при k 2 ?
14.5. Предположим, что в Конгрессе обсуждается по-
литическое решение p , которое может принимать значе-
ния от 0 до 1. Идеальное значение с точки зрения Конгрес-
са равно c , а нынешнее значение (status quo) равно s ,
причем 0 c s 1 . Конгресс хотел бы изменить ситуа-
цию, но закон об изменении должен быть еще подписан
президентом. Его идеал t известен ему самому, но осталь-
ные знают только, что t равномерно распределено на от-
резке [0,1]. Порядок ходов такой: Конгресс принимает ре-
шение p , а президент либо подписывает закон, либо нала-
гает вето. Если p подписано, то выигрыш Конгресса пола-
гается равным (c p ) 2 , для президента выигрыш равен
(t p) 2 . Найдите СБР и проверьте, что в равновесии
c p s.
Предположим теперь, что перед принятием в Кон-
грессе решения президент может прибегнуть к риторике
(т.е. послать бесплатное сообщение). Рассмотрим СБР в
этой игре, причем в этом равновесии решение Конгресса
pL или pH зависит от сообщения, посланного президен-
187
Лекции по теории игр и экономическому моделированию
том. Покажите, что в таком равновесии не может быть вы-
полнено c pL pH s . Объясните, почему не могут су-
ществовать равновесия с тремя или более решениями Кон-
гресса в ответ на сообщение президента. Постройте равно-
весие с двумя решениями c pL pH s . Каким должно
быть pH и какими должны быть сообщения в зависимости
от типа?
188
Задачи письменных работ за прошлые годы
Задачи письменных работ за прошлые годы
190
Задачи письменных работ за прошлые годы
угля qij . Тогда qi qiA qiB составляет совокупный выпуск
фирмы i {1, 2} , а q j q1j q2j есть совокупный объем уг-
ля, проданный в стране j { A, B} . Цена на уголь в странах
А и В задается с помощью линейной обратной функции
спроса: p j 90 q j , j { A, B} . Затраты на производство
продукции составляют ci ( qi ) 10qi , i {1,2} .
(а) Предположим, что между странами отсутствует тор-
говое соглашение, и импорт в обеих странах запрещен. Это
приводит к политическому ограничению q2A q1B 0 . Какие
тогда будут размеры производства q1A и q2B ? (6 очков)
Предположим, что страны подписали договор о сво-
бодной торговле, позволяющий иностранным фирмам про-
давать продукцию в их странах без всяких пошлин. Одна-
ко, имеются затраты на транспортировку. Если фирма i
продает продукцию qij в чужой стране (фирма 1 в В, а
фирма 2 в А), то затраты на транспортировку равны 10qij .
Предположим, что обе фирмы принимают решение о вы-
боре qiA , qiB одновременно, i {1, 2} .
(б) Смоделируйте эту ситуации как игру в нормаль-
ной форме. (8 очков)
(в) Найдите равновесие Нэша в игре из пункта (б).
Оно единственно? (8 очков)
Предположим теперь, что до начала игры из пункта
(б) отдел исследований фирмы 1 обнаружил, что перевозка
угля на современных судах влечет загрязнение окружаю-
щей среды. Если фирма пошлет об этом доклад во Всемир-
ную Торговую Организацию (ВТО), то ВТО запретит пере-
возку на существующих судах. Переход на новые техноло-
гии в транспортировке угля увеличит затраты до 40qij (по
сравнению 10qij сейчас).
191
Лекции по теории игр и экономическому моделированию
(г) Захочет ли фирма 1 передавать информацию в
ВТО? Подтвердите свой вывод анализом равновесий (8
очков).
192
Задачи письменных работ за прошлые годы
можность распоряжаться своей долей. Будем считать, что
каждому важна не только его доля, но и размер доли дру-
гого.
Предположим сначала, что оба участника дележа за-
вистливы. Свой выигрыш они оценивают величиной
u x y , где x — своя доля, y — доля другого, —
одинаковая для обоих степень зависти, причем 0 1 .
а) Один из игроков предлагает вариант дележа по-
дарка, а второй может или согласиться, или отказаться. В
случае согласия происходит дележ на основе сделанного
предложения. При отказе каждый получает ноль. Приме-
ните обратную индукцию для поиска равновесия.
б) Дележ происходит в два этапа. Второй этап насту-
пает после отказа на первом этапе. Право предлагать дележ
на втором этапе определяется жребием: бросается симмет-
ричная монета. Считается, что оба этапа проводятся в один
день, поэтому время получения выигрыша не учитывается
участниками при принятии решений. Если на втором этапе
получен отказ от дележа, то выигрыш каждого считается
равным нулю. Примените обратную индукцию для поиска
равновесия.
в) повторите а) и б) для альтруистичных участников:
u x y .
Задача 4. Ниже приведены несколько статических
игр и профилей стратегий игроков в соответствующих по-
вторяющихся играх. Проверьте, образуют ли данные про-
фили стратегий СПРН в бесконечно повторяющейся игре с
коэффициентом дисконтирования 0.99 .
а) Игра. Каждый из n игроков, n 2 , может вложить
1 в проект по созданию общественного продукта. Размер
созданного общественного продукта будет равен
y ( x1 xn ) / 2 , где xi {0,1} — вклад в общее дело
игрока i . Выигрыш игрока i равен y xi .
Профиль стратегий. Игрок i вкладывает xi 1 в пер-
вом повторении и до тех пор, пока во всех прошлых повто-
193
Лекции по теории игр и экономическому моделированию
рениях уровень произведенного общественного продукта y
был больше 1/4. Иначе игрок i выбирает xi 0 .
б) Игра. Дуополия Курно. Есть две фирмы. Обе фир-
мы ( i 1, 2 ) одновременно и независимо друг от друга на-
значают размер qi выпуска своей продукции. Цена прода-
жи продукции фирм определяется по формуле
P max{0,1 q1 q2 } . Затраты по выпуску продукции
считаются нулевыми.
Профиль стратегий. Есть два состояния: Картель и
Конкуренция. От этих состояний зависит действие игрока.
В состоянии «Картель» выпуск фирмы равен 1/4. В состоя-
нии «Конкуренция» выпуск фирмы равен 1/2. Игра начи-
нается в состоянии «Картель». Если в прошлом периоде
было состояние «Картель» и наблюдались выпуски на
уровне 1/4, то состояние «Картель» сохраняется в текущем
периоде. Иначе наступает состояние «Конкуренция». По-
сле Конкуренции происходит автоматический возврат к
Картелю.
в) Игра. Как в б).
Профиль стратегий. В отличие от б) переход из со-
стояния «Конкуренция» в состояние «Картель» происходит
в том и только том случае, когда в Конкуренции оба выби-
рают 1/2. Иначе после Конкуренции в следующем периоде
опять сохраняется состояние «Конкуренция».
194
Задачи письменных работ за прошлые годы
б) Проведите процесс последовательного исключе-
ния строго доминируемых стратегий с использованием
смешанных стратегий (подсказка: чистая стратегия может
доминироваться смешанной стратегией).
с) Найдите РН в смешанных стратегиях.
Задача 2. Рассмотрим следующую игру в разверну-
той форме.
196
Задачи письменных работ за прошлые годы
Контрольная работа 2008 года. Вариант 1
Задача 1. Рассмотрим следующую игру в нормаль-
ной форме, в которой игрок 1 выбирает строки, а игрок 2
— столбцы.
Л С П
В (3,0) (0,3) (0,1)
Ц (0,3) (3,0) (0,1)
Н (1,0) (1,0) (1,1)
а) Найдите хотя бы два (а если можете, то все) равно-
весия Нэша (РН).
б) Заменим теперь все выигрыши, равные 1, на выиг-
рыши, равные 2. Про каждое найденное в а) РН скажите,
сохранится оно или нет при такой замене.
Подсказка: Не забудьте про смешанные стратегии.
Задача 2. На аукционе продается купюра в 100 дол-
ларов. Имеется два покупателя. Покупатели одновременно
и независимо друг от друга подают свои заявки
bi {0,1, 2,..., 99} , i 1, 2 . Побеждает на аукционе тот по-
купатель, который подал наибольшую заявку. При равен-
стве заявок победитель (равновероятно) определяется жре-
бием. Победитель получает купюру в 100 долларов, запла-
тив то, что указал в заявке. Выигрыш проигравшего на
аукционе равен 0.
а) Постройте соответствующую данной ситуации иг-
ру в нормальной форме.
б) Проведите процесс последовательного исключе-
ния доминируемых стратегий.
в) Найдите все РН в этой игре.
Задача 3. а) Найдите все совершенные по подыграм
РН (СПРН) в следующей игре в развернутой форме.
197
Лекции по теории игр и экономическому моделированию
200
Задачи письменных работ за прошлые годы
Какие из следующих профилей стратегий являются
СПРН?
а) Стратегия каждого игрока: всегда играть С.
б) Стратегия каждого игрока: играть С первый раз, по-
том играть то, что другой сыграл в предыдущем периоде.
в) Есть четыре состояния: Кооперация (К), Наказание
игрока 1 (Н1), Наказание игрока 2 (Н2), Индивидуализм
(И). Начинаем в состоянии К. В этом состоянии оба игрока
играют С. В состоянии Нi игрок i играет С, а другой иг-
рок играет D. В состоянии И оба игрока играют D. Если
игроки попали в состояние И, то они в нем так и остаются.
Из любого другого состояния следует переход в состояние
К, если игроки не отклоняются от предписанных этому со-
стоянию действий. Если один игрок i отклоняется от
предписанного состоянию действия (а другой нет), то сле-
дует переход в состояние Нi . Если оба игрока отклоняют-
ся одновременно, то следует переход в состояние И.
Подсказка. Во всех случаях аккуратно сформули-
руйте стратегию каждого игрока, как совокупность функ-
ций от наблюдаемых действий в прошлых периодах.
Л С П
В (2,–1) (4,2) (2,0)
Ц (3,3) (0,0) (1,1)
Н (1,2) (2,8) (5,1)
203
Лекции по теории игр и экономическому моделированию
в) Игра. Как в б).
Профиль стратегий. В отличие от б) переход из со-
стояния «Конкуренция» в состояние «Картель» происходит
в том и только том случае, когда в Конкуренции оба выби-
рают 1/2. Иначе после Конкуренции в следующем периоде
опять сохраняется состояние «Конкуренция».
204
Задачи письменных работ за прошлые годы
Задача 2. Рассмотрим следующую игру в нормаль-
ной форме, в которой игрок 1 выбирает строки, а игрок 2
— столбцы.
a b c d e
A (2,5) (0,2) (1,2) (5,1) (2,3)
B (0,2) (3,8) (4,6) (4,9) (2,3)
205
Лекции по теории игр и экономическому моделированию
фирма 1 получит выигрыш 1, в то время как фирма 2 полу-
чит 2. Если фирма 1 решит покинуть рынок, не вступая в
борьбу, то с учетом затрат на вход в рынок фирма 1 полу-
чит выигрыш, равный -1, а фирма 2 получит 6.
а) Изобразите дерево соответствующей игры в раз-
вернутой форме.
б) Найдите СПРН методом обратной индукции.
в) Постройте нормальную форму данной игры.
г) Найдите все РН.
206
Задачи письменных работ за прошлые годы
ределенные психологические затраты. Пусть выигрыш от
информирования полиции оценивается величиной v , при-
чем неважно, кто именно и сколько человек позвонит, а
затраты оцениваются величиной c . Пусть v c 0 . Счи-
тается, что выигрыш индивида равен 0, если никто не по-
звонил, равен v , если позвонил кто-то другой и равен
v c , если позвонил он сам.
а) Найдите РН в чистых стратегиях в этой игре.
б) Найдите симметричное РН в смешанных стратеги-
ях, в котором каждый игрок звонит в полицию с вероят-
ность p (0,1) .
в) Проанализируйте найденное в б) РН в зависимости
от параметров v и c . Что будет происходить с возрастани-
ем n с вероятность звонка в полицию фиксированного
свидетеля и вероятностью того, что хотя бы кто-то позво-
нит?
Тип О
затраты квалификация
выбор Л 2 2
К 8 10
После окончания университета игрок 1 нанимается
на работу в фирму (игрок 2). Игрок 2 может взять игрока 1
в один из двух отделов: традиционные технологии (Т) или
высокие технологии (В). Зарплата в Т-отделе равна 2, а в
В-отделе — 6. Выигрыш игрока 1 считается равным разно-
сти: зарплата минус затраты на обучение.
Выигрыш игрока 2 зависит от назначения в отдел и
типа работника. При назначении в В-отдел выигрыш фир-
мы равен разности: квалификация нанятого работника ми-
нус его зарплата. При назначении в Т-отдел выигрыш
фирмы составляет половину квалификации работника ми-
нус зарплата.
(а) Изобразите развернутую форму игры (8 очков).
1
(б) Пусть p . Приведите матричную форму байе-
2
совской игры (8 очков). Подсказка: сколько у каждого иг-
рока стратегий? Сколько чисел (выигрышей) нужно поста-
вить в каждую клетку матрицы?
(в) Найдите все равновесия Байеса-Нэша в чистых
стратегиях (4 очков)
(г) Найдите все совершенные байесовские равнове-
сия в чистых стратегиях (8 очков)
Задача 3. Что посеешь, то и пожнешь. (30 очков)
Крестьянин владеет некоторым участком, где он мо-
жет заниматься земледелием. Выход продукции зависит от
его трудолюбия. Уровень собственного трудолюбия кре-
стьянину известен. Остальные знают только, что трудолю-
бие крестьянина t равномерно распределено на отрезке
[0, 1]. Будем считать, что выигрыш крестьянина от обра-
ботки своей земли равен его трудолюбию t .
210
Задачи письменных работ за прошлые годы
Прежде, чем начать обрабатывать свою землю, кре-
стьянин идет на соседнюю фабрику и предлагает взять его
для работы на конвейере. Крестьянин может попросить
хозяина фабрики любую заплату w 0 , а хозяин может
либо согласиться (С) с этим предложением, либо отказать-
ся (О) от него. Если хозяин отказывается от предложения
крестьянина, то тот возвращается к земледелию, выигрыш
хозяина считается равным 0. Если хозяин соглашается
взять к себе на работу крестьянина с заплатой w , то выиг-
рыш крестьянина считается равным его зарплате w , а вы-
3
игрыш хозяина равен t w , причем эта информация о
2
выигрышах общеизвестна.
(а) Это игра с полной или неполной информацией? (2 очка).
(б) Опишите множества чистых стратегий обоих иг-
роков (4 очка).
(в) Найдите равновесия Байеса–Нэша в чистых стра-
тегиях в этой игре (10 очков).
(г) Для равновесий из пункта (в) найдите возможные
уровни общественного благосостояния (сумма выигрышей
крестьянина и хозяина, осредненная по типу крестьянина)
(4 очка)
(д) Местный политик, который выступает за рост
общественного благосостояния, предлагает урезать субси-
дии на воду фермерам, что снизит для крестьянина типа t
1
выигрыш от земледелия на собственном участке до t , но
2
не окажет влияния на продуктивность крестьянина при ра-
боте на фабрике. Можно ли анализом равновесий подтвер-
дить позицию местного политика, если исходить из крите-
рия общественного благосостояния? (10 очков)
Задача 4. Разбавленное удовольствие. (30 очков)
Рассмотрим взаимоотношения бармена и посетителя.
Бармен подает посетителю виски с водой, выбирая долю
211
Лекции по теории игр и экономическому моделированию
виски x [0, 1] и долю воды 1 x . Затраты на одну пор-
цию составляют для бармена величину c x , где c 0 .
Не зная x , посетитель решает, купить порцию или
нет по рыночной цене p . Если он решается на покупку, то
его выигрыш равен v x p , а выигрыш бармена равен
p c x . Предположим, что v c и что информация о вы-
игрышах общеизвестна. Если посетитель отказывается от
покупки, то его выигрыш считается равным 0, а выигрыш
бармена равен величине c x . Предположим, посетитель
является опытным и способным по вкусу распознать долю
x , но только после того, как заплатит за выпивку.
(а) Это игра с совершенной или несовершенной ин-
формацией? (2 очка)
(б) Постарайтесь как можно лучше изобразить дерево
этой игры (4 очка)
(в) Найдите все равновесия Нэша в этой игре (5 оч-
ков)
(г) Предположим, что приезжий посетитель приходит
в бар каждый вечер своей десятидневной командировки, и
что каждый игрок стремится максимизировать суммарный
(без дисконтирования) выигрыш за эти 10 вечеров. Найди-
те все совершенные по подыграм равновесия Нэша (СПРН)
в этой игре (4 очка)
(д) Предположим, что посетитель местный и что иг-
ра повторяется бесконечное число раз. Пусть игроки стре-
мятся к максимизации суммы дисконтированных ежеднев-
ных выигрышей с некоторым коэффициентом дисконтиро-
вания (0,1) . При каких ценах p существует СПРН, в
котором бармен каждый день выбирает x 1 , а посетитель
соглашается на покупку? (10 очков)
(е) При каких существуют такие цены, как в пунк-
те (д)? (5 очков)
212
Задачи письменных работ за прошлые годы
Задачи экзамена 2006 год
Задача 1. Рассмотрим следующую игру в разверну-
той форме.
0 (Природа)
1/3 2/3
1
2 R
a b L
a
(0,0) b (1,1)
(2,2)
(0,0) (2,2)
213
Лекции по теории игр и экономическому моделированию
зарплату w , равную ожидаемому уровню его производи-
тельности.
(2.1) Какой уровень образования выберет тип L в лю-
бом выявляющем равновесии?
(2.2) Каков наименьший уровень образования для ти-
па H в выявляющем равновесии?
(2.3) Найдите эффективный уровень образования для
типа H как функцию от a . Под эффективным образовани-
ем понимается максимизация производительности минус
затраты.
(2.4) Рассмотрим эффективное выявляющее равнове-
сие, при котором уровень образования для обоих типов
выпускников является эффективным. Найдите множество
всех значений a , при которых такое равновесие существу-
ет.
Задача 3. Есть три участника рынка: один продавец и
два потенциальных покупателя неделимого товара. Обще-
известно, что оценки стоимости этого товара для покупа-
телей являются независимыми случайными величинами,
равномерно распределенными на отрезке [0, 1], а затраты
продавца на производство товара будем считать нулевыми.
Правила аукциона на данном рынке таковы. Сначала поку-
патель 1 предлагает продать продавцу товар по цене b 0 ,
скрытой от покупателя 2. Увидев цену b , продавец может
либо согласиться на сделку, либо отказаться от нее и пред-
ложить покупателю 2 купить у него товар по цене p 0 .
Если покупатель 2 соглашается на сделку, то он получает
товар по цене p . Если покупатель 2 отказывается от сдел-
ки, то товар достается покупателю 1 по цене b .
(3.1) Какова вероятность согласия покупателя 2 на
сделку при условии, что он получил от продавца предло-
жение с ценой p ? Запишите ожидаемый выигрыш продав-
ца в этом случае как функцию от b и p . Запишите пред-
ложение, которое сделает продавец покупателю 2 в равно-
весии, как функцию от предложения b покупателя 1.
214
Задачи письменных работ за прошлые годы
(3.2) Если покупатель 1 предлагает цену b , то какова
вероятность того, что в равновесии продавец вернется к
сделке с ним? Каков ожидаемый выигрыш покупателя 1
как функция от его оценки стоимости товара v1 и его
предложения b ? Какова равновесная торговая стратегия
покупателя 1?
(3.3) Вычислите ожидаемый выигрыш продавца в
равновесии.
Задача 4. Рассмотрим следующую торговую игру
между продавцом и покупателем. Сначала продавец произ-
водит товар низкого качества ( q 0 ) или высокого качест-
ва ( q 1 ). Затраты на производство товара низкого качест-
ва считаем равными 0, а затраты на производство товара
высокого качества полагаем равными 1. Потребительная
стоимость высококачественного товара для покупателя
оценивается величиной v(1) 3 , а товара низкого качества
— величиной v(0) 1 . Покупатель не знает качества про-
изведенного товара, но по правилам торгов он может пред-
ложить один трех вариантов цены покупки p : 0.5, 1.5 или
2.5. Узнав предложенную цену p , продавец может согла-
ситься на сделку или отказаться от нее. Если продавец со-
глашается, то его выигрыш равен p q , а выигрыш поку-
пателя равен v( q) p . Если продавец отказывается от
сделки, то его выигрыш равен q , а выигрыш покупателя
равен 0.
(4.1) Изобразите дерево этой игры.
(4.2) Найдите совершенное по подыграм равновесие
Нэша (СПРН). Отметьте равновесные действия продавца и
покупателя во всех вершинах дерева игры. Определите вы-
игрыши игроков в равновесии.
Предположим теперь, что эта игра повторяется бес-
конечное число раз с одним и тем же продавцом, но раз-
ными потенциальными покупателями в каждом периоде.
Новый покупатель знает качество товара, проданного во
215
Лекции по теории игр и экономическому моделированию
всех предшествующих периодах. Если товар не продан в
данном периоде, то он портится, и продавец должен произ-
вести к следующему периоду новую единицу товара. Ко-
эффициент дисконтирования для выигрышей продавца за
период равен .
Отметим, что повторение СПРН из (4.2) составляет
СПРН в повторяющейся игре, но оно не идеально для про-
давца. Идеальным для продавца было бы производство вы-
сококачественного товара каждый период при получении
предложения от покупателей цены 2.5.
(4.3) Предположим, что по некоторым причинам по-
купатели всегда предлагают цену 2.5, если продавец нико-
гда в прошлом не продавал товар низкого качества. Найди-
те условия на , при которых в ответ на такую стратегию
покупателей продавец всегда будет производить товар вы-
сокого качества.
(4.4) На самом деле покупатели могут предлагать це-
ны, меньшие 2.5, но продавец может взять обязательство
не соглашаться на сделку по цене 0.5 или 1.5. При каких
значениях продавец в СПРН производит в каждом пе-
риоде товар высокого качества и получает в каждом пе-
риоде от покупателя предложение цены 2.5, причем если
покупатель отклоняется от цены 2.5, то продавец отказы-
вается от сделки по любой меньшей цене?
217
Лекции по теории игр и экономическому моделированию
аукционе побеждает тот, кто поставил большую ставку.
При равенстве ставок бросается жребий. Каждый обязан
заплатить по средней ставке даже, если ему объект не
достается! (Отказаться от участия в этом аукционе нель-
зя.)
a) Выпишите функции выигрыша в данной игре.
б) Найдите симметричное равновесие Байеса–Нэша
(РБН) в данной игре в классе квадратичных стратегий:
bi (vi ) c vi2 a , где c 0, a 0 .
в) Покажите, что в этой игре нет других РБН с глад-
кими возрастающими стратегиями b(vi ) .
Задача 4. Рассмотрим следующую сигнальную игру.
а) Найдите все выявляющие совершенные байесов-
ские равновесия (СБР).
б) Найдите все скрывающие СБР.
в) Найдите СБР в смешанных стратегиях, в котором
игрок 1 хотя бы одного типа выбирает L и R с положитель-
ной вероятностью.
221
Лекции по теории игр и экономическому моделированию
a) В предположении, что общеизвестно, найдите
СПРН, используя обратную индукцию.
b) Пусть теперь Банкир не знает , т.е. является
приватным параметром Конкурсанта, а Банкир зна-
ет только, что — случайная величина, причем
1
выполняется следующее условие: Pr x 2 x
2
для любого x 1 2 . Рассмотрим пороговую страте-
гию конкурсанта 0 ( p0 ) , 1 ( p1 ) : соглашаться на
цену p0 в первом раунде, если 0 ( p0 ) , и со-
глашаться на цену p1 во втором раунде, если
1 ( p1 ) . Найдите необходимые и достаточные
условия на функции 0 ( p0 ) , 1 ( p1 ) , при которых
описанная пороговая стратегия Конкурсанта соот-
ветствует СБР.
Подсказка. Некоторые из следующих формул могут
оказаться полезными:
1 1 2( x y )
при любых x y выполнено Pr x | y ;
2 2 1 2y
a 1
1
при любых 1 выполнено Pr( a ) 1 ;
2
при любых a b 1 выполнено
1 1
b 1
a 1
Pr( b | a ) 2 2 .
1
1 a 1
2
222
Задачи письменных работ за прошлые годы
рые производят на экспорт для продажи на мировом рынке
однородный продукт. Цена спроса на этот продукт на ми-
ровом рынке определяется по формуле p (Q ) a Q , где
Q q1 q2 — суммарный выпуск продукта в странах 1 и 2.
Затраты в стране i на выпуск qi до инноваций равны
4
C ( qi ) c qi , причем 0 a c a . Обозначим государст-
9
венные субсидии на инновации в стране i через xi . Эти
субсидии приводят к новой функции затрат:
Ci (qi , xi ) (c xi ) qi . Затраты государства на субсидии рав-
1
ны TCi ( xi ) xi2 .
2
События развиваются последовательно в два этапа.
(1) Государства одновременно и независимо выби-
рают уровни субсидий xi 0 .
(2) Зная уровни субсидий обоих государств, фирмы
одновременно и независимо выбирают уровни выпуска
qi 0 .
Выигрыш фирмы равен
i ( q1 , q2 , x1 , x2 ) p (Q) qi Ci ( qi , xi ) .
Выигрыш государства равен
Wi (q1 , q2 , x1 , x2 ) i (q1 , q2 , x1 , x2 ) TC ( xi ) .
(а) При заданных уровнях субсидий ( x1 , x2 ) найдите
равновесие Нэша (РН) для фирм на этапе 2, а также выиг-
рыши фирм и государств в этом РН.
(б) Найдите совершенное по подыграм равновесие
Нэша в соответствующей динамической игре государств и
фирм.
Задача 2. Синергетические отношения. Усилия
ei 0 каждого двух индивидов i 1, 2 в рамках некоторого
совместного дела влияют на выигрыши друг друга:
223
Лекции по теории игр и экономическому моделированию
ui (ei , e j ) ei (e j ei ) e j , где j 3 i .
(а) Найдите РН в этой игре и выигрыши игроков в нем.
(б) Рассмотрим теперь соответствующую бесконечно
повторяющуюся игру G (, ) с коэффициентом дисконти-
рования 0 1 . Обозначим через e0 индивидуальные
усилия в РН статической игры (из пункта (а)). Рассмотрим
следующую релейную стратегию, зависящую от выбранно-
го уровня усилий k : прикладывать усилие k в первом по-
вторении и потом, пока во всех предыдущих повторениях
другой индивид также прикладывает усилие k , а иначе
переходить на усилия e0 . При каких в зависимости от k
профиль таких релейных стратегий образует СПРН в бес-
конечно повторяющейся игре G (, ) ?
(в) Изобразите графически профили (пары) выигры-
шей игроков в СПРН, основанных на данных релейных
стратегиях.
Задача 3. Сигнальная реклама. Компания «Гло-
ток» представляет новый напиток типичному потребителю.
Напиток может быть Хорошим или Плохим. Априорная
вероятность Хорошего напитка равна 0.6. Зная, каким по-
лучился новый напиток, компания выбирает уровень рек-
ламы: массированная реклама с затратами c или мини-
мальная реклама с нулевыми затратами. Наблюдая уровень
рекламной активности, но, не зная качества нового напит-
ка, типичный потребитель решает, покупать ли ему этот
продукт. С учетом цены на продукт будем считать, что вы-
игрыш потребителя от покупки равен +1, если напиток Хо-
роший, и 1 , если Плохой. Если потребитель не купит на-
питок, то его выигрыш равен 0. Если напиток Хороший и
типичный потребитель купит его, то фирму ожидает боль-
шой доход R . Если напиток Плохой, но типичный потре-
битель его все-таки купит, то фирму ожидает меньший до-
ход r . Если типичный потребитель не купит напиток, то
доход компании равен 0. Предполагается, что 0 r c R .
224
Задачи письменных работ за прошлые годы
(а) Сформулируйте соответствующую сигнальную
игру и изобразите ее графически.
(б) Найдите выявляющее совершенное байесовское
равновесие (СБР) в этой игре.
(в) Найдите скрывающее СБР в этой игре.
(г) Найдите СБР, если вероятность Хорошего напит-
ка равна 0.4.
(д) Найдите СБР, если 0 c r R , а вероятность
Хорошего напитка равна 0.6.
Задача 4. Как ставить оценки? Имеются препода-
ватель и студент. Преподаватель знает, что студенты бы-
вают двух типов H и L. Студент знает свой тип, а препода-
ватель нет. Известно, что априорная вероятность типа H
равна [0, 1] . События развиваются в следующем поряд-
ке.
Преподаватель устанавливает границу [0, 100] в оч-
ках для положительной оценки.
Зная свой тип и эту границу, студент решает, выбрать ли этот
предмет в качестве альтернативного курса или нет.
Если студент не выбрал этот курс, то преподаватель по-
лучает 0, а студент — величину Wt , где t {H , L} тип
студента, причем 0 WL WH 100 .
Если студент выбрал данный курс, то он определяет
уровень усилий e по его освоению и сдает экзамен. На
экзамене студент типа L получает s e очков, а студент
типа H получает s 2e .
Студент получает положительную оценку, если s . В
этом случае его выигрыш считается равным 100 e / 2 .
В противном случае выигрыш студента равен e / 2 .
Выигрыш преподавателя в любом случае считается
равным e .
(а) Рассмотрим престижное учебное заведение с вы-
сокими стандартами, в котором велико, а WH не очень
225
Лекции по теории игр и экономическому моделированию
велико, например, 0.9 , WL 70, WH 80 . Найдите
СБР.
(б) Рассмотрим престижное учебное заведение с «ис-
порченными» молодыми людьми, в котором велики и
WH , например, 0.9 , WL 70, WH 90 . Найдите СБР.
(в) Рассмотрим посредственное учебное заведение, в
котором и WH малы, например, 0.5 , WL 70, .
WH 80 . Найдите СБР.
(г) Предположив одинаковое значение WL , проран-
жируйте экзаменационные очки s в случаях (а), (б), (в).
226
Задачи письменных работ за прошлые годы
Может не приводить ни к чему, поскольку может не
быть равновесия в чистых стратегиях, как в игре угадыва-
ния монеты (равно любая антагонистическая игра без сед-
ловой точки). В игре «Семейный спор» есть 2 равновесия,
но ППИСДС ничего не дает.
(г) Игра с совершенной информацией всегда имеет
единственное совершенное по подыграм равновесие.
Чтобы это было верно нужно добавить условие одно-
значности выигрышей. Без него равновесий с разными вы-
игрышами может быть много. В лекциях был пример с
двумя разными совершенными по подыграм равновесиями
Нэша:
(1,2) (0,0)
В В
1 (2,0)
2
П П
228
Задачи письменных работ за прошлые годы
Равновесие в подыгре (ВБ,Н) достраивается до
СПРН (В,ВБ,Н) с выигрышами (1,–1). Равновесие (ВН,Б)
достраивается до СПРН (О,ВН,Б) с выигрышами (0, 2).
(г) Существует ли совершенное по подыграм равно-
весие Нэша, включающее равновесия в смешанных страте-
гиях в подыгре после входа фирмы 1. (5 очков)
Данная подыгра подобна «Семейному спору». В ней
есть симметричное равновесие в смешанных стратегиях.
4 4
6 p1 (1) (1 p1 ) 1 p1 (3) (1 p1 ) p1 , p2
9 9
В этом равновесии ожидаемые выигрыши равны по
11
, которое достраивается до СПРН добавлением хода
9
«отказ».
Задача 3. Выбор повестки дня (25 очков).
Рассматривается следующая политическая игра, в ко-
торой общественный выбор осуществляется из отрезка
X [0, 5] . Автор законопроекта (игрок 1) вносит альтерна-
тиву x X против существующего положения status quo
q 4 . Зная предложение игрока 1, Законодатель (игрок 2)
выбирает одно из двух: принять предложение x или оста-
вить нынешние состояние q .
Игроку 1 больше всего хочется, чтобы был выбран
проект a 1 , а при выборе другого проекта y X его вы-
игрыш определяется по формуле: u1 ( y ) 10 | y a | .
Игроку 2 больше всего хочется, чтобы был выбран
проект l 3 , а при выборе другого проекта y X его вы-
игрыш определяется по формуле: u2 ( y ) 10 | y l | .
Таким образом, каждый желает, чтобы обществен-
ный выбор был сделан как можно ближе к тому, что он бо-
лее всего предпочитает.
(а) Это игра с совершенной информацией или нет? (3 очка)
229
Лекции по теории игр и экономическому моделированию
Да, с совершенной (играют по очереди и знают все
уже сделанные ходы).
(б) Приведите нормальную форму этой игры. (5 очков)
S1 [0,5] , S 2 s2 | s2 :[0,5] {0,1} ,
s , s (s ) 1
ui ( s1, s2 ) ui ( y ), где y { 1 2 1 .
q, s2 ( s1 ) 0
(в) Найдите совершенное по подыграм равновесие
Нэша. (5 очков)
Законодатель может выбирать между 10 | s1 3 | и
10 | 4 3 | 9 . Значит, он будет отвергать проект из отрез-
ков [0, 2] и [4, 5] , но соглашаться на любой проект из
[2, 4] . В этих условиях игрок 1 будет предлагать 2 (будем
считать, что в случае равенства игрок 2 соглашается).
Итак, 2 и 1[2,3] составляют единственное СПРН с выигры-
шами (9,9).
(г) Единственным ли равновесием Нэша является то,
что найдено в пункте (в)? Если да, докажите. Если нет,
опишите все равновесия Нэша в этой игре. (7 очков)
Сначала, поймем, что предлагая 4, игрок 1 гаранти-
рует себе выигрыш 7. На этом основании игрок 2 может,
например, с помощью угроз построить равновесие, обеспе-
чивающее ему максимальный выигрыш 10. Такое равнове-
сие состоит из s1 3 и стратегии s2 соглашаться только на
3, а от всего другого отказываться. Можно аналогично сде-
лать равновесным и любой проект из [2,4] .
Задача 4. Лишние затраты на транспортировку?
(30 очков)
Есть две страны А и В, в каждой из которых есть
своя фирма-монополист по производству угля. Пусть фир-
ма 1 расположена в стране А, а фирма 2 — в стране В.
Пусть фирма i {1, 2} продает в стране j { A, B} объем
угля qij . Тогда qi qiA qiB составляет совокупный выпуск
230
Задачи письменных работ за прошлые годы
фирмы i {1, 2} , а q j q1j q2j есть совокупный объем уг-
ля, проданный в стране j { A, B} . Цена на уголь в странах
А и В задается с помощью линейной обратной функции
спроса: p j 90 q j , j { A, B} . Затраты на производства
продукции составляют ci ( qi ) 10qi , i {1,2} .
(а) Предположим, что между странами отсутствует
торговое соглашение, и импорт в обеих странах запрещен.
Это приводит к политическому ограничению q2A q1B 0 .
Какие тогда будут размеры производства q1A и q2B ? (6 оч-
ков)
(80 q) q достигает максимума в 40 и дает выигрыш
1600. Предположим, что страны подписали договор о сво-
бодной торговле, позволяющий иностранным фирмам про-
давать продукцию в их странах без всяких пошлин. Одна-
ко, имеются затраты на транспортировку. Если фирма i
продает продукцию qij в чужой стране (фирма 1 в В, а
фирма 2 в А), то затраты на транспортировку равны 10qij .
Предположим, что обе фирмы принимают решение о вы-
боре qiA , qiB одновременно, i {1, 2} .
(б) Смоделируйте эту ситуации как игру в нормаль-
ной форме. (8 очков)
Заменим название страны А на 1, а страны В на 2
( i j ).
Si R 2+ ,
ui ( q11, q12 , q12 , q22 ) (80 qii qij ) qii (70 q ij q jj ) qij .
(в) Найдите равновесие Нэша в игре из пункта (б).
Оно единственно? (8 очков)
Найдем наилучшие ответы и составим уравнения для
нахождения равновесия Нэша.
231
Лекции по теории игр и экономическому моделированию
j j
80 qi 70 q j
qii , qij
2 2
Складывая все 4 уравнения, получаем, что общий
суммарный выпуск в равновесии должен удовлетворять
300 q
уравнению q , откуда q 100 . Складывая выпус-
2
i
ки q для внутреннего потребления, найдем соотношение
i
232
Задачи письменных работ за прошлые годы
Уравнение для суммарного выпуска примет вид
240 q
q q 80 . Уравнение внутреннего выпуска и
2
160 q
экспорта не изменится: q , однако теперь в паре с
2
уравнением q q 80 дает решение q 80 , q 0 , т.е.
торговли между странами в равновесии не будет. Но по-
скольку q 80, q 0 qii 40, qij 0 , равновесные выиг-
рыши будут равны по 1600, что больше 1300. Значит, (в
СПРН) на первом шаге (двух шаговой игры) выгодно по-
сылать отчет.
M R
A 4,1 1,0
D 3,2 0,1
C 2,0 2,2
В ней A D для игрока 1, поскольку 4 > 3 и 1 > 0.
Остается игра
M R
A 4,1 1,0
C 2,0 2,2
233
Лекции по теории игр и экономическому моделированию
В ней стратегии не сравнимы по доминированию.
б) Найдите все равновесия Нэша (РН) в чистых и в
смешанных стратегиях.
Подчеркнув наилучшие ответы игроков найдем два
РН в чистых стратегиях: (A,M) и (C,R). Есть также еще од-
2 1 1 2
но РН в смешанных стратегиях: A C , M R .
3 3 3 3
Задача 2. Рассмотрим следующую игру в разверну-
той форме.
234
Задачи письменных работ за прошлые годы
1
E X
(2,2) (2,2)
E X
(1,3) (2,2)
235
Лекции по теории игр и экономическому моделированию
u x y , где x — своя доля, y — доля другого, —
одинаковая для обоих степень зависти, причем 0 1 .
а) Один из игроков предлагает вариант дележа по-
дарка, а второй может или согласиться, или отказаться. В
случае согласия происходит дележ на основе сделанного
предложения. При отказе каждый получает ноль. Приме-
ните обратную индукцию для поиска равновесия.
Ясно, что в равновесии должно быть x y 1 .
Пусть первым ходит игрок 1, а вторым игрок 2. Иг-
рок 2 соглашается на предложение, если его выигрыш не
меньше, чем в случае отказа. При отказе получаем
u 0 0 0 . Условие согласия игрока 2:
u x (1 x) 0 . Отсюда ясно, что предлагать игроку 2
можно по минимуму: x (1 x ) 0 , т.е x . Полу-
1
1
чаем СПРН с дележом , и профилем выигры-
1 1
1
шей ,0 (1 ,0) . Заметим, что игрок 1
1 1
вынужден реагировать на степень завистливости игрока 2,
его собственная завистливость в данном случае не влияет
на дележ. Зависть помогает игрок 2 получить большую до-
лю, но не больше удовлетворения!
б) Дележ происходит в два этапа. Второй этап насту-
пает после отказа на первом этапе. Право предлагать дележ
на втором этапе определяется жребием: бросается симмет-
ричная монета. Считается, что оба этапа проводятся в один
день, поэтому время получения выигрыша не учитывается
участниками при принятии решений. Если на втором этапе
получен отказ от дележа, то выигрыш каждого считается
равным нулю. Примените обратную индукцию для поиска
равновесия.
Пусть сначала предложение делает игрок 1, а в слу-
чае отказа право хода определяется бросанием монеты.
236
Задачи письменных работ за прошлые годы
Средний выигрыш при отказе на первом этапе равен
1
(1 0) / 2 . Условие согласия игрока 2 на первом
2
1
этапе теперь имеет вид u x (1 x) . Отсюда
2
следует, что по минимуму ему можно предлагать теперь на
первом этапе долю x из условия
1 1
x (1 x ) , т.е. x .
2 2
Осталось проверить, есть ли смысл игроку 1 доби-
ваться согласия и предлагать дележ по ½ каждому. Если
игрок 1 сделает такое предложение на первом этапе, то
второй согласится, и выигрыш игрока 1 составит
1
u 1/ 2 (1 1/ 2) , т.е. ровно тот же выигрыш, что
2
и математическое ожидание выигрыша при отказе. Поэто-
му получаем два СПРН: 1) предложение равного дележа и
согласие на первом этапе, 2) предложение большей доли
себе, отказ на первом этапе с игрой на втором этапе в зави-
симости от везения при жребии.
в) повторите а) и б) для альтруистичных участников:
u x y .
Ясно, что в равновесии должно быть x y 1 .
Пусть первым ходит игрок 1, а вторым игрок 2. Иг-
рок 2 соглашается на предложение, если его выигрыш не
меньше, чем в случае отказа. При отказе получаем
u 0 0 0. Условие согласия игрока 2:
u x (1 x ) 0 . Отсюда ясно, что предлагать альтруи-
стичный игрок 2 соглашается на все, и ему можно предла-
гать нулевую долю. Получаем СПРН с дележом (1,0) и
профилем выигрышей (1 0,0 1 ) (1, ) . Заметим,
что игроку 1 важен факт альтруистичности игрока 2, но
237
Лекции по теории игр и экономическому моделированию
степень его альтруиpзма. Альтруистичный игрок 2 ничего
не получает, но рад за игрока 1.
б) Дележ происходит в два этапа. Второй этап насту-
пает после отказа на первом этапе. Право предлагать дележ
на втором этапе определяется жребием: бросается симмет-
ричная монета. Считается, что оба этапа проводятся в один
день, поэтому время получения выигрыша не учитывается
участниками при принятии решений. Если на втором этапе
получен отказ от дележа, то выигрыш каждого считается
равным 0. Примените обратную индукцию для поиска рав-
новесия.
Пусть сначала предложение делает игрок 1, а в слу-
чае отказа право хода определяется бросанием монеты.
Средний выигрыш при отказе на первом этапе равен
1
(1 ) / 2 . Условие согласия игрока 2 на первом
2
1
этапе теперь имеет вид u x (1 x ) . Отсюда
2
следует, что по минимуму ему можно предлагать теперь на
первом этапе долю x из условия
1 1
x (1 x ) , т.е. x .
2 2
Осталось проверить, есть ли смысл игроку 1 доби-
ваться согласия и предлагать дележ по ½ каждому. Если
игрок 1 сделает такое предложение на первом этапе, то
второй согласится, и выигрыш игрока 1 составит
1
u 1/ 2 (1 1/ 2) , т.е. ровно тот же выигрыш,
2
что и математическое ожидание выигрыша при отказе. По-
этому получаем опять два СПРН: 1) предложение равного
дележа и согласие на первом этапе, 2) предложение боль-
шей доли себе, отказ на первом этапе с игрой на втором
этапе в зависимости от везения при жребии.
Задача 4. Ниже приведены несколько статических
игр и профилей стратегий игроков в соответствующих по-
238
Задачи письменных работ за прошлые годы
вторяющихся играх. Проверьте, образуют ли данные про-
фили стратегий СПРН в бесконечно повторяющейся игре с
коэффициентом дисконтирования 0.99 .
а) Игра. Каждый из n игроков, n 2 , может вложить
1 в проект по созданию общественного продукта. Размер
созданного общественного продукта будет равен
y ( x1 xn ) / 2 , где xi {0,1} — вклад в общее дело
игрока i . Выигрыш игрока i равен y xi .
Профиль стратегий. Игрок i вкладывает xi 1 в пер-
вом повторении и до тех пор, пока во всех прошлых повто-
рениях уровень произведенного общественного продукта y
был больше 1/4. Иначе игрок i выбирает xi 0 .
Профиль стратегий. Каждый вкладывает xi 1 в пер-
вом повторении и потом, пока во всех прошлых повторе-
ниях уровень произведенного общественного продукта y
больше ¼. Иначе каждый игрок выбирает xi 0 .
Это не СПРН. Если все вкладывают в общее дело по
n
1, то y . Если один игрок отклонится, то получится
2
n 1 1
y , т.е. реакции остальных не последует, а выиг-
2 4
n n 1
рыш уклониста возрастет: 1 .
2 2
б) Игра. Дуополия Курно. Есть две фирмы. Обе фир-
мы ( i 1, 2 ) одновременно и независимо друг от друга оп-
ределяют размер qi выпуска своей продукции. Цена про-
дажи продукции фирм определяется по формуле
P max{0,1 q1 q2 } . Затраты по выпуску продукции счи-
таются нулевыми.
Профиль стратегий. Есть два состояния: Картель и
Конкуренция. От этих состояний зависит действие игрока.
В состоянии «Картель» выпуск фирмы равен 1/4. В состоя-
нии «Конкуренция» выпуск фирмы равен 1/2. Игра начи-
239
Лекции по теории игр и экономическому моделированию
нается в состоянии «Картель». Если в прошлом периоде
было состояние «Картель» и наблюдались выпуски на
уровне 1/4, то состояние «Картель» сохраняется в текущем
периоде. Иначе наступает состояние «Конкуренция». По-
сле Конкуренции происходит автоматический возврат к
Картелю.
Это не СПРН, поскольку есть выгодное отклонение в
состоянии «Конкуренция». На q j 1/ 2 наилучшим отве-
том является выпуск, максимизирующий выигрыш
qi (1 qi 1/ 2) , т.е qi 1/ 4 . Поскольку состояние «Конку-
ренция» меняется на состояние «Картель» автоматически,
то в этой подыгре есть выгодное отклонение.
в) Игра. Как в б).
Профиль стратегий. В отличие от б) переход из со-
стояния «Конкуренция» в состояние «Картель» происходит
в том и только том случае, когда в Конкуренции оба выби-
рают 1/2. Иначе после Конкуренции в следующем периоде
опять сохраняется состояние «Конкуренция».Проверим
невозможность выгодного отклонения.
1. Если игра в некоторый момент t начинается в со-
стоянии «Картель» с выпусками (1/4, 1/4), то выигрыши
игроков в одном повторении равны по 1/8, а их текущая
стоимость при повторении этих выпусков с учетом дис-
1 1 1
контирования равна: 2 При этом игра все
8 8 8
время происходит при сохранения состояния «Картель».
Наилучшее ответ в одном повторении на выпуск 1/4
равен 3/8, при этом выигрыш в этом повторении составит
9/64. Однако за отклонением последует Конкуренция. Если
в подыгре, начинающейся с состояния «Конкуренция» (это
будет проверено ниже), то нужно сравнить по текущей
стоимости две последовательности выигрышей. Условие
невыгодности отклонения примет вид:
240
Задачи письменных работ за прошлые годы
1 1 1 9 1 1
2 0 2 3
8 8 8 64 8 8
1 1 9 1
0 .
8 8 64 8
2. Если игра в некоторый момент t начинается в со-
стоянии «Конкуренция», то в одном повторении на выпуск
1/2 выгодно ответить выпуском 3/8, но в отличии от б) иг-
ра тогда опять останется в состоянии «Конкуренции». Та-
ким образом, условие невыгодности отклонения в данной
1 1 1
подыгре теперь имеют вид: 0 0 .
8 16 2
Итак, получили СПРН.
244
Задачи письменных работ за прошлые годы
1
(2 c j 2ci ) 2 (1 ci ) 2
9
Находим наилучший ответ игрока i из условий 1-го
4
порядка: i (ci , c j ) (2 c j 2ci ) 2(1 ci ) 0
ci 9
2
10 10ci 4c j 0 ci 1 c j .
5
5
В силу симметрии ясно, что в РН ci .
7
2 5 7 2(5 7) 3
Отсюда qi .
3 7
б) Пусть в периоде 1 уровни предельных затрат вы-
бираются последовательно: сначала c1 фирмой 1, а затем
c2 на основе знания c1 выбирает фирма 2. Найдите СПРН
в такой игре.
Анализ периода два остается неизменным. В периоде
1 возникает аналог дуополии Штакельберга. Наилучший
2
ответ игрока 2 нам известен: c2 1 c1 . Подставим его в
5
функцию выигрыша игрока 1:
2
1 2
1 (c1 ) 2 1 c1 2c1 (1 c1 ) 2
9 5
2 2
1 15 12c1 4
2 2
(1 c1 ) 1 c1 (1 c1 ) .
9 5 5
Находим максимум из условий 1-го порядка
8 4 5
1 (c1 ) (1 c1 ) 2(1 c1 ) 0 c1 .
c1 5 5 9
246
Задачи письменных работ за прошлые годы
( p,1 p) . Поэтому игрок 1 будет предлагать
(1 (1 p), (1 p )) , а игрок 2 – ( p,1 p) .
Ожидаемый выигрыш игрока 1 составит
(1 (1 p )) p ( p) (1 p) p .
Ожидаемый выигрыш игрока 2 составит
(1 p ) p (1 p)(1 p) 1 p .
в) Найдите СПРН при n и докажите, что дейст-
вительно получили СПРН.
Исходя из а) и б) получаем, что при любом конечном
n2 игрок 1 всегда будет предлагать
(1 (1 p), (1 p )) , а игрок 2 — ( p,1 p) . Докажем,
что это – СПРН. Поскольку в данной игре все подыгры
совпадают с самой игрой, то достаточно рассмотреть от-
клонение в периоде игрока 1, если он получил право пред-
лагать. Если игрок 1 предложит игроку 2 больше (1 p) ,
то игрок 2 согласится, что уменьшит выигрыш игрока 1 по
сравнению с 1 (1 p) . Если игрок 1 предложит меньше
(1 p) , то получит отказ, после чего его выигрыш оцени-
вается величиной p . Но 1 (1 p) 1 p p , по-
этому такое отклонение не выгодно игроку 1. Для игрок 2
все получается точно также, если положить q 1 p .
Ожидаемые выигрыши в СПРН равны ( p,1 p) .
г) Представим, что до начала переговоров игроки мо-
гут инвестировать средства в свою переговорную силу.
Пусть игроки одновременно вкладывают a и b , тогда они
играют в повторяющуюся переговорную игру при n и
p a ( a b) . Найдите СПРН.
В этой игре ожидаемые выигрыши равны
a b
( p a,1 p b) a, b .
ab ab
247
Лекции по теории игр и экономическому моделированию
При фиксированном b найдем наилучший ответ иг-
рока 1:
a b
( a) 1 0 b (a b) 2 .
a a b (a b )2
При фиксированном a найдем наилучший ответ иг-
b a
рока 2: ( b) 2
1 0 a (a b )2 .
b a b ( a b)
Откуда в СПРН получаем a b 1 4 .
Ясно, что p 1 p 1 2 , а ожидаемые выигрыши с
учетом затрат получаются равными 1 4 .
248
Задачи письменных работ за прошлые годы
Чтобы найти все РН нужно еще перебрать оставшие-
ся 8 подматриц 22:
1. В,Л 2. В, С
С П Л П
Ц (3,0) (0,1) Ц (0,3) (0,1)
Н (1,0) (1,1) Н (1,0) (1,1)
3. В, П 4. Ц, Л
Л С С П
Ц (0,3) (3,0) В (0,3) (0,1)
Н (1,0) (1,0) Н (1,0) (1,1)
5. Ц, С 6. Ц, П
Л П Л С
В (3,0) (0,1) В (3,0) (0,3)
Н (1,0) (1,1) Н (1,0) (1,0)
7. Н,Л 8. Н,С
С П Л П
В (0,3) (0,1) В (3,0) (0,1)
Ц (3,0) (0,1) Ц (0,3) (0,1)
Во всех 8 случаях у одного из игроков есть домини-
рующая стратегия, и поэтому в этих 22 играх нет РН в
смешанных стратегиях с положительными вероятностями.
б) Заменим теперь все выигрыши 1 на 2. Про каждое
найденное в а) РН скажите, сохранится оно или нет при
такой замене.
Л С П
В (3,0) (0,3) (0,2)
Ц (0,3) (3,0) (0,2)
Н (2,0) (2,0) (2,2)
РН со всеми положительными вероятностями исчеза-
ет, поскольку не может быть выполнено
3 2 (Л) 32 (С) 2 . РН на основе (1/2, ½ ,0) также пропа-
дает, поскольку ожидаемый выигрыш для Н теперь равен
2, что больше, чем 1.5 (для В и Ц). Из прежних РН остается
только (П,Н).
249
Лекции по теории игр и экономическому моделированию
Задача 2. Продавец продает купюру в 100 долларов
на аукционе. Имеется два покупателя. Покупатели одно-
временно и независимо друг от друга подают свои заявки
bi {0,1, 2,...,99} , i 1, 2 . Побеждает тот покупатель, кото-
рый подал наибольшую заявку. При равенстве заявок побе-
дитель (равновероятно) определяется жребием. Победитель
получает купюру в 100 долларов, заплатив то, что указал в
заявке. Выигрыш проигравшего на аукционе равен 0.
250
Задачи письменных работ за прошлые годы
Начнем с подыгры
a b
A (3,3) (0,0)
B (0,0) (1,1)
В ней есть два чистых РН: Aa и Bb, и одно смешан-
ное РН: {(1/4, 3/4), (1/4, 3/4)}.
Обратная индукция дает три вариант сокращенной игры:
1 l r 2 l r 3 l r
L (3,1) (2,0) L (3,1) (2,0) L (3,1) (2,0)
R (2,0) (3,3) R (2,0) (1,1) R (2,0) (3/4, 3/4)
В варианте 1 получает два чистых РН: Ll и Rr и еще
одно смешанное РН: {(3/4, 1/4),(1/2, 1/2)}.
В вариантах 2 и 3 есть только одно чистое РН Ll.
Больше РН нет, поскольку L строго доминирует L.
Итак, получилось 3 СПРН в чистых стратегиях и еще
два СПРН с использованием смешанных стратегий.
б) Постройте нормальную форму для этой игры.
la lb ra rb
LA 3,1 3,1 2,0 2,0
LB 3,1 3,1 2,0 2,0
RA 2,0 2,0 3,3 0,0
RB 2,0 2,0 0,0 1,1
251
Лекции по теории игр и экономическому моделированию
У каждого игрока есть по два информационных мно-
жества и по два действия на каждом информационном
множестве: итого, по 4 стратегии.
Поскольку выигрыши в первых двух столбцах и в
первых двух строках у обоих игроков одинаковы, то можно
сократить нормальную форму до размеров 33:
l ra rb
L 3,1 2,0 2,0
RA 2,0 3,3 0,0
RB 2,0 0,0 1,1
По диагонали получились РН, которые совпадают с
найденными ранее СПРН.
в) Произведите последовательное исключение доми-
нируемых стратегий.
Оставшиеся стратегии игроков 1 и 2 не сравнимы по
доминированию.
г) Какое СПРН может служить наилучшим прогно-
зом результатов игры, учитывая в).
Формальных оснований для выделения какого-то од-
ного СПРН у нас нет. Однако, если дело не кончится после
пары ходов, т.е. если игроки сыграют R и r, то это будет
явным сигналом для обоих идти на РН в подыгре с выиг-
рышами (3,3). Раз уж не пошел игрок 1 в сторону РН с вы-
игрышами (3,1), то он, видимо, намекает на (3,3), а не на
(1,1).
Задача 4. Сговор в олигополии Курно. Рассмотрим
следующую бесконечно повторяющуюся игру G (, ) .
Игра на шаге. Имеется n 1 , каждая из которых об-
ладает нулевыми затратами по выпуску продукции. В оп-
ределенный день каждая фирма i одновременно и незави-
симо от остальных производит qi некоторого товара и
продает его по цене P 1 (q1 ... qn ) , получая выигрыш
P qi . Рассмотрим следующий профиль стратегий всех
фирм.
252
Задачи письменных работ за прошлые годы
Профиль стратегий. При t 0 все фирмы производят
по 1 / (2n) . При t 0 уровень производства зависит от то-
го, сколько фирмы произвели в прошлом периоде t 1 .
Если каждая фирма произвела 1 / (2n) или если каждая
фирма в периоде t 1 произвела x , то каждая фирма в пе-
риоде t производит 1 / (2n) , иначе каждая фирма произво-
дит x .
Найдите условия на x, n, , при которых данный
профиль стратегий является СПРН.
а) Эта задача на построение СПРН с помощью двух-
фазовых стратегий.
Рассмотрим сначала игру на одном шаге. Найдем РН.
1 Qi
Наилучший ответ на выпуск q i равен qi , где
2
Qi q j . Складывая все равенства, получим соотноше-
j i
n ( n 1)Q n
ние Q . Отсюда Q . В симметричном
2 n 1
1 n 1 1
РН получается qi , P 1 , ui .
n 1 n 1 n 1 ( n 1) 2
При монополии должно достигаться максимум сум-
марного выигрыша (1 Q )Q , что получается при Q 1 / 2
1 1
и соответствует P 1 / 2 , qi , выигрышам ui .
2n 4n
Чтобы построить условия невыгодности отклонений,
нам нужно посчитать, сколько получит игрок при отклоне-
1
нии от qi при условии, что все остальные придержи-
2n
1
ваются выпуска q j . Наилучший ответ равен
2n
1 (n 1) / (2n) n 1
. Выигрыш при отклонении составит
2 4n
253
Лекции по теории игр и экономическому моделированию
2
n 1 n 1 n 1 n 1
1 .
4n 2n 4n 4n
Теперь найдем выигрыш при отклонении от x , если
все остальные придерживаются x . Наилучший ответ будет
1 (n 1) x
, а выигрыш равен
2
2
1 (n 1) x 1 (n 1) x 1 (n 1) x
1 (n 1) x .
2 2 2
Если все играют x , то выигрыш каждого равен (1 nx) x .
Переходим условиям невыгодности отклонений.
Условие 1. Игрок может отклониться от монопольно-
го сговора, но потом через выбор x вернуться на договор-
ную траекторию. Таким образом, достаточно сравнить
только выигрыши за два периода
2
1 1 n 1
(1 nx ) x.
4n 4n 4n
Условие 2. При отклонении от x в фазе наказания
нужно сравнить выигрыш от отклонения с возвратом в фа-
зу сговора
2
1 1 ( n 1) x
(1 nx) x (1 nx) x .
4n 2
При этих условиях данный профиль двухфазовых
стратегий является СПРН.
б) При каких x, n, можно построить монопольный
сговор как СПРН, основанное на релейных стратегиях.
При релейных стратегиях с одним переключением с
монополии на РН при отклонении любого игрок будет
только одно условие невыгодности отклонений:
254
Задачи письменных работ за прошлые годы
2
1 1 n 1 1
2
4n 1 4n ( n 1) 1
в) Сравните результаты а) и б).
Ограничимся n 2 . Тогда условие из б) перепишется
в виде
2
1 1 3 1 9
2
8 1 8 3 1 25
1 1 3
Условие 1 из а) примет вид ( )2 (1 2 x) x
8 8 8
1
64 .
1
(1 2 x ) x
8
Заметим, что осмысленные значения x могут только
из отрезка [0,1/2]. Знаменатель обращается в 0 при x 1 / 4 ,
но при крайних значениях 0 и 1/2 граница для опускает-
ся до 1/8, что существенно ниже, чем 9/25 для релейных
стратегий.
Условие 2 из а) перепишется в виде
2
1 1 x
(1 2 x) x (1 2 x) x
8 2
2
1 x
(1 2 x ) x
2
.
1
(1 2 x) x
8
При x 2 / 5 числитель правой части достигает ми-
нимума, а она сама равна 4/23=0.174..., что существенно
меньше 9/25=0.36, при этом правая часть условия 1 обра-
щается в 25/184=0.136... Итак, при n 2 двухфазовые
стратегии, например, при x 0.4 превращают монополь-
255
Лекции по теории игр и экономическому моделированию
ный сговор в СПРН для 0.2 , чего нельзя достичь при
использовании релейных стратегий.
a b c
A (2,2) (2,0) (2,0)
B (0,2) (5,0) (0,5)
C (0,2) (0,5) (5,0)
а) Найдите хотя бы два (а если можете, то все) рав-
новесия Нэша (РН).
Есть только одно РН в чистых стратегиях (A, a). Есть
еще два симметричных РН в смешанных стратегиях. Легко
проверить, что наилучшим ответом на стратегию
(1/5, 2/5, 2/5) является любая чистая стратегия, поскольку
ожидаемый выигрыш равен 2. Смешанным РН является
также пара стратегий (0, 1/2, 1/2). Так, наилучшими отве-
тами игрока 1 являются стратегии В и С с ожидаемым вы-
игрышем 2.5 каждая. Стратегии A соответствует ожидае-
мый выигрыш 2 < 2.5, что согласуется с тем, что 1 (A) 0 .
1. Ab 2. Ac
a c a b
B (0,2) (0,5) B (0,2) (5,0)
C (0,2) (5,0) C (0,2) (0,5)
3. Ba 4. Bb
b c a c
A (2,0) (2,0) A (2,2) (2,0)
C (0,5) (5,0) C (0,2) (5,0)
5. Bc 6. Ca
a b b c
256
Задачи письменных работ за прошлые годы
A (2,2) (2,0) A (2,0) (2,0)
C (0,2) (0,5) B (5,0) (0,5)
7. Cb 8. Cc
a c a b
A (2,2) (2,0) A (2,2) (2,0)
B (0,2) (0,5) B (0,2) (5,0)
Чтобы найти все РН нужно перебрать представлен-
ные 8 подматриц 22. Во всех 8 случаях у одного из игро-
ков есть доминирующая стратегия, и поэтому в этих 22
играх нет РН в смешанных стратегиях с положительными
вероятностями.
б) Заменим теперь все выигрыши 2 на 3. Про каждое
найденное в а) РН скажите, сохранится оно или нет при
такой замене.
a b c
A (3,3) (3,0) (3,0)
B (0,3) (5,0) (0,5)
C (0,3) (0,5) (5,0)
РН со всеми положительными вероятностями исче-
зает, поскольку не может быть выполнено 51 (B) 5 ,
1 (С) 3 . РН на основе (0, 1/2, 1/2) также пропадает, по-
скольку ожидаемый выигрыш для A теперь равен 3, что
больше, чем 2.5 (для В и C). Из прежних РН остается толь-
ко (A, a).
Задача 2. Сенат определяет размер ставки налога на
недвижимость x X {0, 0.01, 0.02,...,0.99,1} . В состав Се-
ната входят 45 твердых Республиканца во главе с Лидером
Большинства (ЛБ), 40 твердых Демократов во главе с Ли-
дером Меньшинства (ЛМ) и 14 Умеренных во главе с Ли-
дером умеренных (ЛУ). Выигрыш Республиканцев равен
1 x , а выигрыш Демократов равен x . Выигрыш умерен-
ных равен x , если x 0.5 и 1 x , если x 0.5 . Текущая
ставка налога на недвижимость равна x0 0.6 .
257
Лекции по теории игр и экономическому моделированию
Сначала ЛБ предлагает закон x1 X . Затем ЛМ вно-
сит поправку x2 X . По правилам Сената сначала поправ-
ка x2 голосуется против закона x1 , а потом победитель
ставится на голосование против x0 . Победитель последне-
го голосования становится ставкой налога на недвижи-
мость.
Для победы в каждом голосовании требуется набрать
50 или более голосов. В каждом голосовании ЛБ голосует
за всех твердых Республиканцев, ЛМ — за всех твердых
Демократов, а ЛУ — за всех Умеренных.
а) Опишите развернутую форму данной игры с уче-
том возможности выдвижения предложений и голосова-
ния.
Ситуацию можно описать как игру 3 лиц: ЛБ, ЛМ и
ЛУ. Игра состоит из двух стадий: выдвижение предложе-
ний и голосование. Начнем со стадии голосования. Здесь
возможны два варианта.
А. Искреннее голосование. Каждый голосует за ту
альтернативу, которая лучше для него по функции выиг-
рыша. При искреннем голосовании ситуация сводится к
игре двух лиц (ЛБ и ЛМ) в развернутой форме с полной и
совершенной информацией. На каждое действие x1 X
ЛБ следует ответ x2 X ЛМ, причем он, конечно, знает
x2 . Таким образом, получаемся обычная двухходовая игра.
Нужно только определить выигрыши ui ( x1 , x2 ) . Для этого
сначала определим функцию f ( x0 , x1 , x2 ) , которая показы-
вает победителя в двух турах голосования, тогда выигрыш
ЛБ равен 1 f ( x0 , x1 , x2 ) , а выигрыш ЛМ равен
f ( x0 , x1 , x2 ) . Функция f ( x0 , x1 , x2 ) строится в два этапа.
При первом голосовании при x1 0.5 x2 побеждает то
предложение, которое ближе к 0.5, а значит, привлекает
голоса Умеренных. Пусть побеждает x . При втором голо-
совании опять из x и x0 побеждает та ставка, которая
258
Задачи письменных работ за прошлые годы
ближе к 0.5. Пусть это ставка y . Это и есть значение
f ( x0 , x1 , x2 ) . Дерево игры в данном случае выглядит при-
мерно так.
ЛБ
ЛМ
ЛБ
259
Лекции по теории игр и экономическому моделированию
Зависит от подхода. Если считать голосование ис-
кренним, а потому автоматическим, то информация совер-
шенна, поскольку предложения делаются последовательно
и открыто. Если считать голосование стратегическим и
тайным, то получаем игру с несовершенной информацией.
Впрочем, концепция СПРН примерит оба этих подхода.
При стратегическом голосовании возможно приме-
нение угроз. Например, ЛУ может потребовать от ЛМ бо-
лее выгодного для себя предложения, угрожая в противном
случае перекинуться на сторону ЛБ. Такого рода основан-
ные на угрозах РН практически всегда можно построить в
динамических играх. Возникает только вопрос: являются
ли такие угрозы обоснованными? Во всяком случае, они
нарушают принцип СПРН.
в) Найдите совершенное по подыграм РН (СПРН) в
этой игре с помощью обратной индукции.
Давайте начнем обратную индукцию с игры голосо-
вания и покажем, что профиль искренних стратегий (голо-
совать за наилучшую для себя альтернативу) образует РН в
данной подыгре. Начнем с ЛУ. Голосуя искренне ЛУ,
обеспечивает победу более близкой к 0.5 альтернативе (ес-
ли ЛБ и ЛМ играют искренне). У ЛУ нет резона отклонять-
ся. ЛБ и ЛМ могут отклониться от выгодной альтернативы,
если окажутся в меньшинстве, но это им ничего не даст.
Свернув голосование (подыгру) второго тура, приме-
ним ту же логику еще раз. В итоге, получим игру А, свя-
занную с выдвижением предложений.
Применим теперь обратную индукцию к этой игре.
Заметим только, что при заданных x0 , x1 , x2 победит в ито-
ге та ставка, которая ближе к 0.5.
Пусть уже выбрана заявка x1 0.5 и известна на-
чальная ставка x0 0.6 . Если x1 0.4 , то ближе к середине
ставка 0.6. Увеличить начальную ставку все равно нельзя,
поэтому ЛМ может предлагать x2 0.6 .
260
Задачи письменных работ за прошлые годы
Если 0.4 x1 0.5 , то оптимальным выбором для ЛМ
является симметричная ставка x2 1 x1 . В итоге получа-
ем наилучший ответ ЛМ в виде x2 min{0.6,1 x1} .
Теперь перейдем к ходу ЛБ по выбору x1 . С учетом
ответного предложения ЛМ ничего не остается, как вы-
брать x1 0.5 .
Итак, x1 0.5 , x2 min{0.6,1 x1} и искреннее голо-
сование образуют СПРН в данной игре.
Задача 3. Рассмотрим следующую игру в разверну-
той форме.
262
Задачи письменных работ за прошлые годы
Задача 4. Рассмотрим бесконечно повторяющуюся
игру с G (, ) при 0.99 , в которой в каждом периоде
повторяется статическая игра
C D
C 5,5 –6,8
D 8,6 0,0
Какие из следующих профилей стратегий являются
СПРН?
а) Стратегия каждого игрока: Всегда играть С.
Нет. В статической игре только одно РН (D,D), по-
тому только его повторение может быть СПРН в повто-
ряющейся игре.
б) Стратегия каждого игрока: Играть С первый раз,
потом играть то, что другой сыграл в предыдущем перио-
де.
Да. При одностороннем отклонении от С игрок 1 по-
лучает 8 вместо 5, но игрок 2 в следующем периоде будет
играть D. Если сыграть D, то получишь 0, а игрок 2 снова
будет готов играть D. Если сыграть С, то игрок 2 переклю-
чится в следующем периоде на С, но игрок 1 в данном пе-
риоде получит –6. Выгодных отклонений не видно.
Такие стратегии называют «как ты, так и я в сле-
дующем периоде». Они не столь универсальны, как релей-
ные стратегии, но в данной игре достаточны для построе-
ния СПРН на основе кооперативного исхода (С,С).
в) Есть четыре состояния: Кооперация (К), Наказа-
ние игрока 1 (Н1), Наказание игрока 2 (Н2), Индивидуа-
лизм (И). Начинаем в состоянии К. В этом состоянии оба
игрока играют С. В состоянии Нi игрок i играет С, а дру-
гой игрок играет D. В состоянии И оба игрока играют D.
Если игроки попали в состояние И, то они в нем так и ос-
таются. Из любого другого состояния следует переход в
состояние К, если игроки не отклоняются от предписанных
этому состоянию стратегий. Если один игрок i отклоняет-
ся от предписанной состоянию стратегии (а другой нет), то
263
Лекции по теории игр и экономическому моделированию
следует переход в состояние Нi . Если оба игрока откло-
няются одновременно, то следует переход в состояние И.
Да. Это более сложные стратегии, которые напоми-
нают двухфазовые стратегии. Игра начинается с состояния
К, когда оба играют С. Если игрок 1 отклонится и сыграет
D, то он получит 8 вместо 5, но игра перейдет в состояние
Н1. Здесь ему предписано играть C против D игрока 2 и
получать –6. Можно, конечно, сыграть D, но тогда полу-
чишь 0 и переведешь игру в состояние И, из которого
можно выбраться, только сыграв два раза подряд C против
двух подряд D, что совсем не радует. Можно перебирать
последовательно все варианты, но выгодных отклонений
не видно.
265
Лекции по теории игр и экономическому моделированию
E X
(2,2) (2,2)
266
Задачи письменных работ за прошлые годы
Другое СПРН получается из РН (R, b) в подыгре.
При сокращении получим теперь в остатке игру
1
E X
(1,3) (2,2)
267
Лекции по теории игр и экономическому моделированию
фирмы на основе знания затрат c1 и c2 одновременно вы-
бирают размер выпуска qi , i 1, 2 . Выигрыш фирмы i оп-
ределяются их прибылью
i ( qi , q j , ci ) qi [ P (Q) ci ] f (ci ), j i ,
268
Задачи письменных работ за прошлые годы
Находим наилучший ответ игрока i из условий 1-го
порядка:
4
i (ci , c j ) (2 c j 2ci ) 2(1 ci ) 0
ci 9
2
10 10ci 4c j 0 ci 1 c j
5
5
В силу симметрии ясно, что в РН ci . Отсюда
7
2 5 7 2(5 7) 3
qi .
3 7
б) Пусть в периоде 1 уровни предельных затрат вы-
бираются последовательно: сначала c1 фирмой 1, а затем
c2 на основе знания c1 выбирает фирма 2. Найдите СПРН
в такой игре.
Анализ периода два остается неизменным. В периоде
1 возникает аналог дуополии Штакельберга.
2
Наилучший ответ игрока 2 нам известен: c2 1 c1 .
5
Подставим его в функцию выигрыша игрока 1:
1 2
1 (c1 ) (2 1 c1 2c1 )2 (1 c1 ) 2
9 5
1 15 12c1 4
( ) 2 (1 c1 ) 2 (1 c1 ) 2 (1 c1 )2 .
9 5 5
Находим максимум из условий 1-го порядка
8 4 5
1 (c1 ) (1 c1 ) 2(1 c1 ) 0 c1 .
c1 5 5 9
269
Лекции по теории игр и экономическому моделированию
2 7 9 2(5 9) 5 2 5 9 2(7 9) 1
q1 , q2 .
3 9 3 3
8
Совокупный выпуск равен Q . Это больше, чем
9
6
в а), а значит и цена ниже, что выгоднее потребителям.
7
Задача 4. Ниже приведены несколько статических
игр и профилей стратегий игроков в соответствующих по-
вторяющихся играх. Проверьте, образуют ли данные про-
фили стратегий СПРН в бесконечно повторяющейся игре с
коэффициентом дисконтирования 0.99 .
а) Игра. Каждый из n игроков, n 2 , может вложить
1 в проект по созданию общественного продукта. Размер
созданного общественного продукта будет равен
y ( x1 xn ) / 2 , где xi {0,1} — вклад в общее дело
игрока i . Выигрыш игрока i равен y xi .
Профиль стратегий. Игрок i вкладывает xi 1 в пер-
вом повторении и до тех пор, пока во всех прошлых повто-
рениях уровень произведенного общественного продукта y
был больше 1/4. Иначе игрок i выбирает xi 0 .
Профиль стратегий. Каждый вкладывает xi 1 в пер-
вом повторении и потом, пока во всех прошлых повторе-
ниях уровень произведенного общественного продукта y
больше ¼. Иначе каждый игрок выбирает xi 0 .
Это не СПРН. Если все вкладывают в общее дело по
n
1, то y . Если один игрок отклонится, то получится
2
n 1 1
y , т.е. реакции остальных не последует, а выиг-
2 4
n n 1
рыш уклониста возрастет: 1 .
2 2
б) Игра. Дуополия Курно. Есть две фирмы. Обе фир-
мы ( i 1, 2 ) одновременно и независимо друг от друга оп-
270
Задачи письменных работ за прошлые годы
ределяют размер qi выпуска своей продукции. Цена про-
дажи продукции фирм определяется по формуле
P max{0,1 q1 q2 } . Затраты по выпуску продукции
считаются нулевыми.
Профиль стратегий. Есть два состояния: Картель и
Конкуренция. От этих состояний зависит действие игрока.
В состоянии «Картель» выпуск фирмы равен 1/4. В состоя-
нии «Конкуренция» выпуск фирмы равен 1/2. Игра начи-
нается в состоянии «Картель». Если в прошлом периоде
было состояние «Картель» и наблюдались выпуски на
уровне 1/4, то состояние «Картель» сохраняется в текущем
периоде. Иначе наступает состояние «Конкуренция». По-
сле Конкуренции происходит автоматический возврат к
Картелю.
Это не СПРН, поскольку есть выгодное отклонение в
состоянии «Конкуренция». На q j 1/ 2 наилучшим отве-
том является выпуск, максимизирующий выигрыш
qi (1 qi 1/ 2) , т.е qi 1/ 4 . Поскольку состояние «Конку-
ренция» меняется на состояние «Картель» автоматически,
то в этой подыгре есть выгодное отклонение.
в) Игра. Как в б).
Профиль стратегий. В отличие от б) переход из со-
стояния «Конкуренция» в состояние «Картель» происходит
в том и только том случае, когда в Конкуренции оба выби-
рают 1/2. Иначе после Конкуренции в следующем периоде
опять сохраняется состояние «Конкуренция».Проверим
невозможность выгодного отклонения.
1. Если игра в некоторый момент t начинается в со-
стоянии «Картель» с выпусками (1/4, 1/4), то выигрыши
игроков в одном повторении равны по 1/8, а их текущая
стоимость при повторении этих выпусков с учетом дис-
1 1 1
контирования равна: 2 При этом игра все
8 8 8
время происходит при сохранения состояния «Картель».
271
Лекции по теории игр и экономическому моделированию
Наилучшей ответ в одном повторении на выпуск 1/4
равен 3/8, при этом выигрыш в этом повторении составит
9/64. Однако за отклонением последует Конкуренция. Если
в подыгре, начинающейся с состояния «Конкуренция» (это
будет проверено ниже), то нужно сравнить по текущей
стоимости две последовательности выигрышей. Условие
невыгодности отклонения примет вид:
1 1 1 9 1 1
2 0 2 3 ,
8 8 8 64 8 8
1 1 9 1
или 0 .
8 8 64 8
2. Если игра в некоторый момент t начинается в со-
стоянии «Конкуренция», то в одном повторении на выпуск
1/2 выгодно ответить выпуском 3/8, но в отличии от б) иг-
ра тогда опять останется в состоянии «Конкуренции». Та-
ким образом, условие невыгодности отклонения в данной
1 1 1
подыгре теперь имеют вид: 0 0 .
8 16 2
Итак, получили СПРН.
272
Задачи письменных работ за прошлые годы
При n 2 существования доминирующей стратегии
у одного игрока мало, поскольку при этой стратегии для
любых двух игроков может возникнуть, например, антаго-
нистическая игра без РН в чистых стратегиях. Существо-
вание у n 1 игроков доминирующей стратегии влечет
существование РН.
б) Можно ли утверждать, что в конечной развернутой
игре с полной и точной информацией в совершенном по
подыграм РН (СПРН) выигрыши игроков определены од-
нозначно?
Нет. В учебники есть пример, когда существуют два
СПРН с разными векторами выигрышей. Достаточным ус-
ловием для этого утверждения является приведенное в
учебнике условие однозначности выигрышей в финальных
позициях.
в) Приведите пример игры в развернутой форме, в
которой информационная структура не удовлетворяет ус-
ловию полной памяти.
Представьте дерево конечной двухходовой игры двух
лиц, в которой игрок 1, совершая второй ход, не помнит,
какой он сделал первый ход. Изобразите такое дерево са-
мостоятельно, полагая, что на каждом шагу у каждого иг-
рока есть два действия.
г) В бесконечной повторяющейся игре G (, ) бу-
дем называть стратегии игроков марковскими, если дейст-
вие игрока в момент t зависит только от действий игроков
в момент t 1 . Может ли в игре G (, ) существовать
СПРН в марковских стратегиях, отличное от повторения
некоторого РН в исходной игре G ?
Простой ответ состоит в том, что чередовать два РН
игры. Но и в случае одного РН можно построить марков-
ское СПРН. Остановимся на дилемме заключенного
L R
L 1,1 5,0
R 0,5 4,4
273
Лекции по теории игр и экономическому моделированию
и рассмотрим стратегии si0 «как ты, так и я»:
a1i R , ait ait 1 . Если игроки придерживаются таких
стратегий, реализуется последовательность выигрышей
4,4,… Если, скажем, игрок 1 отклонился, сыграв L, то он
получит 5 в одном повторении. Но потом последует серия
из 1, пока игрок 1 не вернется на R. Если он вернется
мгновенно, то условие невыгодности отклоняться примет
вид: 4 4 5 0 1 / 4 . Если игрок 1 сыграет L
два раза подряд, то условие невыгодности отклонения
примет вид 4 4 4 2 5 1 0 , которое с учетом
предыдущего условия автоматически выполняется при
4 2 1 1/ 4 и т.д. Значит, «как ты так и я» обра-
зуют марковское СПРН при 1 / 4 , как и в случае ре-
лейных стратегий.
Задача 2. Рассмотрим следующую игру в нормаль-
ной форме, в которой игрок 1 выбирает строки, а игрок 2
— столбцы.
a b c d e
A (2,5) (0,2) (1,2) (5,1) (2,3)
B (0,2) (3,8) (4,6) (4,9) (2,3)
а) Найдите все равновесия Нэша в чистых стратегиях.
Есть только одно РН в чистых стратегиях: (A, a).
б) Найдите все наилучшие ответы игрока 2 на каж-
дую смешанную стратегии игрока 1. Подсказка: Изобрази-
те графически зависимости выигрыша игрока 2 от вероят-
ности выбора стратегии В игроком 1 при фиксированной
стратегии игрока 2.
в) Найдите все РН в смешанных стратегиях.
Пусть p — вероятность выбора игроком 1 стратегии B.
Изобразим графически зависимость от p ожидаемого выигрыша
игрока 2 для каждой из пяти его чистых стратегий:
274
Задачи письменных работ за прошлые годы
p
Верхняя огибающая семейства этих прямых дает зна-
чение выигрыша игрока 2 при наилучшем ответе. Заметим,
что среди чистых наилучших ответов встречаются только
a,b,d. В точке 1/3 есть два чистых наилучших ответа, а зна-
чит, и любая их смесь является наилучшим ответом на
стратегию (2/3, 1/3) игрока 1. В этой точке пересекаются
прямые a и b, а другие линии проходят ниже. Получим РН
смешанных стратегиях по соответствующей игре 22:
((2/3, 1/3), (3/5, 2/5, 0, 0, 0)). Другое РН в смешанных стра-
тегиях получается при пересечении линий b и d в точке 1/2:
((1/2, 1/2), (0, 1/4, 0, 3/4, 0)).
г) Пусть теперь игрок 1 делает ход первым, а игрок 2,
зная выбор игрока 1, делает ход вторым. Сколько страте-
гий у каждого игрока в этой игре? Найдите совершенное
по подыграм РН в этой игре.
У игрока 1 две стратегии, у игрока 2 теперь 52=25
стратегий по числу функций, определенных на множестве
из 2-х элементов и принимающих 5 значений. СПРН при-
водит к исходу Bd с выигрышами (4,9), что лучше для обо-
их, чем (2,5) в исходном РН. Чтобы понять это, достаточно
посмотреть на приведенную выше матрицу с подчеркну-
тыми наилучшими ответами и выбрать строку, в которой
больше выигрыш игрока 1 с учетом подчеркивания по иг-
року 2.
275
Лекции по теории игр и экономическому моделированию
д) Пусть теперь игрок 2 делает ход первым, а игрок 1,
зная выбор игрока 2, делает ход вторым. Сколько теперь
стратегий у каждого игрока в этой игре? Найдите СПРН в
этой игре.
У игрока 2 теперь 5 стратегий, а у игрока 1 их 25=32
по числу функций, определенных на множестве из 5-и эле-
ментов и принимающих 2 значения. СПРН приводит к ис-
ходу Bb и выигрышам (3,8).
Значит, обоим игрокам выгодно, чтобы фиксирован-
ный порядок ходов был, причем чтобы первым делал ход
игрок 1.
Задача 3. Фирма 1 собирается выйти на рынок, кото-
рый монопольно обслуживает фирма 2. Если фирма 1 ре-
шит все же воздержаться от выхода на этот рынок, то она
получит выигрыш, равный 0, а фирма 2 получит 10 (ска-
жем, миллионов долларов). Если фирма 1 все-таки выйдет
на рынок, то фирма 2 может либо отреагировать мирно,
либо вступить в борьбу против фирмы 1. Если фирма 2 от-
реагирует мирно, то обе фирмы получат выигрыш по 5.
Если фирма 2 вступит в борьбу, то теперь у фирмы 1 есть
выбор: принять вызов или покинуть рынок. Если фирма 1
примет вызов и останется, то с учетом затрат на борьбу
фирма 1 получит выигрыш 1, в то время как фирма 2 полу-
чит 2. Если фирма 1 решит покинуть рынок, не вступая в
борьбу, то с учетом затрат на вход в рынок фирма 1 полу-
чит выигрыш, равный -1, а фирма 2 получит 6.
а) Изобразите дерево соответствующей игры в раз-
вернутой форме.
276
Задачи письменных работ за прошлые годы
СПРН показано стрелками. Оно соответствует мир-
ному дележу рынка.
в) Постройте нормальную форму данной игры.
В сокращенном виде в нормальной форме у игрока 1
три стратегии: Н (не входит на рынок), ВБ (входить и бо-
роться, если придется), ВП (входить, но покидать рынок,
не вступая в борьбу). У игрок 2 две стратегии: Б (бороться)
или М (мириться).
Б М
Н 0,10 0,10
ВБ 1,2 5,5
ВП -1,6 5,5
г) Найдите все РН.
Других РН в этой игре нет.
Задача 4. Рассмотрим статическую игру G .
А Б В
а 4,1 0,0 5,0
б 0,0 1,4 0,0
в 0,0 0,5 3,3
а) Найдите все РН в чистых и смешанных стратегиях
в этой игре.
В чистых стратегиях есть два РН: (а, А) и (б, Б). Есть
еще РН в смешанных стратегиях: ((4/5, 1/5, 0), (1/5, 4/5)), в
котором выигрыш каждого игрока равен 4/5.
Предположим, что эта игра разыгрывается несколько
раз, причем продолжение игры происходит с вероятностью
p , а с вероятностью 1 p игра заканчивается. Выигры-
шем игрока в такой повторяющейся игре G ( p) считается
ожидаемая сумма его выигрышей во всех состоявшихся до
окончания игры повторениях.
б) Можно ли утверждать, что при некотором игра
G (, ) с дисконтированием выигрышей эквивалентна
игре G ( p) ?
277
Лекции по теории игр и экономическому моделированию
В игре G ( p) вероятность того, что игра повторится
t раз равна pt 1 . Пусть игрока ожидает выигрыш xt в
повторении t , если до него дойдет дело, т.е. игра не закон-
чится ранее. Тогда ожидаемый выигрыш равен xt pt 1 .
t 1
Значит, игра G ( p) с ожидаемыми выигрышами совпадает
игрой G (, ) при p . Отметим, что это верно для
любой конечной игры G .
в) Можно ли в игре G ( p) построить СПРН, в кото-
ром игроки будут играть (в,В) по всех повторениях до
окончания игры?
Здесь прямо нельзя использовать «народную теоре-
му», поскольку нет РН в чистых стратегиях с выигрышами
менее 3 для обоих игроков. Один путь — перейти на РН в
смешанных стратегиях при отклонении. Другой путь —
использовать обычные релейные стратегии с переключени-
ем на выгодное равновесие. Например, для игрока 1 выби-
рать «в», пока игрок 2 тоже выбирает «В», а если игрок 2
выбирает не «В», то переключиться на «а». Аналогично,
для игрока 2 переключение происходит на «Б».
Задача 5. n человек являются свидетелями преступ-
ления. Каждый из них может позвонить в полицию или не
звонить. Каждый из них хочет, чтобы полиция была про-
информирована, но позвонить самому, значит, понести оп-
ределенные психологические затраты. Пусть выигрыш от
информирования полиции оценивается величиной v , при-
чем неважно, кто именно и сколько человек позвонит, а
затраты оцениваются величиной c . Пусть v c 0 . Счи-
тается, что выигрыш индивида равен 0, если никто не по-
звонил, равен v , если позвонил кто-то другой и равен
v c , если позвонил он сам.
а) Найдите РН в чистых стратегиях в этой игре.
278
Задачи письменных работ за прошлые годы
Один любой игрок звонит в полицию, а другие нет.
Получается n РН.
б) Найдите симметричное РН в смешанных стратеги-
ях, в котором каждый игрок звонит в полицию с вероят-
ность p (0,1) .
в) Проанализируйте найденное в б) РН в зависимости
от параметров v и c . Что будет происходить с возрастани-
ем n с вероятность звонка в полицию фиксированного
свидетеля и вероятностью того, что хотя бы кто-то позво-
нит?
В этом симметричном смешанном РН выигрыш иг-
рока в случае обоих действий должен быть одинаковым.
Если игрок звонит, то получает v c с вероятностью 1.
Если он не звонит, то получит v с вероятностью
1 (1 p)n 1 , что кто-то другой позвонит. Итак, должно
быть
c
v c v(1 (1 p )n1 ) (1 p )n1
v
c
p 1 ( )1/( n1) .
v
c
Чем больше относительные затраты , тем меньше
v
вероятность звонка.
При возрастании числа n свидетелей вероятность p
в равновесии уменьшается и стремится к нулю. Вероят-
n /( n1)
c n
ность, что никто не позвонит, равна (1 p )
v
c
и стремится к относительным затратам для больших
v
групп свидетелей. Чем ближе c к v , тем больше вероят-
ность, что никто не позвонит.
279
Лекции по теории игр и экономическому моделированию
Задачи экзамена за 2004 год с решениями
1. Алиса и Боб хотят отметить памятную дату. Они
могут перекусить в МакДональдсе или пойти потанцевать
в клуб «Зона». Боб первым выбирает, куда пойти. Алиса
принимает решение, зная, куда пошел Боб. Боб предпочи-
тает подкрепиться, а Алиса — танцы. Игрок получает 3,
если они вместе идут туда, куда ему/ей больше хочется, 1
— если они вместе идут туда, куда больше предпочитает
другой, и 0, если идут в разные места. Все это описание
ситуации является общей информацией.
a) Найдите совершенное по подыграм равновесие
Нэша. Найдите несовершенное по подыграм равновесие
Нэша с другим исходом.
Решение. У Боба 2 стратегии, а у Алисы 4. СПРН:
Алиса идет туда, куда пошел Боб. Исход СПРН — встреча
в МакДональдсе. Не СПРН: Алиса собирается идти в тан-
цевать в Зону, независимо ни от чего и встречает там Боба.
Это равновесие Нэша, но не совершенное РН, поскольку в
подыгре после «хода» Боба в МакДональдс Алиса выбира-
ет не наилучший ответ.
b) Модифицируем игру: Алиса не узнает автомати-
чески, куда пошел Боб, но может узнать это, если захочет,
без каких-либо затрат. Это означает, что сначала Алиса
решает, узнавать ли ей, куда пошел Боб, а затем решает,
куда ей отправиться, либо, получив информацию о том,
куда пошел Боб, либо без всякой информации. Выигрыши
определяются так же, как и в начальной постановке. Най-
дите совершенное по подыграм равновесие в новой игре,
которое имеет тот же самый исход, что и несовершенное по
подыграм равновесие в пункте а).
Решение. Изобразим дерево игры и СПРН в ней,
приводящее к встрече на танцах в Зоне.
280
Задачи письменных работ за прошлые годы
Боб
Алиса
Узнать
Узнать нет нет
Алиса
Алиса
Алиса
281
Лекции по теории игр и экономическому моделированию
Отсюда получаем a0 и x*i b i , причем
E[ x*j ] 2b
b . Но тогда E ( x*j ) E[b i ] bE[ i ] . Из
3 3
E[ x*j ] 2 E ( x*j ) 2b 2
b получаем b , значит, b .
3 3 9 9
2
Итак, xi* (i ) i .
9
3. Найдите совершенное байесовское равновесие (в
чистых и смешанных стратегиях) в следующей игре:
282
Задачи письменных работ за прошлые годы
Ясно, что если после хода Природы право хода пе-
рейдет к игроку 1, то ему надо заканчивать игру с выиг-
рышем 2, поскольку иначе он больше 1 не получит. Выбор
игроков 1 и 2 в трех предфинальных вершинах также не
вызывает сомнения. Еще в одной вершине у игрока 2 всего
1 ход. Проставив эти очевидные ходы, осталось найти ве-
роятность для игрока 1 сделать ход вправо (если Приро-
да даст ему такой шанс), вероятность для игрока 3 сде-
лать ход вправо и вероятность , которая соответствует
ожиданиям игрока попадания траектории в среднюю вер-
шину. В СБР траектория не может попасть в левую верши-
ну по построению.
Проверим теперь, что нет СБР в чистых стратегиях.
Если 3 идет влево, то и 2 должен идти влево, но тогда
0 и 3 должен ходить вправо. Противоречие. Если 3
идет вправо, то 2 должен ходить в центр, тогда 4 / 5 ,
что соответствует ожиданиям о выборе Природы. Но тогда
игроку 3 выгоднее сыграть влево — противоречие.
В смешанном СБР оба хода игрока 3 должны быть
равноценны:
2
1 0 3(1 ) .
3
По правилу Байеса и из условий согласования ожи-
даний игрока 3 со стратегией игрока 2 получаем
0.4 2 1
.
0.4 0.1 3 2
Наконец, для того чтобы игрок 2 смешивал свои чис-
тые стратегии, они должны быть для него равноценны по
ожидаемому выигрышу:
1
1 2 .
2
4. В игре участвуют Судья и Истец. Истцу был нане-
сен некоторый моральный ущерб. Степень ущерба v явля-
283
Лекции по теории игр и экономическому моделированию
ется приватной информацией истца. Судья верит, что v
равномерно распределено на {0, 1,…, 99} (т.е. он полагает,
что вероятность события v i равна 1/100). Истец может
без затрат предъявить истинную величину v Судье. После-
довательность действий следующая. Сначала Истец при-
нимает решение, предъявлять ли величину v судье. Затем
судья дает Истцу компенсацию R . Выигрыш Истца равен
R v , а выигрыш Судьи равен (v R )2 . Все это описание
является общей информацией. Найдите совершенное Байе-
совское равновесие.
Решение. Стратегия Истца есть функция от его при-
ватной информации: s (v) со значениями v (открыться Су-
дье) или N (не открываться). Стратегия Судьи есть функ-
ция R() , заданная на множестве {N , 0,1, , 99} . В РБН
( s* , R* ) при откровенности Истца Судья в силу своих
предпочтений всегда выбирает компенсацию R* (v ) v .
Если Истец не хочет иногда выявлять свою приватную ин-
формацию ( s* (v) N хотя бы для одного v ), то предпоч-
тения Судьи диктуют R* ( N ) E[v | s* (v ) N ] .
В РБН Истец должен дать наилучший ответ на стра-
тегию Судьи R* для каждого v . Отсюда следует, что в
РБН Истец будет открываться при v R* ( N ) и не будет
открываться при v R* ( N ) . Но тогда ясно, что в СБР
R* ( N ) 0 . В противном случае, Судья знает, что Истец
будет молчать для малых значений ущерба, а значит, по-
нижая компенсацию при молчании Истца, Судья может
увеличить свой выигрыш (уменьшить проигрыш).
Итак, в РБН Судья не дает компенсации «в темную»,
но справедлив с искренним Истцом.
284
Задачи письменных работ за прошлые годы
Истец либо искренен всегда ( s* (v) v ), либо скром-
но молчит, лишь при v 0 . Формально имеется ровно два
РБН, которые, по сути, эквивалентны.
Контрпример:
s2* s2
s1* (1,1) (5,0)
s1 (0,5) (5,5)
Тип О
затраты квалификация
выбор Л 2 2
К 8 10
После окончания университета игрок 1 нанимается
на работу в фирму (игрок 2). Игрок 2 может взять игрока 1
в один из двух отделов: традиционные технологии (Т) или
высокие технологии (В). Зарплата в Т-отделе равна 2, а в
В-отделе — 6. Выигрыш игрока 1 считается равным разно-
сти: зарплата минус затраты на обучение.
Выигрыш игрока 2 зависит от назначения в отдел и
типа работника. При назначении в В-отдел выигрыш фир-
мы равен разности: квалификация нанятого работника ми-
нус его зарплата. При назначении в Т-отдел выигрыш
фирмы составляет половину квалификации работника ми-
нус зарплата.
286
Задачи письменных работ за прошлые годы
(а) Изобразите развернутую форму игры (8 очков)
6,-2 В В
4,6
Л С К
1 p Т 0,4
2,0 Т
2 2
В
В
4,-4 1 1 p -2,4
Л О К
0,-1 Т -6,3
Т
1
(б) Пусть p . Приведите матричную форму байе-
2
совской игры (8 очков). Подсказка: сколько у каждого иг-
рока стратегий? сколько чисел (выигрышей) нужно поста-
вить в каждую клетку матрицы?
У игрока 1 есть четыре стратегии: как играть при ти-
пе О и как при типе С. Например, ЛК означает, что О идет
в Липовый университет, а С — в Кедровый. Аналогично, у
игрока 2 имеется 4 стратегии: куда назначать после Липо-
вого университета и куда после Кедрового. Например,
стратегия ВТ означает назначение в В-отдел после Л и в Т-
отдел после К. Три числа в клетке: выигрыш игрок 1 при
типе О; при типе С, ожидаемый выигрыш игрока 2 при ус-
1
ловии p .
2
ТТ ТВ ВТ ВВ
ЛЛ 0; 2, –0.5 0; 2, –0.5 4; 6, –3.5 4; 6, –3.5
ЛК 0; 0, 1.5 0; 4, 2.5 4; 0, –0.5 4; 4, 0.5
КЛ –6; 2, 1.5 –2; 2, 2 –6; 6, –0.5 –2; 6, 1
КК –6; 0, 3.5 –2; 4, 5 –6; 0, 3.5 –2; 4, 5
(в) Найдите все равновесия Байеса–Нэша в чистых
стратегиях (4 очков)
287
Лекции по теории игр и экономическому моделированию
Подчеркнем максимальные выигрыши в столбце за
каждый тип игрока 1 и максимальный выигрыш в строке за
игрока 2. Получаются два РБН: (ЛЛ, ТТ) и (ЛК, ТВ).
Обратите внимание, что в каждом столбце есть клет-
ка, в которой подчеркнуты выигрыши игрока 1 обоих ти-
пов. Это общее свойство байесовских игр. Отсюда следует,
что можно было усреднить выигрыши игрок 1. Равновесия
Нэша в такой игре совпадают с равновесиями Байеса–
Нэша в исходной игре.
(г) Найдите все совершенные байесовские равнове-
сия в чистых стратегиях (8 очков)
Ищем скрывающие равновесия.
ЛЛ влечет ожидания (0.5, 0.5) на равновесном пути
(после Л) и выбор Т. Вне равновесного пути (после К) при
любых ожиданиях получается, что В лучше Т для игрока 2.
Но тогда типу С выгодно отклониться с Л на К, что увели-
чит его выигрыш с 2 до 4. Значит, ЛЛ не может быть до-
строено до СБР.
КК влечет выбор В на равновесном пути (после К) и
оптимальный ответ В за игрока 2. Вне равновесного пути
(после Л) игроку 2 всегда выгодно играть Т. Но тогда типу
О выгодно отклониться от К, повысив свой выигрыш с -2
до 0. Значит, в данной игре нет скрывающих равновесий.
ЛК влечет оптимальный ответ Т на Л и В на К. Ни у
типа О, ни у типа С нет выгодных отклонений.
КЛ влечет все равно оптимальный ответ Т на Л и В
на К, но теперь оба типа имеют мотивацию к отклонению.
Итак, в данной игре есть одно СБР: естественное вы-
являющее равновесие (ЛК,ТВ).
Другой способ нахождения СБР в этой игре основан
на том, что в этой игре игроку 2 при любых ожиданиях вы-
годно играть В после К и Т после Л. С учетом этого игроку
1 типа О выгодно играть Л, а при типу 2 ему выгодно иг-
рать К.
Задача 3. Что посеешь, то и пожнешь (30 очков)
Крестьянин владеет некоторым участком, где он мо-
жет заниматься земледелием. Выход продукции зависит от
288
Задачи письменных работ за прошлые годы
его трудолюбия. Уровень собственного трудолюбия кре-
стьянину известен. Остальные знают только, что трудолю-
бие крестьянина t равномерно распределено на отрезке
[0, 1]. Будем считать, что выигрыш крестьянина от обра-
ботки своей земли равен его трудолюбию t .
Прежде, чем начать обрабатывать свою землю, кре-
стьянин идет на соседнюю фабрику и предлагает взять его
для работы на конвейере. Крестьянин может попросить
хозяина фабрики любую заплату w 0 , а хозяин может
либо согласиться (С) с этим предложением, либо отказать-
ся (О) от него. Если хозяин отказывается от предложения
крестьянина, то тот возвращается к земледелию, выигрыш
хозяина считается равным 0. Если хозяин соглашается
взять к себе на работу крестьянина с заплатой w , то выиг-
рыш крестьянина считается равным его зарплате w , а вы-
3
игрыш хозяина равен t w , причем эта информация о
2
выигрышах общеизвестна.
(а) Это игра с полной или неполной информацией? (2 очка)
Это игра с неполной информацией, поскольку уро-
вень трудолюбия крестьянина является его приватной ин-
формацией, о которой у хозяина фабрики есть только об-
щее представление.
(б) Опишите множества чистых стратегий обоих иг-
роков. (4 очка)
Стратегией крестьянина является функция w f (t )
определенная на [0, 1] и принимающая неотрицательные
значения. Стратегия хозяина есть функция y g ( w) , опре-
деленная при всех w 0 и принимающая значения из мно-
жества {С,О}.
(в) Найдите равновесия Байеса-Нэша в чистых стра-
тегиях в этой игре. (10 очков)
Выигрыш крестьянина типа t с заявкой на зарплату
w равен t , если g ( w) O и w , если g ( w) C . Ясно, что
289
Лекции по теории игр и экономическому моделированию
крестьянина интересует максимальная зарплата, с которой
согласится хозяин: w* max{w | g ( w) C} .
Если t w* , то лучше оставаться дома. При t w*
лучше идти на фабрику и просить зарплату w* . При
t w* оба варианта равнозначны. Итак, оптимальный ответ
крестьянина на любую стратегию хозяина имеет вид поро-
говой стратегии.
В таком случае хозяину только нужно, установить
приемлемый уровень согласия w из условия выгодности
ожидаемого дохода при найме:
w
3
При w 1 имеем ( t w) d t 0 .
0
2
w 2
3 3 w 2 w2
Поскольку 2
t w d t w , то под-
2 2 4
0
ходит только w 0 .
1
3
При w 1 имеем t w d t 0 .
0
2
1
3 3 1 3
Поскольку 2 t w d t 2 2 w 4 w , то в СБР
0
3
пороговый уровень согласия должен быть не выше .
4
Противоречие.
Значит, есть только нулевое РБН: хозяин соглашается
только взять крестьянина на работу бесплатно, что не уст-
раивает крестьянина (кроме случая t 0 ).
(г) Для равновесий из пункта (в) найдите возможные
уровни общественного благосостояния (сумма выигрышей
крестьянина и хозяина, осредненная по типу крестьянина).
(4 очка)
290
Задачи письменных работ за прошлые годы
Суммарный ожидаемый выигрыш в нулевом РБН ра-
1
вен , причем это ожидаемый выигрыш крестьянина при
2
нулевом выигрыше хозяина фабрики.
(д) Местный политик, который выступает за рост
общественного благосостояния, предлагает урезать субси-
дии на воду фермерам, что снизит для крестьянина типа t
1
выигрыш от земледелия на собственном участке до t , но
2
не окажет влияния на продуктивность крестьянина при ра-
боте на фабрике. Можно ли анализом равновесий подтвер-
дить позицию местного политика, если исходить из крите-
рия общественного благосостояния? (10 очков)
t
Выигрыш крестьянина типа t равен , если
2
g ( w) O и w , если g ( w) C . Ясно, что крестьянина ин-
тересует максимальная цена, с которой согласится хозяин:
w* max{w | g ( w) C} .
t t
Если w* , то лучше оставаться дома. При w*
2 2
*
лучше идти на фабрику и просить зарплату w . При
t
w* оба варианта равнозначны. Итак, оптимальный от-
2
вет крестьянина имеет вид пороговой стратегии.
В таком случае, хозяину нужно установить приемле-
мый уровень согласия w из условия выгодности ожидае-
мого дохода при найме.
2w
1 3
При w имеем условие 2 t w d t 0 .
2 0
291
Лекции по теории игр и экономическому моделированию
2w
3 3 ( 2 w)2
Поскольку t w d t 2w2 w2 , то
0 2 2 2
1
получается, что РБН существует при любом w .
2
1
1 3
При w имеем условие t w d t 0 .
2 0
2
1
3 3 1 3
Поскольку 2 t w d t 2 2 w 4 w , то полу-
0
3
чается, что РБН существует при любом w .
4
Отметим, что в РБН выигрыш хозяина имеет макси-
1 1
мум выигрыша при w , и он равен . При этом кресть-
2 4
1
янин просит зарплату при любом типе и всегда получает
2
согласие. Таким образом, его ожидаемый выигрыш остает-
1 3
ся равным , а их суммарный выигрыш теперь равен .
2 4
Итак, крестьянина такой политикой выманить на
фабрику можно, но реальная польза для него будет только
1 5
при зарплате больше . Например, при w выигрыш
2 8
крестьянина и выигрыш хозяина увеличивается по сравне-
нию с первоначальным вариантом на 1/8.
Задача 4. Разбавленное удовольствие (30 очков)
Рассмотрим взаимоотношения бармена и посетителя.
Бармен подает посетителю виски с водой, выбирая долю
виски x [0,1] и долю воды 1 x . Затраты на одну пор-
цию составляют для бармена величину c x , где c 0 .
Не зная x , посетитель решает, купить порцию или
нет по рыночной цене p . Если он решается на покупку, то
292
Задачи письменных работ за прошлые годы
его выигрыш равен v x p , а выигрыш бармена равен
p c x . Предположим, что v c и что информация о вы-
игрышах общеизвестна. Если посетитель отказывается от
покупки, то его выигрыш считается равным 0, а выигрыш
бармена равен величине c x . Предположим, посетитель
является опытным и способным по вкусу распознать долю
x , но только после того, как заплатит за выпивку.
(а) Это игра с совершенной или несовершенной ин-
формацией? (2 очка)
Эта игра с несовершенной информацией, поскольку
бармен делает ход, о котором у посетителя нет информа-
ции.
(б) Постарайтесь как можно лучше изобразить дерево
этой игры. (4 очка)
pcx
да vx p
x
Б П
нет
c x
0
294
Задачи письменных работ за прошлые годы
pc c
p , значит, p c p (1 ) p .
1
Для посетителя сказать НЕТ ничего не даст, кроме
нуля, поэтому условие p v гарантирует невыгодность
отклоняться посетителю.
Итак, если v p c , то найдется такой коэффициент
c
дисконтирования (0,1) , что v p и релейные стра-
тегии образуют СПРН. При p c нужного СПРН нет, по-
скольку у бармена нулевой выигрыш при повторении
(1,ДА), а при отклонении до x 1 его выигрыш равен
p c . Естественно считать, что c 0 .
(е) При каких существуют такие цены, как в пунк-
те (д)? (5 очков)
c c
Если v , т.е. , то искомые цены p сущест-
v
вуют и СПРН строится с помощью релейных стратегий.
Поскольку 0 – это не только выигрыш (для каждого игро-
ка) в пошаговом равновесии Нэша, но и гарантированный
выигрыш (при антагонизме партнера), то невыполнение
pc
условия p ведет к тому, что нарушаются и условия
1
c
равновесия Нэша (даже не СП!). Таким образом, при
v
искомых цен не существует.
295
Лекции по теории игр и экономическому моделированию
Решение.
№ СБР стратегия стратегия представления
игрока 1 игрока 2 игрока 2
1 L b (1/3,2/3)
2 R a (1,0)
3 1/2 L+1/2 R 1/2 a+1/2 b (1/2,1/2)
В смешанном СБР 3 игроку 2 на 2-точечном инфор-
мационном множестве должно быть все равно, что выби-
296
Задачи письменных работ за прошлые годы
рать. Это может быть только при представлениях (1/2,1/2).
При какой смешанной стратегии игрока 1 могут возник-
нуть такие представления у игрока 2? Обозначим через
( L) p вероятность выбора L игроком 1. Тогда по усло-
вию согласования представлений и стратегий должно быть
2 1 1
выполнено p p .
3 3 2
Задача 2. Рассмотрим следующий вариант модели
найма на работу по завершению образования. Есть два ти-
па выпускников L и H. Тип L имеет выраженную в деньгах
функцию психологических затрат на образование
cL (e) e 2 , а тип H — cH (e) a e2 , где e 0 — оценка
уровня образования, а a (0,1) – оценка повышенных спо-
собностей выпускник типа H. Предполагается, что во вре-
мя работы производительность выпускников типов L и H
будет равна 1 e и 2 e , соответственно. Считается, что
конкуренция между фирмами вынуждает каждую фирму
стремиться предлагать выпускнику при приеме на работу
зарплату w , равную ожидаемому уровню его производи-
тельности.
(2.1) Какой уровень образования выберет тип L в лю-
бом выявляющем равновесии?
Для выпускника типа L в выявляющем равновесии
нужно максимизировать свой выигрыш w cL (e) , равный
1 e e 2 . Максимум достигается при e 1/ 2 , при этом
зарплата равна w 1 1/ 2 1.5 , а выигрыш равен
1 0.5 0.52 1.25 .
(2.2) Каков наименьший уровень образования для ти-
па H в выявляющем равновесии?
На плоскости (e, w) через точку (0.5, 1.5) , найденную при
решении (2.1), проходит для типа L кривая безразличия
w c(e) 1.25 w e 2 1.25 w 1.25 e 2 . Значит, чтобы
для типа L не было стимула претендовать на зарплату типа H
297
Лекции по теории игр и экономическому моделированию
должно выполняться условие 1.25 e 2 2 e . Минимальный
уровень образования е для типа H в выявляющем равновесии
достигается при равенстве и составляет 1.5.
(2.3) Найдите эффективный уровень образования для типа
H как функцию от a . Под эффективным образованием понима-
ется максимизация производительности минус затраты.
1
Максимум функции 2 e a e2 достигается при e .
2a
(2.4) Рассмотрим эффективное выявляющее равновесие,
при котором уровень образования для обоих типов выпускников
является эффективным. Найдите множество всех значений a ,
при которых такое равновесие существует.
В выявляющем равновесии из решения (2.2) и (2.3)
1
следует неравенство 1.5 . Отсюда для существования
2a
эффективного выявляющего равновесия получаем условие
1
0a .
3
Задача 3. Есть три участника рынка: один продавец и
два потенциальных покупателя неделимого товара. Обще-
известно, что оценки стоимости этого товара для покупа-
телей являются независимыми случайными величинами,
равномерно распределенными на отрезке [0, 1], а затраты
продавца на производство товара будем считать нулевыми.
Правила аукциона на данном рынке таковы. Сначала поку-
патель 1 предлагает продать продавцу товар по цене b 0 ,
скрытой от покупателя 2. Увидев цену b , продавец может
либо согласиться на сделку, либо отказаться от нее и пред-
ложить покупателю 2 купить у него товар по цене p 0 .
Если покупатель 2 соглашается на сделку, то он получает
товар по цене p . Если покупатель 2 отказывается от сдел-
ки, то товар достается покупателю 1 по цене b .
(3.1) Какова вероятность согласия покупателя 2 на
сделку при условии, что он получил от продавца предло-
298
Задачи письменных работ за прошлые годы
жение с ценой p ? Запишите ожидаемый выигрыш продав-
ца в этом случае как функцию от b и p . Запишите пред-
ложение, которое сделает продавец покупателю 2 в равно-
весии, как функцию от предложения b покупателя 1.
Покупатель 2 соглашается на предложение p про-
давца, если оценка стоимости товара для него попадает в
диапазон [ p,1] , что происходит с вероятностью 1 p .
Ожидаемый доход продавца при этом равен p (1 p) bp .
1 b
Максимум достигается при p .
2
(3.2) Если покупатель 1 предлагает цену b , то какова
вероятность того, что в равновесии продавец вернется к
сделке с ним? Каков ожидаемый выигрыш покупателя 1
как функция от его оценки стоимости товара v1 и его
предложения b ? Какова равновесная торговая стратегия
покупателя 1?
Если покупатель 1 предлагает цену b , то с учетом
(3.1) продавец (при отказе от сделки с покупателем 1)
1 b
предложит покупателю 2 цену p , который откажет-
2
1 b
ся от сделки с вероятностью . Значит, ожидаемый вы-
2
(1 b)(v1 b)
игрыш покупателя 1 будет равен . Эта вели-
2
v1 1
чина достигает максимума в точке 0 , поэтому наи-
2
лучшим предложением покупателя 1 будет b 0 при лю-
бом v1 .
(3.3) Вычислите ожидаемый выигрыш продавца в
равновесии.
Если предложение покупателя 1 есть b 0 , то про-
давцу нет смысла на него соглашаться. Он лучше сделает
299
Лекции по теории игр и экономическому моделированию
предложение p 1/ 2 покупателю 2 и получит выигрыш
p (1 p ) bp 1/ 4 .
Задача 4. Рассмотрим следующую торговую игру
между продавцом и покупателем. Сначала продавец произ-
водит товар низкого качества ( q 0 ) или высокого качест-
ва ( q 1 ). Затраты на производство товара низкого качест-
ва считаем равными 0, а затраты на производство товара
высокого качества полагаем равными 1. Потребительная
стоимость высоко качественного товара для покупателя
оценивается величиной v(1) 3 , а товара низкого качества
– величиной v(0) 1 . Покупатель не знает качества произ-
веденного товара, но по правилам торгов он может пред-
ложить один трех вариантов цены покупки p : 0.5, 1.5 или
2.5. Узнав предложенную цену p , продавец может согла-
ситься на сделку или отказаться от нее. Если продавец со-
глашается, то его выигрыш равен p q , а выигрыш поку-
пателя равен v( q) p . Если продавец отказывается от
сделки, то его выигрыш равен q , а выигрыш покупателя
равен 0.
(4.1) Изобразите дерево этой игры. (см. далее)
(4.2) Найдите совершенное по подыграм равновесие
Нэша (СПРН). Отметьте равновесные действия продавца и
покупателя во всех вершинах дерева игры. Определите вы-
игрыши игроков в равновесии.
В подыграх, соответствующих предфинальным вер-
шинам дерева, продавцу S всегда выгодно соглашаться.
300
Задачи письменных работ за прошлые годы
301
Лекции по теории игр и экономическому моделированию
соко качественного товара каждый период при получении
предложения от покупателей цены 2.5.
(4.3) Предположим, что по некоторым причинам по-
купатели всегда предлагают цену 2.5, если продавец нико-
гда в прошлом не продавал товар низкого качества. Найди-
те условия на , при которых в ответ на такую стратегию
покупателей продавец всегда будет производить товар вы-
сокого качества.
В этих условиях, если продавец всегда производит
товар высокого качества, то он продает его по цене 2.5 ка-
ждый период и получает совокупный дисконтированный
2.5 1
выигрыш от всех периодов, равный . Если он откло-
1
няется и производит товар низкого качества, то в одном
периоде он получает выигрыш 2.5, но потом цена падает до
0.5, как и его выигрыш. Итого, дисконтированный выиг-
0.5
рыш при отклонении равен 2.5 . Получаем условие
1
невыгодности отклонения для продавца:
2.5 1 0.5 2.5 1 2.5 2 1
2.5 .
1 1 1 1 2
(4.4) На самом деле покупатели могут предлагать це-
ны, меньшие 2.5, но продавец может взять обязательство
не соглашаться на сделку по цене 0.5 или 1.5. При каких
значениях продавец в СПРН производит в каждом пе-
риоде товар высокого качества и получает в каждом пе-
риоде от покупателя предложение цены 2.5, причем если
покупатель отклоняется от цены 2.5, то продавец отказы-
вается от сделки по любой меньшей цене?
Пусть покупатель отклоняется от цены 2.5 и предла-
гает 1.5. Если продавец соглашается на сделку по 1.5 в
этом и последующих периодах, то в текущем периоде он
выигрывает 1.5 по сравнению с отказом от сделки, но теря-
ет 1 на понижении цены с 2.5 до 1.5 в каждом следующем
302
Задачи письменных работ за прошлые годы
периоде. Обязательство отказываться от сделки по 1.5 вы-
годно при условии
1.5 0.6 .
1
Для цены 0.5 аналогично получается несущественное до-
полнительное условие
2
0.5 0.5 0.5 2 2.5 0.5 0.2 .
1
Итак, при 0.6 в силу решения пунктов (4.1)-(4.3) стра-
тегия продавца производить в каждом периоде товар высо-
кого качества и соглашаться только на высокую цену 2.5 в
сочетании со стратегиями покупателей предлагать высо-
кую цену 2.5, пока не было продаж товара низкого качест-
ва, образуют СПРН.
303
Лекции по теории игр и экономическому моделированию
б) Проведите последовательное исключение строго
доминируемых стратегий, используя смешанные страте-
гии.
Для армии А равновероятная атака на 2 и 3 домини-
рует атаку на 1, но не строго, если Д защищает 3. Это легко
поправить, взяв (3/5)А2+(2/5)А3. После исключения А1,
получим, что Д1 строго доминируется стратегией
(1/2)Д1+(1/2)Д2. В оставшейся 2х2 матрице ничего страте-
гии не сравнимы по доминированию.
в) Найдите все равновесия Нэша (РН) (в чистых и
смешанных стратегиях) в этой игре.
В чистых стратегиях РН нет. В смешанных стратеги-
ях единственное РН легко ищется по найденной в б) мат-
рице 22: ((3/5)А2+(2/5)А3 , (2/5)Д2+(3/5)Д3 ).
Задача 2. Рассмотрим следующую игру G в нор-
мальной форме при 2 x 3 .
C1 C2 C3 C4
R1 4, 4 0, 0 0, 0 x, x
R2 0, 0 –3, –3 0, 0 0, 0
R3 0, 0 0, 0 2, 2 0, 0
R4 x, x 0, 0 0, 0 1, 1
В этой задаче ограничимся чистыми стратегиями.
а) Найдите совершенное по подыграм равновесие
Нэша (СПРН) в игре G (3) (трехкратном повторении ис-
ходной игры G ) , в котором в первом периоде игроки иг-
рают ( R2 , C2 ) .
В исходной игре есть два РН в чистых стратегиях: ( R1, C1 )
и ( R3 , C3 ) . Построим искомое СПРН в G (3) так: в периоде 1 оба
играют ( R2 , C2 ) , а затем, если никто не отклонился, то играем в
периодах 2 и 3 стратегии ( R1, C1 ) , а если отклонился, то
( R3 , C3 ) . В периоде 2 отклоняться нет смысла, поскольку идет
304
Задачи письменных работ за прошлые годы
повторение РН. В периоде 1 отклоняться не выгодно, поскольку –
3 + 4 + 4 = 5 > 0 + 2 + 2 = 4.
б) Пусть игра G повторяется бесконечное число раз.
Можно ли на основе Народной теоремы с помощью релей-
ных стратегий построить в игре G (, ) СПРН с выигры-
шами (1,1) при некоторых условиях на коэффициент дис-
контирования , 0 1 ?
В условиях Народной теоремы требуется, чтобы вы-
игрыш каждого игрока в G (, ) был больше, чем в неко-
тором РН. Но у нас только два РН с выигрышами (4, 4) и
(2, 2), поэтому использовать релейные стратегии для по-
строения РН не получится: не будет выполнено условие
отклонения.
в) Сконструируйте (на основе двухфазовых страте-
гий) в игре G (, ) СПРН с выигрышами (1, 1) при неко-
торых допустимых параметрах 0 1 и 2 x 3 . Опи-
шите все множество допустимых параметров x и , при
котором сохраняется данное СПРН.
Возьмем две фазы: сотрудничество С= ( R4 , C4 ) и на-
казание Н= ( R2 , C2 ) . СПРН начинается с сотрудничества,
которое продолжается, пока кто-то от него не отклонится.
При отклонении наступает фаза наказания. Фаза наказания
продолжается, пока в ответ не будет наказания. Тогда Н
меняется в следующем периоде на С.
Проверим устойчивость к отклонениям. Если повто-
ряется С, то каждый (до нормировки выигрышей) получает
1
1 1 1 2 ... . Если отклониться и потом не воз-
1
вращаться в С через Н, то получим x 0 0 2 ... . Ус-
ловия невыгодности отклонения получатся в виде
1
x . Если после отклонения вернуться к С через Н, то
1
получим выигрыш x ( 3) 1 2 1 3 ... Условия не-
выгодности отклонения примут вид
305
Лекции по теории игр и экономическому моделированию
x ( 3) 1 1 x 1 4 . Если рассмотреть подыг-
ру, начинающуюся с фазы Н, то при отклонении игрок по-
лучает 0 вместо -3 сейчас и 1 в оставшиеся периоды. Усло-
вия невыгодности отклонения:
3
0 ( 3) 1 1 2 ... .
1 4
1
Заметим, что первое условие отклонения x
1
является следствием двух других, а условие x 1 4 при
3
2 x 3 выполняется автоматически, если , поэтому
4
все множество параметров, при которых данная конструк-
3
ция дает СПРН описывается неравенствами 1.
4
Задача 3. Два участника аукциона конкурируют за
покупку некоторого объекта. Ценности объекта v1 и v2
для участников являются независимыми случайными ве-
личинами, равномерно распределенными на отрезке [0,1].
Участник i имеет точною информацию своем значении vi ,
но не знает v j . Участники делают ставки из диапазона
[0,1] одновременно и независимо друг от друга. В данном
аукционе побеждает тот, кто поставил большую ставку.
При равенстве ставок бросается жребий. Каждый обязан
заплатить по средней ставке даже, если ему объект не
достается! (Отказаться от участия в этом аукционе нель-
зя.)
a) Выпишите функции выигрыша в данной игре.
306
Задачи письменных работ за прошлые годы
bi b j
vi , bi b j
2
vi bi bj
ui (vi , bi , b j ) , bi b j
2 2
bi b j
, bi b j
2
б) Найдите симметричное равновесие Байеса–Нэша
(РБН) в данной игре в классе квадратичных стратегий:
bi (vi ) c vi2 a , где c 0, a 0 .
Найдем ожидаемый выигрыш i при заданной стра-
тегии b j (v j ) c v 2j a игрока j с учетом того, что веро-
ятность совпадения ставок при такой стратегии равна ну-
лю. Ясно, что при ставке bi a игрок i всегда проигрыва-
ет, а поскольку платить надо и проигравшему, то лучше уж
делать нулевую ставку. При bi a победа на аукционе
игрока i определяется условием
bi a
bi b j (v j ) c v 2j a v j .
c
Тогда
1
Ev j (ui (vi , bi , b j (v j )) ui (vi , bi , b j (v j )) d v j
0
(b a ) / c 1 bi b j (v j )
i vi d v j ( )dvj
0 0 2
bi a bi
vi const .
c 2
Здесь под const понимается слагаемое, которое не зависит
от vi и bi .
Теперь при фиксированном vi нужно найти макси-
мум ожидаемого выигрыша по bi . Из условий 1-го порядка
307
Лекции по теории игр и экономическому моделированию
vi 1 1
получаем bi vi2 a . Итак, наилучший
2 c bi a 2 c
ответ на квадратичную стратегию так же является квадра-
тичным, поэтому РБН в этом классе искать можно. Понят-
но, что при vi 0 наилучшей ставкой является bi 0 , по-
этому в РБН должно быть a 0 , а в симметричном равно-
1
весии c c 1 . В итоге получаем единственное квад-
c
ратичное равновесие bi (vi ) vi2 , i 1, 2 .
в) Покажите, что в этой игре нет других РБН с глад-
кими возрастающими b(vi ) .
Обозначим b j 1 (bi ) решение уравнения b j (v j ) bi .
Тогда для ожидаемого выигрыша получим выражение
1
Ev j (ui (vi , bi , b j (v j )) ui (vi , bi , b j (v j )) d v j
0
b j 1 (bi ) 1 bi b j (v j )
vi d v j dvj
0 0 2
b
vi bj 1 (bi ) i const.
2
vi 1
Из условий 1-го порядка получаем . Для
bj (vi ) 2
симметричного РБН получаем дифференциальное уравне-
ние bi(vi ) 2vi bi (vi ) vi2 a , т.е. опять приходим квад-
ратичным стратегиям, а других гладких возрастающих
РБН нет.
Задача 4. Рассмотрим следующую сигнальную игру.
а) Найдите все выявляющие совершенные байесов-
ские равновесия (СБР).
308
Задачи письменных работ за прошлые годы
310
Задачи письменных работ за прошлые годы
ку 100000 (1 ) , если у него есть столько денег. В про-
тивном случае он отдает все, что у него есть.
Порядок ходов
1. Банк назначает ставку .
2. Предприниматель решает, брать ли кредит. Если он
берет 100,000, то вкладывает деньги в проект.
3. По завершению проекта становится известным,
привел ли он к успеху и происходит расплата бан-
ком.
а) Найдите СПРН для случая полной информации о
состоянии предпринимателя.
Богатый предприниматель всегда возвращает кредит,
а его ожидаемая прибыль от проекта равна
1
0.5 300000 (1 ) 100000 0 при ,
2
поэтому для богатого предпринимателя банк может назна-
1
чить .
2
Бедный предприниматель может вернуть деньги
только в случае успеха проекта. Его ожидаемый выигрыш
равен 0.5 (300000 (1 ) 100000) 0 при 2 , поэтому
для бедного предпринимателя банк назначит 2 .
б) Пусть размер состояния предпринимателя — это
его приватная информация. Банк не знает точно размера
состояния предпринимателя. Вероятность обращения в
банк за рисковым кредитом богатого предпринимателя
оценивается величиной ¼ . Найдите СБР.
311
Лекции по теории игр и экономическому моделированию
1 3 1 1
100000 (1 ) ( 100000 (1 ) 0) 100000
4 4 2 2
5 5 3
100000 (1 ) 100000 100000 100000
8 8 2
1
100000 0.
16
1
При 2 выигрыш банка U ( ) составляет
2
3 1 1 3
( 100000 (1 ) 0) 100000 ( 1)100000
4 2 2 8
Максимум достигается при 2 . В итоге получаем
не эффективное СБР: банк назначает ставку 2, от которой
богатый предприниматель отказывается, а бедный согла-
шается, при этом ожидаемый выигрыш банка составляет
37500, что по доходности меньше 50%, а вовсе не утроение
капитала... Это пример «плохого отбора» в играх с приват-
ной информацией: банку хочется работать с богатым, а
приходится с бедным.
312
Задачи письменных работ за прошлые годы
вероятно по жребию.) Выигрыш победителя равен pi ci ,
а выигрыш остальных равен 0.
а) Опишите эту ситуацию как байесовскую игру.
Действия каждой фирмы i — это назначение цены,
поэтому Ai [0, ) . Тип игрока — это его затраты, поэто-
му Ti [0,1] . Ожидания о типах остальных не зависят в
данном случае от знания своего типа. Стратегия фирмы i
есть функция pi (ci ) . Функции выигрыша определяются
очевидным образом. Потребитель в игре не участвует.
b) Найдите в этой игре симметричное линейное рав-
новесие Байеса–Нэша (РБН). Что будет при n ? Дайте
краткую интерпретацию.
Пусть pi (ci ) aci b для всех фирм i . Фиксируем
одну фирму i , ее затраты (тип) ci и линейные стратегии
остальных p j (c j ) ac j b . Найдем оптимальный ответ
фирмы i в виде назначения цены pi . Для этого запишем
ожидаемый выигрыш фирмы i . Ясно, что вероятность на-
значения другими фирмами цены pi равна 0. Выигрыш в
тендере фирмы i определяется условиями pi ac j b при
всех ji. Вероятность такого события равна
n 1
pi b pi b
1 , если только 0 1 . При выполнении
a a
последнего условия ожидаемый выигрыш фирмы i будет
n 1
p b
равен ( pi ci ) 1 i . Выпишем условие оптималь-
a
ности 1-го порядка:
n 1 n2
pi b n 1 p b
1 ( pi ci ) 1 i 0,
a a a
313
Лекции по теории игр и экономическому моделированию
p b n 1
или 1 i ( pi ci ) 0 ,
a a
a b n 1
или pi 1 ci .
n a a
В итоге получили линейную по затратам стратегию.
Для поиска параметров a и b , соответствующих симмет-
ричному линейному РБН, осталось приравнять коэффици-
ab a 1
енты: a ( n 1) / n , b b . При n
n n 1 n
получаем a 1 , а b 0 , т.е. пределе получаем искренние
стратегии pi ci , которые образуют РБН.
c) Найдите все симметричные РБН со строго возрас-
тающими и дифференцируемыми стратегиями.
Будем теперь искать симметричное РБН в виде
pi (ci ) f (ci ) строго возрастающей гладкой функции.
Условия победы в тендере теперь примут вид:
pi (ci ) f (c j ) или c j f 1 ( pi ) при всех j i . Вероят-
ность такого события равна (1 f 1 ( pi )) n1 , если только
0 f 1 ( pi ) 1 . При выполнении последнего условия ожи-
даемый выигрыш фирмы i будет равен
( pi ci )(1 f 1 ( pi )) n1 . Выпишем условие оптимальности
1-го порядка:
(1 f 1 ( pi )) n1
( f 1 ( pi ))
( n 1)( pi ci )(1 f 1 ( pi ))n 2 0.
pi
Вспомним, что должно быть при этом выполнено
pi f (ci ) , или f 1 ( pi ) ci , и что
1 1
( f ( pi )) ( f (ci ))
.
pi ci
314
Задачи письменных работ за прошлые годы
В итоге получаем
1
n 1 ( f (ci )) n2
(1 ci ) (n 1)( f (ci ) ci )(1 ci ) 0 , или
ci
( f (ci ))
(1 ci ) n 1 (n 1)( f (ci ) ci )(1 ci ) n 2 0 , или
ci
((1 ci ) n 1 f (ci )) (n 1)ci (1 ci ) n 2 .
ci
Интегрируя правую часть, получаем
n 1
(1 ci )n 1 f (ci ) (1 ci )n 1 (1 ci )n const .
n
Константа должна быть равна 0, поскольку при ci 1 все
обращается в 0. Итак,
n 1 n 1 1
f (ci ) 1 (1 ci ) ci .
n n n
Получили опять то же линейное РБН. Других
симметричных возрастающих гладких СБР нет.
Задача 2. Найдите совершенное байесовское равно-
весие (СБР) в приведенной далее игре.
В этой игре есть только две подыгры, соответствую-
щих ходам игрока 1 в предфинальных вершинах. Выберем
в них ходы x и w , соответственно. Теперь ясно, что после
хода природы A игрок 1 сделает ход L1, поскольку это
обеспечивает игроку 1 выигрыш, равный 3, а ход R1 — не
более 2, т.е. после A имеем: L1 строго доминирует R1. Те-
перь ясно, что представление на 3-элементном информаци-
онном множестве игрока 2 должно приписывать нулевую
вероятность левой позиции. Заметим еще, что после хода
природы C для игрока 1 ход R3 дает выигрыш всегда
больший, чем ход L3.
Осталось перебрать две стратегии игрока 1: L1L2R3
и L1R2R3.
315
Лекции по теории игр и экономическому моделированию
[p] [1-p]
[q] [1-q]
1
L1L2R3. Ясно, что p , q 0 . Тогда при ходе a
2
игрок 2 получает 1 гарантировано, а при ходе b – в сред-
нем. Значит, оба хода последовательно рациональны. Оп-
тимален также ход r . Но тогда после хода природы B иг-
року 1 выгодно играть R2, следовательно, с L1L2R3 СБР
не построишь.
1
L1R2R3. Теперь p 1, q . Оптимальными являет-
2
ся ходы a и r. Отклоняться от R2 или R3 игроку 1 при этом
не выгодно. Итак, получили единственное СБР в этой игре.
Задача 3. Трое сенаторов по имени Анна, Борис и
Василий участвуют в работе комитета, определяющего
ставку налога [0,1] . Анна — борец за свободу: ее выиг-
рыш от принятия ставки налога в день t равен
t (1 2 ) . Борис — умеренный: его выигрыш от принятия
ставки налога в день t равен t (1 ( T )2 ), 0 T 1 .
Василий — либерал: его выигрыш от принятия ставки на-
лога в день t равен t (1 (1 ) 2 ) . Каждый день один из
316
Задачи письменных работ за прошлые годы
них (равновероятно) получает право выдвинуть предложе-
ние. Предлагающий выдвигает ставку , а двое остальных
голосуют Да или Нет в алфавитном порядке имен. Если
хотя бы один из голосующих скажет Да, то игра кончается
со ставкой налога . Если оба говорят Нет, то игра про-
должается на следующий день.
a) Найдите совершенное по подыграм равновесие
Нэша (СПРН) в этой игре.
Подсказка. Существует СПРН со значениями A T B
такое, что Анна всегда предлагает A , Борис всегда пред-
лагает T , а Василий всегда предлагает B .
Будем искать СПРН в том виде, какой предложен в
подсказке. Идеальные ставки таковы: для Анны – 0, для
Бориса — T , а для Василия — 1. Поэтому Анне нужен го-
лос умеренного Бориса: если он проголосует против, то
более либеральный Василий — тем более. Собственно, по
условию игры Анна не нуждается в голосе Василия, по-
этому ей надо найти минимальную ставку налога, на кото-
рую согласится Борис. При такой ставке Борису будет все
равно, что сказать: Да или Нет. Рассуждая аналогично за
Василия, можем прийти к аналогичному выводу: ему надо
найти такую ставку, чтобы Борису было все равно, как го-
лосовать. Пусть VБ — ожидаемый выигрыш Бориса в
СПРН, т.е. на начало дня до того, как стало известно, кто
делает предложение. Сказав Нет, на выдвинутое предло-
жение, Борис перейдет в подыгру следующего дня, которая
совпадает с исходной игрой, а потому его ожидаемый вы-
игрыш от голосования против равен VБ . Из описанных
выше условий безразличия Анна и Василий должны пред-
ложить ему столько же. Если Борис сделает предложение
Б и получит одобрение одного из сенаторов комитета, то
оно будет принято, поскольку он не может быть невыгодно
сразу Анне и Василию, представляющим крайности. Итак,
если право сделать предложение выпадает Борису, то он
317
Лекции по теории игр и экономическому моделированию
может смело выдвигать T и получать выигрыш 1. Отсюда
получаем уравнение обратной индукции
2 1 1
VБ VБ 1 VБ
3 3 3 2
Из условий безразличия для Бориса при голосовании за
предложения Анны и Василия получаем
1 ( A T )2 1 ( B T ) 2 , или
3 2
3(1 )
( A T ) 2 ( B T ) 2 , значит
3 2
3(1 ) 3(1 )
A T , B T .
3 2 3 2
Чтобы завершить построение, нам нужно определить
условия, когда соглашается каждый сенатор. Ясно, что Бо-
рис соглашается на любое предложение [ A , B ] , по-
скольку внутренность этого отрезка для него лучше, чем
края, на которые он согласен по построению. Из условия
СПРН ожидаемый выигрыш Анны на начало периода дол-
1
жен быть равен VA 1
3
2
A T 2 B2 , поэтому она со-
318
Задачи письменных работ за прошлые годы
При 1 получаем A T , B T , TA T ,
TB T . Это означает фактический диктат умеренного Бо-
риса.
Заметим, что при 1 получаем A T 1,
B T 1 , чего не может быть при 0 T 1 , поскольку
предложения должны быть от 0 до 1. Следовательно, при-
веденное в пункте a) решение имеет смысл только для дос-
таточно больших коэффициентов дисконтирования .
Задача 4. В игре «суперприз» участвуют Банкир и
Конкурсант. Есть три одинаковых чемодана с номерами 0,
1 и 2. В одном из чемоданов с равной вероятностью (1/3)
находится 1 миллион долларов, а в других нет ничего. Че-
модан 0 принадлежит Конкурсанту. Банкир предлагает ку-
пить содержимое чемодана 0 по цене p0 . Если Конкурсант
соглашается на такую цену, то игра кончается заключени-
ем сделки, при которой Банкир получает содержимое че-
модана 0, заплатив Конкурсанту цену p0 . Если Конкур-
сант отказывается от предлагаемой ему сделки, то публич-
но перед обоими игроками открывается чемодан 1. После
этого Банкир снова предлагает купить содержимое чемо-
дана 0 по цене p1 . Если Конкурсант соглашается, то игра
кончается заключением сделки, при которой Банкир полу-
чает содержимое чемодана 0, заплатив Конкурсанту цену
p1 . Если Конкурсант отказывается от сделки и на этот раз,
то публично открывается чемодан 2, а Конкурсант стано-
вится владельцем содержимого чемодана 0. Будем считать,
что выигрыш от владения x миллионов долларов для Бан-
1
кира равен x , а для Конкурсанта равен x
, где 1 (раз-
мерность — миллионы долларов).
a) В предположении, что общеизвестно, найдите
СПРН, используя обратную индукцию.
Начинаем обратную индукцию после отказа Конкур-
санта на первое предложение. Если приз в чемодане 1, то в
319
Лекции по теории игр и экономическому моделированию
периоде 1 это станет известно. Когда ясно, в чемодане 0
приза нет, Конкурсант будет соглашаться на любую цену,
но Банкир будет предлагать 0. Если в чемодане 1 приза
нет, то чемодан 0 содержит миллион с вероятностью ½,
поскольку осталось два неоткрытых чемодана. Значит,
ожидаемый доход Конкурсанта при отказе от p1 равен ½.
1
1
Следовательно, он будет соглашаться при условии p1 ,
2
1 1
или p1
. Значит, Банкир предложит p1
. По-
2 2
скольку 1 , то ожидаемая стоимость выигрыша для
1 1
Банкира равна
0 , поэтому Банкир готов сделать
2 2
такое предложение.
Рассмотрим теперь период 0. Если предложение p0
будет отвергнуто, то с вероятностью 1/3 приз окажется в
чемодане 1 и оба получат по 0, но с вероятностью 2/3 в че-
модане 1 нет приза, и тогда ожидаемый выигры Банкира
1 1 1
будет равен
, а у Конкурсанта – p1 . Итого, ум-
2 2 2
1 1 1
ножая на 2/3, получаем
и . Следовательно,
3 3 2 3
1
1
Конкурсант согласится на p0 при условии p0 , или
3
1
p0
. Отсюда ясно, что в СПРН Банкир предлагает
3
1
p0
, а конкурсант соглашается.
3
b) Пусть теперь Банкир не знает , т.е. является
приватным параметром Конкурсанта, а Банкир знает толь-
ко, что — случайная величина, причем выполняется
320
Задачи письменных работ за прошлые годы
1
следующее условие: Pr(
x ) 2 x для любого x 1 2 .
2
Рассмотрим пороговую стратегию конкурсанта 0 ( p0 ) ,
1 ( p1 ) : соглашаться на цену p0 в первом раунде, если
0 ( p0 ) , и соглашаться на цену p1 во втором раунде,
если 1 ( p1 ) . Найдите необходимые и достаточные ус-
ловия на функции 0 ( p0 ) , 1 ( p1 ) , при которых описанная
пороговая стратегия Конкурсанта соответствует СБР.
Подсказка. Некоторые из следующих формул могут ока-
заться полезными: при любых x y выполнено
1 1 2( x y )
Pr( x | y ) ;
2 2 1 2y
a 1
1
при любых 1 выполнено Pr( a ) 1 ;
2
при любых a b 1 выполнено
1 1
b 1
a1
Pr( b | a) 2 2 .
1
1 a 1
2
Как и ранее, если приз в чемодане 1, то в периоде 1
это станет известно, поэтому в чемодане 0 нет ничего, а
значит, Конкурсант будет соглашаться на любую цену, но
Банкир будет предлагать 0.
Если в чемодане 1 ничего не окажется, чемодан 0 со-
держит миллион с вероятностью ½. Ожидаемый доход
Конкурсанта при отказе от p1 равен ½. Значит, он будет
1
1 1
соглашаться при условии p
1 , или p1 , или
2 2
1 ( p1 ) log 2 p1 . Итак, функцию 1 ( p1 ) из условий
СБР мы нашли.
321
Лекции по теории игр и экономическому моделированию
Теперь нам нужно функцию 0 ( p0 ) и цену p1 ( p0 ) ,
которая будет предлагаться в СБР. Если p0 отвергнуто, то
1 1
Банкир знает, что 0 ( p0 ) , или
0 ( p0 ) . Обозна-
2 2
1
чим y 0 ( p0 )
. Ожидаемый доход Банкира от предложе-
2
ния p1 , после того, как p0 было отвергнуто, равен
1 1 1
U B ( p1 ) Pr(
p1 |
y )( p1 )
2 2 2
2( p1 y ) 1
( p1 ) ,
1 2y 2
323
Лекции по теории игр и экономическому моделированию
4
a c a . Обозначим государ-
C (qi ) c qi , причем 0
9
ственные субсидии на инновации в стране i через xi . Эти
субсидии приводят к новой функции затрат:
Ci (qi , xi ) (c xi )qi . Затраты государства на субсидии
1 2
равны TCi ( xi ) xi .
2
События развиваются последовательно в два этапа.
(1) Государства одновременно и независимо выби-
рают уровни субсидий xi 0 .
(2) Зная уровни субсидий обоих государств, фирмы
одновременно и независимо выбирают уровни выпуска
qi 0 .
Выигрыш фирмы равен
i (q1 , q2 , x1 , x2 ) p(Q)qi Ci (qi , xi ) .
Выигрыш государства равен
Wi (q1 , q2 , x1 , x2 ) i (q1 , q2 , x1 , x2 ) TC ( xi )
.
(а) При заданных уровнях субсидий ( x1 , x2 ) найдите
равновесие Нэша (РН) для фирм на этапе 2, а также выиг-
рыши фирм и государств в этом РН.
i ( q1 , q2 , x1 , x2 ) ( a qi q j ) qi (c xi ) qi
(a c xi q j qi )qi ,
поэтому наилучший ответ из условий первого порядка дос-
a c xi q j
тигается в точке Ri (q j ) , если только эта
2
величина неотрицательна. Иначе наилучший ответ соот-
ветствует нулевому выпуску. Решая систему уравнений
324
Задачи письменных работ за прошлые годы
для РН qi0 R(q 0j ), i 1, 2, j 3 i , получаем РН в по-
дыгре при субсидиях ( x1 , x2 ) :
a c 2 xi x j
qi ( x1 , x2 ) , i 1,2, j 3 i .
3
Выигрыши в этом РН равны
2
a c 2 xi x j
i ( x1 , x2 ) , i 1,2, j 3 i,
3
2
a c 2 xi x j xi2
Wi ( x1 , x2 ) , i 1,2, j 3 i.
3 2
325
Лекции по теории игр и экономическому моделированию
вытесняя с рынка другую страну. Ясно, что при госмоно-
поли одной страны i и субсидиях xi оптимальный выпуск
равен qi ( a c xi ) / 2 , а выигрыш фирмы и государства
равены i (a c xi )2 / 4 и Wi (a c xi ) 2 / 4 x 2 / 2 .
Отсюда оптимальные субсидии при госмонополии равны
xi a c , откуда qi a c . При таком выпуске цена равна
затратам: p c , что обеспечивает вытеснение страны j .
Формально, B j ( a c) 0, q j (0, a c) 0.
Заметим, что при госмонополии одной строны цены
минимальны, что хорошо для потребителя обеих стран.
Выигрыш фирмы и государства монополиста равны
i (a c )2 и Wi (a c) 2 / 2 . Ясно, что СПРН с госмоно-
полией выгоднее монополисту, чем симметричное СПРН,
поэтому между странами может развернуться жесткая
борьба за захват рынка.
Задача 2. Синергетические отношения. Усилия
ei 0 каждого двух индивидов i 1, 2 в рамках некоторо-
го совместного дела влияют на выигрыши друг друга:
ui (ei , e j ) ei (ei e j ) e j , где j 3 i .
328
Задачи письменных работ за прошлые годы
(б) Найдите выявляющее совершенное байесовское
равновесие (СБР) в этой игре.
Есть два кандидата на СБР: искреннее или лживое.
В искреннем СБР «Глоток» активно рекламирует
Хороший напиток и пассивно — Плохой. Автоматически
p 1, q 0 . На активную рекламу потребитель отвечает
покупкой, а на пассивную – отказом. «Глотку» не выгодно
отклоняться ни при каком качестве напитка. Получили ис-
креннее СБР.
В лживом СБР «Глоток» активно рекламирует Пло-
хой напиток и активно Хороший. Значит, p 0, q 1 . По-
требитель покупает при пассивной рекламе и не покупает
при активной. Но «Глотку» при плохом напитке выгодно
отклониться на пассивную рекламу, чтобы получить r 0 .
Значит, лживого СБР при данных параметрах нет.
(в) Найдите скрывающее СБР в этой игре.
Есть два потенциальных скрывающих СБР: с актив-
ной или пассивной рекламой, независимо от качества на-
питка.
При активной рекламе p 0.6 . Ожидаемый выиг-
рыш от покупки равен 0.2, что больше 0, поэтому при ак-
тивной рекламе потребитель покупает напиток. Однако эту
конструкцию нельзя продлить до СБР. По условию
r c 0 , поэтому в случае Плохого напитка «Глотку» бо-
лее выгодна пассивная реклама, которая дает неотрица-
тельный выигрыш.
При пассивной рекламе q 0.6 . Ожидаемый выиг-
рыш от покупки для потребителя снова равен 0.2, поэтому
он покупает. Отклоняться в сторону активной рекламы
«Глотку» не выгодно при любом p и любой реакции по-
требителя на активную рекламу. Получили СБР.
(г) Найдите СБР, если вероятность Хорошего напит-
ка равна 0.4.
На выявляющие СБР такое изменение не влияет. Ис-
креннее СБР сохраняется.
329
Лекции по теории игр и экономическому моделированию
В скрывающих равновесиях теперь потребитель не
будет покупать напиток, поскольку его ожидаемый выиг-
рыш от покупки равен –0.2.
При активной рекламе, достроить скрывающее СБР
нельзя, поскольку при Плохом напитке «Глотку» выгодна
пассивная реклама: c 0 r .
При пассивной рекламе нужно, чтобы потребитель
не хотел купить напиток также и при активной рекламе.
Тогда «Глоток» не будет отклоняться при Хорошем напит-
ке. Этого можно достигнуть при p 0.5 . Итак, получили
нулевое (пассивная реклама и нет покупок) скрывающее
СБР. Ненулевых СБР в этом случае нет.
(д) Найдите СБР, если 0 c r R , а вероятность
Хорошего напитка равна 0.6.
Теперь искреннее выявляющее СБР вылетает, по-
скольку «Глотку» становится выгодным при Плохом на-
питке использовать активную рекламу: r c 0 . Лживое
СБР нет по нем же причинам, что и раньше: при плохом
качестве выгодно переходить на пассивную рекламу .
Возникает скрывающее СБР с активной рекламой
при q 0.5 . Скрывающее СБР с пассивной рекламой те-
перь получается при любом p , поскольку потребитель
будет покупать и при пассивной рекламе, а переходить на
активную рекламу «Глотку» нет смысла.
Задача 4. Как ставить оценки? Имеются препода-
ватель и студент. Преподаватель знает, что студенты бы-
вают двух типов H и L. Студент знает свой тип, а препода-
ватель нет. Известно, что априорная вероятность типа H
равна [0,1] . События развиваются в следующем по-
рядке.
Преподаватель устанавливает границу [0,100] в
очках для положительной оценки.
Зная свой тип и эту границу, студент решает, выбрать ли
этот предмет в качестве альтернативного курса или нет.
330
Задачи письменных работ за прошлые годы
Если студент не выбрал этот курс, то преподаватель по-
лучает 0, а студент – величину Wt , где t {H , L} тип
студента, причем 0 WL WH 100 .
Если студент выбрал данный курс, то он определяет
уровень усилий e по его освоению и сдает экзамен. На
экзамене студент типа L получает s e очков, а сту-
дент типа H получает s 2e .
Студент получает положительную оценку, если s .
В этом случае его выигрыш считается равным
100 e / 2 . В противном случае выигрыш студента ра-
вен e / 2 . Выигрыш преподавателя в любом случае
считается равным e .
(а) Рассмотрим престижное учебное заведение с высо-
кими стандартами, в котором велико, а WH не очень вели-
ко, например, 0.9 , WL 70, WH 80 . Найдите СБР.
Начнем с конца. Зная и свой тип, студент будет
сравнивать выигрыш от сдачи на положительную оценку с
минимальными достаточными для этого усилиями с аль-
тернативным выигрышем. Студенту H достаточно прило-
жить / 2 усилий, чтобы сдать экзамен и получить выиг-
рыш 100 / 4 . Студенту L потребуется усилий, что
соответствует выигрышу 100 / 2 .
Студенту H выберет курс при условии
100 / 4 WH 4(100 WH ) H 80 .
Студенту L выберет курс при условии
100 / 2 WL 2(100 WL ) L 60 H .
Если 60 , то придут как H, так и L. Выигрыш
преподавателя в этой зоне равен / 2 (1 ) . Эта вели-
чина возрастает по и достигает своего максимального
значения 33 при L 60 . При L H придет
только H. Выигрыш преподавателя в этой зоне / 2 дос-
331
Лекции по теории игр и экономическому моделированию
тигает максимального значения 36 при H 80 . Оста-
лось сравнить эти значения выигрышей преподавателя:
36 > 33. Итак, в СБР выбирать курс будут только H, наби-
рая на экзамене 80 очков.
(б) Рассмотрим престижное учебное заведение с «ис-
порченными» молодыми людьми, в котором велики и
WH , например, 0.9 , WL 70, WH 90 . Найдите СБР.
При этих условиях границы пересекаются иначе
H 40 L 60 , поэтому при 40 придут и H, и L, а при
40 60 останутся только L. Теперь нужно сравнивать
H / 2 (1 ) H 22 и (1 ) L 6 . В СБР будут и H, и L
при проходном уровне очков на экзамене, равном 40 .
(в) Рассмотрим посредственное учебное заведение, в
котором и WH малы, например, 0.5 ,
WL 70, WH 80 . Найдите СБР.
В этом случае H 80 L 60 , как и в (а), но те-
перь сравнение L / 2 (1 ) L 45 и H / 2 20 в
пользу 60 . В СБР на экзамене присутствуют и H, и L
при границе очков 60.
(г) Предположив одинаковое значение WL , проран-
жируйте экзаменационные очки s в случаях (а), (б), (в).
Итак, граница очков на положительную оценку самая
высокая в случае (а), а самая низкая в случае (б). В случаях
(б) и (в) в курсе участвуют оба типа. Причины разные. В
случае (б) тип L отфильтровать не возможно, а в случае (в)
– не выгодно.
(д) Приведите условия на параметры модели, чтобы
свойства СБР в случаях (а), (б), (с) сохранились.
Полное исследование зависимости от параметров не
приводится.
332
Литература
333