Вы находитесь на странице: 1из 176

Лекции по теории игр и экономическому моделированию

Лекция 13
Сигнальные игры

Этот класс игр имеет большое прикладное значение,


а также самостоятельный теоретический интерес. Действие
игрока трактуется как сигнал, если данное действие игрок
предпринимает на основе приватной информации (о типе),
недоступной остальным. Остальные могут только догады-
ваться о типе на основе действий информированного игро-
ка и знания его функции выигрыша. При этом информиро-
ванному игроку иногда бывает выгодно выявлять инфор-
мацию через действия, а иногда — скрывать ее.
Будем рассматривать простейший вариант сигналь-
ной игры, в которой принимают участие два игрока: S `—
отправитель и R — получатель.
Динамический сценарий сигнальной игры.
Этап 1. Природа выбирает тип t  T с вероятностью
p (t ) , p (t )  0,  p (t )  1 .
tT
Этап 2. Отправитель S наблюдает тип t и посылает
сообщение m  M .
Этап 3. Получатель R видит сообщение m (но не тип
t ) и выбирает действие a  A .
Этап 4. Определяются выигрыши uS (t , m, a ) и
u R (t , m, a) обоих игроков.
Стратегия отправителя S: функция m(t ) .
Стратегия получателя R: функция a( m) .
Пример. Бинарная сигнальная игра. Пусть множе-
ства типов, сообщений и действий содержат всего по два
элемента: | T || M || A | 2 . Тогда сигнальную игру можно
удобно изобразить графически. Начальную позицию с хо-
дом Природы (игрок 0) удобно расположить в центре дере-
ва игры. Ход игрока 0 вверх означает реализацию типа
t1  T отправителя S , а ход игрока 0 вниз — типа t2  T .

158
Лекция 13. Сигнальные игры
Отправитель узнает свой тип и посылает одно из сообщений:
m1 или m2 . Получив сообщение, но не зная, какой тип реали-
зовался, получатель R выбирает действие a1 или a2 .
a1 a1
m1 t1 m2

S 
a2 a2

0
a1 a1
1
S

m1 t2 m2
a2
a2
Здесь вероятности равны p (t1 )   , p (t2 )  1   . У
каждого игрока есть два информационных множества и
четыре стратегии. У игрока S есть две выявляющие страте-
гии: m(t1 )  m(t2 ) , а также две скрывающие стратегии:
m(t1 )  m(t2 ) . В общем случае бывают, конечно, еще гиб-
ридные стратегии: не взаимнооднозначные m(t ) , но и не
m(t )  const .
У игрока R каждое из двух двухэлементных инфор-
мационных множеств соответствует полученному сообще-
нию. На каждом нужно выбрать одно из двух действий,
поэтому получается 4 стратегии.
Пары выигрышей игроков нужно проставить во все 8
финальных позиций.
Перепишем теперь общее определение СБР для слу-
чая сигнальных игр.
Определение. Совершенное байесовское равновесие
в сигнальных играх есть совокупность стратегии отправи-

159
Лекции по теории игр и экономическому моделированию
теля m(t ) , стратегии получателя a( m) и представлений
получателя  (t | m) , которые удовлетворяют следующим
условиям.
Условие 1. Для каждого информационного множест-
ва H (m) , соответствующего сообщению m , задано веро-
ятностное распределение  (t | m) на множестве типов T ,
характеризующее представление получателя R о типах.
Условие 2. При заданных представлениях  (t | m)
стратегия получателя a( m) максимизирует его ожидаемый
выигрыш   (t | m)  u R (t , m, a ) для каждого сообщения m.
tT
Условие 3. Для стратегии a( m) , определенной усло-
вием 2, и для каждого t  T стратегия отправителя m(t )
максимизирует его выигрыш uS (t , m, a( m)) .
Условие 4. Представления получателя  (t | m) долж-
ны быть согласованы со стратегией отправителя m(t ) и
вероятностным распределением p (t ) на T по правилу
Байеса. 
Уточним условие 4.
Пусть T ( m)  {t  T | m(t )  m} . Если T ( m)   , то
H (m) лежит вне равновесного пути (и не достижимо не из
какой промежуточной позиции) и  (t | m) на нем может
быть определено произвольным образом.
Если T ( m)   , то H (m) лежит на равновесном пути
p(t )
и должно быть выполнено:  (t | m)  .
p (T (m))
Для того чтобы понять, как ищется СБР в сигнальной
игре, остановимся на конкретном числовом примере би-
нарной сигнальной игры, добавив выигрыши в рассмот-
ренный ранее пример.
Пример. Нахождение СБР в бинарной сигнальной
игре.
160
Лекция 13. Сигнальные игры

(1,3)
u u
[q]
[ p] t1
l r (2,1)
(4,0)
S 1
d
d 2 (0,0)
0
(2,4) (1,0)
u
1 u
S
2
(1,2)
(0,1)
[1  p] l t2 r
d [1  q]
d

Здесь
1
T  {t1 , t2 }, M  {l , r}, A  {u, d }, p(t1 )  p(t 2 )  .
2
Алгоритм поиска СБР в бинарной сигнальной игре.
А1. Фиксируем одну из четырех стратегий m(t ) от-
правителя S и будем пытаться достроить ее до СБР.
А2. Находим представления ( p и q ), согласованные
с m(t ) на равновесном пути.
А3. При заданных представлениях на равновесном
пути находим оптимальный ответ получателя R.
А4. Вне равновесного пути подбираем представления
и согласованные с ними действия получателя S так, чтобы
отправителю было невыгодно отклоняться от m(t ) для лю-
бого из своих двух типов.
Сначала будем искать скрывающие равновесия.
Р1. (l , l ) : S посылает сообщение l независимо от ти-
па. С этой стратегией в силу условия 4 согласуются пред-
ставления p  0.5 и любое q . При p  0.5 (как, впрочем, и

161
Лекции по теории игр и экономическому моделированию
при любом другом p для данного примера) ожидаемый
выигрыш от действия u ( 3.5 ) больше, чем ожидаемый вы-
игрыш от d (0.5), поэтому на равновесном пути в левом
информационном множестве игрок R будет выбирать u .
Осталось проверить выгодность отклонения для иг-
рока S. При t1 игрок S будет выбирать l , только если на
правом информационном множестве игрок R будет играть
d . (Сравните выигрыши игрока S). Для того чтобы R иг-
рал справа d , нужно, чтобы d было лучше u справа. От-
сюда получаем условие на q :
2
1  q  0  (1  q )  0  q  2  (1  q)  q  .
3
При таких q действие d будет оптимальным справа,
а игрок S не будет иметь мотивации к отклонению от l при
t1 . Последняя проверка: выгодно ли для S отклониться от l
при t2 ? Нет, поскольку при t2 , l и u слева его выигрыш
равен 2, а при отклонении r и ответе d справа его выиг-
рыш равен 1.
Итак, получили скрывающее СБР, которое может
быть кратко записано так:
 1 2
l , l , u, d , p  , q   .
 2 3
Р2. (r , r ) : S посылает сообщение r независимо от
типа. Теперь в силу условия 4 получаем q  0.5 . При таком
q оптимальным действием R справа будет d (1 > 0.5).
Слева оптимальным действием является u при любом p .
Но тогда игроку S выгодно отклониться от r и выбрать l
для любого типа.
Значит, (r , r ) не может быть достроено до равновесия.
Перейдем теперь к выявляющим равновесиям.

162
Лекция 13. Сигнальные игры
Р3. (l , r ) : S посылает сообщение l при t1 и r при t2 .
Оба информационных множества лежат на равновесном
пути, поэтому все представления определены однозначно:
p  1 , q  0 . Значит, R слева будет играть u , а справа d .
Но игроку S при t2 выгодно вместо r сыграть l (2 > 1).
Значит, (l , r ) нельзя достроить до СБР.
Р4. (r , l ) : S посылает сообщение l при t2 и r при t1 .
Теперь p  0 , q  1 . Слева R ходит u , справа R ходит тоже
u . Проверка показывает, что игроку S невыгодно откло-
няться ни при каком из своих двух типов.
Итак, получили выявляющее равновесие:
{r , l , u, u , p  0, q  1} .
Всего в этой игре существуют два СБР: одно скры-
вающее и одно выявляющее.
В следующей лекции мы рассмотрим несколько мо-
делей, основанных на сигнальных играх, а сейчас разберем
интересный частный случай сигнальных игр, когда выиг-
рыши не зависят от сообщений.
Бесплатные сигналы (Cheap-Talk Games). До сих
пор сообщения m не были чисто информационным дейст-
вием, поскольку выигрыши игроков от них зависели. Сей-
час мы рассмотрим случай, когда выигрыши зависят толь-
ко от типов и от действий, но не зависят от сообщений:
uS (t , a) и u R (t , a) .
Скрывающее равновесие в такой игре всегда сущест-
вует. Если m(t )  m* , то представления получателя опреде-
ляются как  (t | m* )  p (t ) и оптимальным действием бу-
дет выбор a* из условий максимизации ожидаемого выиг-
рыша  p (t )  uR (a, t ) . Действия a* игрок R в СБР выбира-
tT
ет в ответ на любое сообщение.

163
Лекции по теории игр и экономическому моделированию
Кажется, что ничего, кроме такого СБР в случае бес-
платных сигналов и быть не может. Но это не совсем так. В
рассмотренных ниже примерах найдены условия на функ-
ции выигрышей, при выполнении которых существуют, по
крайней мере, частично выявляющие равновесия.
Бинарная игра с бесплатными сигналами. Пусть
множества типов T  {1,2} и действий A  {1,2} состоят из
двух элементов каждое, а множество сообщений M  T
совпадает с множеством сигналов. Приведем таблицу вы-
игрышей (это не игра в нормальной форме, а просто табли-
ца значений).
a\t 1 2
1 x,1 y, 0
2 z, 0 w,1
Выигрыши игрока R заданы, причем, если бы он
имел информацию о типе, то выбирал бы a  t . Наша зада-
ча найти такие выигрыши x, y , z, w игрока S, при которых
существовало бы выявляющее равновесие.
1. Если x  z и y  w , то при любом типе игроку S
выгоднее, чтобы R сыграл 1, поэтому S будет пытаться
убедить R, что t  1 , но верить этому R не будет. Анало-
гично разбирается случай x  z и y  w .
2. Если x  z и y  w , то S будет пытаться убедить
R, что t  1 , когда t  2 , и наоборот. Поскольку R понима-
ет это, то верить он не будет.
3. Если x  z и w  y , оба игрока заинтересованы в
выявлении информации и стратегии m(t )  t и a( m)  m
образуют выявляющее равновесие СБР.
Итак, в бинарной игре с бесплатными сигналами для
существования выявляющего СБР необходимо, чтобы ин-
тересы игроков качественно совпадали.
Непрерывная игра с бесплатными сигналами.
Множество типов состоит из отрезка T  [0,1] с равномер-
ным распределением. Множества сообщений M  T и
164
Лекция 13. Сигнальные игры
действий A  T совпадают с множеством типов. Получа-
тель R хочет точно угадать тип. Его выигрыш равен
u R (t , a)  (a  t ) 2 . Отправитель S хочет угадать тип с за-
данным завышением. Выигрыш отправителя S равен
2
uS (t , a)    a  (t  b)  , b  0 .
Оказывается, что в этой игре существуют гибридные
кусочно-линейные СБР. Число кусков n зависит от вели-
чины рассогласования b .
Начнем с n  2 . Разобьем отрезок на два диапазона с
помощью x1 .

0 x1 1

0 1
Слева от x1 посылается сообщение 0, а справа – со-
общение 1.
Получатель знает тип с точностью до диапазона, по-
этому его оптимальный ответ – середина соответствующе-
x 1  x1
го диапазона: a(0)  1 , a(1)  .
2 2
Отправитель пошлет сообщение 0 или 1, в зависимо-
x 1  x1
сти от того, что ближе к t  b : a(0)  1 или a(1)  .
2 2
Чтобы оптимальный ответ m(t ) совпадал с m(t )  0 при
t  x1 и m(t )  1 при t  x1 , должно быть выполнено усло-
вие
1  x 1  x2  1
x1  b   1    x1   2b .
2 2 2  2

165
Лекции по теории игр и экономическому моделированию
Для того чтобы это решение имело смысл, должно
1
быть выполнено b  . При больших значениях рассогла-
4
сования b существует только скрывающее равновесие.
Заметим, что длины отрезков в СБР отличаются на
4b : (1  x1 )  ( x1  0)  4b .
Нетрудно показать, что это свойство сохраняется при
любом количестве n кусков. Пусть длина самого малень-
кого левого куска равна d . Тогда остальные длины обра-
зуют арифметическую прогрессию
d  (d  4b)  (d  8b)    ( d  (n  1)  (4b))  1 .
n(n  1)
Поскольку 1  2    ( n  1)  , то уравнение
2
для d примет вид n  d  n(n  1)  2b  1 .
Если 2bn(n  1)  1 , то положительное решение урав-
нения существует. Обозначим через n* (b) максимальное
n , для которого 2bn(n  1)  1 . Найдем положительный ко-
1
рень квадратного уравнения n2  n   0 , равный
2b
1 1 1
  . Целая часть этой величины равна n* (b) . При
2 4 2b
1
b получается n* (b)  1 , что соответствует скрывающе-
4
му равновесию.
Ясно, что при b  0 число кусков n* (b)   , т.е.
гибридное равновесие становится все ближе к выявляю-
щему, но совпадет с ним только при полном совпадении
интересов игроков.

166
Лекция 13. Сигнальные игры
Задачи к лекции 13
13.1. Найдите скрывающее совершенное байесовское
равновесие, в котором отправитель любого типа играет r в
следующей сигнальной игре:

t1 0,1
1,2 l r

0.5 3,0
2,0
R 0 R
0,0 0.5 1,0

l r 2,2
t2
3,1
13.2. Рассмотрим сигнальную игру с тремя типами.

t1 0,1
1,1 l r

(1/3) 0,0
1,0
R R
2,1 t2 1,1

l (1/3) r 1,0
0,0
t3 0,0
1,1

l r 2,1
(1/3)
0,0
Найдите все скрывающие совершенные байесовские рав-
новесия, в которых отправитель любого типа играет l.
13.3. Рассмотрим две сигнальные игры.

167
Лекции по теории игр и экономическому моделированию

(1,1) а. (2,2)
u
u
[ p] t1 [q ]
l r
(2,0)
S 1
d
d 2 (0,0)
0
(0,0) (1,0)
u
1 u
S
2
(0,1) (1,1)
[1  p ] l t2 r [1  q]
d d

(3,0) б. (0,0)
u u
[q]
[ p] t1
l r
(1,1)
S 1
d
d 2 (4,1)
0
(3,3) (1,2)
u
1 u
S
2
(0,1) (2,0)
[1  p ] l t2 r [1  q]
d d

Найдите все скрывающие и выявляющие совершен-


ные байесовские равновесия в этих сигнальных играх.

168
Лекция 13. Сигнальные игры
13.4. Найдите все совершенные байесовские равнове-
сия для двух игр из задач 13.1 и 13.2.
13.5. Рассмотрим сигнальную игру 2, аналогичную
динамической игре 1 с неполной, но несовершенной ин-
формацией, которую мы определили в лекции 12.
Игра 1:

1 R

L (1,3)
M
2
L R
R L

(2,1) (0,0) (0,2) (0,1)


Игра 2:
(2,1)
u

L t1 R a
(0,0) (1,3)
S 1
d 2
R R
(0,2) 0
u
1
S 2 a
(1,3)
(0,1)
M R
t2
d
Типы t1 и t2 аналогичны ходам L и M в сигнальной
игре. Если S получает сигнал R, то игра фактически закан-
чивается.
Найдите РБН в чистых стратегиях и СБР в данной
сигнальной игре 2. Сравните все РН и все СБР в игре 1.
169
Лекции по теории игр и экономическому моделированию
13.6. Найдите СБР в следующей игре с бесплатными
сигналами.
a\t 1 2 3
1 0,1 0,0 0,0
2 1,0 1,2 1,0
3 0,0 0,0 2,1
Все 3 типа равновероятны. Напомним, что это пла-
тежная матрица выигрышей игроков 1 и 2 в зависимости от
действия и от типа, а не матрица игры в нормальной фор-
ме.
13.7. Рассмотрим непрерывную игру с бесплатными
сигналами, описанную в лекции. Для каких значений b
существует трехступенчатое равновесие? В каком равнове-
сии ожидаемый выигрыш получателя больше: в трех- или в
двухступенчатом равновесии? Какому типу отправителя
лучше в трехступенчатом равновесии по сравнению с
двухступенчатым?

170
Лекция 14. Модели, основанные на сигнальных играх
Лекция 14
Модели, основанные на сигнальных играх

Сигнальные игры широко используются при модели-


ровании. Мы приведем по одному примеру из трех различ-
ных направлений: сигналы на рынке труда, инвестиции
корпораций и денежная политика.
Сигналы на рынке труда. Модель Спенса. В этой
модели участниками являются молодые люди (студенты),
которые после завершения образования собираются нани-
маться на работу, и фирмы, которые заинтересованы в вы-
сокоэффективных работниках. Считается, что каждый сту-
дент может быть либо высокоэффективным (тип H) как
работник, либо обыкновенным (тип L). Доля (вероятность)
студентов типа H оценивается равной p , а типа L — как
1 p .
Студенты в процессе завершения образования соби-
раются приложить разные усилия e , которые измеряются
объемов дополнительных курсов, средним баллом и еще
какой-то объективной характеристикой, указанной в ди-
пломе, который предъявляется при приеме на работу.
Предполагается, что продуктивность работника
y (t , e) зависит от его типа t {H , L} и от усилий e  0 на
получение образования, причем y ( H , e)  y ( L, e) и y (t , e)
возрастает по e при фиксированном t .
Выигрыш работника при найме на работу с зарпла-
той w равен w  c(t , e) , где величина c(t , e) характеризует
оцениваемые в деньгах психологические затраты, связан-
ные с усилиями e студента типа t .
Выигрыш фирмы при найме работника равен
y (t , e)  w , однако в модели Спенса учитывается еще и
конкуренция фирм за работника. Мы не будем описывать
полную модель со многими фирмами, а остановимся на
подыгре, в которой участвует один студент и одна фирма.
Однако с учетом конкуренции мы будем предполагать, что
171
Лекции по теории игр и экономическому моделированию
выигрыш фирмы равен [ y (t , e)  w]2 , что означает жела-
ние фирмы правильно угадать с помощью зарплаты ожи-
даемый уровень продуктивности работника. Больше фирма
платить не заинтересована, а меньше — ей не позволит
конкуренция за работников с другими фирмами, которые
могут переманить недооцененного работника.
Динамический сценарий в модели Спенса выглядит
следующим образом.
Этап 1. Природа определяет тип студента: H с веро-
ятностью p или L с вероятностью 1  p .
Этап 2. Предполагается, что студент знает свой тип t
и выбирает уровень усилий e  0 при завершении образо-
вания.
Этап 3. Фирма не знает тип t студента, но она видит,
какие усилия e он потратил на завершение образования.
На этой основе она определяет размер зарплаты w .
Этап 4. Выигрыш поступившего на работу студента
равен w  c(t , e) , а выигрыш фирмы равен [ y (t , e)  w]2 .
Главным предположением модели Спенса является
то, что студенту типа L дополнительные усилия даются
тяжелее, чем студенту типа H, т.е. сигналы в этой игре да-
леко не бесплатные. Формально можно это предположение
записать в виде неравенства на предельные затраты, свя-
занные с образовательными усилиями:
ce ( L, e)  ce ( H , e) .
Изобразим графически линии безразличия I L и I H
для работников типов L и H. Пусть эти линии проходят
через общую точку (e1 , w1 ) . Напомним, что линии безраз-
личия работника на плоскости (e, w) соответствуют соче-
таниям усилий и зарплаты с одинаковым выигрышем:
w  c (t , e)  const .
При увеличении усилий с e1 до e2 для сохранения
уровня выигрыша игроку типа L нужна зарплата wL ,
172
Лекция 14. Модели, основанные на сигнальных играх
большая, чем зарплата wH , которая компенсирует допол-
нительные усилия игроку типа H.
w IL IH

wL
wH
w1

e1 e2 e
Прежде чем переходить к поиску СБР в этой игре,
рассмотрим случай полной информации. Если фирма знает
тип работника, то она назначит ему зарплату w(t )  y (t , e) ,
а работник (в бытность студентом) выберет усилия e* (t ) ,
исходя из максимизации своего выигрыша y (t , e)  c(t , e) .

It
y
y (e, t )

w* (t )

e* (t ) e

173
Лекции по теории игр и экономическому моделированию
Обозначим w* (t )  y (t , e* (t )) . Графически в точке
(e* (t ), w* (t )) происходит касание уровня безразличия и ли-
нии (для простоты ее можно изобразить прямой) выпуска
y (e, t ) .
При поиске СБР важным является то, насколько
близки типы работников. Может тип L выдержать уровень
обучения e* ( H ) ради более высокой зарплаты w* ( H ) или
его дополнительные затраты настолько высоки, что даже
более высокая зарплата не компенсирует эти затраты. Если
w* ( L)  c( L, e* ( L))  w* ( H )  c ( L, e* ( H )) , то будем гово-
рить, что типы H и L сильно различимы.

y y ( H , e)

y ( L, e )
w* ( H )

w* ( L)

*
e* ( L ) e ( H ) e
Для этого случая легко построить выявляющее СБР.
Стратегия работника в этом СБР: выбирать оптимальный
уровень образования для своего типа e( H )  e* ( H ) и
e( L)  e* ( L ) . С учетом этой стратегии работника ожидания
фирмы, которые задаются вероятностью  ( H | e) , в этом
выявляющем СБР должны быть определены однозначно
при оптимальных уровнях образования на основании усло-
вия согласования представлений на равновесном пути. До-
определим эти представления вне равновесного пути так,

174
Лекция 14. Модели, основанные на сигнальных играх
чтобы игроку типа L было невыгодно маскироваться под
тип H:  ( H | e)  0, e  e* ( H ) ,  ( H | e)  1, e  e* ( H ) .
Стратегия фирмы в СБР состоит в том, чтобы назна-
чать адекватную зарплату: w(e)  y ( L, e) при e  e* ( H ) и
w(e)  y ( H , e) при e  e* ( H ) .
Выигрыши обоих игроков в этом СБР совпадают со
случаем полной информации.
Более интересен случай, когда типы H и L слабо раз-
личимы, т.е. когда дополнительная зарплата компенсирует
типу L дополнительные затраты на более высокий уровень
обучения: w* ( L)  c( L, e* ( L))  w* ( H )  c ( L, e* ( H )) .

w* ( L)

e* ( L) e* ( H ) eS e

Обозначим через eS  e* ( H ) такой уровень усилий


на обучение, при котором ложные сигналы типу L стано-
вятся невыгодны w* ( L)  c ( L, e* ( L))  y ( H , eS )  c( L, eS ) .
Тогда выявляющее СБР строится на основе стратегии ра-
ботника e( H )  eS и e( L)  e* ( L ) , ожиданиях фирмы
 ( H | e)  0, e  eS ,  ( H | e)  1, e  eS
и стратегии фирмы w(e)  y ( L, e) при e  eS и
w(e)  y ( H , e) при e  eS .
175
Лекции по теории игр и экономическому моделированию
В этом СБР студенту типа H приходится прилагать
«лишние» усилия по завершению курса только для того,
чтобы фирма могла уверенно отличить его от типа L.
Ясно, что типу H отклоняться от сигнала eS невы-
годно, как в сторону увеличения (лишние затраты при той
же зарплате), так и в сторону уменьшения, поскольку для
H невыгодно выдавать себя за L. Линия безразличия I H ,
проходящая через точку (eS , y ( H , eS )) при e  eS лежит
выше линии выпуска y ( L, e) . Типу L отклонение не прино-
сит выигрыша, поскольку для получения зарплаты y (e, H )
ему придется достигнуть уровня eS , что связано для него
со слишком большими затратами.
Перейдем теперь к анализу скрывающих равновесий.
Пусть оба типа подают одинаковый сигнал eP . Тогда по
правилу согласования представлений должно быть выпол-
нено  ( H | eP )  p . Оптимальным ответом при таких пред-
ставлениях является следующая зарплата
wP  p  y ( H , eP )  (1  p )  y ( L, eP ) .
Для завершения конструкции скрывающего СБР
нужно описать представления и стратегию вне равновесно-
го пути. Проще всего это сделать, положив  ( H | e)  0 и
w(e)  y ( L, e) при e  eP .
Конечно, такие представления и действия вне равно-
весного пути явно напоминают необоснованные угрозы.
Но во-первых, у нас нет никаких условий согласования на
недостижимых информационных множествах, а во-вторых,
такое доопределение СБР вне равновесного пути не явля-
ется единственным. В качестве задачи предлагается найти
другой вариант представлений и действий вне равновесно-
го пути для скрывающего СБР.
Графически скрывающее СБР можно изобразить с
помощь трех линий выпуска: y ( H , e) для типа H, y ( L, e)

176
Лекция 14. Модели, основанные на сигнальных играх
для типа L и ожидаемого выпуска при скрывающем СБР
py ( H , e)  (1  p ) y ( L, e) .

IL
y ( H , e)
y IH
py ( H , e)
(1  p ) y ( L, e)

wP
y ( L , e)

w* ( L )

e* ( L ) eP y

Перейдем теперь к построению гибридного СБР, в


котором тип H выбирает уровень обучения e , а тип L ис-
пользует смешанную стратегию, которая выбирает сигнал
e с вероятностью  , и сигнал eL с вероятностью (1   ) .
По условию согласования представлений и правилу Байеса
должно быть выполнено
p
 ( H | e )  ,  ( H | eL )  0 .
p  (1  p )
Поскольку p  (1  p)  1 , то  ( H | e )  p , т.е. при полу-
чении сигнала e фирма склона увеличивать шансы типа
H, даже если она понимает, что с вероятностью  такой
сигнал может подавать тип L. Правда, если  стремится к
0, то  ( H | e ) стремится к 1. Напротив, если  стремится
к 1, то  ( H | e ) стремится к 0. Таким образом, можно счи-
тать, что гибридное равновесие занимает промежуточное
положение между выявляющим и скрывающими СБР.
177
Лекции по теории игр и экономическому моделированию
Вслед за представлениями фирмы  ( H | eL )  0 сле-
дует положить w(eL )  y ( L, eL ) . В случае выявления тип L
в ответ выберет eL  e* ( L) , т.е. свой оптимальный уровень
при полной информации.
Для существования оптимального ответа работника в
смешанных стратегиях должно быть выполнено
w* ( L)  c ( L, e* ( L))  w  c ( L, e ) ,

где w  w(e )  y ( L, e ) .
При этом с точки зрения фирмы должно быть выпол-
нено условие оптимальной зарплаты
p (1  p)
w   y ( H , e )   y ( L, e ) .
p  (1  p ) p  (1  p )
Решение этого уравнения относительно  сущест-
вует и единственно при y ( L, e )  w  y ( H , e ) . Найдем
сначала вероятность q из условия
w  qy ( H , e )  (1  q ) y ( L, e ) ,
p(1  q)
а затем вычислим вероятность   .
q(1  p)
Для графического изображения гибридного равнове-
сия и сравнения его с найденными ранее выявляющим и
скрывающим равновесиям нам понадобятся четыре линии
выпуска: y ( H , e) для типа H, y ( L, e) для типа L и ожидае-
мого выпуска py ( H , e)  (1  p ) y ( L, e) при скрывающем
СБР и ожидаемого выпуска qy ( H , e)  (1  q) y ( L, e) при
гибридном СБР.
Уровень образования e для гибридного равновесия
лежит между оптимальным уровнем e* ( L ) образования
для типа L при выявлении информации и уровнем eS , ко-
торый позволяет различить типы.
178
Лекция 14. Модели, основанные на сигнальных играх
IH
IL y ( H , e)
qy ( H , e)
w
 (1  q) y ( L, e)

w py ( H , e)
(1  p) y ( L, e)
y ( L, e )
*
w ( L)

e* ( L ) e eS e

Для завершения построения гибридного СБР страте-


гию работника определим как e( H )  eS для типа H и сме-
шанную для типа L, которая выбирает e* ( L ) с вероят-
ность  и e с вероятностью 1   .
Ожидания фирмы определим следующим образом:
 ( H | e)  0, e  e ,  ( H | e)  q, e  eS .
Стратегия фирмы такова: назначить w(e)  y ( L, e)
при e  eS и w(e)  qy ( H , e)  (1  q) y ( L, e) при e  eS .
Линия qy ( H , e)  (1  q) y ( L, e) с увеличением  под-
нимается до линии y ( H , e) , а при уменьшении  она при-
ближается к линии py ( H , e)  (1  p ) y ( L, e) . В этом смысле
данное семейство гибридных равновесий связывает край-
ние случаи: выявляющее и скрывающее равновесие.

Предприниматель и инвестор
Допустим, что предпринимателю нужно привлечь
внешние инвестиции для выполнения некоторого нового
привлекательного проекта. У предпринимателя есть при-
ватная информация о прибыльности существующей ком-
пании, но доход от нового проекта не может быть выделен
179
Лекции по теории игр и экономическому моделированию
на фоне доходов существующей компании. Все, что можно
наблюдать — это агрегированную прибыль фирмы.
Предположим, что предприниматель предлагает по-
тенциальному инвестору некоторую долю собственности
фирмы в обмен на необходимые для нового проекта инве-
стиции. В каком случае новый проект будет реализован, и
какова будет переданная доля фирмы?
Рассмотрим эту модель в виде сигнальной игры,
предположив, что доходы существующей фирмы могут
быть либо высокими t  H , либо низкими t  L , где
H  L  0 . Пусть для реализации нового проекта необхо-
димы инвестиции I . Привлекательность проекта для инве-
стора характеризуется тем, что этот проект дает большую
доходность, чем альтернативный для инвестора вариант r
(скажем, банковский процент): R  I  (1  r ) .
Динамический сценарий игры.
1. Природа определяет доход текущий фирмы: t  H
с вероятностью p или t  L с вероятность 1  p .
2. Предприниматель узнает тип t и делает предложе-
ние потенциальному инвестору в виде доли s собственно-
сти фирмы, где 0  s  1 .
3. Инвестор видит s (но не t ) и принимает решение:
принять предложение или отказаться.
4. Если инвестор отказывается, то его выигрыш равен
I  (1  r ) , а выигрыш предпринимателя равен t . Если инве-
стор соглашается, то его выигрыш равен s  (t  R) , а выиг-
рыш предпринимателя равен (1  s )  (t  R) .
В этой сигнальной игре у получателя (инвестора)
всего два действия: согласиться или отказаться. У отправи-
теля (предпринимателя) множество сигналов больше, но,
как оказывается, этого недостаточно для эффективного
взаимодействия участников.
Начнем со скрывающего равновесия, в котором оба
типа посылают сигнал s . Представления инвестора долж-

180
Лекция 14. Модели, основанные на сигнальных играх
ны приписывать вероятность p типу L. В этом случае ус-
ловие согласия инвестора с предложением s имеет вид
s[ pL  (1  p) H  R]  I (1  r ) .
Для предпринимателя его часть дохода после реали-
зации проекта (1  s )  (t  R) не должна быть меньше теку-
щих доходов t :
R
(1  s )  (t  R)  t  s  .
tR
Отсюда видна верхняя грань для предложения с точки зре-
ния рациональности предпринимателя.
Оба условия на долю s могут быть выполнены, если
I (1  r ) R
 .
pL  (1  p) H  R t  R
При малых p это неравенство следует из условия
привлекательности проекта R  I  (1  r ) . При p , близких к
1, нужно дополнительно потребовать выполнение условия
H
R  I  (1  r )  I  (1  r ) L,
R
т.е. проект должен быть не просто привлекательным, а
иметь определенную степень привлекательности по срав-
нению с альтернативным вариантом.
На содержательном уровне для этого скрывающего
равновесия получается, что тип H субсидирует на финан-
совом рынке тип L, поскольку минимальное предложение
I (1  r )
pL  (1  p) H  R
для типа H хуже, а для типа L лучше случая с полной ин-
формацией. Конечно, такие косвенные субсидии еще не
означают отказа инвестора от участия в проекте. Если при-
веденные выше условия существования скрывающего СБР
181
Лекции по теории игр и экономическому моделированию
выполнены, то потери от субсидирования перекрываются
доходами от участия в новом проекте.
I (1  r ) R
Если  , то скрывающего рав-
pL  (1  p) H  R t  R
новесия не существует, однако выявляющее равновесие в
этой игре существует всегда. В выявляющем равновесии
I (1  r )
предприниматель типа L предлагает долю , на что
LR
инвестор соглашается. Тип H не может сделать для себя
I (1  r ) R
невыгодное предложение s   , а при любом
H R HR
I (1  r )
предложении s  получит отказ. В итоге в выяв-
H R
ляющем СБР новый проект будет реализовывать на полу-
ченные инвестиции только слабый тип L. В этом неэффек-
тивность механизма переговоров предпринимателя и инве-
стора, обусловленная недостаточным разнообразием мно-
жества сигналов.
Обсудим кратко другой способ привлечения инве-
стиций: долговой контракт вместо передачи портфеля ак-
ций. Предположим, что инвестор соглашается на долговой
контракт в размере D . Если предприниматель не объявит о
своем банкротстве, то инвестор получит выигрыш D , а
выигрыш предпринимателя будет равен t  R  D . Если
предприниматель объявит о банкротстве, то его выигрыш
будет равен нулю, а выигрыш инвестора будет равен дохо-
ду перешедшей ему в собственность фирмы: t  R .
Если L  0 , то скрывающее равновесие существует.
Оба типа просят в долг D  I (1  r ) , на что инвестор со-
глашается. Если L  0 , причем R  L  I (1  r ) , то тип L не
может вернуть долг, даже с учетом доходов от нового про-
екта, поэтому инвестор не может в этом случае согласиться
на долговой контракт. Аналогичная ситуация возникает в
том случае, если H и L представляют ожидаемые (а не
гарантированные) доходы. Допустим, что доходы типа t
182
Лекция 14. Модели, основанные на сигнальных играх
могут быть либо t  K , либо t  K , причем с одинаковой
1
вероятностью . Если R  L  K  I (1  r ) , то с вероятно-
2
1
стью предприниматель типа L не сможет расплатиться
2
по долговому контракту D  I (1  r ) , а поэтому инвестор
не может согласиться на такой контракт.
Денежная политика. Добавим приватную информа-
цию в двухпериодную версию модели денежной политики,
которую мы уже рассматривали. В этой модели, как и в
модели Спенса, есть много скрывающих, выявляющих и
гибридных равновесий. Остановимся на них кратко.
Напомним, что в нашей модели выигрыш финансо-
вых властей считается равным
w( ,  e )  c 2  (b  y*  d (   e )  y* ) 2 ,
где  — реальная инфляция,  e — ожидаемая предприни-
мателями инфляция, y* — эффективный уровень выпуска.
Однопериодный выигрыш предпринимателей равен
(   e ) 2 .
В двухпериодной модели выигрыши игроков опреде-
лим просто как сумму однопериодных выигрышей:
w(1 , 1e )  w( 2 ,  2e ) и (1  1e )2  ( 2   2 e ) 2 ,
где  t — реальный уровень инфляции в периоде t , а  te –
ожидаемый предпринимателями уровень инфляции на на-
чало периода t .
Параметр c в определении функции выигрыша
w( ,  e ) характеризует готовность к компромиссу между
двумя критериями: нулевая инфляция и эффективный вы-
пуск. Раньше мы предполагали, что значение этого пара-
метра общеизвестно. Теперь будем считать, что этот пара-
метр является приватной информацией финансовых вла-

183
Лекции по теории игр и экономическому моделированию
стей: c  S — сильная борьба с инфляцией, c  W — сла-
бая борьба с инфляцией, где S  W  0 .
Динамический сценарий двухпериодной игры.
1. Природа определяет тип денежных властей c . Ве-
роятность c  W равна p .
2. Предприниматели формируют ожидания 1e ин-
фляции первого периода, не зная типа властей.
3. Власти узнают 1e и выбирают уровень реальной
инфляции 1 первого периода.
4. Предприниматели узнают 1 (но не c ) и форми-
руют ожидания инфляции  2e второго периода.
5. Власти узнают  2e и выбирают уровень реальной
инфляции  2 второго периода.
Заметим, что в этой динамической игре с неполной
информацией можно выделить встроенную сигнальную
игру. Выбор реальной инфляции первого периода можно
трактовать, как сигнал, который власти отправляют пред-
принимателям. Ожидания предпринимателями уровня ин-
фляции второго периода можно интерпретировать как дей-
ствия получателя в ответ на полученный сигнал. Ожидания
первого периода — это ход до сигнальной игры, а опреде-
ление реального уровня инфляции во втором периоде —
это ход после сигнальной игры.
Напомним, в однопериодной игре (эта игра ранее
рассматривалась как этап повторяющейся игры) оптималь-
ный выбор финансовых властей в ответ на ожидания пред-
принимателей был найден в виде
d
 * ( e )  2
[(1  b) y*  d e ] .
cd

184
Лекция 14. Модели, основанные на сигнальных играх
По аналогии можно найти оптимальный ответ вла-
стей на ожидания предпринимателей во втором периоде
d
для типа c :  2* ( 2e , c )  2
[(1  b) y*  d  2e ] .
cd
В скрывающем равновесии оба типа выбирают один
и тот же уровень инфляции  * , поэтому в равновесии
ожидания инфляции предпринимателями должны быть та-
кими же: 1e   * . Представления предпринимателей на
равновесном пути должны быть таковы, что они ожидают
тип W у властей с вероятностью p . С учетом действий
властей во втором периоде ожидания предпринимателей
 2e ( p ) находятся из максимизации

 p( 2* ( 2 e ,W )   2e ) 2  (1  p)( 2* ( 2 e , S )   2 e ) 2 .
Власти типа c выбирают во втором периоде инфляцию на
уровне  2* ( 2 e ( p), c) , и игра кончается.
Для завершения построения скрывающего СБР нуж-
но еще определить представления и действия вне равно-
весного пути, чтобы ни одному из типов отправителя (вла-
стям) не выгодно было отклониться.
В выявляющем равновесии каждый тип шлет свой
сигнал:  W и  S (разные уровни реальной инфляции пер-
вого периода в зависимости от типа финансовых властей).
Ожидания предпринимателей инфляции первого периода
теперь равны
1e  p W  (1  p ) S .
Увидев, что реальная инфляция в первом периоде
оказалась равной  W , предприниматели начинают второй
период с уверенностью, что c  W , и значит, формируют
ожидания  2e (1) . Аналогично, если инфляция оказалась на
уровне  S , то это приводит к ожиданиям  2e (0) . В равно-

185
Лекции по теории игр и экономическому моделированию
весии слабый тип выбирает  2* ( 2 e (1), W ) , а сильный тип
выбирает  2* ( 2 e (0), S ) , после чего игра кончается.
Для завершения конструкции выявляющего равнове-
сия нужно еще построить представления и действия вне
равновесного пути, а также проверить условия невыгодно-
сти отклонения для обоих типов властей. В частности, у
властей типа L не должно быть соблазна в первом периоде
выбрать уровень инфляции  S с тем, чтобы на основе (не-
адекватных) ожиданий  2e (0) добиться суммарно больше-
го выигрыша за счет второго периода. Для широкого диа-
пазона параметров здесь возникает эффект, похожий на
модель Спенса. Уровень  S в выявляющем СБР приходит-
ся держать ниже уровня инфляции в игре с полной инфор-
мацией с тем, чтобы блокировать возможность слабому
типу выставлять себя за сильного.

Задачи к лекции 14
14.1. Найдите другой вариант представлений и дейст-
вий вне равновесного пути для скрывающего СБР для мо-
дели Спенса.
14.2. Нарисуйте линии безразличия и производствен-
ной функции для сигнальной игры на рынке труда с двумя
типами работника. Найдите гибридное СБР, в котором вы-
сокоэффективный работник использует смешанную стра-
тегию.
14.3. Два партнера делят общую собственность.
Партнер 1 владеет долей s , а партнер 2 владеет долей
1  s . Партнеры соглашаются играть в следующую игру:
партнер 1 называю цену p за всю собственность, а парт-
нер 2 решает: либо купить долю партнера 1, заплатив ему
p  s , либо продать ему свою долю, получив p  (1  s ) . Бу-
дем считать общеизвестным, что личные оценки стоимости
собственности партнеров независимы и равномерно рас-
пределены на отрезке [0, 1], но своя оценка известна каж-
186
Лекция 14. Модели, основанные на сигнальных играх
дому партнеру и является его приватной информацией.
Найдите СБР.
14.4. Покупатель и продавец имеют оценки стоимо-
сти товара vB и vS . Общеизвестно, что vB  vS , т.е. что
сделка между ними потенциально прибыльна. Предполо-
жим, что оценка продавца равномерно распределена на
отрезке [0, 1] и является его приватной информацией. Из-
вестно, что vB  k  vS , причем коэффициент k  1 общеиз-
вестен. Покупатель знает k , но он не знает vB (и vS ).
Продавец знает vS и k , а потому и vB . Предположим, что
продавец делает сигнальное предложение с ценой p , ко-
торое покупатель принимает или отвергает. Каким будет
СБР при k  2 ? А при k  2 ?
14.5. Предположим, что в Конгрессе обсуждается по-
литическое решение p , которое может принимать значе-
ния от 0 до 1. Идеальное значение с точки зрения Конгрес-
са равно c , а нынешнее значение (status quo) равно s ,
причем 0  c  s  1 . Конгресс хотел бы изменить ситуа-
цию, но закон об изменении должен быть еще подписан
президентом. Его идеал t известен ему самому, но осталь-
ные знают только, что t равномерно распределено на от-
резке [0,1]. Порядок ходов такой: Конгресс принимает ре-
шение p , а президент либо подписывает закон, либо нала-
гает вето. Если p подписано, то выигрыш Конгресса пола-
гается равным (c  p ) 2 , для президента выигрыш равен
(t  p) 2 . Найдите СБР и проверьте, что в равновесии
c p s.
Предположим теперь, что перед принятием в Кон-
грессе решения президент может прибегнуть к риторике
(т.е. послать бесплатное сообщение). Рассмотрим СБР в
этой игре, причем в этом равновесии решение Конгресса
pL или pH зависит от сообщения, посланного президен-

187
Лекции по теории игр и экономическому моделированию
том. Покажите, что в таком равновесии не может быть вы-
полнено c  pL  pH  s . Объясните, почему не могут су-
ществовать равновесия с тремя или более решениями Кон-
гресса в ответ на сообщение президента. Постройте равно-
весие с двумя решениями c  pL  pH  s . Каким должно
быть pH и какими должны быть сообщения в зависимости
от типа?

188
Задачи письменных работ за прошлые годы
Задачи письменных работ за прошлые годы

Контрольная работа 2005 года (1,5 часа)


Задача 1. Основные понятия (20 очков)
Приведите математическое и краткое словесное оп-
ределение следующих понятий (4 очка за каждый пункт):
(а) Наилучший ответ игрока.
(б) Равновесие Нэша.
Докажите или опровергните контрпримером каждое
из следующих утверждений (4 очка за каждый пункт):
(в) В конечной игре с двумя участниками процесс
последовательного исключения строго доминируемых
стратегий всегда приводит к равновесию Нэша в чистых
стратегиях
(г) Игра с совершенной информацией всегда имеет
единственное совершенное по подыграм равновесие.
(д) Любое равновесие в строго доминирующих стра-
тегиях является равновесием Нэша.
Задача 2. Новая фирма (25 очков)
Фирма 1 рассматривает потенциальную возможность
выхода на рынок, занятый фирмой 2. Если фирма 1 играет
«отказ» (О), то она получает 0, а фирма 2 остается монопо-
листом и получает 2. Если фирма 1 играет «вход» (В), то
обе фирмы независимо выбирают производство для небо-
гатых потребителей (Н) или для богатых (Б).
Обе фирмы несут потери, если они выпустили одина-
ковый продукт: их выигрыши равны –6, если они обе сори-
ентировались на небогатых, и –3, если — на богатых. Если
они выбрали разный продукт, то та фирма, которая сориен-
тировалась на богатых, получает выигрыш 1, а другая по-
лучает –1.
(а) Нарисуйте соответствующее дерево игры в раз-
вернутой форме со всеми атрибутами и найдите подыгры
данной игры. (5 очков)
(б) Приведите в матричном виде нормальную форму
этой игры. (5 очков)
189
Лекции по теории игр и экономическому моделированию
(в) Найдите все совершенные по подыграм равнове-
сия Нэша в чистых стратегиях. (10 очков)
(г) Существует ли совершенное по подыграм равно-
весие Нэша, включающее равновесия в смешанных стра-
тегиях в подыгре после входа фирмы 1. (5 очков)
Задача 3. Выбор повестки дня (25 очков).
Рассматривается следующая политическая игра, в ко-
торой общественный выбор осуществляется из отрезка
X  [0, 5] . Автор законопроекта (игрок 1) вносит альтерна-
тиву x  X против существующего положения status quo
q  4 . Зная предложение игрока 1, Законодатель (игрок 2)
выбирает одно из двух: принять предложение x или оста-
вить нынешние состояние q .
Игроку 1 больше всего хочется, чтобы был выбран
проект a  1 , а при выборе другого проекта y  X его вы-
игрыш определяется по формуле: u1 ( y )  10 | y  a | .
Игроку 2 больше всего хочется, чтобы был выбран
проект l  3 , а при выборе другого проекта y  X его вы-
игрыш определяется по формуле: u1 ( y )  10 | y  l | .
Таким образом, каждый желает, чтобы обществен-
ный выбор был сделан как можно ближе к тому, что он бо-
лее всего предпочитает.
(а) Это игра с совершенной информацией или нет? (3 очка)
(б) Приведите нормальную форму этой игры. (5 очков)
(в) Найдите совершенное по подыграм равновесие Нэша. (5 очков)
(г) Единственным ли равновесием Нэша является то,
что найдено в пункте (в)? Если да, докажите. Если нет,
опишите все равновесия Нэша в этой игре. (7 очков)
Задача 4. Лишние затраты на транспортировку?
(30 очков)
Есть две страны А и В, в каждой из которых есть
своя фирма-монополист по производству угля. Пусть фир-
ма 1 расположена в стране А, а фирма 2 — в стране В.
Пусть фирма i {1, 2} продает в стране j { A, B} объем

190
Задачи письменных работ за прошлые годы
угля qij . Тогда qi  qiA  qiB составляет совокупный выпуск
фирмы i {1, 2} , а q j  q1j  q2j есть совокупный объем уг-
ля, проданный в стране j { A, B} . Цена на уголь в странах
А и В задается с помощью линейной обратной функции
спроса: p j  90  q j , j { A, B} . Затраты на производство
продукции составляют ci ( qi )  10qi , i {1,2} .
(а) Предположим, что между странами отсутствует тор-
говое соглашение, и импорт в обеих странах запрещен. Это
приводит к политическому ограничению q2A  q1B  0 . Какие
тогда будут размеры производства q1A и q2B ? (6 очков)
Предположим, что страны подписали договор о сво-
бодной торговле, позволяющий иностранным фирмам про-
давать продукцию в их странах без всяких пошлин. Одна-
ко, имеются затраты на транспортировку. Если фирма i
продает продукцию qij в чужой стране (фирма 1 в В, а
фирма 2 в А), то затраты на транспортировку равны 10qij .
Предположим, что обе фирмы принимают решение о вы-
боре qiA , qiB одновременно, i {1, 2} .
(б) Смоделируйте эту ситуации как игру в нормаль-
ной форме. (8 очков)
(в) Найдите равновесие Нэша в игре из пункта (б).
Оно единственно? (8 очков)
Предположим теперь, что до начала игры из пункта
(б) отдел исследований фирмы 1 обнаружил, что перевозка
угля на современных судах влечет загрязнение окружаю-
щей среды. Если фирма пошлет об этом доклад во Всемир-
ную Торговую Организацию (ВТО), то ВТО запретит пере-
возку на существующих судах. Переход на новые техноло-
гии в транспортировке угля увеличит затраты до 40qij (по
сравнению 10qij сейчас).

191
Лекции по теории игр и экономическому моделированию
(г) Захочет ли фирма 1 передавать информацию в
ВТО? Подтвердите свой вывод анализом равновесий (8
очков).

Контрольная работа 2006 года


Задача 1. Рассмотрим следующую игру в нормаль-
ной форме.
L M R
A 1,0 4,1 1,0
D 2,1 3,2 0,1
C 3,-1 2,0 2,2
а) Проведите последовательное исключение строго
доминируемых стратегий.
б) Найдите все равновесия Нэша (РН) в чистых и
смешанных стратегиях.
Задача 2. Рассмотрим следующую игру в разверну-
той форме.
а) Найдите два разных совершенных по подыграм
равновесия Нэша (СПРН).
б) Постройте нормальную форму этой игры.
в) Найдите РН, которое не является СПРН.

Задача 3. Два человека должны договориться о де-


леже общего подарка стоимостью 1, чтобы получить воз-

192
Задачи письменных работ за прошлые годы
можность распоряжаться своей долей. Будем считать, что
каждому важна не только его доля, но и размер доли дру-
гого.
Предположим сначала, что оба участника дележа за-
вистливы. Свой выигрыш они оценивают величиной
u  x   y , где x — своя доля, y — доля другого,  —
одинаковая для обоих степень зависти, причем 0    1 .
а) Один из игроков предлагает вариант дележа по-
дарка, а второй может или согласиться, или отказаться. В
случае согласия происходит дележ на основе сделанного
предложения. При отказе каждый получает ноль. Приме-
ните обратную индукцию для поиска равновесия.
б) Дележ происходит в два этапа. Второй этап насту-
пает после отказа на первом этапе. Право предлагать дележ
на втором этапе определяется жребием: бросается симмет-
ричная монета. Считается, что оба этапа проводятся в один
день, поэтому время получения выигрыша не учитывается
участниками при принятии решений. Если на втором этапе
получен отказ от дележа, то выигрыш каждого считается
равным нулю. Примените обратную индукцию для поиска
равновесия.
в) повторите а) и б) для альтруистичных участников:
u  x  y .
Задача 4. Ниже приведены несколько статических
игр и профилей стратегий игроков в соответствующих по-
вторяющихся играх. Проверьте, образуют ли данные про-
фили стратегий СПРН в бесконечно повторяющейся игре с
коэффициентом дисконтирования   0.99 .
а) Игра. Каждый из n игроков, n  2 , может вложить
1 в проект по созданию общественного продукта. Размер
созданного общественного продукта будет равен
y  ( x1    xn ) / 2 , где xi {0,1} — вклад в общее дело
игрока i . Выигрыш игрока i равен y  xi .
Профиль стратегий. Игрок i вкладывает xi  1 в пер-
вом повторении и до тех пор, пока во всех прошлых повто-

193
Лекции по теории игр и экономическому моделированию
рениях уровень произведенного общественного продукта y
был больше 1/4. Иначе игрок i выбирает xi  0 .
б) Игра. Дуополия Курно. Есть две фирмы. Обе фир-
мы ( i  1, 2 ) одновременно и независимо друг от друга на-
значают размер qi выпуска своей продукции. Цена прода-
жи продукции фирм определяется по формуле
P  max{0,1  q1  q2 } . Затраты по выпуску продукции
считаются нулевыми.
Профиль стратегий. Есть два состояния: Картель и
Конкуренция. От этих состояний зависит действие игрока.
В состоянии «Картель» выпуск фирмы равен 1/4. В состоя-
нии «Конкуренция» выпуск фирмы равен 1/2. Игра начи-
нается в состоянии «Картель». Если в прошлом периоде
было состояние «Картель» и наблюдались выпуски на
уровне 1/4, то состояние «Картель» сохраняется в текущем
периоде. Иначе наступает состояние «Конкуренция». По-
сле Конкуренции происходит автоматический возврат к
Картелю.
в) Игра. Как в б).
Профиль стратегий. В отличие от б) переход из со-
стояния «Конкуренция» в состояние «Картель» происходит
в том и только том случае, когда в Конкуренции оба выби-
рают 1/2. Иначе после Конкуренции в следующем периоде
опять сохраняется состояние «Конкуренция».

Контрольная работа 2007 года


Задача 1. Рассмотрим следующую игру в нормаль-
ной форме, в которой игрок 1 выбирает строки, а игрок 2 –
столбцы.
Л С П
В (2,-1) (4,2) (2,0)
Ц (3,3) (0,0) (1,1)
Н (1,2) (2,8) (5,1)
a) Найдите все равновесия Нэша (РН) в чистых стратегиях.

194
Задачи письменных работ за прошлые годы
б) Проведите процесс последовательного исключе-
ния строго доминируемых стратегий с использованием
смешанных стратегий (подсказка: чистая стратегия может
доминироваться смешанной стратегией).
с) Найдите РН в смешанных стратегиях.
Задача 2. Рассмотрим следующую игру в разверну-
той форме.

а) С помощью обратной индукции найдите совер-


шенное по подыграм равновесие Нэша (СПРН) в этой игре.
Соответствующие СПРН стратегии пометьте стрелками на
рисунке.
б) Пусть эта игра повторяется бесконечное число раз.
При каком коэффициенте дисконтирования  повторение
исхода (5, 5) будет соответствовать СПРН в бесконечно
повторяющейся игре? Приведите соответствующую пару
стратегий игроков и докажите, что она является СПРН.
Задача 3. Рассмотрим конкуренцию двух фирм в
двух периодах. В периоде 1 каждая фирма i  1, 2 может
инвестировать f (ci )  (1  ci )2 , чтобы получить в периоде 2
размер предельных затрат ci  [0,1] . Заметьте, что чем
меньше желательный уровень предельных затрат, тем
больше нужно инвестировать. В периоде 2 уровни затрат
c1 и c2 становятся известными фирмам, и они конкуриру-
ют по правилам дуополии Курно.
Формально, будем считать, что в периоде 1 фирмы выби-
рают одновременно величины ci  [0,1] . В периоде 2 фир-
мы на основе знания затрат c1 и c2 одновременно выби-
рают размер выпуска qi , i  1, 2 . Выигрыш фирмы i опре-
деляются их прибылью
195
Лекции по теории игр и экономическому моделированию
 i ( qi , q j , ci )  qi [ P (Q)  ci ]  f (ci ), j  i ,
a) Найдите СПРН в этой игре.
б) Пусть в периоде 1 уровни предельных затрат вы-
бираются последовательно: сначала c1 фирмой 1, а затем
c2 на основе знания c1 выбирает фирма 2. Найдите СПРН
в такой игре.
Задача 4. Два игрока получат общий подарок стои-
мостью 1, если договорятся о его дележе. Если они догово-
рились в момент времени t  0,1, 2,... , что при дележе игрок
i получит x , то игра кончается и выигрыш игрока i со-
ставит  t  x , где   (0,1) . Если игроки не договорились
до момента n , то игра автоматически заканчивается и каж-
дый получает по 0.
В момент t  n право сделать предложение партнеру
определяется жребием: с вероятность p  (0,1) предложе-
ние делает игрок 1, а с вероятностью 1  p игрок 2.
Игрок делает предложение в виде дележа ( x,1  x ) .
Другой игрок может согласиться или отказаться. В случае
согласия игрок 1 получает x , а игрок 2 получает 1  x . В
случае отказа переговоры возобновляются в следующий
момент времени.
а) Найдите СПРН при n  1 . Чему равны ожидаемые
выигрыши игроков в этом СПРН?
б) Найдите СПРН при n  2 . Чему равны ожидаемые
выигрыши игроков в этом СПРН?
в) Найдите СПРН при n   и докажите, что дейст-
вительно получили СПРН.
г) Представим, что до начала переговоров игроки мо-
гут инвестировать средства в свою переговорную силу.
Пусть игроки одновременно вкладывают a и b , тогда они
играют в повторяющуюся переговорную игру при n   и
p  a ( a  b) . Найдите СПРН.

196
Задачи письменных работ за прошлые годы
Контрольная работа 2008 года. Вариант 1
Задача 1. Рассмотрим следующую игру в нормаль-
ной форме, в которой игрок 1 выбирает строки, а игрок 2
— столбцы.
Л С П
В (3,0) (0,3) (0,1)
Ц (0,3) (3,0) (0,1)
Н (1,0) (1,0) (1,1)
а) Найдите хотя бы два (а если можете, то все) равно-
весия Нэша (РН).
б) Заменим теперь все выигрыши, равные 1, на выиг-
рыши, равные 2. Про каждое найденное в а) РН скажите,
сохранится оно или нет при такой замене.
Подсказка: Не забудьте про смешанные стратегии.
Задача 2. На аукционе продается купюра в 100 дол-
ларов. Имеется два покупателя. Покупатели одновременно
и независимо друг от друга подают свои заявки
bi {0,1, 2,..., 99} , i  1, 2 . Побеждает на аукционе тот по-
купатель, который подал наибольшую заявку. При равен-
стве заявок победитель (равновероятно) определяется жре-
бием. Победитель получает купюру в 100 долларов, запла-
тив то, что указал в заявке. Выигрыш проигравшего на
аукционе равен 0.
а) Постройте соответствующую данной ситуации иг-
ру в нормальной форме.
б) Проведите процесс последовательного исключе-
ния доминируемых стратегий.
в) Найдите все РН в этой игре.
Задача 3. а) Найдите все совершенные по подыграм
РН (СПРН) в следующей игре в развернутой форме.

197
Лекции по теории игр и экономическому моделированию

б) Постройте нормальную форму для этой игры.


в) Произведите последовательное исключение доми-
нируемых стратегий.
г) Какое СПРН может служить наилучшим прогно-
зом результатов игры, учитывая в).
Задача 4. Сговор в олигополии Курно. Рассмотрим
следующую бесконечно повторяющуюся игру G (,  ) .
Игра каждого периода. Имеется n  1 фирм, каждая
из которых обладает нулевыми затратами по выпуску про-
дукции. В определенный день каждая фирма i одновре-
менно с другими фирмами и независимо от остальных
производит количество qi некоторого товара и продает его
по цене P  1  (q1  ...  qn ) , получая выигрыш P  qi .
Рассмотрим следующий профиль стратегий всех фирм.
Профиль стратегий. При t  0 все фирмы производят
по 1 / (2n) . При t  0 уровень производства зависит от то-
го, сколько фирмы произвели в прошлом периоде t  1 .
Если каждая фирма в периоде t  1 произвела 1 / (2n) или
если каждая фирма произвела x , то каждая фирма в пе-
риоде t производит 1 / (2n) , иначе каждая фирма произво-
дит x .
a) Найдите условия на x, n,  , при которых данный
профиль стратегий является СПРН.
198
Задачи письменных работ за прошлые годы
б) При каких x, n,  можно построить монопольный
сговор как СПРН, основанное на релейных стратегиях.
в) Сравните результаты а) и б).
Подсказка: Достаточно найти два неравенства на x, n,  .

Контрольная работа 2008 года. Вариант 2


Задача 1. Рассмотрим следующую игру в нормаль-
ной форме, в которой игрок 1 выбирает строки, а игрок 2 –
столбцы.
a b c
A (2,2) (2,0) (2,0)
B (0,2) (5,0) (0,5)
C (0,2) (0,5) (5,0)
а) Найдите хотя бы два (а если можете, то все) рав-
новесия Нэша (РН).
б) Заменим теперь все выигрыши 2 на 3. Про каждое
найденное в а) РН скажите, сохранится оно или нет при
такой замене.
Подсказка: Не забудьте про смешанные стратегии.
Задача 2. Сенат определяет размер ставки налога на
недвижимость как x  X  {0, 0.01, 0.02,..., 0.99,1} . В состав
Сената входят 45 твердых Республиканцев во главе с Ли-
дером Большинства (ЛБ), 40 твердых Демократов во главе
с Лидером Меньшинства (ЛМ) и 14 Умеренных во главе с
Лидером Умеренных (ЛУ). Выигрыш Республиканцев ра-
вен 1  x , а выигрыш Демократов равен x . Выигрыш Уме-
ренных равен x , если x  0.5 и 1  x , если x  0.5 . Теку-
щая ставка налога на недвижимость равна x0  0.6 .
Сначала ЛБ предлагает закон x1  X . Затем ЛМ вно-
сит поправку x2  X . По правилам Сената сначала поправ-
ка x2 голосуется против закона x1 , а потом победитель ( x1
или x2 ) ставится на голосование против x0 . Победитель
последнего голосования становится ставкой налога на не-
движимость.
199
Лекции по теории игр и экономическому моделированию
Для победы в каждом голосовании требуется набрать
50 или более голосов. В каждом голосовании ЛБ голосует
за всех твердых Республиканцев, ЛМ — за всех твердых
Демократов, а ЛУ – за всех Умеренных.
а) Опишите развернутую форму данной игры с учетом
возможности выдвижения предложений и голосования.
б) Это игра с совершенной информацией?
в) Найдите совершенное по подыграм РН (СПРН) в
этой игре с помощью обратной индукции.
Подсказка. Можно ограничиться случаем x1  0.5  x2 .
Задача 3. Рассмотрим следующую игру в разверну-
той форме.

а) Найдите все СПРН в данной игре.


б) Постройте нормальную форму для этой игры.
в) Произведите последовательное исключение доми-
нируемых стратегий.
г) Какое СПРН может служить наилучшим прогно-
зом результатов игры, учитывая в).
Задача 4. Рассмотрим бесконечно повторяющуюся
игру с G (,  ) при   0.99 , в которой в каждом периоде
повторяется статическая игра
C D
C (5,5) (-6,8)
D (8,-6) (0,0)

200
Задачи письменных работ за прошлые годы
Какие из следующих профилей стратегий являются
СПРН?
а) Стратегия каждого игрока: всегда играть С.
б) Стратегия каждого игрока: играть С первый раз, по-
том играть то, что другой сыграл в предыдущем периоде.
в) Есть четыре состояния: Кооперация (К), Наказание
игрока 1 (Н1), Наказание игрока 2 (Н2), Индивидуализм
(И). Начинаем в состоянии К. В этом состоянии оба игрока
играют С. В состоянии Нi игрок i играет С, а другой иг-
рок играет D. В состоянии И оба игрока играют D. Если
игроки попали в состояние И, то они в нем так и остаются.
Из любого другого состояния следует переход в состояние
К, если игроки не отклоняются от предписанных этому со-
стоянию действий. Если один игрок i отклоняется от
предписанного состоянию действия (а другой нет), то сле-
дует переход в состояние Нi . Если оба игрока отклоняют-
ся одновременно, то следует переход в состояние И.
Подсказка. Во всех случаях аккуратно сформули-
руйте стратегию каждого игрока, как совокупность функ-
ций от наблюдаемых действий в прошлых периодах.

Контрольная 2008 работа. Вариант 3


Задача 1. Рассмотрим следующую игру в нормаль-
ной форме, в которой игрок 1 выбирает строки, а игрок 2 –
столбцы.

Л С П
В (2,–1) (4,2) (2,0)
Ц (3,3) (0,0) (1,1)
Н (1,2) (2,8) (5,1)

a) Найдите все равновесия Нэша (РН) в чистых стра-


тегиях.
б) Проведите процесс последовательного исключе-
ния строго доминируемых стратегий с использованием
201
Лекции по теории игр и экономическому моделированию
смешанных стратегий (подсказка: чистая стратегия может
доминироваться смешанной стратегией).
с) Найдите РН в смешанных стратегиях.
Задача 2. Рассмотрим следующую игру в разверну-
той форме.

а) Найдите два разных совершенных по подыграм


равновесия Нэша (СПРН).
б) Постройте нормальную форму этой игры.
в) Найдите РН, которое не является СПРН.
Задача 3. Рассмотрим конкуренцию двух фирм в
двух периодах. В периоде 1 каждая фирма i  1, 2 может
инвестировать f (ci )  (1  ci )2 , чтобы получить в периоде 2
размер предельных затрат ci  [0,1] . Заметьте, что чем
меньше желательный уровень предельных затрат, тем
больше нужно инвестировать. В периоде 2 уровни затрат
c1 и c2 становятся известными фирмам, и они конкуриру-
ют по правилам дуополии Курно.
Формально, будем считать, что в периоде 1 фирмы
выбирают одновременно величины ci  [0,1] . В периоде 2
фирмы на основе знания затрат c1 и c2 одновременно вы-
бирают размер выпуска qi , i  1, 2 . Выигрыш фирмы i оп-
ределяются их прибылью
 i ( qi , q j , ci )  qi [ P (Q)  ci ]  f (ci ), j  i ,
где Q  q1  q2 , P(Q)  max{2  Q,0} .
a) Найдите СПРН в этой игре.
202
Задачи письменных работ за прошлые годы
б) Пусть в периоде 1 уровни предельных затрат вы-
бираются последовательно: сначала c1 фирмой 1, а затем
c2 на основе знания c1 выбирает фирма 2. Найдите СПРН
в такой игре.
Задача 4. Ниже приведены несколько статических
игр и профилей стратегий игроков в соответствующих по-
вторяющихся играх. Проверьте, образуют ли данные про-
фили стратегий СПРН в бесконечно повторяющейся игре с
коэффициентом дисконтирования   0.99 .
а) Игра. Каждый из n игроков, n  2 , может вложить
1 в проект по созданию общественного продукта. Размер
созданного общественного продукта будет равен
y  ( x1    xn ) / 2 , где xi {0,1} — вклад в общее дело
игрока i . Выигрыш игрока i равен y  xi .
Профиль стратегий. Игрок i вкладывает xi  1 в пер-
вом повторении и до тех пор, пока во всех прошлых повто-
рениях уровень произведенного общественного продукта y
был больше 1/4. Иначе игрок i выбирает xi  0 .
б) Игра. Дуополия Курно. Есть две фирмы. Обе фир-
мы ( i  1, 2 ) одновременно и независимо друг от друга на-
значают размер qi выпуска своей продукции. Цена прода-
жи продукции фирм определяется по формуле
P  max{0,1  q1  q2 } . Затраты по выпуску продукции
считаются нулевыми.
Профиль стратегий. Есть два состояния: Картель и
Конкуренция. От этих состояний зависит действие игрока.
В состоянии «Картель» выпуск фирмы равен 1/4. В состоя-
нии «Конкуренция» выпуск фирмы равен 1/2. Игра начи-
нается в состоянии «Картель». Если в прошлом периоде
было состояние «Картель» и наблюдались выпуски на
уровне 1/4, то состояние «Картель» сохраняется в текущем
периоде. Иначе наступает состояние «Конкуренция». По-
сле Конкуренции происходит автоматический возврат к
Картелю.

203
Лекции по теории игр и экономическому моделированию
в) Игра. Как в б).
Профиль стратегий. В отличие от б) переход из со-
стояния «Конкуренция» в состояние «Картель» происходит
в том и только том случае, когда в Конкуренции оба выби-
рают 1/2. Иначе после Конкуренции в следующем периоде
опять сохраняется состояние «Конкуренция».

Контрольная работа 2009 года


Задача 1. На каждый из следующих вопросов при-
нимаются только исчерпывающие ответы с доказательст-
вом или контрпримером.
а) Верно ли, что в конечной игре двух лиц для суще-
ствования равновесия Нэша (РН) в чистых стратегиях дос-
таточно существования доминирующей стратегии хотя бы
у одного игрока? Справедливо ли это утверждение для иг-
ры n лиц при n  2 ?
б) Можно ли утверждать, что в конечной развернутой
игре с полной и точной информацией в совершенном по
подыграм РН (СПРН) выигрыши игроков определены од-
нозначно?
в) Приведите пример игры в развернутой форме, в
которой информационная структура не удовлетворяет ус-
ловию полной памяти.
г) В бесконечной повторяющейся игре G (,  ) бу-
дем называть стратегии игроков марковскими, если дейст-
вие игрока в момент t зависит только от действий игроков
в момент t  1 . Может ли в игре G (,  ) существовать
СПРН в марковских стратегиях, отличное от повторения
некоторого РН в исходной игре G ?

204
Задачи письменных работ за прошлые годы
Задача 2. Рассмотрим следующую игру в нормаль-
ной форме, в которой игрок 1 выбирает строки, а игрок 2
— столбцы.

a b c d e
A (2,5) (0,2) (1,2) (5,1) (2,3)
B (0,2) (3,8) (4,6) (4,9) (2,3)

а) Найдите все равновесия Нэша в чистых стратегиях.


б) Найдите все наилучшие ответы игрока 2 на каж-
дую смешанную стратегии игрока 1. Подсказка: Изобрази-
те графически зависимости выигрыша игрока 2 от вероят-
ности выбора стратегии В игроком 1 при фиксированной
стратегии игрока 2.
в) Найдите все РН в смешанных стратегиях.
г) Пусть теперь игрок 1 делает ход первым, а игрок 2,
зная выбор игрока 1, делает ход вторым. Сколько страте-
гий у каждого игрока в этой игре? Найдите совершенное
по подыграм РН в этой игре.
д) Пусть теперь игрок 2 делает ход первым, а игрок 1,
зная выбор игрока 2, делает ход вторым. Сколько теперь
стратегий у каждого игрока в этой игре? Найдите СПРН в
этой игре.

Задача 3. Фирма 1 собирается выйти на рынок, кото-


рый монопольно обслуживает фирма 2. Если фирма 1 ре-
шит все же воздержаться от выхода на этот рынок, то она
получит выигрыш, равный 0, а фирма 2 получит 10 (ска-
жем, миллионов долларов). Если фирма 1 все-таки выйдет
на рынок, то фирма 2 может либо отреагировать мирно,
либо вступить в борьбу против фирмы 1. Если фирма 2 от-
реагирует мирно, то обе фирмы получат выигрыш по 5.
Если фирма 2 вступит в борьбу, то теперь у фирмы 1 есть
выбор: принять вызов или покинуть рынок. Если фирма 1
примет вызов и останется, то с учетом затрат на борьбу

205
Лекции по теории игр и экономическому моделированию
фирма 1 получит выигрыш 1, в то время как фирма 2 полу-
чит 2. Если фирма 1 решит покинуть рынок, не вступая в
борьбу, то с учетом затрат на вход в рынок фирма 1 полу-
чит выигрыш, равный -1, а фирма 2 получит 6.
а) Изобразите дерево соответствующей игры в раз-
вернутой форме.
б) Найдите СПРН методом обратной индукции.
в) Постройте нормальную форму данной игры.
г) Найдите все РН.

Задача 4. Рассмотрим статическую игру G :


А Б В
а 4,1 0,0 5,0
б 0,0 1,4 0,0
в 0,0 0,5 3,3
а) Найдите все РН в чистых и смешанных стратегиях
в этой игре.
Предположим, что эта игра разыгрывается несколько
раз, причем продолжение игры происходит с вероятностью
p , а с вероятностью 1  p игра заканчивается. Выигры-
шем игрока в такой повторяющейся игре G ( p) считается
ожидаемая сумма его выигрышей во всех состоявшихся до
окончания игры повторениях.
б) Можно ли утверждать, что при некотором  игра
G (,  ) с дисконтированием выигрышей эквивалентна
игре G ( p) ?
в) Можно ли в игре G ( p) построить СПРН, в кото-
ром игроки будут играть (в,В) по всех повторениях до
окончания игры?
Задача 5. n человек являются свидетелями преступ-
ления. Каждый из них может позвонить в полицию или не
звонить. Каждый из них хочет, чтобы полиция была про-
информирована, но позвонить самому, значит, понести оп-

206
Задачи письменных работ за прошлые годы
ределенные психологические затраты. Пусть выигрыш от
информирования полиции оценивается величиной v , при-
чем неважно, кто именно и сколько человек позвонит, а
затраты оцениваются величиной c . Пусть v  c  0 . Счи-
тается, что выигрыш индивида равен 0, если никто не по-
звонил, равен v , если позвонил кто-то другой и равен
v  c , если позвонил он сам.
а) Найдите РН в чистых стратегиях в этой игре.
б) Найдите симметричное РН в смешанных стратеги-
ях, в котором каждый игрок звонит в полицию с вероят-
ность p  (0,1) .
в) Проанализируйте найденное в б) РН в зависимости
от параметров v и c . Что будет происходить с возрастани-
ем n с вероятность звонка в полицию фиксированного
свидетеля и вероятностью того, что хотя бы кто-то позво-
нит?

Задачи экзамена за 2004 год (1,5 часа)

1. Алиса и Боб хотят отметить памятную дату. Они


могут перекусить в МакДональдсе или пойти потанцевать
в клуб «Зона». Боб первым выбирает, куда пойти. Алиса
принимает решение, зная куда пошел Боб. Боб предпочи-
тает подкрепиться, а Алиса — танцы. Игрок получает 3,
если они вместе идут туда, куда ему/ей больше хочется, 1
— если они вместе идут туда, куда больше предпочитает
другой, и 0, если идут в разные места. Все это описание
ситуации является общей информацией.
a) Найдите совершенное по подыграм равновесие
Нэша. Найдите несовершенное по подыграм равновесие
Нэша с другим исходом.
b) Модифицируем игру: Алиса не узнает автомати-
чески, куда пошел Боб, но может узнать это, если захочет,
без каких-либо затрат. Это означает, что сначала Алиса
207
Лекции по теории игр и экономическому моделированию
решает, узнавать ли ей, куда пошел Боб, а затем решает,
куда ей отправиться, либо, получив информацию о том,
куда пошел Боб, либо без всякой информации. Выигрыши
определяются так же, как и в начальной постановке. Най-
дите совершенное по подыграм равновесие в новой игре,
которое имеет тот же самый исход, что и несовершенное по
подыграм равновесие в пункте а).
2. Два инвестора одновременно вкладывают средства
в совместный проект. Если инвестор i вкладывает xi , а его
партнер j инвестирует x j , то выигрыш инвестора i опре-
деляется по формуле i xi x j  xi3 . Здесь i — приватный
параметр инвестора i , о котором его партнер думает как о
случайной величине, равномерно распределенной на от-
резке [0, 1]. Это описание ситуации является общей ин-
формацией. Найдите симметричное равновесие Байеса-
Нэша в классе стратегий xi  a  b i .
3. Найдите совершенное байесовское равновесие (в
чистых и смешанных стратегиях) в следующей игре:

4. В игре участвуют Судья и Истец. Истцу был нане-


сен некоторый моральный ущерб. Степень ущерба v явля-
ется приватной информацией истца. Судья верит, что v
равномерно распределено на {0,1,…,99} (т.е. он полагает,
что вероятность события v  i равна 1/100). Истец может
без затрат предъявить истинную величину v Судье. После-
довательность действий следующая. Сначала Истец при-
нимает решение, предъявлять ли величину v судье. Затем
208
Задачи письменных работ за прошлые годы
судья дает Истцу компенсацию R . Выигрыш Истца равен
R  v , а выигрыш Судьи равен (v  R )2 . Все это описание
является общей информацией. Найдите совершенное байе-
совское равновесие.

Задачи экзамена за 2005 год (3 часа)


Задача 1. Основные понятия (10 очков)
Предположим, что в игре двух лиц с полной инфор-
мацией у каждого игрока i есть доминирующая стратегия
si* . Установите справедливость каждого из следующих ут-
верждений. Если утверждение верно, то приведите доказа-
тельство, если нет — контрпример.
(а) Пара стратегий ( s1* , s2* ) является равновесием Нэ-
ша (2 очка).
(б) Не существует другого равновесия Нэша ( s1 , s2 ) ,
в котором выигрыш каждого игрока был бы больше, чем в
( s1* , s2* ) (8 очков).
Задача 2. Кому где учиться? (30 очков)
Рассмотрим следующую проблему выбора образова-
ния. Выпускник школы (игрок 1) решает, куда ему пойти
учиться: в Липовый университет (Л) или в Кедровый уни-
верситет (К). В Кедровом университете тяжелее учиться
(больше моральные затраты), но и получаемая квалифика-
ция выше. Конкретно, затраты и квалификация игрока 1
зависит от его типа: сильный выпускник (С) или обычный
выпускник (О). Будем считать, что игрок 1 знает свой тип,
а все остальные знают только, что доля сильных выпуск-
ников равна p . Затраты и квалификация для каждого типа
приведены в следующих таблицах:
Тип С
затраты квалификация
Л 0 4
выбор
К 2 12
209
Лекции по теории игр и экономическому моделированию

Тип О
затраты квалификация
выбор Л 2 2
К 8 10
После окончания университета игрок 1 нанимается
на работу в фирму (игрок 2). Игрок 2 может взять игрока 1
в один из двух отделов: традиционные технологии (Т) или
высокие технологии (В). Зарплата в Т-отделе равна 2, а в
В-отделе — 6. Выигрыш игрока 1 считается равным разно-
сти: зарплата минус затраты на обучение.
Выигрыш игрока 2 зависит от назначения в отдел и
типа работника. При назначении в В-отдел выигрыш фир-
мы равен разности: квалификация нанятого работника ми-
нус его зарплата. При назначении в Т-отдел выигрыш
фирмы составляет половину квалификации работника ми-
нус зарплата.
(а) Изобразите развернутую форму игры (8 очков).
1
(б) Пусть p  . Приведите матричную форму байе-
2
совской игры (8 очков). Подсказка: сколько у каждого иг-
рока стратегий? Сколько чисел (выигрышей) нужно поста-
вить в каждую клетку матрицы?
(в) Найдите все равновесия Байеса-Нэша в чистых
стратегиях (4 очков)
(г) Найдите все совершенные байесовские равнове-
сия в чистых стратегиях (8 очков)
Задача 3. Что посеешь, то и пожнешь. (30 очков)
Крестьянин владеет некоторым участком, где он мо-
жет заниматься земледелием. Выход продукции зависит от
его трудолюбия. Уровень собственного трудолюбия кре-
стьянину известен. Остальные знают только, что трудолю-
бие крестьянина t равномерно распределено на отрезке
[0, 1]. Будем считать, что выигрыш крестьянина от обра-
ботки своей земли равен его трудолюбию t .

210
Задачи письменных работ за прошлые годы
Прежде, чем начать обрабатывать свою землю, кре-
стьянин идет на соседнюю фабрику и предлагает взять его
для работы на конвейере. Крестьянин может попросить
хозяина фабрики любую заплату w  0 , а хозяин может
либо согласиться (С) с этим предложением, либо отказать-
ся (О) от него. Если хозяин отказывается от предложения
крестьянина, то тот возвращается к земледелию, выигрыш
хозяина считается равным 0. Если хозяин соглашается
взять к себе на работу крестьянина с заплатой w , то выиг-
рыш крестьянина считается равным его зарплате w , а вы-
3
игрыш хозяина равен t  w , причем эта информация о
2
выигрышах общеизвестна.
(а) Это игра с полной или неполной информацией? (2 очка).
(б) Опишите множества чистых стратегий обоих иг-
роков (4 очка).
(в) Найдите равновесия Байеса–Нэша в чистых стра-
тегиях в этой игре (10 очков).
(г) Для равновесий из пункта (в) найдите возможные
уровни общественного благосостояния (сумма выигрышей
крестьянина и хозяина, осредненная по типу крестьянина)
(4 очка)
(д) Местный политик, который выступает за рост
общественного благосостояния, предлагает урезать субси-
дии на воду фермерам, что снизит для крестьянина типа t
1
выигрыш от земледелия на собственном участке до t , но
2
не окажет влияния на продуктивность крестьянина при ра-
боте на фабрике. Можно ли анализом равновесий подтвер-
дить позицию местного политика, если исходить из крите-
рия общественного благосостояния? (10 очков)
Задача 4. Разбавленное удовольствие. (30 очков)
Рассмотрим взаимоотношения бармена и посетителя.
Бармен подает посетителю виски с водой, выбирая долю

211
Лекции по теории игр и экономическому моделированию
виски x  [0, 1] и долю воды 1  x . Затраты на одну пор-
цию составляют для бармена величину c  x , где c  0 .
Не зная x , посетитель решает, купить порцию или
нет по рыночной цене p . Если он решается на покупку, то
его выигрыш равен v  x  p , а выигрыш бармена равен
p  c  x . Предположим, что v  c и что информация о вы-
игрышах общеизвестна. Если посетитель отказывается от
покупки, то его выигрыш считается равным 0, а выигрыш
бармена равен величине c  x . Предположим, посетитель
является опытным и способным по вкусу распознать долю
x , но только после того, как заплатит за выпивку.
(а) Это игра с совершенной или несовершенной ин-
формацией? (2 очка)
(б) Постарайтесь как можно лучше изобразить дерево
этой игры (4 очка)
(в) Найдите все равновесия Нэша в этой игре (5 оч-
ков)
(г) Предположим, что приезжий посетитель приходит
в бар каждый вечер своей десятидневной командировки, и
что каждый игрок стремится максимизировать суммарный
(без дисконтирования) выигрыш за эти 10 вечеров. Найди-
те все совершенные по подыграм равновесия Нэша (СПРН)
в этой игре (4 очка)
(д) Предположим, что посетитель местный и что иг-
ра повторяется бесконечное число раз. Пусть игроки стре-
мятся к максимизации суммы дисконтированных ежеднев-
ных выигрышей с некоторым коэффициентом дисконтиро-
вания   (0,1) . При каких ценах p существует СПРН, в
котором бармен каждый день выбирает x  1 , а посетитель
соглашается на покупку? (10 очков)
(е) При каких  существуют такие цены, как в пунк-
те (д)? (5 очков)

212
Задачи письменных работ за прошлые годы
Задачи экзамена 2006 год
Задача 1. Рассмотрим следующую игру в разверну-
той форме.

0 (Природа)
1/3 2/3
1
2 R
a b L
a
(0,0) b (1,1)
(2,2)
(0,0) (2,2)

(1.1) Постройте нормальную форму этой игры для


игроков 1 и 2 и найдите все равновесия Нэша (РН) в чис-
тых и смешанных стратегиях.
(1.2) Найдите все совершенные байесовские равнове-
сия (СБР) (в чистых и смешанных стратегиях) и приведите
ответ в следующем формате:
№ СБР стратегия стратегия представления
игрока 1 игрока 2 игрока 2

Задача 2. Рассмотрим следующий вариант модели


найма на работу по завершению образования. Есть два ти-
па выпускников L и H. Тип L имеет выраженную в деньгах
функцию психологических затрат на образование
cL (e)  e 2 , а тип H – cH (e)  a  e2 , где e  0 — оценка
уровня образования, а a  (0,1) – оценка повышенных спо-
собностей выпускника типа H. Предполагается, что во
время работы производительность выпускников типов L и
H будет равна 1  e и 2  e , соответственно. Считается, что
конкуренция между фирмами вынуждает каждую фирму
стремиться предлагать выпускнику при приеме на работу

213
Лекции по теории игр и экономическому моделированию
зарплату w , равную ожидаемому уровню его производи-
тельности.
(2.1) Какой уровень образования выберет тип L в лю-
бом выявляющем равновесии?
(2.2) Каков наименьший уровень образования для ти-
па H в выявляющем равновесии?
(2.3) Найдите эффективный уровень образования для
типа H как функцию от a . Под эффективным образовани-
ем понимается максимизация производительности минус
затраты.
(2.4) Рассмотрим эффективное выявляющее равнове-
сие, при котором уровень образования для обоих типов
выпускников является эффективным. Найдите множество
всех значений a , при которых такое равновесие существу-
ет.
Задача 3. Есть три участника рынка: один продавец и
два потенциальных покупателя неделимого товара. Обще-
известно, что оценки стоимости этого товара для покупа-
телей являются независимыми случайными величинами,
равномерно распределенными на отрезке [0, 1], а затраты
продавца на производство товара будем считать нулевыми.
Правила аукциона на данном рынке таковы. Сначала поку-
патель 1 предлагает продать продавцу товар по цене b  0 ,
скрытой от покупателя 2. Увидев цену b , продавец может
либо согласиться на сделку, либо отказаться от нее и пред-
ложить покупателю 2 купить у него товар по цене p  0 .
Если покупатель 2 соглашается на сделку, то он получает
товар по цене p . Если покупатель 2 отказывается от сдел-
ки, то товар достается покупателю 1 по цене b .
(3.1) Какова вероятность согласия покупателя 2 на
сделку при условии, что он получил от продавца предло-
жение с ценой p ? Запишите ожидаемый выигрыш продав-
ца в этом случае как функцию от b и p . Запишите пред-
ложение, которое сделает продавец покупателю 2 в равно-
весии, как функцию от предложения b покупателя 1.

214
Задачи письменных работ за прошлые годы
(3.2) Если покупатель 1 предлагает цену b , то какова
вероятность того, что в равновесии продавец вернется к
сделке с ним? Каков ожидаемый выигрыш покупателя 1
как функция от его оценки стоимости товара v1 и его
предложения b ? Какова равновесная торговая стратегия
покупателя 1?
(3.3) Вычислите ожидаемый выигрыш продавца в
равновесии.
Задача 4. Рассмотрим следующую торговую игру
между продавцом и покупателем. Сначала продавец произ-
водит товар низкого качества ( q  0 ) или высокого качест-
ва ( q  1 ). Затраты на производство товара низкого качест-
ва считаем равными 0, а затраты на производство товара
высокого качества полагаем равными 1. Потребительная
стоимость высококачественного товара для покупателя
оценивается величиной v(1)  3 , а товара низкого качества
— величиной v(0)  1 . Покупатель не знает качества про-
изведенного товара, но по правилам торгов он может пред-
ложить один трех вариантов цены покупки p : 0.5, 1.5 или
2.5. Узнав предложенную цену p , продавец может согла-
ситься на сделку или отказаться от нее. Если продавец со-
глашается, то его выигрыш равен p  q , а выигрыш поку-
пателя равен v( q)  p . Если продавец отказывается от
сделки, то его выигрыш равен q , а выигрыш покупателя
равен 0.
(4.1) Изобразите дерево этой игры.
(4.2) Найдите совершенное по подыграм равновесие
Нэша (СПРН). Отметьте равновесные действия продавца и
покупателя во всех вершинах дерева игры. Определите вы-
игрыши игроков в равновесии.
Предположим теперь, что эта игра повторяется бес-
конечное число раз с одним и тем же продавцом, но раз-
ными потенциальными покупателями в каждом периоде.
Новый покупатель знает качество товара, проданного во

215
Лекции по теории игр и экономическому моделированию
всех предшествующих периодах. Если товар не продан в
данном периоде, то он портится, и продавец должен произ-
вести к следующему периоду новую единицу товара. Ко-
эффициент дисконтирования для выигрышей продавца за
период равен  .
Отметим, что повторение СПРН из (4.2) составляет
СПРН в повторяющейся игре, но оно не идеально для про-
давца. Идеальным для продавца было бы производство вы-
сококачественного товара каждый период при получении
предложения от покупателей цены 2.5.
(4.3) Предположим, что по некоторым причинам по-
купатели всегда предлагают цену 2.5, если продавец нико-
гда в прошлом не продавал товар низкого качества. Найди-
те условия на  , при которых в ответ на такую стратегию
покупателей продавец всегда будет производить товар вы-
сокого качества.
(4.4) На самом деле покупатели могут предлагать це-
ны, меньшие 2.5, но продавец может взять обязательство
не соглашаться на сделку по цене 0.5 или 1.5. При каких
значениях  продавец в СПРН производит в каждом пе-
риоде товар высокого качества и получает в каждом пе-
риоде от покупателя предложение цены 2.5, причем если
покупатель отклоняется от цены 2.5, то продавец отказы-
вается от сделки по любой меньшей цене?

Задачи экзамена за 2007 год


Задача 1. В армии А есть один самолет, с помощью
которого можно атаковать одну из трех целей 1, 2, или 3
армии Д. У армии Д есть только зенитная пушка, которую
она может установить для зашиты одной из трех целей.
Армия А может уничтожить при атаке только незащищен-
ную цель. Для армии А выигрыш от уничтожения цели k
равен k . Аналогично, выигрыш армии Д от успешной за-
щиты цели k равен k . При атаке на защищенную цель
выигрыш армии А равен нулю. При атаке на незащищен-
ную цель выигрыш армии Д равен нулю.
216
Задачи письменных работ за прошлые годы
a) Приведите нормальную форму этой игры в мат-
ричном виде.
А\Д Д1 Д2 Д3
А1 0,1 1,0 1,0
А2 2,0 0,2 2,0
А3 3,0 3,0 0,3
б) Проведите последовательное исключение строго
доминируемых стратегий, используя смешанные стратегии.
Задача 2. Рассмотрим следующую игру G в нор-
мальной форме при 2  x  3 .
C1 C2 C3 C4
R1 4,4 0,0 0,0 x,x
R2 0,0 -3,-3 0,0 0,0
R3 0,0 0,0 2,2 0,0
R4 x,x 0,0 0,0 1,1

а) Найдите совершенное по подыграм равновесие


Нэша (СПРН) в игре G (3) (трехкратном повторении ис-
ходной игры G ), в котором в первом периоде игроки иг-
рают ( R2 , C2 ) .
в) Сконструируйте (на основе двухфазовых страте-
гий) в игре G (,  ) СПРН с выигрышами (1,1) при некото-
рых допустимых параметрах 0    1 и 2  x  3 . Опишите
все множество допустимых параметров x и  , при кото-
ром сохраняется данное СПРН.
Задача 3. Два участника аукциона конкурируют за
покупку некоторого объекта. Ценности объекта v1 и v2
для участников являются независимыми случайными ве-
личинами, равномерно распределенными на отрезке [0, 1].
Участник i имеет точною информацию своем значении vi ,
но не знает v j . Участники делают ставки из диапазона
[0, 1] одновременно и независимо друг от друга. В данном

217
Лекции по теории игр и экономическому моделированию
аукционе побеждает тот, кто поставил большую ставку.
При равенстве ставок бросается жребий. Каждый обязан
заплатить по средней ставке даже, если ему объект не
достается! (Отказаться от участия в этом аукционе нель-
зя.)
a) Выпишите функции выигрыша в данной игре.
б) Найдите симметричное равновесие Байеса–Нэша
(РБН) в данной игре в классе квадратичных стратегий:
bi (vi )  c  vi2  a , где c  0, a  0 .
в) Покажите, что в этой игре нет других РБН с глад-
кими возрастающими стратегиями b(vi ) .
Задача 4. Рассмотрим следующую сигнальную игру.
а) Найдите все выявляющие совершенные байесов-
ские равновесия (СБР).
б) Найдите все скрывающие СБР.
в) Найдите СБР в смешанных стратегиях, в котором
игрок 1 хотя бы одного типа выбирает L и R с положитель-
ной вероятностью.

Задача 5. У предпринимателя есть рисковый проект,


для реализации которого нужно вложить 100,000. В случае
успеха проект принесет доход 300,000, а в случае неудачи
– 0. Оба варианта считаются равновероятными. Предпри-
ниматель может быть либо богатым с состоянием 1,000,000
или бедным с состоянием 0. В любом случае (в силу неко-
торых причин) он не может инвестировать свои деньги в
218
Задачи письменных работ за прошлые годы
этот проект, но может взять кредит у банка. Банк готов
дать кредит под рисковый проект, но под специально на-
значенную им процентную ставку  . Заняв 100,000, пред-
приниматель по завершению проекта должен вернуть бан-
ку 100000  (1   ) , если у него есть столько денег. В про-
тивном случае он отдает все, что у него есть.
Порядок ходов
1. Банк назначает ставку  .
2. Предприниматель решает, брать ли кредит.
Если он берет 100,000, то вкладывает деньги в про-
ект.
3. По завершению проекта становится известным,
привел ли он к успеху и происходит расплата м
банком.
а) Найдите СПРН для случая полной информации о
состоянии предпринимателя.
б) Пусть размер состояния предпринимателя — это
его приватная информация. Банк не знает точно размера
состояния предпринимателя. Вероятность обращения в
банк за рисковым кредитом богатого предпринимателя
оценивается величиной ¼. Найдите СБР.

Задачи экзамена за 2008 год


Задача 1. Потребителю нужна одна единица некото-
рого товара. В тендере участвуют n фирм, которые могут
поставить этот товар. Затраты на производство товара для
фирмы i равны ci , причем эта величина известна точно
только фирме i . Общедоступная информация о затратах
состоит в том, что величины ci являются независимыми
случайными величинами, равномерно распределенными на
отрезке [0, 1]. Одновременно и независимо друг от друга
каждая фирма i назначает цену pi , а потребитель покупа-
ет товар у той фирмы, которая назначила минимальную
цену. (Если таких фирм несколько, то победитель опреде-
ляется среди фирм, назвавших минимальную цену равно-
219
Лекции по теории игр и экономическому моделированию
вероятно по жребию.) Выигрыш победителя равен pi  ci ,
а выигрыш остальных равен 0.
a) Опишите эту ситуацию как байесовскую игру.
b) Найдите в этой игре симметричное линейное рав-
новесие Байеса-Нэша (РБН). Что будет при
n   ? Дайте краткую интерпретацию.
c) Найдите все симметричные РБН со строго возрас-
тающими и дифференцируемыми стратегиями.
Подсказка. Для любого c  (0,1) вероятность того, что
c j  c для всех j  i равна (1  c) n1 .
Задача 2. Найдите совершенное байесовское равно-
весие (СБР) в следующей игре.

Задача 3. Трое сенаторов по имени Анна, Борис и


Василий участвуют в работе комитета, определяющего
ставку налога   [0,1] . Анна — борец за свободу: ее выиг-
рыш от принятия ставки налога  в день t равен
 t (1   2 ) . Борис — умеренный: его выигрыш от принятия
ставки налога  в день t равен  t (1  (  T )2 ), 0  T  1 .
Василий — либерал: его выигрыш от принятия ставки на-
лога  в день t равен  t (1  (1   ) 2 ) . Каждый день один из
них (равновероятно) получает право выдвинуть предложе-
ние. Предлагающий выдвигает ставку  , а двое остальных
220
Задачи письменных работ за прошлые годы
голосуют Да или Нет в алфавитном порядке имен. Если
хотя бы один из голосующих скажет Да, то игра кончается
со ставкой налога  . Если оба говорят Нет, то игра про-
должается на следующий день.
a) Найдите совершенное по подыграм равновесие
Нэша (СПРН) в этой игре.
Подсказка. Существует СПРН со значениями  A  T   B
такое, что Анна всегда предлагает  A , Борис всегда пред-
лагает T , а Василий всегда предлагает  B .
b) Что случится при   1 ? Дайте короткую интер-
претацию.
Задача 4. В игре «суперприз» участвуют Банкир и
Конкурсант. Есть три одинаковых чемодана с номерами 0,
1 и 2. В одном из чемоданов с равной вероятностью (1/3)
находится 1 миллион долларов, а в других нет ничего. Че-
модан 0 принадлежит Конкурсанту. Банкир предлагает ку-
пить содержимое чемодана 0 по цене p0 . Если Конкурсант
соглашается на такую цену, то игра кончается заключени-
ем сделки, при которой Банкир получает содержимое че-
модана 0, заплатив Конкурсанту цену p0 . Если Конкур-
сант отказывается от предлагаемой ему сделки, то публич-
но перед обоими игроками открывается чемодан 1. После
этого Банкир снова предлагает купить содержимое чемо-
дана 0 по цене p1 . Если Конкурсант соглашается, то игра
кончается заключением сделки, при которой Банкир полу-
чает содержимое чемодана 0, заплатив Конкурсанту цену
p1 . Если Конкурсант отказывается от сделки и на этот раз,
то публично открывается чемодан 2, а Конкурсант стано-
вится владельцем содержимого чемодана 0. Будем считать,
что выигрыш от владения x миллионов долларов для Бан-
1
кира равен x , а для Конкурсанта равен x  , где   1 (раз-
мерность — миллионы долларов).

221
Лекции по теории игр и экономическому моделированию
a) В предположении, что  общеизвестно, найдите
СПРН, используя обратную индукцию.
b) Пусть теперь Банкир не знает  , т.е.  является
приватным параметром Конкурсанта, а Банкир зна-
ет только, что  — случайная величина, причем
 1 
выполняется следующее условие: Pr    x   2 x
2 
для любого x  1 2 . Рассмотрим пороговую страте-
гию конкурсанта  0 ( p0 ) , 1 ( p1 ) : соглашаться на
цену p0 в первом раунде, если    0 ( p0 ) , и со-
глашаться на цену p1 во втором раунде, если
  1 ( p1 ) . Найдите необходимые и достаточные
условия на функции  0 ( p0 ) , 1 ( p1 ) , при которых
описанная пороговая стратегия Конкурсанта соот-
ветствует СБР.
Подсказка. Некоторые из следующих формул могут
оказаться полезными:
 1 1  2( x  y )
при любых x  y выполнено Pr    x |   y   ;
2 2  1 2y
a 1
1
при любых   1 выполнено Pr(  a )  1    ;
2
при любых a  b  1 выполнено
1 1
b 1
 a 1
Pr(  b |   a )  2 2 .
1
1 a 1
2

Задачи экзамена 2009 год


Задача 1. Государственные субсидии инноваций.
Есть две страны i  1, 2 и в каждой по одной фирме, кото-

222
Задачи письменных работ за прошлые годы
рые производят на экспорт для продажи на мировом рынке
однородный продукт. Цена спроса на этот продукт на ми-
ровом рынке определяется по формуле p (Q )  a  Q , где
Q  q1  q2 — суммарный выпуск продукта в странах 1 и 2.
Затраты в стране i на выпуск qi до инноваций равны
4
C ( qi )  c  qi , причем 0  a  c  a . Обозначим государст-
9
венные субсидии на инновации в стране i через xi . Эти
субсидии приводят к новой функции затрат:
Ci (qi , xi )  (c  xi ) qi . Затраты государства на субсидии рав-
1
ны TCi ( xi )  xi2 .
2
События развиваются последовательно в два этапа.
(1) Государства одновременно и независимо выби-
рают уровни субсидий xi  0 .
(2) Зная уровни субсидий обоих государств, фирмы
одновременно и независимо выбирают уровни выпуска
qi  0 .
Выигрыш фирмы равен
 i ( q1 , q2 , x1 , x2 )  p (Q) qi  Ci ( qi , xi ) .
Выигрыш государства равен
Wi (q1 , q2 , x1 , x2 )   i (q1 , q2 , x1 , x2 )  TC ( xi ) .
(а) При заданных уровнях субсидий ( x1 , x2 ) найдите
равновесие Нэша (РН) для фирм на этапе 2, а также выиг-
рыши фирм и государств в этом РН.
(б) Найдите совершенное по подыграм равновесие
Нэша в соответствующей динамической игре государств и
фирм.
Задача 2. Синергетические отношения. Усилия
ei  0 каждого двух индивидов i  1, 2 в рамках некоторого
совместного дела влияют на выигрыши друг друга:

223
Лекции по теории игр и экономическому моделированию
ui (ei , e j )  ei (e j  ei )  e j , где j  3  i .
(а) Найдите РН в этой игре и выигрыши игроков в нем.
(б) Рассмотрим теперь соответствующую бесконечно
повторяющуюся игру G (,  ) с коэффициентом дисконти-
рования 0    1 . Обозначим через e0 индивидуальные
усилия в РН статической игры (из пункта (а)). Рассмотрим
следующую релейную стратегию, зависящую от выбранно-
го уровня усилий k : прикладывать усилие k в первом по-
вторении и потом, пока во всех предыдущих повторениях
другой индивид также прикладывает усилие k , а иначе
переходить на усилия e0 . При каких  в зависимости от k
профиль таких релейных стратегий образует СПРН в бес-
конечно повторяющейся игре G (,  ) ?
(в) Изобразите графически профили (пары) выигры-
шей игроков в СПРН, основанных на данных релейных
стратегиях.
Задача 3. Сигнальная реклама. Компания «Гло-
ток» представляет новый напиток типичному потребителю.
Напиток может быть Хорошим или Плохим. Априорная
вероятность Хорошего напитка равна 0.6. Зная, каким по-
лучился новый напиток, компания выбирает уровень рек-
ламы: массированная реклама с затратами c или мини-
мальная реклама с нулевыми затратами. Наблюдая уровень
рекламной активности, но, не зная качества нового напит-
ка, типичный потребитель решает, покупать ли ему этот
продукт. С учетом цены на продукт будем считать, что вы-
игрыш потребителя от покупки равен +1, если напиток Хо-
роший, и 1 , если Плохой. Если потребитель не купит на-
питок, то его выигрыш равен 0. Если напиток Хороший и
типичный потребитель купит его, то фирму ожидает боль-
шой доход R . Если напиток Плохой, но типичный потре-
битель его все-таки купит, то фирму ожидает меньший до-
ход r . Если типичный потребитель не купит напиток, то
доход компании равен 0. Предполагается, что 0  r  c  R .

224
Задачи письменных работ за прошлые годы
(а) Сформулируйте соответствующую сигнальную
игру и изобразите ее графически.
(б) Найдите выявляющее совершенное байесовское
равновесие (СБР) в этой игре.
(в) Найдите скрывающее СБР в этой игре.
(г) Найдите СБР, если вероятность Хорошего напит-
ка равна 0.4.
(д) Найдите СБР, если 0  c  r  R , а вероятность
Хорошего напитка равна 0.6.
Задача 4. Как ставить оценки? Имеются препода-
ватель и студент. Преподаватель знает, что студенты бы-
вают двух типов H и L. Студент знает свой тип, а препода-
ватель нет. Известно, что априорная вероятность типа H
равна   [0, 1] . События развиваются в следующем поряд-
ке.
 Преподаватель устанавливает границу   [0, 100] в оч-
ках для положительной оценки.
 Зная свой тип и эту границу, студент решает, выбрать ли этот
предмет в качестве альтернативного курса или нет.
 Если студент не выбрал этот курс, то преподаватель по-
лучает 0, а студент — величину Wt , где t {H , L} тип
студента, причем 0  WL  WH  100 .
 Если студент выбрал данный курс, то он определяет
уровень усилий e по его освоению и сдает экзамен. На
экзамене студент типа L получает s  e очков, а студент
типа H получает s  2e .
 Студент получает положительную оценку, если s   . В
этом случае его выигрыш считается равным 100  e / 2 .
В противном случае выигрыш студента равен e / 2 .
Выигрыш преподавателя в любом случае считается
равным e .
(а) Рассмотрим престижное учебное заведение с вы-
сокими стандартами, в котором  велико, а WH не очень

225
Лекции по теории игр и экономическому моделированию
велико, например,   0.9 , WL  70, WH  80 . Найдите
СБР.
(б) Рассмотрим престижное учебное заведение с «ис-
порченными» молодыми людьми, в котором велики  и
WH , например,   0.9 , WL  70, WH  90 . Найдите СБР.
(в) Рассмотрим посредственное учебное заведение, в
котором  и WH малы, например,   0.5 , WL  70, .
WH  80 . Найдите СБР.
(г) Предположив одинаковое значение WL , проран-
жируйте экзаменационные очки s в случаях (а), (б), (в).

Контрольная работа 2005 года с решениями


Задача 1. Основные понятия (20 очков)
Приведите математическое и краткое словесное оп-
ределение следующих понятий (4 очка за каждый пункт):
(а) Наилучший ответ игрока.
Наилучший ответ игрока на стратегии остальных иг-
роков: G  {S1 ,..., Sn , u1 ,..., un }, s i  ( s j ; j  i),

Ri ( si )  Arg max ui ( si , si ) .


si Si

Отображение наилучших ответов:


R( s)  ( Ri ( si ); i  1,..., n) .
(б) Равновесие Нэша.
1. s*  R ( s* ) .
2. ui ( s* )  ui ( si , s*i ), si  Si , i  1,...n .
Докажите или опровергните контрпримером каждое
из следующих утверждений (4 очка за каждый пункт):
(в) В конечной игре с двумя участниками процесс
последовательного исключения строго доминируемых
стратегий всегда приводит к равновесию Нэша в чистых
стратегиях.

226
Задачи письменных работ за прошлые годы
Может не приводить ни к чему, поскольку может не
быть равновесия в чистых стратегиях, как в игре угадыва-
ния монеты (равно любая антагонистическая игра без сед-
ловой точки). В игре «Семейный спор» есть 2 равновесия,
но ППИСДС ничего не дает.
(г) Игра с совершенной информацией всегда имеет
единственное совершенное по подыграм равновесие.
Чтобы это было верно нужно добавить условие одно-
значности выигрышей. Без него равновесий с разными вы-
игрышами может быть много. В лекциях был пример с
двумя разными совершенными по подыграм равновесиями
Нэша:

(1,2) (0,0)

В В

1 (2,0)
2
П П

(д) Любое равновесие в строго доминирующих стра-


тегиях является равновесием Нэша.
Доминирующая стратегия:
ui ( si0 , si )  ui ( si , s i ), si  Si , si  S i , i  1,..., n .

Отсюда сразу следует, s 0  R ( s), s  s0  R( s 0 ) .


Задача 2. Новая фирма (25 очков)
Фирма 1 рассматривает потенциальную возможность
выхода на рынок, занятый фирмой 2. Если фирма 1 играет
«отказ» (О), то она получает 0, а фирма 2 остается монопо-
листом и получает 2. Если фирма 1 играет «вход» (В), то
обе фирмы независимо выбирают производство для небо-
гатых потребителей (Н) или для богатых (Б).
Обе фирмы несут потери, если они выпустили оди-
наковый продукт: их выигрыши равны –6, если они обе
сориентировались на небогатых, и –3, если на богатых. Ес-
227
Лекции по теории игр и экономическому моделированию
ли они выбрали разный продукт, то та фирма, которая со-
риентировалась на богатых, получает выигрыш 1, а другая
получает –1.
(а) Нарисуйте соответствующее дерево игры в раз-
вернутой форме со всеми атрибутами и найдите подыгры
данной игры. (5 очков)

Есть одна подыгра после хода «вход» фирмы 1. Дру-


гих подыгр (кроме самой игры) нет, поскольку нет больше
одноточечных информационных множеств.
(б) Приведите в матричном виде нормальную форму
этой игры. (5 очков)
Н Б
ОН 0,2 0,2
ОБ 0,2 0,2
ВН –6,–6 –1,1
ВБ 1,–1 –3,–3
(в) Найдите все совершенные по подыграм равнове-
сия Нэша в чистых стратегиях. (10 очков).
В подыгре после входа есть два равновесия:
Н Б
ВН –6,–6 –1,1
ВБ 1,–1 –3,–3

228
Задачи письменных работ за прошлые годы
Равновесие в подыгре (ВБ,Н) достраивается до
СПРН (В,ВБ,Н) с выигрышами (1,–1). Равновесие (ВН,Б)
достраивается до СПРН (О,ВН,Б) с выигрышами (0, 2).
(г) Существует ли совершенное по подыграм равно-
весие Нэша, включающее равновесия в смешанных страте-
гиях в подыгре после входа фирмы 1. (5 очков)
Данная подыгра подобна «Семейному спору». В ней
есть симметричное равновесие в смешанных стратегиях.
4 4
6  p1  (1)  (1  p1 )  1  p1  (3)  (1  p1 )  p1  , p2 
9 9
В этом равновесии ожидаемые выигрыши равны по
11
 , которое достраивается до СПРН добавлением хода
9
«отказ».
Задача 3. Выбор повестки дня (25 очков).
Рассматривается следующая политическая игра, в ко-
торой общественный выбор осуществляется из отрезка
X  [0, 5] . Автор законопроекта (игрок 1) вносит альтерна-
тиву x  X против существующего положения status quo
q  4 . Зная предложение игрока 1, Законодатель (игрок 2)
выбирает одно из двух: принять предложение x или оста-
вить нынешние состояние q .
Игроку 1 больше всего хочется, чтобы был выбран
проект a  1 , а при выборе другого проекта y  X его вы-
игрыш определяется по формуле: u1 ( y )  10 | y  a | .
Игроку 2 больше всего хочется, чтобы был выбран
проект l  3 , а при выборе другого проекта y  X его вы-
игрыш определяется по формуле: u2 ( y )  10 | y  l | .
Таким образом, каждый желает, чтобы обществен-
ный выбор был сделан как можно ближе к тому, что он бо-
лее всего предпочитает.
(а) Это игра с совершенной информацией или нет? (3 очка)

229
Лекции по теории игр и экономическому моделированию
Да, с совершенной (играют по очереди и знают все
уже сделанные ходы).
(б) Приведите нормальную форму этой игры. (5 очков)
S1  [0,5] , S 2  s2 | s2 :[0,5]  {0,1} ,
s , s (s )  1
ui ( s1, s2 )  ui ( y ), где y  { 1 2 1 .
q, s2 ( s1 )  0
(в) Найдите совершенное по подыграм равновесие
Нэша. (5 очков)
Законодатель может выбирать между 10 | s1  3 | и
10 | 4  3 | 9 . Значит, он будет отвергать проект из отрез-
ков [0, 2] и [4, 5] , но соглашаться на любой проект из
[2, 4] . В этих условиях игрок 1 будет предлагать 2 (будем
считать, что в случае равенства игрок 2 соглашается).
Итак, 2 и 1[2,3] составляют единственное СПРН с выигры-
шами (9,9).
(г) Единственным ли равновесием Нэша является то,
что найдено в пункте (в)? Если да, докажите. Если нет,
опишите все равновесия Нэша в этой игре. (7 очков)
Сначала, поймем, что предлагая 4, игрок 1 гаранти-
рует себе выигрыш 7. На этом основании игрок 2 может,
например, с помощью угроз построить равновесие, обеспе-
чивающее ему максимальный выигрыш 10. Такое равнове-
сие состоит из s1  3 и стратегии s2 соглашаться только на
3, а от всего другого отказываться. Можно аналогично сде-
лать равновесным и любой проект из [2,4] .
Задача 4. Лишние затраты на транспортировку?
(30 очков)
Есть две страны А и В, в каждой из которых есть
своя фирма-монополист по производству угля. Пусть фир-
ма 1 расположена в стране А, а фирма 2 — в стране В.
Пусть фирма i {1, 2} продает в стране j { A, B} объем
угля qij . Тогда qi  qiA  qiB составляет совокупный выпуск

230
Задачи письменных работ за прошлые годы
фирмы i {1, 2} , а q j  q1j  q2j есть совокупный объем уг-
ля, проданный в стране j { A, B} . Цена на уголь в странах
А и В задается с помощью линейной обратной функции
спроса: p j  90  q j , j { A, B} . Затраты на производства
продукции составляют ci ( qi )  10qi , i {1,2} .
(а) Предположим, что между странами отсутствует
торговое соглашение, и импорт в обеих странах запрещен.
Это приводит к политическому ограничению q2A  q1B  0 .
Какие тогда будут размеры производства q1A и q2B ? (6 оч-
ков)
(80  q) q достигает максимума в 40 и дает выигрыш
1600. Предположим, что страны подписали договор о сво-
бодной торговле, позволяющий иностранным фирмам про-
давать продукцию в их странах без всяких пошлин. Одна-
ко, имеются затраты на транспортировку. Если фирма i
продает продукцию qij в чужой стране (фирма 1 в В, а
фирма 2 в А), то затраты на транспортировку равны 10qij .
Предположим, что обе фирмы принимают решение о вы-
боре qiA , qiB одновременно, i {1, 2} .
(б) Смоделируйте эту ситуации как игру в нормаль-
ной форме. (8 очков)
Заменим название страны А на 1, а страны В на 2
( i  j ).

Si  R 2+ ,
ui ( q11, q12 , q12 , q22 )  (80  qii  qij ) qii  (70  q ij  q jj ) qij .
(в) Найдите равновесие Нэша в игре из пункта (б).
Оно единственно? (8 очков)
Найдем наилучшие ответы и составим уравнения для
нахождения равновесия Нэша.

231
Лекции по теории игр и экономическому моделированию
j j
80  qi 70  q j
qii  , qij 
2 2
Складывая все 4 уравнения, получаем, что общий
суммарный выпуск в равновесии должен удовлетворять
300  q
уравнению q  , откуда q  100 . Складывая выпус-
2
i
ки q для внутреннего потребления, найдем соотношение
i

суммарного внутреннего выпуска q  q11  q22 и суммарно-


160  q
го экспорта q  q12  q12 : q . Поскольку
2
q  q  100 , то получаем q  60, q  40  qii  30, qij  20 .
Равновесные выигрыши игроков равны по 900+400=1300.
Равновесие единственно.
Предположим теперь, что до начала игры из пункта
(б) отдел исследований фирмы 1 обнаружил, что перевозка
угля на современных судах влечет загрязнение окружаю-
щей среды. Если фирма пошлет об этом доклад во Всемир-
ную Торговую Организацию (ВТО), то ВТО запретит пере-
возку на существующих судах. Переход на новые техноло-
гии в транспортировке угля увеличит затраты до 40qij (по
сравнению 10qij сейчас).
(г) Захочет ли фирма 1 передавать информацию в
ВТО? Подтвердите свой вывод анализом равновесий (8
очков).
После сообщения в ВТО получится подыгра:
Si  R 2+ ,
ui ( q11, q12 , q12 , q22 )  (80  qii  qij ) qii  (40  qij  q jj ) qij .
Уравнения для равновесия изменятся на
j j
80  qi 40  q j
qii  , qij 
2 2

232
Задачи письменных работ за прошлые годы
Уравнение для суммарного выпуска примет вид
240  q
q  q  80 . Уравнение внутреннего выпуска и
2
160  q
экспорта не изменится: q  , однако теперь в паре с
2
уравнением q  q  80 дает решение q  80 , q  0 , т.е.
торговли между странами в равновесии не будет. Но по-
скольку q  80, q  0  qii  40, qij  0 , равновесные выиг-
рыши будут равны по 1600, что больше 1300. Значит, (в
СПРН) на первом шаге (двух шаговой игры) выгодно по-
сылать отчет.

Контрольная работа 2006 года с решениями


Задача 1. Рассмотрим следующую игру в нормаль-
ной форме.
L M R
A 1,0 4,1 1,0
D 2,1 3,2 0,1
C 3,–1 2,0 2,2
а) Проведите последовательное исключение строго
доминируемых стратегий.
Ясно, что M  L для игрока 2, поскольку 1 > 0, 2 >1
и 0 > –1. Исключив L, получаем игру

M R
A 4,1 1,0
D 3,2 0,1
C 2,0 2,2
В ней A  D для игрока 1, поскольку 4 > 3 и 1 > 0.
Остается игра
M R
A 4,1 1,0
C 2,0 2,2
233
Лекции по теории игр и экономическому моделированию
В ней стратегии не сравнимы по доминированию.
б) Найдите все равновесия Нэша (РН) в чистых и в
смешанных стратегиях.
Подчеркнув наилучшие ответы игроков найдем два
РН в чистых стратегиях: (A,M) и (C,R). Есть также еще од-
2 1 1 2 
но РН в смешанных стратегиях:  A  C , M  R  .
3 3 3 3 
Задача 2. Рассмотрим следующую игру в разверну-
той форме.

а) Найдите два разных совершенных по подыграм


равновесия Нэша (СПРН).
Есть только собственная подыгра, начинающаяся из
позиции с ходом игрока 2. Она равносильна статической
игре
a b c
L 3,1 0,0 2,2
R 0,0 1,3 2,2
В этой игре есть два РН в чистых стратегиях (L, c) и
1 2 
(R, b) и РН в смешанных стратегиях  L  R, c  , которые
3 3 
мы пока можем не рассматривать, поскольку в задаче тре-
буется найти только два СПРН.
РН (L,c) в подыгре приводит к выигрышам (2, 2). Со-
кратив исходную игру с учетом этого РН в подыгре, полу-
чим в остатке игру

234
Задачи письменных работ за прошлые годы
1

E X

(2,2) (2,2)

Оба выбора игрока 1 ведут к СПРН: (EL, c) и (XL, c),


и оба они приводят к одинаковым выигрышам (2, 2).
Другое СПРН получается из РН (R, b) в подыгре. При
сокращении получим теперь в остатке игру
1

E X

(1,3) (2,2)

В этой игре X  E , поэтому игрок 1 должен выбрать


X. В итоге получаем другое СПРН (XR, b), но опять с теми
же выигрышами (2, 2).
б) Постройте нормальную форму этой игры
a b c
EL 3,1 0,0 2,2
ER 0,0 1,3 2,2
XL 2,2 2,2 2,2
XR 2,2 2,2 2,2
в) Найдите РН, которое не является СПРН.
Жирным шрифтом выделены уже найденные три
СПРН. Видны еще два РН, которые не являются СПРН:
(XL, b) и (XR, c).
Задача 3. Два человека должны договориться о де-
леже общего подарка стоимостью 1, чтобы получить воз-
можность им распоряжаться своей долей. Будем считать,
что каждому важна не только его доля, но и размер доли
другого.
Предположим сначала, что оба участника дележа за-
вистливы. Свой выигрыш они оценивают величиной

235
Лекции по теории игр и экономическому моделированию
u  x   y , где x — своя доля, y — доля другого,  —
одинаковая для обоих степень зависти, причем 0    1 .
а) Один из игроков предлагает вариант дележа по-
дарка, а второй может или согласиться, или отказаться. В
случае согласия происходит дележ на основе сделанного
предложения. При отказе каждый получает ноль. Приме-
ните обратную индукцию для поиска равновесия.
Ясно, что в равновесии должно быть x  y  1 .
Пусть первым ходит игрок 1, а вторым игрок 2. Иг-
рок 2 соглашается на предложение, если его выигрыш не
меньше, чем в случае отказа. При отказе получаем
u  0   0  0 . Условие согласия игрока 2:
u  x    (1  x)  0 . Отсюда ясно, что предлагать игроку 2

можно по минимуму: x    (1  x )  0 , т.е x  . Полу-
1 
 1  
чаем СПРН с дележом  ,  и профилем выигры-
 1  1  
 1  
шей   ,0   (1   ,0) . Заметим, что игрок 1
 1  1  
вынужден реагировать на степень завистливости игрока 2,
его собственная завистливость в данном случае не влияет
на дележ. Зависть помогает игрок 2 получить большую до-
лю, но не больше удовлетворения!
б) Дележ происходит в два этапа. Второй этап насту-
пает после отказа на первом этапе. Право предлагать дележ
на втором этапе определяется жребием: бросается симмет-
ричная монета. Считается, что оба этапа проводятся в один
день, поэтому время получения выигрыша не учитывается
участниками при принятии решений. Если на втором этапе
получен отказ от дележа, то выигрыш каждого считается
равным нулю. Примените обратную индукцию для поиска
равновесия.
Пусть сначала предложение делает игрок 1, а в слу-
чае отказа право хода определяется бросанием монеты.

236
Задачи письменных работ за прошлые годы
Средний выигрыш при отказе на первом этапе равен
1
(1    0) / 2  . Условие согласия игрока 2 на первом
2
1
этапе теперь имеет вид u  x    (1  x)  . Отсюда
2
следует, что по минимуму ему можно предлагать теперь на
первом этапе долю x из условия
1 1
x    (1  x )  , т.е. x  .
2 2
Осталось проверить, есть ли смысл игроку 1 доби-
ваться согласия и предлагать дележ по ½ каждому. Если
игрок 1 сделает такое предложение на первом этапе, то
второй согласится, и выигрыш игрока 1 составит
1 
u  1/ 2    (1  1/ 2)  , т.е. ровно тот же выигрыш, что
2
и математическое ожидание выигрыша при отказе. Поэто-
му получаем два СПРН: 1) предложение равного дележа и
согласие на первом этапе, 2) предложение большей доли
себе, отказ на первом этапе с игрой на втором этапе в зави-
симости от везения при жребии.
в) повторите а) и б) для альтруистичных участников:
u  x  y .
Ясно, что в равновесии должно быть x  y  1 .
Пусть первым ходит игрок 1, а вторым игрок 2. Иг-
рок 2 соглашается на предложение, если его выигрыш не
меньше, чем в случае отказа. При отказе получаем
u  0  0  0. Условие согласия игрока 2:
u  x    (1  x )  0 . Отсюда ясно, что предлагать альтруи-
стичный игрок 2 соглашается на все, и ему можно предла-
гать нулевую долю. Получаем СПРН с дележом (1,0) и
профилем выигрышей (1    0,0  1   )  (1,  ) . Заметим,
что игроку 1 важен факт альтруистичности игрока 2, но

237
Лекции по теории игр и экономическому моделированию
степень его альтруиpзма. Альтруистичный игрок 2 ничего
не получает, но рад за игрока 1.
б) Дележ происходит в два этапа. Второй этап насту-
пает после отказа на первом этапе. Право предлагать дележ
на втором этапе определяется жребием: бросается симмет-
ричная монета. Считается, что оба этапа проводятся в один
день, поэтому время получения выигрыша не учитывается
участниками при принятии решений. Если на втором этапе
получен отказ от дележа, то выигрыш каждого считается
равным 0. Примените обратную индукцию для поиска рав-
новесия.
Пусть сначала предложение делает игрок 1, а в слу-
чае отказа право хода определяется бросанием монеты.
Средний выигрыш при отказе на первом этапе равен
1
(1   ) / 2  . Условие согласия игрока 2 на первом
2
1
этапе теперь имеет вид u  x    (1  x )  . Отсюда
2
следует, что по минимуму ему можно предлагать теперь на
первом этапе долю x из условия
1 1
x    (1  x )  , т.е. x  .
2 2
Осталось проверить, есть ли смысл игроку 1 доби-
ваться согласия и предлагать дележ по ½ каждому. Если
игрок 1 сделает такое предложение на первом этапе, то
второй согласится, и выигрыш игрока 1 составит
1
u  1/ 2    (1  1/ 2)  , т.е. ровно тот же выигрыш,
2
что и математическое ожидание выигрыша при отказе. По-
этому получаем опять два СПРН: 1) предложение равного
дележа и согласие на первом этапе, 2) предложение боль-
шей доли себе, отказ на первом этапе с игрой на втором
этапе в зависимости от везения при жребии.
Задача 4. Ниже приведены несколько статических
игр и профилей стратегий игроков в соответствующих по-
238
Задачи письменных работ за прошлые годы
вторяющихся играх. Проверьте, образуют ли данные про-
фили стратегий СПРН в бесконечно повторяющейся игре с
коэффициентом дисконтирования   0.99 .
а) Игра. Каждый из n игроков, n  2 , может вложить
1 в проект по созданию общественного продукта. Размер
созданного общественного продукта будет равен
y  ( x1    xn ) / 2 , где xi {0,1} — вклад в общее дело
игрока i . Выигрыш игрока i равен y  xi .
Профиль стратегий. Игрок i вкладывает xi  1 в пер-
вом повторении и до тех пор, пока во всех прошлых повто-
рениях уровень произведенного общественного продукта y
был больше 1/4. Иначе игрок i выбирает xi  0 .
Профиль стратегий. Каждый вкладывает xi  1 в пер-
вом повторении и потом, пока во всех прошлых повторе-
ниях уровень произведенного общественного продукта y
больше ¼. Иначе каждый игрок выбирает xi  0 .
Это не СПРН. Если все вкладывают в общее дело по
n
1, то y  . Если один игрок отклонится, то получится
2
n 1 1
y  , т.е. реакции остальных не последует, а выиг-
2 4
n n 1
рыш уклониста возрастет: 1  .
2 2
б) Игра. Дуополия Курно. Есть две фирмы. Обе фир-
мы ( i  1, 2 ) одновременно и независимо друг от друга оп-
ределяют размер qi выпуска своей продукции. Цена про-
дажи продукции фирм определяется по формуле
P  max{0,1  q1  q2 } . Затраты по выпуску продукции счи-
таются нулевыми.
Профиль стратегий. Есть два состояния: Картель и
Конкуренция. От этих состояний зависит действие игрока.
В состоянии «Картель» выпуск фирмы равен 1/4. В состоя-
нии «Конкуренция» выпуск фирмы равен 1/2. Игра начи-

239
Лекции по теории игр и экономическому моделированию
нается в состоянии «Картель». Если в прошлом периоде
было состояние «Картель» и наблюдались выпуски на
уровне 1/4, то состояние «Картель» сохраняется в текущем
периоде. Иначе наступает состояние «Конкуренция». По-
сле Конкуренции происходит автоматический возврат к
Картелю.
Это не СПРН, поскольку есть выгодное отклонение в
состоянии «Конкуренция». На q j  1/ 2 наилучшим отве-
том является выпуск, максимизирующий выигрыш
qi (1  qi  1/ 2) , т.е qi  1/ 4 . Поскольку состояние «Конку-
ренция» меняется на состояние «Картель» автоматически,
то в этой подыгре есть выгодное отклонение.
в) Игра. Как в б).
Профиль стратегий. В отличие от б) переход из со-
стояния «Конкуренция» в состояние «Картель» происходит
в том и только том случае, когда в Конкуренции оба выби-
рают 1/2. Иначе после Конкуренции в следующем периоде
опять сохраняется состояние «Конкуренция».Проверим
невозможность выгодного отклонения.
1. Если игра в некоторый момент t начинается в со-
стоянии «Картель» с выпусками (1/4, 1/4), то выигрыши
игроков в одном повторении равны по 1/8, а их текущая
стоимость при повторении этих выпусков с учетом дис-
1 1 1
контирования равна:     2  При этом игра все
8 8 8
время происходит при сохранения состояния «Картель».
Наилучшее ответ в одном повторении на выпуск 1/4
равен 3/8, при этом выигрыш в этом повторении составит
9/64. Однако за отклонением последует Конкуренция. Если
в подыгре, начинающейся с состояния «Конкуренция» (это
будет проверено ниже), то нужно сравнить по текущей
стоимости две последовательности выигрышей. Условие
невыгодности отклонения примет вид:

240
Задачи письменных работ за прошлые годы
1 1 1 9 1 1
    2    0    2   3
8 8 8 64 8 8
1 1 9 1
    0     .
8 8 64 8
2. Если игра в некоторый момент t начинается в со-
стоянии «Конкуренция», то в одном повторении на выпуск
1/2 выгодно ответить выпуском 3/8, но в отличии от б) иг-
ра тогда опять останется в состоянии «Конкуренции». Та-
ким образом, условие невыгодности отклонения в данной
1 1 1
подыгре теперь имеют вид: 0     0      .
8 16 2
Итак, получили СПРН.

Контрольная работа 2007 года с решениями


Задача 1. Рассмотрим следующую игру в нормаль-
ной форме, в которой игрок 1 выбирает строки, а игрок 2 –
столбцы.
Л С П
В (2,–1) (4,2) (2,0)
Ц (3,3) (0,0) (1,1)
Н (1,2) (2,8) (5,1)
a) Найдите все равновесия Нэша (РН) в чистых стра-
тегиях.
Подчеркнем наилучшие ответы. Получилось два РН:
(В, С) и (Ц, Л).
б) Проведите процесс последовательного исключе-
ния строго доминируемых стратегий с использованием
смешанных стратегий (подсказка: чистая стратегия может
доминироваться смешанной стратегией).
Чистые стратегии игрока 1 не сравнимы по домини-
рованию, поскольку в каждой строке есть подчеркнутый
элемент (максимум в столбце). То же касается стратегий Л
и С: в них есть подчеркнутые элементы (максимум в стро-
ке). Стратегия П не является наилучшим ответом ни на ка-
кую стратегию игрока 1, но чистыми стратегиями С и П
241
Лекции по теории игр и экономическому моделированию
она не доминируется. Зато если взять смешанную страте-
гию ½ Л + ½ С, то она будет доминировать стратегию П.
Л С П ½Л+½С
В (2,–1) (4,2) (2,0) (3,0.5)
Ц (3,3) (0,0) (1,1) (1.5,1.5)
Н (1,2) (2,8) (5,1) (1.5,5)
После исключения П у игрока 1 стратегия В домини-
рует стратегию Н. В оставшейся 2х2 матрице
Л С
В (2,–1) (4,2)
Ц (3,3) (0,0)
доминируемых стратегий нет.
с) Найдите РН в смешанных стратегиях.
Пусть p – вероятность выбора В. Тогда p находит-
ся из того условия, чтобы обе стратегии Л и С были наи-
лучшими ответами на данную смешанную стратегию:
(1) p  3(1  p )  2 p  0(1  p )  p  1 2 .
Пусть q — вероятность выбора Л. Тогда q находит-
ся из того условия, чтобы обе стратегии В и Ц были наи-
лучшими ответами на данную смешанную стратегию:
2q  4(1  q)  3q  0(1  q)  q  4 5 .
В итоге получаем РН в смешанных стратегиях
(0.5В + 0.5Ц+0Н, 0.8Л+0.2С+0П).
Задача 2. Рассмотрим следующую игру в разверну-
той форме.

а) С помощью обратной индукции найдите совер-


шенное по подыграм равновесие Нэша (СПРН) в этой игре.
242
Задачи письменных работ за прошлые годы
Соответствующие СПРН стратегии пометьте стрелками на
рисунке.
Все стрелки в силу обратной индукции получаются
вниз. Это задает СПРН. СПРН соответствует траектория,
ведущая к исходу (4, 0).
б) Пусть эта игра повторяется бесконечное число раз.
При каком коэффициенте дисконтирования  повторение
исхода (5, 5) будет соответствовать СПРН в бесконечно
повторяющейся игре? Приведите соответствующую пару
стратегий игроков и докажите, что она является СПРН.
Будем использовать релейные стратегии: играть
прямо, пока в прошлом все играли прямо, и переходить на
игру вниз в противном случае.
Игрок 1 может с выгодой в одном повторении откло-
ниться, сыграв вниз в точку (6,2). Условия невыгодности
отклонения игрока 1 записываются в виде
5 4
6  5  6(1   )  4  2  1    1/ 2 .
1 1
Игрок 2 может с выгодой в одном повторении откло-
ниться, сыграв вниз в точку (3,7). Условия невыгодности
отклонения игрока 2 записываются в виде
5 0
7  5  7(1   )  7  2    2 / 7 .
1 1
В итоге при   1/ 2 получаем СПРН в бесконечно
повторяющейся игре в релейных стратегиях.
Задача 3. Рассмотрим конкуренцию двух фирм в
двух периодах. В периоде 1 каждая фирма i  1, 2 может
инвестировать f (ci )  (1  ci )2 , чтобы получить в периоде 2
размер предельных затрат ci  [0,1] . Заметьте, что чем
меньше желательный уровень предельных затрат, тем
больше нужно инвестировать. В периоде 2 уровни затрат
c1 и c2 становятся известными фирмам, и они конкуриру-
ют по правилам дуополии Курно.
243
Лекции по теории игр и экономическому моделированию
Формально, будем считать, что в периоде 1 фирмы
выбирают одновременно величины ci  [0,1] . В периоде 2
фирмы на основе знания затрат c1 и c2 одновременно вы-
бирают размер выпуска qi , i  1, 2 . Выигрыш фирмы i опре-
деляются их прибылью  i ( qi , q j , ci )  qi [ P(Q )  ci ]  f (ci ) , где
j  i, Q  q1  q2 , P(Q)  max{2  Q,0} .
a) Найдите СПРН в этой игре.
Применим обратную индукцию. Фиксируем затраты
c1 и c2 . В периоде 2 все сводится к обычной дуополии
Курно с несимметричными затратами. Наилучший ответ
2  ci  q j
игрока i на выпуск q j равен Ri ( q j )  , если
2
q j  2  ci . В противном случае наилучшим ответом будет
ничего не выпускать, т.е. Ri ( q j )  0 при q j  2  ci .
Будем пока искать равновесие, для которого
q j  2  ci , i  1, 2 .
2  ci  q j
Решив систему уравнений qi  , i  1, 2 ,
2
2  c j  2ci
получим выпуски в РН qi  . Поскольку по ус-
3
ловию ci  [0,1] , то неотрицательность выпуска в равнове-
сии нарушена не будут.
Заметим, что совокупный выпуск в равновесии равен
4  c j  ci
Q  q1  q2  .
3
Теперь переходим к периоду 1, поставляя найденные
равновесные выпуски:
2  c j  2ci  4  c j  ci 
 i (ci , c j )  2  ci   (1  c1 ) 2 
3  3 

244
Задачи письменных работ за прошлые годы
1
 (2  c j  2ci ) 2  (1  ci ) 2
9
Находим наилучший ответ игрока i из условий 1-го
 4
порядка:  i (ci , c j )   (2  c j  2ci )  2(1  ci )  0 
ci 9
2
10  10ci  4c j  0  ci  1  c j .
5
5
В силу симметрии ясно, что в РН ci  .
7
2  5 7  2(5 7) 3
Отсюда qi   .
3 7
б) Пусть в периоде 1 уровни предельных затрат вы-
бираются последовательно: сначала c1 фирмой 1, а затем
c2 на основе знания c1 выбирает фирма 2. Найдите СПРН
в такой игре.
Анализ периода два остается неизменным. В периоде
1 возникает аналог дуополии Штакельберга. Наилучший
2
ответ игрока 2 нам известен: c2  1  c1 . Подставим его в
5
функцию выигрыша игрока 1:
2
1 2 
1 (c1 )   2  1  c1  2c1   (1  c1 ) 2 
9 5 
2 2
1  15  12c1   4 
2 2
    (1  c1 )  1  c1   (1  c1 ) .
9 5   5 
Находим максимум из условий 1-го порядка
 8 4 5
1 (c1 )   (1  c1 )  2(1  c1 )  0  c1  .
c1 5 5 9

Затраты фирмы 2 в СПРН получаются равны-


25 7
ми c2  1   . Выпуски в СПРН равны
59 9
245
Лекции по теории игр и экономическому моделированию
2  7 9  2(5 9) 5 2  5 9  2(7 9) 1
q1   , q2   .
3 9 3 3
8
Совокупный выпуск равен Q  . Это больше, чем
9
6
в а), а значит и цена ниже, что выгоднее потребителям.
7
Задача 4. Два игрока получат общий подарок стои-
мостью 1, если договорятся о его дележе. Если они догово-
рились в момент времени t  0,1, 2,... , что при дележе игрок
i получит x , то игра кончается и выигрыш игрока i со-
ставит  t  x , где   (0,1) . Если игроки не договорились
до момента n , то игра автоматически заканчивается и каж-
дый получает по 0.
В момент t  n право сделать предложение партнеру
определяется жребием: с вероятность p  (0,1) предложе-
ние делает игрок 1, а с вероятностью 1  p игрок 2.
Один грок делает предложение в виде дележа
( x,1  x) . Другой игрок может согласиться или отказаться.
В случае согласия игрок 1 получает x , а игрок 2 получает
1  x . В случае отказа переговоры возобновляются в сле-
дующий момент времени.
а) Найдите СПРН при n  1 . Чему равны ожидаемые
выигрыши игроков в этом СПРН?
Для упрощения введем как всегда условие благоже-
лательности при принятия предложения. Тогда наилучшее
предложение для игрока 1 — (1,0), а для игрока 2 — (0,1).
Поскольку игроком 1 получает право делать предложение
с вероятность p , то ожидаемые выигрыши игроков равны
( p,1  p ) .
б) Найдите СПРН при n  2 . Чему равны ожидаемые
выигрыши игроков в этом СПРН?
В силу обратной индукции отказ в периоде 1 приво-
дит с учетом дисконтирования к ожидаемым выигрышам

246
Задачи письменных работ за прошлые годы
  ( p,1  p) . Поэтому игрок 1 будет предлагать
(1   (1  p),  (1  p )) , а игрок 2 – ( p,1   p) .
Ожидаемый выигрыш игрока 1 составит
(1   (1  p ))  p  ( p)  (1  p)  p .
Ожидаемый выигрыш игрока 2 составит
 (1  p ) p  (1   p)(1  p)  1  p .
в) Найдите СПРН при n   и докажите, что дейст-
вительно получили СПРН.
Исходя из а) и б) получаем, что при любом конечном
n2 игрок 1 всегда будет предлагать
(1   (1  p),  (1  p )) , а игрок 2 — ( p,1   p) . Докажем,
что это – СПРН. Поскольку в данной игре все подыгры
совпадают с самой игрой, то достаточно рассмотреть от-
клонение в периоде игрока 1, если он получил право пред-
лагать. Если игрок 1 предложит игроку 2 больше  (1  p) ,
то игрок 2 согласится, что уменьшит выигрыш игрока 1 по
сравнению с 1   (1  p) . Если игрок 1 предложит меньше
 (1  p) , то получит отказ, после чего его выигрыш оцени-
вается величиной  p . Но 1   (1  p)  1     p   p , по-
этому такое отклонение не выгодно игроку 1. Для игрок 2
все получается точно также, если положить q  1  p .
Ожидаемые выигрыши в СПРН равны ( p,1  p) .
г) Представим, что до начала переговоров игроки мо-
гут инвестировать средства в свою переговорную силу.
Пусть игроки одновременно вкладывают a и b , тогда они
играют в повторяющуюся переговорную игру при n   и
p  a ( a  b) . Найдите СПРН.
В этой игре ожидаемые выигрыши равны
 a b 
( p  a,1  p  b)    a,  b .
 ab ab 

247
Лекции по теории игр и экономическому моделированию
При фиксированном b найдем наилучший ответ иг-
рока 1:
 a b
(  a)   1  0  b  (a  b) 2 .
a a  b (a  b )2
При фиксированном a найдем наилучший ответ иг-
 b a
рока 2: (  b)  2
 1  0  a  (a  b )2 .
b a  b ( a  b)
Откуда в СПРН получаем a  b  1 4 .
Ясно, что p  1  p  1 2 , а ожидаемые выигрыши с
учетом затрат получаются равными 1 4 .

Контрольная работа 2008 года с решениями.


Вариант 1
Задача 1. Рассмотрим следующую игру в нормаль-
ной форме, в которой игрок 1 выбирает строки, а игрок 2 –
столбцы.
Л С П
В (3,0) (0,3) (0,1)
Ц (0,3) (3,0) (0,1)
Н (1,0) (1,0) (1,1)
а) Найдите хотя бы два (а если можете, то все) рав-
новесия Нэша (РН).
Есть только одно РН в чистых стратегиях (Н,П). Есть
еще два симметричных РН в смешанных стратегиях. Легко
проверить, что наилучшим ответом на стратегию
(1/3, 1/3, 1/3) является любая чистая стратегия, поскольку
ожидаемый выигрыш равен 1. Смешанным РН является
также пара стратегий (1/2, 1/2, 0). Так, наилучшими отве-
тами игрока 1 являются стратегии В и Ц с ожидаемым вы-
игрышем 1.5 каждая. Стратегии Н соответствует ожидае-
мый выигрыш 1 < 1.5, что согласуется с тем, что 1 (H)  0 .

248
Задачи письменных работ за прошлые годы
Чтобы найти все РН нужно еще перебрать оставшие-
ся 8 подматриц 22:
1. В,Л 2. В, С
С П Л П
Ц (3,0) (0,1) Ц (0,3) (0,1)
Н (1,0) (1,1) Н (1,0) (1,1)
3. В, П 4. Ц, Л
Л С С П
Ц (0,3) (3,0) В (0,3) (0,1)
Н (1,0) (1,0) Н (1,0) (1,1)
5. Ц, С 6. Ц, П
Л П Л С
В (3,0) (0,1) В (3,0) (0,3)
Н (1,0) (1,1) Н (1,0) (1,0)
7. Н,Л 8. Н,С
С П Л П
В (0,3) (0,1) В (3,0) (0,1)
Ц (3,0) (0,1) Ц (0,3) (0,1)
Во всех 8 случаях у одного из игроков есть домини-
рующая стратегия, и поэтому в этих 22 играх нет РН в
смешанных стратегиях с положительными вероятностями.
б) Заменим теперь все выигрыши 1 на 2. Про каждое
найденное в а) РН скажите, сохранится оно или нет при
такой замене.
Л С П
В (3,0) (0,3) (0,2)
Ц (0,3) (3,0) (0,2)
Н (2,0) (2,0) (2,2)
РН со всеми положительными вероятностями исчеза-
ет, поскольку не может быть выполнено
3 2 (Л)  32 (С)  2 . РН на основе (1/2, ½ ,0) также пропа-
дает, поскольку ожидаемый выигрыш для Н теперь равен
2, что больше, чем 1.5 (для В и Ц). Из прежних РН остается
только (П,Н).
249
Лекции по теории игр и экономическому моделированию
Задача 2. Продавец продает купюру в 100 долларов
на аукционе. Имеется два покупателя. Покупатели одно-
временно и независимо друг от друга подают свои заявки
bi {0,1, 2,...,99} , i  1, 2 . Побеждает тот покупатель, кото-
рый подал наибольшую заявку. При равенстве заявок побе-
дитель (равновероятно) определяется жребием. Победитель
получает купюру в 100 долларов, заплатив то, что указал в
заявке. Выигрыш проигравшего на аукционе равен 0.

а) Постройте соответствующую данной ситуации иг-


ру в нормальной форме.
Si  {0,1,...,99} ,
ui (bi , b j )  100  bi , если bi  b j ,
ui (bi , b j )  (100  bi ) / 2 , если bi  b j ,
ui (bi , b j )  0 , если bi  b j .

б) Проведите процесс исключения доминированных


стратегий.
Ясно, что 1 доминирует 0, поскольку 0 дает положи-
тельный выигрыш 50 только против 0. Заявка 1 дает 99
против 0, 50 против 1 и 0 в остальных случаях. После ис-
ключения 0 доминируемой заявкой становится 1. Если нет
заявки 0, то 2 доминирует 1. Продолжим это процесс ана-
логично, пока ни дойдем до {98,99} . Поскольку против 98
заявка 98 и заявка 99 дают одинаковый выигрыш, равный
1, то дальше ничего исключить не можем.
в) Найдите все РН в этой игре, согласованные с а).
Получаем два РН: {98, 98} и {99, 99} . Отклоняясь от
98 к 99, мы не увеличиваем выигрыш по сравнению с вы-
бором 98. От 99 также нет смысла отклоняться.
Задача 3. а) Найдите все совершенные по подыграм
РН (СПРН) в следующей игре в развернутой форме.

250
Задачи письменных работ за прошлые годы

Начнем с подыгры
a b
A (3,3) (0,0)
B (0,0) (1,1)
В ней есть два чистых РН: Aa и Bb, и одно смешан-
ное РН: {(1/4, 3/4), (1/4, 3/4)}.
Обратная индукция дает три вариант сокращенной игры:
1 l r 2 l r 3 l r
L (3,1) (2,0) L (3,1) (2,0) L (3,1) (2,0)
R (2,0) (3,3) R (2,0) (1,1) R (2,0) (3/4, 3/4)
В варианте 1 получает два чистых РН: Ll и Rr и еще
одно смешанное РН: {(3/4, 1/4),(1/2, 1/2)}.
В вариантах 2 и 3 есть только одно чистое РН Ll.
Больше РН нет, поскольку L строго доминирует L.
Итак, получилось 3 СПРН в чистых стратегиях и еще
два СПРН с использованием смешанных стратегий.
б) Постройте нормальную форму для этой игры.
la lb ra rb
LA 3,1 3,1 2,0 2,0
LB 3,1 3,1 2,0 2,0
RA 2,0 2,0 3,3 0,0
RB 2,0 2,0 0,0 1,1
251
Лекции по теории игр и экономическому моделированию
У каждого игрока есть по два информационных мно-
жества и по два действия на каждом информационном
множестве: итого, по 4 стратегии.
Поскольку выигрыши в первых двух столбцах и в
первых двух строках у обоих игроков одинаковы, то можно
сократить нормальную форму до размеров 33:
l ra rb
L 3,1 2,0 2,0
RA 2,0 3,3 0,0
RB 2,0 0,0 1,1
По диагонали получились РН, которые совпадают с
найденными ранее СПРН.
в) Произведите последовательное исключение доми-
нируемых стратегий.
Оставшиеся стратегии игроков 1 и 2 не сравнимы по
доминированию.
г) Какое СПРН может служить наилучшим прогно-
зом результатов игры, учитывая в).
Формальных оснований для выделения какого-то од-
ного СПРН у нас нет. Однако, если дело не кончится после
пары ходов, т.е. если игроки сыграют R и r, то это будет
явным сигналом для обоих идти на РН в подыгре с выиг-
рышами (3,3). Раз уж не пошел игрок 1 в сторону РН с вы-
игрышами (3,1), то он, видимо, намекает на (3,3), а не на
(1,1).
Задача 4. Сговор в олигополии Курно. Рассмотрим
следующую бесконечно повторяющуюся игру G (,  ) .
Игра на шаге. Имеется n  1 , каждая из которых об-
ладает нулевыми затратами по выпуску продукции. В оп-
ределенный день каждая фирма i одновременно и незави-
симо от остальных производит qi некоторого товара и
продает его по цене P  1  (q1  ...  qn ) , получая выигрыш
P  qi . Рассмотрим следующий профиль стратегий всех
фирм.

252
Задачи письменных работ за прошлые годы
Профиль стратегий. При t  0 все фирмы производят
по 1 / (2n) . При t  0 уровень производства зависит от то-
го, сколько фирмы произвели в прошлом периоде t  1 .
Если каждая фирма произвела 1 / (2n) или если каждая
фирма в периоде t  1 произвела x , то каждая фирма в пе-
риоде t производит 1 / (2n) , иначе каждая фирма произво-
дит x .
Найдите условия на x, n,  , при которых данный
профиль стратегий является СПРН.
а) Эта задача на построение СПРН с помощью двух-
фазовых стратегий.
Рассмотрим сначала игру на одном шаге. Найдем РН.
1  Qi
Наилучший ответ на выпуск q i равен qi  , где
2
Qi   q j . Складывая все равенства, получим соотноше-
j i
n  ( n  1)Q n
ние Q  . Отсюда Q  . В симметричном
2 n 1
1 n 1 1
РН получается qi  , P 1  , ui  .
n 1 n 1 n 1 ( n  1) 2
При монополии должно достигаться максимум сум-
марного выигрыша (1  Q )Q , что получается при Q  1 / 2
1 1
и соответствует P  1 / 2 , qi  , выигрышам ui  .
2n 4n
Чтобы построить условия невыгодности отклонений,
нам нужно посчитать, сколько получит игрок при отклоне-
1
нии от qi  при условии, что все остальные придержи-
2n
1
ваются выпуска q j  . Наилучший ответ равен
2n
1  (n  1) / (2n) n  1
 . Выигрыш при отклонении составит
2 4n

253
Лекции по теории игр и экономическому моделированию
2
 n 1 n 1 n 1  n 1
1      .
 4n 2n  4n  4n 
Теперь найдем выигрыш при отклонении от x , если
все остальные придерживаются x . Наилучший ответ будет
1  (n  1) x
, а выигрыш равен
2
2
 1  (n  1) x  1  (n  1) x  1  (n  1) x 
1   (n  1) x    .
 2  2  2 
Если все играют x , то выигрыш каждого равен (1  nx) x .
Переходим условиям невыгодности отклонений.
Условие 1. Игрок может отклониться от монопольно-
го сговора, но потом через выбор x вернуться на договор-
ную траекторию. Таким образом, достаточно сравнить
только выигрыши за два периода
2
1 1  n 1
     (1  nx ) x.
4n 4n  4n 
Условие 2. При отклонении от x в фазе наказания
нужно сравнить выигрыш от отклонения с возвратом в фа-
зу сговора
2
1  1  ( n  1) x 
(1  nx) x       (1  nx) x .
4n  2 
При этих условиях данный профиль двухфазовых
стратегий является СПРН.
б) При каких x, n,  можно построить монопольный
сговор как СПРН, основанное на релейных стратегиях.
При релейных стратегиях с одним переключением с
монополии на РН при отклонении любого игрок будет
только одно условие невыгодности отклонений:

254
Задачи письменных работ за прошлые годы
2
1 1  n 1  1 
   2
4n 1    4n  ( n  1) 1  
в) Сравните результаты а) и б).
Ограничимся n  2 . Тогда условие из б) перепишется
в виде
2
1 1 3 1  9
   2  
8 1   8  3 1 25

1 1 3
Условие 1 из а) примет вид    ( )2   (1  2 x) x
8 8 8
1
  64 .
1
 (1  2 x ) x
8
Заметим, что осмысленные значения x могут только
из отрезка [0,1/2]. Знаменатель обращается в 0 при x  1 / 4 ,
но при крайних значениях 0 и 1/2 граница для  опускает-
ся до 1/8, что существенно ниже, чем 9/25 для релейных
стратегий.
Условие 2 из а) перепишется в виде
2
1 1 x 
(1  2 x) x       (1  2 x) x 
8  2 
2
 1 x 
   (1  2 x ) x
 2 
  .
1
 (1  2 x) x
8
При x  2 / 5 числитель правой части достигает ми-
нимума, а она сама равна 4/23=0.174..., что существенно
меньше 9/25=0.36, при этом правая часть условия 1 обра-
щается в 25/184=0.136... Итак, при n  2 двухфазовые
стратегии, например, при x  0.4 превращают монополь-

255
Лекции по теории игр и экономическому моделированию
ный сговор в СПРН для   0.2 , чего нельзя достичь при
использовании релейных стратегий.

Контрольная работа 2008 года с решениями


Вариант 2
Задача 1. Рассмотрим следующую игру в нормаль-
ной форме, в которой игрок 1 выбирает строки, а игрок 2 –
столбцы.

a b c
A (2,2) (2,0) (2,0)
B (0,2) (5,0) (0,5)
C (0,2) (0,5) (5,0)
а) Найдите хотя бы два (а если можете, то все) рав-
новесия Нэша (РН).
Есть только одно РН в чистых стратегиях (A, a). Есть
еще два симметричных РН в смешанных стратегиях. Легко
проверить, что наилучшим ответом на стратегию
(1/5, 2/5, 2/5) является любая чистая стратегия, поскольку
ожидаемый выигрыш равен 2. Смешанным РН является
также пара стратегий (0, 1/2, 1/2). Так, наилучшими отве-
тами игрока 1 являются стратегии В и С с ожидаемым вы-
игрышем 2.5 каждая. Стратегии A соответствует ожидае-
мый выигрыш 2 < 2.5, что согласуется с тем, что 1 (A)  0 .
1. Ab 2. Ac
a c a b
B (0,2) (0,5) B (0,2) (5,0)
C (0,2) (5,0) C (0,2) (0,5)
3. Ba 4. Bb
b c a c
A (2,0) (2,0) A (2,2) (2,0)
C (0,5) (5,0) C (0,2) (5,0)
5. Bc 6. Ca
a b b c
256
Задачи письменных работ за прошлые годы
A (2,2) (2,0) A (2,0) (2,0)
C (0,2) (0,5) B (5,0) (0,5)
7. Cb 8. Cc
a c a b
A (2,2) (2,0) A (2,2) (2,0)
B (0,2) (0,5) B (0,2) (5,0)
Чтобы найти все РН нужно перебрать представлен-
ные 8 подматриц 22. Во всех 8 случаях у одного из игро-
ков есть доминирующая стратегия, и поэтому в этих 22
играх нет РН в смешанных стратегиях с положительными
вероятностями.
б) Заменим теперь все выигрыши 2 на 3. Про каждое
найденное в а) РН скажите, сохранится оно или нет при
такой замене.
a b c
A (3,3) (3,0) (3,0)
B (0,3) (5,0) (0,5)
C (0,3) (0,5) (5,0)
РН со всеми положительными вероятностями исче-
зает, поскольку не может быть выполнено 51 (B)  5 ,
1 (С)  3 . РН на основе (0, 1/2, 1/2) также пропадает, по-
скольку ожидаемый выигрыш для A теперь равен 3, что
больше, чем 2.5 (для В и C). Из прежних РН остается толь-
ко (A, a).
Задача 2. Сенат определяет размер ставки налога на
недвижимость x  X  {0, 0.01, 0.02,...,0.99,1} . В состав Се-
ната входят 45 твердых Республиканца во главе с Лидером
Большинства (ЛБ), 40 твердых Демократов во главе с Ли-
дером Меньшинства (ЛМ) и 14 Умеренных во главе с Ли-
дером умеренных (ЛУ). Выигрыш Республиканцев равен
1  x , а выигрыш Демократов равен x . Выигрыш умерен-
ных равен x , если x  0.5 и 1  x , если x  0.5 . Текущая
ставка налога на недвижимость равна x0  0.6 .

257
Лекции по теории игр и экономическому моделированию
Сначала ЛБ предлагает закон x1  X . Затем ЛМ вно-
сит поправку x2  X . По правилам Сената сначала поправ-
ка x2 голосуется против закона x1 , а потом победитель
ставится на голосование против x0 . Победитель последне-
го голосования становится ставкой налога на недвижи-
мость.
Для победы в каждом голосовании требуется набрать
50 или более голосов. В каждом голосовании ЛБ голосует
за всех твердых Республиканцев, ЛМ — за всех твердых
Демократов, а ЛУ — за всех Умеренных.
а) Опишите развернутую форму данной игры с уче-
том возможности выдвижения предложений и голосова-
ния.
Ситуацию можно описать как игру 3 лиц: ЛБ, ЛМ и
ЛУ. Игра состоит из двух стадий: выдвижение предложе-
ний и голосование. Начнем со стадии голосования. Здесь
возможны два варианта.
А. Искреннее голосование. Каждый голосует за ту
альтернативу, которая лучше для него по функции выиг-
рыша. При искреннем голосовании ситуация сводится к
игре двух лиц (ЛБ и ЛМ) в развернутой форме с полной и
совершенной информацией. На каждое действие x1  X
ЛБ следует ответ x2  X ЛМ, причем он, конечно, знает
x2 . Таким образом, получаемся обычная двухходовая игра.
Нужно только определить выигрыши ui ( x1 , x2 ) . Для этого
сначала определим функцию f ( x0 , x1 , x2 ) , которая показы-
вает победителя в двух турах голосования, тогда выигрыш
ЛБ равен 1  f ( x0 , x1 , x2 ) , а выигрыш ЛМ равен
f ( x0 , x1 , x2 ) . Функция f ( x0 , x1 , x2 ) строится в два этапа.
При первом голосовании при x1  0.5  x2 побеждает то
предложение, которое ближе к 0.5, а значит, привлекает
голоса Умеренных. Пусть побеждает x . При втором голо-
совании опять из x и x0 побеждает та ставка, которая

258
Задачи письменных работ за прошлые годы
ближе к 0.5. Пусть это ставка y . Это и есть значение
f ( x0 , x1 , x2 ) . Дерево игры в данном случае выглядит при-
мерно так.

ЛБ
ЛМ

В. Стратегическое голосование. Можно считать, что


голосование является тайным. Это значит, что игроки ЛБ,
ЛМ и ЛУ подают голоса за один из двух вариантов одно-
временно и независимо друг от друга. Тогда за двухходо-
вой игрой А следует развернутая игра с полной, но несо-
вершенной информацией. Сначала ЛБ, ЛМ и ЛУ подает
карточки ЛБ1, ЛМ1, ЛУ1, на которых написано x1 или x2 .
После подсчета голосов и определения победителя x сле-
дует второй тур голосования с одновременной подачей
карточек ЛБ2, ЛМ2, ЛУ2, на которых написано x1 или x2 .
К каждой терминальной позиции дерева игры А те-
перь цепляется игра с одновременными ходами одного ту-
ра голосования, которая может быть изображена так, как
это показано ниже.
К каждой финальной позиции этого дерева цепляется
аналогичная игра голосования второго тура.
ЛУ
ЛМ

ЛБ

б) Это игра с совершенной информацией?

259
Лекции по теории игр и экономическому моделированию
Зависит от подхода. Если считать голосование ис-
кренним, а потому автоматическим, то информация совер-
шенна, поскольку предложения делаются последовательно
и открыто. Если считать голосование стратегическим и
тайным, то получаем игру с несовершенной информацией.
Впрочем, концепция СПРН примерит оба этих подхода.
При стратегическом голосовании возможно приме-
нение угроз. Например, ЛУ может потребовать от ЛМ бо-
лее выгодного для себя предложения, угрожая в противном
случае перекинуться на сторону ЛБ. Такого рода основан-
ные на угрозах РН практически всегда можно построить в
динамических играх. Возникает только вопрос: являются
ли такие угрозы обоснованными? Во всяком случае, они
нарушают принцип СПРН.
в) Найдите совершенное по подыграм РН (СПРН) в
этой игре с помощью обратной индукции.
Давайте начнем обратную индукцию с игры голосо-
вания и покажем, что профиль искренних стратегий (голо-
совать за наилучшую для себя альтернативу) образует РН в
данной подыгре. Начнем с ЛУ. Голосуя искренне ЛУ,
обеспечивает победу более близкой к 0.5 альтернативе (ес-
ли ЛБ и ЛМ играют искренне). У ЛУ нет резона отклонять-
ся. ЛБ и ЛМ могут отклониться от выгодной альтернативы,
если окажутся в меньшинстве, но это им ничего не даст.
Свернув голосование (подыгру) второго тура, приме-
ним ту же логику еще раз. В итоге, получим игру А, свя-
занную с выдвижением предложений.
Применим теперь обратную индукцию к этой игре.
Заметим только, что при заданных x0 , x1 , x2 победит в ито-
ге та ставка, которая ближе к 0.5.
Пусть уже выбрана заявка x1  0.5 и известна на-
чальная ставка x0  0.6 . Если x1  0.4 , то ближе к середине
ставка 0.6. Увеличить начальную ставку все равно нельзя,
поэтому ЛМ может предлагать x2  0.6 .

260
Задачи письменных работ за прошлые годы
Если 0.4  x1  0.5 , то оптимальным выбором для ЛМ
является симметричная ставка x2  1  x1 . В итоге получа-
ем наилучший ответ ЛМ в виде x2  min{0.6,1  x1} .
Теперь перейдем к ходу ЛБ по выбору x1 . С учетом
ответного предложения ЛМ ничего не остается, как вы-
брать x1  0.5 .
Итак, x1  0.5 , x2  min{0.6,1  x1} и искреннее голо-
сование образуют СПРН в данной игре.
Задача 3. Рассмотрим следующую игру в разверну-
той форме.

а) Найдите все СПРН в данной игре.


l r
L 3,3 0,2
R 2,0 2,2
В подыгре 22 есть два чистых РН: Ll и Rr, а также
смешанное РН: {(2/3, 1/3), (2/3, 1/3)}.
Ll. Достраивается до СПРН ходом E игрока 2, по-
скольку 5/2 < 3.
Rr. Достраивается до СПРН ходом X игрока 2, по-
скольку 5/2 > 2.
Смешанное РН. Достраивается до СПРН ходом X иг-
рока 2, поскольку 5/2 > 2.
Итак, есть два чистых СПРН и одно смешанное.
б) Постройте нормальную форму для этой игры.
261
Лекции по теории игр и экономическому моделированию
У игрока 1 одно информационное множества и два
допустимых действия, а значит, у него есть всего две стра-
тегии L и R. У игрока 2 есть два информационных множе-
ства и по два действия на каждом из них, т.е. 4 стратегии:
Xl, Xr, El, Er. Нормальная форма имеет вид.
Xl Xr El Er
L 5/2, 5/2 5/2, 5/2 3, 3 0, 2
R 5/2, 5/2 5/2, 5/2 2, 0 2, 2
Можно сократить одинаковые столбцы, отождествив
стратегии Xl и Xr.
X El Er
L 5/2, 5/2 3, 3 0, 2
R 5/2, 5/2 2, 0 2, 2
в) Произведите последовательное исключение доми-
нируемых стратегий.
Стратегия X строго доминирует для игрока 2 страте-
гию Er.
X El
L 5/2,5/2 3,3
R 5/2,5/2 2,0
Теперь L доминирует R для игрока 1. Наконец, оста-
ется профиль (L, El), который соответствует одному из
СПРН.
г) Какое СПРН может служить наилучшим прогно-
зом результатов игры, учитывая в).
Исключение доминируемых стратегий указывает на
(L,El). На это СПРН указывают и следующие рассуждения,
которые называют прямой индукцией. Если игрок 1 видит,
что игрок 2 сыграл E, то он воспринимает это как сигнал к
выбору РН с выигрышами (3, 3). Если вдруг игрок 2 сыгра-
ет r после E, то он всех «удивит». Ход r гарантирует ему
выигрыш, равнй ровно 2. Но ведь он мог столь же гаранти-
ровано получить 2.5, сразу выбрав X.

262
Задачи письменных работ за прошлые годы
Задача 4. Рассмотрим бесконечно повторяющуюся
игру с G (,  ) при   0.99 , в которой в каждом периоде
повторяется статическая игра
C D
C 5,5 –6,8
D 8,6 0,0
Какие из следующих профилей стратегий являются
СПРН?
а) Стратегия каждого игрока: Всегда играть С.
Нет. В статической игре только одно РН (D,D), по-
тому только его повторение может быть СПРН в повто-
ряющейся игре.
б) Стратегия каждого игрока: Играть С первый раз,
потом играть то, что другой сыграл в предыдущем перио-
де.
Да. При одностороннем отклонении от С игрок 1 по-
лучает 8 вместо 5, но игрок 2 в следующем периоде будет
играть D. Если сыграть D, то получишь 0, а игрок 2 снова
будет готов играть D. Если сыграть С, то игрок 2 переклю-
чится в следующем периоде на С, но игрок 1 в данном пе-
риоде получит –6. Выгодных отклонений не видно.
Такие стратегии называют «как ты, так и я в сле-
дующем периоде». Они не столь универсальны, как релей-
ные стратегии, но в данной игре достаточны для построе-
ния СПРН на основе кооперативного исхода (С,С).
в) Есть четыре состояния: Кооперация (К), Наказа-
ние игрока 1 (Н1), Наказание игрока 2 (Н2), Индивидуа-
лизм (И). Начинаем в состоянии К. В этом состоянии оба
игрока играют С. В состоянии Нi игрок i играет С, а дру-
гой игрок играет D. В состоянии И оба игрока играют D.
Если игроки попали в состояние И, то они в нем так и ос-
таются. Из любого другого состояния следует переход в
состояние К, если игроки не отклоняются от предписанных
этому состоянию стратегий. Если один игрок i отклоняет-
ся от предписанной состоянию стратегии (а другой нет), то
263
Лекции по теории игр и экономическому моделированию
следует переход в состояние Нi . Если оба игрока откло-
няются одновременно, то следует переход в состояние И.
Да. Это более сложные стратегии, которые напоми-
нают двухфазовые стратегии. Игра начинается с состояния
К, когда оба играют С. Если игрок 1 отклонится и сыграет
D, то он получит 8 вместо 5, но игра перейдет в состояние
Н1. Здесь ему предписано играть C против D игрока 2 и
получать –6. Можно, конечно, сыграть D, но тогда полу-
чишь 0 и переведешь игру в состояние И, из которого
можно выбраться, только сыграв два раза подряд C против
двух подряд D, что совсем не радует. Можно перебирать
последовательно все варианты, но выгодных отклонений
не видно.

Контрольная работа 2008 года с решениями


Вариант 3
Задача 1. Рассмотрим следующую игру в нормаль-
ной форме, в которой игрок 1 выбирает строки, а игрок 2 –
столбцы.
Л С П
В (2,–1) (4,2) (2,0)
Ц (3,3) (0,0) (1,1)
Н (1,2) (2,8) (5,1)

a) Найдите все равновесия Нэша (РН) в чистых стра-


тегиях.
Подчеркнем наилучшие ответы. Получилось два РН:
(В,С) и (Ц,Л).
б) Проведите процесс последовательного исключе-
ния строго доминируемых стратегий с использованием
смешанных стратегий (подсказка: чистая стратегия может
доминироваться смешанной стратегией).
Чистые стратегии игрока 1 не сравнимы по домини-
рованию, поскольку в каждой строке есть подчеркнутый
элемент (максимум в столбце). То же касается стратегий Л
и С: в них есть подчеркнутые элементы (максимум в стро-
264
Задачи письменных работ за прошлые годы
ке). Стратегия П не является наилучшим ответом ни на ка-
кую стратегию игрока 1, но чистыми стратегиями С и П
она не доминируется. Зато если взять смешанную страте-
гию ½ Л + ½ С, то она будет доминировать стратегию П.
Л С П ½Л+½С
В (2,–1) (4,2) (2,0) (3,0.5)
Ц (3,3) (0,0) (1,1) (1.5,1.5)
Н (1,2) (2,8) (5,1) (1.5,5)
После исключения П у игрока 1 стратегия В домини-
рует стратегию Н. В оставшейся 2х2 матрице
Л С
В (2,-1) (4,2)
Ц (3,3) (0,0)
доминируемых стратегий нет.
с) Найдите РН в смешанных стратегиях.
Пусть p — вероятность выбора В. Тогда p нахо-
дится из того условия, чтобы обе стратегии Л и С были
наилучшими ответами на данную смешанную стратегию:
(1) p  3(1  p )  2 p  0(1  p )  p  1 2 .
Пусть q – вероятность выбора Л. Тогда q находится
из того условия, чтобы обе стратегии В и Ц были наилуч-
шими ответами на данную смешанную стратегию:
2q  4(1  q)  3q  0(1  q)  q  4 5 .
В итоге получаем РН в смешанных стратегиях
(0.5В+0.5Ц+0Н, 0.8Л+0.2С+0П).
Задача 2. Рассмотрим следующую игру в разверну-
той форме.

265
Лекции по теории игр и экономическому моделированию

а) Найдите два разных совершенных по подыграм


равновесия Нэша (СПРН).
Есть только собственная подыгра, начинающаяся из
позиции с ходом игрока 2. Она равносильна следующей
статической игре.
a b c
L 3,1 0,0 2,2
R 0,0 1,3 2,2
В этой игре есть два РН в чистых стратегиях (L,c) и
1 2
(R,b) и РН в смешанных стратегиях ( L  R, c) , которые
3 3
мы пока можем не рассматривать, поскольку в задаче тре-
буется найти только два СПРН.
РН (L, c) в подыгре приводит к выигрышам (2, 2).
Сократив исходную игру с учетом этого РН в подыгре, по-
лучим в остатке игру
1

E X

(2,2) (2,2)

Оба выбора игрока 1 ведут к СПРН [(EL, c) и


(XL, c)], но оба они приводят к одинаковым выигрышам
(2, 2).

266
Задачи письменных работ за прошлые годы
Другое СПРН получается из РН (R, b) в подыгре.
При сокращении получим теперь в остатке игру
1

E X

(1,3) (2,2)

В этой игре X  E , поэтому игрок 1 должен выбрать


X. В итоге получаем другое СПРН (XR, b), но опять с теми
же выигрышами (2,2).
б) Постройте нормальную форму этой игры.
Нормальная форма представлена далее сразу с наи-
лучшими ответами игороков.
a b c
EL 3,1 0,0 2,2
ER 0,0 1,3 2,2
XL 2,2 2,2 2,2
XR 2,2 2,2 2,2
в) Найдите РН, которое не является СПРН.
Жирным шрифтом выделены уже найденные три
СПРН. Видны еще два РН, которые не являются СПРН:
(XL, b) и (XR, c).
Задача 3. Рассмотрим конкуренцию двух фирм в
двух периодах. В периоде 1 каждая фирма i  1, 2 может
инвестировать f (ci )  (1  ci )2 , чтобы получить в периоде 2
размер предельных затрат ci  [0,1] . Заметьте, что чем
меньше желательный уровень предельных затрат, тем
больше нужно инвестировать. В периоде 2 уровни затрат
c1 и c2 становятся известными фирмам, и они конкуриру-
ют по правилам дуополии Курно.
Формально, будем считать, что в периоде 1 фирмы
выбирают одновременно величины ci  [0,1] . В периоде 2

267
Лекции по теории игр и экономическому моделированию
фирмы на основе знания затрат c1 и c2 одновременно вы-
бирают размер выпуска qi , i  1, 2 . Выигрыш фирмы i оп-
ределяются их прибылью
 i ( qi , q j , ci )  qi [ P (Q)  ci ]  f (ci ), j  i ,

где Q  q1  q2 , P(Q)  max{2  Q,0} .


a) Найдите СПРН в этой игре.
Применим обратную индукцию. Фиксируем затраты
c1 и c2 . В периоде 2 все сводится к обычной дуополии
Курно с несимметричными затратами. Наилучший ответ
2  ci  q j
игрока i на выпуск q j равен Ri ( q j )  , если
2
q j  2  ci . В противном случаем наилучшим ответом бу-
дет ничего не выпускать, т.е. Ri ( q j )  0 при q j  2  ci .
Будем пока искать равновесие, для которого
q j  2  ci , i  1, 2 .
2  ci  q j
Решив систему уравнений qi  , i  1, 2 ,
2
2  c j  2ci
получим выпуски в РН qi  . Поскольку по ус-
3
ловию ci  [0,1] , то условие неотрицательности выпуска в
равновесии нарушено не будут. Заметим, что совокупный
4  c j  ci
выпуск в равновесии равен Q  q1  q2  .
3
Теперь переходим к периоду 1, поставляя найденные
равновесные выпуски:
2  c j  2ci  4  c j  ci 
 i (ci , c j )  2  ci   (1  c1 ) 2 
3  3 
1
 (2  c j  2ci ) 2  (1  ci )2
9

268
Задачи письменных работ за прошлые годы
Находим наилучший ответ игрока i из условий 1-го
порядка:
 4
 i (ci , c j )   (2  c j  2ci )  2(1  ci )  0 
ci 9
2
10  10ci  4c j  0  ci  1  c j
5
5
В силу симметрии ясно, что в РН ci  . Отсюда
7
2  5 7  2(5 7) 3
qi   .
3 7
б) Пусть в периоде 1 уровни предельных затрат вы-
бираются последовательно: сначала c1 фирмой 1, а затем
c2 на основе знания c1 выбирает фирма 2. Найдите СПРН
в такой игре.
Анализ периода два остается неизменным. В периоде
1 возникает аналог дуополии Штакельберга.
2
Наилучший ответ игрока 2 нам известен: c2  1  c1 .
5
Подставим его в функцию выигрыша игрока 1:
1 2
1 (c1 )  (2  1  c1  2c1 )2  (1  c1 ) 2 
9 5
1 15  12c1 4
 ( ) 2  (1  c1 ) 2  (1  c1 ) 2  (1  c1 )2 .
9 5 5
Находим максимум из условий 1-го порядка
 8 4 5
1 (c1 )   (1  c1 )  2(1  c1 )  0  c1  .
c1 5 5 9

Затраты фирмы 2 в СПРН получаются равными


25 7
c2  1   .Выпуски в СПРН
59 9

269
Лекции по теории игр и экономическому моделированию
2  7 9  2(5 9) 5 2  5 9  2(7 9) 1
q1   , q2   .
3 9 3 3
8
Совокупный выпуск равен Q  . Это больше, чем
9
6
в а), а значит и цена ниже, что выгоднее потребителям.
7
Задача 4. Ниже приведены несколько статических
игр и профилей стратегий игроков в соответствующих по-
вторяющихся играх. Проверьте, образуют ли данные про-
фили стратегий СПРН в бесконечно повторяющейся игре с
коэффициентом дисконтирования   0.99 .
а) Игра. Каждый из n игроков, n  2 , может вложить
1 в проект по созданию общественного продукта. Размер
созданного общественного продукта будет равен
y  ( x1    xn ) / 2 , где xi {0,1} — вклад в общее дело
игрока i . Выигрыш игрока i равен y  xi .
Профиль стратегий. Игрок i вкладывает xi  1 в пер-
вом повторении и до тех пор, пока во всех прошлых повто-
рениях уровень произведенного общественного продукта y
был больше 1/4. Иначе игрок i выбирает xi  0 .
Профиль стратегий. Каждый вкладывает xi  1 в пер-
вом повторении и потом, пока во всех прошлых повторе-
ниях уровень произведенного общественного продукта y
больше ¼. Иначе каждый игрок выбирает xi  0 .
Это не СПРН. Если все вкладывают в общее дело по
n
1, то y  . Если один игрок отклонится, то получится
2
n 1 1
y  , т.е. реакции остальных не последует, а выиг-
2 4
n n 1
рыш уклониста возрастет: 1  .
2 2
б) Игра. Дуополия Курно. Есть две фирмы. Обе фир-
мы ( i  1, 2 ) одновременно и независимо друг от друга оп-
270
Задачи письменных работ за прошлые годы
ределяют размер qi выпуска своей продукции. Цена про-
дажи продукции фирм определяется по формуле
P  max{0,1  q1  q2 } . Затраты по выпуску продукции
считаются нулевыми.
Профиль стратегий. Есть два состояния: Картель и
Конкуренция. От этих состояний зависит действие игрока.
В состоянии «Картель» выпуск фирмы равен 1/4. В состоя-
нии «Конкуренция» выпуск фирмы равен 1/2. Игра начи-
нается в состоянии «Картель». Если в прошлом периоде
было состояние «Картель» и наблюдались выпуски на
уровне 1/4, то состояние «Картель» сохраняется в текущем
периоде. Иначе наступает состояние «Конкуренция». По-
сле Конкуренции происходит автоматический возврат к
Картелю.
Это не СПРН, поскольку есть выгодное отклонение в
состоянии «Конкуренция». На q j  1/ 2 наилучшим отве-
том является выпуск, максимизирующий выигрыш
qi (1  qi  1/ 2) , т.е qi  1/ 4 . Поскольку состояние «Конку-
ренция» меняется на состояние «Картель» автоматически,
то в этой подыгре есть выгодное отклонение.
в) Игра. Как в б).
Профиль стратегий. В отличие от б) переход из со-
стояния «Конкуренция» в состояние «Картель» происходит
в том и только том случае, когда в Конкуренции оба выби-
рают 1/2. Иначе после Конкуренции в следующем периоде
опять сохраняется состояние «Конкуренция».Проверим
невозможность выгодного отклонения.
1. Если игра в некоторый момент t начинается в со-
стоянии «Картель» с выпусками (1/4, 1/4), то выигрыши
игроков в одном повторении равны по 1/8, а их текущая
стоимость при повторении этих выпусков с учетом дис-
1 1 1
контирования равна:     2  При этом игра все
8 8 8
время происходит при сохранения состояния «Картель».

271
Лекции по теории игр и экономическому моделированию
Наилучшей ответ в одном повторении на выпуск 1/4
равен 3/8, при этом выигрыш в этом повторении составит
9/64. Однако за отклонением последует Конкуренция. Если
в подыгре, начинающейся с состояния «Конкуренция» (это
будет проверено ниже), то нужно сравнить по текущей
стоимости две последовательности выигрышей. Условие
невыгодности отклонения примет вид:
1 1 1 9 1 1
    2    0    2   3 ,
8 8 8 64 8 8
1 1 9 1
или     0    .
8 8 64 8
2. Если игра в некоторый момент t начинается в со-
стоянии «Конкуренция», то в одном повторении на выпуск
1/2 выгодно ответить выпуском 3/8, но в отличии от б) иг-
ра тогда опять останется в состоянии «Конкуренции». Та-
ким образом, условие невыгодности отклонения в данной
1 1 1
подыгре теперь имеют вид: 0     0     .
8 16 2
Итак, получили СПРН.

Контрольная работа 2009 года с решениями


Задача 1. На каждый из следующих вопросов при-
нимаются только исчерпывающие ответы с доказательст-
вом или контрпримером.
а) Верно ли, что в конечной игре двух лиц для суще-
ствования равновесия Нэша (РН) в чистых стратегиях дос-
таточно существования доминирующей стратегии хотя бы
у одного игрока? Справедливо ли это утверждение для иг-
ры n лиц при n  2 ?
Если в игре двух лиц у одного игрока есть домини-
рующая стратегия, то достаточно взять на нее наилучший
ответ другого игрока, чтобы получить РН, поскольку до-
минирующая стратегия является наилучшим ответом на
любую стратегию.

272
Задачи письменных работ за прошлые годы
При n  2 существования доминирующей стратегии
у одного игрока мало, поскольку при этой стратегии для
любых двух игроков может возникнуть, например, антаго-
нистическая игра без РН в чистых стратегиях. Существо-
вание у n  1 игроков доминирующей стратегии влечет
существование РН.
б) Можно ли утверждать, что в конечной развернутой
игре с полной и точной информацией в совершенном по
подыграм РН (СПРН) выигрыши игроков определены од-
нозначно?
Нет. В учебники есть пример, когда существуют два
СПРН с разными векторами выигрышей. Достаточным ус-
ловием для этого утверждения является приведенное в
учебнике условие однозначности выигрышей в финальных
позициях.
в) Приведите пример игры в развернутой форме, в
которой информационная структура не удовлетворяет ус-
ловию полной памяти.
Представьте дерево конечной двухходовой игры двух
лиц, в которой игрок 1, совершая второй ход, не помнит,
какой он сделал первый ход. Изобразите такое дерево са-
мостоятельно, полагая, что на каждом шагу у каждого иг-
рока есть два действия.
г) В бесконечной повторяющейся игре G (,  ) бу-
дем называть стратегии игроков марковскими, если дейст-
вие игрока в момент t зависит только от действий игроков
в момент t  1 . Может ли в игре G (,  ) существовать
СПРН в марковских стратегиях, отличное от повторения
некоторого РН в исходной игре G ?
Простой ответ состоит в том, что чередовать два РН
игры. Но и в случае одного РН можно построить марков-
ское СПРН. Остановимся на дилемме заключенного
L R
L 1,1 5,0
R 0,5 4,4

273
Лекции по теории игр и экономическому моделированию
и рассмотрим стратегии si0 «как ты, так и я»:
a1i  R , ait  ait 1 . Если игроки придерживаются таких
стратегий, реализуется последовательность выигрышей
4,4,… Если, скажем, игрок 1 отклонился, сыграв L, то он
получит 5 в одном повторении. Но потом последует серия
из 1, пока игрок 1 не вернется на R. Если он вернется
мгновенно, то условие невыгодности отклоняться примет
вид: 4  4  5  0    1 / 4 . Если игрок 1 сыграет L
два раза подряд, то условие невыгодности отклонения
примет вид 4  4  4 2  5  1  0 , которое с учетом
предыдущего условия автоматически выполняется при
4 2  1    1/ 4 и т.д. Значит, «как ты так и я» обра-
зуют марковское СПРН при   1 / 4 , как и в случае ре-
лейных стратегий.
Задача 2. Рассмотрим следующую игру в нормаль-
ной форме, в которой игрок 1 выбирает строки, а игрок 2
— столбцы.
a b c d e
A (2,5) (0,2) (1,2) (5,1) (2,3)
B (0,2) (3,8) (4,6) (4,9) (2,3)
а) Найдите все равновесия Нэша в чистых стратегиях.
Есть только одно РН в чистых стратегиях: (A, a).
б) Найдите все наилучшие ответы игрока 2 на каж-
дую смешанную стратегии игрока 1. Подсказка: Изобрази-
те графически зависимости выигрыша игрока 2 от вероят-
ности выбора стратегии В игроком 1 при фиксированной
стратегии игрока 2.
в) Найдите все РН в смешанных стратегиях.
Пусть p — вероятность выбора игроком 1 стратегии B.
Изобразим графически зависимость от p ожидаемого выигрыша
игрока 2 для каждой из пяти его чистых стратегий:

274
Задачи письменных работ за прошлые годы

p
Верхняя огибающая семейства этих прямых дает зна-
чение выигрыша игрока 2 при наилучшем ответе. Заметим,
что среди чистых наилучших ответов встречаются только
a,b,d. В точке 1/3 есть два чистых наилучших ответа, а зна-
чит, и любая их смесь является наилучшим ответом на
стратегию (2/3, 1/3) игрока 1. В этой точке пересекаются
прямые a и b, а другие линии проходят ниже. Получим РН
смешанных стратегиях по соответствующей игре 22:
((2/3, 1/3), (3/5, 2/5, 0, 0, 0)). Другое РН в смешанных стра-
тегиях получается при пересечении линий b и d в точке 1/2:
((1/2, 1/2), (0, 1/4, 0, 3/4, 0)).
г) Пусть теперь игрок 1 делает ход первым, а игрок 2,
зная выбор игрока 1, делает ход вторым. Сколько страте-
гий у каждого игрока в этой игре? Найдите совершенное
по подыграм РН в этой игре.
У игрока 1 две стратегии, у игрока 2 теперь 52=25
стратегий по числу функций, определенных на множестве
из 2-х элементов и принимающих 5 значений. СПРН при-
водит к исходу Bd с выигрышами (4,9), что лучше для обо-
их, чем (2,5) в исходном РН. Чтобы понять это, достаточно
посмотреть на приведенную выше матрицу с подчеркну-
тыми наилучшими ответами и выбрать строку, в которой
больше выигрыш игрока 1 с учетом подчеркивания по иг-
року 2.
275
Лекции по теории игр и экономическому моделированию
д) Пусть теперь игрок 2 делает ход первым, а игрок 1,
зная выбор игрока 2, делает ход вторым. Сколько теперь
стратегий у каждого игрока в этой игре? Найдите СПРН в
этой игре.
У игрока 2 теперь 5 стратегий, а у игрока 1 их 25=32
по числу функций, определенных на множестве из 5-и эле-
ментов и принимающих 2 значения. СПРН приводит к ис-
ходу Bb и выигрышам (3,8).
Значит, обоим игрокам выгодно, чтобы фиксирован-
ный порядок ходов был, причем чтобы первым делал ход
игрок 1.
Задача 3. Фирма 1 собирается выйти на рынок, кото-
рый монопольно обслуживает фирма 2. Если фирма 1 ре-
шит все же воздержаться от выхода на этот рынок, то она
получит выигрыш, равный 0, а фирма 2 получит 10 (ска-
жем, миллионов долларов). Если фирма 1 все-таки выйдет
на рынок, то фирма 2 может либо отреагировать мирно,
либо вступить в борьбу против фирмы 1. Если фирма 2 от-
реагирует мирно, то обе фирмы получат выигрыш по 5.
Если фирма 2 вступит в борьбу, то теперь у фирмы 1 есть
выбор: принять вызов или покинуть рынок. Если фирма 1
примет вызов и останется, то с учетом затрат на борьбу
фирма 1 получит выигрыш 1, в то время как фирма 2 полу-
чит 2. Если фирма 1 решит покинуть рынок, не вступая в
борьбу, то с учетом затрат на вход в рынок фирма 1 полу-
чит выигрыш, равный -1, а фирма 2 получит 6.
а) Изобразите дерево соответствующей игры в раз-
вернутой форме.

б) Найдите СПРН методом обратной индукции.

276
Задачи письменных работ за прошлые годы
СПРН показано стрелками. Оно соответствует мир-
ному дележу рынка.
в) Постройте нормальную форму данной игры.
В сокращенном виде в нормальной форме у игрока 1
три стратегии: Н (не входит на рынок), ВБ (входить и бо-
роться, если придется), ВП (входить, но покидать рынок,
не вступая в борьбу). У игрок 2 две стратегии: Б (бороться)
или М (мириться).
Б М
Н 0,10 0,10
ВБ 1,2 5,5
ВП -1,6 5,5
г) Найдите все РН.
Других РН в этой игре нет.
Задача 4. Рассмотрим статическую игру G .

А Б В
а 4,1 0,0 5,0
б 0,0 1,4 0,0
в 0,0 0,5 3,3
а) Найдите все РН в чистых и смешанных стратегиях
в этой игре.
В чистых стратегиях есть два РН: (а, А) и (б, Б). Есть
еще РН в смешанных стратегиях: ((4/5, 1/5, 0), (1/5, 4/5)), в
котором выигрыш каждого игрока равен 4/5.
Предположим, что эта игра разыгрывается несколько
раз, причем продолжение игры происходит с вероятностью
p , а с вероятностью 1  p игра заканчивается. Выигры-
шем игрока в такой повторяющейся игре G ( p) считается
ожидаемая сумма его выигрышей во всех состоявшихся до
окончания игры повторениях.
б) Можно ли утверждать, что при некотором  игра
G (,  ) с дисконтированием выигрышей эквивалентна
игре G ( p) ?
277
Лекции по теории игр и экономическому моделированию
В игре G ( p) вероятность того, что игра повторится
t раз равна pt 1 . Пусть игрока ожидает выигрыш xt в
повторении t , если до него дойдет дело, т.е. игра не закон-

чится ранее. Тогда ожидаемый выигрыш равен  xt pt 1 .
t 1
Значит, игра G ( p) с ожидаемыми выигрышами совпадает
игрой G (,  ) при p   . Отметим, что это верно для
любой конечной игры G .
в) Можно ли в игре G ( p) построить СПРН, в кото-
ром игроки будут играть (в,В) по всех повторениях до
окончания игры?
Здесь прямо нельзя использовать «народную теоре-
му», поскольку нет РН в чистых стратегиях с выигрышами
менее 3 для обоих игроков. Один путь — перейти на РН в
смешанных стратегиях при отклонении. Другой путь —
использовать обычные релейные стратегии с переключени-
ем на выгодное равновесие. Например, для игрока 1 выби-
рать «в», пока игрок 2 тоже выбирает «В», а если игрок 2
выбирает не «В», то переключиться на «а». Аналогично,
для игрока 2 переключение происходит на «Б».
Задача 5. n человек являются свидетелями преступ-
ления. Каждый из них может позвонить в полицию или не
звонить. Каждый из них хочет, чтобы полиция была про-
информирована, но позвонить самому, значит, понести оп-
ределенные психологические затраты. Пусть выигрыш от
информирования полиции оценивается величиной v , при-
чем неважно, кто именно и сколько человек позвонит, а
затраты оцениваются величиной c . Пусть v  c  0 . Счи-
тается, что выигрыш индивида равен 0, если никто не по-
звонил, равен v , если позвонил кто-то другой и равен
v  c , если позвонил он сам.
а) Найдите РН в чистых стратегиях в этой игре.

278
Задачи письменных работ за прошлые годы
Один любой игрок звонит в полицию, а другие нет.
Получается n РН.
б) Найдите симметричное РН в смешанных стратеги-
ях, в котором каждый игрок звонит в полицию с вероят-
ность p  (0,1) .
в) Проанализируйте найденное в б) РН в зависимости
от параметров v и c . Что будет происходить с возрастани-
ем n с вероятность звонка в полицию фиксированного
свидетеля и вероятностью того, что хотя бы кто-то позво-
нит?
В этом симметричном смешанном РН выигрыш иг-
рока в случае обоих действий должен быть одинаковым.
Если игрок звонит, то получает v  c с вероятностью 1.
Если он не звонит, то получит v с вероятностью
1  (1  p)n 1 , что кто-то другой позвонит. Итак, должно
быть
c
v  c  v(1  (1  p )n1 )   (1  p )n1
v
c
 p  1  ( )1/( n1) .
v
c
Чем больше относительные затраты , тем меньше
v
вероятность звонка.
При возрастании числа n свидетелей вероятность p
в равновесии уменьшается и стремится к нулю. Вероят-
n /( n1)
c n
ность, что никто не позвонит, равна (1  p )   
v
c
и стремится к относительным затратам для больших
v
групп свидетелей. Чем ближе c к v , тем больше вероят-
ность, что никто не позвонит.

279
Лекции по теории игр и экономическому моделированию
Задачи экзамена за 2004 год с решениями
1. Алиса и Боб хотят отметить памятную дату. Они
могут перекусить в МакДональдсе или пойти потанцевать
в клуб «Зона». Боб первым выбирает, куда пойти. Алиса
принимает решение, зная, куда пошел Боб. Боб предпочи-
тает подкрепиться, а Алиса — танцы. Игрок получает 3,
если они вместе идут туда, куда ему/ей больше хочется, 1
— если они вместе идут туда, куда больше предпочитает
другой, и 0, если идут в разные места. Все это описание
ситуации является общей информацией.
a) Найдите совершенное по подыграм равновесие
Нэша. Найдите несовершенное по подыграм равновесие
Нэша с другим исходом.
Решение. У Боба 2 стратегии, а у Алисы 4. СПРН:
Алиса идет туда, куда пошел Боб. Исход СПРН — встреча
в МакДональдсе. Не СПРН: Алиса собирается идти в тан-
цевать в Зону, независимо ни от чего и встречает там Боба.
Это равновесие Нэша, но не совершенное РН, поскольку в
подыгре после «хода» Боба в МакДональдс Алиса выбира-
ет не наилучший ответ.
b) Модифицируем игру: Алиса не узнает автомати-
чески, куда пошел Боб, но может узнать это, если захочет,
без каких-либо затрат. Это означает, что сначала Алиса
решает, узнавать ли ей, куда пошел Боб, а затем решает,
куда ей отправиться, либо, получив информацию о том,
куда пошел Боб, либо без всякой информации. Выигрыши
определяются так же, как и в начальной постановке. Най-
дите совершенное по подыграм равновесие в новой игре,
которое имеет тот же самый исход, что и несовершенное по
подыграм равновесие в пункте а).
Решение. Изобразим дерево игры и СПРН в ней,
приводящее к встрече на танцах в Зоне.

280
Задачи письменных работ за прошлые годы
Боб

Алиса
Узнать
Узнать нет нет
Алиса
Алиса
Алиса

3,1 0,0 3,1 0,0 0,0 1,3 0,0 1,3

2. Два инвестора одновременно вкладывают средства


в совместный проект. Если инвестор i вкладывает xi , а его
партнер j инвестирует x j , то выигрыш инвестора i опре-
деляется по формуле i xi x j  xi3 . Здесь i — приватный
параметр инвестора i , о котором его партнер думает, как о
случайной величине, равномерно распределенной на отре-
зе [0,1]. Это описание ситуации является общей информа-
цией. Найдите симметричное равновесие Байеса–Нэша в
классе стратегий xi  a  b i .
Решение. Пусть пара стратегий ( x1* , x2* ) является
РБН, причем x*i  a  b i , поскольку мы ищем симмет-
ричное РБН. Ожидаемый выигрыш i от инвестиций xi при
известном i равен U ( xi ,i )  i xi E[ x*j ]  xi3 .
Найдем xi* (i ) из условия 1-го порядка (при каждом
i нужно максимизировать выигрыш игрока i по xi ) :
E[ x*j ]
xi* (i )  i .
3

281
Лекции по теории игр и экономическому моделированию
Отсюда получаем a0 и x*i  b i , причем

E[ x*j ] 2b
b . Но тогда E ( x*j )  E[b i ]  bE[ i ]  . Из
3 3

E[ x*j ] 2 E ( x*j ) 2b 2
b получаем b   , значит, b  .
3 3 9 9
2
Итак, xi* (i )  i .
9
3. Найдите совершенное байесовское равновесие (в
чистых и смешанных стратегиях) в следующей игре:

Решение. На картинке показано единственное СБР в


смешанных стратегиях этой игре.

282
Задачи письменных работ за прошлые годы
Ясно, что если после хода Природы право хода пе-
рейдет к игроку 1, то ему надо заканчивать игру с выиг-
рышем 2, поскольку иначе он больше 1 не получит. Выбор
игроков 1 и 2 в трех предфинальных вершинах также не
вызывает сомнения. Еще в одной вершине у игрока 2 всего
1 ход. Проставив эти очевидные ходы, осталось найти ве-
роятность  для игрока 1 сделать ход вправо (если Приро-
да даст ему такой шанс), вероятность  для игрока 3 сде-
лать ход вправо и вероятность  , которая соответствует
ожиданиям игрока попадания траектории в среднюю вер-
шину. В СБР траектория не может попасть в левую верши-
ну по построению.
Проверим теперь, что нет СБР в чистых стратегиях.
Если 3 идет влево, то и 2 должен идти влево, но тогда
  0 и 3 должен ходить вправо. Противоречие. Если 3
идет вправо, то 2 должен ходить в центр, тогда   4 / 5 ,
что соответствует ожиданиям о выборе Природы. Но тогда
игроку 3 выгоднее сыграть влево — противоречие.
В смешанном СБР оба хода игрока 3 должны быть
равноценны:
2
1  0   3(1   )    .
3
По правилу Байеса и из условий согласования ожи-
даний игрока 3 со стратегией игрока 2 получаем
0.4 2 1
    .
0.4  0.1 3 2
Наконец, для того чтобы игрок 2 смешивал свои чис-
тые стратегии, они должны быть для него равноценны по
ожидаемому выигрышу:
1
1  2    .
2
4. В игре участвуют Судья и Истец. Истцу был нане-
сен некоторый моральный ущерб. Степень ущерба v явля-

283
Лекции по теории игр и экономическому моделированию
ется приватной информацией истца. Судья верит, что v
равномерно распределено на {0, 1,…, 99} (т.е. он полагает,
что вероятность события v  i равна 1/100). Истец может
без затрат предъявить истинную величину v Судье. После-
довательность действий следующая. Сначала Истец при-
нимает решение, предъявлять ли величину v судье. Затем
судья дает Истцу компенсацию R . Выигрыш Истца равен
R  v , а выигрыш Судьи равен (v  R )2 . Все это описание
является общей информацией. Найдите совершенное Байе-
совское равновесие.
Решение. Стратегия Истца есть функция от его при-
ватной информации: s (v) со значениями v (открыться Су-
дье) или N (не открываться). Стратегия Судьи есть функ-
ция R() , заданная на множестве {N , 0,1, , 99} . В РБН
( s* , R* ) при откровенности Истца Судья в силу своих
предпочтений всегда выбирает компенсацию R* (v )  v .
Если Истец не хочет иногда выявлять свою приватную ин-
формацию ( s* (v)  N хотя бы для одного v ), то предпоч-
тения Судьи диктуют R* ( N )  E[v | s* (v )  N ] .
В РБН Истец должен дать наилучший ответ на стра-
тегию Судьи R* для каждого v . Отсюда следует, что в
РБН Истец будет открываться при v  R* ( N ) и не будет
открываться при v  R* ( N ) . Но тогда ясно, что в СБР
R* ( N )  0 . В противном случае, Судья знает, что Истец
будет молчать для малых значений ущерба, а значит, по-
нижая компенсацию при молчании Истца, Судья может
увеличить свой выигрыш (уменьшить проигрыш).
Итак, в РБН Судья не дает компенсации «в темную»,
но справедлив с искренним Истцом.

284
Задачи письменных работ за прошлые годы
Истец либо искренен всегда ( s* (v)  v ), либо скром-
но молчит, лишь при v  0 . Формально имеется ровно два
РБН, которые, по сути, эквивалентны.

Задачи экзамена за 2005 год с решениями


Задача 1. Основные понятия. (10 очков)
Предположим, что в игре двух лиц с полной инфор-
мацией у каждого игрока i есть доминирующая стратегия
si* . Установите справедливость каждого из следующих ут-
верждений. Если утверждение верно, то приведите доказа-
тельство, если нет — контрпример.
(а) Пара стратегий ( s1* , s2* ) является равновесием Нэ-
ша (2 очка)
Верно:
ui ( si* , s i )  ui ( si , si ), si , si , i 
ui ( si* , s* i )  ui ( si , s*i ), si , i.

(б) Не существует другого равновесия Нэша ( s1 , s2 ) ,


в котором выигрыш каждого игрока больше, чем в ( s1* , s2* )
(8 очков)

Контрпример:
s2* s2
s1* (1,1) (5,0)
s1 (0,5) (5,5)

Если есть пара строго доминирующих стратегий:


ui ( si* , s i )  ui ( si , si ), si  si* , i  1,2 ,
то никакого другого равновесия Нэша (кроме этой пары)
быть не может, поскольку строго доминирующая стратегия
285
Лекции по теории игр и экономическому моделированию
является единственным наилучшим ответом на любую
стратегию.
Задача 2. Кому где учиться? (30 очков)
Рассмотрим следующую проблему выбора образова-
ния. Выпускник школы (игрок 1) решает, куда ему пойти
учиться: в Липовый университет (Л) или в Кедровый уни-
верситет (К). В Кедровом университете тяжелее учиться
(больше моральные затраты), но и получаемая квалифика-
ция выше. Конкретно, затраты и квалификация игрока 1
зависит от его типа: сильный выпускник (С) или обычный
выпускник (О). Будем считать, что игрок 1 знает свой тип,
а все остальные знают только, что доля сильных выпуск-
ников равна p . Затраты и квалификация для каждого типа
приведены в следующих таблицах:
Тип С
затраты квалификация
Л 0 4
выбор
К 2 12

Тип О
затраты квалификация
выбор Л 2 2
К 8 10
После окончания университета игрок 1 нанимается
на работу в фирму (игрок 2). Игрок 2 может взять игрока 1
в один из двух отделов: традиционные технологии (Т) или
высокие технологии (В). Зарплата в Т-отделе равна 2, а в
В-отделе — 6. Выигрыш игрока 1 считается равным разно-
сти: зарплата минус затраты на обучение.
Выигрыш игрока 2 зависит от назначения в отдел и
типа работника. При назначении в В-отдел выигрыш фир-
мы равен разности: квалификация нанятого работника ми-
нус его зарплата. При назначении в Т-отдел выигрыш
фирмы составляет половину квалификации работника ми-
нус зарплата.
286
Задачи письменных работ за прошлые годы
(а) Изобразите развернутую форму игры (8 очков)

6,-2 В В
4,6
Л С К

1 p Т 0,4
2,0 Т
2 2
В
В
4,-4 1 1 p -2,4

Л О К
0,-1 Т -6,3
Т
1
(б) Пусть p  . Приведите матричную форму байе-
2
совской игры (8 очков). Подсказка: сколько у каждого иг-
рока стратегий? сколько чисел (выигрышей) нужно поста-
вить в каждую клетку матрицы?
У игрока 1 есть четыре стратегии: как играть при ти-
пе О и как при типе С. Например, ЛК означает, что О идет
в Липовый университет, а С — в Кедровый. Аналогично, у
игрока 2 имеется 4 стратегии: куда назначать после Липо-
вого университета и куда после Кедрового. Например,
стратегия ВТ означает назначение в В-отдел после Л и в Т-
отдел после К. Три числа в клетке: выигрыш игрок 1 при
типе О; при типе С, ожидаемый выигрыш игрока 2 при ус-
1
ловии p  .
2

ТТ ТВ ВТ ВВ
ЛЛ 0; 2, –0.5 0; 2, –0.5 4; 6, –3.5 4; 6, –3.5
ЛК 0; 0, 1.5 0; 4, 2.5 4; 0, –0.5 4; 4, 0.5
КЛ –6; 2, 1.5 –2; 2, 2 –6; 6, –0.5 –2; 6, 1
КК –6; 0, 3.5 –2; 4, 5 –6; 0, 3.5 –2; 4, 5
(в) Найдите все равновесия Байеса–Нэша в чистых
стратегиях (4 очков)

287
Лекции по теории игр и экономическому моделированию
Подчеркнем максимальные выигрыши в столбце за
каждый тип игрока 1 и максимальный выигрыш в строке за
игрока 2. Получаются два РБН: (ЛЛ, ТТ) и (ЛК, ТВ).
Обратите внимание, что в каждом столбце есть клет-
ка, в которой подчеркнуты выигрыши игрока 1 обоих ти-
пов. Это общее свойство байесовских игр. Отсюда следует,
что можно было усреднить выигрыши игрок 1. Равновесия
Нэша в такой игре совпадают с равновесиями Байеса–
Нэша в исходной игре.
(г) Найдите все совершенные байесовские равнове-
сия в чистых стратегиях (8 очков)
Ищем скрывающие равновесия.
ЛЛ влечет ожидания (0.5, 0.5) на равновесном пути
(после Л) и выбор Т. Вне равновесного пути (после К) при
любых ожиданиях получается, что В лучше Т для игрока 2.
Но тогда типу С выгодно отклониться с Л на К, что увели-
чит его выигрыш с 2 до 4. Значит, ЛЛ не может быть до-
строено до СБР.
КК влечет выбор В на равновесном пути (после К) и
оптимальный ответ В за игрока 2. Вне равновесного пути
(после Л) игроку 2 всегда выгодно играть Т. Но тогда типу
О выгодно отклониться от К, повысив свой выигрыш с -2
до 0. Значит, в данной игре нет скрывающих равновесий.
ЛК влечет оптимальный ответ Т на Л и В на К. Ни у
типа О, ни у типа С нет выгодных отклонений.
КЛ влечет все равно оптимальный ответ Т на Л и В
на К, но теперь оба типа имеют мотивацию к отклонению.
Итак, в данной игре есть одно СБР: естественное вы-
являющее равновесие (ЛК,ТВ).
Другой способ нахождения СБР в этой игре основан
на том, что в этой игре игроку 2 при любых ожиданиях вы-
годно играть В после К и Т после Л. С учетом этого игроку
1 типа О выгодно играть Л, а при типу 2 ему выгодно иг-
рать К.
Задача 3. Что посеешь, то и пожнешь (30 очков)
Крестьянин владеет некоторым участком, где он мо-
жет заниматься земледелием. Выход продукции зависит от
288
Задачи письменных работ за прошлые годы
его трудолюбия. Уровень собственного трудолюбия кре-
стьянину известен. Остальные знают только, что трудолю-
бие крестьянина t равномерно распределено на отрезке
[0, 1]. Будем считать, что выигрыш крестьянина от обра-
ботки своей земли равен его трудолюбию t .
Прежде, чем начать обрабатывать свою землю, кре-
стьянин идет на соседнюю фабрику и предлагает взять его
для работы на конвейере. Крестьянин может попросить
хозяина фабрики любую заплату w  0 , а хозяин может
либо согласиться (С) с этим предложением, либо отказать-
ся (О) от него. Если хозяин отказывается от предложения
крестьянина, то тот возвращается к земледелию, выигрыш
хозяина считается равным 0. Если хозяин соглашается
взять к себе на работу крестьянина с заплатой w , то выиг-
рыш крестьянина считается равным его зарплате w , а вы-
3
игрыш хозяина равен  t  w , причем эта информация о
2
выигрышах общеизвестна.
(а) Это игра с полной или неполной информацией? (2 очка)
Это игра с неполной информацией, поскольку уро-
вень трудолюбия крестьянина является его приватной ин-
формацией, о которой у хозяина фабрики есть только об-
щее представление.
(б) Опишите множества чистых стратегий обоих иг-
роков. (4 очка)
Стратегией крестьянина является функция w  f (t )
определенная на [0, 1] и принимающая неотрицательные
значения. Стратегия хозяина есть функция y  g ( w) , опре-
деленная при всех w  0 и принимающая значения из мно-
жества {С,О}.
(в) Найдите равновесия Байеса-Нэша в чистых стра-
тегиях в этой игре. (10 очков)
Выигрыш крестьянина типа t с заявкой на зарплату
w равен t , если g ( w)  O и w , если g ( w)  C . Ясно, что

289
Лекции по теории игр и экономическому моделированию
крестьянина интересует максимальная зарплата, с которой
согласится хозяин: w*  max{w | g ( w)  C} .
Если t  w* , то лучше оставаться дома. При t  w*
лучше идти на фабрику и просить зарплату w* . При
t  w* оба варианта равнозначны. Итак, оптимальный ответ
крестьянина на любую стратегию хозяина имеет вид поро-
говой стратегии.
В таком случае хозяину только нужно, установить
приемлемый уровень согласия w из условия выгодности
ожидаемого дохода при найме:
w
3
При w  1 имеем  ( t  w) d t  0 .
0
2
w 2
3  3 w 2 w2
Поскольку  2
  t  w  d t    w   , то под-
 2 2 4
0
ходит только w  0 .
1
3 
При w  1 имеем    t  w  d t  0 .
0
2 
1
3  3 1 3
Поскольку   2  t  w  d t  2  2  w  4  w , то в СБР
0
3
пороговый уровень согласия должен быть не выше .
4
Противоречие.
Значит, есть только нулевое РБН: хозяин соглашается
только взять крестьянина на работу бесплатно, что не уст-
раивает крестьянина (кроме случая t  0 ).
(г) Для равновесий из пункта (в) найдите возможные
уровни общественного благосостояния (сумма выигрышей
крестьянина и хозяина, осредненная по типу крестьянина).
(4 очка)

290
Задачи письменных работ за прошлые годы
Суммарный ожидаемый выигрыш в нулевом РБН ра-
1
вен , причем это ожидаемый выигрыш крестьянина при
2
нулевом выигрыше хозяина фабрики.
(д) Местный политик, который выступает за рост
общественного благосостояния, предлагает урезать субси-
дии на воду фермерам, что снизит для крестьянина типа t
1
выигрыш от земледелия на собственном участке до t , но
2
не окажет влияния на продуктивность крестьянина при ра-
боте на фабрике. Можно ли анализом равновесий подтвер-
дить позицию местного политика, если исходить из крите-
рия общественного благосостояния? (10 очков)
t
Выигрыш крестьянина типа t равен , если
2
g ( w)  O и w , если g ( w)  C . Ясно, что крестьянина ин-
тересует максимальная цена, с которой согласится хозяин:
w*  max{w | g ( w)  C} .
t t
Если  w* , то лучше оставаться дома. При  w*
2 2
*
лучше идти на фабрику и просить зарплату w . При
t
 w* оба варианта равнозначны. Итак, оптимальный от-
2
вет крестьянина имеет вид пороговой стратегии.
В таком случае, хозяину нужно установить приемле-
мый уровень согласия w из условия выгодности ожидае-
мого дохода при найме.
2w
1 3 
При w  имеем условие   2  t  w  d t  0 .
2 0

291
Лекции по теории игр и экономическому моделированию
2w
3  3 ( 2 w)2
Поскольку    t  w  d t    2w2  w2 , то
0 2  2 2
1
получается, что РБН существует при любом w  .
2
1
1 3 
При w  имеем условие   t  w  d t  0 .

2 0
2 
1
3  3 1 3
Поскольку   2  t  w  d t  2  2  w  4  w , то полу-
0
3
чается, что РБН существует при любом w  .
4
Отметим, что в РБН выигрыш хозяина имеет макси-
1 1
мум выигрыша при w  , и он равен . При этом кресть-
2 4
1
янин просит зарплату при любом типе и всегда получает
2
согласие. Таким образом, его ожидаемый выигрыш остает-
1 3
ся равным , а их суммарный выигрыш теперь равен .
2 4
Итак, крестьянина такой политикой выманить на
фабрику можно, но реальная польза для него будет только
1 5
при зарплате больше . Например, при w  выигрыш
2 8
крестьянина и выигрыш хозяина увеличивается по сравне-
нию с первоначальным вариантом на 1/8.
Задача 4. Разбавленное удовольствие (30 очков)
Рассмотрим взаимоотношения бармена и посетителя.
Бармен подает посетителю виски с водой, выбирая долю
виски x  [0,1] и долю воды 1  x . Затраты на одну пор-
цию составляют для бармена величину c  x , где c  0 .
Не зная x , посетитель решает, купить порцию или
нет по рыночной цене p . Если он решается на покупку, то

292
Задачи письменных работ за прошлые годы
его выигрыш равен v  x  p , а выигрыш бармена равен
p  c  x . Предположим, что v  c и что информация о вы-
игрышах общеизвестна. Если посетитель отказывается от
покупки, то его выигрыш считается равным 0, а выигрыш
бармена равен величине c  x . Предположим, посетитель
является опытным и способным по вкусу распознать долю
x , но только после того, как заплатит за выпивку.
(а) Это игра с совершенной или несовершенной ин-
формацией? (2 очка)
Эта игра с несовершенной информацией, поскольку
бармен делает ход, о котором у посетителя нет информа-
ции.
(б) Постарайтесь как можно лучше изобразить дерево
этой игры. (4 очка)

pcx
да vx p
x

Б П
нет
c  x
0

В начальной вершине ходит бармен. У него беско-


нечное множество ходов x  [0,1] . Потом ходит посети-
тель. У него одно информационное множество, поскольку
он не знает выбора бармена.
(в) Найдите все равновесия Нэша в этой игре. (5 оч-
ков)
Стратегия бармена — это x . Стратегия посетителя –
это ДА или НЕТ. Ясно, что x  0 является оптимальным
ответом на любую стратегию посетителя. Итак, есть нуле-
вое равновесие (0,НЕТ), если c  p  v .
293
Лекции по теории игр и экономическому моделированию
(г) Предположим, что приезжий посетитель приходит
в бар каждый вечер своей десятидневной командировки, и
что каждый игрок стремится максимизировать суммарный
(без дисконтирования) выигрыш за эти 10 вечеров. Найди-
те все совершенные по подыграм равновесия Нэша (СПРН)
в этой игре. (4 очка)
Нет ничего нового, кроме повторения нулевого од-
ношагового равновесия.
(д) Предположим, что посетитель местный и что иг-
ра повторяется бесконечное число раз. Пусть игроки стре-
мятся к максимизации суммы дисконтированных ежеднев-
ных выигрышей с некоторым коэффициентом дисконтиро-
вания   (0,1) . При каких ценах p существует СПРН, в
котором бармен каждый день выбирает x  1 , а посетитель
соглашается на покупку? (10 очков)
Ясно, что должно быть выполнено условие c  p  v ,
чтобы выигрыши в повторениях обоих участников были
неотрицательными. Покажем, что при некотором   (0,1)
любую цену p из интервала c  p  v можно достроить
до СПРН.
Будем строить равновесие с помощью релейных
стратегий:
x  1 пока посетитель говорит ДА ;
x  0 после первого НЕТ;
посетитель говорит ДА пока чувствует x  1 ;
НЕТ после первого x  1 .
Такая пара релейных стратегий может быть СПРН.
Поскольку (0,НЕТ) является одношаговым равновесием
Нэша, нужно только проверить условие невыгодности от-
клонения. При отклонении до x  0 бармен в одном повто-
рении получит максимальный выигрыш p , но потом будут
нули. Это надо сравнить с получением p  c в каждом по-
вторении:

294
Задачи письменных работ за прошлые годы
pc c
 p , значит, p  c  p (1   )  p  .
1  
Для посетителя сказать НЕТ ничего не даст, кроме
нуля, поэтому условие p  v гарантирует невыгодность
отклоняться посетителю.
Итак, если v  p  c , то найдется такой коэффициент
c
дисконтирования   (0,1) , что v  p  и релейные стра-

тегии образуют СПРН. При p  c нужного СПРН нет, по-
скольку у бармена нулевой выигрыш при повторении
(1,ДА), а при отклонении до x  1 его выигрыш равен
p  c . Естественно считать, что c  0 .
(е) При каких  существуют такие цены, как в пунк-
те (д)? (5 очков)
c c
Если  v , т.е.   , то искомые цены p сущест-
 v
вуют и СПРН строится с помощью релейных стратегий.
Поскольку 0 – это не только выигрыш (для каждого игро-
ка) в пошаговом равновесии Нэша, но и гарантированный
выигрыш (при антагонизме партнера), то невыполнение
pc
условия  p ведет к тому, что нарушаются и условия
1 
c
равновесия Нэша (даже не СП!). Таким образом, при  
v
искомых цен не существует.

Задачи экзамена за 2006 год с решениями


Задача 1. Рассмотрим следующую игру в разверну-
той форме.

295
Лекции по теории игр и экономическому моделированию

(1.1) Постройте нормальную форму этой игры для


игроков 1 и 2 и найдите все равновесия Нэша (РН) в чис-
тых и смешанных стратегиях.
Решение. Есть два РН в чистых стратегиях (L,b) и (R,a).
a b
L 2/3, 2/3 4/3, 4/3
R 4/3, 4/3 2/3, 2/3
Есть еще одно РН в смешанных стратегиях
{(1/2, 1/2), (1/2, 1/2)}.
(1.2) Найдите все совершенные байесовские равнове-
сия (СБР) (в чистых и смешанных стратегиях) и приведите
ответ в следующем формате:
№ СБР стратегия стратегия представления
игрока 1 игрока 2 игрока 2

Решение.
№ СБР стратегия стратегия представления
игрока 1 игрока 2 игрока 2
1 L b (1/3,2/3)
2 R a (1,0)
3 1/2 L+1/2 R 1/2 a+1/2 b (1/2,1/2)
В смешанном СБР 3 игроку 2 на 2-точечном инфор-
мационном множестве должно быть все равно, что выби-
296
Задачи письменных работ за прошлые годы
рать. Это может быть только при представлениях (1/2,1/2).
При какой смешанной стратегии игрока 1 могут возник-
нуть такие представления у игрока 2? Обозначим через
 ( L)  p вероятность выбора L игроком 1. Тогда по усло-
вию согласования представлений и стратегий должно быть
2 1 1
выполнено p    p .
3 3 2
Задача 2. Рассмотрим следующий вариант модели
найма на работу по завершению образования. Есть два ти-
па выпускников L и H. Тип L имеет выраженную в деньгах
функцию психологических затрат на образование
cL (e)  e 2 , а тип H — cH (e)  a  e2 , где e  0 — оценка
уровня образования, а a  (0,1) – оценка повышенных спо-
собностей выпускник типа H. Предполагается, что во вре-
мя работы производительность выпускников типов L и H
будет равна 1  e и 2  e , соответственно. Считается, что
конкуренция между фирмами вынуждает каждую фирму
стремиться предлагать выпускнику при приеме на работу
зарплату w , равную ожидаемому уровню его производи-
тельности.
(2.1) Какой уровень образования выберет тип L в лю-
бом выявляющем равновесии?
Для выпускника типа L в выявляющем равновесии
нужно максимизировать свой выигрыш w  cL (e) , равный
1  e  e 2 . Максимум достигается при e  1/ 2 , при этом
зарплата равна w  1  1/ 2  1.5 , а выигрыш равен
1  0.5  0.52  1.25 .
(2.2) Каков наименьший уровень образования для ти-
па H в выявляющем равновесии?
На плоскости (e, w) через точку (0.5, 1.5) , найденную при
решении (2.1), проходит для типа L кривая безразличия
w  c(e)  1.25  w  e 2  1.25  w  1.25  e 2 . Значит, чтобы
для типа L не было стимула претендовать на зарплату типа H

297
Лекции по теории игр и экономическому моделированию
должно выполняться условие 1.25  e 2  2  e . Минимальный
уровень образования е для типа H в выявляющем равновесии
достигается при равенстве и составляет 1.5.
(2.3) Найдите эффективный уровень образования для типа
H как функцию от a . Под эффективным образованием понима-
ется максимизация производительности минус затраты.
1
Максимум функции 2  e  a  e2 достигается при e  .
2a
(2.4) Рассмотрим эффективное выявляющее равновесие,
при котором уровень образования для обоих типов выпускников
является эффективным. Найдите множество всех значений a ,
при которых такое равновесие существует.
В выявляющем равновесии из решения (2.2) и (2.3)
1
следует неравенство  1.5 . Отсюда для существования
2a
эффективного выявляющего равновесия получаем условие
1
0a .
3
Задача 3. Есть три участника рынка: один продавец и
два потенциальных покупателя неделимого товара. Обще-
известно, что оценки стоимости этого товара для покупа-
телей являются независимыми случайными величинами,
равномерно распределенными на отрезке [0, 1], а затраты
продавца на производство товара будем считать нулевыми.
Правила аукциона на данном рынке таковы. Сначала поку-
патель 1 предлагает продать продавцу товар по цене b  0 ,
скрытой от покупателя 2. Увидев цену b , продавец может
либо согласиться на сделку, либо отказаться от нее и пред-
ложить покупателю 2 купить у него товар по цене p  0 .
Если покупатель 2 соглашается на сделку, то он получает
товар по цене p . Если покупатель 2 отказывается от сдел-
ки, то товар достается покупателю 1 по цене b .
(3.1) Какова вероятность согласия покупателя 2 на
сделку при условии, что он получил от продавца предло-

298
Задачи письменных работ за прошлые годы
жение с ценой p ? Запишите ожидаемый выигрыш продав-
ца в этом случае как функцию от b и p . Запишите пред-
ложение, которое сделает продавец покупателю 2 в равно-
весии, как функцию от предложения b покупателя 1.
Покупатель 2 соглашается на предложение p про-
давца, если оценка стоимости товара для него попадает в
диапазон [ p,1] , что происходит с вероятностью 1  p .
Ожидаемый доход продавца при этом равен p (1  p)  bp .
1 b
Максимум достигается при p  .
2
(3.2) Если покупатель 1 предлагает цену b , то какова
вероятность того, что в равновесии продавец вернется к
сделке с ним? Каков ожидаемый выигрыш покупателя 1
как функция от его оценки стоимости товара v1 и его
предложения b ? Какова равновесная торговая стратегия
покупателя 1?
Если покупатель 1 предлагает цену b , то с учетом
(3.1) продавец (при отказе от сделки с покупателем 1)
1 b
предложит покупателю 2 цену p  , который откажет-
2
1 b
ся от сделки с вероятностью . Значит, ожидаемый вы-
2
(1  b)(v1  b)
игрыш покупателя 1 будет равен . Эта вели-
2
v1  1
чина достигает максимума в точке  0 , поэтому наи-
2
лучшим предложением покупателя 1 будет b  0 при лю-
бом v1 .
(3.3) Вычислите ожидаемый выигрыш продавца в
равновесии.
Если предложение покупателя 1 есть b  0 , то про-
давцу нет смысла на него соглашаться. Он лучше сделает

299
Лекции по теории игр и экономическому моделированию
предложение p  1/ 2 покупателю 2 и получит выигрыш
p (1  p )  bp  1/ 4 .
Задача 4. Рассмотрим следующую торговую игру
между продавцом и покупателем. Сначала продавец произ-
водит товар низкого качества ( q  0 ) или высокого качест-
ва ( q  1 ). Затраты на производство товара низкого качест-
ва считаем равными 0, а затраты на производство товара
высокого качества полагаем равными 1. Потребительная
стоимость высоко качественного товара для покупателя
оценивается величиной v(1)  3 , а товара низкого качества
– величиной v(0)  1 . Покупатель не знает качества произ-
веденного товара, но по правилам торгов он может пред-
ложить один трех вариантов цены покупки p : 0.5, 1.5 или
2.5. Узнав предложенную цену p , продавец может согла-
ситься на сделку или отказаться от нее. Если продавец со-
глашается, то его выигрыш равен p  q , а выигрыш поку-
пателя равен v( q)  p . Если продавец отказывается от
сделки, то его выигрыш равен q , а выигрыш покупателя
равен 0.
(4.1) Изобразите дерево этой игры. (см. далее)
(4.2) Найдите совершенное по подыграм равновесие
Нэша (СПРН). Отметьте равновесные действия продавца и
покупателя во всех вершинах дерева игры. Определите вы-
игрыши игроков в равновесии.
В подыграх, соответствующих предфинальным вер-
шинам дерева, продавцу S всегда выгодно соглашаться.

300
Задачи письменных работ за прошлые годы

Сокращая дерево, получим игру двух лиц с одновре-


менными ходами, которой соответствует следующая нор-
мальная форма.
Покупатель
Сокращенная игра
0.5 1.5 2.5
0 (0.5, 0.5) (1.5, –0.5) (2.5, –1.5)
Продавец
1 (–0.5, 2.5) (0.5, 1.5) (1.5, 0.5)
В ней у обоих игроков есть доминирующая страте-
гия. Эти стратегии образуют единственное РН в этой игре
(сравните с ДЗ). В итоге получается СПРН, в котором про-
давец производит товар низкого качества, получает пред-
ложение продать его по низкой цене 0.5 и соглашается, что
приводит к выигрышам (0.5,0.5).
Предположим теперь, что эта игра повторяется бес-
конечное число раз с одним и тем же продавцом, но раз-
ными потенциальными покупателями в каждом периоде.
Новый покупатель знает качество товара, проданного во
всех предшествующих периодах. Если товар не продан в
данном периоде, то он портится, и продавец должен произ-
вести к следующему периоду новую единицу товара. Ко-
эффициент дисконтирования для выигрышей продавца за
период равен  .
Отметим, что повторение СПРН из (4.2) составляет
СПРН в повторяющейся игре, но оно не идеально для про-
давца. Идеальным для продавца было бы производство вы-

301
Лекции по теории игр и экономическому моделированию
соко качественного товара каждый период при получении
предложения от покупателей цены 2.5.
(4.3) Предположим, что по некоторым причинам по-
купатели всегда предлагают цену 2.5, если продавец нико-
гда в прошлом не продавал товар низкого качества. Найди-
те условия на  , при которых в ответ на такую стратегию
покупателей продавец всегда будет производить товар вы-
сокого качества.
В этих условиях, если продавец всегда производит
товар высокого качества, то он продает его по цене 2.5 ка-
ждый период и получает совокупный дисконтированный
2.5  1
выигрыш от всех периодов, равный . Если он откло-
1
няется и производит товар низкого качества, то в одном
периоде он получает выигрыш 2.5, но потом цена падает до
0.5, как и его выигрыш. Итого, дисконтированный выиг-
0.5
рыш при отклонении равен 2.5  . Получаем условие
1 
невыгодности отклонения для продавца:
2.5  1 0.5 2.5  1 2.5  2 1
 2.5      .
1  1 1  1 2
(4.4) На самом деле покупатели могут предлагать це-
ны, меньшие 2.5, но продавец может взять обязательство
не соглашаться на сделку по цене 0.5 или 1.5. При каких
значениях  продавец в СПРН производит в каждом пе-
риоде товар высокого качества и получает в каждом пе-
риоде от покупателя предложение цены 2.5, причем если
покупатель отклоняется от цены 2.5, то продавец отказы-
вается от сделки по любой меньшей цене?
Пусть покупатель отклоняется от цены 2.5 и предла-
гает 1.5. Если продавец соглашается на сделку по 1.5 в
этом и последующих периодах, то в текущем периоде он
выигрывает 1.5 по сравнению с отказом от сделки, но теря-
ет 1 на понижении цены с 2.5 до 1.5 в каждом следующем

302
Задачи письменных работ за прошлые годы
периоде. Обязательство отказываться от сделки по 1.5 вы-
годно при условии

1.5     0.6 .
1
Для цены 0.5 аналогично получается несущественное до-
полнительное условие
2
0.5   0.5  0.5  2  2.5  0.5    0.2 .
1
Итак, при   0.6 в силу решения пунктов (4.1)-(4.3) стра-
тегия продавца производить в каждом периоде товар высо-
кого качества и соглашаться только на высокую цену 2.5 в
сочетании со стратегиями покупателей предлагать высо-
кую цену 2.5, пока не было продаж товара низкого качест-
ва, образуют СПРН.

Задачи экзамена за 2007 год с решениями


Задача 1. В армии А есть один самолет, с помощью
которого можно атаковать одну из трех целей 1, 2, или 3
армии Д. У армии Д есть только зенитная пушка, которую
она может установить для зашиты одной из трех целей.
Армия А может уничтожить при атаке только незащищен-
ную цель. Для армии А выигрыш от уничтожения цели k
равен k . Аналогично, выигрыш армии Д от успешной за-
щиты цели k равен k . При атаке на защищенную цель
выигрыш армии А равен нулю. При атаке на незащищен-
ную цель выигрыш армии Д равен нулю.
a) Приведите нормальную форму этой игры в мат-
ричном виде.
А\Д Д1 Д2 Д3
А1 0,1 1,0 1,0
А2 2,0 0,2 2,0
А3 3,0 3,0 0,3

303
Лекции по теории игр и экономическому моделированию
б) Проведите последовательное исключение строго
доминируемых стратегий, используя смешанные страте-
гии.
Для армии А равновероятная атака на 2 и 3 домини-
рует атаку на 1, но не строго, если Д защищает 3. Это легко
поправить, взяв (3/5)А2+(2/5)А3. После исключения А1,
получим, что Д1 строго доминируется стратегией
(1/2)Д1+(1/2)Д2. В оставшейся 2х2 матрице ничего страте-
гии не сравнимы по доминированию.
в) Найдите все равновесия Нэша (РН) (в чистых и
смешанных стратегиях) в этой игре.
В чистых стратегиях РН нет. В смешанных стратеги-
ях единственное РН легко ищется по найденной в б) мат-
рице 22: ((3/5)А2+(2/5)А3 , (2/5)Д2+(3/5)Д3 ).
Задача 2. Рассмотрим следующую игру G в нор-
мальной форме при 2  x  3 .
C1 C2 C3 C4
R1 4, 4 0, 0 0, 0 x, x
R2 0, 0 –3, –3 0, 0 0, 0
R3 0, 0 0, 0 2, 2 0, 0
R4 x, x 0, 0 0, 0 1, 1
В этой задаче ограничимся чистыми стратегиями.
а) Найдите совершенное по подыграм равновесие
Нэша (СПРН) в игре G (3) (трехкратном повторении ис-
ходной игры G ) , в котором в первом периоде игроки иг-
рают ( R2 , C2 ) .
В исходной игре есть два РН в чистых стратегиях: ( R1, C1 )
и ( R3 , C3 ) . Построим искомое СПРН в G (3) так: в периоде 1 оба
играют ( R2 , C2 ) , а затем, если никто не отклонился, то играем в
периодах 2 и 3 стратегии ( R1, C1 ) , а если отклонился, то
( R3 , C3 ) . В периоде 2 отклоняться нет смысла, поскольку идет

304
Задачи письменных работ за прошлые годы
повторение РН. В периоде 1 отклоняться не выгодно, поскольку –
3 + 4 + 4 = 5 > 0 + 2 + 2 = 4.
б) Пусть игра G повторяется бесконечное число раз.
Можно ли на основе Народной теоремы с помощью релей-
ных стратегий построить в игре G (,  ) СПРН с выигры-
шами (1,1) при некоторых условиях на коэффициент дис-
контирования  , 0    1 ?
В условиях Народной теоремы требуется, чтобы вы-
игрыш каждого игрока в G (,  ) был больше, чем в неко-
тором РН. Но у нас только два РН с выигрышами (4, 4) и
(2, 2), поэтому использовать релейные стратегии для по-
строения РН не получится: не будет выполнено условие
отклонения.
в) Сконструируйте (на основе двухфазовых страте-
гий) в игре G (,  ) СПРН с выигрышами (1, 1) при неко-
торых допустимых параметрах 0    1 и 2  x  3 . Опи-
шите все множество допустимых параметров x и  , при
котором сохраняется данное СПРН.
Возьмем две фазы: сотрудничество С= ( R4 , C4 ) и на-
казание Н= ( R2 , C2 ) . СПРН начинается с сотрудничества,
которое продолжается, пока кто-то от него не отклонится.
При отклонении наступает фаза наказания. Фаза наказания
продолжается, пока в ответ не будет наказания. Тогда Н
меняется в следующем периоде на С.
Проверим устойчивость к отклонениям. Если повто-
ряется С, то каждый (до нормировки выигрышей) получает
1
1  1    1   2  ...  . Если отклониться и потом не воз-
1 
вращаться в С через Н, то получим x  0    0   2  ... . Ус-
ловия невыгодности отклонения получатся в виде
1
x . Если после отклонения вернуться к С через Н, то
1
получим выигрыш x  ( 3)    1   2  1   3 ... Условия не-
выгодности отклонения примут вид
305
Лекции по теории игр и экономическому моделированию
x  ( 3)    1  1    x  1  4 . Если рассмотреть подыг-
ру, начинающуюся с фазы Н, то при отклонении игрок по-
лучает 0 вместо -3 сейчас и 1 в оставшиеся периоды. Усло-
вия невыгодности отклонения:
 3
0  ( 3)  1    1   2  ...    .
1 4
1
Заметим, что первое условие отклонения x 
1
является следствием двух других, а условие x  1  4 при
3
2  x  3 выполняется автоматически, если   , поэтому
4
все множество параметров, при которых данная конструк-
3
ция дает СПРН описывается неравенствами   1.
4
Задача 3. Два участника аукциона конкурируют за
покупку некоторого объекта. Ценности объекта v1 и v2
для участников являются независимыми случайными ве-
личинами, равномерно распределенными на отрезке [0,1].
Участник i имеет точною информацию своем значении vi ,
но не знает v j . Участники делают ставки из диапазона
[0,1] одновременно и независимо друг от друга. В данном
аукционе побеждает тот, кто поставил большую ставку.
При равенстве ставок бросается жребий. Каждый обязан
заплатить по средней ставке даже, если ему объект не
достается! (Отказаться от участия в этом аукционе нель-
зя.)
a) Выпишите функции выигрыша в данной игре.

306
Задачи письменных работ за прошлые годы
 bi  b j 
 vi  , bi  b j 
 2 
 vi bi bj
 
ui (vi , bi , b j )    , bi  b j 
2 2 
 bi  b j 
  , bi  b j 
 2 
б) Найдите симметричное равновесие Байеса–Нэша
(РБН) в данной игре в классе квадратичных стратегий:
bi (vi )  c  vi2  a , где c  0, a  0 .
Найдем ожидаемый выигрыш i при заданной стра-
тегии b j (v j )  c  v 2j  a игрока j с учетом того, что веро-
ятность совпадения ставок при такой стратегии равна ну-
лю. Ясно, что при ставке bi  a игрок i всегда проигрыва-
ет, а поскольку платить надо и проигравшему, то лучше уж
делать нулевую ставку. При bi  a победа на аукционе
игрока i определяется условием
bi  a
bi  b j (v j )  c  v 2j  a  v j  .
c
Тогда
1
Ev j (ui (vi , bi , b j (v j ))   ui (vi , bi , b j (v j )) d v j 
0
(b  a ) / c 1 bi  b j (v j )
i vi d v j   ( )dvj 
0 0 2
bi  a bi
 vi   const .
c 2
Здесь под const понимается слагаемое, которое не зависит
от vi и bi .
Теперь при фиксированном vi нужно найти макси-
мум ожидаемого выигрыша по bi . Из условий 1-го порядка
307
Лекции по теории игр и экономическому моделированию
vi 1 1
получаем   bi  vi2  a . Итак, наилучший
2 c bi  a 2 c
ответ на квадратичную стратегию так же является квадра-
тичным, поэтому РБН в этом классе искать можно. Понят-
но, что при vi  0 наилучшей ставкой является bi  0 , по-
этому в РБН должно быть a  0 , а в симметричном равно-
1
весии c   c  1 . В итоге получаем единственное квад-
c
ратичное равновесие bi (vi )  vi2 , i  1, 2 .
в) Покажите, что в этой игре нет других РБН с глад-
кими возрастающими b(vi ) .
Обозначим b j 1 (bi ) решение уравнения b j (v j )  bi .
Тогда для ожидаемого выигрыша получим выражение
1
Ev j (ui (vi , bi , b j (v j ))   ui (vi , bi , b j (v j )) d v j 
0

b j 1 (bi ) 1  bi  b j (v j ) 
 vi d v j     dvj 
0 0 2
 
b
 vi bj 1 (bi )  i  const.
2
vi 1
Из условий 1-го порядка получаем  . Для
bj (vi ) 2
симметричного РБН получаем дифференциальное уравне-
ние bi(vi )  2vi  bi (vi )  vi2  a , т.е. опять приходим квад-
ратичным стратегиям, а других гладких возрастающих
РБН нет.
Задача 4. Рассмотрим следующую сигнальную игру.
а) Найдите все выявляющие совершенные байесов-
ские равновесия (СБР).

308
Задачи письменных работ за прошлые годы

Потенциально есть два выявляющих равновесия со


стратегиями LR или RL игрока 1. Попробуем достроить LR
до СБР. На LR игрок 2 ответит DU. Отклонения игрока 1
не улучшают его выигрыша ни для одного из двух типов.
RL достраивается до СБР выбором DD за игрока 2 и
проверкой невыгодности отклонений для игрока 1.
Итого, есть два выявляющих СБР. Представления на ин-
формационных множествах задаются автоматически.
б) Найдите все скрывающие СБР.
Попробуем построить LL СБР. D является в этом
случае наилучшим ответом игрока 2, не зависимо от его
представлений, при этом выигрыш игрока 1 будет равен 3
в обоих случаях. Легко проверить, что при любом выборе
U или D справа для одного из типов игрока 1 при отклоне-
нии выигрыш будет больше 3. То же справедливо и для
смешанной стратегии, составленной из выбора U и D. Зна-
чит, такого СБР нет.
Попробуем построить RR СБР.
u2 ( D)  0.8  2  0.2  0  1.6  u2 (U )  0.8  0  0.2  1  0.2 ,
поэтому справа игрок 2 сыграет D. Но слева игроку 2 все-
гда выгодно играть D, поэтому типу t B игрока 1 выгодно
отклониться, чтобы получить 3 вместо 1.
Итак, скрывающих СБР в этой игре нет.
в) Найдите СБР в смешанных стратегиях, в котором
игрок 1 хотя бы одного типа выбирает L и R с положитель-
ной вероятностью.
309
Лекции по теории игр и экономическому моделированию
Поскольку на сигнал L игрок 2 всегда выбирает D,
что дает игроку 1 выигрыш 3, то в смешанном СБР ожи-
даемый выигрыш при выборе R должен быть таким же.
Более того, чтобы игрок 2 выбрал смешанную стратегию
необходимо, чтобы ожидаемый выигрыш для него от вы-
бора U и D справа должен быть одинаковым:
1
0  q  1  (1  q )  2  q  0  (1  q)  q  .
3
Игрок 1 типа t A будет применять смешанную страте-
гию, если выигрыши при выборе R и L совпадут, что воз-
1 2
можно только при выборе U  D в ответ на R. Но тогда
3 3
типу t B следует играть R.
Если тип t A играет смешанную стратегию
 R  (1   ) L , то согласование представлений и стратегий
по правилу Байеса дает связь
0.8 1 1
   .
0.8  0.2 3 8
Итак, получили СБР
1 7 1 2 1
 R  L, R, D, U  D, p  1, q   .
8 8 3 3 3

Задача 5. У предпринимателя есть рисковый проект,


для реализации которого нужно вложить 100,000. В случае
успеха проект принесет доход 300,000, а в случае неудачи
— 0. Оба варианта считаются равновероятными. Предпри-
ниматель может быть либо богатым с состоянием 1,000,000
или бедным с состоянием 0. В любом случае (в силу неко-
торых причин) он не может инвестировать свои деньги в
этот проект, но может взять кредит у банка. Банк готов
дать кредит под рисковый проект, но под специально на-
значенную им процентную ставку  . Заняв 100,000, пред-
приниматель по завершению проекта должен вернуть бан-

310
Задачи письменных работ за прошлые годы
ку 100000  (1   ) , если у него есть столько денег. В про-
тивном случае он отдает все, что у него есть.

Порядок ходов
1. Банк назначает ставку  .
2. Предприниматель решает, брать ли кредит. Если он
берет 100,000, то вкладывает деньги в проект.
3. По завершению проекта становится известным,
привел ли он к успеху и происходит расплата бан-
ком.
а) Найдите СПРН для случая полной информации о
состоянии предпринимателя.
Богатый предприниматель всегда возвращает кредит,
а его ожидаемая прибыль от проекта равна
1
0.5  300000  (1   )  100000  0 при   ,
2
поэтому для богатого предпринимателя банк может назна-
1
чить   .
2
Бедный предприниматель может вернуть деньги
только в случае успеха проекта. Его ожидаемый выигрыш
равен 0.5  (300000  (1   )  100000)  0 при   2 , поэтому
для бедного предпринимателя банк назначит   2 .
б) Пусть размер состояния предпринимателя — это
его приватная информация. Банк не знает точно размера
состояния предпринимателя. Вероятность обращения в
банк за рисковым кредитом богатого предпринимателя
оценивается величиной ¼ . Найдите СБР.

Богач будет брать кредит до ставки 0.5, а бедняк —


до ставки 2.
1
Если   , то выигрыш банка U ( ) будет равен
2

311
Лекции по теории игр и экономическому моделированию
1 3 1 1
 100000  (1   )   (  100000  (1   )   0)  100000 
4 4 2 2
5 5 3
  100000  (1   )  100000   100000  100000 
8 8 2
1
  100000  0.
16
1
При    2 выигрыш банка U ( ) составляет
2
3 1 1 3
 (  100000  (1   )   0)  100000  (  1)100000
4 2 2 8
Максимум достигается при   2 . В итоге получаем
не эффективное СБР: банк назначает ставку 2, от которой
богатый предприниматель отказывается, а бедный согла-
шается, при этом ожидаемый выигрыш банка составляет
37500, что по доходности меньше 50%, а вовсе не утроение
капитала... Это пример «плохого отбора» в играх с приват-
ной информацией: банку хочется работать с богатым, а
приходится с бедным.

Задачи экзамена за 2008 год с решениями.


Задача 1. Потребителю нужна одна единица некото-
рого товара. В тендере участвуют n фирм, которые могут
поставить этот товар. Затраты на производство товара для
фирмы i равны ci , причем эта величина известна точно
только фирме i . Общедоступная информация о затратах
состоит в том, что величины ci являются независимыми
случайными величинами, равномерно распределенными на
отрезке [0, 1]. Одновременно и независимо друг от друга
каждая фирма i назначает цену pi , а потребитель покупа-
ет товар у той фирмы, которая назначила минимальную
цену. (Если таких фирм несколько, то победитель опреде-
ляется среди фирм, назвавших минимальную цену равно-

312
Задачи письменных работ за прошлые годы
вероятно по жребию.) Выигрыш победителя равен pi  ci ,
а выигрыш остальных равен 0.
а) Опишите эту ситуацию как байесовскую игру.
Действия каждой фирмы i — это назначение цены,
поэтому Ai  [0, ) . Тип игрока — это его затраты, поэто-
му Ti  [0,1] . Ожидания о типах остальных не зависят в
данном случае от знания своего типа. Стратегия фирмы i
есть функция pi (ci ) . Функции выигрыша определяются
очевидным образом. Потребитель в игре не участвует.
b) Найдите в этой игре симметричное линейное рав-
новесие Байеса–Нэша (РБН). Что будет при n   ? Дайте
краткую интерпретацию.
Пусть pi (ci )  aci  b для всех фирм i . Фиксируем
одну фирму i , ее затраты (тип) ci и линейные стратегии
остальных p j (c j )  ac j  b . Найдем оптимальный ответ
фирмы i в виде назначения цены pi . Для этого запишем
ожидаемый выигрыш фирмы i . Ясно, что вероятность на-
значения другими фирмами цены pi равна 0. Выигрыш в
тендере фирмы i определяется условиями pi  ac j  b при
всех ji. Вероятность такого события равна
n 1
 pi  b  pi  b
1   , если только 0   1 . При выполнении
 a  a
последнего условия ожидаемый выигрыш фирмы i будет
n 1
 p b
равен ( pi  ci ) 1  i  . Выпишем условие оптималь-
 a 
ности 1-го порядка:
n 1 n2
 pi  b  n 1  p b 
1    ( pi  ci )  1  i  0,
 a  a  a 

313
Лекции по теории игр и экономическому моделированию
 p  b  n 1
или  1  i  ( pi  ci )  0 ,
 a  a
a  b n 1 
или pi   1   ci  .
n a a 
В итоге получили линейную по затратам стратегию.
Для поиска параметров a и b , соответствующих симмет-
ричному линейному РБН, осталось приравнять коэффици-
ab a 1
енты: a  ( n  1) / n , b  b  . При n  
n n 1 n
получаем a  1 , а b  0 , т.е. пределе получаем искренние
стратегии pi  ci , которые образуют РБН.
c) Найдите все симметричные РБН со строго возрас-
тающими и дифференцируемыми стратегиями.
Будем теперь искать симметричное РБН в виде
pi (ci )  f (ci ) строго возрастающей гладкой функции.
Условия победы в тендере теперь примут вид:
pi (ci )  f (c j ) или c j  f 1 ( pi ) при всех j  i . Вероят-
ность такого события равна (1  f 1 ( pi )) n1 , если только
0  f 1 ( pi )  1 . При выполнении последнего условия ожи-
даемый выигрыш фирмы i будет равен
( pi  ci )(1  f 1 ( pi )) n1 . Выпишем условие оптимальности
1-го порядка:
(1  f 1 ( pi )) n1 
 ( f 1 ( pi ))
 ( n  1)( pi  ci )(1  f 1 ( pi ))n 2  0.
pi
Вспомним, что должно быть при этом выполнено
pi  f (ci ) , или f 1 ( pi )  ci , и что
1 1
( f ( pi ))   ( f (ci )) 
  .
pi  ci 
314
Задачи письменных работ за прошлые годы
В итоге получаем
1
n 1   ( f (ci ))  n2
(1  ci )    (n  1)( f (ci )  ci )(1  ci )  0 , или
 ci 
 ( f (ci ))
(1  ci ) n 1  (n  1)( f (ci )  ci )(1  ci ) n  2  0 , или
ci

((1  ci ) n 1 f (ci ))   (n  1)ci (1  ci ) n  2 .
ci
Интегрируя правую часть, получаем
n 1
(1  ci )n 1 f (ci )  (1  ci )n 1  (1  ci )n  const .
n
Константа должна быть равна 0, поскольку при ci  1 все
обращается в 0. Итак,
n 1 n 1 1
f (ci )  1  (1  ci )  ci  .
n n n
Получили опять то же линейное РБН. Других
симметричных возрастающих гладких СБР нет.
Задача 2. Найдите совершенное байесовское равно-
весие (СБР) в приведенной далее игре.
В этой игре есть только две подыгры, соответствую-
щих ходам игрока 1 в предфинальных вершинах. Выберем
в них ходы x и w , соответственно. Теперь ясно, что после
хода природы A игрок 1 сделает ход L1, поскольку это
обеспечивает игроку 1 выигрыш, равный 3, а ход R1 — не
более 2, т.е. после A имеем: L1 строго доминирует R1. Те-
перь ясно, что представление на 3-элементном информаци-
онном множестве игрока 2 должно приписывать нулевую
вероятность левой позиции. Заметим еще, что после хода
природы C для игрока 1 ход R3 дает выигрыш всегда
больший, чем ход L3.
Осталось перебрать две стратегии игрока 1: L1L2R3
и L1R2R3.
315
Лекции по теории игр и экономическому моделированию

[p] [1-p]

[q] [1-q]

1
L1L2R3. Ясно, что p  , q  0 . Тогда при ходе a
2
игрок 2 получает 1 гарантировано, а при ходе b – в сред-
нем. Значит, оба хода последовательно рациональны. Оп-
тимален также ход r . Но тогда после хода природы B иг-
року 1 выгодно играть R2, следовательно, с L1L2R3 СБР
не построишь.
1
L1R2R3. Теперь p  1, q  . Оптимальными являет-
2
ся ходы a и r. Отклоняться от R2 или R3 игроку 1 при этом
не выгодно. Итак, получили единственное СБР в этой игре.
Задача 3. Трое сенаторов по имени Анна, Борис и
Василий участвуют в работе комитета, определяющего
ставку налога   [0,1] . Анна — борец за свободу: ее выиг-
рыш от принятия ставки налога  в день t равен
 t (1   2 ) . Борис — умеренный: его выигрыш от принятия
ставки налога  в день t равен  t (1  (  T )2 ), 0  T  1 .
Василий — либерал: его выигрыш от принятия ставки на-
лога  в день t равен  t (1  (1   ) 2 ) . Каждый день один из

316
Задачи письменных работ за прошлые годы
них (равновероятно) получает право выдвинуть предложе-
ние. Предлагающий выдвигает ставку  , а двое остальных
голосуют Да или Нет в алфавитном порядке имен. Если
хотя бы один из голосующих скажет Да, то игра кончается
со ставкой налога  . Если оба говорят Нет, то игра про-
должается на следующий день.
a) Найдите совершенное по подыграм равновесие
Нэша (СПРН) в этой игре.
Подсказка. Существует СПРН со значениями  A  T   B
такое, что Анна всегда предлагает  A , Борис всегда пред-
лагает T , а Василий всегда предлагает  B .
Будем искать СПРН в том виде, какой предложен в
подсказке. Идеальные ставки таковы: для Анны – 0, для
Бориса — T , а для Василия — 1. Поэтому Анне нужен го-
лос умеренного Бориса: если он проголосует против, то
более либеральный Василий — тем более. Собственно, по
условию игры Анна не нуждается в голосе Василия, по-
этому ей надо найти минимальную ставку налога, на кото-
рую согласится Борис. При такой ставке Борису будет все
равно, что сказать: Да или Нет. Рассуждая аналогично за
Василия, можем прийти к аналогичному выводу: ему надо
найти такую ставку, чтобы Борису было все равно, как го-
лосовать. Пусть VБ — ожидаемый выигрыш Бориса в
СПРН, т.е. на начало дня до того, как стало известно, кто
делает предложение. Сказав Нет, на выдвинутое предло-
жение, Борис перейдет в подыгру следующего дня, которая
совпадает с исходной игрой, а потому его ожидаемый вы-
игрыш от голосования против равен  VБ . Из описанных
выше условий безразличия Анна и Василий должны пред-
ложить ему столько же. Если Борис сделает предложение
 Б и получит одобрение одного из сенаторов комитета, то
оно будет принято, поскольку он не может быть невыгодно
сразу Анне и Василию, представляющим крайности. Итак,
если право сделать предложение выпадает Борису, то он

317
Лекции по теории игр и экономическому моделированию
может смело выдвигать T и получать выигрыш 1. Отсюда
получаем уравнение обратной индукции
2 1 1
VБ   VБ   1  VБ 
3 3 3  2
Из условий безразличия для Бориса при голосовании за
предложения Анны и Василия получаем

1  ( A  T )2  1  ( B  T ) 2  , или
3  2
3(1   )
( A  T ) 2  ( B  T ) 2  , значит
3  2
3(1   ) 3(1   )
A T  , B  T  .
3  2 3  2
Чтобы завершить построение, нам нужно определить
условия, когда соглашается каждый сенатор. Ясно, что Бо-
рис соглашается на любое предложение   [ A , B ] , по-
скольку внутренность этого отрезка для него лучше, чем
края, на которые он согласен по построению. Из условия
СПРН ожидаемый выигрыш Анны на начало периода дол-
1
жен быть равен VA  1 
3
 2
A  T 2   B2  , поэтому она со-

гласится на любое предложение   TA , где 1 TA2   VA ,


т.е. TA – это максимальная из приемлемых для нее в СПРН
 2
ставок. Значит, TA  1    ( A  T 2   B2 ).
3
Рассуждая аналогично, получаем что Василий со-
глашается на предложение   TB , где

TB  1    ((1   A )2  (1  T ) 2  (1   B )2 ).
3
b) Что случится при ? Дайте короткую интерпретацию.

318
Задачи письменных работ за прошлые годы
При   1 получаем  A  T ,  B  T , TA  T ,
TB  T . Это означает фактический диктат умеренного Бо-
риса.
Заметим, что при   1 получаем  A  T  1,
 B  T  1 , чего не может быть при 0  T  1 , поскольку
предложения должны быть от 0 до 1. Следовательно, при-
веденное в пункте a) решение имеет смысл только для дос-
таточно больших коэффициентов дисконтирования  .
Задача 4. В игре «суперприз» участвуют Банкир и
Конкурсант. Есть три одинаковых чемодана с номерами 0,
1 и 2. В одном из чемоданов с равной вероятностью (1/3)
находится 1 миллион долларов, а в других нет ничего. Че-
модан 0 принадлежит Конкурсанту. Банкир предлагает ку-
пить содержимое чемодана 0 по цене p0 . Если Конкурсант
соглашается на такую цену, то игра кончается заключени-
ем сделки, при которой Банкир получает содержимое че-
модана 0, заплатив Конкурсанту цену p0 . Если Конкур-
сант отказывается от предлагаемой ему сделки, то публич-
но перед обоими игроками открывается чемодан 1. После
этого Банкир снова предлагает купить содержимое чемо-
дана 0 по цене p1 . Если Конкурсант соглашается, то игра
кончается заключением сделки, при которой Банкир полу-
чает содержимое чемодана 0, заплатив Конкурсанту цену
p1 . Если Конкурсант отказывается от сделки и на этот раз,
то публично открывается чемодан 2, а Конкурсант стано-
вится владельцем содержимого чемодана 0. Будем считать,
что выигрыш от владения x миллионов долларов для Бан-
1
кира равен x , а для Конкурсанта равен x 
, где   1 (раз-
мерность — миллионы долларов).
a) В предположении, что  общеизвестно, найдите
СПРН, используя обратную индукцию.
Начинаем обратную индукцию после отказа Конкур-
санта на первое предложение. Если приз в чемодане 1, то в
319
Лекции по теории игр и экономическому моделированию
периоде 1 это станет известно. Когда ясно, в чемодане 0
приза нет, Конкурсант будет соглашаться на любую цену,
но Банкир будет предлагать 0. Если в чемодане 1 приза
нет, то чемодан 0 содержит миллион с вероятностью ½,
поскольку осталось два неоткрытых чемодана. Значит,
ожидаемый доход Конкурсанта при отказе от p1 равен ½.
1
 1
Следовательно, он будет соглашаться при условии p1  ,
2
1 1
или p1  
. Значит, Банкир предложит p1 
. По-
2 2
скольку   1 , то ожидаемая стоимость выигрыша для
1 1
Банкира равна  
 0 , поэтому Банкир готов сделать
2 2
такое предложение.
Рассмотрим теперь период 0. Если предложение p0
будет отвергнуто, то с вероятностью 1/3 приз окажется в
чемодане 1 и оба получат по 0, но с вероятностью 2/3 в че-
модане 1 нет приза, и тогда ожидаемый выигры Банкира
1 1 1
будет равен  
, а у Конкурсанта – p1  . Итого, ум-
2 2 2
1 1 1
ножая на 2/3, получаем  
и . Следовательно,
3 3 2 3
1
 1
Конкурсант согласится на p0 при условии p0  , или
3
1
p0  
. Отсюда ясно, что в СПРН Банкир предлагает
3
1
p0  
, а конкурсант соглашается.
3
b) Пусть теперь Банкир не знает  , т.е.  является
приватным параметром Конкурсанта, а Банкир знает толь-
ко, что  — случайная величина, причем выполняется

320
Задачи письменных работ за прошлые годы
1
следующее условие: Pr( 
 x )  2 x для любого x  1 2 .
2
Рассмотрим пороговую стратегию конкурсанта  0 ( p0 ) ,
1 ( p1 ) : соглашаться на цену p0 в первом раунде, если
   0 ( p0 ) , и соглашаться на цену p1 во втором раунде,
если   1 ( p1 ) . Найдите необходимые и достаточные ус-
ловия на функции  0 ( p0 ) , 1 ( p1 ) , при которых описанная
пороговая стратегия Конкурсанта соответствует СБР.
Подсказка. Некоторые из следующих формул могут ока-
заться полезными: при любых x  y выполнено
1 1 2( x  y )
Pr(   x |   y )  ;
2 2 1 2y
a 1
1
при любых   1 выполнено Pr(  a )  1    ;
2
при любых a  b  1 выполнено
1 1
b 1
 a1
Pr(  b |   a)  2 2 .
1
1  a 1
2
Как и ранее, если приз в чемодане 1, то в периоде 1
это станет известно, поэтому в чемодане 0 нет ничего, а
значит, Конкурсант будет соглашаться на любую цену, но
Банкир будет предлагать 0.
Если в чемодане 1 ничего не окажется, чемодан 0 со-
держит миллион с вероятностью ½. Ожидаемый доход
Конкурсанта при отказе от p1 равен ½. Значит, он будет
1

1 1
соглашаться при условии p 
1 , или p1   , или
2 2
  1 ( p1 )   log 2 p1 . Итак, функцию 1 ( p1 ) из условий
СБР мы нашли.

321
Лекции по теории игр и экономическому моделированию
Теперь нам нужно функцию  0 ( p0 ) и цену p1 ( p0 ) ,
которая будет предлагаться в СБР. Если p0 отвергнуто, то
1 1
Банкир знает, что    0 ( p0 ) , или 
  0 ( p0 ) . Обозна-
2 2
1
чим y   0 ( p0 )
. Ожидаемый доход Банкира от предложе-
2
ния p1 , после того, как p0 было отвергнуто, равен
1 1 1
U B ( p1 )  Pr( 
 p1 | 
 y )(  p1 ) 
2 2 2
2( p1  y ) 1
 (  p1 ) ,
1 2y 2

а максимум по p1 этой квадратичной по p1 достигается


1 y 1 1
при p1 ( p0 )     0 ( p0 )1
.
4 2 4 2
При заданном p0 Конкурсанты с типом    0 ( p0 )
предпочитают сделку по цене p0 сейчас, чем ждать
p1 ( p0 ) следующего периода. Конкурсанты с типом
  (1 ( p1 ( p0 )),  0 ( p0 )) откажутся от p0 , но согласятся с
p1 ( p0 ) в следующем раунде. Для типа  0 ( p0 ) должно
быть все равно, согласиться или ждать до следующего ра-
унда:
1 1
0 ( p0 ) 2
p0  ( p1 ( p0 )) 0 ( p0 ) .
3
Если подставить найденное выражение для p1 ( p0 ) ,
то получим искомое уравнение для определения  0 ( p0 ) :
 0 ( p0 ) 0 ( p0 ) 0 ( p0 )
2 1 1  1 2 1 1
p0      0 ( p0 )1         .
3 4 2  4 3 2 3
322
Задачи письменных работ за прошлые годы
 
1 2 1 1
Функция      при   1 убывает от ¾
4 3 2  3
до 0. Значит, это уравнение определяет функцию  0 ( p0 )
при p0  [0, 3 / 4] .
Определенную таким образом функцию  0 ( p0 )
следует использовать для нахождения начальной цены p0
из условий максимизации ожидаемого выигрыша Банкира.
Чтобы записать зависимость U B ( p0 ) по-честному
нужно учесть, что типы    0 ( p0 ) соглашаются на p0 (и
какова вероятность этого события), умножить эту вероят-
1 
ность на   p0  . Затем посчитать вероятность
3 
  (1 ( p1 ( p0 )),  0 ( p0 )) для типов, которые соглашаются
1 
во втором периоде, и умножить ее на   p0  . Потом
2 
нужно максимизировать сумму из этих двух слагаемых по
p0 Ясно, что сделать это можно только численно.
Попробуйте.
Ожидания игроков в этом гибридном СБР
определяются естественным образом.

Задачи экзамена за 2009 год с решениями


Задача 1. Государственные субсидии инноваций.
Есть две страны i  1, 2 и в каждой по одной фирме, кото-
рые производят на экспорт для продажи на мировом рынке
однородный продукт. Цена спроса на этот продукт на ми-
ровом рынке определяется по формуле p (Q )  a  Q , где
Q  q1  q2 — суммарный выпуск продукта в странах 1 и
2. Затраты в стране i на выпуск qi до инноваций равны

323
Лекции по теории игр и экономическому моделированию
4
a  c  a . Обозначим государ-
C (qi )  c  qi , причем 0 
9
ственные субсидии на инновации в стране i через xi . Эти
субсидии приводят к новой функции затрат:
Ci (qi , xi )  (c  xi )qi . Затраты государства на субсидии
1 2
равны TCi ( xi )  xi .
2
События развиваются последовательно в два этапа.
(1) Государства одновременно и независимо выби-
рают уровни субсидий xi  0 .
(2) Зная уровни субсидий обоих государств, фирмы
одновременно и независимо выбирают уровни выпуска
qi  0 .
Выигрыш фирмы равен
 i (q1 , q2 , x1 , x2 )  p(Q)qi  Ci (qi , xi ) .
Выигрыш государства равен
Wi (q1 , q2 , x1 , x2 )   i (q1 , q2 , x1 , x2 )  TC ( xi )
.
(а) При заданных уровнях субсидий ( x1 , x2 ) найдите
равновесие Нэша (РН) для фирм на этапе 2, а также выиг-
рыши фирм и государств в этом РН.
 i ( q1 , q2 , x1 , x2 )  ( a  qi  q j ) qi  (c  xi ) qi
 (a  c  xi  q j  qi )qi ,
поэтому наилучший ответ из условий первого порядка дос-
a  c  xi  q j
тигается в точке Ri (q j )  , если только эта
2
величина неотрицательна. Иначе наилучший ответ соот-
ветствует нулевому выпуску. Решая систему уравнений

324
Задачи письменных работ за прошлые годы
для РН qi0  R(q 0j ), i  1, 2, j  3  i , получаем РН в по-
дыгре при субсидиях ( x1 , x2 ) :
a  c  2 xi  x j
qi ( x1 , x2 )  , i  1,2, j  3  i .
3
Выигрыши в этом РН равны
2
 a  c  2 xi  x j 
 i ( x1 , x2 )    , i  1,2, j  3  i,
 3 
2
 a  c  2 xi  x j  xi2
Wi ( x1 , x2 )     , i  1,2, j  3  i.
 3  2

(б) Найдите совершенное по подыграм равновесие


Нэша в соответствующей динамической игре государств и
фирм.
4 1
Поскольку  , то максимум Wi ( x1 , x2 ) по xi  0
9 2
можно найти из условий первого порядка:
Bi ( x j )  4(a  c  x j ) .
Решая систему уравнений xi0  B ( x 0j ), i  1, 2,
4( a  c )
j  3  i для СПРН находим субсидии xi0  , i  1, 2 .
5
3(a  c)
При таких субсидиях выпуски равны qi0  , i  1,2 ,
5
6( a  c )
Q0  . Цена при этом будет неотрицательна только
5
2
при условии 6c  a . Выигрыши равны  i   3( a  c ) / 5 и
2
Wi   ( a  c ) / 5  .
Нужно еще проверить случаи несимметричного
СПРН, когда одна из стран устанавливает госмонополию,

325
Лекции по теории игр и экономическому моделированию
вытесняя с рынка другую страну. Ясно, что при госмоно-
поли одной страны i и субсидиях xi оптимальный выпуск
равен qi  ( a  c  xi ) / 2 , а выигрыш фирмы и государства
равены  i  (a  c  xi )2 / 4 и Wi  (a  c  xi ) 2 / 4  x 2 / 2 .
Отсюда оптимальные субсидии при госмонополии равны
xi  a  c , откуда qi  a  c . При таком выпуске цена равна
затратам: p  c , что обеспечивает вытеснение страны j .
Формально, B j ( a  c)  0, q j (0, a  c)  0.
Заметим, что при госмонополии одной строны цены
минимальны, что хорошо для потребителя обеих стран.
Выигрыш фирмы и государства монополиста равны
 i  (a  c )2 и Wi  (a  c) 2 / 2 . Ясно, что СПРН с госмоно-
полией выгоднее монополисту, чем симметричное СПРН,
поэтому между странами может развернуться жесткая
борьба за захват рынка.
Задача 2. Синергетические отношения. Усилия
ei  0 каждого двух индивидов i  1, 2 в рамках некоторо-
го совместного дела влияют на выигрыши друг друга:
ui (ei , e j )  ei (ei  e j )  e j , где j  3  i .

(а) Найдите РН в этой игре и выигрыши игроков в нем.


Смысл функции выигрыша: два лентяя в одном про-
екте. Каждому приятно видеть, как работает другой, а если
уж придется поработать самому, то желательно получить
удовольствие, что другой работает больше на каждую еди-
ницу своих усилий.
Легко понять, что наилучший ответ есть половина
усилий другого, поэтому единственное РН соответствует
нулевым усилиям. Естественное равновесие для двух лен-
тяев.
(б) Рассмотрим теперь соответствующую бесконечно
повторяющуюся игру G (,  ) с коэффициентом дискон-
тирования 0    1 . Обозначим через e0 индивидуальные
326
Задачи письменных работ за прошлые годы
усилия в РН статической игры (из пункта (а)). Рассмотрим
следующую релейную стратегию, зависящую от выбранно-
го уровня усилий k : прикладывать усилие k в первом по-
вторении и потом, пока во всех предыдущих повторениях
другой индивид также прикладывает усилие k , а иначе
переходить на усилия e0 . При каких  в зависимости от
k профиль таких релейных стратегий образует СПРН в
бесконечно повторяющейся игре G (,  ) ?
Если оба прикладывают усилия k , то выигрыш для
обоих равен k в каждом повторении. При наилучшем от-
клонении в одном повторении, работая в пол-силы, полу-
k2
чишь  k , но потом будешь все время получать нули по
4
определению релейной стратегии, поскольку e0 . В итоге,
условие невыгодности отклонения сведется к неравенству
k k k
 k (  1)   
1  4 k4
(в) Изобразите графически профили (пары) выигры-
шей игроков в СПРН, основанных на данных релейных
стратегиях.
Следует напомнить, что в игре G (,  ) можно счи-
тать Vi текущую стоимость платежей в повторениях, а
можно выигрыш U i  (1   )Vi (см. стр. 90 учебника). Нор-
мировка делается для того, что выигрыши в исходной игре
G и в повторяющейся игре G (,  ) были бы сопостави-
мы. Так, если для данного СПРН игроки в каждом повто-
рении получают по k , то это означает, что выигрыши в
G (,  ) у них будут тоже по U i  k .
k
Поскольку 0   1 при любом неотрицательном
k4
k , то и при любом уровне усилий k существует СПРН с
выигрышами k для обоих в каждом повторении, а значит с
327
Лекции по теории игр и экономическому моделированию
профилем выигрышей U  (U1 ,U 2 )  (k , k ) . Таким образом,
множество всех профилей выигрышей для релейных сим-
метричных СПРН составляет биссектрису первого квад-
ранта. Благодаря СПРН в повторяющейся игре лентяи мо-
гут прийти устойчивому соглашению, позволяющему
взмыть хоть до небес...
Задача 3. Сигнальная реклама. Компания «Гло-
ток» представляет новый напиток типичному потребителю.
Напиток может быть Хорошим или Плохим. Априорная
вероятность Хорошего напитка равна 0.6. Зная, каким по-
лучился новый напиток, компания выбирает уровень рек-
ламы: массированная реклама с затратами c или мини-
мальная реклама с нулевыми затратами. Наблюдая уровень
рекламной активности, но, не зная качества нового напит-
ка, типичный потребитель решает, покупать ли ему этот
продукт. С учетом цены на продукт будем считать, что вы-
игрыш потребителя от покупки равен +1, если напиток Хо-
роший, и 1 , если Плохой. Если потребитель не купит на-
питок, то его выигрыш равен 0. Если напиток Хороший и
типичный потребитель купит его, то фирму ожидает боль-
шой доход R . Если напиток Плохой, но типичный потре-
битель его все-таки купит, то фирму ожидает меньший до-
ход r . Если типичный потребитель не купит напиток, то
доход компании равен 0. Предполагается, что
or c R.
(а) Сформулируйте соответствующую сигнальную
игру и изобразите ее графически.
(R,1)
(R-c,1) К
К
[ p] Акт Хор Пас [q ]
(0,0)
Г 0.6
(-с,0) Н Н
П П
0
0.4 К (r,-1)
(r-c,-1) К
Г

(-с,0) Акт Плох Пас (0,0)


[1  p ] [1  q] Н
Н

328
Задачи письменных работ за прошлые годы
(б) Найдите выявляющее совершенное байесовское
равновесие (СБР) в этой игре.
Есть два кандидата на СБР: искреннее или лживое.
В искреннем СБР «Глоток» активно рекламирует
Хороший напиток и пассивно — Плохой. Автоматически
p  1, q  0 . На активную рекламу потребитель отвечает
покупкой, а на пассивную – отказом. «Глотку» не выгодно
отклоняться ни при каком качестве напитка. Получили ис-
креннее СБР.
В лживом СБР «Глоток» активно рекламирует Пло-
хой напиток и активно Хороший. Значит, p  0, q  1 . По-
требитель покупает при пассивной рекламе и не покупает
при активной. Но «Глотку» при плохом напитке выгодно
отклониться на пассивную рекламу, чтобы получить r  0 .
Значит, лживого СБР при данных параметрах нет.
(в) Найдите скрывающее СБР в этой игре.
Есть два потенциальных скрывающих СБР: с актив-
ной или пассивной рекламой, независимо от качества на-
питка.
При активной рекламе p  0.6 . Ожидаемый выиг-
рыш от покупки равен 0.2, что больше 0, поэтому при ак-
тивной рекламе потребитель покупает напиток. Однако эту
конструкцию нельзя продлить до СБР. По условию
r  c  0 , поэтому в случае Плохого напитка «Глотку» бо-
лее выгодна пассивная реклама, которая дает неотрица-
тельный выигрыш.
При пассивной рекламе q  0.6 . Ожидаемый выиг-
рыш от покупки для потребителя снова равен 0.2, поэтому
он покупает. Отклоняться в сторону активной рекламы
«Глотку» не выгодно при любом p и любой реакции по-
требителя на активную рекламу. Получили СБР.
(г) Найдите СБР, если вероятность Хорошего напит-
ка равна 0.4.
На выявляющие СБР такое изменение не влияет. Ис-
креннее СБР сохраняется.
329
Лекции по теории игр и экономическому моделированию
В скрывающих равновесиях теперь потребитель не
будет покупать напиток, поскольку его ожидаемый выиг-
рыш от покупки равен –0.2.
При активной рекламе, достроить скрывающее СБР
нельзя, поскольку при Плохом напитке «Глотку» выгодна
пассивная реклама: c  0  r .
При пассивной рекламе нужно, чтобы потребитель
не хотел купить напиток также и при активной рекламе.
Тогда «Глоток» не будет отклоняться при Хорошем напит-
ке. Этого можно достигнуть при p  0.5 . Итак, получили
нулевое (пассивная реклама и нет покупок) скрывающее
СБР. Ненулевых СБР в этом случае нет.
(д) Найдите СБР, если 0  c  r  R , а вероятность
Хорошего напитка равна 0.6.
Теперь искреннее выявляющее СБР вылетает, по-
скольку «Глотку» становится выгодным при Плохом на-
питке использовать активную рекламу: r  c  0 . Лживое
СБР нет по нем же причинам, что и раньше: при плохом
качестве выгодно переходить на пассивную рекламу .
Возникает скрывающее СБР с активной рекламой
при q  0.5 . Скрывающее СБР с пассивной рекламой те-
перь получается при любом p , поскольку потребитель
будет покупать и при пассивной рекламе, а переходить на
активную рекламу «Глотку» нет смысла.
Задача 4. Как ставить оценки? Имеются препода-
ватель и студент. Преподаватель знает, что студенты бы-
вают двух типов H и L. Студент знает свой тип, а препода-
ватель нет. Известно, что априорная вероятность типа H
равна   [0,1] . События развиваются в следующем по-
рядке.
 Преподаватель устанавливает границу   [0,100] в
очках для положительной оценки.
 Зная свой тип и эту границу, студент решает, выбрать ли
этот предмет в качестве альтернативного курса или нет.

330
Задачи письменных работ за прошлые годы
 Если студент не выбрал этот курс, то преподаватель по-
лучает 0, а студент – величину Wt , где t {H , L} тип
студента, причем 0  WL  WH  100 .
 Если студент выбрал данный курс, то он определяет
уровень усилий e по его освоению и сдает экзамен. На
экзамене студент типа L получает s  e очков, а сту-
дент типа H получает s  2e .
 Студент получает положительную оценку, если s   .
В этом случае его выигрыш считается равным
100  e / 2 . В противном случае выигрыш студента ра-
вен e / 2 . Выигрыш преподавателя в любом случае
считается равным e .
(а) Рассмотрим престижное учебное заведение с высо-
кими стандартами, в котором  велико, а WH не очень вели-
ко, например,   0.9 , WL  70, WH  80 . Найдите СБР.
Начнем с конца. Зная  и свой тип, студент будет
сравнивать выигрыш от сдачи на положительную оценку с
минимальными достаточными для этого усилиями с аль-
тернативным выигрышем. Студенту H достаточно прило-
жить  / 2 усилий, чтобы сдать экзамен и получить выиг-
рыш 100   / 4 . Студенту L потребуется  усилий, что
соответствует выигрышу 100   / 2 .
Студенту H выберет курс при условии
100   / 4  WH    4(100  WH )   H  80 .
Студенту L выберет курс при условии
100   / 2  WL    2(100  WL )   L  60   H .
Если   60 , то придут как H, так и L. Выигрыш
преподавателя в этой зоне равен  / 2  (1   ) . Эта вели-
чина возрастает по  и достигает своего максимального
значения 33 при    L  60 . При  L     H придет
только H. Выигрыш преподавателя в этой зоне  / 2 дос-

331
Лекции по теории игр и экономическому моделированию
тигает максимального значения 36 при    H  80 . Оста-
лось сравнить эти значения выигрышей преподавателя:
36 > 33. Итак, в СБР выбирать курс будут только H, наби-
рая на экзамене 80 очков.
(б) Рассмотрим престижное учебное заведение с «ис-
порченными» молодыми людьми, в котором велики  и
WH , например,   0.9 , WL  70, WH  90 . Найдите СБР.
При этих условиях границы пересекаются иначе
 H  40   L  60 , поэтому при   40 придут и H, и L, а при
40    60 останутся только L. Теперь нужно сравнивать
 H / 2  (1   ) H  22 и (1   ) L  6 . В СБР будут и H, и L
при проходном уровне очков на экзамене, равном 40 .
(в) Рассмотрим посредственное учебное заведение, в
котором  и WH малы, например,   0.5 ,
WL  70, WH  80 . Найдите СБР.
В этом случае  H  80   L  60 , как и в (а), но те-
перь сравнение  L / 2  (1   ) L  45 и  H / 2  20 в
пользу   60 . В СБР на экзамене присутствуют и H, и L
при границе очков 60.
(г) Предположив одинаковое значение WL , проран-
жируйте экзаменационные очки s в случаях (а), (б), (в).
Итак, граница очков на положительную оценку самая
высокая в случае (а), а самая низкая в случае (б). В случаях
(б) и (в) в курсе участвуют оба типа. Причины разные. В
случае (б) тип L отфильтровать не возможно, а в случае (в)
– не выгодно.
(д) Приведите условия на параметры модели, чтобы
свойства СБР в случаях (а), (б), (с) сохранились.
Полное исследование зависимости от параметров не
приводится.

332
Литература

1. фон Нейман Дж. Теория игр и экономическое по-


ведение/Дж. фон Нейман, О. Моргенштерн. –М.: Наука,
1970. – 708с.
2. Оуэн Г. Теория игр: учебник/ Г. Оуэн. – М.: Мир,
1971. – 230с.
3. Мулен Э. Теория игр с примерами из математиче-
ской экономики: учебник/ Э. Мулен. – М.: Мир, 1985. –
198с.
4. Мулен Э. Кооперативное принятие решений: Ак-
сиомы и модели/ Э. Мулен.– М.: Мир, 1991. – 463с.
5. Gibbons R. Game Theory for Applied Economists.
Princeton University Press/ R. Gibbons.– 1992.– 267 p.
6. Печерский С.Л. Теория игр для экономистов.
Вводный курс: учебное пособие./ С.Л. Печерский.
А.А. Беляева.– Спб.: Европейский университет в СПб.
2001. –342 с.
7. Данилов В.И. Лекции по теории игр: учебное по-
собие/Данилов В.И.–М.: Российская экономическая школа,
2002. –140 с.
8. Васин А.А. Теория игр и модели математической
экономики: учебное пособие/ А.А. Васин, В.В. Морозов.–
М.: Макс-Пресс, 2005. –272 с.
9. Myerson R. Game Theory: Analysis of Conflict/
R. Myerson. – Harvard University Press, 1991. – 568 p.
10. Osborne M.J. An Introduction to Game Theory/
M. Osborne. – Oxford University Press, 2004. –533 p.

333