Вы находитесь на странице: 1из 5

Российский Государственный Авиационный Технологический Университет

имени К.Э. Циолковского - (МАТИ)

«Антагонистическая
игра»
Доклад по методам оптимизации
Аль Фарах М.Г.
21.12.2008

Доклад по методам оптимизации, в котором рассматриваются основные


понятия антагонистических игр и теории игр в целом.
Оглавление
Введение..................................................................................................................3
Общие выкладки....................................................................................................3
Конкретные примеры.............................................................................................4
Орлянка...............................................................................................................4
Дилемма заключённого......................................................................................4
Антагонистические игры в экономике.................................................................5
Введение
Антагонистическая игра (игра с нулевой суммой, англ. zero-sum) — термин теории
игр. Антагонистической игрой называется некооперативная игра, в которой участвуют два
игрока, выигрыши которых противоположны.
Формально антагонистическая игра может быть представлена тройкой ,
где X и Y — множества стратегий первого и второго игроков, соответственно; F —
функция выигрыша первого игрока, ставящая в соответствие каждой паре стратегий
(ситуации) (x,y), действительное число, соответствующее полезности первого
игрока при реализации данной ситуации. Так как интересы игроков противоположны,
функция F одновременно представляет и проигрыш второго игрока.

В теории игр стратегия игрока в игре или деловой ситуации — это полный
план действий при всевозможных ситуациях, способных возникнуть.
Стратегия определяет действие игрока в любой момент игры и для
каждого возможного течения игры, способного привести к каждой
ситуации.

Исторически антагонистические игры являются первым классом математических


моделей теории игр, при помощи которых описывались азартные игры. Считается, что
благодаря этому предмету исследования теория игр и получила свое название. В
настоящее время антагонистические игры рассматриваются как часть более широкого
класса некооперативных игр.

Некооперативная игра — термин теории игр. Некооперативной игрой


называется математическая модель взаимодействия нескольких сторон
(игроков), в процессе которого они не могут формировать коалиции и
координировать свои действия.

Общие выкладки
Есть матрица A размера . Первый игрок выбирает число от 1 до n, второй —
от 1 до m. Затем они сверяют числа и первый игрок получает aij очков, а второй ( − aij)
очков (i — число, выбранное первым игроком, j — вторым). Нужно найти оптимальную
стратегию первого игрока. Пусть в оптимальной стратегии число i нужно выбирать с
вероятностью pi. Тогда оптимальная стратегия является решением следующей задачи
линейного программирования: , , ,
( ), в которой нужно максимизировать
функцию . C в оптимальном решении будет математическим
ожиданием выигрыша первого игрока в наихудшем случае.
Матрица A называется платежной матрицей.
Конкретные примеры
Орлянка
Простейшим примером антагонистической игры является игра «Орлянка». Первый
игрок прячет монету орлом или решкой вверх, а второй пытается угадать, как она
спрятана. Если он не угадывает - он платит первому одну денежную единицу, если
угадывает - первый платит ему одну денежную единицу.
В данной игре каждый участник имеет две стратегии: «орел» и «решка».
Множество ситуаций в игре состоит из четырех элементов. В строках таблицы указаны
стратегии первого игрока х, в столбцах - стратегии второго игрока y. Для каждой из
ситуаций указаны выигрыши первого и второго игроков.
X Y Орел Решка
Орел -1,1 1, -1
Решка 1, -1 -1,1

В аналитическом виде функция выигрыша первого игрока имеет следующую


форму:

где x ∈ X и y ∈ Y - стратегии первого и второго игроков, соответственно.


Так как выигрыш первого игрока равен проигрышу второго, то F2(x,y) = − F1(x,y).

Дилемма заключённого
В теории игр дилемма заключённого (реже употребляется название «дилемма
бандита») — некооперативная игра, в которой игроки стремятся получить выгоду,
сотрудничая друг с другом или предавая. Как во всей теории игр, предполагается, что
игрок («заключённый») максимизирует свой собственный выигрыш, не заботясь о выгоде
других.
В дилемме заключённого предательство строго доминирует над сотрудничеством,
поэтому единственное возможное равновесие — предательство обоих участников. Проще
говоря, неважно, что сделает другой игрок, каждый выиграет больше, если предаст.
Поскольку в любой ситуации предать выгоднее, чем сотрудничать, все рациональные
игроки выберут предательство.
Ведя себя по отдельности рационально, вместе участники приходят к
нерациональному решению: если оба предадут, они получат в сумме меньший выигрыш,
чем если бы сотрудничали. В этом и заключается дилемма.
В повторяющейся дилемме заключённого игра происходит периодически, и каждый
игрок может «наказать» другого за несотрудничество ранее. В такой игре сотрудничество
может стать равновесием, а стимул предать может перевешиваться угрозой наказания (с
ростом числа итераций равновесие Нэша стремится к Парето-оптимуму).
Во всех судебных системах кара за бандитизм (совершение преступлений в составе
организованной группы) намного тяжелее, чем за те же преступления, совершённые в
одиночку (отсюда альтернативное название — «дилемма бандита»).
Классическая формулировка дилеммы заключённого такова:
Двое преступников, А и Б, попались примерно в одно и тоже время на сходных
преступлениях. Есть основания полагать, что они действовали по сговору, и полиция,
изолировав их друг от друга, предлагает им одну и ту же сделку: если один
свидетельствует против другого, а тот хранит молчание, то первый освобождается за
помощь следствию, а второй получает максимальный срок (10 лет). Если оба молчат, дело
проходит по другой статье, и они приговариваются к 6 месяцам. Если оба свидетельствуют
против друг друга, они получают минимальный срок (по 2 года). Каждый заключённый
выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает
точно, что сделает другой. Что произойдёт?
Игру можно представить в виде следующей таблицы:
Заключённый Б хранит Заключённый Б даёт показания
молчание
Заключённый А хранит Оба получают полгода. А получает 10 лет,
молчание Б освобождается
Заключённый А даёт показания А освобождается, Оба получают 2 года тюрьмы
Б получает 10 лет тюрьмы

Дилемма появляется, если предположить, что оба заботятся только о минимизации


собственного срока заключения.
Представим рассуждения одного из заключённых. Если партнёр молчит, то лучше
его предать и выйти на свободу (иначе — полгода тюрьмы). Если партнёр свидетельствует,
то лучше тоже свидетельствовать против него, чтобы получить 2 года (иначе — 10 лет).
Стратегия «свидетельствовать» строго доминирует над стратегией «молчать». Аналогично
другой заключённый приходит к тому же выводу.
С точки зрения группы (этих двух заключённых) лучше всего сотрудничать друг с
другом, хранить молчание и получить по полгода, так как это уменьшит суммарный срок
заключения. Любое другое решение будет менее выгодным.

Антагонистические игры в экономике


Антагонистическая игра — игра, воспроизводящая, моделирующая экономическую
ситуацию противостояния, противоборства, конкуренции двух сторон с взаимно
противоположными интересами.