Вы находитесь на странице: 1из 14

Пинус В.О.

Теоретико-игровой и имитационный подходы к принятию решений


1) Необходимые понятия;
В процессе управления экономическими системами часто возникают ситуации, при
которых сталкиваются интересы нескольких конкурирующих сторон, преследующих
противоположные цели. Такие ситуации называются конфликтными. Принятие решения в
конфликтной ситуации проводится в условиях неопределенности.
Математический аппарат, предназначенный для принятия оптимальных решений в таких
случаях, называется теорией игр.
Понятие игры определено, если заданы четыре условия:
1) имеется несколько сторон, цели которых не совпадают;
2) заданы правила, определяющие выбор допустимых стратегий, известные сторонам;
3) существует выбор конечных состояний, которыми заканчивается игра (например:
выигрыш, проигрыш);
4) заранее определены и известны всем сторонам количественные показатели каждого
возможного конечного состояния.
В теории игр приняты следующие определения:
Игра называется парной, если число участвующих в ней сторон равно двум. Если число
сторон больше двух, то игра может быть сведена к парной благодаря возникновению
коалиций между группами сторон.
Игра называется конечной, если число стратегий у каждой стороны является конечным.
Игра называется игрой с нулевой суммой, если выигрыш одной стороны равен
проигрышу второй. В противном случае игра называется с ненулевой суммой.
Математическая модель конечной парной игры с нулевой суммой представляет собой так
называемую платежную матрицу ||aij|| размера m x n, где m – число стратегий стороны A, n
– число стратегий стороны B. Элемент матрицы aij представляет собой выигрыш стороны
A, если она применяет стратегию Ai, а сторона B использует стратегию Bj.
2) Методы решения игровых задач;
a. Решение игр в чистых стратегиях;
Если каждая из сторон выбирает однозначно с вероятностью 1 некоторую стратегию, то
решение игры будет в чистых стратегиях. Оптимальное решение игры соответствует
максимально возможному выигрышу стороны А (минимально возможному проигрышу
стороны В). Таким образом, решение игры заключается в нахождении оптимальных
чистых стратегий сторон.
Чтобы обеспечить себе максимальный выигрыш, сторона А должна выбирать такую
стратегию Аi, i = 1, 2, ..., m, при которой ее минимальный выигрыш максимален:

Величина α называется нижней ценой игры и представляет собой гарантированный


выигрыш стороны А.
Стратегия, обеспечивающая стороне А получение выигрыша α, называется максиминной.
Пример решения матричной игры при использовании чистых стратегий для стороны А:

Оптимальной для стороны В будет та стратегия Вj, j = 1, 2, ..., n, при которой ее


максимальный проигрыш минимален:

Величина β называется верхней ценой игры, а соответствующая проигрышу β стратегия


стороны В — минимаксной.
Пример решения матричной игры при использовании чистых стратегий для стороны В:

Таким образом, выигрыш стороны А (проигрыш стороны В) при выборе ими оптимальных
стратегий не может быть больше верхней цены игры (меньше нижней цены игры):
Фактический результат игры, называемый ценой игры, лежит в пределах:

Если значения нижней и верхней цены игры совпадают, то говорят, что игра имеет
седловую точку:

Оптимальные стратегии игр с седловой точкой устойчивы, так как отклонение любой
стороны от оптимальной стратегии приводит к уменьшению выигрыша стороны А
(увеличению проигрыша стороны В). Понятие устойчивости для игры с седловой точкой
означает, что пара оптимальных стратегий сторон А и В является как бы положением
равновесия — отклонение любой из сторон от своей оптимальной стратегии вызывает
изменение выигрыша (проигрыша), которое невыгодно для стороны, отклоняющейся от
оптимальной стратегии, и вынуждает ее вернуться к своей оптимальной стратегии.
b. Решение игр в смешанных стратегиях;
Стратегия стороны, заключающаяся в выборе чистых стратегий с некоторыми
фиксированными вероятностями, называется смешанной стратегией.
Тогда чистая стратегия будет частным случаем смешанной стратегии, в которой
вероятность применения всех стратегий, кроме данной, равна 0.
Если игра ведется в смешанных стратегиях, то при многократном повторении игры
каждая сторона случайно выбирает одну из своих чистых стратегий.
Смешанную стратегию стороны А будем описывать m-мерным вектором

где pi — вероятность использования чистой стратегии Аi.


Смешанную стратегию стороны В будем описывать n-мерным вектором

где qj — вероятность использования чистой стратегии Вj.


Очевидно, что компоненты векторов P и Q должны удовлетворять приведенным ниже
соотношениям неравенств и условиям нормировки:

Результат игры будет зависеть от смешанной стратегии Р стороны А и смешанной


стратегии Q стороны В, и он называется платежной функцией φ(Р, Q).
Физически платежная функция является математическим ожиданием результата игры и
вычисляется по формуле:

Оптимальное поведение стороны А заключается в том, что если сторона А использует


оптимальную смешанную стратегию P*, то при любой стратегии стороны В выигрыш
стороны А (проигрыш стороны В) будет не меньше цены игры, т.е.

Оптимальное поведение стороны В заключается в том, что если сторона В использует


оптимальную смешанную стратегию Q*, то при любой стратегии стороны А проигрыш
стороны В (выигрыш стороны А) будет не больше цены игры, т.е.

Пусть в игре существуют:


• такая смешанная стратегия Р* стороны А,
• такая смешанная стратегия Q* стороны В,
• такое число ν, что имеют место соотношения:

удовлетворяющие условиям нормировки


Тогда будем называть:
• стратегии Р* и Q* — оптимальными стратегиями сторон; • число ν — ценой игры;
• совокупность (Р*, Q*, ν) — решением игры.
Отсюда следует зависимость

Заменяя в предыдущих неравенствах число ν его значением, получим

Точка (Р*, Q*) называется седловой точкой функции (Р, Q) при Р и Q, удовлетворяющей
условиям нормировки.
Таким образом, оптимальные стратегии сторон — это седловая точка платежной функции,
а цена игры — значение платежной функции в седловой точке.
Отсюда следует и содержание теоремы Неймана — основной теоремы теории матричных
игр, которая гласит: «Каждая матричная игра с нулевой суммой имеет решение в чистых
или в смешанных стратегиях».
Решение матричной игры в смешанных стратегиях, т.е. нахождение седловой точки
платежной функции, связано с операциями над платежной матрицей.
Поэтому перед решением игры целесообразно упростить платежную матрицу, оставив в
ней только те элементы, которые соответствуют существенным стратегиям.
Чистая стратегия называется существенной, если вероятность ее использования в
смешанной стратегии больше 0. В противном случае, если вероятность использования
чистой стратегии в смешанной равна 0, чистая стратегия называется несущественной.
Для выявления существенных стратегий попарно сравнивают строки и столбцы
платежной матрицы. Если все элементы i-й строки больше соответствующего элемента k-
й строки, то стратегия Аi доминирует над стратегией Аk, и поэтому стратегия Аk
несущественна и может быть исключена из платежной матрицы. Подобные рассуждения
могут быть проведены и в отношении столбцов.
Кроме того, в платежной матрице могут существовать одинаковые строки и одинаковые
столбцы, т.е. дублирующие стратегии. Из нескольких дублирующих стратегий нужно
оставлять одну.
Процедура последовательного исключения несущественных и дублирующих стратегий:
В теории игр имеет место следующая теорема: у любой конечной игры m x n имеется
решение, в котором число существенных стратегий каждой стороны не превосходит
наименьшего из чисел m и n.
Решение игровой задачи может быть осуществлено:
• графически, когда min{m, n} = 2;
• аналитически, путем решения системы линейных уравнений;
• сведением игры к задаче линейного программирования;
• приближенно с помощью алгоритма Брауна.
Справедливы следующие свойства оптимальных стратегий матричной игры:
1)Если сторона А использует i-ю существенную стратегию, а сторона В — оптимальную
смешанную стратегию Q*, то выигрыш стороны А равен цене игры, т.е.

2)Если сторона В использует j-ю существенную стратегию, а сторона А — оптимальную


смешанную стратегию P*, то проигрыш стороны В равен цене игры, т.е.

c. Графическое решение игр;


Решению игры 2 x 2 можно дать удобную геометрическую интерпретацию.
Возьмем отрезок оси абсцисс единичной длины. Левый конец отрезка изображает
стратегию А1, правый конец — стратегию А2; внутренние точки отрезка представляют
собой смешанные стратегии стороны А.
Вероятность p1 стратегии А1 равна расстоянию от точки Р* до правого конца отрезка, а
вероятность p2 стратегии A2 — расстоянию от точки Р* долевого конца отрезка. В точках
А1 и А2 восстановим два перпендикуляра к оси абсцисс — y1 и y2. На оси 0y1 будем
откладывать выигрыш при чистой стратегии А1, а на оси 1y2 — выигрыш при чистоте
стратегии А2. Если сторона В применяет стратегию В1, то выигрыш стороны А при
стратегии А1 будет α11, при стратегии А2 — α21. Точку с координатой α11 на оси 0y1 и точку
с координатой α21 на оси 1y2 соединим прямой. Любая смешанная стратегия стороны А
даст выигрыш, равный ординате точки на отрезке В1B1 , исключая его концы.
Рассмотрим более сложную ситуацию:

Тогда графическое решение игры для данного примера имеет вид:

Аналогично строится прямая В2В2:

Так как сторона В стремится минимизировать свой проигрыш, то нижней границей


выигрыша стороны А будет ломаная линия В1NВ2. Стремясь максимизировать свой
минимальный выигрыш, сторона А выберет оптимальную стратегию Р* = {Р1, Р2},
соответствующую точке N, имеющей наибольшую ординату на ломаной В1NВ2. Эта
ордината представляет собой цену игры ν, а точка ее пересечения с осью абсцисс делит
отрезок 01 в отношении p1/p2. Для определения оптимальной стратегии Q = {q1, q2}
стороны В строится график в стратегиях А1, А2, на котором ищут минимум верхней
границы проигрыша стороны В.
На основании приведенной выше теоремы о числе существенных стратегий игры 2 x n и
m x 2 могут быть сведены к игре 2 x 2, так как число существенных стратегий каждой
стороны равно двум.
На графике строятся линии стратегий Вj. Для определения существенных стратегий
стороны В среди точек пересечения линий ее стратегий выбирается точка N, имеющая
максимальную ординату. Точка определяет существенные стратегии стороны В (в данном
случае это стратегии В3 и В4), а ордината точки В представляет собой цену игры ν. В
рассмотренной ситуации игра 2 x n сведена к игре 2 x 2, которая решается элементарно.
Решение игры m x 2 проводится аналогично, с той разницей, что строится верхняя
граница проигрыша, на которой ищут минимум.
d. Аналитическое решение игр;
На основе свойств оптимальных стратегий легко решить игру 2 х 2, заданную платежной
матрицей:

Пусть известно, что игра не имеет седловой точки. Так как все стратегии в игре 2 x 2
существенные, на основании формул и с учетом условия нормировки можно записать
систему уравнений:

Решение этой системы уравнений относительно искомых переменных pi, qj и v


представляет собой решение игры:
Для матрицы 2 х 4 со структурной схемой данных, представленной ниже, можно дать
соответствующую формализацию и записать аналогичную систему уравнений:

Такая формализация представляет собой систему из восьми линейных алгебраических


уравнений для семи неизвестных:

Для решения записанной системы уравнений с использованием инструментальных


средств необходимо дать соответствующее стандартное представление системы линейных
алгебраических уравнений:

Решение игровой задачи средствами MS Excel:

e. Решение игр методом линейного программирования;


Сведение игры к задаче линейного программирования может быть осуществлено на
основе соответствующей ее формализации для конкурирующих сторон. Математическая
модель игры за сторону А с условием нормировки имеет вид:
Далее, с учетом того, что цена игры ν ≥0, разделим второе и первое выражение
представленной модели на ν. Поскольку сторона А стремится максимизировать свой
выигрыш ν, то обратная величина 1/ν должна быть минимизирована:

Введем новые обозначения:

Тогда в соответствии с введенными обозначениями можно записать целевую функцию и


ограничения задачи линейного программирования:

Пример оптимизации игровой задачи за сторону A инструментальным средством «Поиск


решения» MS Excel:

Выполним аналогичные преобразования игровой ситуации за сторону В. Математическая


модель игры с условием нормировки будет иметь вид:

Разделим второе и первое выражение представленной модели на ν. Поскольку сторона В


стремится минимизировать свой проигрыш ν, то обратная величина 1/ν должна быть
максимизирована:
Введем обозначения:

В этом случае игровую ситуацию за сторону В можно представить как задачу линейного
программирования с соответствующей целевой функцией и ограничениями:

Пример оптимизации игровой задачи за сторону A инструментальным средством «Поиск


решения» MS Excel:

f. Решение игр итерационным алгоритмом Брауна;


Решение игры методом Брауна начинается со случайного выбора стратегии одной из
сторон.
Пусть сторона А выбрала стратегию Аi. Выпишем элементы этой стратегии под игровой
матрицей.
Сторона В, минимизируя свой проигрыш, выберет стратегию Вj, соответствующую
минимальному элементу стратегии Аi. Выпишем элементы стратегии В справа от
матрицы. Сторона А находит среди элементов стратегии Вj максимальный элемент и
выбирает стратегию Аk, соответствующую максимальному выигрышу. Элементы
стратегии Аk прибавляются к элементам стратегии Аi и записываются под матрицей.
Аналогичные итерации повторяются столько раз, сколько необходимо для решения игры с
требуемой точностью. На каждой итерации максимальный выигрыш стороны А и
минимальный проигрыш стороны В отмечаются звездочкой или выделяются цветом.
Подсчитав число отмеченных элементов в каждой стратегии сторон, получим частоту
использования каждой стратегии путем деления числа отмеченных элементов стратегии
на общее число итераций.
При достаточно большом числе итераций частоты стратегий сводятся к вероятностям,
которые и являются оптимальными решениями матричной игры.
За N проведенных итераций будут получены оптимальные стратегии:
Р* = {p1, p2, ..., pm}; Q* = {q1, q2, ..., qn}.
В методе Брауна точность полученного решения повышается при увеличении числа
итераций. Метод Брауна достаточно прост для программной реализации на компьютере.
В частности, на основе программы, разработанной А. А. Бабаевым выполнены различные
расчеты с числом итераций 100 и 1000.
Решение игры 2 x 4 итерационным алгоритмом Брауна для тестового примера:

Решение игровой задачи итерационным методом Брауна с седловой точкой:

Положительным аспектом использования метода Брауна является то, что он позволяет


находить решение игры как за сторону А, так и за сторону В одновременно в отличие от
решения матричной игры как пары двойственных задач методом линейного
программирования. Особенно перспективно использование метода Брауна для получения
приближенного решения матричных игр как задач линейного программирования большой
размерности.
Задания для самостоятельного решения:
1) Найдите седловую точку игры с платежной матрицей:
4 5 9 3
A= 8
7
7
( 4
6
2
3
8
4
7
9
6
)
2) Упростите платежную матрицу:
1 2 1 2

(
B= 2
3
4
1
3
1
2
2
3
4
2
3
)
3) Решите матричную игру аналитическим методом:

C= ( 36 5 2 0
−1 3 5 )
4) Решите матричную игру графическим методом:

D= 4 2 3 −1
( )
−4 0 −2 2

Список используемых источников:


1. Системы поддержки принятия решений: теория и практика: учебник для
академического бакалавриата / под ред. В. Г. Халина, Г. В. Черновой. — М.:
Издательство Юрайт, 2015 — 494 с. — Серия: Бакалавр. Академический курс.
ISBN 978-5-9916-5201-8