Вы находитесь на странице: 1из 31

МОСКОВСКИЙ АВИАЦИОННЫЙ ИНСТИТУТ

НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ
УНИВЕРСИТЕТ

Факультет №3 – «Системы управления, информатика и


электроэнергетика»
Кафедра 308 – «Информационные технологии»

Лабораторная работа «Игровые методы принятия решений»

по дисциплине «Теория информационных процессов и


систем»

Вариант №26
26.04.2020
Очень много синтаксических ошибок? Проставьте запятые, невозможно читать.!
Замечания – см примечания по работе. Исправляйте в соответствии с инструкцией,
выложенной в lms.
Ю.В.

05.05.2020 Много ошибок и неточностей. Правьте!!!


Ю.В.

Выполнил:
студент группы М3О-414Б
Соколов Алексей Михайлович
+79169903046

Принял:
доцент, к.т.н.
Горбачев Юрий Васильевич

1
Москва, 2020

ЗАДАНИЕ 1
Решить заданную игру тремя методами:
 Аналитический метод;
 Графический метод;
 Метод Брауна.

Решение аналитическим методом.


Исходная платежная матрица А

ψ1 ψ2 maxmin
φ1 1 5 1
φ2 -2 6 -2
φ3 8 -3 -3
minmax 8 6

На данной матрице показаны значения выигрыша игрока A или все


возможные проигрыши игрока Б в зависимости от выбранной стратегии
игроками.

У игрока А — 3 стратегии. В данном случаем строки матрицы показывают


количество стратегий, соответственно у игрока А — 3 стратегии.
У игрока Б — 2 столбца. В данном случаем столбцы матрицы показывают
количество стратегий, соответственно у игрока Б — 2 стратегии.

Необходимо отметить ограничения.


У игроков есть свои стратегии, которые они применяют с той или иной
частотой. Частота использования стратегии обладает двумя свойствами:

1) Частота является отношением числа применений стратегии к числу


применения всех стратегий, данная характеристика находится в
диапазоне между 0 и 1 включительно.

0 ≤ p i ≤ 1; 0 ≤ q i ≤ 1;

2
2) Свойство следует из первого – Сумма частот равняется 1, как сумма
чисел использования отдельных стратегий равняется общему числу
использования всех стратегий.

∑ pi =1; ∑ qi=1

Решение игры Аналитическим методом.

Распишем составляющие финальных уравнений для игрока А и Б.

Средний выигрыш игрока А.

Средний выигрыш при условии того, что игрок Б выбрал стратегию ψ 1.

a I1I =1 p 1−2 p2 +8 p3

Средний выигрыш при условии того, что игрок Б выбрал стратегию ψ 2.

a I2I =5 p 1+ 6 p 2−3 p 3

Результат выигрыша игрока А имеет вид:

a II =a1I I q1 +a I2I q 2

a II =( 1 p1 −2 p2 +8 p3 ) q1 + ( 5 p1 +6 p2−3 p3 ) q 2 ;

Средний проигрыш игрока Б.

Средний проигрыш при условии того, что игрок А выбрал стратегию φ 1.

a I1=1 q1 +5 q2

Средний проигрыш при условии того, что игрок А выбрал стратегию φ 2.

a I2=−2 q1 +6 q 2

Средний проигрыш при условии того, что игрок А выбрал стратегию φ 3.

a I3=8 q1 −3 q2

Результат проигрыша для игрока Б имеет вид.

a I =aI1 p1+a I2 p2 +a3I p3


3
a I =( 1q 1+ 5 q2 ) p 1+ (−2 q1 +6 q 2) p2 + ( 8 q 1−3 q 2) p3 ;

Найдем значения p j и q i, максимизирующие средний выигрыша игрока A и


проигрыша Б. Для нахождения условного экстремума записываем функцию
Лагранжа:
F I ( q 1 , q 2 , p 1 , p2 , p3 , ν ) =¿ ( 1 q1 +5 q2 ) p1 + (−2 q1 +6 q2 ) p 2+ ( 8 q1−3 q2 ) p 3−ν 2 ( q 1+ q2−1 ) −ν 1 ( p1 + p 2+ p 3−1 ) ,

, где ν1 и ν 2 – цена игры.


Предположим, что стратегия φ 1 у игрока A не активна, т.е. p1=0 .
В таком случае функция Лагранжа примет вид:
F I ( q 1 , q 2 , p 2 , p3 , ν ) =(−2 q1 +6 q 2 ) p2 + ( 8 q1−3 q 2 ) p3 −ν 1 ( p 2+ p 3−1 )−ν 2 ( q1 +q 2−1 )

Найдем частные производные функции Лагранжа по всем аргументам:

∂FI
=−2 q1 +6 q 2=ν 1 ;
∂ p2

∂FI
=8 q1−3 q 2=ν 1 ;
∂ p3
∂FI
=−2 p2 +8 p3=ν 2 ;
∂ q1
∂FI
=6 p 2−3 p 3=ν 2 ;
∂ q2
∂FI
=−p 3− p2 +1=0 ;
∂ ν1
∂FI
=−q2 −q1 +1=0;
∂ ν2

Полученная система содержит 6 уравнений и 6 неизвестных.


Решая данную систему, находим значения pi и qj, которые являются
частотами использования стратегий. Далее, чтобы найти цену игры,
подставляем полученные частоты в уравнения.

Для решения данной системы разделим полученную систему уравнений на


две системы в виде:

4
−2 q1 +6 q 2=ν 1 ; −2 p2 +8 p 3=ν 2 ;

{ {
8 q1−3 q 2=ν1 ; 6 p2−3 p3=ν 2 ; (2)
q 1+ q2 =1; p2 + p3=1.

Вычтем из первых уравнений вторые:


−2q 1+ 6 q2=ν 1 ; −2 p2 +8 p3=v 2 ;

{ {
−10 q1 +9 q 2=0 ; −8 p 2+11 p3 =0 ;
q 1+ q2=1 ; p 2+ p3 =1.

Найдем решения систем уравнений:


−2 q1 +6 q2 =ν 1 ; −2 p 2+ 8 p 3=ν 2 ;

{ {
−10(1−q2 )+ 9 q2=0; −8 ( 1− p3 ) + 11 p 3=0 ;
q 1=1−q 2 ; p2=1− p3 ;

−2q 1+ 6 q2=ν 1 ; −2 p2 +8 p3=ν 2 ;

{ q 2=0,526 ;
q1=1−q 2=0,474 ; {
−8 ( 1− p3 ) +11 p3=0 ;
p2=1− p 3 ;

ν 1=2,21; −2 p2 +8 p3=ν 2 ;

{
q2 =0,526 ;
{ p 3=0,421 ;
q1 =0,474 ; p2=1−0,421=0,579 ;

ν 1=2,21; ν 2=0,788 ;

{ {
q2 =0,526 ; p3 =0,421;
q1 =0,474 ; p2=0,579;

Решения систем являются значения частот pi и q j, а также цены игры:


q1 =0,474 ; p 2=0,579 ;

{ {
q2 =0,526 ; p 3=0,421 ;
ν 1=2,21; ν 2=0,788 ;

Решения систем являются значениями частот q 1 , q 2 , p2 , p3 и цены игры


оптимальных смешанных стратегий игроков А и Б:

p2=0,579 ;
p3=0,421;
ν 2=0,788 ;

5
q 1=0,474 ;
q 2=0,526 ;
ν1 =2,21;

Предположение, что 1 стратегия игрока А является неактивной, имеет


место быть, т.к. полученные частоты удовлетворяют условиям:

0 ≤ p 3 , p2 ≤1 ; 0 ≤ q1 ,q 2 ≤ 1 ;

∑ pi =1; ∑ qi=1

Проверим правильность найденного решения подстановкой их в системы


уравнений (2) и сравнением левой и правой части уравнений:

−2∙ 0,474+ 6 ∙0,526=2,21 ;


{8∙ 0,474−3 ∙ 0,526=2,21 ;
0,474 +0,526=1;

−2∙ 0,579+8 ∙ 0,421=2,21 ;


{6∙ 0,579−3∙ 0,421=2,21;
0,579+0,421=1.

Предположим, что стратегия φ 2 у игрока A не активна, т.е. p2=0 .


В таком случае функция Лагранжа примет вид:

F I ( q 1 , q 2 , p 1 , p3 , ν )= ( 1q 1 +5 q2 ) p1+ ( 8 q1 −3 q2 ) p 3−ν 1 ( p1 + p3−1 ) −ν 2 ( q 1+ q2−1 )

Найдем частные производные функции Лагранжа по всем аргументам:

∂FI
=1q 1+ 5 q2=ν 1 ;
∂ p1
∂FI
=8 q1−3 q 2=ν 1 ;
∂ p3
∂FI
=1 p1 +8 p3=ν 2 ;
∂ q1
∂FI
=5 p1 −3 p3 =ν 2 ;
∂ q2

6
∂FI
=−p 3− p1 +1=0 ;
∂ ν1
∂FI
=−q1 −q2 +1=0.
∂ ν2

Разделим полученную систему уравнений на две системы в виде:


1 q1 +5 q 2=ν 1 ; 1 p1 +8 p3=ν 2 ;

{ {
8 q1−3 q2=ν 1 ; 5 p1−3 p3 =ν 2 ; (3)
q1 +q 2=1; p 1+ p 3=1.

Вычтем из первых уравнений вторые:


1q 1+ 5 q2=ν 1 ; 1 p 1+ 8 p 3=ν 2 ;

{ {
−7 q1 +8 q 2=0 ; −4 p1 +11 p3=0;
q 1+ q2=1 ; p1 + p3=1.

Найдем решения систем уравнений:


4 q 2 +1=ν1 ; 7 p3 +1=ν 2 ;

{ {
−7 ( 1−q 2 ) +8 q 2=0 ; −4 ( 1− p 3 )+ 11 p 3=0 ;
q1=1−q2 ; p1=1−p 3 ;

ν 1=4 ∙ 0,467+1=2,867 ; ν 2=7 ∙ 0,267+1=2,867 ;

{ q 2=0,467 ;
{ p3=0,267 ;
q1=1−0,467=0,533 ; p1=1−0,267=0,733 .

Решения систем являются значения частот pi и q j, а также цены игры:


q1 =0,533 ; p 1=0,733 ;

{ {
q2 =0,467 ; p3 =0,267 ;
ν 1=2,867 ; ν 2=0,267 .

Решения систем являются значениями частот p1 , p3 , q1 , q2 оптимальных


смешанных стратегий игроков А и В:
p1=0,733 ;
p3=0,267;
ν 2=0,267 ;
q 1=0,533 ;
q 2=0,467 ;
ν1 =2,867 ;

7
Предположение, что 2 стратегия игрока А является неактивной, имеет
место быть, т.к. полученные частоты удовлетворяют условиям:

0 ≤ p 3 , p1 ≤ 1 ; 0 ≤q 1 ,q 2 ≤ 1 ;

∑ pi =1; ∑ qi=1

Проверим правильность найденного решения подстановкой их в системы


уравнений (3) и сравнением левой и правой части уравнений:
1 ∙0,533+ 5∙ 0,467=2,867 ;
{8 ∙0,533−3 ∙ 0,467=2,867 ;
0,533+0,467=1;

1∙ 0,733+8 ∙ 0,267=2,867 ;
{5∙ 0,733−3 ∙0,267=2,867 ;
0,733+0,267=1.

Предположим, что стратегия φ 3 у игрока A не активна, т.е. p3=0.


В таком случае функция Лагранжа примет вид:
F I ( p1 , p2 , q1 , q2 , ν )=( 1q 1+ 5 q2 ) p 1+ (−2 q1 +6 q 2 ) p2−ν 1 ( p 1+ p2 −1 )−ν 2 ( q 1+ q2 −1 )

Найдем частные производные функции Лагранжа по всем аргументам:


∂FI
=1q 1+ 5 q2−ν 1=0 ;
∂ p1
∂FI
=−2 q1 +6 q 2−ν 1=0;
∂ p2
∂FI
=1 p1−2 p2−ν 2=0 ;
∂ q1
∂FI
=5 p1 +6 p2−ν 2=0 ;
∂ q2
∂FI
=−p 1− p2 +1=0 ;
∂ ν1
∂FI
=−q1 −q2 +1=0.
∂ ν2

В итоге получим 6 уравнений с шестью неизвестными.

Разделим полученную систему уравнений на две системы в виде:

8
1 q1 +5 q2 =ν 1 ; 1 p 1−2 p 2=ν 2 ;

{ {
−2 q1 +6 q 2=ν 1 ; 5 p1+ 6 p 2=ν 2 ; (4 )
q1 +q2 =1; p1 + p2=1.

Вычтем из первых уравнений вторые:


1q 1+ 5 q2=ν 1 ; 1 p 1−2 p2 =ν 2 ;

{ {
3 q1 −1q 2=0 ; −4 p1 −8 p 2=0 ;
q 1+ q2=1 ; p1 + p 2=1.

Найдем решения систем уравнений:


4 q 2+ 1=ν 1 ; 1−3 p 2=ν 2 ;

{ {
3 ( 1−q 2 )−1 q2 =0 ; −4 ( 1− p2 ) −8 p2=0 ;
q1=1−q2 ; p 1=1− p2 ;

ν 1=4 ∙ 0,75+ 1=4 ; ν 2=4 ;

{ q 2=0,75 ;
{
p 2=−1 ;
q1=1−0,75=0,25 ; p1=1+1=2.

Решения систем являются значения частот pi и q j, а также цены игры:


q1 =0,25 ; p1=2 ;

{ {
q2 =0,75 ; p2=−1;
ν 1=4 ; ν 2=4.

Решения систем являются значениями частот p1 , p2 , q1 , q2 ,оптимальных

смешанных стратегий игроков А и Б:


q 1=0,25 ;
q 2=0,75 ;
ν 2=4 ;
p1=2 ;
p2=−1 ;
ν1 =4.

Предположение, что 3 стратегия игрока А является неактивной, не


имеет место быть , т.к. полученные частоты не удовлетворяют условиям:

0 ≤ p 1 , p2 ≤ 1 ; 0 ≤q 1 , q 2 ≤ 1;

∑ pi =1; ∑ qi=1
В итоге из всех предположений только два имеют право на существование Из
приведённых расчётов и предположений подходит 1 и 2 решение игрока А.
9
В первом предположении цена игры равна 2,21, а во втором 2,87 и игрок А
хочет максимизировать свой выигрыш. Цена игры во втором случае больше
цены игры в первом случае (2,867>2,21), значит, верно второе предположение.
Отсюда Тогда решением игры будут являться значения частот p1 , p2 , p 3 , q 1 , q 2 и
цены игры ν, оптимальных и смешанных стратегий игроков А и Б со
следующими значениями:
p1=0,730 ;
p2=0 ;
p3=0,270;
q 1=0,533 ;
q 2=0,476 ;
ν=2,877 ;

Решение Графическим методом.


Найдем нижнюю и верхнюю цену игры:
ψ 1 ψ 2 maxmin
φ1 1 5 1
φ2 -2 6 -2
φ3 8 -3 -3
minmax 8 6

Выполняется неравенство ( 1<6 ) , значит, седловой точки нет. Решим игру для
игрока Б. Пусть Б применяет свою смешанную стратегию ψ , а A – свои
чистые стратегии φ 1 , φ2 , φ3 .

При этом частоты должны удовлетворять ограничениям:

0 ≤ pi≤ 1
∑ pi =1

10
Тогда уравнения среднего проигрыша игрока Б:
y 1=a11 q1 +a 12 q2 ; y 1=1 q1 +5 q 2 ;
y 2=a21 q 1+ a22 q 2 ; y 2=−2 q1 +6 q2 ;
y 3=a31 q 1+ a32 q 2 ; y 3 =8 q1−3 q2 ;
q 1+ q2=1 ; q 1+ q2=1 ;

Для решения графическим методом возьмем единичный отрезок OD на оси


абсцисс,на котором точка М* определяет частоты q 1 иq 2 точка (М*) на данном
отрезке (OD) делит его на части, отображающие отношением своей длины к
длине всего отрезка частоты применения стратегий (q 1 и q 2), использование
чистых стратегий ψ 1,ψ 2φ 2 игрока Б. По оси ординат будем определять
значение среднего проигрыша игрока Б.
Выражения для y 1 , y 2 , y 3 — это уравнения прямых. Для построения прямой
достаточно двух точек.
Чтобы найти значения y 1 , y 2 , y 3, нужно взять любые неотрицательные
значения q 1 и q 2, удовлетворяющие уравнению q 1+q 2=1.
Построим график на основе уравнений среднего проигрыша игрока Б при
использовании им смешанной стратегииψ и использовании игроком A
чистых стратегий φ 1 , φ2 , φ3 .
Ось ординат отображает проигрыш игрока Б. Через окончание отрезка
на оси абсцисс строится дополнительная ось ординат.
Прямые на этом графике будут отображать средний проигрыш игрока Б
в зависимости от выбранной стратегии игроком А. Для построения каждой
такой прямой линии достаточно две точки.
Построим график на основе уравнений среднего проигрыша игрока Б при
использовании смешанной стратегииψ и использовании игроком A чистых
стратегий φ 1 , φ2 , φ3 .

Решение игры графическим методом для игрока Б изображено на рисунке 1.

11
φ3

φ2

V φ1

ν1
φ1
M¿
φ2
φ3

Рисунок 1– график отображающий линию гарантированного проигрыша


игрока Б.

Линия для первой Линия для второй Линия для


стратегии стратегии третьей стратегии
Абсцисс 0 1 0 1 0 1
Ординат
1 5 -2 6 8 -3
а

Ломаная линия AMBC φ 3 M φ2— это линия максимальных проигрышей игрока


Б, минимальный из которых равен длине отрезка MМ* = ν1 =2,8, а точка М*
позволяет определить значение q 1=0,53q 1=0,47 , и q 2=0,47.
Решение игры для игрока Б:
q 1=0,53 ;
q 2=0,47 ;

ν1 =2,8 ;

Решим игру для игрока A.

12
Из рисунка 1 заметим, что в точке М* игрок A не будет использовать
стратегию φ 2, так как это приведет к уменьшению (на 7 единиц) проигрыша
игрока Б, а игрок A не допустит этого. Отсюда можно сделать вывод, что в
точке М* стратегия φ 2 является неактивной и частота ее использования p2=0 .
Уравнения выигрыша игрока A при использовании смешанной стратегии φ , а
игроком Б – чистых стратегий ψ 1 и ψ 2 имеет вид:
y 1=1 p1+ 8 p 3 ;
y 3=5 p1−3 p3 .

Графическое решение для игрока A будем осуществлять аналогично


графическому решению для игрока Б.

Линия для первой Линия для второй


стратегии стратегии
Абсцисс 0 1 0 1
Ординат
8 1 -3 5
а

Для построения прямых необходимо отметить точки на оси ординат. Из


условий ограничения значений частоты рассмотрим интервал OD = 1.
Ось ординат отображает выигрыш игрока А. Через окончание отрезка
на оси абсцисс строится дополнительная ось ординат.
Прямые на этом графике будут отображать средний выигрыш игрока А
в зависимости от выбранной стратегии игроком Б. Для построения каждой
такой прямой линии достаточно две точки.
Рассмотрим точку O, в этой точке значения частот p1=0 и p3=1 (т.е. игрок A
применяет только свою чистую стратегию φ 3), тогда получаем значение
первой точки для построения прямой y 1=1 p1+ 8 p 3:
y 1=8

Теперь рассмотрим точку D, в этой точке значения частот p1=1 и p3=0 (т.е.
игрок A использует только свою чистую стратегию φ 1), тогда получаем
значение второй точки для построения прямой y 1=1 p1+ 8 p 3:
y 1=1

Решение игры графическим методом для игрока А изображено на рисунке 2.


13
ψ1
ψ2

ν2 ψ1

M¿
ψ2

Рисунок 2 – график отображающий линию гарантированного выигрыша


игрока А.

Ломаная линия KMF — это линия минимальных выигрышей игрока A,


максимальный из которых равен длине отрезка MM* = ν 2=2,8, а точка M*
позволяет определить значение p1 , p3.
Решение игры для игрока A:
p1=0 , 73 ;
p2=0 ;
p3=0,27 ;
ν 2=2,8 .

Из решений игр для игрока А и игрока Б можно увидеть, что цены игры
равны:
ν=ν 1=ν 2=2,8.
Результаты игры, полученные графическим методом:
p1=0,73 ;

14
p2=0 ;
p3=0,27 ;
q 1=0 , 47 ;
q 2=0,53 ;
q 1=0 , 53 ;
q 2=0,47 ;
ν=2,8 .
pi и q j – частоты использования соответственно чистой стратегии φ i игроком

A и ψ j - игроком Б в своих смешанных стратегиях, а ν – цена игры.

Итеративный метод Брауна.


Один из способов нахождения оптимальной стратегии состоит в том,
что игру проигрывают N раз, выбирая каждый раз ту чистую стратегию,
которая является наиболее выгодной, исходя из накопленных результатов за
все предыдущие партии. Относительные частоты применения этих стратегий
определяют приближенное решение игры.
В каждой партии каждый из игроков выбирает свою наилучшую
чистую стратегию в предположении, что противник использует смешанную
стратегию с относительными частотами появления чистых стратегий в
предыдущих партиях. В первой партии стратегии выбираются произвольно.
Реализуем итеративный метод Брауна в среде Microsoft Excel. Зададим
точность определения цены игры ε =0,01. Пусть первый игрок начинает игру
первой стратегией.
Получим таблицу, в которой указаны итерации, посчитанные при
помощи метода Брауна:

15
Обозначения в таблице:
k – номер итерации;
i k , j k – номера выбранных стратегий;

μi , v i – накопленные за k партий результаты игры для i и j;

γ 1 – средний накопленный проигрыш μi за k партий;

γ 2 – средний накопленный выигрыш vi за k партий;

min γ 1 – нижняя цена игры;

maxγ 2 – верхняя цена игры;

∆ K – абсолютная погрешность определения цены игры.

k – номер хода;
i k , j k – номер сыгранной стратегии в k-ом ходу игроком А и Б
соответственно;
μi– накопленный выигрыш игрока А на k-ом ходу;
γ 2 – средний минимальный накопленный выигрыш на k-ом ходу;
vi – накопленный проигрыш игрока Б на k-ом ходу;
γ 1 – средний максимальный накопленный проигрыш на k-ом ходу;
min γ 1 – минимальный из средних максимальных проигрышей до k-го
хода;
maxγ 2 – максимальный из средних минимальных выигрышей до k-го
хода;
∆ K – разница между min γ 1 иmaxγ 2.

Всего сыграно 15 партий.

16
Игрок А использовал первую стратегию 11 раз, ни разу вторую
стратегию и третью стратегию 4 раза. Частоты появления в смешанных
стратегиях:
11
p1 = =0,733 ;
15

0
p2 = =0 ;
15
4
p3 = =0,267.
15
Игрок В использовал первую стратегию 8 раз и вторую стратегию 7
раз. Частоты появления в смешанных стратегиях:
8
q 1= =0,533 ;
15
7
q 2= =0,467.
15
Приближенное значение цены игры равно:
1 1
ν= ( min y 1+ max y 2 )= ( 2 , 867+2,867 ) =2,867.
2 2

Выводы:
В результате выполнения первой части лабораторной работы тремя
различными методами (аналитический, графический и метод Брауна) были
получены похожие результаты.
Таблица результатов показана ниже:
Графический Аналитический Метод Брауна
метод
p1
0,730 0,73
0,730 0,733
p2 0 0 0
p3
0,270 0,27
0,270 0,267
q1
0,530 0,533
0,533

q2
0,470 0,467
0,476
ν 2,80 2,87 7 2,867

17
Из таблицы видно, что полученные значения похожи. Использованные
методы равносильны и помогают проверить полученные результаты.

Часть 2
Решить заданную игру двумя методами:
 Графический метод;
 Метод Брауна.
18
ψ1 ψ2 ψ3 ψ4 maxmin
φ8 91 33 81 56 33
φ9 89 85 91 97 85
φ 10 59 15 76 91 15
minmax 91 85 91 97
Матрица 1.

Нижняя цена игры совпадает с верхней


φ 9 ψ 2 — седловая точка.

Для избежания игры с седловой точкой заменил элемент φ 9ψ 3 на 80.

Тогда матрица имеет следующий вид:

ψ1 ψ2 ψ3 ψ4 maxmin
φ8 91 33 81 56 33
φ9 89 85 80 97 80
φ 10 59 15 76 91 15
minmax 91 85 91 97
Матрица 2.

Нижняя цена игры не совпадает с верхней, седловая точка отсутствует,


Игра будет происходить с использованием смешанных стратегий.

В данной матрице показаны значения выигрыша игрока A и все возможные


проигрыши игрока Б в зависимости от выбранной стратегии игроками.
Игрок А заинтересован в наибольшем выигрыше, но его выигрыш
равен проигрышу игрока Б, который будет применять стратегию
минимизирующую выигрыш игрока А. Игрок А может рассчитывать на
гарантированный выигрыш из следующих возможных: 56, 33 или 15.
19
Логично, что игрок будет стараться получить наибольшую выгоду,
следовательно, его минимальный выигрыш составит 56. Искомое значение
является нижней ценой игры или же максимином.

У игрока Б задача минимизировать свой проигрыш с учетом того, что


игрок А стремится к обратному, и возможные варианты максимального
проигрыша игрока Б это 97, 91 и 89. В его силах уменьшить свой
максимальный проигрыш до значения 89, искомое значение является верхней
ценой игры или же минимаксом.

Метод Брауна

Разницу между минимальным из средних максимальных проигрышей


игрока Б и максимальным из средних минимальных выигрышей игрока А на
k-ом ходу. Необходимо, чтобы значение было меньше 0.01.

В процессе моделирования может появиться положение, при котором


результаты при различных стратегиях одинаковые, в таком случае будем
применять стратегию с наименьшим порядковым номером.
Представлена таблица 1 итерации с 1-34 и таблица 2 итерации с 1258-
1278.

20
Таблица 1. Ходы игры с 1-34.

21
Таблица 2. Ходы игры с 1258-1278.

K – номер “хода”;
i, j – номер сыгранной стратегии в k-ом ходу игроком А и Б
соответственно;
μ(k) – накопленный выигрыш игрока А на k-ом ходу;
Y2(k) – средний минимальный накопленный выигрыш на k-ом ходу;
V(k) – накопленный проигрыш игрока Б на k-ом ходу;
Y1(k) – средний максимальный накопленный проигрыш на k-ом ходу;
minY1 – минимальный из средних максимальных проигрышей до k-го
хода;
maxY2 – максимальный из средних минимальных выигрышей до k-го
хода;
ΔK – разница между miny1(k) и maxy2(k).

k – номер хода;
i k , j k – номер сыгранной стратегии в k-ом ходу игроком А и Б

соответственно;
μi– накопленный выигрыш игрока А на k-ом ходу;

γ 2 – средний минимальный накопленный выигрыш на k-ом ходу;

vi – накопленный проигрыш игрока Б на k-ом ходу;

γ 1 – средний максимальный накопленный проигрыш на k-ом ходу;

min γ 1 – минимальный из средних максимальных проигрышей до k-го

хода;
max γ 2 – максимальный из средних минимальных выигрышей до k-го

хода;
∆ K – разница между min γ 1 иmaxγ 2.

22
Всего было проведено 2000 итераций. Всего было проведено 1300 итераций.
Необходимо найти частоты использований стратегий игроками А и Б.
Средний максимальный проигрыш игрока Б достиг минимального на 1278
итерации. теперь есть возможность найти частоты для каждой стратегии. Для
наложения частоты для каждой стратегии необходимо посчитать каждое
количество использованных стратегий. Полученное количество нужно
разделить на общее количество стратегий.
Игрок А Игрок Б
Номер стратегии Частота Номер стратегии Частота
1 0,054 1 0

2 0,891 2 0,0667

3 0,064 3 0,9088

4 0

Цена игры = (80,09434 + 80,08451)/2 = 80,089425.

Графический метод.

Предположим, что игрок А играет на смешанной стратегии, а игрок Б


отвечает одной из своих чистых стратегий. Тогда уравнения
гарантированного выигрыша игрока А имеет вид:

y 1=91 p1 +89 p2+ 59 p3

y 2=33 p1 +85 p2 +15 p 3

y 3=81 p1 +80 p2 +76 p 3

y 4 =56 p 1+ 97 p 2+ 91 p3

23
Далее строится пространственная декартова система координат. На оси
абсцисс откладывается единичный отрезок, который показывает частоты 3
стратегий.
Ось аппликат отображает частоту, ось ординат выигрыш игрока А.
Выражения для 𝑦1,𝑦2,𝑦3,𝑦4 являются уравнениями плоскостей. Для
построения плоскости достаточно трёх точек.

Построим график на основе уравнений гарантированного выигрыша игрока


А при использовании им смешанной стратегии 𝜑 и использовании игроком Б
чистых стратегий ψ 1,ψ 2,ψ 3,ψ 4.

Рассмотрим точку S, в этой точке значения частот 𝑝1 = 1, 𝑝2 = 0, 𝑝3 = 0


(т.е. игрок A применяет только свою чистую стратегию 𝜑1), тогда получаем
значение первой точки для построения прямой
𝑦1=91𝑝1+89𝑝2+59𝑝3 : 𝑦1 =91

Рассмотрим точку K, в этой точке значения частот 𝑝1=0, 𝑝2=1,𝑝3=0


(т.е. игрок A применяет только свою чистую стратегию 𝜑2), тогда получаем
значение первой точки для построения прямой
𝑦1=91𝑝1+89𝑝2+59𝑝3 : 𝑦1 =89

Рассмотрим точку X, в этой точке значения частот 𝑝1=0, 𝑝2=0,𝑝3=1


(т.е. игрок A применяет только свою чистую стратегию 𝜑3), тогда получаем
значение первой точки для построения прямой
𝑦1=91𝑝1+89𝑝2+59𝑝3 : 𝑦1 =59

Далее представлены точки для плоскостей среднего выигрыша игрока А:

24
Плоскость для 1 Плоскость для 2 стратегии
стратегии

{p1, p2, p3} {1,0,0 {0,1,0


{0,0,1} {1,0,0} {0,1,0} {0,0,1}
} }
Буквенное S K X A B C
обозначение
Ордината 91 89 59 33 85 15

Плоскость для 3 Плоскость для 4


стратегии стратегии

{p1, p2, p3} {1,0,0


{1,0,0} {0,1,0} {0,0,1} {0,1,0} {0,0,1}
}
Буквенное D F E N O P
обозначение
Ордината 81 80 76 56 97 91

График выигрыша для игрока А показан на рисунке 3.

25
Рисунок 3 – график отображающий линию гарантированного выигрыша
игрока А.

26
Из графика получаем:
 Длина всего единичного отрезка 90 мм;
 Длина первого отрезка – 5 мм;
 Длина второго отрезка – 6 мм;
 Длина третьего отрезка – 79 мм.
Цена игры = 80.

Из этого следует:
 Частота использования первой стратегии – 5/90 = 0.05;
 Частота использования второй стратегии – 6/90 = 0.06;
 Частота использования третьей стратегии – 79/90 = 0.89.

Теперь начинается построение графика для игрока Б.


Сперва необходимо определить его неактивную стратегию, для этого
надо обратиться к рисунку 3. Поверхность гарантированного проигрыша
игрока Б образуется из поверхностей среднего проигрыша по стратегиям 1, 2
и 3 игрока А, отсюда следует, что 4 стратегия является неактивной.

Игрок Б применяет свою стратегию φ , а игрок А – свою чистую


стратегию ψ 1. Тогда первое уравнение имеет вид:

y 1=91 q 1+ 33 q2 +81 q3

Таким образом получаются уравнения:

y 1=91 q 1+ 33 q2 +81 q3

y 2=89 q 1+ 85 q2 +80 q 3

27
y 3=59 q 1+ 15 q2 +76 q3

Также строится пространственная декартова система координат. На оси


абсцисс откладывается единичный отрезок, отображающий сумму частот
трёх стратегий. Ось аппликат отображает частоту одной стратегии – первой.
Ось ординат – проигрыша игрока Б.

Далее представлены точки для плоскостей среднего проигрыша игрока Б:

Плоскость для 1 Плоскость для 2 стратегии


стратегии

{q1, q2, q3} {1,0,0 {0,1,0


{0,0,1} {1,0,0} {0,1,0} {0,0,1}
} }
Буквенное S K X A B C
обозначение
Ордината 91 33 81 89 85 80

Плоскость для 3 стратегии

{1,0,0} {0,1,0} {0,0,1}


D E F
59 15 76

График проигрыша для игрока Б показан на рисунке 4.

28
Рисунок 4 – график отображающий линию гарантированного проигрыша для
игрока Б.
29
Из графика получаем:
 Длина всего единичного отрезка 90 мм;
 Длина первого отрезка – 0мм;
 Длина второго отрезка – 6 мм;
 Длина третьего отрезка – 85 мм.

Из этого следует:
 Частота использования первой стратегии – 0;
 Частота использования второй стратегии – 6/90 = 0.0667;
 Частота использования третьей стратегии – 85/90 = 0.8993.

Выводы.

30
Во второй части лабораторной работы использовались графический
метод и метод Брауна. Для сравнения результатов ниже приведена таблица
частот и цены игры полученных этими методами.

Графический Метод Брауна


Цена игры 80 80,089425
Первая стратегия 0.05 0,054
игрока А (φ 1)
Вторая стратегия 0.89 0,891
игрока А (φ 2)
Третья стратегия 0.06 0.064
игрока А (φ 3)
Четвертая стратегия 0 0
игрока А (φ 4)
Первая стратегия 0 0
игрока Б (ψ 1)
Вторая стратегия 0.0667 0,0667
игрока Б (ψ 2)
Третья стратегия 0.8993 0,9088
игрока Б (ψ 3)

Из таблицы видно, что полученные значения похожи. Использованные


методы равносильны и помогают проверить полученные результаты.

31

Вам также может понравиться