Академический Документы
Профессиональный Документы
Культура Документы
НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ
УНИВЕРСИТЕТ
Вариант №26
26.04.2020
Очень много синтаксических ошибок? Проставьте запятые, невозможно читать.!
Замечания – см примечания по работе. Исправляйте в соответствии с инструкцией,
выложенной в lms.
Ю.В.
Выполнил:
студент группы М3О-414Б
Соколов Алексей Михайлович
+79169903046
Принял:
доцент, к.т.н.
Горбачев Юрий Васильевич
1
Москва, 2020
ЗАДАНИЕ 1
Решить заданную игру тремя методами:
Аналитический метод;
Графический метод;
Метод Брауна.
ψ1 ψ2 maxmin
φ1 1 5 1
φ2 -2 6 -2
φ3 8 -3 -3
minmax 8 6
0 ≤ p i ≤ 1; 0 ≤ q i ≤ 1;
2
2) Свойство следует из первого – Сумма частот равняется 1, как сумма
чисел использования отдельных стратегий равняется общему числу
использования всех стратегий.
∑ pi =1; ∑ qi=1
a I1I =1 p 1−2 p2 +8 p3
a I2I =5 p 1+ 6 p 2−3 p 3
a II =a1I I q1 +a I2I q 2
a II =( 1 p1 −2 p2 +8 p3 ) q1 + ( 5 p1 +6 p2−3 p3 ) q 2 ;
a I1=1 q1 +5 q2
a I2=−2 q1 +6 q 2
a I3=8 q1 −3 q2
∂FI
=−2 q1 +6 q 2=ν 1 ;
∂ p2
∂FI
=8 q1−3 q 2=ν 1 ;
∂ p3
∂FI
=−2 p2 +8 p3=ν 2 ;
∂ q1
∂FI
=6 p 2−3 p 3=ν 2 ;
∂ q2
∂FI
=−p 3− p2 +1=0 ;
∂ ν1
∂FI
=−q2 −q1 +1=0;
∂ ν2
4
−2 q1 +6 q 2=ν 1 ; −2 p2 +8 p 3=ν 2 ;
{ {
8 q1−3 q 2=ν1 ; 6 p2−3 p3=ν 2 ; (2)
q 1+ q2 =1; p2 + p3=1.
{ {
−10 q1 +9 q 2=0 ; −8 p 2+11 p3 =0 ;
q 1+ q2=1 ; p 2+ p3 =1.
{ {
−10(1−q2 )+ 9 q2=0; −8 ( 1− p3 ) + 11 p 3=0 ;
q 1=1−q 2 ; p2=1− p3 ;
{ q 2=0,526 ;
q1=1−q 2=0,474 ; {
−8 ( 1− p3 ) +11 p3=0 ;
p2=1− p 3 ;
ν 1=2,21; −2 p2 +8 p3=ν 2 ;
{
q2 =0,526 ;
{ p 3=0,421 ;
q1 =0,474 ; p2=1−0,421=0,579 ;
ν 1=2,21; ν 2=0,788 ;
{ {
q2 =0,526 ; p3 =0,421;
q1 =0,474 ; p2=0,579;
{ {
q2 =0,526 ; p 3=0,421 ;
ν 1=2,21; ν 2=0,788 ;
p2=0,579 ;
p3=0,421;
ν 2=0,788 ;
5
q 1=0,474 ;
q 2=0,526 ;
ν1 =2,21;
0 ≤ p 3 , p2 ≤1 ; 0 ≤ q1 ,q 2 ≤ 1 ;
∑ pi =1; ∑ qi=1
∂FI
=1q 1+ 5 q2=ν 1 ;
∂ p1
∂FI
=8 q1−3 q 2=ν 1 ;
∂ p3
∂FI
=1 p1 +8 p3=ν 2 ;
∂ q1
∂FI
=5 p1 −3 p3 =ν 2 ;
∂ q2
6
∂FI
=−p 3− p1 +1=0 ;
∂ ν1
∂FI
=−q1 −q2 +1=0.
∂ ν2
{ {
8 q1−3 q2=ν 1 ; 5 p1−3 p3 =ν 2 ; (3)
q1 +q 2=1; p 1+ p 3=1.
{ {
−7 q1 +8 q 2=0 ; −4 p1 +11 p3=0;
q 1+ q2=1 ; p1 + p3=1.
{ {
−7 ( 1−q 2 ) +8 q 2=0 ; −4 ( 1− p 3 )+ 11 p 3=0 ;
q1=1−q2 ; p1=1−p 3 ;
{ q 2=0,467 ;
{ p3=0,267 ;
q1=1−0,467=0,533 ; p1=1−0,267=0,733 .
{ {
q2 =0,467 ; p3 =0,267 ;
ν 1=2,867 ; ν 2=0,267 .
7
Предположение, что 2 стратегия игрока А является неактивной, имеет
место быть, т.к. полученные частоты удовлетворяют условиям:
0 ≤ p 3 , p1 ≤ 1 ; 0 ≤q 1 ,q 2 ≤ 1 ;
∑ pi =1; ∑ qi=1
1∙ 0,733+8 ∙ 0,267=2,867 ;
{5∙ 0,733−3 ∙0,267=2,867 ;
0,733+0,267=1.
8
1 q1 +5 q2 =ν 1 ; 1 p 1−2 p 2=ν 2 ;
{ {
−2 q1 +6 q 2=ν 1 ; 5 p1+ 6 p 2=ν 2 ; (4 )
q1 +q2 =1; p1 + p2=1.
{ {
3 q1 −1q 2=0 ; −4 p1 −8 p 2=0 ;
q 1+ q2=1 ; p1 + p 2=1.
{ {
3 ( 1−q 2 )−1 q2 =0 ; −4 ( 1− p2 ) −8 p2=0 ;
q1=1−q2 ; p 1=1− p2 ;
{ q 2=0,75 ;
{
p 2=−1 ;
q1=1−0,75=0,25 ; p1=1+1=2.
{ {
q2 =0,75 ; p2=−1;
ν 1=4 ; ν 2=4.
0 ≤ p 1 , p2 ≤ 1 ; 0 ≤q 1 , q 2 ≤ 1;
∑ pi =1; ∑ qi=1
В итоге из всех предположений только два имеют право на существование Из
приведённых расчётов и предположений подходит 1 и 2 решение игрока А.
9
В первом предположении цена игры равна 2,21, а во втором 2,87 и игрок А
хочет максимизировать свой выигрыш. Цена игры во втором случае больше
цены игры в первом случае (2,867>2,21), значит, верно второе предположение.
Отсюда Тогда решением игры будут являться значения частот p1 , p2 , p 3 , q 1 , q 2 и
цены игры ν, оптимальных и смешанных стратегий игроков А и Б со
следующими значениями:
p1=0,730 ;
p2=0 ;
p3=0,270;
q 1=0,533 ;
q 2=0,476 ;
ν=2,877 ;
Выполняется неравенство ( 1<6 ) , значит, седловой точки нет. Решим игру для
игрока Б. Пусть Б применяет свою смешанную стратегию ψ , а A – свои
чистые стратегии φ 1 , φ2 , φ3 .
0 ≤ pi≤ 1
∑ pi =1
10
Тогда уравнения среднего проигрыша игрока Б:
y 1=a11 q1 +a 12 q2 ; y 1=1 q1 +5 q 2 ;
y 2=a21 q 1+ a22 q 2 ; y 2=−2 q1 +6 q2 ;
y 3=a31 q 1+ a32 q 2 ; y 3 =8 q1−3 q2 ;
q 1+ q2=1 ; q 1+ q2=1 ;
11
φ3
φ2
V φ1
ν1
φ1
M¿
φ2
φ3
ν1 =2,8 ;
12
Из рисунка 1 заметим, что в точке М* игрок A не будет использовать
стратегию φ 2, так как это приведет к уменьшению (на 7 единиц) проигрыша
игрока Б, а игрок A не допустит этого. Отсюда можно сделать вывод, что в
точке М* стратегия φ 2 является неактивной и частота ее использования p2=0 .
Уравнения выигрыша игрока A при использовании смешанной стратегии φ , а
игроком Б – чистых стратегий ψ 1 и ψ 2 имеет вид:
y 1=1 p1+ 8 p 3 ;
y 3=5 p1−3 p3 .
Теперь рассмотрим точку D, в этой точке значения частот p1=1 и p3=0 (т.е.
игрок A использует только свою чистую стратегию φ 1), тогда получаем
значение второй точки для построения прямой y 1=1 p1+ 8 p 3:
y 1=1
ν2 ψ1
M¿
ψ2
Из решений игр для игрока А и игрока Б можно увидеть, что цены игры
равны:
ν=ν 1=ν 2=2,8.
Результаты игры, полученные графическим методом:
p1=0,73 ;
14
p2=0 ;
p3=0,27 ;
q 1=0 , 47 ;
q 2=0,53 ;
q 1=0 , 53 ;
q 2=0,47 ;
ν=2,8 .
pi и q j – частоты использования соответственно чистой стратегии φ i игроком
15
Обозначения в таблице:
k – номер итерации;
i k , j k – номера выбранных стратегий;
k – номер хода;
i k , j k – номер сыгранной стратегии в k-ом ходу игроком А и Б
соответственно;
μi– накопленный выигрыш игрока А на k-ом ходу;
γ 2 – средний минимальный накопленный выигрыш на k-ом ходу;
vi – накопленный проигрыш игрока Б на k-ом ходу;
γ 1 – средний максимальный накопленный проигрыш на k-ом ходу;
min γ 1 – минимальный из средних максимальных проигрышей до k-го
хода;
maxγ 2 – максимальный из средних минимальных выигрышей до k-го
хода;
∆ K – разница между min γ 1 иmaxγ 2.
16
Игрок А использовал первую стратегию 11 раз, ни разу вторую
стратегию и третью стратегию 4 раза. Частоты появления в смешанных
стратегиях:
11
p1 = =0,733 ;
15
0
p2 = =0 ;
15
4
p3 = =0,267.
15
Игрок В использовал первую стратегию 8 раз и вторую стратегию 7
раз. Частоты появления в смешанных стратегиях:
8
q 1= =0,533 ;
15
7
q 2= =0,467.
15
Приближенное значение цены игры равно:
1 1
ν= ( min y 1+ max y 2 )= ( 2 , 867+2,867 ) =2,867.
2 2
Выводы:
В результате выполнения первой части лабораторной работы тремя
различными методами (аналитический, графический и метод Брауна) были
получены похожие результаты.
Таблица результатов показана ниже:
Графический Аналитический Метод Брауна
метод
p1
0,730 0,73
0,730 0,733
p2 0 0 0
p3
0,270 0,27
0,270 0,267
q1
0,530 0,533
0,533
q2
0,470 0,467
0,476
ν 2,80 2,87 7 2,867
17
Из таблицы видно, что полученные значения похожи. Использованные
методы равносильны и помогают проверить полученные результаты.
Часть 2
Решить заданную игру двумя методами:
Графический метод;
Метод Брауна.
18
ψ1 ψ2 ψ3 ψ4 maxmin
φ8 91 33 81 56 33
φ9 89 85 91 97 85
φ 10 59 15 76 91 15
minmax 91 85 91 97
Матрица 1.
ψ1 ψ2 ψ3 ψ4 maxmin
φ8 91 33 81 56 33
φ9 89 85 80 97 80
φ 10 59 15 76 91 15
minmax 91 85 91 97
Матрица 2.
Метод Брауна
20
Таблица 1. Ходы игры с 1-34.
21
Таблица 2. Ходы игры с 1258-1278.
K – номер “хода”;
i, j – номер сыгранной стратегии в k-ом ходу игроком А и Б
соответственно;
μ(k) – накопленный выигрыш игрока А на k-ом ходу;
Y2(k) – средний минимальный накопленный выигрыш на k-ом ходу;
V(k) – накопленный проигрыш игрока Б на k-ом ходу;
Y1(k) – средний максимальный накопленный проигрыш на k-ом ходу;
minY1 – минимальный из средних максимальных проигрышей до k-го
хода;
maxY2 – максимальный из средних минимальных выигрышей до k-го
хода;
ΔK – разница между miny1(k) и maxy2(k).
k – номер хода;
i k , j k – номер сыгранной стратегии в k-ом ходу игроком А и Б
соответственно;
μi– накопленный выигрыш игрока А на k-ом ходу;
хода;
max γ 2 – максимальный из средних минимальных выигрышей до k-го
хода;
∆ K – разница между min γ 1 иmaxγ 2.
22
Всего было проведено 2000 итераций. Всего было проведено 1300 итераций.
Необходимо найти частоты использований стратегий игроками А и Б.
Средний максимальный проигрыш игрока Б достиг минимального на 1278
итерации. теперь есть возможность найти частоты для каждой стратегии. Для
наложения частоты для каждой стратегии необходимо посчитать каждое
количество использованных стратегий. Полученное количество нужно
разделить на общее количество стратегий.
Игрок А Игрок Б
Номер стратегии Частота Номер стратегии Частота
1 0,054 1 0
2 0,891 2 0,0667
3 0,064 3 0,9088
4 0
Графический метод.
y 4 =56 p 1+ 97 p 2+ 91 p3
23
Далее строится пространственная декартова система координат. На оси
абсцисс откладывается единичный отрезок, который показывает частоты 3
стратегий.
Ось аппликат отображает частоту, ось ординат выигрыш игрока А.
Выражения для 𝑦1,𝑦2,𝑦3,𝑦4 являются уравнениями плоскостей. Для
построения плоскости достаточно трёх точек.
24
Плоскость для 1 Плоскость для 2 стратегии
стратегии
25
Рисунок 3 – график отображающий линию гарантированного выигрыша
игрока А.
26
Из графика получаем:
Длина всего единичного отрезка 90 мм;
Длина первого отрезка – 5 мм;
Длина второго отрезка – 6 мм;
Длина третьего отрезка – 79 мм.
Цена игры = 80.
Из этого следует:
Частота использования первой стратегии – 5/90 = 0.05;
Частота использования второй стратегии – 6/90 = 0.06;
Частота использования третьей стратегии – 79/90 = 0.89.
y 1=91 q 1+ 33 q2 +81 q3
y 1=91 q 1+ 33 q2 +81 q3
y 2=89 q 1+ 85 q2 +80 q 3
27
y 3=59 q 1+ 15 q2 +76 q3
28
Рисунок 4 – график отображающий линию гарантированного проигрыша для
игрока Б.
29
Из графика получаем:
Длина всего единичного отрезка 90 мм;
Длина первого отрезка – 0мм;
Длина второго отрезка – 6 мм;
Длина третьего отрезка – 85 мм.
Из этого следует:
Частота использования первой стратегии – 0;
Частота использования второй стратегии – 6/90 = 0.0667;
Частота использования третьей стратегии – 85/90 = 0.8993.
Выводы.
30
Во второй части лабораторной работы использовались графический
метод и метод Брауна. Для сравнения результатов ниже приведена таблица
частот и цены игры полученных этими методами.
31