Вы находитесь на странице: 1из 10

Элементы теории игр как

обобщение теории управления


ВЫПОЛНИЛА: ГЛУХОВА МАРИНА,
УЧЕНИЦА 10«А» КЛАССА
РУКОВОДИТЕЛЬ: ПРОФЕССОР КАФЕДРЫ
АВТОМАТИЗИРОВАННЫХ СРЕДСТВ
СПЕЦИАЛЬНОГО НАЗНАЧЕНИЯ
Цель и задачи
Цель работы - изучить основные понятия теории управления и
теории игр и разработать алгоритмы для отдельных прикладных
задач. Поставлены следующие задачи:
• Обосновать возможность применения этих сфер при
разработке систем и стратегий поведения взаимодействующих
объектов
• Рассмотреть методы теории управления, которые могут быть
использованы в задачах теории игр
• Исследовать применимость разработанных методов
составления алгоритмов в прикладных задачах из различных
областей
Структура системы управления
𝑠 𝑡 – состояние системы;
𝜉 𝑡 – воздействие внешней
среды;
ℎ 𝑡 - наблюдение состояния
системы подсистемой принятия
решений;
𝑥 𝑡 - управление (управляющий
процесс);
𝑢 𝑡 - реализованное управление.

Стратегия – оператор, формирующий воздействия на предмет в зависимости от


наблюдений состояния объекта, поступающих из канала наблюдения H.
Пример использования принципа Беллмана
Что такое игра?
• Игра - математическая модель конфликта
• Ведется по определенным правилам
Игра n лиц определяется:
• множеством стратегий игроков: 𝒳𝑖 , где 𝑖 - различные игроки;
• множеством ситуаций 𝒳 = 𝒳1 × 𝒳2 × ⋯ × 𝒳𝑛 , образованных
стратегиями
• Функциями 𝑄𝑖 , которые определяют выигрыш 𝑖 −го игрока в
ситуации
Равновесие Нэша
Равновесие Нэша — ситуация, в которой
два или более игрока участвуют со своей
стратегией, где ни один участник не
сможет увеличить выигрыш, изменив
только свою стратегию при сохранении ее
другими.

Пример матричной игры


𝑄(1,1) 𝑄(1,2) 0 2
𝑄= =
𝑄(2,1) 𝑄(2,2) 1 4
Джон Форбс Нэш Равновесная ситуация
(1925 – 2015)
Пример биматричной игры

𝑄1 (1,1) 𝑄1 (1,2) 0 4
𝑄1 = =
𝑄1 (2,1) 𝑄1 (2,2) 5 1

𝑄2 (1,1) 𝑄2 (1,2) 6 0
𝑄2 = =
𝑄2 (2,1) 𝑄2 (2,2) 1 3
Игра Ним

(n) (n)

Изначальное Выигрышная ситуация Выигрышная ситуация


расположение вида «1 𝑛 0» вида «0 𝑛 0»
Нахождение максимальной нагрузки
Заключение
• Рассмотрена универсальность принципов динамического
программирования для управления детерминированными и
стохастическими системами.
• Показана возможность применения методов теории управления
в практических задачах формирования стратегий
функционирования комплексов и принятия решений в условиях
конфликта.
• Построены программы, демонстрирующие работу примеров
алгоритмов, которые доступны для использования на практике
или для ознакомления с предметной областью.