Вы находитесь на странице: 1из 25

На правах рукописи

Федеральное государственное бюджетное учреждение науки


Инсттуг проблем управления им. В.А. Трапезникова
Российской академии наук

Базенков Николай Ильич

ТЕОРЕТИКО-ИГРОВЫЕ АЛГОРИТМЫ ФОРМИРОВАНИЯ


ДЕЦЕНТРАЛИЗОВАННЫХ БЕСПРОВОДНЫХ СЕТЕЙ

Специальность: 05.13.11 — Математическое и программное обеспечение


вычислительных машин, комплексов и компьютерных сетей

АВТОРЕФЕРАТ
диссертации на соискание ученой степени
кандидата технических наук

13 ФЕВ 20и

Москва
2014

005545153
Работа выполнена в Федеральном государственном бюджетном учрежденш науки
Институте проблем управления им. В.А. Трапезникова Российской академии
наук.

Научный руководитель: доктор технических наук, профессор


Кузнецов Олег Петрович,

Официальные оппониггы: Еремеев Александр Павлович,


д.т.н., проф., Национальный исследовательский
университет «МЭИ», заведующий кафедрой
прикладной математики;
Тарасов Валерий Борисович,
K.T.H., доцент, Московский Государственный

Технический Университет имени Н.Э. Баумана,


заместитель по науке заведующего кафедрой
«Компьютерные системы автоматизации
производства»
Ведущая организация: Федеральное государственное бюджетное
учреждение науки Институт системного
анализа Российской академии наук (ИСА РАН)

Защита состоится « S » 2014 г. в 1 1 час. на заседании диссертаци-


онного совета Д002.226.03 при Институте проблем управления РАН (ИЛУ РАН)
по адресу: 117997, Москва, ул. Профсоюзная, д. 65, малый конференц-зал.

С диссертацией можно ознакомиться в библиотеке ИПУ РАН

Автореферат разослан «"iQ) 2014 г.

Ученый секретарь диссертационного


совета Д002.226.03,
кандидат технических наук, Кулинич A.A.
Общая характеристика работы

Актуальность темы исследования. В работе рассматриваются децентра-


лизованные беспроводные сети с нефиксированной топологией, к которым от-
носятся сенсорные сети, мобильные ad hoc сети и др. Они используются для
распределенного сбора данных, организации связи в нолевых условиях, расши-
рения пропускной способности обычных сотовых сетей и решения других задач,
где требуется создать коммуникационную сеть без какой-либо дополнительной
инфраструктуры, кроме самих беспроводных узлов. Такие сети состоят из боль-
шого числа устройств, как правила, работающих от автономных аккумуляторов.
Поскольку заряд аккумуляторов ограничен, задача обеспечения энергоэффекгив-
пости является одной из основных при управлении ad hoc сетями.
Один из методов увеличения времени жизни сети заключается в формиро-
вании эффективной топологии. Узлы настраивают мощности своих передатчиков
таким образом, чтобы граф сети обладал заданными свойствами и суммарная
мощность бьша, по возможности, минимальна. 1Сак правило, использование цен-
трализованных алгоритмов невозможно по причине отсутствия в сети единого
управляющего центра, ограниченного обмена информацией и малых вычисли-
тельных мощностей узлов. Среди децентрализованных алгоритмов формирова-
ния сетей используются, в том числе, методы теории игр, которые сейчас аьсгивно
применяются для решения самых разных задач в управлешш беспроводными се-
тями.
Теория игр рассматривает взаимодействие независимых игроков, или аген-
тов, 1П1тересы которых могут не совпадать. В компьютерных сетях методы тео-
рии игр используются для разработки алгоритмов распределенной оптимизации.
Вместо решения централизованной задачи каждому узлу сети задается индиви-
дуальная функция полезности, которую он стремится максимизировать. При этом
агенты не координируют свои действия. Такой подход удобен в том случае, ко-
гда каждый узел должен использовать только локальную информацию и обмен
дополнительными сообщениями между узлами нежелателен.
Теоретико-шровым алгоритмам управления беспроводными сетями посвя-
щено множество исследова1шй. В данной работе развиваются методы, предло-
женные S. Eidenbenz, S. Zust (Los Alamos National Laboratory, США), V.S. Kumar,
A.B. MacKenzie, R.P. Gilles (Virginia Polytechnic Institute and State University,
3
Ж
США). В России работы по применению теории игр в беспроводных сетях прово-
дились в Карельском научном центре РАН, Санкт-Петербургском государствен-
ном университете, Нижегородском государственном техническом з^иверситете
им. P.E. Алексеева.
Использованный в задачах формирования сетей метод последовательных
наилучших ответов имеет недостатки, связанные с тем, что получаемые им равно-
весия могут сильно отличаться от оптимального. Также при использовании этого
метода сохраняют устойчивость недопустимые равновесия. Поэтому актуальной
задачей является разработка новых методов поиска равновесий, повышающих
эффективность алгориткюв.
Объектом исследования является задача формирования связной сети при
минимальной суммарной мощности узлов. На плоскости расположено множе-
ство узлов, которые могут изменять мощности своих передатчиков. Необходимо
назначить каждому узлу такую мощность, чтобы сеть была связна и сумма всех
мощностей была минимальна.
Предметом исследования является новый метод выбора агентами своих
действий, названный двойным наилучшим ответом. Изучается эффективность
этого метода в алгоритмах формирования сети.
Целью диссертационной работы является разработка алгоритмов форми-
рования сети на основе метода двойного наилучшего ответа.
В ходе достижения поставленной цели были решены следующие задата:

1. Проведен обзор приложений теории игр к задачам управления и оптимиза-


ции в беспроводных сетях, в том числе к задаче формирования эффективной
топологии сети. Обзор показал, что разработка новых теоретико-игровых
алгоритмов формирования сетей является актуальной научной и практиче-
ской задачей.

2. Предложен новый метод принятия решения агентами - двойной наилучший


ответ. Метод основан на идеях теории рефлексивных игр. Доказано, что в
задаче формирования связной сети новый метод делает неустойчивыми все
недопустимые равновесия.

3. На основе метода двойного наилучшего ответа разработано два алгоритма


формирования сети. Показано, что новые алгоритмы получают в среднем
более эффективные равновесия, чем стандартный метод наилучшего ответа.

4. Предложена схема реализации метода двойного наилучшего ответа, иссле-


дована ее вычислетельная и коммуникационная сложность.

5. Разработан программный комплекс имитационного моделирования процес-


са формирования сети. Комплекс использовался для исследования эффек-
тивности алгоритмов и визуализации результатов.

Связь с планом. Работа выполнена в соответствш! с плановой тематикой


Института проблем управления РАН им. В.А. Трапезнжова и при поддержке
грантов РФФИ 10-07-00104, 13-07-00491.
Методы исследования. В основе методологии исследования лежат методы
теории игр, а также имитационное моделирование. Полученные аналитические
результаты базируются на методах теории графов и теории некооперативных
игр. Исследование эффективности алгоритмов формирования сети проведено с
помощью имитационного моделирования, методика проведения экспериментов
описана в работе.
Научная новизна работы заключается в следующем:

1. Предложен оригинальный метод двойного наилучшего ответа, основанный


на подходе рефлексивных игр. Методы стратегической рефлексии ранее
применялись в задачах управления социально-экономическими системами.
В технических системах стратегическая рефлексия применялась для по-
вьппения эффективности проникновения агетх)в через линию обороны. В
задачах формирования сетей методы рефлексивных игр применены впер-
вые.

2. Получена оценка неэффективности равновесия Нэша в рассматриваемой


игре формирования связной сети.

3. Доказано, что для игры формирования сети метод двойного наилучшего


ответа делает неустойчивыми все равновесия, в которых сеть не связна.
Это эквивалентно тому, что в рассматриваемой игре все равновесия, не оп-
тимальные по Парето, будут неустойчивыми при использовании двойного
наилучшего ответа.
4. Разработанные алгоритмы формирования сети показывают лучшие резуль-
таты, чем традиционный теоретико-игровой алгоритм. Это позволяет пред-
положить, что 0Ш1 могут быть применены и в других задачах, где исполь-
зуются методы теории игр.

5. Получены оценки сложности разработанных алгоритмов и базового ал-


горитма наилучшего ответа. Предложенный алгоритм поиска наилучшего
ответа для рассматргтаемой игры нигде в литературе не описан.

Практическая зпачимость работы определяется разработанным комплек-


сом имитационного моделирования, а также эффективностью разработанных ал-
горитмов, что позволит сэкономить мощность и продлить время жизни реальных
беспроводных сетей. Разработанные в работе процедуры могут бьггь адаптиро-
ваны для различных теоретико-игровых задач, а также дня анализа социальных
сетей.
Достоверность результатов обусловлена использованными методами тео-
рии игр, теории графов и имитационным моделированием. Использованный про-
граммный комплекс, исходные тестовые примеры и полученные данные экспери-
ментов находятся в открытом доступе, что обеспечивает достоверность резуль-
татов исследования.
Положения, выносимые на защиту:

1. Предложен новый метод принятия решешя агентом, названный двойным


наилучшим ответом. Доказано, что для рассматриваемой игры формиро-
вания сети предложенный метод делает неустойчивыми все неоптималь-
ные по Парето равновесия Нэша. Для рассматриваемой игры получена не
встречавшаяся ранее оценка для отношения затрат в наихудшем равновесии
Нэша к оптимальному равновесию.

2. На основе предложенного метода разработано два алгоритма формирования


беспроводной сети. В первом алгоритме используется статический метод
принятия решения, во втором агенты динамически переключаются между
обычным наилучшим ответом и двойным наилучшим ответом. Показано,
что разработанные алгоритмы позволяют сузеть множество получаемых
равновесий по сравнению с базовым алгоритмом наилучшего ответа.
3. Исследована эффективность предложенных алгоритмов. Показано, что раз-
работанные алгоритмы формируют более эффективные сети, чем известный
теоретико-игровой алгоритм наилучшего ответа.

4. Предложены схемы реализации алгоритмов базового наилучшего ответа и


двойного наилучшего ответа. Получены оценки вычислительной и комму-
никационной сложности предложенных алгоритмов.

5. Разработан программный комплекс имитационного моделирования, имею-


щий потецциальпые приложения для анализа других теоретико-игровых
задач, а также для анализа процессов в социальных сетях.

Апробация работы. Результаты диссертационной работы докладывались


на семинарах ИПУ РАН, VII Всероссийской школе-семинаре молодых ученьпс
«Управление большими системами» (Магнитогорск, 2011), I и II Международ-
ных школах-семинарах молодых ученых «Интеллектуальные системы и техноло-
гии: проблемы и перспективы» (Тверь-Протасово, 2012,2013), VI Международной
конференции «Game Theory and Management» (Санкт-Петербург, 2012), Между-
народном семинаре «Networking Games and Management» (Петрозаводск, 2012),
VI Всероссийской мультиконференции по проблемам управления (Дивноморское,
2013).
Программный комплекс прошел апробацию и используется в аналитиче-
ском агентстве «Новые стратегии», что подтверждается актом о внедрении.
Публикации. По теме диссертационной работы опубликовано 11 печатных
работ, в том числе 2 в рецегоируемых изданиях, рекомендуемых ВАК.
Личный вклад автора. Все результаты получены автором.
Объем и структура работы. Диссертация состоит го введения, 3 глав, за-
ключения, библиографии, включающей 122 наименования, и приложения. Общий
объем диссертации составляет 125 страниц.
Содержание работы

Во введении обоснована актуальность диссертационной работы, сформу-


лированы цели и задачи исследования, перечислены полученные результаты, по-
казана научная и практическая значимость работы и представлены положения,
выносимые на защиту.
В первой главе диссертации проведен обзор исследований, посвященных
применению теории игр к задачам управления и оптимизации в беспроводных
сетях. Начиная с 2003-2004 годов наблюдается существенный рост исследова-
тельской активности по данной тематике.
Проведенная классификация исследований показала, что используется ши-
рокий спектр методов теории шр. В данной работе рассматриваются методы
некооперативной теории игр, которая исследует взаимодействия независимых
субъектов, или агентов, стремящихся максимизировать свой вьгагрьпц.
Далее рассматривается определенный тип беспроводных сетей - ad hoc
сети, иногда называемые самоорганизующимися. Сетями ad hoc {лат. создан-
ный для данного случая) называют беспроводные сети, для создания которых не
требуется никакой дополнительной инфраструктуры, кроме самих беспроводных
узлов. Такие сети используются для связи в полевых условиях, распределенного
сбора и обработки данных, расширения пропускной способности сотовых сетей
и т.д. Рассмотрены основные типы самоорганизующихся сетей, а также некото-
рые актуальные задачи.
Устройства в таких сетях часто работают от автономных аккумуляторов, по-
этому много внимашш уделяется увеличетшю времени жизни сети. Управлением
топологией (topology control) называют методы повышения знергоэффективпо-
сти за счет формирования и поддержания эффективной топологии сети. Здесь
рассматривается только этап формирования сети.
Узлы сети могут устанавливать разные мощности своих передатчиков. Необ-
ходимо получить такой вектор мопцюстей узлов р, чтобы граф сети д{р) обладал
заданными свойствами: связностью или к-связностью, ограниченной длиной пу-
тей и максимальной степенью узлов, разреженностью связей. При этом обычно
стараются минимизировать суммарную мощность узлов.
Большинство задач формирования оптимальной сети относятся к классу
АГР-трудных. Поэтому вместо поиска точного репюния используются эвристиче-
8
ские алгоретмы, которые можно условно разделить на геометрические и графо-
вые.
Геометрические используют модель сети, в которой зона действия пере-
датчика представляет собой круг радиуса г. Далее формируется геометрический
1-раф, обладающий некоторыми полезными свойствами. Алгоритм LMST форми-
рует локально-минимальное остовное дерево, алгоритм СВТС - так называемый
граф Яо (Yac graph). Такие алгоритмы требуют наличия информации о располо-
жении узлов, что часто не выполнимо. Графовые алгоритмы функционируют, не
используя геометрическую модель сети, а оценивая состояние связи с каждым из
соседей. Например, в алгоритме ХТС каждый узел ранжирует своих соседей по
качеству связи, затем устанавливает к лучших связей.
Перечисленные алгоритмы имеют ряд недостатков. Во-первых, для успеш-
ной работы все узлы сети должны использовать один алгоршгм, что может создать
проблемы, коща в сети используются узлы разных производителей, поскольку
единых стандартов формирования топологии пока не существует. Во-вторых, мо-
жет возникнуть необходимость модифицировать критерий качества. Например,
кроме связности сети учесть еще и длину путей. В третьих, разные узлы могут
иметь pa3HjTO емкость источников питания, следовательно, "цена" мощности для
них может быть разной. Один из возможных подходов к решению этих проблем
заключается в переходе к задачам и методам теории игр.
Теоретико-игровые алгортмы отличаются тем, что предполагают ка^кдый
узел самостоятельным агентом, не координирующим свои действия с другими
узлами. В работах, исследующих теоретико-игровые алгоритмы, наиболее часто
применяется схема поиска равновесия, основанная на последовательном приме-
нении узлами правила наилучшего ответа. Этот метод имеет ряд недостатков.
Во-первых, полученное равновесие часто сильно отличается от оптимального.
Во-вторых, при неправильных начальных условиях или случайной ошибке ал-
горитм может получить недопустимое равновесие, когда сеть не связна. Данная
работа посвящена исследованию нового правила выбора действия, призванного
повысить эффективность теоретико-игровых алгоритмов.
Во второй главе приводится формальная постановка задачи, даются опре-
деления основных понятий теории игр, описьгеаются предложенные алгоритмы
формирования сети и исследуется их эффективность.
Модель сети. Сеть состоит из множества узлов, N = {1,...,п}, распо-
ложенных на плоскости. Каждый узел г € N может изменять мощность своего
передатчика. Мощности всех передатчиков задаются вектором р = ( р ь . . .,/)„),
Pi 6
Узел г может успешно передавать данные узлу, находящемся на расстоянии
г, если вьтолняется условие
Р1 > Рг", (1)
где р; - мощность передатчика узла г, > 1 - коэффициент, учитывающий требу-
емое качество передачи, а > 2 - показатель затухания сигнала. Величина показа-
теля а зависит от физических свойств среды и наличия препятствий: деревьев,
домов, людей. В воздухе при отсутствии препятствий а = 2.
Определение 1. Множество узлов, для которых выполняется условие (1), если
узел г установит свою максимальную мощность р-'"^, будем называть соседями
узла г и обозначать как ЛГ/""^.
Определение 2. Графом коммуникаций, порожденньпл вектором мощностей р,
называется неориентированный граф д(р) = (ЛГ, Е{р)), где N - множество вер-
Ш1Ш, соответствующих узлам сети, Е{р) - множество ребер, ще {г,j) 6 Е{р),
если условие (1) выполняется для обоих узлов i и j .
На рисунке 1 проиллюстрирована модель образования сети. Сплошными
линиями показаны неориентированные ребра. Пунктирными линиями и стрел-
ками показаны ориентированные ребра, которые означают, что мощность только
одного узла достаточна для образования связи.
Вектор мощностей, в котором каждый узел устанавливает свою максималь-
ную мощность pi = р-""^, обозначим какр""*^. Граф, порождаемый этим вектором,
обозначим как 5= э(р""").
Основньпл критерием качества является суммарная мощность узлов

= (2)
ieN

которая соответствует среднему времени работы узлов. Другим критерием каче-

10
Рис. 1. Модель образования беспроводной сети

ства является максимальная мощность в сети

= maxpi, (3)
teN

которая определяет время выхода из строя первого узла. Дополнительно исполь-


зуется оценка интенсивности в сети как

1{р) = mi^Ii{p), (4)


•eJV
где /¿(р) = € Я I > /г^ч}!, hji - минимальная мощность, необходимая для
образования связи {j,i).
Задача формирования топологии формулируется как

^ Pi min
iBN
(5)
g{p) - связный граф.

Задача (5) относится к ЛГР-трудным, и ее точное решение в реальных усло-


виях невозможно. В данной работе исследуются децентрализовашпле алгоритмы
ее решения, осгюванные на методах теории игр.

11
Игра формирования топологии. Введем основные понятия теории игр.
Определение 3. Игрой в нормальной форме называется тройка

T={N,{Ai}i^.^,{ui}ieN), (6)

где

1. iV = {1,..., п} - множество игроков, или агентов;


2. Ai - множество возможных действий г-го агента. Декартово произведение
А = Xjgjv^i называют множеством возможных исходов игры;
3. ííj: Л М - функции полезности задают выигрыши агентов в каждом из
возможных исходов 1пры.

Профиль действий всех агентов обозначим как а — ( a i , . . . , а„). Всех аген-


тов за исключением г будем обозначать как —г, и профиль их действий o_¿ =
( a i , . . . , a,_i, a j + i , . . . , а,,) € A-I — x J ^ Í A J будем называть обстановкой для аген-
та i. Иногда профиль всех действий удобно обозначать а = (а„ a-i).
Определение 4. Профиль действий а* € А называется равновесием Нэша, если
для каждого агента i е N к для любого действия а S Ai, (ц ^ о- выполняется
условие
Wi(ai,ali) <w¿«,al,) (7)
Определение 5. Множеством наилучших ответов (best response) агента i £ N на
обстановку a-I 6 A-I назьгеается множество

Sií¿(a_i) = argmaxu¿(x,a_¡). (8)


x^Ai
Если множество наилучших ответов всегда содержит только один элемент,
выражише (8) задает функцию наилучших ответов. Для игры, рассматриваемой
в данной работе, всегда выполняется этот случай. Если в системе установилось
равновесие Нэша, то ни один агент- не сможет увеличить полезность, в одиночку
изменив свое действие, такое состояние будет устойчивым.
Определение 6. Профиль действий а 6 Л доминируется профилем а! € А, если
щ{а') > щ(а) Vie NnBieN : щ(р'} > щ(р).

12
Определение 7. Профиль действий а £ А является оптимальным по Парето,
если он не домитруется никаким другим профилем а' G А.
Состояние а оптимально по Парсто, если в нем нельзя увеличть выигрыш
ни одного агента, не ухудшив при это вьшгрыш другого агента.
Далее описывается игра формирования связного неориентированного гра-
фа, известная из работы (Komali, MacKenzie, Gilles, 2008). Агентами являют-
ся узлы сети N, действием агента i Ç. N является мощность его передатчика
Pi 6 Обозначим множества действий узлов как Pi = Игра
формирования топологии задастся тройкой

(9)

где Р = XieNPi - множество исходов игры. Функция полезности щ: Р R


отражает требование связности сети и уменьшения мощности передатчика:

y,Íp) = Mfi{9{p))-Pi< (10)

гД2/;(д(р))-числоузлов,скоторымиузелгсвязапвграфе5(р).М > maXi^NPT"^


отражает приоритет обеспечения связности сети над минимизацией мощности.
В работе (Komali, MacKenzie, Gilles, 2008) доказано, что игра формирова-
ния тополопш имеет хотя бы одно равновесие Нэша и эти равновесия соответ-
ствуют локальным минимумам суммарной мощности (2). Проблема заключает-
ся в том, что поиск равновесия, являющегося глобальным минимумом, остает-
ся iVP-трудной задачей. А оставшиеся равновесия отличаются по своей эффек-
тивности. Более того, некоторые равновесия не являются допустимыми решени-
ями задачи (5), поскольку граф сети я них не связен.
Определение 8. Недопустимым равновесием Нэша в игре формирования то-
пологии назовем такой вектор мощностей р*, что граф д{р*) не связен, когда
существует такой вектор мощностей р', при котором д{р') - связный граф.
Утверждение 1. Любое недопустимое равновесие Нэша р* не является Парето-
оптимальным.
В данной диссертационной работе получена оценка отношения затрат в
наихудшем допустимом равновесии к оптимальному.

13
П-1 II
в в
S+S 8 5 S +e S S

а) б)
Рис. 2. Равновесия в линейной сети, а) наихудшее; б) оптимальное

Утверждение 2. Существует такое расположение узлов, при котором наихудшее


возможное равновесие отличается от оптимального в
Иллюстрацией этого утверждения служит сеть на рисунке 2. Далее рассмат-
риваются a n r o p i r i M b i формирования сети и равновесия, которые они получают.
Алгоритмы формирования сети. В литературе известен алгоритм поиска
равновесия, основанный на итерационном применении наилучшего ответа (8).
Все узлы начинают с максимальной мощности, затем поочередно выбирают но-
вую мощность как наилучший ответ на текущую обстановку до тех пор, пока
хотя бы один узел продолжает изменять мощность. Для игры формирования то-
пологии наилучший ответ узла единственен, поэтому выбор мощности всегда
определяется однозначно.
Этот алгоритм сходится к равновесию Нэша за п операций изменения мощ-
ности, а также сохраняет связность исходного графа д"*"^. Но полученное равно-
весие зависит от порядка действий узлов и, как следует из утверждения 2, может
отличаться от оптимального в раз. Другой недостаток этого алгоритма
заключается в том, что, если вследствие ошибки установится недопустимое рав-
новесие, оно останется устойчивым, и алгортм придется запускать заново или
вводить специальные механизмы восстановления связности.
В работе предлагается новый метод выбора агентом своего действия, на-
званный двойным наилучшим ответом. Замена в векторе а = {а^, a-i) действия
агента г на х € Ai будет обозначаться как о*'^ = (х, a_i). Обстановка для узла j в
этом новом векторе действий будет обозначаться как

a'fj = {х, a-i)_j = ( a i , . . . , a,-i, re, a,+i,..., aj-i, Oj+i,..., a„).

Допустим, агент i выбрал действие а; G Л;, и каждый другой агент j е N, j ^ i


выбирает свой наилучший ответ на новую обстановку = (i, Тогда

14
вектор всех таких наилучших ответов будет обозначаться как

Определение 9. Двойным наилучшим ответом (double best response) агента г на


обстановку а_,: называется действие

DBRi{a-i) = argmaxwi(a;,BH_i(o''^)), (12)


xeAi
где - вектор одновременных наилучших ответов других агентов на
выбор агентом i действия х.
Определение 10. Рефлексивным множеством (reflexive set) Ri агента i назовем
множество агентов, для которых i может вычислить наилучший ответ (8).
Определение 11. Локальным двойным наилучшим ответом (local double best
response) агента i на обстановку a-i называется действие

LocZ?Biíi,fíj(a_i) = argm^Mí(x,a7v\fí,,£?ñH¡(3;,a_,)), (13)

где алг\п; - действия агентов, не входящих в ñ,-, BRji^{x, a-i) - наилучшие ответы
агентов, входящих в В,.
В системах с небольшим числом агентов может использоваться прави-
ло (12). В качестве примера можно привести управление группой мобильных
роботов или мобильной ad hoc сетью с небольшим числом узлов. Сенсорные
сети, как правило, состоят из десятков и сотен узлов, поэтому в них возможно
использовать только локальную версию двойного наилучшего ответа. В данной
работе рефлексивным множеством узла г считаются все соседи узла Д,- =
По аналогии с базовым алгоритмом наилучших ответов предложен алго-
ритм IDBR (Iterated Best Response), использующий правило двойного наилучше-
го ответа. В отличие от базового алгоритма, если узлы сети используют двойной
наилучший ответ, ни одно из недопустимых равновесий Кэша не будет устойчи-
вым.
Определение 12. Вектор действий а* является устойчивым к двойному наилуч-

15
Алгоритм 1IDBR - Iterated Double Best Response
1. (Инициализация). Все узлы устанавливают произвольную начальную мощность р" €
[О,?™"], формируется начальный граф = д(р°).
2. (Настройка мощности). Узел г, выбранный в соотвепствии с некоторым произвольным
порядком, шменяет мощность по правилу (12)

= DBRi(píi) (или

3. (Обновление сети). Формируется новый граф = ff(p¡'^\píi), + 1


4. (Остановка). Шага 2 и 3 продолжаются, пока хотя бы один узел изменяет мощность
5. (Завершение). Если ф а ф д' не связный, все узлы переходят на правило наилучшего ответа
(8). Переход к шагу 2.

шему ответу, если для любого агента г е Л'' а- = DBRi{a'_j)


Утверждение 3. Если р' - равновесие Нэша и граф д{р*) не связен, тогда Зг €
N : DBRiipU) Ф
Следствие 1. В игре формирования топологии все не оптимальные по Парето
равновесия не будут устойчивыми к двойному наилучшему ответу.
Алгоритм двойных наилучших ответов устойчивее к порядку выбора уз-
лов, чем базовый алгоритм наилучп1их ответов. Для сети на рисунке 2 алгоритм
IDBR при любом порядке действий узлов и любой начальной мощности получает
оптимальную сеть. Но это выполняется не дня любой сети.
Утверждение 4. Затраты (р**) в равновесии р", полученном алгоритмом IDBR,
в худшем случае не. меньше затрат в равновесии р", полученном алго-
ритмом IBR.
К сожалению, свойство наилучшего ответа сохранять связность сети не
вьтолняется для двойного наилучшего ответа. Это иллюстрирует рисунок 3.
Узлы c u d , расположенные близко друг от друга, готовы установить "дешевую"
связь (с, d) и "надеются" на то, что сосед установит "дорогую" связь с узлом
Ь. Алгоритм двойного наилучшего ответа стабилизируется и получает сеть на
рисунке За.
Вычислительные эксперименты показывают, что после запуска одной ите-
рации алгоритма наилучших ответов на шаге 5 связная сеть формируется всегда.
Не доказано, что алгоритм IDBR остановится на шаге 3. Однако эксперименты
показьгаают, что всегда можно произвести искусственную остановку алгоритма

16
^ CL h j \d
2 1 s 2 1 s
a) 6)

1 £
B)

Рис. 3. Остановка двойного наилучшего ответа на несвязной сети а) сеть, на


которой останавливается алгоритм; б) субоптимальное равновесие С'"'"' = 5+2£,
в) оптимальное равновесие С"*"' = 5 + е

по истечению некоторого счетчика времени, после чего всегда формируется связ-


ная сеть. Строгое доказательство этих свойств алгоритма IDBR пока полущггь не
удалось.
В работе предложен другой алгоритм, VDBR (Variable Best Response), ко-
торый гарантированно останавливается.

Алгоритм 2 VDBR - Variable Double Best Response


1. (Инициалгоация). Узлы устанавливают начальную мощность p j € [0,pj"'"'], формируется
начальный граф д° — gijP). Устанавливается счетчик counU = т'^^.
2. (Настройка мощности). Узел i вычисляет свой наилучший ответ p f = Biii(pli)
Если Ui{p^,pti) > Uiip^pii) или counti = О, то = pf"
Иначе р|+' = DBRi(pli) (или ¿ос£)ВЯ;,лг^».(р!_Л), counU = counti - 1
3. (Обновление сети). Аналогично алгоритму 1
4. (Остановка). Шаги 2 и 3 продолжаются до тех пор, пока хотя бы один узел изменяет
мощность

Утверждение 5. Алгоритм VDBR всегда останавливается, и финальное состоя-


ние р ' есть равновесие Нэша.
Из утверждения 5 не следует, что алгоритм VDBR сходится к связной сети,
но это наблюдается экспериментально, даже если Уг 6 = О, а т ^ = 1.
Исследование эффективности алгоритмов. Эффективность предложенных
алгоритмов исследовалась в численных экспериметах. Для проведения экспе-
риментов использовался разработанный программный комплекс имитационного
17
-ГВК-е UdDER- -ЮВЯ—/ УОВИ- -мгт]
8
7
6
•К 5

2
1
О
10 20 30 40 50 10 20 30 40 50
#пос1ез #пойез
а) б)
Рис. 4. Суммарная мощность узлов, С'"'"' а) алгоритмы с постоянным правилом
выбора мощности; б) с переменным правилом

моделирования.
Алгоритмы сравнивались по четырем кретериям эффективности: суммар-
ная мощность узлов, максимальная мощность, уровень помех в сети и время
сходимости. Изменение основного критерия эффективности - суммарной мощ-
ности узлов - показано на рисунке 4. Время сходимости алгоритмов показано на
рисунке 5. По вертикальной оси отложено количество итераций, требующихся
для остановки алгоритма. Одна итерация включает п шагов обновления сети.
Графики остальных показателей приводятся в диссертации. На графиках по оси
абсцисс отложена плотность сети, измеряемая как количество узлов в квадрате
100 на 100. По оси ординат отложены значения критериев. Показаны средние зна-
чения и среднеквадратичные отклонения критериев для каждой плотности узлов.
Графики немного смещены относительно оси абсцисс, чтобы отрезки, показыва-
ющие отклонения от среднего, не перекрывались.
Условные обозначения алгоритмов приведены в верхней части рисунка. Ал-
горитмы с постоянным правилом выбора мощности:ГОК- базовый алгоритм наи-
лучшего ответа; ШВК - двойного наилучшего ответа; ЬосГОВа - модификация
с локальным правилом двойного наилучшего ответа. Алгоритмы с переменньш
правилом: УПВК2, УВВКЗ - максимально допустимое число исполь-
зований двойного наилучшего ответа т'^'^ меняется от 1 до 3. При дальнейшем
увеличении т ^ эффективность алгоритма перестает изменяться, и эти резуль-

18
р ^ 1ВК :::: locIDBR--^ ювя ? урвк! -н— урв1^ - • УОВ

12 12

10 10

8 8

6

4 4

2 2
- * — * *
О О
10 20 30 40 50 10 20 30 40 50
#п(х1е5 #П0с1е5
а) б)
Рис. 5. Время сходимости алгоритмов а) с постоянным правилом выбора мощно-
сти; б) с переменным правилом

таты на графиках не указаны. В алгоритмах с переменным правилом выбора


мощности использовалась только локальная модификация двойного наилучшего
ответа (13).
Все алгоритмы с двойным наилучшим ответом демонстрируют лучшие ре-
зультаты, чем базовый алгоритм. Все теоретико-игровые алгоритмы формируют
менее эффективные сети, чем минимальное остовное дерево. На рисунках видно,
что замена двойного наилучшего ответа на его локальную модификацию снижает
эффективность алгоритма. Алгоритм с переменным правилом и локальным двой-
ным наилучшим ответом при тп'"^ > 2 показывает не\пюго лучшие результаты,
чем алгоритм с глобальным наилучшим ответом.
Можно сделать вывод, что для создания прикладных алгоритмов форми-
рования топологии лучше всего подходит алгоритм с переменным правилом вы-
бора мощности. Также при использовании переменного правила сокращаются
интервалы, в течение которых нарушена связность сети. Фактически, двойной
наилучший ответ можно использовать в те моменты, когда не требуется пере-
давать данЕше. Тогда допустимо нарушить связность сети на короткий период.
В случае возникновения необходимости срочной передачи данных все узлы мо-
гут переключиться на обычный наилучший ответ и за 1 итерацию сформировать
связную сеть.
В третьей главе исследуется вычислительная сложность алгоритмов и опи-

19
сывается программный комплекс имитационного моделирования. Приводится ос-
новная схема формирования сети, алгоритм BestResponse вычисления базового
наилучшего ответа и DoubleDestResponse для вычисления двойного наилучшего
ответа.
Утверждение 6. Алгортм BestResponse вычисляет наилучший ответ (8) узла с
функцией полезности (10) и время работы в худшем случае составляет 0{N + Е)
для графа сети д = (N, Е).
Для вычисления наилучшего ответа в игре с полезностями 10 узел i должен
обладать информацией о текущей тополопш сети д{р), своей окрестности в графе
предложений gi(p) и стоимости образования связей со своими соседями hij j 6
щпах_ Сложность 0{N + Е) обусловлена тем, что в ходе алгоретма в худшем
случае выполняется поиск связных компонент, которым принадлежат соседи узла.
При замене fi{g{p)) в функции полезности на локальную оценку, например в к-
окрестности ухла г, сложность уменьшится соответственно.
Утверждение 7. Вычисление двойного наилучшего ответа узла г в графе д =
(ЛГ, Е) требует 0{VR{N+E)) операций, где R=\Ri\- мощность рефлексивного
множества узла, V = j - число соседей узла. В ходе вычислений требуется
обмен 2VR служебными сообщениями.
В данной работе в качестве рефлексивного множества использовались со-
седи узла, Ri = A*,™^. Для данного случая двойной наилучший ответ требует
0{V^{N + Е)) операций и обмена сообщениями. Для плотных сетей, коща
Е ^ N^ nV N, сложность вычисления двойного наилучшего ответа возраста-
ет до 0{N^). В другом крайнем случае, коща сеть разрежена, то есть Е ^ N п
V = const, сложность двойного наилучшего ответа становится равной 0{N).
Сложность обусловлена тем, что в предложенном алгоритме при поиске
мопщости перебираются все соседи узла. В теле цикла перебора соседей выпол-
няется вычисление R наилучших ответов. Каждое вычисление наилучшего ответа
требует 0{N + Е) операций. Узел не обладает информацией, необходимой для
вычисления наилучших ответов, и запрашивает результат у своих соседей, для
чего требуется обмен служебньпии сообщениями.
Утверждение 8. Время вьшисления двойного наилучшего ответа в алгоритме
VDBR составляет 0{V^N), если Ri = ЛТ"''^

20
10 20 30 40 50

а) б)
Рис. 6. Примеры сетей, полученных а) базовым алгоритмом; 6) VDBR, тп''^ = 3

Доказано, что для алгоритма VDBR сложность вычисления двойного наи-


лучшего ответа всегда не хуже O(V^iV), что для плотных сетей преобразуется в
O(iV^), а для разреженных в 0{N).
Далее в третьей шаве проводится обзор существующих систем моделиро-
вания ad hoc сетей, обосновывается необходимость разработки отдельного ком-
плекса для исследования эффективности предложенных алгоритмов, приводится
описание комплекса и методики проведения эксперимепгов.
Комплекс реализован как библиотека функций MATLAB и доступен в
интернете по адресу h t t p s : / / s o u r c e f o r g e . n e t / p r o j e c t s / n e t g a m e s / .
Библиотека включает функции генерации исходных данных, имитации процес-
са формирования сети рассмотренными алгоритмами и функции визуализации
результатов. На рисунке 6 приведен пример работы алгоритмов для сети из 25
узлов.
В заключе1гаи приводятся основные выводы по результатам работы, обо-
значаются возможные направления дальнейших исследований.

21
Основные результаты и выводы

1. Формирование эффективной топологии является одним из методов увели-


чения времени жизни ad hoc сетей при работе от автономных аккумулято-
ров. Проведенный обзор алгоретмов формироваггая сети показал, что раз-
работка новых методов поиска равновесий, повышающих эффективность
алгоритмов, является актуальной научной задачей.
2. Исследована предложенная в литературе игровая формуггаровка задачи фор-
мирования связной сети при минимизации суммарной мощности передат-
чиков. Доказано, что в рассматриваемой игре нашо'дшее равновесие может
отличаться от оптимального в раз, и что в игре существуют недо-
пустимые равновесия, которые остаются устойчивьпли при применении ба-
зового теоретико-игрового алгоритма наилучшего ответа.
3. Предложен новый теоретико-игровой метод принятия решения агентом, на-
званный двойным наилучшим ответом. Доказано, что при использовании
двойного наилучшего ответа любое недопустимое равновесие в игре фор-
мирования топологш! перестает бьггь устойчивым. Это эквивалентно тому,
что устойчивьпл может бьггь только равновесие, оптимальное по Парето.
4. На основе двойного наилучшего ответа разработано два алгоритма форми-
рования сети: ШВЕ (Iterated Best Response) и VDBR (Variable Double Best
Response). Показано, что оба алгоритма сходятся, получают в результате
связные сети и более устойчивы к порядку действий узлов, чем базовый
алгоритм. Исследована эффективность алгоритмов в сравнении с базовым
алгоритмом и минимальным остовным деревом. Все алгоритмы, использу-
ющие двойной наилучший ответ, показали лучшие результаты, чем базовый
алгоритм. Алгоритм VDBR превосходит алгоритм IDBR и является наибо-
лее перспективным для практической реализации.
5. Предложешл схемы реализации алгоритмов, исследована их вычислитель-
ная сложность. Вычислительная сложность наилучшего ответа составля-
ет О (ЛГ + Е), Л?^ - число узлов, Е - число ребер в текущем графе сети.
Предложен алгоритм вычисления двойного наилучшего ответа, использу-
ющий такой же объем локальной информации, что и наилучший ответ, его
сложность составляет 0{V^{N + Е)), V - число соседей узла. Доказано,

22
что при использовании в алгоритме VDBR сложность составляет 0{V'^N)
операций. Предложенная реализация двойного наилучшего ответа требует
обмена служебными сообщениями.
6. Разработан комплекс имитационного моделирован1и, который использовал-
ся для исследований эффективности алгоритмов. Данный комплекс пред-
ставляет собой библиотеку функций MATLAB, которая может быть ис-
пользована в исследованиях других процессов формирования технических
и социально-экономических сетей.

Список публикаций
Публикации в ведущих рецензируемых журналах, входящих в перечень ВАК

1. Базенков Н. И. Динамика двойных наилучших ответов в игре формирования топологии


беспроводной ad hoc сети //Управдение большими системами. Выпуск 43. - 2 0 1 3 . -С.217-
239.
2. Базенков Н. И., Губанов Д. А. Обзор информационных систем анализа социальных сетей
// Управление большими системами. Выпуск 41. - 2013. - С. 357-394.
Тезисы докладов на международных конференциях
3. Bazenkov N. Reflexive Behavior in Topology Control for Ad Hoc Networks // Collected abstracts
of 6th International Conference on Game Theory and Management (GTM). - 2012. - P. 39-41.
Публикации в трудах всероссийских конференций
4. Базенков Н.И. Динамика двойных наилучших ответов в игре формирования топологии
беспроводной ad hoc сети // Труды 6-й Всероссийской мультиконфереиции по проблемам
управления (МКПУ-2013). - 2013. - Т. 4. - С. 81-85.
5. Базенков Н.И., Яхин А.Ш. Экспериметальное исследование цитирования внештгах сайтов
в русскоязычной блогосфере // Труды 5-ой конференщ™ «Управлегше в технических, эр-
гатических, организационных и сетевых системах» (УТЭОСС-2012). - 2012. - С. 872-875.
6. Базенков П.И. Обзор теоретико-игровых моделей обеспечения безопасности таформаци-
онных систем // Труды 5б-й научной конференции МФТИ. Радиотехника и кибернетика. -
2 0 1 3 . - С . 124-125
7. Базенков Н.И. Рефлексия в задаче управления топологией беспроводной сети И Труды 55-й
научной конференции МФТИ. Радиотехника и кибернетика. - 2012. - Т. 1. - С. 46-47.
Публикации в трудах молодежных научных школ
8. Базенков Н.И. Динамика двойных наилучших ответх)в в игре формирования топологии
беспроводной ad hoc сети // Труды П-й Международной летней школы-семинара по искус-
ственному интеллекту для студентов, аспирантов и молодых ученых «Ителлекгуальные
системы и технологии: современное состояние и перспективы» (ISyT'2013). - 2013. -
С. 111-116

23
9. Базенков Н.И. Теоретико-игровая постановка задачи контроля эгоистичного поведения
узлов в многоагентных сетях передачи данных. // Материалы VIII Всероссийской школы-
конфере!щии молодых ученых «Управление большими системами». - 2011. - С. 130-133.
10. Базенков Н.И. Задача стимулирования кооперации узлов в многоагетпых беспроводных
сетях в условиях ограниченной пропускной способности // Труды международной лет-
ней школы-семинара «Интеллектуальные системы и технологии: современной состояние
и перспективы» (ISyT'ZOlI, Тверь). Тверь-Протасово: Издательство Тверского государ-
ственного технического университета - 2011. - С. 110-118.
И . Базенков Н.И. Теоретико-игровая модель кооперации узлов в мобильных Ad Нос сетях.
// Аннотации докладов Научной сессии НИ}ГУ МИФИ 2011. - 2011. - Т. 3. - С. 60.

В работе [2] автором проведен обзор программных пакетов для сетевого моделирования,
используемых в научных исследованиях. В работе [5] автором получены все основные результа-
ты.

24
Подписано в печать: 27.01.2014

Заказ №> 9316 Тираж - 100 экз.


Псмшь '|р;|ф||рС111!1)1.
Гипография «11-Н <1)()1'МЛ Г»
ИМИ 7726,4.10900
115230, Москиа, Нартмискос т., 36
(499) 788-7К-56
vvww.autoreferat.ru